Sei sulla pagina 1di 867

La matematica

Problemi e teoremi
8 II

A cura di Claudio Bartocci e Piergiorgio Odifreddi

Einaudi
La matematica
A cura di Claudio Bartocci e Piergiorgio Odifreddi

Comitato scientìfico
Sir Michael F. Atiyah
Chairman, University of Edinburgh
Alain Connes
Collège de France, Parigi
Freeman J. Dyson
Institute for Advanced Study, Princeton
Yuri I. Manin
Northwestern University, Evanston
David B. Mumford
Brown University, Providence
Hilary W. Putnam
Harvard University, Cambridge Mass.
Stephen Smale
Toyota Technological Institute, Chicago

Piano d e ll’opera

I
I luoghi e i tempi

n
Problemi e teoremi

m
Suoni, forme, parole

IV
L’intreccio con le scienze
La matematica
A cura di Claudio Bartocci e Piergiorgio O difreddi

V olum e seco n d o
P rob lem i e teorem i

Direzione scientifica di Claudio Bartocci

G iu lio E inaudi editore

ZOVVO
Redazione: Valentina Barbero
Realizzazione tecnica: Studio Lexis, Torino
Traduzioni: Francesco Aloe, Riccardo Bellè, Luigi Civalleri, Alessia Dimitri, Veronica Gavagna,
Giacomo Lenzi, Igor Mencattini, Pier Daniele Napolitani, Adria Tissoni

© 2008 Giulio Einaudi editore s.p.a., Torino


www.einaudi.it
ISBN 978-88-06-16425-6
Indice

Problemi e teoremi

Y U R I I. MANIN
p. 3 Matematica e conoscenza: aspetti interni, sociali e culturali
1. La conoscenza matematica
4 1.1. Uno sguardo d ’insieme
7 1.2. G li oggetti della conoscenza matematica
13 1.3. Definizioni, teoremi, dimostrazioni
15 1.4. Problemi, congetture, programmi di ricerca
2. La matematica come strumento cognitivo
16 2.1. Un po’ di storia
17 2.2. Gli strumenti cognitivi della matematica
19 2.3.1 modelli
3. Le scienze matematiche e i valori dell’uomo
3.1. Introduzione
27 3.2. Razionalità
3.3. Verità
28 3.4. Azione e contemplazione

M A RT IN DAVIS
33 I fondamenti dell’aritmetica
35 1. La definizione fregeana di numero
42 2. Gli assiomi di Dedekind-Peano per l’aritmetica
44 3. Il secondo problema di Hilbert
45 4 .1 «Principia mathematica»
46 5. Il programma di Hilbert
49 6. Kurt Godei
56 7. Il programma di Hilbert dopo Godei
58 8 .1 fondamenti oggi
VI
Indice

DAVID A. VOGAN JR
La classificazione dei gruppi
p. 61 1. Introduzione
62 2. La simmetria
66 3.1gruppi di simmetria
69 4.1 gruppi astratti
71 5 .1sottogruppi
75 6. Le orbite
80 7. Le classi laterali e la dimostrazione del teorema 4.2
84 8 .1sottogruppi normali
90 9.1gruppi semplici e le serie di composizione

JOHN STILLWELL
Il teoremafondamentale del calcolo
99 1. Il teorema fondamentale del moto
102 2. Prime determinazioni di tangenti (coefficienti angolari) e misurazioni di aree
106 3. Prime versioni del teorema fondamentale
110 4. Differenziabilità, continuità e oltre
113 5. Evoluzione del concetto di integrale
118 6. Il teorema fondamentale del calcolo secondo Lebesgue
119 7. L’estensione di Schwartz del concetto di funzione
125 8. L’estensione di Robinson del concetto di numero

ANDREW GRANVILLE
Il teorema fondamentale dell*aritmetica
1. Introduzione
131 1.1. Il teorema fondamentale
133 1.2. Una storia confusa
135 1.3. Frazioni continue
138 1.4. Radici quadrate
2. Fattorizzazione unica in altri domini?
139 2.1. Polinomi
140 2.2. Dove non c’è fattorizzazione unica!
141 2.3. L’ultimo teorema di Fermat
3. Una teoria generale
142 3.1. Ideali
144 32. Campi di numeri, interi algebrici e unità
146 3.3. Gli interi di Gauss
147 3.4. Fattorizzare un primo p in un dato campo di numeri
4. Gruppi
148 4.1. Costruire le unità
Indice vn

4.2. Elementi irriducibili


p. 151 4.3. Il gruppo delle classi
155 4.4. Esempi di equazioni
5. Forme quadratiche, ideali e trasformazioni
156 5.1. Prospettive diverse sulla riduzione
157 5.2. Forme quad ratiche
6. Equazioni diofantee
158 6.1. L’ultimo teorema di Fermat, rivisitato
159 6.2. Curve ellittiche
7. La fattorizzazione unica, in pratica
160 7.1. Fattorizzare
162 7.2. Crittografìa
164 7.3. Test di primalità
165 8. Ulteriori sviluppi

HAROLD M. EDWARDS
167 La risoluzione delle equazioni algebriche

BENJAMIN FINE e GERHARD ROSENBERGER


Il teoremafondamentale dell’algebra
177 1. Introduzione
181 2. Le dimostrazioni originali di Gauss
184 2.1. La quarta dimostrazione di Gauss
189 3. Dimostrazioni analitiche
198 4. Dimostrazioni algebriche
208 5. Dimostrazioni topologiche

FRANCESCO AMOROSO e CARLO VIOLA


Numeri irrazionali e numeri trascendenti
217 1. Introduzione
218 2. Irrazionalità
222 3. Approssimazione diofantea e frazioni continue
225 4. Misure d’irrazionalità
228 5. Approssimazioni razionali a numeri algebrici
230 6. I primi numeri trascendenti: Liouville
232 7. La trascendenza di e secondo Hermite
236 8. Il teorema di Gel'fond-Schneider
238 9. I metodi di Gel'fond e Schneider
241 10. E-funzioni e (7-funzioni
244 11. Il teorema di Baker e qualche altro risultato notevole
vm Indice

JONATHAN M . BORWEIN
La vita di p i greco
p. 249 1. Preambolo: pi greco nella cultura popolare
251 2. Presentazione di pi greco
252 3. L’infanzia di pi greco
253 3.1. II metodo di Archimede
255 4. Approssimazioni di it prima del calcolo infinitesimale
256 5. L’adolescenza di pi greco
259 6. La vita adulta di pi greco e il calcolo infinitesimale
260 6.1. Una curiosa anomalia nella sèrie di Gregory
261 7. Le approssimazioni di ir nelTepoca del calcolo infinitesimale
262 7.1.1 calcoli di Newton con l’arcoseno
263 7.2. Il calcolatore viennese
264 8. L’irrazionalità e la trascendenza di ir
8.1. Misure di irrazionalità
266 9. Pi greco nell’era digitale
9.1. L’Electronic Numerica! Integrator and Calculator ( e n i a c ).
267 9.2. La serie di Bailamme per it (1939)
268 9.3. Le serie ellittiche di Ramanujan
270 10. Algoritmi a complessità operazionale ridotta
10.1. Filosofia della matematica
272 11. Ritorno al futuro
273 12. Perché pi greco?
274 12.1. Cambiare la visione del mondo
275 122. Scoprire le iterazioni di ir
276 13. Come calcolare l’N-esima cifra di ir
277 13.1. L’algoritmo in azione
278 14. Altre formule di tipo b b p per il calcolo di una cifra
279 14.1. Formule b b p in base tr e
280 14.2. Normalità e dinamica
15. Vita di pi greco
281 16. Note di chiusura

UMBERTO ZANNIER
Risultati e metodi nella teoria delle equazioni diofantee
287 1. Generalità
290 2. Le questioni principali
291 3. Alcuni risultati notevoli
297 3.1. Risultati in dimensione superiore
4. Alcuni metodi notevoli
298 4.1. Il metodo della discesa
299 42. Metodi algebrici
Indice ix
p. 301 4.3. Metodi locali
303 4.4. Metodi di approssimazione diofantea
306 4.5. Metodi geometrici

MASSIMO BERTO LINI


L ultimo teorema di Fermai
313 1. Introduzione
315 2. Cenni storici
318 3. La congettura di Shimura-Taniyama
324 4. Shimura-Taniyama implica Fermat
325 5. Appendice 1. Preliminari algebrici
328 6. Appendice 2.1campi Q(E„) e la strategia di Wiles
329 7. Appendice 3. Conseguenze del lavoro di Wiles

ALAN BAKER
Numeri trascendenti eproblemi diofantei
335 1. Introduzione
336 2. La quadratura del cerchio
337 3. Il settimo problema di Hilbert
339 4. Forme logaritmiche
340 5. Il problema del numero delle classi
342 6. Il problema di Mahler in teoria metrica
344 7. La congettura «abc»

JOHN STILLWELL
Le serie infinite
349 l. La serie geometrica
355 2. La serie armonica
358 3. Le serie di potenze per funzioni circolari
360 4. Le serie di Taylor
362 5. Inversione di serie
366 6. La funzione zeta
370 7. La costante di Eulero
372 8. La teoria della convergenza
375 9. Le serie di Fourier
378 10. Serie di Fourier e funzioni discontinue

J. BRIAN CONREY
L’ipotesi di Riemann
383 1. Introduzione
385 2. L’enunciato preciso dell’ipotesi di Riemann
X Indice

p. 389 3. L’equazione funzionale di Riemann


392 4. La formula per contare il numero degli zeri
393 5. Che cosa sappiamo a proposito degli zeri?
394 6. Enunciati equivalenti nella teoria dei numeri
7. Universalità di £(j )
395 8. Formule esplicite
398 9. Approcci all’ipotesi di Riemann
402 9.1. Il teorema di Bombieri
403 9.2. Nyman, Beurling, Baez-Duarte, Vasyunin
404 10. L’ipotesi di Riemann implica quella di Lindelòf
405 11. Correlazione di coppia e teoria delle matrici random
406 11.1. La teoria delle matrici random e i momenti di £(j)
12. Le funzioni L
408 12.1. La classe di Selberg
410 12.2. Funzioni L di grado 2
412 12.3. Funzioni L quadrate simmetriche
413 12.4. Funzioni L di convoluzione
12.5. Famiglie di funzioni L e teoria delle matrici random
13. Altri approcci all’ipotesi di Riemann
13.1. Meccanica statistica
414 13.2. Funzioni zeta su campi finiti
416 13.3. Alcuni enunciati equivalenti interessanti
420 14. Aneddoti

JOHN K. TRUSS
I fondamenti dell’analisi
427 1. Introduzione
429 2. Il completamento di un insieme totalmente ordinato
437 2.1. Estensione al caso generale del completamento di un insieme totalmente
ordinato
438 2.2. R non è numerabile
440 2.3. Gli ordinali
2.4. La retta reale estesa
442 2.5. Le rette lunghe
443 2.6. L’ipotesi di Suslin
445 3. D completamento degli spazi metrici
452 4. La costruzione di R con le espansioni decimali
453 5. La teoria delle grandezze di Eudosso
455 6 .1campi non archimedei e l’analisi non standard
457 7. L’integrazione
Indice »

AJOHIRO KANAMORI
p. 461 L’ipotesi del continuo
1. Cantor
462 1.1. Numeri reali c numerabilità
465 1-2. L’ipotesi del continuo e i numeri transfiniti
468 1.3. Diagonalizzazione e numeri cardinali
2. Matematizzazione
472 2.1.1 primi passi
476 22. L’assioma della scelta
478 2.3. L’assiomatizzazione
481 2.4. Insiemi analitici e proiettivi
484 2.5. Il completamento deU’assiomatizzazione
489 2.6. Equivalenze e conseguenze
3. La coerenza
491 3.1. La logica del primo ordine
494 3.2. L'universo costruibile
497 3.3. Nuovi assiomi
4. L’indipendenza
499 4.1.11forcing
502 42. La potenza del forcing
506 4.3. La determinatezza

IVAR EKELAND
Il calcolo delle variazioni
515 l.Leorigini
516 2. Pierre de Fermat
519 3. La scoperta dell’analisi
521 4. Il calcolo delle variazioni
523 5. Collegamenti con la fisica
527 6. Il calcolo delle variazioni nel xx secolo

ROBIN HARTSHORNE
Suifondamenti della geometria
531 1. Introduzione
532 2. Gli Elementi di Euclide
535 3. La rivolta contro il rigore
537 4. L’uso dei numeri nella geometria
539 5. La teoria delle proporzioni
541 6. La continuità
542 7. H postulato delle parallele e la geometria non euclidea
544 8. Gli assiomi di Hilbert
xn Indice

p. 546 9. L’introduzione delle coordinate


548 10. La geometrìa proiettiva
552 11. La geometrìa algebrica
12. Conclusioni
553 13. Riferimenti bibliografici

JEREM Y GRAY
La geometria dello spazio
555 1. Euclide
557 2. I commentatori arabi e islamici
559 3. Il risveglio deirOccidente
562 4. Gauss, Schweikart, Taurìnus e la geometrìa differenziale di Gauss
565 5. Bolyai e Lobacevskij
569 6. Riemann
572 7. Bel trami
574 8. Klein
9. Poincaré
575 10. Il problema dello spazio di Helmholtz-Lie
578 11.1corpi rìgidi e le forme spaziali di Clifford-Klein
580 12. Einstein, la teorìa della relatività ristretta e Minkowski
581 13. La teorìa della relatività generale
582 14. Da Riemann a Levi-Civita, Weyl e Cartan

ENRICO ARBARELLO
Superfici di Riemann
591 1. Cenni storici
595 2. Topologia delle superfici
600 3. Geometria differenziale delle superfici
604 4. Geometria riemanniana delle superfici
607 5. Geometria complessa delle superfici
614 6. Superfici di Riemann e curve algebriche
618 7. I periodi delle superfici di Riemann
621 8. Geometria iperbolica delle superfici
625 9. I moduli secondo Teichmiiller
629 10. Moduli delle curve stabili
634 11. Superfici di Riemann e teoria delle stringhe
639 12. Curve algebriche e teoria dei numeri

FABRIZIO CATANESE
La classificazione delle varietà algebriche
643 1. Prologo
644 2. Preistoria della geometria algebrica
Indice xm

p. 652 3. La geometrìa algebrica nell’Ottoccnto


4. Il tardo Ottocento
661 4.1. Il problema degli invarianti, Hilbert, e l’algebra astratta
667 4.2. La teoria deU’uniformizzazione trascendente
672 4.3. L’uniformizzazione in più variabili
674 4.4. Il progetto di classificazione delle superfici algebriche
679 5. Il teorema di classificazione delle superfici algebriche
683 5.1. Gli oggetti della classificazione di Enriques e il coronamento del loro studio
686 5.2. Le superfici K3 e i risultati fondamentali di Kodaira
689 5.3. Le superfici di tipo generale
690 5.4. Gli spazi dei moduli delle superfici di tipo generale
6 .1 modelli minimi in dimensione più alta e famiglie di curve razionali
692 6.1.1 divisori nef e il cono di Mori
695 6.2. Le varietà di Fano e il problema della razionalità e unirazionalità
7. Altri punti di vista collegati
697 7.1. Le varietà reali
698 7.2. La curvatura
700 7.3. Il sogno che lega iperbolicità e mordellicità

ARNAUD BEAUVILLE
705 La congettura di Hodge
706 1. Coomologia
708 2. La decomposizione di Hodge
711 3. L’enunciato della congettura di Hodge
714 4. Controesempi su Z
716 5. Codimensione 1: il teorema di Lefschetz
719 6. Casi noti e casi non noti
722 7. La congettura di Hodge generale
724 8. Teoria di Hodge e cicli algebrici
727 9. Conclusione

COLIN ROURKE
La congettura di Poincaré
731 1. Introduzione
732 2. La classificazione delle varietà
738 3. La congettura e le sue generalizzazioni
741 4. Il caso di dimensione n ^ 5
747 5. Il caso di dimensione 4
749 6. Il programma di Thurston
754 7. Il programma di Perelman
*V Indice

MARTIN HENK e GUNTER M . ZIEGLER


La congettura di Keplero
p. 765 1. Un diffìcile rompicapo
767 2. Nel piano
775 3. Nello spazio tridimensionale
780 4. Una situazione scandalosa
782 5. Una ricetta?
787 6. II computer contro Keplero
7. Problemi, problemi e ancora problemi
7.1. Sfere più che vicine
788 12. Corpi difficilmente impaccabili
7.3. Impaccamenti reticolari
789 7.4. Impaccamenti finiti
791 7.5. D problema del bacio

LUIGI ACCARDI
Probabilità
793 1. Introduzione: il ritardo del caso
794 2. La legge dei grandi numeri e il teorema centrale del limite
796 2.1. Le probabilità condizionate
799 22. L’ago di Buffon e la nascita della simulazione stocastica
3. Probabilità come estensione della logica: la logica dell’incerto
801 3.1. Identificazione tra eventi e affermazioni di un linguaggio
802 32. Misure di probabilità come estensioni delle funzioni verità
803 3.3. Probabilità intuizionista
805 4. L’Ottocento
806 4.1. Caso e probabilità in fisica nell’Ottocento
808 4.2. La scuola russa e la nascita della probabilità come disciplina matematica
809 5 .1processi stocastici
811 6. L’analisi stocastica
812 6.1. La struttura dei processi stocastici classici
813 6.2. Generalizzazioni del calcolo stocastico
7. La rivoluzione della probabilità quantistica
7.1. Caratteristiche delle rivoluzioni matematiche
815 12. Problemi posti dal successo del modello probabilistico quantistico
7.3. Descrizione del nuovo formalismo
817 7.4. Primi passi verso l’unificazione: gli albori della teoria della teoria algebrica
della probabilità
820 7.5. Dubbi sulla necessità del nuovo modello probabilistico: variabili nascoste
821 7.6. Radici sperimentali della differenza tra probabilità classica e quantistica
822 7.7. Analogie tra geometrie non euclidee e probabilità non kolmogoroviane:
gli invarianti statistici
Indice xv

p. 824 7.8. Il sesto problema di Hilbert e la funzione euristica delle teorìe assiomatiche
826 7.9. Eventi e misure: nuova assiomatica della probabilità
829 8. Conclusioni

833 Ìndice dei nomi


847 G li autori
Y U R I I. MANIN

Matematica e conoscenza: aspetti interni, sociali e culturali

Ha colto nel segno: da un lato [noi matematici] ci


vantiamo di saper costruire un mondo elegante, del tut­
to separato dai vincoli imposti dalla realtà, ma dall’altro
avanziamo la pretesa che le nostre costruzioni siano alla
base di quasi tutti i progressi tecnici più importanti.
DAVID MUMFORD*

La matematica pura è un corpo organico gigantesco, costruito solo ed


esclusivamente da idee che nascono nella mente dei matematici, e li vivono.
Se questa mia affermazione vi risulta in qualche modo indigesta, avete
almeno tre punti di vista alternativi.
Ad esempio, potete pensare che la matematica si identifichi semplicemen­
te con ciò che è contenuto nei manoscritti, libri, articoli e lezioni prodotti dai
matematici della nostra epoca: una rete sempre più intricata, fatta di teore­
mi, definizioni, dimostrazioni, costruzioni, congetture (e forse devo metterci
anche i software), che gli specialisti presentano con orgoglio ai congressi,
conservano gelosamente nelle biblioteche o negli archivi elettronici, usano
per congratularsi e premiarsi a vicenda o, a volte, per scannarsi sulla primoge­
nitura di un’idea. In breve, la matematica è ciò che fanno adesso i matematici,
proprio come la musica è ciò che scrivono ed eseguono i musicisti.
In secondo luogo, la matematica può essere vista come un’attività pro­
fondamente radicata nel reale, e in costante collegamento con la realtà. Dal
contare sulle dita al mandare un uomo sulla Luna o a inventare Google, ciò
che facciamo serve a capire, creare e manipolare cose reali, e forse la mate­
matica sta proprio in questo tipo di comprensione, più che nell’inafferrabi­
le discorso che accompagna le nostre astrazioni. I matematici quindi sono
interpreti, più o meno consapevoli, di un ruolo nella storia dell’umanità,
come Archimede che si impegna nella difesa della sua Siracusa (e del suo
tiranno), Alan Turing che decifra i bollettini intercettati di Rommel, o John
von Neumann che scopre che far scoppiare le bombe in quota e non al suolo
è una strategia di distruzione molto efficiente. Se accettiamo questo punto di
vista, la matematica può essere difesa come attività socialmente utile. I suoi
interpreti, però, hanno a volte nozioni un po’ confuse sul bene e sul male; per
illustrare il concetto, non trovo di meglio che citare questo passo: «la mate-

1 Dalla Prefazione a Enzcnsbcrger [1999].


A Yuri I. Manin

matica si può rivelare una risorsa indispensabile. Quando fu il momento di


verificare gli effetti delle bombe a frammentazione sugli esseri umani, poiché
gli esperimenti condotti con i maialifurono proibiti per motivi umanitari, si
utilizzarono delle simulazioni numeriche» [Booft-Bavnbek e Hoyrup 2003,
Introduzione, p. 11]. Il corsivo è mio.
Infine, c’è chi fa sua l’immagine del Grande Castello Matematico, che
svetta da qualche parte, nel Mondo Platonico delle Idee, un mondo non
costruito dai matematici ma da loro svelato a poco a poco, con devozione
e umiltà. I grandi ingegni arrivano a intuire il Grande Progetto che sta alla
base di tutto, ma anche chi riesce a malapena a scoprire il disegno di una
piastrella della cucina può raggiungere la felicità. Se vogliamo metterla in
semiotica, possiamo esprimere la stessa posizione dicendo che la matematica
è un proto-testo la cui esistenza può essere solo postulata, ma che comunque
è alla base di tutte le copie frammentarie e corrotte con cui siamo costretti
a lavorare. Chi sia l’autore del testo originale (o il costruttore del Grande
Castello) non è dato sapere, anche se qualcuno sembra avere certezze al
riguardo, come Georg Cantor e la sua infinita collezione di infiniti, diretta-
mente ispirata da Dio, o Kurt Godei e la sua «prova ontologica».
Con varie sfumature e gradi di adesione, questi tre atteggiamenti mentali,
posizioni sociali e conseguenti comportamenti individuali aleggiano su ciò
che segue. Prima di entrare nel vivo, in questo paragrafo introduttivo ho solo
voluto rendere il lettore consapevole di questa tensione interna, piuttosto
che mettere paletti e dare giudizi definitivi, che non esistono.
Un ultimo avvertimento riguarda le fonti storiche. Ci sono due modi per
leggere un testo di matematica del passato: o si cerca di capire il tempo e la
temperie culturale in cui fu scritto, o lo si usa per far luce su valori e pregiudi­
zi del nostro tempo. Nella storia della matematica, questi due atteggiamenti
sono rappresentati daU’etnomatematica e dalla scuola bourbakista. Qui, per
amor di chiarezza, userò la chiave di lettura «modernizzante»2.

1. La conoscenza matematica.

1.1. Uno sguardo d ’insieme.


Ecco come Sir Michael Atiyah inizia il suo saggio [Atiyah 2005]: «Le tre
grandi divisioni della matematica sono, neH’ordine in cui sono comparse,
la geometria, l’algebra e l’analisi. La geometria è sostanzialmente un pro­
dotto della civiltà greca, l’algebra è indo-araba e l’analisi (ovvero il calcolo

Ringrazio Silke Wimmcr-Zagier per avermi fornito qualche fonte sulla matematica cinese e
giapponese, e per avermi spiegato la loro rilevanza per questo saggio. Grazie anche a Dmitri Manin,
che mi ha illustrato il modo in cui Google indicizza le pagine.
Matematica c conoscenza 5

infinitesimale) è stata inventata da Newton e Leibniz, che hanno aperto le


porte alla modernità». Atiyah prosegue dicendo che queste tre branche, nel
mondo fisico, corrispondono rispettivamente allo studio di spazio, tempo e
quantità continue {continuum)-. «Che la geometria sia lo studio dello spazio
è abbastanza ovvio, che l’algebra sia lo studio del tempo lo è forse di meno.
Ma ogni sistema algebrico comporta una serie di operazioni (addizione, mol­
tiplicazione, ecc.) che devono essere eseguite in sequenza, una dopo l’altra.
In altre parole, l’algebra per avere significato ha bisogno del tempo (anche
se di solito si usa un tempo discreto, fatto di istanti successivi)».
Secondo un punto di vista alternativo, l’algebra ha una relazione intima
non tanto con la fisica quanto con il linguaggio. Se osserviamo, infatti, il len­
to affermarsi della notazione posizionale per i numeri e quello, successivo,
del simbolismo algebrico per rappresentare variabili e operazioni, possiamo
riconoscere due fasi distinte.
In un primo tempo, l’uso di una particolare notazione serve soprattutto
ad abbreviare e rendere omogenea la rappresentazione simbolica di un certo
insieme di significati. In questa fase, un linguaggio naturale può svolgere
la stessa funzione (come è in effetti avvenuto in passato), solo con minore
efficienza. Possiamo dunque raffrontare questo processo con la comparsa di
un sottodialetto specialistico all’interno di una lingua. Le cifre romane che
ancora oggi usiamo in casi speciali sono un residuo fossile di questo stadio
di sviluppo. Un altro esempio utile, forse più definito e meglio documentato,
è dato dalla nascita della notazione chimica moderna.
Nella seconda fase, si inventano gli algoritmi per operare sui numeri
scritti in notazione posizionale: prima l’addizione e la moltiplicazione, poi la
divisione. Parallelamente, si iniziano a disporre variabili e operazioni in mo­
do da scrivere identità ed equazioni, fino ad arrivare a classi di equazioni che
si possono trasformare e risolvere. In questa fase, le espressioni del nuovo
dialetto (matematico) non sono tanto veicoli di significato, quanto materia
prima per la grande macchina della computazione. Questo spostamento,
dalla semantica più o meno esplicita della notazione alla semantica implicita
degli algoritmi come trasformazioni di stringhe di simboli, è stato l’evento
fondamentale che ha segnato la nascita dell’algebra.
In nessuna lingua naturale è avvenuto qualcosa di analogo a questa secon­
da fase. Al contrario, quando negli anni Sessanta del secolo scorso, grazie ai
primi grandi calcolatori elettronici, si videro i primi tentativi algoritmici su
testi di lingue come inglese, francese e russo (in particolare, i primi program­
mi di traduzione automatica), fu chiaro fin da subito che il linguaggio umano
era particolarmente inadatto per i computer. Si rendevano necessari grandi
database per i vocabolari; la morfologia, la sintassi e l’uso della lingua erano
governati da insiemi di regole intricate e illogiche; nelle singole lingue, gli usi
sembravano diversi in modo contraddittorio e idiosincratico. Nonostante
6 Yuri I. Manin

tutti i nostri sforzi, la traduzione automatica non ha mai dato risultati soddi­
sfacenti e ha sempre reso necessario l’intervento di un redattore umano.
Questa caratteristica delle lingue naturali, cioè la loro resistenza ai ten­
tativi di trattamento algoritmico, è forse il motivo fondamentale per cui un
linguaggio adatto alla fìsica si trova solo nella matematica. Per esprimere
relazioni come E = me2 o \e,S{{<>)Dip non ci mancano certo le parole, che
comunque possono essere definite quando serve; il punto è che solo con le
parole non potremmo fare nulla a partire da queste straordinarie scoperte.
Ma sarebbe comunque sbagliato pensare solo alle formule e liquidare le
parole, che nei testi matematici e scientifici hanno tre funzioni fondamentali.
In primo luogo, formano una serie di ponti tra la realtà del mondo fisico e
il mondo delie astrazioni matematiche; secondariamente, portano con sé
giudizi di valore, impliciti o espliciti, circa le nostre scelte di particolari tipi
di deduzioni all’interno dell’enorme numero di discorsi formali, il più delle
volte vuoti di contenuto; infine, ma non meno importante, ci permettono di
comunicare, insegnare e imparare.
Vorrei riportare qui un acuto brano di Paul Samuelson relativo all’uso
di parole e simboli matematici nei modelli economici: «Quando affrontia­
mo in modo retorico i problemi della teoria economica, stiamo comunque
risolvendo le stesse equazioni che affronteremmo se le scrivessimo in modo
esplicito. [...] Gli errori davvero gravi stanno nell’assunzione delle premes­
se. [...] Uno dei vantaggi della matematica, o più precisamente dei canoni
matematici consueti con cui si dimostrano gli assunti, verbalmente o per
mezzo di simboli, sta nel fatto che ci obbliga a scoprire le carte in tavola, in
modo che tutti possano controllare i nostri punti di partenza» (citato in Li
Calzi e Basile [2000]).
Ma torniamo alle tre grandi province matematiche, la geometria, l’al­
gebra e l’analisi; dove ha diritto di cittadinanza la logica (matematica), con
la sua incarnazione moderna data dalla teoria della computazione e più in
generale dalla scienza dei calcolatori? Ci sono ottimi argomenti per consi­
derarla parte dell’algebra (con buona pace di Frege). E se accettiamo questa
classificazione, le parole di Atiyah sull’algebra e sul tempo, con cui abbiamo
aperto il paragrafo, ci sembrano ben fondate. In realtà, la logica fece il suo
grande salto negli anni Trenta del secolo scorso, quando Alan Turing uti­
lizzò per primo una metafora fisica (la «macchina di Turing», appunto) per
descrivere un procedimento algoritmico. Prima di allora la logica era vista
quasi esclusivamente in termini paralinguistici. La macchina è un automa
finito che si muove con passi discreti lungo un nastro unidimensionale, su
cui scrive e cancella unità di informazione; la sua esistenza e universalità,
garantite da un apposito teorema, sottolineano proprio l’aspetto temporale
della computazione. Ma c’è di più: l’idea del calcolo come processo fisico
ha aperto la strada non solo ai moderni computer ma anche alla scoperta
Matematica e conoscenza 7

delle leggi generali, classiche e quantistiche, che governano la raccolta e la


manipolazione dell’informazione.

1.2. G li oggetti della conoscenza matematica.


La biologia studia gli organismi viventi; l’astronomia, i corpi celesti; la
chimica, la varietà della materia e i modi delle sue trasformazioni. Gli scien­
ziati fanno osservazioni e misure di crudi dati di realtà, progettano espe­
rimenti precisi, da effettuarsi in ambienti controllati (non in astronomia,
certo), e infine creano un paradigma esplicativo che diventa un punto fermo
nel discorso scientifico.
Ma che cosa studia la matematica?
Ecco una possibile risposta: concetti che si possono trattare come sefos­
sero oggetti reali (Davis e Hersch [1980] li definiscono «oggetti mentali con
proprietà riproducibili»).
Tutti questi concetti devono essere sufficientemente ben definiti, tali da
essere riconoscibili in ogni contesto in cui possano venire utilizzati. Allo stes­
so tempo, devono avere forti potenzialità di connessione con altri concetti
dello stesso tipo. Quando, per mezzo della tradizione o dell’insegnamento,
si forma un certo corpo iniziale di concetti, le loro relazioni e connessioni
interne possono a loro volta assurgere a oggetti matematici, formando in
questo modo il primo livello di una gerarchia di astrazioni.
Le fondamenta di questa gerarchia sono le immagini mentali delle cose
reali e delle loro trasformazioni. Miracolosamente, anche ai livelli più alti di
astrazione si può comunque trovare una certa connessione con la realtà: il
livello di conoscenza del mondo a cui sono arrivati i fìsici con le loro scoperte
si può esprimere solo nel linguaggio della matematica.
Vediamo ora qualche esempio fondamentale.

1.2.1. Numeri naturali. È questo forse il primo concetto «protomate­


matico». I numeri 1, 2, 3, ... hanno proprietà «inflessibili», che li hanno
fatti diventare parte della cultura simbolico-religiosa di molte civiltà. Viene
subito in mente la Trinità cristiana, ma anche il Nirvana buddista ha origine
numerologica: viene dalle radici sanscrite nir e dva, e dva significa due (il
che implica che lo stato di assoluta beatitudine si ottiene obliterando la na­
tura individuale e diventando «uno» con l’universo). Questa connotazione
negativa, di separazione, del numero due sopravvive anche in alcune lingue
europee, dove è parte della radice di «dubitare»: douter in francese ezweifeln
in tedesco (al proposito si veda anche la descrizione di Mefìstofele fatta da
Faust).
I numeri naturali sono anche un concetto «protofìsico»: contare una serie
di oggetti materiali (o immateriali: ad esempio il giorno e la notte) è il primo
caso di «misura» (ci torneremo tra poco).
8 Yuri I. Manin

Questi numeri diventano un concetto «matematico» quando:


a) si sviluppano procedimenti per manipolarli come se fossero oggetti:
addizione, moltiplicazione;
b) si scoprono le prime proprietà strutturali astratte dell’intera classe dei
naturali: esistenza e infinità dei numeri primi, esistenza e unicità della
fattorizzazione.
Queste due scoperte avvennero in luoghi e tempi molto distanti (e pos­
siamo affermare che è altrettanto grande la distanza culturale e filosofica che
le separa). La prima segna l’inizio di quella che oggi chiamiamo matematica
applicata , la seconda di quella che un tempo si definiva matematica pura.
Cerchiamo di capirne qualcosa in più.
In un primo tempo, i numeri e i modi con cui manipolarli sono codificati
da oggetti materiali, come un dito o un’altra parte del corpo, un bastoncino
o una tacca. Quest’ultima è già un segno, più che un oggetto, e può già avere
significati diversi: magari non sta per 1, ma per 10, o 60, a seconda della sua
posizione relativa rispetto ad altre tacche poste sulla stessa fila. Si apre cosi
la strada a una grande e precoce scoperta, quella della numerazione posi­
zionale. Perché il sistema funzioni, però, è richiesto anche un segno speciale
per lo «zero», che arriva in un secondo tempo e che segna il raggiungimento
di un nuovo livello di astrazione.
Leggiamo questo eloquente passo dell’introduzione a Boofl-Bavnbek e
Hoyrup [2003]:
All’incirca nel 2074 a.C., il re Shulgi attuò una riforma militare nell’impero su­
mero, seguita l’anno successivo da una riforma amministrativa (pare introdotta con la
scusa dello stato di emergenza, ma presto resa permanente). Gran parte della popo­
lazione attiva era obbligata a prestare la sua opera con metodi non dissimili da quelli
usati per gli schiavi; gli scribi dovevano sorvegliare il lavoro ed erano responsabili
della produttività della squadra a loro affidata, che veniva calcolata secondo regole
prefissate in unità astratte pari a 1/60 della giornata lavorativa (cioè 12 minuti). Ne
conseguiva l’esigenza di un’accurata contabilità, in cui la produzione veniva verificata
con precisione e convertita in unità standard: erano dunque necessarie molte addi­
zioni e moltiplicazioni. Nacque cosi un sistema di notazione posizionale in base 60,
con il quale venivano fatti tutti i calcoli. Da ciò deduciamo che gli scribi dovevano
avere a disposizione tavole di moltiplicazione, tabelle di reciproci e di costanti, e che
dovevano frequentare corsi specifici di istruzione per imparare a usarle. L’effettivo
avvio di un sistema che era per cosi dire «nell’aria» da secoli richiese cosi una decisio­
ne politica e una forte volontà. Come accadde in molti altri casi, fu la guerra a fornire
l'opportunità per un’azione di largo respiro sociale.

I numeri primi, d’altro canto, sembrano saltar fuori da pure speculazioni,


cosi come il concetto di infinito attuale e di sistema dei numeri naturali.
La dimostrazione dell’esistenza di infiniti numeri primi, contenuta negli
Elementi di Euclide, è una delle più antiche gemme del discorso matematico.
Ricordiamola qui brevemente, usando la notazione moderna: in sintesi, si
Matematica e conoscenza 9

suppone per assurdo di avere un elenco finito di primi p p ne si costruisce


un altro primo non compreso nell’elenco, cioè uno dei divisori del numero
Pi • 'Pn + !■
E un esempio perfetto di come si possano trattare concetti matematici
come se fossero oggetti materiali «concreti». Giunti a questo stadio di astra­
zione, sono ormai pure idee, incredibilmente scollegate da ogni vestigia di
contabilità sumera o di qualunque altra notazione materiale. Uno sguardo a
un numero intero scritto in moderna forma decimale ci permette di capire se
è divisibile o no per 5, ma non se è primo. Generazioni di matematici venuti
dopo Euclide si sono stupiti dell’apparente casualità con cui i numeri primi
sembrano distribuiti nella serie dei naturali.
La scoperta, la sperimentazione e recentemente anche l’ingegneria (cioè
la produzione algoritmica di grandi primi, per ragioni legate alla sicurezza
informatica) di questi particolari numeri sono diventate il marchio di fab­
brica di molti settori della moderna teoria dei numeri.

1.2.2.1 numeri reali e 1‘«algebra geometrica». Gli interi sono il prodotto


del contare, ma i numeri reali nascono dalla geometria, sotto forma di lun­
ghezze, aree e volumi. La scoperta pitagorica delPincommensurabilità tra
diagonale e lato di un quadrato fu anche la scoperta del fatto che esistono più
«grandezze» che «numeri». In seguito, queste stesse grandezze divennero
numeri reali.
Le operazioni aritmetiche sugli interi sono figlie dei bastoncini e delle
tacche e nascono dal bisogno di annotare e manipolare quantità in modo
sistematico. Le operazioni algebriche sui numeri reali nascono invece dal
disegno, dall’architettura, dall’agrimensura, e poi dalle speculazioni su cer­
chi, quadrati e angoli euclidei.
Gli storici della matematica nel xx secolo si sono divisi sull’interpretazione
della matematica greca (o perlomeno di sua gran parte) come «algebra geome­
trica». Secondo alcuni, ad esempio, la tipica figura di un quadrato suddiviso
in quattro parti, di cui due altri quadrati e due rettangoli uguali, è da leggersi
come la prova geometrica dell’identità algebrica (a + b)2 = a2 + lab +
Dal nostro punto di vista, possiamo fare considerazioni più generali sulle
modalità del ragionamento astratto, in particolare matematico. Sono sostan­
zialmente due:
a) la manipolazione consapevole di un sistema finito e discreto di sim­
boli, dotato di leggi esplicite per la costruzione e deduzione di pro­
posizioni sensate, e di leggi più implicite che permettono di decidere
quali proposizioni siano «interessanti» (parte sinistra del cervello,
elaborazione linguistica e algebrica);
b) la manipolazione in gran parte inconscia di immagini visuali, con re­
gole implicite basate sulle esperienze passate e sulla probabilità di
10 Yuri I. Manin

quelle future, con criteri di giudizio fondati su equilibrio, armonia,


simmetria (parte destra del cervello, arti visive e musica, geometria).
Un matematico ricercatore deve mettere insieme nel suo cervello questi
due aspetti, in vari modi raffinati. Non è certo un compito semplice, soprat­
tutto perché le velocità con cui la mente li tratta sono enormemente diverse:
seguendo Norretranders [1998], si parla di circa 10 bit/secondo per le ma­
nipolazioni di tipo simbolico e di IO7bit/secondo per le altre.
Forse proprio a causa di queste (e altre) discrepanze, si tende a pensare
alle due modalità in modo emotivo, identificandole come valori in opposizio­
ne: la freddezza dell’intelletto contro il calore del sentimento, la nuda logica
contro la brillante intuizione. A questo proposito si veda David Mumford
[2000 e 2002], che difende in modo molto efficace la statistica dalle influenze
della logica, ma si dichiara tutto a favore della statistica matematica, le cui
fondamenta, come quelle di ogni altro settore della disciplina, sono costruite
in modo rigorosamente logico.
Tornando ai Greci e alla loro algebra geometrica, vediamo nel loro modo
di far matematica un classico esempio di pensiero da lato destro del cervello
che in seguito, per ragioni storiche, diventa dominato dal lato sinistro. Per
dirla con Mumford, l’algebra moderna è la grammatica delle manipolazioni
di oggetti intrinsecamente geometrici, mentre l’algebra greca è un compen­
dio di entrambi gli aspetti.
Forse si possono ritrovare tracce moderne del pensiero geometrico gre­
co non solo nella geometria in senso proprio, ma anche nella fisica teorica.
Nell’ultimo mezzo secolo ce stato un tale vigore di congetture e costruzioni
raffinate, sia in matematica sia in fìsica, da portare alla nascita di una esplicita
«fìsica matematica». Per esempio, l’uso creativo degli integrali sui cammini
di Feynman ci colpisce per l’abbondanza di risultati costruiti su fondamenta
matematicamente instabili, a giudizio di tutti. Forse questa è un’altra prova
del fatto che l’algebra geometrica greca era reale, e non solo una nostra
ricostruzione a posteriori.

1.2.3. Storia di tre numeri. Tutti dicono che l’espressione di Eulero


é™ = — 1è la più bella formula matematica che ci sia. Combina, in modo del
tutto imprevedibile, tre (o quattro, se consideriamo anche l’unità 1) costanti
fondamentali, scoperte in epoche diverse per motivi altrettanto diversi.
In breve, tt = 3,1415926... è un altro lascito dei Greci. La sua stessa esi­
stenza come numero reale, cioè come (lunghezza di un) segmento o (misura
di una) superfìcie, non è semplice da afferrare senza un qualche sforzo con­
cettuale. La «quadratura del cerchio» non è solo un problema geometrico,
ma anche un test di legittima esistenza, dagli esiti incerti.
Per contro e = 2,7128128... nasce alla metà del xvn secolo, all’interno di
una matematica occidentale quasi, se non del tutto, matura. È un sottopro­
Matematica e conoscenza 11

dotto teorico dell’invenzione dei logaritmi, c delle tavole logaritmiche come


strumento per velocizzare i calcoli (grazie al fatto che l’addizione sostituisce
la moltiplicazione), oltre che del problema della «quadratura dell’iperbole».
Nessuna costruzione geometrica classica porta a e, e nulla sembra far pensare
a una sua relazione con tt.
Infine, l’uso di i = V-I, un numero «immaginario», mostruoso per mol­
ti all’epoca, fu letteralmente imposto a Cardano quando scopri le formule
per la risoluzione per radicali delle equazioni cubiche. Risulta infatti che se
ci sono tre radici reali, il segno sotto certe radici quadrate è negativo.
La formula di Eulero è un caso notevole di quelle «identità all’infini­
to» in cui egli eccelleva (un maestro moderno delle stesse è stato Srinivasa
Ramanujan). Infatti f'1T= - 1 è un caso particolare della serie é x =
c^e Porta all’espressione più generale eix = cosx + i sinx.
Le nuove scoperte della teoria dei numeri reali e dei limiti hanno relegato
in secondo piano le abilità di Eulero e Ramanujan nel trattare le identità
infinite. A proposito di quest’ultimo, il suo mentore G. H. Hardy non capiva
come il matematico indiano potesse intuirle cosi bene nel suo mondo inte­
riore. È un fatto che forse ci dice qualcosa sulla diatriba tra logica e statistica,
ma al momento non riesco a formulare un’ipotesi anche provvisoria.
Come prodotto di una serie di ricerche del tutto indipendenti, la re­
lazione eix = cos x = / sin x si è rivelata fondamentale per dare una base
matematica adeguata a una delle più importanti e sorprendenti scoperte del
xx secolo: la meccanica quantistica, con le sue onde di probabilità e i suoi
fenomeni di interferenza.

1.2.4. L'insieme di Cantor, estremo oggetto matematico. Nelle esatte pa­


role di Cantor, «Unter einer “Menge” verstehen wir jede Zusammenfassung
M von bestimmten wohlunterschiedenen Objekten m unserer Anschauung
oder unseres Denkens (welche die “Elemente” von M genannt werden) zu
einem Ganzen»'.
La sintassi del tedesco permette a Cantor una simmetria tra significato e
struttura: gli «oggetti m» (Objekten m unsererAnschauung...) sono racchiusi
tra la «collezione» (Zusammenfassung) e la specificazione «presa nella sua
interezza» {zu einem Ganzen).
Se leggiamo per la prima volta questa definizione, ci risulta difficile im­
maginare che razza di matematica, o meglio che razza di pensiero in generale,
possa scaturire da basi cosi povere. Ma è proprio la parsimonia dei mezzi
a permettere a Cantor la sua «diagonalizzazione» e il raffronto tra infiniti

’ «Con “insieme" intendiamo ogni collezione M, presa nella sua interezza, di m oggetti (che
chiamiamo “elementi" di Mi definiti e distinti nella nostra percezione o nel pensiero*.
12 Yuri I. Manin

trattati come oggetti concreti, che porta a scoprire che i numeri reali sono
«più infiniti» in senso stretto degli interi.
Allo stesso tempo, l’intuizione di Cantor sta alla base di gran parte delle
ricerche sui fondamenti della matematica nel xx secolo. Negata con forza da
logicisti di varie scuole e generazioni, viene invece presa come idea unificante
sotto le spoglie di teoria degli insiemi e, più tardi, di teoria delle categorie.

1.2.5. «Tutti gli uomini sono mortali...» Dal sillogismo al software. Le


forme elementari delle proposizioni e le regole di base delle deduzioni furo­
no sistematizzate da Aristotele. Fin da subito ci si accorse delle analogie tra
queste e l’aritmetica elementare, ma la connessione fu precisata e resa esplici­
ta assai più tardi, soprattutto da George Boole. I filosofi della scienza hanno
sempre avuto idee contrastanti sui rapporti gerarchici in questa relazione;
per Frege, ad esempio, l’aritmetica era certamente parte della logica.
NegU anni Trenta del xx secolo si è assistito a una raffinata fusione delle
parti, grazie a Godei, Tarski e Church, che hanno inventato modelli astratti
del ragionamento matematico assai più sofisticati della semplice combina­
toria di proposizioni finite. Si è rivelata soprattutto importante un’idea che
risale a Leibniz, grazie alla quale le deduzioni logiche si possono sostituire
con operazioni aritmetiche, sfruttando un modo particolare di associare a
ogni proposizione un numero intero.
Tarski, per cui la verità doveva essere tale «in tutte le interpretazioni»,
scopri che l’insieme delle (o meglio, dei numeri rappresentanti le) verità
aritmetiche non si può esprimere con una formula. La versione tarskiana
«infinita» del concetto di verità è legata al fatto che le espressioni logiche
possono contenere quantificatori universali come «per tutti gli x» o «esiste
un x», quindi l’interpretazione di una formula finita richiede una sequenza
potenzialmente infinita di verifiche.
Con uno stratagemma simile, Godei dimostrò che l’insieme delle verità
aritmetiche deducibili da un qualsiasi sistema finito di assiomi e regole di
deduzione non può coincidere con quello di tutte le proposizioni vere del
sistema. Nelle dimostrazioni di Tarski e Godei gioca un ruolo fondamentale
il concetto di autoreferenzialltà.
Tra l’altro, i due mostrarono che la relazione gerarchica fondamentale è
tra linguaggio e metalinguaggio, e che solo le loro relazioni sono oggettive,
non i rispettivi status ontologici. È possibile utilizzare la logica per descrivere
l’aritmetica e viceversa; con una raffinata mistura di logica e aritmetica si può
dimostrare senza incertezze che esistono restrizioni intrinseche all’uso della
sola logica come strumento cognitivo, anche quando il discorso è puramente
interno alla logica stessa.
Negli stessi anni, Turing e Church misero a punto il concetto di «com­
putabilità», che fin da subito mostrò un sentore più aritmetico. Turing fece
il passo decisivo: per parlare di logica e computazione non usò il modello
Matematica e conoscenza 13

linguistico tradizionale, caro a Tarski e Godei, ma lo sostituì con un ogget­


to fìsico, la «macchina di Turing». Fu un salto concettuale notevole, che
preparò la teoria ai successivi avanzamenti tecnologici, cioè alla nascita dei
calcolatori elettronici programmabili.
Dal punto di vista teorico, Church eTuring dedussero entrambi l’esisten­
za di una nozione «definitiva» di computabilità, incarnata rispettivamente
dalla funzione ricorsiva universale e dalla macchina di Turing. Questo non è
tanto un nuovo teorema, quanto una «scoperta fisica in ambito metafìsico»,
non sostenuta da una dimostrazione formale ma dal fatto che, storicamente,
tutti i sistemi alternativi proposti in seguito si sono sempre rivelati, alla fine,
equivalenti a quello di Church-Turing. Un aspetto non molto conosciuto
(perlomeno tra i non specialisti) di questa scoperta è la presenza inevitabile
della «non computabilità» all’intemo della definizione corretta di compu­
tabilità: una funzione ricorsiva, in genere, non è definita ovunque, e non è
possibile decidere a priori dove è definita e dove no.
I computer che oggi ci circondano sono l’incamazione, tecnologicamen­
te alienata, di queste grandi scoperte.

1.3. D efinizioni, teoremi, dimostrazioni.


Presenterò ora brevemente qualche forma tangibile di matematica «pu­
ra», intesa come prodotto dell’attività collettiva della comunità matematica
contemporanea. Insisterò sulle forme con cui questa è organizzata solo in
quanto riflesso della struttura intema del mondo dei concetti matematici.
Prendiamo un articolo di ricerca in una delle più autorevoli riviste del
settore, come gli «Annals of Mathematics» o le «Inventiones Mathemati-
cae». In genere è suddiviso in capoversi abbastanza compatti, sotto le dici­
ture Definizione, Teorema (con le due sottospecie Proposizione e Lemma)
e Dimostrazione. Queste ultime possono essere molto lunghe. È questa la
struttura a blocchi del discorso matematico odierno; la presenza di accessori
come introduzioni che spiegano i motivi della ricerca, esempi e controe-
sempi, discussioni di casi particolari e cosi via rende il tutto più piacevole
da leggere.
Questa organizzazione tradizionale è un’eredità greca, segnatamente
degli Elementi di Euclide. La definizione serve a introdurre nel discorso un
certo oggetto matematico; il teorema ne enuncia alcune proprietà, o lo mette
in relazione con altri oggetti; la dimostrazione serve a convincere gli altri del­
la giustezza del teorema, per mezzo di un discorso formale suddiviso in passi
successivi, ognuno dei quali deriva dal precedente in modo «elementare».
In pratica: prima scriviamo di cosa stiamo parlando, e poi perché siamo
convinti che ciò che diciamo sia giusto (con buona pace di Bertrand Russell).
Concentriamoci sulle definizioni. Il punto di partenza è intricato e con­
troverso dal punto di vista epistemologico. Stiamo parlando di immagini
14 Yuri I. Manin

mentali molto specifiche, in genere ignote a chi non abbia avuto una forma­
zione specifica (cos’è un numero reale? una variabile aleatoria? un gruppo?)
Quando ho parlato di qualche concetto matematico, finora ho usato solo
artifìci retorici per renderli chiari e comprensibili, ma non ho mai dato defi­
nizioni nel senso tecnico del termine.
In Euclide, le definizioni sono in genere un miscuglio di spiegazioni di
oggetti geometrici e di «assiomi», in cui si esplicita una serie di proprietà
astratte che vogliamo abbia il nostro oggetto.
Nella matematica moderna, in pratica si può definire tutto (più o meno
esplicitamente) a partire dal concetto di insieme dato da Cantor e da un
armamentario limitato di proprietà e tecniche di costruzione di altri insiemi.
Ogni definizione matematica, dunque, si può vedere come la descrizione in
forma standardizzata di una certa struttura, data da insiemi, sottoinsiemi e
cosi via. Questo punto di vista risale al gruppo Bourbaki e si è dimostrato
molto importante, tanto da diventare una forma largamente condivisa di
organizzazione della conoscenza matematica. La reazione a questo successo
è stata inevitabile, con critiche severe dirette soprattutto verso il sistema di
valori che sta dietro a questa tradizione neoeuclidea; ma i suoi meriti pratici
sono diffìcilmente contestabili. Perlomeno, con questo sistema la comunica­
zione tra matematici specialisti di campi diversi è resa molto più efficiente.
Se adottiamo la teoria degli insiemi, in una delle sue forme, come base per
tutte le edificazioni future, gli unici assiomi superstiti, in senso euclideo, del
sistema sono quelli della teoria stessa, che sembrano anche proprietà intuiti­
vamente ovvie in genere accettate senza grandi discussioni (ma ci torneremo
tra poco). Gli assiomi relativi ai numeri reali o alla geometria piana diventano
proprietà dimostrabili di insiemi appositamente costruiti.
Questo quadro concettuale è stato sviluppato a fondo nel monumentale
lavoro di Bourbaki, dove si trova anche l’elegante concetto di «strutture
madri» (structures-mères)\
Ponendosi in un contesto più ampio, potremmo dire che i matematici
hanno sviluppato un comportamento specifico nei loro discorsi, che defini­
rei «cultura delle definizioni». È una cultura in cui si investono molte energie
per rendere chiari il contenuto (la semantica) di alcune nozioni fondamentali
astratte e la sintassi che governa le loro relazioni, mentre la scelta delle parole
(e persino delle notazioni) usate è una questione secondaria e in gran parte la­
sciata all’arbitrio, dettata dalla praticità, da considerazioni di natura estetica,
dal desiderio di sortire il giusto effetto. Possiamo paragonare questo modo
di fare a certi codici della ricerca umanistica, dove termini come Dasein o

4 Per saperne di più sulla storia di questo gruppo si può consultare il numero monografico di
«Pour la Science» [a a .w . 2000]. Si veda anche G. Bolondi, La Francia del Novecento: il fenomeno
bourbaki, in questa stessa opera, voi. 1. 1luoghi e i tempi, Einaudi, Torino 2007, pp. 625-50.
M aiematica e conoscenza 15

différance sono usati in modo standard per riferirsi a una certa tradizione,
senza preoccuparsi troppo del loro significato*.

1.4. Problemi, congetture, programmi di ricerca.


Ogni tanto si dà alle stampe un articolo in cui si risolvono (o perlomeno
si getta nuova luce su) famosi problemi e congetture, che hanno resistito
ai nostri sforzi per decenni o addirittura secoli. Vecchie conoscenze come
l’ultimo teorema di Fermat (dimostrato da Andrew Wiles), la congettura di
Poincaré (dimostrata da Grigori Perelman), l’ipotesi di Riemann, la conget­
tura P = NP, ecc., oggi fanno notizia anche sui giornali.
L’8 agosto 1900, durante il secondo Congresso intemazionale dei mate­
matici a Parigi, David Hilbert fece un intervento in cui illustrò dieci proble­
mi fondamentali (parte di una lista più ampia di 23, che venne pubblicata
dopo) die la matematica avrebbe dovuto risolvere nel nuovo secolo. Si può
discutere dell’importanza scientifica relativa di alcuni problemi del suo elen­
co, ma è indubbio che tutti esercitarono una grande influenza sui programmi
di ricerca delle future generazioni di matematici, che concentrarono i loro
sforzi in direzioni precise.
Un problema può essere una domanda che richiede una risposta sec­
ca (sì/no) circa la validità di una certa affermazione (come ad esempio la
congettura di Goldbach: è vero che ogni numero pari maggiore di 4 si può
scrivere come somma di due primi?) Un programma di ricerca, invece, è
uno schizzo preliminare di un campo più vasto, una carta geografica in cui
alcune aree sono raffigurate con precisione e altre ricostruite sulla scorta di
analogie, casi particolari e cosi via.
Questa distinzione non è sempre netta. Il primo problema della lista
di Hilbert, l’ipotesi del continuo, sembrava allora ammettere una semplice
risposta si/no. Invece ha dato vita a un grande programma di ricerca, al
termine del quale si è scoperto, tra l’altro, che nessuna risposta è ricavabile
partendo dalla teoria assiomatica degli insiemi comunemente accettata.
D ’altro canto, la formulazione esplicita di un programma di ricerca può
dar vita a imprese azzardate. L’ambito del sesto problema, che riguardava
l’assiomatizzazione della fìsica, è stato completamente stravolto nei trent'an­
ni successivi alla sua enunciazione.
Tra i programmi di ricerca più importanti dell’ultimo secolo ci sono esplo­
razioni profonde della complessa struttura del mondo platonico. André Weil

* Forse esagero. Qualche giorno faero su un tram erimuginavo su questa affermazione di Ogden
Nash: «Ci sono persone che dopo una giornata di lavoro si mettono a studiare di notte per prendere
un diploma per corrispondenza, mentre altre pensano che raggiungerannogli stessi obicttivi con uno
studio particolareggiato delle differenze tra bionde e brune». Dietro a un simile studio c’è un'idea
molto derrìdiana di «differenza», pensavo, quando d’un tratto l’insegna di un negozio ha attirato la
mia attenzione: recitava d e s ig n f u r d a s e j n .
16 Yuri I. Manin

ha ipotizzato l’esistenza di una teoria coomologica per le varietà algebriche


di caratteristica finita e Grothendieck l’ha costruita in modo esplicito, il che
ha cambiato per sempre il modo in cui intendiamo le relazioni tra continuo
e discreto.
Poincaré diceva che non esistono problemi risolti, ma solo problemi «più
o meno» risolti; in altre parole, formulare una congettura solo come una
domanda a risposta secca si/no è indice di chiusura mentale.
L’alba del xxi secolo ha visto la pubblicazione di una lista di «pro­
blemi del Millennio» da parte del Clay Institute. Sono sette, e tutti ri­
chiedono una risposta si/no. Per la prima volta, in un elenco di questioni
matematiche compare un problema che viene dalla scienza dei computer:
la famosa congettura P = NP. Hanno tutti un bel cartellino del prezzo
attaccato: IO6 dollari sono a disposizione di chiunque ne risolva uno.
È ovvio che le forze del libero mercato sono state a guardare mentre si
decideva il prezzo.

2. La matematica come strumento cognitivo.

2.1. Un po’ di storia.


I testi antichi considerati le fonti della storia per la matematica mostrano
come questa sia nata sotto le spoglie di un’attività mirata a soddisfare le
esigenze del commercio, della burocrazia, delle grandi imprese pubbliche e
della guerra, come abbiamo visto sopra a proposito dei Sumeri.
Un altro esempio si può trovare nei Nove capitoli sui procedimenti ma­
tematici, compilati in Cina durante la dinastia Han nei primi anni dell’era
cristiana. È una lista di problemi seguiti dalla loro soluzione; ognuno si può
pensare come caso particolare di un algoritmo generale, che dà modo al let­
tore di risolvere da sé altri problemi simili. Secondo Karine Chemla [1998],
i casi esaminati sono
problemi concreti che la burocrazia Han doveva affrontare, in particolare relativi
al «Grande ministero dell’Agricoltura» (dasinong): calcolare la paga dei dipendenti
statali o le scorte nei granai, stabilire standard di misurazione, ecc. Inoltre, il sesto
dei Nove capitoli prende il titolo da una legge proposta dal Gran Ministro Sang Hon-
gyang (152-82 a.C.) per rendere equo il sistema delle tasse; il testo classico mostra
alcune procedure matematiche utili a raggiungere l’obiettivo.

Qualcosa di analogo di trova in Anjing Qu [2002]:


Nella lunga storia dell’impero cinese, l’astronomia teorica è sempre stata l’unica
scienza esatta su cui si è concentrata l’attenzione dei regnanti. Tutte le dinastie si so­
no preoccupate di avere un osservatorio reale, visto come istituzione indispensabile
dello Stato. Matematici, astronomi e astrologi erano gli unici scienziati professionisti
stipendiati dall’imperatore. I matematici del tempo si occupavano di fissare le prò-
Matematica e conoscenza 17

cedure algoritmiche per il computo del tempo; gran parte di questi scienziati aveva
un formazione specifica nel campo dei calendari. [...]
A loro era richiesto un altro grado di accuratezza nel prevedere i fenomeni celesti.
Gli sforzi per migliorare i modelli di calcolo, fino alla precisione necessaria per le
osservazioni astronomiche, erano incessanti. Non era necessario, né possibile, che un
modello di matematica di tipo geometrico rimpiazzasse quello numerico, chiave del
sistema cinese. [...] In quanto strettamente collegata ai metodi numerici, l’algebra, e
non la geometria, divenne la branca della matematica più sviluppata in Cina.

La tradizione occidentale inizia in Grecia. Secondo H. W. Turnbull


[1956], dobbiamo a Pitagora (569-500 a.C.) la parola «matematica», nonché
la suddivisione della stessa in aritmetica c geometria. Nel dettaglio, l’arit­
metica (come la musica) studia le quantità discrete, mentre la geometria
(come l’astronomia) si occupa di quelle continue. La dicotomia secondaria
tra geometria e astronomia è invece quella tra il fisso e il mutevole.
Con poche modifiche, questa classificazione arrivò fino al Medioevo,
dove si tradusse nel programma di studi del Quadrivio. Se ne trovano ancora
chiare tracce nel pensiero di Michael Atiyah esposto sopra.
In un passo della Repubblica (VII, 525c) Platone (429-348 a.C.) spiega
perché lo studio della matematica sia essenziale per un governo illuminato:
Sarebbe dunque conveniente, Glaucone, rendere obbligatoria questa scienza e
convincere quelli destinati a esercitare le massime magistrature ad affrontare lo studio
non superficiale dcll’aritmetica fino a giungere con l’intelligenza pura alla compren­
sione della natura dei numeri, non per la compravendita come fanno commercianti
e bottegai, ma per la guerra e per facilitare allo spirito il passaggio dal divenire alla
verità dell’essere6.

Con l’affermarsi progressivo della matematica «pura», il confronto con


le esigenze materiali iniziò a essere classificato come «applicazione». L’op­
posizione tra matematica pura e applicata, com’è noto ai giorni nostri, è
sicuramente cristallizzata già all’inizio del xex secolo: in Francia, Joseph Diaz
Gergonne pubblica le sue «Annales de mathématiques pures et appliquées»
dal 1810 al 1833, mentre in Germania August Leopold Creile fonda nel 1826
il suo «Journal ftir die reine und angewandte Mathematik».

2.2. G li strumenti cognitivi della matematica.


Per capire come la matematica si applichi ai fini di migliorare la cono­
scenza del mondo reale, è opportuno esaminarla sotto forma di tre modalità
operative: modello, teoria e metafora.
Un modello matematico descrive in senso qualitativo o quantitativo una
serie di fenomeni, ma lo mettiamo a disagio se pretendiamo di fame qualco-

kPlatone, La Repubblica, traduzione di G. Lorza, Mondadori, Milano 1990. [N.J.T.],


18 Yuri I. Manin

sa di più. Dagli epicicli nel modello tolemaico del moto planetario (circa
150 a.C.) al modello standard della fìsica delle particelle elementari (cir­
ca 1960 d.C.), i modelli quantitativi si aggrappano alla realtà osservabile
aggiustando in qualche modo il valore di un gran numero di parametri
liberi (più di 20 nel caso della fìsica). Modelli di questo tipo possono essere
estremamente accurati.
I modelli qualitativi ci dicono qualcosa sulle proprietà di stabilità di un
sistema, sulla presenza di attrattori (stati di confinamento che si verificano
indipendentemente dalle condizioni iniziali) o di fenomeni critici, che av­
vengono quando il sistema passa il confine tra due stati di fase o tra i domini
di due diversi attrattori. Un recente lavoro di Vladimir Keilis-Borok e altri
[2003] cerca di prevedere il numero di omicidi commessi a Los Angeles,
usando come metodo la pattern recognition applicata agli eventi poco fre­
quenti. Ecco le conclusioni: «Abbiamo trovato che un aumento del tasso di
omicidi segue entro 11 mesi l’instaurarsi di una precisa struttura statistica:
aumento simultaneo di furti e aggressioni, accompagnati dal calo di rapine e
omicidi. Entrambi i fenomeni non hanno andamento monotono, ma si ma­
nifestano in modo sporadico, con cicli di 2-6 mesi».
L’era dei computer ha visto il proliferare di modelli. Oggi si producono
su scala industriale e si risolvono per via numerica. In un suo acuto saggio
scritto nel 1997, Robert M. Solow [2005] sostiene che la moderna teoria
economica ortodossa è in pratica una costruzione di modelli.
I modelli sono spesso utilizzati alla stregua di «scatole nere», oggetti dalla
struttura interna ignota in cui si immettono dati con un computer e da cui si
ricavano responsi oracolari che prescrivono certi comportamenti (è cosi ad
esempio per le transazioni finanziarie).
Una teoria (fisica, formulata matematicamente) si distingue da un mo­
dello soprattutto perché mira più in alto. Le teorie fisiche correnti hanno
l’ambizione di descrivere la realtà con precisione, che sarebbe assoluta se il
mondo fosse fatto di oggetti ben limitati: punti materiali dotati di massa ma
privi di dimensioni, soggetti solo alla forza di gravità, campi elettromagnetici
Gwi
nel vuoto e cosi via. Nella legge gravitazionale di Newton F = —— , le quan­

tità G, M e r devono fare concessioni ai dati sperimentali, ma quell’elevazione


a quadrato poggia su inossidabili basi teoriche: l’esponente è 2, non l’appros­
simazione di2,000000003... Una teoria quantitativa ben fondata serve anche
in ambito ingegneristico: una macchina non è che un frammento artificiale
di universo, un ambiente ben isolato in cui a poche leggi fisiche è permesso
di farla da padrone. In questo uso, la teoria fa la funzione di un modello.
Oggi una delle forze che stimolano la nascita di nuove teorie è la credenza
in una realtà al di fuori e al di sopra del mondo materiale, che può essere
afferrata solo con gli strumenti della matematica. Dai solidi platonici alla
«lingua matematica» di Galileo e alle superstringhe quantistiche, questo
Matematica e conoscenza 19

atteggiamento psicologico è spesso presente, anche quando sembra essere in


conflitto con le esplicite posizioni filosofiche degli scienziati.
Una metafora (matematica), se aspira al rango di strumento cognitivo,
deve postulare la possibilità di raffrontare una complessa serie di fenomeni a
una opportuna costruzione matematica. L’esempio più recente che mi sovvie­
ne è l’intelligenza Artificiale: da un lato, si tratta di un insieme di conoscenze
relative ai calcolatori e a una nuova realtà tecnologica, fatta di hardware,
software, reti, ecc.; dall’altro è un potenziale modello del funzionamento del
cervello e della mente, intesa in senso biologico. Complessivamente non ha
ancora raggiunto lo status di modello, perché manca di una esplicita, com­
pleta e coerente struttura di corrispondenza tra chip e neuroni, algoritmi e
processi cerebrali. Ma è possibile (e lo facciamo) utilizzare la nostra massa di
conoscenze in materia di computer e algoritmi (cose che abbiamo inventato
noi) per fare ipotesi sensate sulla struttura e sul funzionamento del sistema
nervoso centrale (come si vede in Mumford [2000 e 2002]).
Una teoria matematica invita a costruire modelli applicativi. Una meta­
fora matematica invita a meditare sulle nostre conoscenze. Al proposito, il
classico saggio di Susan Sontag [1990] sugli usi e abusi della «malattia» come
metafora ci aiuta a porre le giuste cautele.
Ovviamente, la mia classificazione non è rigida né assoluta. Gli studi
statistici all’interno delle scienze sociali oscillano spesso tra il modello e la
metafora. Un cambio di paradigma può ridurre una teoria scientifica al ran­
go di modello superato. Ma per chiarezza di esposizione, questa partizione
è un modo utile di organizzare i fatti storici e sincronici.
Passiamo ora a un esame un po’ più dettagliato di questi strumenti co­
gnitivi, soprattutto dei modelli e delle strutture correlate.

2.3. I modelli.
È possibile studiare la nascita e i meccanismi interni di un modello ma­
tematico isolando i tre stadi in cui si articola ogni studio sistematico di un
insieme di osservazioni quantificabili.
a) Scelta di un insieme di osservabili.
b) Sviluppo di un metodo di misura, cioè assegnazione di valori numerici
alle osservabili. Spesso questo passo è preceduto da un ordinamento
più o meno esplicito dei valori attesi lungo un asse appropriato; ci si
attende che la misura effettiva sia coerente con questo ordinamento.
c) Ipotesi di legge (o leggi) sottostante la distribuzione delle osservabili
nello spazio delle configurazioni (di solito pluridimensionale) che ne
risulta. Le leggi possono essere di natura probabilistica o esatte. Gli
stati di equilibrio possono essere particolarmente interessanti: si tratta
in genere di punti stazionari di funzioni definite in modo appropriato
20 Yuri I. Manin

all’interno dello spazio delle configurazioni. Se il tempo è tra le varia­


bili, in genere entrano in gioco equazioni differenziali di evoluzione.
È interessante soffermarsi sul carattere culturale della scelta delibasse
di valutazione», seguendo le tesi di Karl Jaspers. Per Jaspers la transizione
alla modernità è avvenuta attorno al 500 a.C., epoca in cui l’asse era ordi­
nato secondo l’opposizione tra immanente e trascendente. Qui ci importa
vedere questi due poli come le diverse direzioni di uno stesso asse, verso le
quali l’uomo può scegliere di dirigersi: la libertà è la libertà di scelta tra due
alternative incompatibili. L’immagine della scelta lungo un asse è anche alla
base dell’espressione «gradi di libertà», oggi ridotta a termine tecnico, senza
più (come spesso accade) echi evocativi.
Il concetto di misura, alla base della scienza moderna, è cosi indispensa­
bile da essere a volte sussunto senza cautele critiche aU’interno di un model­
lo. È importante, invece, tenere presente i suoi limiti.
Nell’ambito della descrizione quantistica del mondo microscopico, una
«misura» è un’interazione molto specifica che produce un cambiamento casua­
le nello stato del sistema, piuttosto che fornire informazioni sullo stato stesso.
Nella teoria economica, l’asse universale è dato dalla moneta, su cui si
collocano i «prezzi» di qualunque cosa. La misura, dunque, è funzione delle
forze di mercato. Ecco allora la contraddizione inerente a tutte le metafore
basate sul concetto di mercato (tra cui l’osceno «libero mercato delle idee»):
riducono un mondo a più dimensioni, dotato di vari gradi di libertà incon­
frontabili o incompatibili, al mondo monodimensionale della moneta. In
linea di principio, sull’asse dei prezzi non si possono trasferire nemmeno le
più elementari relazioni di ordinamento, per non parlare di quelle che non
hanno proprio senso di esistere su questo unico asse.
Un’espressione come «il libero mercato delle idee» è allora il trionfo del-
l’ossimoro: nel mondo a una dimensione del mercato, l’unica idea in vendita
è quella del libero mercato stesso.

2.3.1. Breve glossario dei modi di misura. Un’avvertenza di carattere ge­


nerale: la storia di ogni «asse» che esamineremo qui parte sempre dalla scala
umana, cioè dalla manipolazione diretta di oggetti materiali. Poi si evolve
verso scale maggiori e minori, e per affrontare i nuovi problemi posti da
queste estensioni ha bisogno sempre più di strumenti matematici.

c o n t a r e . Se rileggiamo quanto scritto al § 1.2.1 circa i numeri naturali,


vediamo chiaramente che la transizione dalla «scala umana» dei pochi og­
getti quotidiani a quella ben più vasta della burocrazia statale ha stimolato
la creazione e la codifica del sistema di notazione posizionale.
Saltando molti altri punti interessanti, arriviamo a quello che Georg
Cantor considerava a ragione il suo capolavoro: la scoperta di un metodo
Matematica e conoscenza 21

per «contare gli infiniti» e del fatto che ne esiste una gerarchia crescente e
infinita.
11 punto centrale della sua argomentazione assomiglia molto a quello
usato da Euclide per dimostrare che esistono infiniti primi. Dato un insieme
X, finito o infinito, si verifica che V(X), cioè l’insieme di tutti i suoi sottoin­
siemi, ha cardinalità strettamente maggiore di quella di X: è il risultato della
celebre «diagonalizzazione» cantoriana.
La teoria degli insiemi infiniti rende possibile uno straordinario amplia­
mento delle due caratteristiche di fondo dei numeri naturali, cioè del fatto
che ogni numero misura una «quantità» e che la loro relazione d’ordine è del
tipo «x è maggiore di y». Gli infiniti diventano rispettivamente «cardinali»
(misure di infinità) e «ordinali» (posizioni sull’asse ordinato della scala degli
infiniti).
I misteri della successione di infiniti cantoriana hanno portato a una serie
di problemi irrisolti (e in buona misura irresolubili) e sono diventati il punto
cruciale di molte discussioni novecentesche su metodi e fondamenti della
matematica. Le dispute, anche accese, sulla legittimità del parto della sua
mente furono per Cantor causa di sofferenze psichiche e depressioni, che lo
portarono a morte proprio negli anni in cui la Prima guerra mondiale stava
stritolando gli ultimi resti della fiducia illuministica nella ragione.

s p a z io e t e m p o . La prima scala di misurazione umana delle lunghezze


era certamente legata a quella dei campi e degli edifìci. Un bastone con due
tacche o un pezzo di corda erano semplici modi per trasferire una misura
da un punto all’altro.
Arriviamo all’astrazione fondamentale di Euclide: il piano diventa in­
finitamente rigido, e divisibile all’infinito, con il suo (implicito) gruppo di
simmetrie fatto di traslazioni e rotazioni; un luogo dove i punti non hanno
dimensione, le rette si estendono ai due estremi indefinitamente, i cerchi e i
triangoli sono perfetti. Certo una simile idea nasce da un’immagine mentale
molto raffinata dell’antico sistema di misurazione geodetico. La geometria
euclidea dello spazio sembra più vicina al mondo osservabile; è notevole
anche il fatto che nella sua opera si ritrovano sistematicamente astrazioni di
vari oggetti a zero, una e due dimensioni.
II teorema di Pitagora, dal canto suo, è un elegante collegamento tra
l’aritmetica e il sapere pratico dei costruttori egizi: una formula come 32 =
42 = 52diventa un metodo per costruire angoli retti, con l’aiuto di una corda
su cui si stringono dei nodi a distanza regolare.
Eratostene di Alessandria, attorno al 200 a.C., scopre un modo per effet­
tuare la prima vera misura scientifica a larga scala, quella della circonferenza
della Terra. Il suo metodo sfrutta in modo molto sofisticato le potenzialità
della geometria euclidea. Nella città egiziana di Siene, si nota cne a mezzo­
giorno del solstizio d’estate il Sole è perfettamente allo zenith (i suoi raggi
22 Yuri I. Manin

arrivano a illuminare il fondo di un pozzo profondo). Nello stesso istante, ad


Alessandria i raggi solari divergono dalla perpendicolare di un angolo pari a
1/50 di circonferenza. A questo punto si assumono due dati empirici, cioè la
distanza tra le due città (5000 stadi: una misura su larga scala, probabilmente
ottenuta a partire dalla durata del viaggio tra i due punti) e il fatto che esse
stiano sullo stesso meridiano.
Dopo la parte osservativa, viene quella basata su un modello teorico.
L’ipotesi è che la Terra sia una sfera e che il Sole sia situato a una distanza
tanto grande da poter essere considerata infinita, di modo che le rette che
congiungono le due città con l’astro siano parallele. A questo punto, una
semplice deduzione su basi euclidee applicata alla sezione terrestre passante
per Alessandria e Siene mostra che la distanza tra le due città è 1/50 della
misura della circonferenza del pianeta, che è quindi pari a 250 000 stadi
(un’ottima approssimazione, se lo stadio era davvero lungo quanto oggi si
pensa).
In questo ragionamento è implicita l’esistenza di un gruppo di simmetrie
esteso del piano euclideo, che oltre a traslazioni e rotazioni comprende an­
che dilatazioni e contrazioni, cioè cambiamenti di tutte le lunghezze secondo
un identico fattore. L’incarnazione pratica di questo concetto è la mappa del
territorio, strumento fondamentale in un numero incalcolabile di attività
umane, tra cui le esplorazioni geografiche in tutto il globo.
I lettori più attenti si saranno accorti che il fattore tempo è entrato di
soppiatto in questo racconto (la cui fonte è il De motu circolari corporum
caelestium di Cleomede, scritto nella prima metà del I secolo a.C.): come
facciamo a sapere che i raggi solari hanno una determinata angolazione a
Siene e ad Alessandria nello stesso momento? Dopotutto sono due luoghi
distanti tra loro ben 5000 stadi.
La prima «scala umana» di misurazione temporale era legata all’altemar-
si periodico di notte e di, nonché alla posizione di massima del Sole in cielo. I
sestanti, di cui si parla negli scritti di Cleomede ed Eratostene, permettevano
di trasformare una misura temporale in una equivalente spaziale.
La scala successiva ha a che fare con i cicli annuali delle stagioni, e con
la periodicità dei riti religiosi nelle varie società. Per ottenere la precisione
desiderata in questo ambito sono necessarie buone osservazioni, per ac­
corgersi delle irregolarità di alcuni fenomeni, e un certo numero di calcoli,
soprattutto metodi di interpolazione.
II passo successivo è quello del «tempo storico», che non ha richiesto
particolari strumenti matematici. Con il tempo dei fenomeni geologici ed
evolutivi si ritorna alla scienza: per scrivere la storia delle strutture fìsiche
terrestri e della vita è necessaria una comprensione approfondita del concet­
to di tempo fìsico, assai matematicizzato; in questo caso, però, l’evoluzione
è cosi lenta e le testimonianze cosi frammentarie che vengono a mancare
(o non sono più necessarie) misure precise. Oltre a una pletora di dati spe­
Matematica e conoscenza 23

rimentali, a brillanti intuizioni e a un modello deduttivo assai elementare,


serve anche un po’ di matematica: quella necessaria alla radiodatazione, che
si basa sul fatto che le sostanze radioattive decadono nel tempo secondo una
legge esponenziale. Una prima versione di questo metodo si è vista con la
«glottocronologia», cioè con la datazione della nascita delle lingue moderne
con i metodi della linguistica comparata.
Quando ci si accorse dell’immenso arco temporale tipico dei processi
geologici ed evolutivi, fu anche chiaro che si poneva una sfida ai dogmi della
fede (cristiana): la discrepanza tra la presunta età del mondo calcolata dal
momento della creazione biblica e quella dei dati scientifici si fece sempre
più colossale.
Dall’altro lato della scala, la misura di piccoli intervalli di tempo fu resa
possibile dall’invenzione degli orologi. Le meridiane sfruttano la regolari­
tà del moto visibile del Sole e servono a suddividere il giorno in parti più
piccole. Le clessidre ad acqua e a sabbia, grazie al fatto che alcuni processi
fisici controllati sono riproducibili, misurano intervalli di tempo fìssi ancora
minori. La comparsa degli orologi meccanici aggiunge un altro tassello alla
creazione di fenomeni periodici artificiali. I moderni orologi atomici, grazie
a metodi sofisticati di amplificazione, sfruttano processi periodici che occor­
rono in natura a scala microscopica.
Ma il tempo, dopotutto, rimane un mistero, perché non ci consente di
muoverci liberamente al suo interno come facciamo con lo spazio ma ci tra­
scina chissà dove. Sant’Agostino nelle Confessioni (XI, xxvi, 33) ci ricorda
questo perenne e poco scientifico tormento: «Misuro il tempo, lo so: ma non
misuro il futuro, perché non esiste ancora, non misuro il presente perché
non occupa alcuna estensione, non misuro il passato perché non esiste più.
Che cosa misuro allora?»7.

c a s o , p r o b a b il it à , f in a n z a . L’idea di «caso» e «probabilità» insita nel


linguaggio comune ha poco a che vedere con la sua versione matematica*.
In linea di massima, l’idea intuitiva di probabilità ha a che fare con la stima
e la speranza che un evento accada o meno.
La misura della probabilità e la sua trattazione in termini matematici non
si riferiscono alla speranza in sé, che è una questione di tipo psicologico, ma
a una caratteristica numerica, oggettiva della realtà, strettamente correlata
(nelle sue versioni iniziali) al far di conto.
La probabilità di pescare la regina di picche in un mazzo ben mescolato
di 52 carte è esattamente 1/52. Le cose si fanno più interessanti, ma sempre

7 Agostino, Confessioni, Garzanti, Milano 1990. [N.d.T.].


1 Per un’interessante analisi semantica di questi termini in svariate lingue europee antiche e
moderne, si veda Caikovskij [2001].
24 Yuri I. Manin

elementari a livello matematico, se si cerca di calcolare la probabilità di varie


combinazioni di carte (ad esempio una buona mano a poker). Per i calcoli
relativi si fa uso in forma implicita del concetto di gruppo di simmetrie: oltre
a contare il numero di carte nel mazzo e il numero di esiti favorevoli del­
l’estrazione, diamo per scontato che il gioco sia equo e che ogni carta possa
uscire con uguale probabilità.
La teoria probabilistica da un lato è figlia della matematica usata per i
giochi d’azzardo; dall’altro nasce dalla statistica finanziaria, dal mondo delle
banche, del fìsco e del commercio. L’osservazione degli esiti di un evento e
della loro stabilità relativa nel tempo ha portato al concetto di probabilità
empirica e a quello, più o meno esplicito, di un «gioco d’azzardo nascosto»,
di una realtà inaccessibile in cui si trovano le cause che producono i risultati
osservati con frequenze abbastanza regolari da poter stare dentro una teoria
matematica. La definizione moderna di spazio di probabilità è una sistema­
zione assiomatica di questa idea di fondo.
Il denaro nasce come misura del valore delle cose; entra in modo essen­
ziale nel regno della probabilità quando le banche diventano soprattutto
erogatrici di credito. La parola stessa, «credito», ha le sue origini nel campo
semantico delle aspettative e dei giudizi umani. Oggi esiste una «cultura
del credito» dominante che non ha quasi nulla a che fare con l’economia
della produzione. Come dice ottimamente Mary Poovey, quest’ultima «crea
profitti trasformando la forza del lavoro in prodotti, a cui viene assegnato
un prezzo per poi essere immessi nel mercato»; la finanza, invece, trae i suoi
profitti «dal fare intricate scommesse sulla possibilità che i prezzi salgano
o scendano in futuro» [Poovey 2003, p. 27], cioè dal gioco d’azzardo. Un
gioco colossale, che coinvolge cifre incredibili in un’esplosiva mistura di
reale e virtuale.

in f o r m a z io n e e c o m p l e s s it à . È questo u n esem pio p iu tto s to raffinato


di sistema d i m isura contem poraneo.
Cosi come i termini «caso» e «probabilità», l’espressione «quantità di in­
formazione» può essere fuorviarne seusata nel senso comune. Questo concet­
to teorico, divenuto uno dei più importanti nella seconda metà del xx secolo
dopo i lavori di Claude Shannon e Andreij Kolmogorov, indica all'incirca la
lunghezza del testo necessario per veicolare una certa informazione.
Nel parlare quotidiano questa idea sembra irrilevante e poco convincen­
te. L’informazione ci interessa in quanto importante e affidabile, caratteri­
stiche qualitative piuttosto che quantitative; l’importanza, inoltre, è anche
funzione del contesto culturale, scientifico o politico. E comunque sembra
poco serio misurare l’informazione contenuta in Guerra e pace solo in base
alla sua lunghezza.
Ma nel campo del commercio o delle telecomunicazioni non ci curiamo
di quanto un’informazione sia attendibile o importante, vogliamo soprattut­
Matematica e conoscenza 25

to che sia sicura. La dimensione complessiva dei testi trasmessi ogni giorno
attraverso Internet, i mass media e i telefoni è straordinaria, molto al di là di
quella che abbiamo chiamato «scala umana».
L’idea base di Shannon può essere riassunta così. Supponiamo in primo
luogo che l’informazione da trasmettere sia semplicemente «sì» o «no», in
risposta a una certa domanda. Per farlo non dobbiamo neppure scomodarci
a usare il linguaggio naturale: bastano due cifre, 1per «si» e 0 per «no». De­
finiamo questa quantità di informazione 1bit. Se il testo da trasmettere è più
complesso, diciamo di N bit, siamo certi che l’informazione sarà al più pari a
N; ma siamo proprio sicuri che non si possa trasmettere la stessa quantità con
un testo più corto? In effetti esistono metodi standard per la compressione
del testo, che Shannon enunciò in modo esplicito. Il più generale parte dal
presupposto che non tutti i testi sono equiprobabili; basta dunque assegnare
un codice più corto ai messaggi più probabili e risparmiare cosi, almeno in
media, sul volume delle trasmissioni.
Ecco un modo possibile per assegnare un codice numerico a un testo
scritto in linguaggio naturale. Le lettere dell’alfabeto sono circa 30; poiché
25 = 32, sono necessari 5 bit per assegnare un numero binario a tutte, e
quindi la lunghezza di un testo codificato in numeri sarà circa 5 volte la sua
lunghezza in lettere. Ma ci sono lettere statisticamente più usate di altre, a
cui si possono assegnare codici più corti. Tutto questo ci porta a risolvere
un problema di ottimizzazione fattibile e a calcolare la lunghezza media del
testo cosi compresso. Essenzialmente, questa è ciò che Shannon e Kolmo-
gorov definiscono «entropia».
Grazie a questo paradigma statistico di misura, i creatori di Google sono
stati in grado di scovare un modo creativo per assegnare un codice numerico
all 'importanza dell’informazione. In soldoni, ogni volta che facciamo una
ricerca su Google si attiva un programma che produce in output una lista di
pagine contenenti la tal parola o frase. In genere l’elenco è molto lungo ed
è presentato in ordine di importanza, cioè attinenza con i termini di ricerca.
Come fa il programma a calcolare questo ordinamento?
Ogni pagina in rete ha vari collegamenti ipertestuali ad altre pagine.
L’insieme di tutte le pagine è rappresentabile come un grafo orientato i cui
vertici sono le pagine stesse e i cui lati sono i collegamenti (i link). In prima
approssimazione, supponiamo che l’importanza di un vertice sia misurata
dal numero di lati che vi arrivano. Questo criterio può essere raffinato os­
servando che non tutti i link sono uguali: uno che proviene da un sito molto
visitato ha più peso, in proporzione, di altri. Tutto ciò (omettendo qualche
dettaglio meno rilevante) porta a una definizione palesemente circolare: ogni
pagina conferisce uguale importanza alle pagine a cui punta; l’importanza
di una pagina è data dalla quantità totale che riceve dalle altre pagine. Un
classico teorema dovuto a Markov, però, ci assicura che questa definizione
è in realtà ben posta. Non ci resta che calcolare il valore di importanza delle
26 Yuri I. Manin

singole pagine e metterle in ordine decrescente nella lista dei risultati di


Google.
Torniamo alle procedure efficienti di Shannon. Avrete notato che la tra­
smissione ha dei costi: uno per la codifica all’inizio e uno per la decodifica
alla fine. Che succede se utilizziamo processi di compressione più spinti e
sofisticati?
Usiamo una metafora. Un testo codificato alla sorgente è essenzialmente
un programma P che ha come output il testo decodificato Q alla fine. Pren­
diamo ora l’insieme casuale dei programmi che hanno Q come output: è
possibile scegliere il più corto tra questi per risparmiare?
Un notevole risultato di Kolmogorov ci assicura che questo progetto è
ben definito: il programma più corto Pesiste, e la sua lunghezza (detta «com­
plessità di Kolmogorov di Q») essenzialmente non dipende dal linguaggio
usato. In altre parole, si può avere una misura del tutto oggettiva della quan­
tità di informazione contenuta in un dato testo Q.
Ecco però che arrivano le cattive notizie. In primo luogo, non esiste un
metodo sistematico per costruire P partendo da Q (al contrario di quanto
accade per l’entropia di Shannon); secondariamente, il tempo richiesto per
ricavare Q da P può essere molto lungo, anche se P è corto. Un semplice
esempio: se Q è un’enorme fila di 1 lunga N = IO10 , la sua trasmissione è
rapidissima (basta codificare il testo come «scrivi 1 N volte») ma la sua ese­
cuzione in arrivo è infinita, perché chi la riceve si deve mettere a stampare
il numero 1 per N volte.
Ciò significa che la complessità di Kolmogorov, nonostante l’elegante
e raffinata (anche se «elementare») matematica che comporta, non è una
misura pratica della quantità di informazione. È molto utile, però, come
metafora che ci permette di illustrare vari punti di forza e debolezza della
moderna società dell’informazione.
Ci permette, ad esempio, di capire in che misura ci sia stato un cambia­
mento di scala nel modo in cui l’informazione scientifica (ma tutta l’infor­
mazione in genere) viene codificata. Le leggi fondamentali della fisica (da
F = ma di Newton a E = me2di Einstein) sono programmi di compressione
molto spinti che permettono di ottenere dati in molte situazioni concrete. La
loro complessità di Kolmogorov è chiaramente a scala umana, la loro scoper­
ta è dovuta a singoli individui e il loro contenuto informativo è pienamente
accessibile al singolo studente o scienziato.
Ma grandi ricerche contemporanee come il Progetto Genoma produco­
no una massa di dati scientifici che, comunque la si comprima, va ben oltre
le capacità ricettive del singolo. È probabile che in futuro la cosa si ripeterà,
ad esempio con il progetto di mappatura del sistema nervoso centrale, la
cui complessità di Kolmogorov sarà dello stesso ordine della massa di dati
ottenuta.
Matematica e conoscenza 27

Come si vede, dunque, siamo già entrati in ambiti del sapere la cui descri­
zione richiede un contenuto informativo (alla Kolmogorov) assai maggiore
di quello della scienza classica. Senza i computer, non sarebbe possibile
raccogliere, conservare e manipolare tale massa di dati.
Che cosa accadrà quando tutte le nuove conoscenze scientifiche dovran­
no essere registrate e usate solo da reti e calcolatori?

3. Le scienze matematiche e i valori dell'uomo.

3.1. Introduzione.
Nel commentare un frammento del papiro di Rhind, un manuale di ma­
tematica egizio scritto attorno al 1700 a.C., James R. Newman scriveva:
Mi sembra che una valutazione precisa della matematica egizia debba basarsi
su considerazioni sulla natura umana assai più profonde e trasversali di quanto gli
egittologi o gli storici della scienza vogliano ammettere. Riguardo alla questione del
confronto tra le scienze matematiche in Egitto, Mesopotamia e Grecia, la risposta è
relativamente semplice e relativamente ininfluente. È molto più importante capire
perché gli Egizi siano arrivati alla loro particolare matematica, in che modo questa
ci dia informazioni sulla loro cultura, come sia legata alle loro istituzioni sociali e
politiche, credenze religiose, pratiche economiche e tradizioni di vita. Solo in questi
termini possiamo essere giudici imparziali della loro scienza [Newman 1956, voi. I,
p. 178],

Alla fine del secolo scorso queste parole erano diventate il fondamento
di un paradigma molto diffuso, per cui Ubiratan D ’Ambrosio ha coniato
il termine «etnomatematica» [Selin 2000]. Anche questa mia rassegna, e il
progetto editoriale di cui fa parte, sono concise presentazioni dell’etnoma-
tematica occidentale, vista con il senno di poi della fine del xx secolo.
Il modo più interessante con cui la matematica entra nelle relazioni in-
traculturali è probabilmente quello non diretto ma filtrato dalla mediazione
di un sistema di valori. Questi sistemi esercitano la loro influenza in ogni
ambito e ne determinano in pratica le interpretazioni culturali. Viceversa,
un sistema di valori nuovo che viene formandosi in un settore (ad esempio
la scienza) dà vita a un processo di rivalutazione, riforma, a volte stravolgi­
mento o abbandono dei vecchi sistemi.
Ecco perché ho voluto chiudere il saggio con una breve carrellata di
valori calati nell’ambito della creazione matematica.

3.2. Razionalità.
Torniamo a Newman, che scrive nell’introduzione del volume sopra ci­
tato:
28 Yuri I. Manin

Ho inizialo a raccogliere materiale per un’antologia che nelle mie intenzioni


dovrebbe mostrare varie facce della ricchezza, dell’importanza e della bellezza della
matematica. [Il libro] presenta la matematica come uno strumento, un linguaggio e
una carta geografica; come un’opera d’arte e come fine a se stessa; come frutto della
passione per la perfezione. A volte è vista come oggetto di satira o di umorismo, come
fonte di dispute; come uno sprone all’arguzia e un catalizzatore per l’immaginazione;
come un’attività che ha dato agli uomini follia e delizia. Vista sotto una luce più am­
pia, la matematica sembra un corpo di conoscenze costruito dall’uomo, e allo stesso
tempo autonomo e indipendente dal suo creatore.

In questa lista di valori personali ed emotivi c’è una clamorosa omissione: la


razionalità. La cosa può forse spiegarsi con il fatto che, nella tradizione anglo-
sassone, questo prodotto dell’illuminismo è stato associato quasi solo alla scien­
za economica eha dunque portato a un’interpretazione stretta: «razionale» è un
attore economico che persegue in modo coerente il proprio interesse.
Un’altra possibile causa dell’omissione è che la razionalità non è quel che
si dica una caratteristica emozionante: «Cogito ergo sum» è una dimostrazio­
ne di esistenza, che manca però di quella necessità che ogni essere senziente
percepisce senza pensare.
Comunque, l’aspirazione alla razionalità nel senso rinascimentale di «na­
turale desiderio di sapere» [Cesi 2003] è una forza senza la quale la mate­
matica non sarebbe esistita a lungo e non avrebbe ottenuto tanti successi nel
portare la sua fetta di progresso alla società.

3.3. Verità.
Il problema della «verità in matematica» ha visto interpretazioni onni­
comprensive e complesse, sofisticate e contraddittorie9. Qui mi limito ad
affermare che in prospettiva storica la ricerca della verità è stata uno dei
valori di fondo della matematica, indipendentemente dalle sue implicazioni
culturali e filosofiche.
Quando un matematico si mette al tavolo e inizia a lavorare, deve cercare
di dimenticare valori in conflitto come autorità, efficienza, ambizione, fede
e cosi via.

3.4. Azione e contemplazione.


La natura di ciò che fanno rende i matematici più adatti alla contem­
plazione che all’azione. I Romani, uomini d’azione per antonomasia, nella
loro fervente ammirazione della cultura greca non inclusero la matematica.
I valori imperiali di coraggio, onore, gloria, disciplina non lasciavano molto
spazio alla geometria.

’ Per una rassegna abbastanza recente sul tema si veda Dalcs c Oliveri [1998].
Matematica e conoscenza 29

La tradizione contemplativa è continuata per secoli, ma con qualche


interessante eccezione (come è sempre il caso con le tradizioni). Al propo­
sito, concluderò il saggio con un breve ritratto di un grande matematico del
Novecento, John von Neumann.
Jànos von Neumann nacque il 28 dicembre 1903 a Budapest e mori a
Washington 1*8 febbraio 1957. Durante la sua non lunga vita fu uno dei
protagonisti di varie conquiste scientifiche: i fondamenti della teoria degli in­
siemi, la meccanica quantistica e la teoria ergodica, la teoria dei giochi come
paradigma economico, la teoria delle algebre di operatori, l’architettura dei
moderni computer, il principio di implosione che sta alla base della bomba
all’idrogeno, e molto altro [Macrae 1992].
Ecco due esempi del suo modo di pensare e di esprimersi, all’inizio e alla
fine della sua carriera.

Contemplazione: l’universo di von Neumann. La caratterizzazione di


Cantor degli insiemi come collezioni arbitrarie di elementi distinti è spesso
troppo generosa. L’universo di von Neumann è fatto solo di insiemi i cui ele­
menti sono a loro volta insiemi. Il pericolo dell’autoreferenzialità si evita con
questi postulati: in ogni famiglia di insiemi Xt, dove Xt è elemento di
esiste un insieme più piccolo di tutti; esiste un insieme sempre più piccolo
di tutti gli altri, che è l’insieme vuoto 0. Quindi l’universo di von Neumann
nasce da un «vuoto filosofico»: i suoi primi elementi sono 0, {0}, {{0}}, (0,
{0}}, e cosi via. Le parentesi graffe stanno al posto delle parole di Cantor
viste sopra: Zusammenfassung... zu einem Ganzen. L’operazione può essere
iterata all’infinito, ed è l’unica che produce nuovi insiemi a partire da quelli
già costruiti. L’iterazione, naturalmente, può essere transfinita, secondo una
delle grandi intuizioni di Cantor.
Difficile immaginare un oggetto di contemplazione più puro di questa
cristallina e forte gerarchia.

Azione: Hiroshima. Da una lettera scritta da von Neumann a R. E. Dun-


can, dell’archivio Ibm, datata 18 dicembre 1947 [von Neumann 2005, pp.
111- 12]:
Caro signor Duncan,
In risposta alla Sua del 16 dicembre [...] Le posso raccontare ciò che segue.
Durante la guerra, ho iniziato e portato avanti dei lavori sullo shock trasverso. La
conclusione è stata che è meglio far scoppiare le bombe più grandi in quota e non al
suolo, perché cosi si ha quella maggiore pressione d’urto trasversa di cui si parlava.
[...]
Sono stato insignito della Medaglia al Valore (ottobre 1946) e di un premio per
l’eccellente stato di servizio. Ecco la motivazione:
Motivazione per il conferimento della Medaglia al Valore al dottor John von Neu­
mann: per la sua condotta eccezionale nello svolgere straordinari servizi agli Stati
Uniti dal 9 luglio 1942 al 31 agosto 1945.
30 Yuri I. Manin

Il dottor von Neumann, con doti straordinarie di senso del dovere, autorevolezza
tecnica, indefesso spirito di corpo e continuo entusiasmo, è stato uno dei principali
responsabili di ricerche fondamentali condotte dalla Marina degli Stati Uniti sull’uso
efficace degli esplosivi, che hanno portato a un nuovo ordine di servizio per le mis­
sioni di attacco e che si sono dimostrate utili per aumentare la potenza di fuoco nel
caso degli attacchi atomici sul Giappone. Il suo lavoro è stato di valore inestimabile
per lo sforzo bellico degli Stati Uniti.
HARRY TRUMAN

AA. W .
2000 Bourbaki. Urte sociétésecrète de mathématiciens, in «Pour la Science», n. 2.
Af^JING QU
2002 The Third Approach to thè History of Mathematics in China, in a a . v v ., Pro­
ceedings ofthè International Congress ofMathematicians, Beijtng 2002, Higher
Education Press, Beijing, voi. Ili, pp. 947-958.
ATIYAH, M .
2005 Geometry and Physics of thè 20th Century, in k o u n e i h e r et al. [2005], pp. 4-9.
booS-bavnbek, b.e H 0Y R U P , j. (a cura di)
2003 Mathematics and War, Birkhàuser Verlag, Basel.
BOURBAKI, N.
1960 Éléments d'histoire des mathématiques, Hermann, Paris [trad. it. Elementi di
storia della matematica, Feltrinelli, Milano 1963].
C a ik o v s k ij, yu . v.
2001 Che cos’è la probabilità? (Evoluzione del concetto dall'antichità a Poisson) (in
russo), in «Istoriko-matematiceskie issledovanija», II serie, 41, pp. 34-56.
CESI, F.
2003 II naturale desiderio di sapere, Pontificia Accademia delle Scienze, Città del
Vaticano.
CHEM LA, K.
1998 History of Mathematics in China: A Factor in World History and a Source for
New Questions, in a a .v v ., Proceedings of thè International Congress of Math­
ematicians, Berlin 1998, Documenta Mathematica, Bielefeld, voi. Ili, pp. 789-
798.
DALES, H . G. e o u v e r i, G. (a c u r a d i)
1998 Truth in Mathematics, Clarendon Press, Oxford.
DAVIS, P. J . e HERSCH, R.

1980 The Mathematical Experience, Birkhàuser, Boston [trad. it. L’esperienza mate­
matica (da Taleteal computer), Edizioni di Comunità, Milano 1985].
enzen sberger, h .m.
1999 Drawbridge Up. Mathematics - A Cultural Anathema, edizione bilingue tede­
sco/inglese, A. K. Peters, Natick Mass. [trad. it. Ponte levatoio fuori servizio
Matematica e conoscenza 31

ovvero La matematica nell'aldilà della cultura, in G li elisir della scienza, Einau­


di, Torino 2004, pp. 7-18].
KEIUS-BOROK, V ., GASCON, D ., SOLOV1EV, A. et al.
2003 On thè Predictability of Crime Waves in Megacities. Extended Summary, in
a a . v v ., The Cultural Values of Science. Proceedings of thè Plenary Session of

thè Pontificai Academy ofSciences, Nov. 8-112002, Pontifìcia Accademia delle


Scienze, Città del Vaticano, pp. 221-29.
k obzarev , i . y u . e m a n i n , y u . i.

1989 Elementary Particles. Mathematics, Physics and Philosophy, Kluwer, Dor­


drecht.
k o u n e i h e r , j ., f l a m e n t , d ., nabonnand, p h .e s z c z e c in ia r z , j .-j . (a c u r a d i )

2005 Géométrie au xxe siècle. Histoire et horizons, Hermann, Paris.


u CALZI, M . e BASILE, A.
2000 Economisti e matematica dal 1494 fino al 1969. Oltre l'arte delfar di conto, in
m . e m m e r (a cura d i) , Matematica e cultura 2000, Springer, Milano, pp. 95-

107.
M ACRA E, N.

1992 John von Neumann, Random House, New York (rist. American Mathematical
Society, Providence 1999).
MANDELBROT, B. B. e HUDSON, R. L.

2004 The (Mis)behavior of Markets, Basic Books, New York [trad. it. Il disordine
dei mercati. Una visionefrattale di rischio, rovina e redditività, Einaudi, Torino
2005].
M A N IN , Y U . I.
1990 Mathematics as Metaphor, in a a . v v ., Proceedings of thè International Congress
of Mathematicians, Kyoto 1990, American Mathematical Society -Springer-
Verlag, Boston, voi. II, pp. 1665-71.
1998 Truth, Rigor and Common Sense, in d a l e s e o u v e r i [1998], pp. 147-59.
2004 Georg Cantor and His Heritage, in Algebraic Geometry: Methods, Relations,
and Applications. Collected Papers Dedicated to thè Memory of Andrei Niko-
laevich Tyurin, MAIK Nauka/Interperiodica, Moskva, pp. 195-203. Preprint
math. AG/0209244.
M U M F O R D , D.

2000 The Dawning of thè Age ofStochasticity, in v. a r n o l ’D, m . a t i y a h , p . l a x e b .


m a z u r (a cura di), Mathematics: Frontiers and Perspectives, American Mathe­

matical Society, Providence, pp. 197-218.


2002 Pattern Theory: thè Mathemathics ofPerception, in a a . v v ., Proceedings of thè
International Congress of Mathematicians, Beijing 2002, Higher Education
Press, Beijing, voi. I, pp. 401-22.
NEUMANN, J. VON
2005 Selected Letters, a cura di M. Rédei, American Mathematical Society, Provi­
dence.
32 Yuri I. Manin

new m an, j . R. (a c u r a d i)
1956 The World of Mathematics, 4 voli., Simon and Schuster, New York.
N0RRETRANDERS, T.
1998 The User lllusion: Cutting Consciousness Down to Size, Penguin, New York.
POOVEY, M .
1998 A History ofthè Modem Fact. Problems ofKnowledge in thè Sciences of Wealth
and Society, The University of Chicago Press, Chicago.
2003 Can numbers ensure honesty? Unrealistic expectations and thè US accounting
scandal, in «Notices of thè American Mathematical Society», 50(1), pp. 27-
35.
SELIN, h . (a c u r a d i)
2000 Mathematics Across Cultures. The History of Non-Western Mathematics, Klu­
wer, Dordrecht.
SIEGMUND-SCHULTZE, R.
2003 Military Work in Mathematics 1914-1945: An Attempt at an International Per-
spective, in b o o B-b a v n b e k e h o y r u p [2003], pp. 23-82.
SOLOW , R. M .
2005 How did economics get that way and what way did it get?, in «Daedalus», 126,
pp. 87-100.
SO NTAG, S.

1990 lllness as Metaphor. AIDS and Its Metaphors, Farrar, Strauss and Giroux,
New York [trad. it. Malattia come metafora (Aids e Cancro), Einaudi, Torino
1992].
TURNBULL, H. W .

1956 The Great Mathematicians, in n e w m a n [1956], voi. I, pp. 75-168.


MARTIN DAVIS

I fondamenti dell1aritmetica

Che cosa c’è di più familiare della successione di numeri naturali


0 ,1,2,3,...
e di più certo dei «fatti» che apprendiamo a scuola a questo proposito:
5 + 7 = 12; 3 X 5 = 15; 8-3=5.
Perché mai per nozioni tanto chiare, inequivocabili, si richiede un «fon­
damento»? La situazione si complica quando si prendono in considerazione
le verità concernenti tutti i numeri naturali. In quest’ottica, se esaminiamo
i calcoli
1 +3 +5 = 9
1 + 3 + 5 + 7 =16
1+3+5+7+9=25
potremmo ipotizzare che, per ogni numero naturale n>
1 + 3 + 5 + ••• + (2h + 1) = (h + l)2.
Questo è piuttosto facile da dimostrare1, ma non lo è altrettanto provare
numerose proprietà più complesse dei numeri naturali, alcune delle quali
riguardano anche i quadrati perfetti
1,4,9,16,...
Per esempio, ci potremmo interrogare sui risultati della somma di quadrati:
13 = 9 + 4 = 32+ 22
71 = 49 + 9 + 9 + 4 = 72 + 32 + 32 + 22

1 Se scrìviamo la somma due volte come segue:


1 + 3 + ••■ + 2 » + l
2n + 1 + 2n - 3 + ■■• + 1
notiamo che la somma dei due termini in ogni colonna è pari a 2n + 2 = 2(»+1 ). Dato che ci sono
n + 1colonne, la somma doppia è pari a 2(»+ 1 )’. Questa dimostrazione si avvale di alcuneproprieù
generali, meno specifiche, dei numeri naturali, nel senso che le somme non variano modificando la
disposizione dei numeri sommati.
34 Martin Davis

101 = 100 + 1 = IO2 + l 2


1001 = 900 + 101 = 900 + 100 + 1 = 302 + IO2 + l 2
63 = 49 + 9 + 4 + 1 = 72 + 32 + 22 + l 2.
Da questi calcoli emerge che sono necessari non più di quattro quadrati
per ottenere un numero naturale, il che è indubbiamente vero. Secondo un
noto teorema, dimostrato per la prima volta dal matematico franceseJoseph-
Louis de Lagrange, ogni numero naturale può essere espresso come somma di
non più di quattro quadrati.
Dal punto di vista matematico i due esempi citati non presentano al­
cun aspetto problematico. Il primo, che correla numeri dispari e quadrati
perfetti, è attinente alla «somma di una progressione aritmetica» e rientra
nell’ambito della matematica insegnata nelle scuole; il secondo, il «teore­
ma dei quattro quadrati» di Lagrange, è descritto e dimostrato nei manuali
universitari dedicati alla teoria dei numeri. Eppure, quando si considerano
questioni simili, è facile essere attanagliati da una ridda di dubbi filosofici.
Come recepire l’espressione «tutti i numeri naturali»? In qualità di esseri
finiti, come possiamo sperare di comprendere questa totalità infinita? Dato
che esistono numeri naturali più grandi del numero di elettroni presenti nel­
l’universo osservabile, quale significato empirico possono avere? E ad ogni
modo, che cosa sono i numeri? Di certo il numero 25 non è semplicemente
una coppia di simboli proprio come «pioggia» non è soltanto una sequenza
di sette lettere. Cosi come «pioggia» è un simbolo che indica l’acqua prove­
niente dal cielo sotto forma di unità discrete, le gocce, anche «25» simbo­
leggia qualcosa, che può essere rappresentato altrettanto correttamente dal
numero romano XXV o dalla sequenza binaria 11001.
Negli ultimi anni del xix secolo filosofi e matematici mostrarono un ef­
fettivo interesse per la vera natura dei numeri. A quel tempo in Germania la
filosofìa idealista viveva il suo periodo di massimo splendore. Hegel aveva
proposto il suo sistema di categorie, in cui nozioni quali «essere» e «dive­
nire» si intrecciavano in modo complesso, negandosi e confluendo l’una
nell’altra. In reazione ad essa si sviluppò una filosofia empirica che inten­
deva rifarsi a criteri scientifici. Uno dei suoi esponenti, il grande scienziato
Hermann von Helmholtz, cercò di spiegare i numeri in termini empirici in
un trattato breve, Zahlen und Messeti-.
Il contare è un procedimento, che dipende dalla nostra capacità di conservare
nella memoria la successione, in cui si sono susseguiti nel tempo gli atti coscienziali.
Noi possiamo considerare i numeri [...] come una serie di segni scelti arbitraria­
mente, per i quali solo un determinato modo di succedersi è ritenuto da noi come
legittimo o, secondo il modo comune di esprimersi, «naturale»2.

1 H. von Helmholtz, ZàhUn undMesseri, erkenntnisstheoretisch betrachtet, 1887 [trad. it. Conta­
reemisurareconsideralidalpunto di vistadella teoria del conoscere, in Opere, a cu ra di V. Cappelletti,
Utct, Torino 1967, pp. 707-45; la citazione è a p. 712].
I fondamenti dell’aritmetica 35

Georg Cantor era di tutt’altro parere. Nella sua audace matematica del­
l’infinito i numeri naturali costituivano solo una piccola parte di un regno
vastissimo - quello dei numeri transfiniti, come li battezzò Cantor stesso
- che includeva «infinità» immensamente più grandi di quella dei naturali. In
un articolo del 1887 sui numeri transfiniti e sulle loro implicazioni filosofiche
e teologiche’, Cantor critica il trattato di Helmholtz in quanto esprime un
«punto di vista empirico-psicologico estremo con un dogmatismo che non
si sarebbe creduto possibile». Prosegue poi rilevando quanto segue:
Pertanto, nella Germania di oggi abbiamo, in reazione all’idealismo esagerato
di Kant-Fichte-Hegel-Schelling, uno scetticismo accademico-positivista che domina
fortemente la scena. Tale scetticismo si è inevitabilmente esteso all’aritmetica, nel
cui ambito è giunto alle conclusioni più infauste, il che potrebbe rivelarsi, in ultima
analisi, molto dannoso per lo scetticismo positivista stesso.

L’articolo fu ripubblicato come parte di una raccolta del 1890, Gesammelte


Abhandlungen zur Lehre vom Transfiniten\ che fu recensita da Gottlob
Frege, uno dei fondatori della logica matematica moderna. Frege diede par­
ticolare risalto all’osservazione che abbiamo citato, affermando:
Proprio cosi! Questo è lo scoglio dove [questa dottrina] si fermerà: dal momento
che l’infinito, in definitiva, non può venir negato nell’aritmetica, e che d’altra parte
esso è inconciliabile con l’indirizzo teoretico-conoscitivo in questione. È qui, mi
sembra, il campo di battaglia dove avverrà una grande decisione’.

Frege non poteva certo immaginare che, appena una decina di anni dopo
questa dichiarazione, la sua opera sui fondamenti dell’aritmetica sarebbe
rimasta vittima proprio dell’infuriare della battaglia da lui stesso preannun­
ciata.

1. La definizionefregeana di numero.

Dai tempi degli antichi Greci il ragionamento matematico viene conside­


rato una forma di ragionamento logico; anzi, proprio per il tipo di deduzioni
utilizzate, alla verità matematica si attribuisce spesso un grado di certezza
estraneo ad altri ambiti. Parallelamente agli sviluppi della matematica, non

*G. Cantor, Mitteilungen zur Lehre vom Transfiniten, in «Zeitschrift fur Philosophic und phi-
losophischc Kritik», 91 (1887), pp. 81-125.
* Gesammelte Abhaldungen mathematiscben und pbilopbischen Inbalts, a cura di E. Zermelo,
Springer, Berlin 1932 (ristampa G. Olms, Hildcsheim 1966). pp. 378-439; la citazione precedente
è a p. 382.
’ G. Frege, Rezension von: Georg Cantor. Zum Lehre vom Transfiniten, in «Zcitschrift fur Phi-
losophie und philosophische Krìtilc», 100 (1892), pp. 269-72 [trad. it. Recensione alla «Teoria del
transfinito» dì Georg Cantor, in Logica earitmetica, a cura di C. Mangione, Boringhieri, Torino 1965,
pp. 414-17; la citazione è a p. 417].
36 Martin Davis

mancarono le ricerche sulla natura della logica stessa: Aristotele fu il primo


a interessarsene, seguito dagli stoici e molto tempo dopo, nel xn secolo,
dagli scolastici. Per quanto sembri incredibile, tali sviluppi ebbero tuttavia
ben poco a che fare con la pratica matematica. Inoltre, nonostante i notevoli
progressi conseguiti, le forme di ragionamento elaborate erano molto meno
precise di quelle usate in matematica.
Malgrado la logica stia alla base del ragionamento matematico, la pratica
matematica e la logica formale arrivarono finalmente a incontrarsi, in quanto
la prima fu utilizzata come strumento per analizzare la seconda. I primi,
frammentari tentativi in tal senso furono compiuti da Leibniz, ma U vero
progresso avvenne nel 1847 grazie al matematico inglese George Boole, il
quale mostrò come l’algebra comune potesse essere sfruttata per verificare
le inferenze logiche. A questo scopo, tuttavia, era necessario - scopri Boole
- aggiungere nuove regole, ovvero:
a a = a\ a X a = a.
Queste hanno senso se si immagina che le lettere rappresentino frasi o pro­
posizioni e i simboli X e + rappresentino, rispettivamente, «e» e «o».
Sebbene i metodi di Boole fossero assai più efficaci di quelli preceden­
ti, non si estendevano a tutti i metodi di ragionamento logico usati nelle
dimostrazioni matematiche. Il merito di avere infine raggiunto questo im­
portante obiettivo spetta al matematico tedesco Gottlob Frege nella sua
Begriffsscbrift\Attraverso un esame attento e dettagliato delle frasi, Frege
riuscì a metterne a nudo la vera struttura logica in un modo che l’analisi
grammaticale tradizionale non avrebbe mai potuto fare. Prima di tutto in­
trodusse una notazione uniforme (mutuata dalla matematica) per indicare
che un elemento possiede una determinata proprietà. Ad esempio, invece
di scrivere
Giovanni è bravo
Frege ricorreva alla formula
bravo(Giovanni).
Analogamente, nel caso di relazione tra due elementi, invece di
Giovanni ama Maria
Frege scriveva
ama(Giovanni, Maria).

* Id., begriffssckrift Eine der anthmetischen nacbgebildete Fortnelsprache des reinen Denkens,
1879 [ir*d. it. Ideografia. Un linguaggio in formule delpensiero puro a imitazione di quello aritmetico,
in Logica e aritmetica cit., pp. 99-206]
I fondamenti deU’aritmetica 37

Il pregio di questa notazione sta nel fatto che la matematica suggerisce


la possibilità di usare variabili al posto di nomi individuali per esprimere
generalità.
Pertanto la frase
Tutti i cavalli sono mammiferi
potrebbe essere espressa nella forma
se cavallo(x) allora mammifero(x)
e la frase
Alcuni cavalli sono purosangue
nella forma
cavallo(x) e purosangue(x).
La variabile x viene tuttavia usata in modo diverso nei due esempi: nel primo
caso è questione di generalità (universalità), nel secondo semplicemente di
esistenza di uno o più individui. Nella logica di Frege si usano appositi sim­
boli sia per indicare tale distinzione sia per sostituire le parole in corsivo:
V per tutti
3 esiste
D se ... allora
A e
Le due frasi diventano quindi
Vx[cavallo(x) D mammifero(x)]
3x[cavallo(x) A purosangue(x)].
Altri simboli utili nella logica di Frege sono7:
non
V o
= uguaglianza
Le due frasi che abbiamo usato come esempi non rendono di per sé giustizia
all’efficacia del linguaggio fregeano; in effetti, il sistema logico elaborato
da Aristotele come del resto la versione algebrica messa a punto da Boole

7Questi sono i simboli utilizzati oggi, non quelli usati da Frege, e derivano dal sistema di nota­
zione elaborato da Giuseppe Peano e Bertrand Russell tra la (ine del xix e l’inizio del xx secolo. G ò
che ha importanza è ovviamente l'identifìcazione da parte di Frege dei concetti logici chiave, non
i simboli specifici adottati per rappresentarli. A questo proposito può essere opportuno ricordare
che Frege riusciva a sbrigarsela con i soli tre simboli V, D, - , dato che gli altri possono esseredefiniti
in termini di questi.
38 Martin Davis

sono perfettamente adeguati per analizzare tali frasi e le inferenze logiche


che le riguardano. Dagli esempi seguenti si può in parte arguire il grado di
sottigliezza raggiunto dall’analisi di Frege:
Tutti amano qualcuno (VxKEty) ama(x, y)
Qualcuno ama tutti (3x) ('Vy) ama(x, y)
Tutti sono amati da qualcuno (Vy) (3x) ama(x, y)
Qualcuno è amato da tutti (3y)(Vx) ama(x, y)
È interessante notare che in matematica esistono distinzioni sottili che hanno
fuorviato persino i grandi matematici, basate proprio sulla distinzione tra
Vx3y e 3yVx.
Ecco un altro divertente esempio al riguardo: il detto
Tutti amano un innamorato.
Se definiamo la parola «innamorato» come una persona che ama qualcuno,
allora «y è un innamorato» può essere espresso come 3z ama(y, z). Il detto
può pertanto essere scritto come segue:
Vy[3z amaCy, z) D Vx ama(x, >)].
Il linguaggio di Frege non può essere utilizzato nel ragionamento logico
a meno che non si precisino apposite regole di inferenza che permettano
di passare da determinate premesse a una conclusione desiderata. Ne è un
esempio la regola:
[A DB]
A
B
Qui le lettere A e B rappresentano espressioni arbitrarie nel linguaggio di
Frege, che possono essere anche alquanto complesse. Le regole possono
essere fomite in molti modi diversi, ma sono tutte equivalenti.
Frege era riuscito a esprimere l’intera portata delle inferenze logiche
usate in matematica in termini di regole simboliche puramente formali. Era
già un risultato importante, ma cercò di fare di più: riteneva infatti che tutti
i concetti matematici fossero in realtà nozioni logiche mascherate sotto un
diverso aspetto, ed era convinto di poter dimostrare che il «numero» fosse
spiegabile in termini meramente logici. Alcune delle inferenze logiche che
abbiamo citato riguardano «proprietà», o potremmo dire «concetti»: per
esempio, essere un cavallo. Il fatto fondamentale di queste proprietà è che
le frasi che affermano che un oggetto possiede la proprietà in questione
presentano determinati valori di verità: sono, in ciascun caso, vere o false.
Secondo Frege associata a ogni proprietà c’è la classe, o l’insieme, di oggetti
che la possiedono, la cosiddetta «estensione» della proprietà, ed è perfet­
I fondamenti deH’aritmetica 39

tamente possibile che proprietà diverse abbiano le stesse estensioni. Per


esempio, la proprietà di appartenere alla specie Homo sapiens e di essere
un bipede implume hanno la stessa estensione, ossia l’insieme degli esseri
umani. Per quanto concerne la nozione di numero, il punto essenziale è che
il numero di oggetti che possiedono una determinata proprietà dipende solo
dall’estensione di tale proprietà. Per una data proprietà F, indichiamo con
P la sua estensione. Frege si ripropose di fornire una definizione del numero
di oggetti contenuti nell’estensione di una proprietà. Fatto molto importante,
egli osservò che la proprietà di due insiemi che hanno lo stesso numero di
elementi - che sono, cioè, equinumerosi igleichzahlig) - può essere spiegata
in termini puramente logici senza prima definire il numero. Per il momento
non illustreremo come; ricorderemo solo che per qualsiasi proprietà F si può
considerare il concetto
essere equinumerosa a P.
Frege mirava in sostanza a definire il numero di oggetti che possiedono
la proprietà F come l’estensione di tale concetto. In altre parole, il numero
di r è l’estensione del concetto
essere equinumeroso a P.
Per meglio spiegare l’idea di Frege, consideriamo le seguenti proprietà:
- essere una delle regioni italiane;
- essere una delle possibili mosse iniziali dei pezzi bianchi in una partita
a scacchi.

Usiamo la lettera R per indicare la prima proprietà e la C per la seconda. Nel


linguaggio di Frege possiamo dunque scrivere le affermazioni vere:
R(Calabria), R(Umbria), C(Nf3), C(Pe4)8.
Calabria e Umbria sono pertanto in k e Nf3 e Pe4 in C. Secondo l’idea di
Frege due estensioni sono equinumerose solo nel caso in cui sia possibile ab­
binare gli oggetti dell’una con quelli dell’altra in modo tale che ciascuno sia
appaiato con un solo oggetto. La tabella 1illustra questo tipo di abbinamen­
to tra le estensioni di Ke C. Possiamo immaginare che un tale abbinamento
sia determinato da una relazione che può essere espressa nella forma S{x, y).
Quindi, per esempio, si dà che ^(Campania, Pb4) ma non che 5“(Abruzzo,
Nc3). Ora, pensando in termini di estensioni di una coppia arbitraria di

( Le colonne di una scacchiera sono tradizionalmente denominate da sinistra a destra con le


lettere dell’alfabeto comprese m a eh, le traverse con i numeri da I a 8. Le mosse iniziali indicate
nell’esempio riguardano dunque, rispettivamente, un cavallo (N) e un pedone (P). Esistono sedici
possibili mosse iniziali di pedone (dato che ognuno degli otto pedoni può avanzare di una o due
case) e quattro di cavallo.
40 Martin Davis

proprietà, F, G, il fatto che una relazione 5(x, y) fornisca un abbinamento tra


le loro estensioni può essere espresso, nel linguaggio di Frege, dai seguenti
quattro enunciati:
MI Vx[F(x) D 3y[S(x, y) A G(y)]]
M2 Vy[G(y) D 3x[S(x, y) A FU)]]
M3 VxVyVz[[S(x, y) A S(x, z)]Dy = z]
M4 VxVyVzttfU, y) A S(z, y)]Ox = z]
L’enunciato MI afferma che S associa a ogni membro di P un corrisponden­
te membro di ó . Analogamente, M2 afferma che S associa un membro di
P a ogni membro di ó . M3 e M4 assicurano che in ciascuno dei due casi il
membro associato sia unico. Pertanto, Ó è equinumeroso a F solo nel caso
in cui esista una relazione S per cui tutti questi quattro enunciati siano veri.
Nel linguaggio di Frege ciò si esprime nella forma
3S[MI A M2 A M3 A M4]9.

9A rieor di termini questa espressione non appartiene propriamente al linguaggio fregeano


perché i simboli M1-M4 non ne fcinno parte. Essi vengono usati quali abbreviazioni per evitare
di scrivere una formula lunga e complicata. Talvolta si dice che simboli del genere appartengo­
no al metalinguaggio del linguaggio di Frege e che quest ultimo e il corrispondente linguaggio
oggetto.

Tabella 1.
Abbinamento delle due estensioni.
Abruzzo — Pa3
Basilicata *» Pa4
Calabria ** Pb3
Campania ** Pb4
Emilia-Romagna ** Pc3
Friuli-Venezia Giulia ** Pc4
Lazio *» Pd3
Liguria *» Pd4
Lombardia *♦ Pe3
Marche *» Pe4
Molise *» Pf3
Piemonte ** Pf4
Puglia ** Pg3
Sardegna *» Pg4
Sicilia *» Ph3
Toscana *♦ Ph4
Trentino-Alto Adige ** Na3
Umbria *♦ Nc3
Valle d’Aosta <•* Nf3
Veneto *-* Nh3
I fondamenti dclTaritmctica 41

Per una data F, questa è una condizione su G: sarà vera per alcune pro­
prietà G, per la precisione quelle la cui estensione è equinumerosa a P, e falsa
per altre. Frege ci invita dunque a formare l’estensione di tale condizione e
definisce il numero di P come quest’estensione stessa.
A proposito di questa definizione, Frege stesso osservò: «Per mettere
alla prova il valore delle definizioni, bisogna studiarne la fecondità. Quelle
che potrebbero venir tranquillamente soppresse, senza che derivi da ciò
alcuna lacuna nelle dimostrazioni, vanno respinte come completamente
prive di valore»10. Si mise dunque all’opera per provare tutta la fecondità
della propria definizione, costruendo dimostrazioni puramente logiche dei
fatti fondamentali riguardanti i numeri naturali. Dagli studi dettagliati che
condusse allo scopo ebbe origine un’opera monumentale in due volumi che
rappresenta il suo capolavoro, i Grundgesetze der Arithmetik. Nel giugno
1902 il primo volume era già stato pubblicato e il secondo era in stampa
quando accadde il disastro. Frege ricevette una lettera da Bertrand Russell,
in cui il filosofo esordiva con parole di elogio: «Concordo completamente
con Lei su tutti gli aspetti più importanti [...]. Su molti singoli argomenti
trovo nelle Sue opere discussioni, distinzioni e definizioni che inutilmente
si cercano in altri logici»11. Poi sferrava il colpo fatale: «Solo in un punto ho
incontrato una difficoltà».
Tale «difficoltà» riguardava il presupposto fondamentale di Frege che
ogni proprietà avesse un’estensione. Russell aveva scoperto una proprietà
che ne era priva: la proprietà di un insieme di non appartenere a se stesso. Se
supponiamo che esista un’estensione simile, che chiameremo R, ci possiamo
chiedere se R possieda la proprietà in questione, ossia se R non appartenga
a se stessa. Se cosi fosse, tuttavia, ne conseguirebbe che R appartiene a R.
Se d’altronde R appartiene a R, possiede la proprietà in questione e quindi
non appartiene a se stessa. Non c’è modo di evitare la contraddizione. Può
sembrare un problema insignificante, quasi un simpatico rompicapo, ma
visto che poteva essere formulato nel linguaggio di Frege e che la contrad­
dizione emergeva usando le sue regole di dimostrazione, bastò a far crollare
lo splendido castello costruito dal matematico. Le varie parti della costru­
zione erano infatti cosi strettamente interconnesse che la presenza di una
contraddizione in una sola di essa era sufficiente a determinare la rovina
dell’intera struttura. La reazione di Frege a un disastro causato da un artificio
cosi esoterico è paragonabile alla risposta data da Mercuzio a Romeo, che
lo rassicura sulle condizioni della sua ferita: «Oh, no! non è profonda come

14 Frege [1884], trad. it. p. 308.


11 G. Frege, Alle origini della nuova logica. Epistolario scientifico con Hilbert, Husserl, Peano,
Russell, Vailati c altri, a cura di G. Gabriel et al., cd. italiana a cura di C. Mangione. Boringhicri,
Torino 1983. pp. 183-84.
42 Manin Davis

un pozzo, nc larga come la porta di una chiesa; ma può bastare, c non ci sarà
bisogno d’altro»1*.
Non fu di grande consolazione che Russell terminasse la lettera con pa­
role di sincera ammirazione: «La trattazione esatta della logica sui problemi
dei fondamenti [...] è rimasta molto indietro; in Lei trovo il meglio di quanto
conosco del nostro tempo e per questa ragione mi permetto di esprimerLc
il mio profondo rispetto». Il povero Frege fu costretto ad aggiungere una
postilla al secondo volume dei Grundgesetze, in cui esordiva dichiarando:
«A uno scrittore di scienza ben poco può giungere più sgradito del fatto che,
dopo aver completato un lavoro, venga scosso uno dei fondamenti della sua
costruzione. Sono stato messo in questa situazione da una lettera del signor
Bertrand Russell»13.
La lettera di Russell fece crollare il progetto di Frege per stabilire i fon­
damenti dell’aritmetica. Sebbene la sua logica sia sopravvissuta, se non altro
perché rappresentava —come Russell aveva osservato —un grande progresso
rispetto al passato, la grandezza del lavoro di Frege è stata riconosciuta ap­
pieno soltanto molti anni dopo la sua morte, avvenuta nel 1923.

2. Gli assiomi di Dedekind-Peano per 1‘aritmetica.

In questo saggio ci occupiamo dei fondamenti dei numeri naturali


0,1,2,3,...
Nell’antica Grecia il concetto di «numero» si riteneva implicasse moltepli­
cità, tanto che 0 e 1 non ne facevano parte. Naturalmente in epoca moderna
il termine si è esteso fino a comprendere, per esempio:

-5. 5,73, V7, ir = 3,1459...

L’argomento esula dagli scopi del presente saggio, ma vale pur sempre la
pena di ricordare che alla fine del xix secolo si riusci a mostrare come defi­
nire numeri nell’accezione più ampia in termini dei soli numeri naturali"
Pertanto, un fondamento adeguato per l’aritmetica dei numeri naturali si tra­
durrebbe automaticamente in un fondamento per l’intera varietà di numeri
usati nella matematica e nella scienza contemporanee. Richard Dedekind
fu una delle figure determinanti in questo grande processo di riduzione che

u W. Shakespeare, Romeo e Giulietta, III, i, in Tutte le opere, a cura di M. Praz, Sansoni, Firenze
1964, p. 309.
11Trad. it. in Logica earitmetica cit., p. 574.
MVa sottolineato che alcuni matematici e filosofi pongono in dubbio il libero uso degli insiemi
infiniti che entrano in gioco in questo processo di riduzione e si dichiarano pertanto insoddisfatti.
I fondamenti ddl’arìtmetica 43

avrebbe ricondotto tutto ai numeri naturali. A differenza di Frege, egli non


si preoccupò di definire i numeri naturali: propose invece alcuni assiomi
che credeva fossero sufficienti, nel loro insieme, a caratterizzarli. Giuseppe
Peano incluse questi assiomi nel suo sistema di costruzione dei fondamenti
deiraritmetica. Gli assiomi si basano su tre nozioni, zero, successore e nume­
ro, e possono essere espressi come segue:
1. 0 è un numero.
2. Ogni numero ha un successore.
3. I numeri con lo stesso successore sono uguali.
4. 0 non è il successore di alcun numero.
5. Ogni insieme contenente 0 e anche il successore di ognuno dei suoi
elementi deve contenere tutti i numeri.
Il primo assioma dà un punto di partenza, il numero 0, e il quarto assicura
che nessun numero lo preceda15. Il secondo e il terzo assicurano una pro­
gressione infinita in cui ogni «numero» ha un successore unico. Pertanto,
se indichiamo con S il «successore», i primi quattro assiomi considerati nel
loro insieme specificano la progressione di numeri
OSO SSO SSSO...
che siamo indotti a concepire come
0123 ...
I primi quattro assiomi non precludono tuttavia che possano essere presenti
altri oggetti non appartenenti a questa successione. Qui entra in gioco il
quinto assioma, il quale implica che l’insieme composto da 0 e da tutti gli
oggetti ottenuti applicando l’operazione successore un numero finito (ma
arbitrariamente grande) di volte debba contenere tutti i numeri.
Dal punto di vista concettuale, tali assiomi appaiono insoddisfacenti co­
me fondamento dell’aritmetica: un lettore attento avrà notato che la spiega­
zione poc’anzi fornita ricorre all’espressione «numero finito di volte», perciò
l’idea di numero viene in certo qual modo recepita informalmente come pre­
liminare agli assiomi stessi, che dovrebbero spiegare il concetto di numero.
Inoltre, il quinto assioma contiene le parole «ogni insieme»; gli insiemi di
numeri sono comunemente specificati da un criterio soddisfatto da tutti gli
elementi che li compongono, come l’insieme di numeri primi o di quadrati
perfetti (nella terminologia di Frege, sono dunque l’«estensione» del criterio
di definizione). Tali criteri vengono precisati usando il linguaggio, naturale
o artificiale; gli studi di Cantor hanno però dimostrato che per qualsiasi

11 In realtà, Dedckind e Peano partono dall'l anziché dallo 0, giacché non considerano 0 un
numero naturale.
44 Martin Davis

linguaggio gli insiemi specificabili da criteri scritti in quel linguaggio sono


una parte infinitesimale della totalità di insiemi di numeri naturali. Secondo
alcuni, ciò renderebbe sospetto il concetto stesso di insieme arbitrario di
numeri naturali. A questo proposito vale la pena di ricordare il già citato
commento di Frege sulla filosofia positivista: «l’infinito, in definitiva, non
può venir negato nell’aritmetica, e [...] d’altra parte esso è inconciliabile con
l’indirizzo teoretico-conoscitivo in questione». Malgrado ciò, gli assiomi de­
scritti conservano la loro importanza. Torneremo a parlarne, considerandoli
in una forma adeguatamente modificata.
Come base da cui procedere per dedurre tutte le proprietà dei numeri
naturali, gli assiomi di Peano sono molto efficaci. Nel suo breve trattato,
divenuto ormai un classico, Grundlagen derAnalysis, Edmund Landau tratta
l’argomento in modo abbastanza dettagliato. Il quinto assioma, in partico­
lare, esprime un importante metodo di dimostrazione, Xinduzione materna-
tica.
Quale esempio, daremo un’altra dimostrazione dell’identità
1+3 +5 + ■
■• + (2« + 1) = (» + l)2
considerata all’inizio del saggio. Sia A l’insieme di numeri n per i quali tale
uguaglianza è vera. Il numero 0 appartiene ad A perché per n = 0 l’enunciato
è semplicemente 1 = 1. Dobbiamo pertanto dimostrare che, se un numero
k appartiene ad A, lo stesso vale per il suo successore k + 1. Procediamo
come segue:
1 + 3 + 5 + ••• + {2k + 1) + (2(k + 1) +1) = (k + l)2 + 2k + 3
= k2 + 4k + 4
= (k + 2)2
= ((*+ 1)+1)2.

3. Il secondo problema di Hilbert.

Nel 1900 il trentottenne David Hilbert, all’apice della sua produttività


scientifica, era il matematico di maggior spicco della sua generazione non so­
lo in Germania, ma forse addirittura nel mondo intero. Invitato a intervenire
al Congresso intemazionale dei matematici che si svolgeva a Parigi nell’estate
di quell’anno, Hilbert, invece di esporre i propri importanti risultati, decise
di lanciare una sfida per il nuovo secolo proponendo ai convenuti un elen­
co di ventitré problemi. Questi problemi, in effetti, avrebbero stimolato la
ricerca dei decenni avvenire, dimostrando cosi tutta la loro fecondità. Nel
secondo problema della lista Hilbert presentò una tesi originale a proposito
del senso in cui si può dire che gli enti studiati dai matematici «esistono».
Ovviamente, il numero 7 non esiste nello stesso senso in cui esiste un oggetto
I fondamenti ddl’aritmetica 45
fisico: Hilbert propose che gli enti matematici fossero caratterizzati da un
insieme di assiomi dai quali le loro proprietà potessero essere dedotte. Il
criterio che a suo parere garantiva Inesistenza» degli enti in esame consi­
steva nel fatto che gli assiomi fossero tra loro coerenti, cioè che da essi non
derivasse logicamente alcuna contraddizione.
Della coerenza di un insieme di assiomi erano state date, fino a quel
momento, soltanto dimostrazioni di carattere relativo: in altre parole, si era
provato che un certo insieme di assiomi era coerente presumendo che un
altro insieme di assiomi, ritenuto più fondamentale, lo fosse. Per esempio, la
coerenza degli assiomi della geometria non euclidea di Lobacevskij era stata
dimostrata facendo vedere che essi potevano essere interpretati nell’ambito
della geometria euclidea. Hilbert stesso aveva elaborato un’assiomatizzazio-
ne rigorosa della geometria euclidea, colmando in tal modo certe lacune di
questa venerabile disciplina. Aveva quindi fornito una dimostrazione della
coerenza dei suoi assiomi basata sui numeri reali. Nel secondo problema
della sua lista, Hilbert proponeva di trovare una dimostrazione di coerenza
per gli assiomi che caratterizzano il sistema dei numeri reali. È evidente che,
per risultare soddisfacenti, le dimostrazioni di coerenza non possono essere
tutte di natura relativa; bisogna arrivare a un punto fermo, vale a dire a una
dimostrazione di coerenza in grado di reggersi da sé. Nel 1900 nessuno aveva
tuttavia la più pallida idea di come costruire una dimostrazione siffatta.
Il successivo Congresso internazionale dei matematici si svolse, quat­
tro anni più tardi, a Heidelberg. Nel frattempo era emerso il devastante
paradosso di Russell. Hilbert si rivolse al congresso delineando in modo
frammentario la strategia che a suo parere avrebbe consentito di giungere a
una dimostrazione di coerenza per l’aritmetica. L’idea fondamentale - che
Hilbert e i suoi collaboratori avrebbero sviluppato e perfezionato nel corso
degli anni - era quella di sostituire il ragionamento astratto con la mani­
polazione di simboli e dimostrare quindi come quest'ultima non portasse
a contraddizioni. Il grande matematico francese Henri Poincaré denunciò
tuttavia la circolarità su cui si basava tale approccio: i metodi dimostrativi
che Hilbert voleva usare non erano molto diversi da quelli che intendeva
dimostrare. Sarebbero passati molti anni prima che Hilbert affrontasse se­
riamente questa obiezione.

4. I «Principia mathematica».

Bertrand Russell, in collaborazione con il collega Alfred North White-


head, s’imbarcò nell’eroica impresa di salvare il progetto di Frege di trovare
un fondamento puramente logico per l’aritmetica. Il risultato fu un’opera in
tre volumi, i Principia mathematica, che potrebbe essere definita con ugual
ragione sia un capolavoro sia una mostruosità. Il paradosso che aveva man­
46 Martin Davis

dato in pezzi il sistema di Frege fu evitato considerando gli insiemi in ge­


rarchie rigorosamente distinte, in modo che nessuno potesse appartenere
a se stesso. U primo volume, apparso nel 1910, partiva da quella che era
sostanzialmente la logica fregeana e, dopo più di seicento pagine piene di
simboli complessi, non arrivava nemmeno a trattare l’aritmetica. Questa
materia veniva affrontata nel secondo volume, pubblicato due anni dopo:
il teorema 1 + 1 = 2 si trova dimostrato a pagina 83. Agli occhi dello stu­
dioso moderno l’intero approccio appare inutilmente macchinoso: si in­
contrano pagine e pagine pressoché prive di testo in cui si dimostrano con
minuzia formale una quantità di assolute banalità. Gli autori introducono
una definizione di numero di stampo fregeano, che risulta però gravemente
compromessa dalle gerarchie in cui sono stati segregati gli insiemi. Affer­
mazioni della forma «tutti gli insiemi che sono equinumerosi a...» sono
bandite; il massimo che si può dire è «tutti gli insiemi di un determinato
tipo sono equinumerosi a...» Per destreggiarsi tra i diversi tipi di insiemi,
Russell e Whitehead trovarono necessario introdurre uno speciale «assio­
ma di riducibilità», che minò seriamente la giustificazione filosofica della
divisione gerarchica in tipi e che ben difficilmente poteva essere ritenuto
una verità logica evidente.
Nonostante ciò, i Principia mathematica ebbero un impatto notevole.
Se nelle pagine iniziali l’argomento dell’opera è chiaramente la logica, a un
certo punto questa cede il posto alla matematica, senza che sia possibile trac­
ciare una precisa linea di demarcazione. Pur con tutte le sue imperfezioni,
questo scritto monumentale dimostrò una volta per tutte che il progetto di
racchiudere la matematica in un linguaggio simbolico puramente formale
era perfettamente realizzabile.

5. Il programma di Hilbert.

Dopo la conferenza di Hilbert al Congresso di Heidelberg, il problema


della coerenza non parve suscitare più alcun interesse almeno fino al ter­
mine della Prima guerra mondiale, nel 1918. Nel frattempo il matematico
olandese Luitzen EgbertusJan Brouwer, inizialmente un protetto di Hilbert,
aveva proposto un programma radicale per circoscrivere il ragionamento
matematico sugli insiemi infiniti. Sulle prime Hilbert lo giudicò soltanto un
tentativo poco avveduto, ma quando Hermann Weyl, uno dei suoi studenti
più brillanti, dichiarò di essersi convertito alle tesi di Brouwer, reagì in modo
drastico e in un discorso del 1922 si spinse ad affermare:
Weyl e Brouwer [...] cercano di fondare la matematica gettando a mare tutto
ciò che a loro appare scomodo e istituendo una dittatura del divieto alla Kronecker.
Ma ciò significa smembrare e mutilare la nostra scienza, e seguendo questi rifor­
matori corriamo il pericolo di perdere una gran parte dei nostri più preziosi tesori.
I fondamenti dell’aritmetica 47
Weyl e Brouwer mettono al bando i concetti generali di numero irrazionale, di
funzione (addirittura di funzione numerica), i numeri cantoriani delle classi supe­
riori, ecc.; esempi di teoremi e di modi inferenziali vietati sono il teorema che tra
infiniti numeri c’è sempre uno più piccolo, e persino il tertium non datur logico
(ad es. nell’asserzione: esiste solo un numero finito di numeri primi oppure ne
esistono infiniti). [...] Questo tentativo di putsch [...] è condannato in partenza
all’insuccesso poiché il potere statale è stato cosi ben armato e rafforzato da Frege.
Dedekind e Cantor16.

Hilbert era ormai pronto a lavorare seriamente al programma che aveva


abbozzato solo a grandi linee nel 1904. La sua idea di base consisteva nel
«codificare» le nozioni matematiche di cui si vuole dimostrare la coerenza
in un sistema formale, in modo tale che le deduzioni logiche si potessero
ridurre a manipolazioni di simboli. A quel punto sarebbe stato possibile
impostare una dimostrazione di coerenza considerando l’intero sistema for­
male come un oggetto matematico combinatorio. Hilbert coniò il termine
«metamatematica» per indicare l’uso della matematica per studiare i siste­
mi formali che «codificano» porzioni significative della matematica. Aveva,
dunque, finalmente trovato una risposta all’obiezione di Poincaré, secondo
cui il programma delineato a Heidelberg sarebbe stato minato dalla circo­
larità implicita nel voler giustificare il ragionamento matematico attraverso
il ragionamento matematico stesso. La dimostrazione di coerenza, inoltre,
sarebbe stata condotta con metodi «finitisti» tanto semplici e diretti che
nemmeno Brouwer e i suoi seguaci avrebbero potuto sollevare obiezioni.
Inizialmente Hilbert pensò di adottare il sistema dei Principia mathematica
di Whitehead e Russell, ma ben presto cambiò idea. Affiancato dal brillante
logico Paul Bernays, scelse la strada di aggiungere opportuni assiomi mate­
matici alla logica di Frege.
Nel caso dei numeri naturali, gli ovvi assiomi da usare erano i postulati di
Dedekind-Peano descritti poco sopra. Introducendo i simboli 0, S per indi­
care rispettivamente 0 e «successore», i primi due assiomi sono già espressi
dalla notazione stessa. Usando le lettere x, y, ecc. come variabili sull’insieme
dei numeri naturali, il terzo e il quarto assioma possono essere tradotti nel
linguaggio formale come segue:
VxVy(Sx = S;y D x = y)
Vx ->(0 = Sx).
Formalizzare il quinto assioma è una faccenda ben più difficile. Malgrado
esso comprenda le parole «ogni insieme», risulta impossibile fornire una
descrizione assiomatica pienamente adeguata del concetto di insieme, anche

'* D. Hilbert, Neubedriindung der Mathematik. Erste Mitteilung, 1922 [trad. it. Nuova fonda­
zione della matematica. Prima comunicazione, in Ricerche suifondamenti della matematica, a cura di
V. Michele Abrusci, Bibliopolis, Napoli 1985, p. 192].
48 Martin Davis

se ci si limita agli insiemi di numeri naturali17. Non c’è modo di risolvere la que­
stione in maniera del tutto soddisfacente. Anche per definire operazioni fonda-
mentali quali l’addizione e la moltiplicazione è necessario ricorrere al concetto
di insieme di numeri naturali nella sua interezza. Per superare questa seconda
difficoltà, si può arricchire il linguaggio con i nuovi simboli + e X per indicare
l’addizione e la moltiplicazione, e aggiungere i quattro assiomi seguenti:
Vx(x + 0 = x)
VxV)>(x + S;y = S(x + ;y))
Vx(x x 0 = 0)
VxVyU X Sy = (x X y) + x).
Non è troppo diffìcile convincersi che queste equazioni sono sufficienti a
derivare tutti i fatti consueti riguardanti l’addizione e la moltiplicazione di
specifici numeri naturali18. Questo linguaggio è chiamato «linguaggio del­
l’aritmetica». Gli insiemi di numeri naturali di cui si occupano normalmente
i matematici sono tutti defìnibili in questo linguaggio19. Per esempio, 1insie­
me di numeri pari è definibile mediante la formula
3y{x = y + y).

Ciò è vero nel senso che, se nella formula si sostituisce a x l’espressione


composta da un certo numero di occorrenze di S in sequenza seguito da 0,
l’enunciato che ne risulta sarà dimostrabile solo nel caso in cui quel numero
di occorrenze sia pari. L’insieme di numeri primi è definibile mediante la
formula
-•(x = 0) A — ' (x = SO) A VyVzU = y X z D i y = x\jz = x)).
Queste formule suggeriscono un modo per riuscire a recuperare, almeno
in parte, la forza del quinto assioma di Peano pur restando nell ambito del
linguaggio dell’aritmetica: invece di cercare di parlare di tutti gli insiemi, ci
si limita a considerare, uno per uno, solo gli insiemi definibili nel linguaggio
delParitmetica. Lo «schema» seguente serve da modello per queste «istan-
ziazioni» dell’assioma di induzione:
W(0) A VxU(x) D .4(Sx))] D Vx.4(x).
L’idea è di pensare A(x) come qualcosa che sta al posto di una definizione,
espressa nel linguaggio dell’aritmetica, di un qualche insieme nel quale la

11Ciò fu mostrato dal logico norvegese Thoralf Skolcm.


'* Il lettore può divertirsi a derivare da questi assiomi il fatto che 2 X 2 = 4 nella forma
SSO x sso =sssso.
'* In particolare, è stato dimostrato che tutti gli insiemi computabili di numeri naturali (cioè,
tali che sia possibile verificare con un algoritmo se un numero vi appartiene o meno) sono defìnibili
in questo modo.
I fondamenti dell’aritmetica 49

lettera x va sostituita da 0 o Sx, come indicato nello schema. Dato che nel
linguaggio dell’aritmetica si hanno infinite definizioni diverse, lo schema
precedente costituisce un modello per infiniti assiomi diversi. Il sistema
che ne risulta, oggi noto come «aritmetica di Peano» (PA), ha avuto un
grande successo. Nonostante la forma limitata in cui è disponibile l’assio­
ma di induzione, PA è risultata perfettamente adeguata per dimostrare
tutti i teoremi riguardanti i numeri naturali presenti nella letteratura ma­
tematica.
L’artimetica di Peano fu ampiamente studiata da Hilbert e dai suoi
colleghi e studenti. Il primo passo da compiere per la realizzazione del
programma di Hilbert era trovare una dimostrazione (condotta con me­
todi finitisti) della coerenza di PA. In due pubblicazioni serie, alTincirca
coeve alle conferenze in cui Hilbert esponeva le sue idee, fu sostenuto di
aver raggiunto questo obiettivo: una era firmata da Wilhelm Ackermann,
allievo di Hilbert, l’altra da Jànos von Neumann (il grande matematico,
all epoca appena ventiquattrenne, avrebbe in seguito cambiato il proprio
nome di battesimo in John). Entrambe le dimostrazioni risultarono tutta­
via irrimediabilmente errate. Nel frattempo un giovane e brillante logico,
Kurt Godei, rimaneva, per il momento, dietro le quinte: la sua entrata in
scena avrebbe gettato nuova luce sulle effettive possibilità del programma
di Hilbert di garantire un solido fondamento all’aritmetica, rilevando nel
contempo le insidie che pregiudicavano il successo.

6. Kurt Godei.

Nell’autunno del 1930 Hilbert fu l’ospite d’onore in un congresso di


scienziati e medici a Kònigsberg. Per l’occasione scelse di intervenire sul
tema «scienza naturale e logica» e in uno slancio di ottimismo annunciò
che non esistevano problemi irrisolvibili. Concluse la propria allocuzio­
ne con parole altisonanti, che in seguito sarebbero state incise sulla sua
lapide: «Wir miissen wissen; wir werden wissen» (Dobbiamo sapere; sa­
premo). In un congresso collaterale dedicato ai fondamenti della mate­
matica, svoltosi a Kònigsberg pochi giorni prima del discorso di Hilbert,
si era verificato un evento memorabile, che sollevava seri dubbi sul suo
ottimismo. Alcuni oratori avevano illustrato le tre principali correnti di
pensiero sui fondamenti della matematica: von Neumann aveva discusso
il programma di Hilbert, un discepolo di Brouwer, Arend Heyting, avev
presentato il revisionismo radicale del maestro, mentre il filosofo Rudolph
Carnap del famoso Circolo di Vienna illustrò il tentativo di Frege-Rus-
sell di sviluppare la matematica soltanto da principi logici. Furono tutti
interventi interessanti e ben argomentati, che tuttavia contenevano ben
pochi elementi di novità. Il congresso fu seguito da una tavola rotonda in
50 Martin Davis

cui un giovane dall’aria schiva avanzò l’idea che potesse esistere un enun­
ciato vero riguardante i numeri naturali non dimostrabile in sistemi quali
i Principia mathematica. Qualche tempo dopo questa idea, allora appena
abbozzata, sarebbe stata trasformata in un’audace affermazione: si può
dimostrare che esiste un enunciato vero riguardante i numeri naturali che
non può essere provato nel sistema dei Principia mathematica. Quel gio­
vane si chiamava Kurt Godei e aveva appena discusso la tesi di dottorato
aH’Università di Vienna.
L’annuncio di questo risultato ebbe profonde implicazioni per almeno
due degli orientamenti illustrati nel corso del congresso, per la precisione
quelli esposti da Carnap e von Neumann. Nello stesso tempo, mise in dub­
bio il «wir werden wissen» hilbertiano” . Carnap aveva fatto il viaggio da
Vienna a Kònigsberg con Godei ed era stato al corrente della scoperta già
prima che i lavori del congresso avessero inizio: ciò tuttavia non influenzò
affatto il suo intervento. Von Neumann, dal canto suo, comprese all’istante
che si trattava di un fatto di estrema rilevanza e al termine del dibattito si
affrettò a raggiungere Godei per avere altri ragguagli. Dopo questo episo­
dio smise di occuparsi di logica matematica, anche se continuò a esprimere
profonda ammirazione per i risultati conseguiti da Godei.
Godei era nato e cresciuto nella comunità tedesca della città ceca di
Bmo. All’Università di Vienna si interessò dapprima di fisica, poi di teoria
dei numeri, prima di dedicarsi per il resto della sua vita alla logica mate­
matica e ai fondamenti della matematica. Nel 1928 Hilbert e Ackermann
avevano pubblicato un piccolo manuale di logica, Grundziige der theo-
retischen Logik, in cui ponevano un problema che attirò 1 attenzione del
giovane Godei. Frege aveva fornito per la prima volta un insieme di regole
che sembrava perfettamente adeguato per procedere da una serie di pre­
messe a una conclusione che ne fosse la logica conseguenza. Whitehead e
Russell, e in seguito Hilbert e Ackermann, avevano adottato alcune varianti
di tali regole, del tutto equivalenti ad esse. Il problema descritto nel ma­
nuale di Hilbert e Ackermann che suscitò l’interesse di Godei consisteva
nel dimostrare che queste regole fossero complete, ossia che per qualsiasi
inferenza valida (cioè, corretta) esse potessero essere usate per giungere
alla conclusione a partire dalle premesse. Nella sua tesi di dottorato Godei
riuscì a dimostrare questo risultato. Per comprendere appieno che cosa
dimostrò il logico di Bmo, è necessario capire bene in che senso si possa
dire che un’argomentazione è valida. Consideriamo a questo proposito il
seguente esempio di inferenza logica, in cui le due premesse sono poste al
di sopra della linea di separazione e la conclusione al di sotto:

* La reazione di Hilbert di fronte ai risultati di Godei fu, almeno all’inizio, di profonda col­
lera.
I fondamenti dcll’aritfnetica 51

Tutti gli innamorati sonofelici


Giovanni è innamorato di Maria
Giovanni èfelice
Usando il linguaggio di Frege, possiamo esprimere questa inferenza nella
forma
(*) Vx(3>i4(x, y) D F(x))
A(G, M)
F(G)
I simboli A, F, G, M hanno un significato relativo all’argomento specifico:
A la relazione di essere innamorato
F la proprietà di essere felice
G Giovanni
M Maria
Ora, affermare che questa inferenza è valida significa affermare che, indipen­
dentemente dall’universo di individui che scegliamo, dalla relazione fra tali
individui che rappresentiamo con la lettera A, dalla proprietà che indichia­
mo con la lettera F e da quali individui designiamo con G e M , fintantoché
operiamo in modo da garantire che le due premesse siano entrambi enunciati
veri, anche la conclusione lo sarà. Per meglio chiarire che cosa significhi per
un’inferenza essere valida, può essere utile considerare un’interpretazione
della stessa inferenza simbolica molto diversa dalla precedente:
I predatori hanno denti aguzzi
I giaguari sono predatori delle mucche
I giaguari hanno denti aguzzi
Per poter comprendere che anche questo esempio ricade nell’inferenza sim­
bolica (*), possiamo usare le variabili x, y per indicare specie arbitrarie di
mammiferi e interpretare le altre lettere cosi:
A la relazione di una specie predatrice di un’altra
F la proprietà di avere denti aguzzi
G giaguari
M mucche
Un’inferenza è valida se, indipendentemente dall’universo sul quale variano
le variabili, dalle proprietà, relazioni o costanti che le singole lettere rappre­
sentano, fintantoché tutte le premesse sono enunciati veri, anche la conclu­
sione lo è.
Diversamente da (*), il seguente è un esempio di inferenza non valida,
per quanto talvolta in politica qualcuno si comporti come se lo fosse:
52 Martin Davis

3x(G(x)AH(x))
Vx(G(x) D H(x))
Per capire che non si tratta di un’argomentazione valida, riferiamo le
variabili al genere umano e poniamo che G sia la proprietà di essere mus­
sulmano e H la proprietà di essere terrorista. La premessa è vera: alcuni
mussulmani sono terroristi. Ma ovviamente la conclusione è falsa: non tutti
i mussulmani sono terroristi.
Le regole di Frege sono interamente sintattiche-, ciò significa che esse
dipendono solo dalla forma delle espressioni e non dal loro significato. Per
contro, la nozione di validità di un’inferenza è semantica: affermare che una
determinata inferenza è valida significa affermare che, indipendentemente
dal significato che si attribuisce ai simboli, se le premesse sono vere, lo è
anche la conclusione. Il problema affrontato da Godei consisteva nel dimo­
strare che le nozioni sintattica e semantica coincidono: un’inferenza è valida
se e solo se la conclusione può essere dedotta dalle premesse usando le regole
di Frege. Nella sua tesi di dottorato egli riuscì nell’impresa.
Benché il lavoro di Godei sia pregevole, non può tuttavia essere definito
rivoluzionario, perché utilizza metodi ben noti ai logici. Ciò che sorprende,
piuttosto, è che Hilbert e il suo valente gruppo di collaboratori avessero la­
sciato il problema irrisolto. Nelle università austriache e tedesche del tempo,
chi aspirava alla carriera accademica doveva presentare una Habilitations-
schrift, una sorta di seconda tesi di dottorato. Per questa dissertazione Godei
decise di lavorare sul programma hilbertiano volto a trovare dimostrazioni
di coerenza finitiste. La straordinaria scoperta alla quale arrivò fu che questo
programma, almeno nella sua concezione originaria, non era attuabile.
Hilbert partiva dall’assunto che i sistemi logici, intesi come strutture
sintattiche combinatorie, potessero essere studiati matematicamente. Godei
approfondi questa idea: dato che tali sistemi erano in grado di «codificare»
la matematica consueta, potevano essere usati in modo da riferirsi a se stessi.
Per realizzare questo obiettivo, Godei si servi di un codice che rappresentava
le stringhe di simboli che costituivano le espressioni di un sistema formale
mediante numeri naturali. Dal momento che questi sistemi formali erano
concepiti proprio per trattare i numeri naturali, ecco che enunciati riguar­
danti il sistema formale potevano, tramite il codice, essere trasformati in
enunciati riguardanti i numeri naturali, e dunque essere espressi nel sistema
stesso.
Per illustrare in modo concreto queste idee, torniamo a considerare il
linguaggio dell’aritmetica e il sistema formale PA formulato in tale linguag­
gio. Anche se Godei, nel suo rivoluzionario articolo, non usò tale sistema,
bensì uno molto più potente basato sui Principia mathematica di Whitehead
e Russell, risulta tuttavia molto più facile spiegare la faccenda in termini
di PA. Nei nostri esempi abbiamo finora utilizzato solo tre variabili, x, y,
I fondamenti dell’aritmetica 53

z; tuttavia, per una piena capacità espressiva è necessario disporre di una


classe arbitrariamente ampia di simboli utilizzabili come variabili. A tale
scopo introduciamo il simbolo speciale ', che sarà usato per coniare nuove
variabili quali y\x" o z'". Ecco allora come si può creare un codice per il
linguaggio ddl'aritmetica21:
+ X x y z { ) '
i d - . v a V B 0 S =
i i i i i i i i i i i i i i i i i
10 11 12 13 14 15 21 22 23 31 32 33 34 41 42 43 44

L’assioma di PA VxV>>(Sx = Sy D x = y) è codificato, per esempio, dal


numero 143214334122324422331032443342. Si tratta, com’è ovvio, di un
codice assolutamente arbitrario, ma chiunque lo conosca non avrà difficoltà
a ricostruire l’espressione originaria a partire dal numero. Come abbiamo
già visto, in PA i numeri sono rappresentati da una stringa di S seguita da
0. Il numero di trenta cifre che abbiamo appena scritto sarebbe quindi rap­
presentato da una lunghissima stringa contenente più di IO29occorrenze di
S. Abbiamo già avuto occasione di osservare che determinate formule di PA
possono fungere da definizioni di insiemi di numeri naturali; l’insieme di
numeri pari, per esempio, può essere definito dalla formula
3y(x = >' + >')
e l’insieme di numeri primi dalla formula
-<(x = 0) A (x = SO) AVyVz(x = y X zD {y = x\/z = x)).
Godei mostrò come costruire una formula di PA, assai più complessa di
queste, che fornisca una definizione dell’insieme di numeri che sono codici di
quelle formule di PA dimostrabili a partire dagli assiomi usando le regole di
Frege. Usando questa formula riuscì a costruire formule di PA che, mediante
il codice, esprimono l’asserzione che determinate formule sono dimostrabili
- o, al contrario, non dimostrabili - in PA. In altre parole, riuscì a costruire
formule A che, una volta decodificate, dicono che una determinata formula B
non è dimostrabile in PA. Ora, a chiunque ignori il codice, A sembra esprimere
soltanto qualche complicata e poco interessante proposizione riguardante i
numeri naturali; chi invece conosce il codice, capisce chey4 esprime la propo­
sizione che una certa formula B non è dimostrabile in PA. In generale, A e B
sono formule diverse; Godei si chiese se potessero essere uguali. La risposta è
si, ed egli riuscì a dimostrarlo usando un trucco matematico appreso da Can­
tor, che rendeva possibile, per l’appunto, sistemare le cose in modo tale che la

11 II codice specifico usato da Godei era diverso da quello qui descritto, ma la cosa non ha
alcuna rilevanza.
54 Martin Davis

formula asserita non dimostrabile e la formula che esprimeva tale asserzione


coincidessero. In altre parole, Godei aveva capito come ottenere una formula,
che chiameremo U, avente le seguenti proprietà:
- U afferma che una determinata formula non è dimostrabile in PA;
- quella formula non è altro che U stessa;
- pertanto, U afferma: «U non è dimostrabile in PA».

Per capire meglio quali siano le proprietà di questa formula notevole,


daremo per scontato che le proposizioni espresse dalle formule dimostrabili
in PA siano tutte vere. Usando le proprietà di U sopra elencate, possiamo
dimostrare che, sebbene U esprima una proposizione vera, non è dimostra­
bile in PA:
(i) La proposizione espressa da U è vera. Supponiamo sia falsa. Allora,
in base a quanto afferma U stessa, U sarebbe dimostrabile in PA e
pertanto la proposizione che esprime dovrebbe essere vera, il che è
una contraddizione. Di conseguenza, la proposizione deve essere
vera.
(ii) U non è dimostrabile in PA. Si è dimostrato che la proposizione
espressa da U, che asserisce U non è dimostrabile in PA, è vera. Di
conseguenza, U non è effettivamente dimostrabile in PA.
(iii) La negazione di U, cioè, laformula -• U, non è dimostrabile in PA. Dato
che la proposizione espressa da U è vera, quella espressa da -• U deve
essere falsa; pertanto anche -• U non è dimostrabile in PA.

Per sottolineare il fatto che né U né la sua negazione sono dimostrabili in


PA, U viene detta «proposizione indecidibile». E opportuno tuttavia mettere
bene in evidenza il fatto che questa indecidibilità è tale solo relativamente
alla dimostrabilità all 'interno del sistema PA. Da un punto di vista esterno è
chiaro che ciò che U esprime è vero. Ciononostante, il risultato ottenuto da
Godei, mostrando che nessun singolo sistema formale può esprimere in se
stesso tutte le verità matematiche, infranse per sempre il sogno di Frege e di
Whitehead e Russell di ridurre la matematica alla logica.
Dato che abbiamo appena dimostrato che la proposizione espressa da U
è vera, potremmo a questo punto chiederci perché mai tale dimostrazione
non possa essere tradotta nel sistema PA. Godei intuì che dietro al fatto che
ciò non era possibile doveva nascondersi qualcosa di interessante. Ciò che
può essere provato all’interno di PA è la proposizione:
Se PA è coerente allora U.
Pertanto, se riuscissimo a dimostrare all’intemo di PA che PA è coerente,
ne conseguirebbe che potremmo dimostrare U in PA. Dato che sappiamo
che non è possibile dimostrare U in PA, concludiamo che la coerenza di PA
I fondamenti dell’aritmetica 55

non possa essere dimostrata in PA. Questo è il cosiddetto «secondo teorema


dell’incompletezza» di Godei. Ora, il programma di Hilbert si riproponeva
di dimostrare che sistemi come PA sono coerenti usando soltanto metodi «fì-
nitisti», un modesto sottoinsieme di quelli disponibili in PA; eppure, Godei
aveva provato che anche l’intero sistema PA è insufficiente a dimostrare la
sua propria coerenza. Ciò significava infliggere un colpo mortale al pro­
gramma di Hilbert, almeno cosi come concepito in origine. Avremo modo
di approfondire l’argomento nelle pagine che seguono.

Nella parte restante di questo paragrafo spiegheremo come costruire una


formula del tipo di U in PA. Il lettore che non intende addentrarsi in una
trattazione alquanto tecnica può passare subito al paragrafo successivo.
È innanzitutto importante chiarire alcune questioni. Si è visto che in PA
i numeri naturali sono rappresentati da espressioni della forma S ... SO. Per
la precisione, un numero naturale n è rappresentato da un’espressione di
questo genere in cui vi sono esattamente n occorrenze di S. Scriveremo «per
indicare tale espressione e diremo che « è il numerale corrispondente a n.
Cosi, per esempio, 2 è SSO. Le variabili x, y, z svolgono due ruoli diversi in PA
e nei sistemi logici affini. Da una parte, possono trovarsi in contesti come
Vx...x... oppure 3y...y...
in cui fungono da simboli che consentono di esprimere il concetto di «tutti»
o «alcuni». Tali variabili sono dette vincolate. Dall’altra, si hanno anche va­
riabili non vincolate, che sono dette libere. Queste possono essere sostituite;
in particolare, per determinati scopi, possono essere sostituite da numerali.
Nella formula
-•(* = 0) A~>(x = SO) A VyVz(x = y x z D (y = x\Jz = y)),

che, come già notato, può servire da definizione dell’insieme di numeri pri­
mi, x è una variabile libera, y e z due variabili vincolate. Le formule che non
contengono variabili libere sono dette proposizioni (o, più propriamente,
formule chiuse) ed esprimono affermazioni che possono essere vere o false.
Cosi, se nell’ultima formula a x sostituiamo SSSSSO, la proposizione risul­
tante è vera perché 5 è un numero primo, mentre se a x sostituiamo SSSSSSO
otteniamo una proposizione falsa. Le formule che hanno una sola variabile
libera - poniamo la x - sono dette unarie. Come già osservato, queste posso­
no essere usate per definire insiemi di numeri naturali. Faremo ora uso dei
codici delle formule unarie. Il codice della formula unaria
3y(x = y + y),
che, come già osservato, definisce l’insieme di numeri pari, è
153341324433233342.
56 Martin Davis

Per una data formula unaria A e un numero naturale n useremo la nota­


zione [A : «] per rappresentare la proposizione ottenuta sostituendo in A la
variabile x con h, il numerale che rappresenta il numero n. Per esempio,
[3>(x = y + y) : 2]
rappresenta la proposizione
3?(SS0 = y + y)-
Ora vedremo come i metodi di Godei possano essere usati per costruire una
proposizione U di PA che esprima l’affermazione che essa stessa non è dimo­
strabile in PA. Dobbiamo in primo luogo elencare tutte le formule unarie
Aq,A j,A2yA j,...
Per fare ciò procederemo nel modo seguente: se un numero k è il codice
di una formula unaria, stabiliamo che Ak sia quella formula. Per colmare
i vuoti che si hanno nel caso in cui k non sia il codice di nessuna formula
unaria, conveniamo c h e ^ sia la formula unaria x —0. Quindi, per esempio,
Ai5J34I32443>23J342 è la formula unaria 3y{x = y + y).

Qualunque siano i numeri naturali n, m, la formula [An: m] sarà una pro­


posizione. Alcune di queste proposizioni saranno dimostrabili in PA, altre
no. Sia ora K l’insieme costituito dai numeri naturali n tali che che [An: n\
non sia dimostrabile in PA. Il fatto che la dimostrabilità in PA sia definibile
in PA consente di trovare una formula unaria B che definisca tale insieme
K in PA“ Ci dev’essere allora un numero q tale che B = Aq giacché tutte le
formule unarie sono incluse nella sequenza A v A2, A}, ... Perciò, per ogni
numero naturale n, la proposizione [Aq\ n] esprime l’affermazione
[An: n] non è dimostrabile in PA.
In particolare, attribuendo il valore q a n, vediamo che [Aq : q] esprime
l’affermazione
[Aq: q] non è dimostrabile in PA.
Pertanto, [Aq: q\è una proposizione di PA che esprime l’affermazione che
essa stessa non è dimostrabile in PA.

7. Il programma di Hilbert dopo Godei.

Hilbert aveva ricercato una dimostrazione «finitista» della coerenza di


PA. Von Neumann era convinto che Godei avesse provato che era un’im-

a La costruzione non è difficile, ma sarebbe troppo complicato illustrare qui i dettagli.


I fondamenti dell’aritmetica 57

presa impossibile. Godei, dal canto suo, non era tanto sicuro che le cose
stessero proprio cosi. In effetti, come questi ebbe a osservare, potrebbe esistere
un qualche principio di carattere fìnitista al di fuori di PA che renda possibile
dimostrare, insieme con altri metodi fìnitisti, la coerenza di PA. Nel 1936 Ger­
hard Gentzen, allievo di Hilbert, riuscì a ottenere una dimostrazione di questo
genere (anche se sul suo essere davvero fìnitista vi erano non pochi dubbi).
Per illustrare il risultato di Gentzen, è opportuno ricordare prima di
tutto il cosiddetto «principio del minimo»: ogni insieme non vuoto di numeri
naturali ha un elemento minore di tutti gli altri. Come si può dimostrare,
esso è equivalente al quinto postulato di Peano. E se si restringe questo
principio agli insiemi definibili in PA, esso può essere usato per dare una
formulazione equivalente di PA”. Georg Cantor aveva già evidenziato che
esistono molti modi diversi - che chiamava «buoni ordinamenti» - in cui
si possono disporre i numeri naturali senza che il principio del minimo sia
violato. Per esempio, i numeri pari possono precedere tutti quelli dispari,
nella maniera seguente:
(7.1) 0,2,4,6,... 1,3,5,7,...
In questo ordinamento 8 < 3 perché ogni numero pari è più piccolo di
qualsiasi numero dispari. Ecco un esempio di buon ordinamento più com­
plicato:
(7.2) 0 ,1 ,2 ,4 ,... 3,9,15,... 5,25,35,... 7,49,77,...
In questo caso, dopo 0 e 1, seguono i numeri non nulli divisibili per 2, poi
quelli non nulli divisibili per 3 ma non per 2, poi quelli non nulli divisibili
per 5 ma non per 2 o 3, poi ancora quelli non nulli divisibili per 7 ma non
per 2, 3 o 5, e così via, procedendo attraverso la successione dei numeri
primi. Cantor diede nomi diversi ai diversi tipi di buoni ordinamenti: l’ordi­
namento usuale è di tipo u>, quello (7.1) di tipo oj • 2, quello (7.2) di tipo a)2.
Senza fornire ulteriori esempi, che risulterebbero piuttosto complicati, sarà
sufficiente ricordare che Cantor definì buoni ordinamenti di tipo:
..., (O17, ... (tìu,l ... (tì'0”, ...
«Al di là» di tutti questi, c'è un buon ordinamento estremamente com­
plicato che Cantor chiamò di tipo E q. Ebbene, il principio del minimo per
gli insiemi definibili non può essere dimostrato in PA per i buoni ordina­
menti di tipo E q, sebbene sia dimostrabile per tutti gli ordinali più piccoli.
Gentzen mostrò come provare la coerenza di PA usando metodi fìnitisti più
il principio del minimo per buoni ordinamenti di tipo Gq. La figura 1 illustra

u C'è una questione tecnica di secondaria importanza: il principio del minimo usa la < relazione
che non è immediatamente disponibile in PA. Tuttavia, si può semplicemente definirex<y come
3z(x + Sz = y).
58 Martin Davis

la situazione. Anche se pochi direbbero che questa è una dimostrazione


fìnitista che soddisfa le condizioni fissate da Hilbert: nondimeno, il risultato
di Gentzen fu importante. In particolare, evidenzia come il programma di
Hilbert avesse ancora mantenuto, dopo più di trentanni, il suo interesse pur
avendo perduto quella rilevanza fondazionale che egli aveva sperato.
Oggi il programma di Hilbert sopravvive come l’importante area di ri­
cerca che va sotto il nome di «teoria della dimostrazione». Senza cercare di
fornire una giustificazione assoluta di nessuno specifico sistema formale, i
teorici della dimostrazione studiano le gerarchie di sistemi formali di com­
plessità crescente e le loro interrelazioni. I buoni ordinamenti continuano ad
avere un ruolo importante in tali ricerche. Oltre al loro intrinseco interesse,
questi studi risultano avere profonde connessioni con altri campi di indagi­
ne. Vi sono relazioni, per esempio, con il famoso problema informatico P =
NP, per la cui soluzione è stato messo in palio un milione di dollari. Inoltre,
l'analisi delle dimostrazioni ha condotto in certi casi al perfezionamento di
teoremi in ambiti molto lontani dalla logica matematica.

8. I fondamenti oggi.

Nei primi anni del xx secolo il mondo della matematica fu tormentato dal
problema del ruolo della teoria degli insiemi. A causa di paradossi come quel­
lo che Russell segnalò all’attenzione di Frege, serpeggiava, anche tra i grandi
matematici dell’epoca, una sensazione di crisi a proposito dei fondamenti della
matematica. Come abbiamo visto, fu un periodo di forti passioni.
Negli anni Cinquanta il clima era invece molto diverso. Quando, verso la
fine degli anni Quaranta, facevo il dottorato, i miei compagni, conoscendo il
mio interesse per i fondamenti, si divertirono a provocarmi con la seguente
storiella:

Figura 1.
I fondamenti dell’aritmetica 59

Sulle rive del Reno c’era un antico e maestoso castello che da secoli e secoli
veniva ammirato da tutti. Nelle sue cantine vivevano molti ragni che nel corso degli
anni avevano tessuto un complicato intrico di ragnatele. Un giorno furono aperte le
porte delle cantine e un forte vento spazzò via tutte le ragnatele. I ragni cercarono
affannosamente di tesserle di nuovo perché, guarda un po’, pensavano che fossero le
loro tele a tenere in piedi il castello.

Era accaduto che i metodi insiemistici avevano ormai acquisito un ruolo


determinante nella pratica matematica. Interi settori della matematica ve­
nivano sviluppati a partire dalla teoria degli insiemi, ed era a tutti evidente
che i paradossi e le palesi contraddizioni che tanto avevano turbato il mondo
della matematica erano relegati ai margini, in un ambito che nulla aveva a
che fare con il modo in cui gli insiemi venivano usati nella matematica di
tutti i giorni.
Ai matematici che ancora si interessavano di tali questioni era chiaro che
gli assiomi per la teoria degli insiemi formulati per la prima volta da Ernst
Zermelo, e successivamente modificati da Adolf Abraham Fraenkel, Thoralf
Skolem e John von Neumann, erano più che sufficienti a formalizzare la
matematica dei manuali universitari e degli articoli di ricerca. Nicolas Bour­
baki —lo pseudonimo sotto il quale si nascondeva un gruppo di matematici
francesi —aveva adottato negli Éléments de mathématique una variante del­
l’assiomatica di Zermelo-Fraenkel. Il problema filosofico di definire i numeri
naturali che Frege pensava di aver risolto era completamente ignorato. Von
Neumann aveva definito i numeri naturali in termini insiemistici, identifi­
cando lo 0 con l’insieme vuoto 0 e ogni altro numero naturale con l’insieme
costituito dai numeri che lo precedono:
0 = 0, 1 = (0), 2 = {0,{0}}, 3 = {0,{0),{0,{0}}}, ...
Nessuno si preocccupava che questa «definizione» avesse una giustificazio­
ne filosofica, l’importante era che funzionasse bene a livello pratico: aveva
il pregio di rappresentare ogni numero con un insieme che aveva proprio
quel numero di elementi, e inoltre consentiva di introdurre agevolmente i
numeri transfiniti di Cantor.
Anche se i problemi legati ai fondamenti erano ormai di interesse se­
condario per la maggior parte dei matematici, una conventicola di adepti
continuò a scervellarsi su tali questioni. Tra costoro, tuttavia, non c’era uni­
formità di vedute, e si ebbero cosi accese controversie che parevano realiz­
zare la profezia di Frege. Da una parte, vi era chi suggeriva di usare nelle
dimostrazioni soltanto i metodi che si ritenevano «sicuri». In quest’ottica si
sviluppò il costruttivismo, il cui iniziatore fu L. E. J. Brouwer; i suoi fautori
riuscirono a definire un tipo di matematica molto più elegante ed esteso
di quanto Brouwer stesso e i suoi immediati seguaci non fossero riusciti
a fare. I «predicativisti» avevano una visione meno rigida e tracciarono la
frontiera là dove arrivava la matematica insiemistica dell’assiomatica di Zer-
60 Martin Davis

melo-Fraenkel. Tutt’altra direzione imboccarono quanti vollero allargare


questi confini. I lavori di Godei avevano indicato con chiarezza che non era
possibile ottenere una dimostrazione di coerenza per i nuovi assiomi propo­
sti, la maggior parte parte dei quali postulava l’esistenza di insiemi infiniti
molto più grandi di quelli considerati da Cantor. Resta da vedere se, come
aveva previsto lo stesso Godei, alcuni di questi assiomi si dimostreranno cosi
profìcui nella risoluzione dei problemi tuttora aperti da essere pienamente
accettati dalla comunità matematica.

BENACERRAF, P. e PUTNAM, H.
1983 PhilosopbyofMathematics:SelectedReadings, 2a edizione, Cambridge Univer­
sity Press, Cambridge.
DAVIS, M.
2000 TheUniversalComputer: TheRoadfromLeibniz to Turing, Norton, New York
(edizione paperback: EnginesofLogic: Mathematicians and thè Origins ofthè
Computer, Norton, New York 2001) [trad. it. Il calcolatore universale. Da Lei­
bniz a Turing, Adelphi, Milano 2003].
daw son, j . w . JR
1997 Logicai Dilemmas: The Life and Work ofKurt Godei, Peters, Wellesley Mass,
[trad. it. Dilemmi logici. La vita e l'opera di Kurt Godei, Bollati Boringhieri,
Torino 2001].
FREGE, G.
1884 DieGrundlagen derArithmetik: einelogisch-mathematische Untersuchung iìber
den Begriffder Zahl, Wilhelm Koebner Verlag, Breslau [trad. it. Fondamenti
dell’aritmetica, in Logicaearitmetica, a cura di C. Mangione, Boringhieri, To­
rino 1965, pp. 211-349].
GRATTAN-GUINNESS, I.
2000 TheSearchfor Mathematical Roots, 1870-1940: Logics, Set Theories, and thè
Foundations ofMathematicsfrom Cantor through Russell to Godei, Princeton
University Press, Princeton.
m a n c o su , p . (a cura di)
1998 FromBrouwertoHilbert. TheDebateonthè Foundations ofMathematics in thè
1920’s, Oxford University Press, Oxford.
REO), c .
1986 Hilbert-Courant, Springer-Verlag, New York (il volume riunisce due biografìe
già edite separatamente pressoSpringen Hilbert, 1970 e Courant in Gottingen
and NewYork: TheStoryofan Improbable Mathematician, 1976).
van s t ig t , v . p.
1990 Brouwer’sIntuitionism, North-Holland, Amsterdam.
D A V ID A . V O G A N JR

La classificazione dei gruppi

1. Introduzione.

La concezione della simmetria nella matematica moderna arriva a toccare


al tempo stesso le intuizioni del nostro senso comune e le nostre idee più
profonde sulla bellezza. Parte del fascino di un fiocco di neve sta proprio
nella sua simmetria; e fin da bambini impariamo a imitare questa qualità
piegando la carta e usando le forbici.
L’esempio più semplice di simmetria è quello della simmetria bilaterale,
come quella di un omino di carta ritagliato da un foglio piegato a metà. Que­
sto ritaglio può assomigliare a una persona, a una conchiglia o a una foglia,
ma in ogni caso la metà destra e la metà sinistra saranno immagini speculari
l’una dell’altra. Se il ritaglio viene ribaltato, non cambia forma. Le due metà
identiche si sono scambiate di posto, ma l’immagine che vediamo non viene
mutata. Ribaltare il ritaglio costituisce una sua simmetria.

Esiste più di una simmetria: anche non fare nulla lascia l’immagine che
vediamo immutata. A prima vista, annoverare il «non far nulla» fra le sim­
metrie potrebbe parere inutile o di nessun interesse, e invece risulta assai
utile, allo stesso modo in cui lo zero è indispensabile per risolvere problemi
aritmetici.
In matematica, il concetto di simmetria trova espressione astratta nella
nozione di gruppo. Un oggetto matematico dotato di simmetrie dà luogo
esattamente a un gruppo; ma un gruppo astratto può essere generato da vari
esempi di simmetria. La teoria dei gruppi esplora questa relazione e cerca
62 David A. Vogan Jr

di capire tutti i modi in cui un dato gruppo può derivare da un gruppo di


simmetria.
Nel caso della simmetria bilaterale, il gruppo di simmetria ha due ele­
menti soli: quello che scambia destra e sinistra e quello che non fa nulla.
Questi due elementi costituiscono il nostro primo esempio di un gruppo di
simmetria. In matematica la definizione di gruppo astratto è strutturata in
modo che ogni esempio di simmetria bilaterale dia luogo allo stesso gruppo
astratto.
Viene naturale porsi il problema di come classificare tutti i possibili
esempi di simmetria. Un primo passo per risolvere la questione potrebbe
essere quello di cercare tutti gli esempi di oggetti che hanno una simmetria
bilaterale; ma è chiaramente un compito troppo vasto per poter avere una ri­
sposta ragionevole. Chiunque, armato di un paio di forbici e fogli di carta da
piegare, può sfornare illimitate serie di oggetti simmetrici, ciascuno diverso
dal precedente. Ma ciascuno di essi avrebbe lo stesso gruppo di simmetria.
Se le simmetrie sono troppo generali per poter essere classificate, si può
però sperare che lo possano essere i gruppi di simmetria. Negli ultimi cento-
cinquantanni i matematici hanno lavorato a questa classificazione dei gruppi.
Si tratta di un problema ancora troppo generale per ammettere una soluzione
ragionevole: tuttavia si sono fatti progressi impressionanti. La forma generale
delle risposte è di questo tipo: i gruppi di simmetria non troppo grandi si otten­
gono assemblando alcuni pezzi presi da un campionario di esempi abbastanza
ristretto. In questo saggio ci proponiamo di chiarire, almeno in parte, quale
sia il significato del termine «assemblare» - che cosa voglia dire, cioè, pensare
un gruppo di simmetria come costituito da pezzi più piccoli. Concluderemo
spendendo qualche parola sui campionari di esempi: una delle cose da dire è
die molti di essi iniziano proprio dal gruppo di simmetria bilaterale.

2. La simmetria.

In questo paragrafo discuteremo l’idea matematica di simmetria in modo


un po’ più formale. Siccome si tratta di un’idea applicabile a un’enorme gam­
ma di situazioni, le definizioni formali che introdurremo dovranno essere
astratte; ma accanto ad esse discuteremo due esempi concreti.
Devo sottolineare che qualsiasi discussione breve della simmetria è si­
curamente fuorviarne; porta a tralasciare molte delle idee più belle e fonda-
mentali; inoltre (e questo è il peggio) lascia intravedere le insufficienze del
suo autore. Il lettore che verrà catturato dalle idee che delineeremo qui potrà
imparare molto di più leggendo il bel libro di Hermann Weyl [1952].

Esempio 2.1. Supponiamo che T sia un triangolo equilatero, con vertici


A, B e C, e lato di lunghezza 1. Possiamo pensare T come se consistesse
La classificazione dei gruppi 63

solo di questi tre vertici e dei lati che li congiungono, tralasciando la regio­
ne racchiusa dai lati. (Si tratta di una scelta puramente convenzionale o di
comodo. La scelta più semplice sarebbe pensare che T sia identificato solo
dai tre vertici e tralasciare anche i lati, ma ciò non sarebbe efficace a livello
esemplificativo).

Esempio 2.2. Supponiamo che C sia una circonferenza di raggio 1 (non


consideriamo il disco che questa racchiude). Per poter parlare dei punti di
C, fisseremo un punto P(0), immaginando di muoverci sulla circonferenza
in senso antiorario. Per specificare un qualsiasi altro punto, ora possiamo
dire quanti gradi dista da P(0) viaggiando in senso antiorario. Il punto dia­
metralmente opposto a P(0) si trova dunque a 180° da lui; lo indicheremo
con P(180). Scriveremo P(0)P(180) per indicare il segmento che va da P(0)
a P(180), che è un diametro di C. Gli estremi del diametro perpendicolare a
P(0)P( 180) li chiameremo P(90) e P(270), perché si trovano rispettivamente
a 90° e 270° da P(0).

«90)

Quando giriamo intorno alla circonferenza partendo da P(0), avviene


qualcosa di particolare. Dopo 90° arriviamo a P(90); dopo 180° arriviamo
a P(180); dopo 270° a P(270); e dopo 360° ci ritroviamo in P(0). In altre
parole, possiamo descrivere P(0) come posto a 0° da P(0) stesso, o a 360°, o
a 720°, e cosi via. Allo stesso modo, P(180) può venir scritto come P(—180)
o P(540). Ciascuna di queste etichette descrive uno e un solo punto della
circonferenza; ma ciascun punto ha un’infinità di etichette diverse.
Diamo ora una prima versione della definizione di simmetria.
64 David A. Vogan Jr

Definizione 2.3. Supponiamo che X sia un oggetto matematico - cioè un


insieme dotato di una qualche struttura addizionale. Una «simmetria di X» è
un riarrangiamento deipunti di X tale da conservare la struttura addizionale.

Prima di cercare di spiegare questa definizione o di precisarla, dirò che


cosa viene a significare nei due esempi precedenti.

Esempio 2.4. Supponiamo che T sia il triangolo delFesempio 2.1. Un


tipo di struttura che questo insieme possiede è il concetto di distanza fra
due punti. Se Pe Qsono punti di T, scriveremo d(P, Q) per indicare la loro
distanza. Per esempio, se P è il punto medio di BC (il lato che congiunge i

vertici B e O , allora d(/t, P) = — (come si può facilmente calcolare usando


il teorema di Pitagora). 2
Una simmetria di T è un riarrangiamento dei suoi punti che conservi
tale distanza. Formalmente, ciò significa in primo luogo che una simmetria
è un’applicazione a da T in T; ovvero, che è un modo di far corrispondere
a ogni punto P del triangolo un nuovo punto cr(P). Perché tale riarrangia­
mento sia una simmetria occorre che la distanza di P da Q sia la stessa della
distanza di ct(P) da ct(Q), qualunque siano i punti P e Q del triangolo. Con­
dizione che in formule si scrive:
d(a(P), a(Q)) = d(P, Q) (per tutti i punti P e Q ó iT ).
Il triangolo equilatero ha esattamente sei simmetrie; diamone una descri­
zione a parole. Se pensiamo il vertice A come quello «in alto», il triangolo
ha una simmetria bilaterale che scambia i lati destro e sinistro. Ciò significa
che i vertici B e C vengono scambiati (e che A non viene mosso). Se pensia­
mo C come vertice in alto, abbiamo la simmetria bilaterale che scambia A
e B lasciando fermo C. Infine, ce un’ultima simmetria bilaterale che fissa B
scambiando A e C. Abbiamo trovato fin qui tre simmetrie:

A A A

Una quarta simmetria (non illustrata in figura) è quella che fa ruotare il


triangolo in senso antiorario di 120°. Questa simmetria porta A in B, B in C e C
in A. Una quinta simmetria ruota il triangolo di 240°, e porta A in C , B ìnA eC
in B. La sesta e ultima simmetria è quella che non muove assolutamente nulla.
La classificazione dei gruppi 65

Esempio 2.5. Supponiamo che C sia la circonferenza dell’esempio 2.2.


Esattamente come per il triangolo, possiamo cogliere la geometria della cir­
conferenza osservando le distanze fra i punti: una simmetria consiste in un
riarrangiamento dei punti che conservi le loro distanze.
La circonferenza ha infinite simmetrie. Se scegliamo uno qualsiasi dei
suoi infiniti diametri, ce una simmetria bilaterale che ribalta la circonferenza
attorno a questo diametro. Tale simmetria fissa due punti diametralmente
opposti (gli estremi del diametro) e muove tutti gli altri. In questo modo si
può anche vedere che tutte queste simmetrie sono diverse: ciascuna di esse
fìssa una diversa coppia di punti.

Possiamo ottenere un secondo tipo di simmetrie (non illustrato in figu­


ra) scegliendo un qualsiasi numero A e ruotando di A0 in senso antiorario
ciascun punto della circonferenza. Se A = 90, per esempio, questa rotazio­
ne porta P{0) in P(90); P(90) in P( 180); P(180) in P(270); e P(270) in P(0).
Queste simmetrie non sono tutte distinte: una rotazione di 90° coincide
esattamente con la rotazione di —270°, per esempio. (Si noti che l’azione
fisica di prendere un disco e farlo girare di 90° è diversa da quella di farlo
ruotare di —270°. Ma qui stiamo prendendo in considerazione solo il modo
in cui vengono ridisposti i punti e non il modo in cui viene effettuato tale
riarrangiamento).
Questa lista risulta essere completa: le simmetrie bilaterali e le rotazioni
costituiscono tutte le simmetrie di C che conservano la distanza. La simme­
tria che «non fa nulla» risulta essere la rotazione di 0°.

Tenendo presente questi due esempi, possiamo ora dare una definizione
un po’ più formale di simmetria in generale.

Definizione 2.6. Si supponga che X sia un oggetto matematico. Una «sim­


metria di X» è un’applicazione cr di X in X con le seguentiproprietà:
(i) sex ex' sono elementi distinti di X, (t(x) e cr(x') sono ancb ’essi distin­
ti;
(ii) se y è un qualunque elemento di X, allora esiste un qualche elemento
x di X tale che cr(x) = y;
(iii) a conserva la struttura di X.
66 David A. Vogan Jr

Quest’ultima richiesta su a suona certamente assai vaga, perché è pensata


per poter essere applicata in molte situazioni diverse. Ma per ogni struttura
matematica che vogliamo considerare, essa assumerà un significato molto
concreto e preciso.

3. I gruppi di simmetria.

In questo paragrafo introdurremo la nozione di gruppo di simmetria, e


studieremo in modo più formale i due esempi precedenti.

Definizione 3.1. Supponiamo che X sia una struttura matematica. Il


«gruppo di simmetria di X» è la collezione 2(X) di tutte le simmetrie di X.
La «legge di composizione di gruppo» in X(X) è l’operazione di composizione
delle simmetrie: sea, ea2sono simmetrie diX, a, • ct2è la simmetria di X che
si ottiene eseguendo prima a2, poi a,. In formule:
(o-j • ct2)(x ) = a,(a2U)) (per ogni punto x di X).
Linversa di una simmetria a è la simmetria a -1, che disfa il riarrangia­
mento <r. In simboli:
o-“ '()0 = X se e solo se y = a(x) (per ogni punto x di X).
La «simmetria identità» è la simmetria l x di X che non fa nulla:
l x(x) = x (per ogni punto x di X).
D gruppo delle simmetrie di X ora possiede una sua propria struttura
matematica, i cui ingredienti sono la collezione 2(X) di tutte le simmetrie di
X; l’operazione • che compone due simmetrie; l’operazione _1 che inverte
una simmetria; e la speciale simmetria l x che non fa nulla.
Negli esempi del triangolo e della circonferenza, abbiamo già elencato
tutte le simmetrie e abbiamo anche specificato quale sia la simmetria identi­
tà. Vediamo ora come funziona l’operazione di composizione in questi due
esempi.

Esempio 3.2. Supponiamo che T sia il triangolo dell’esempio 2.1. Nel­


l’esempio 2.4 abbiamo elencato le sei simmetrie che costituiscono il gruppo
di simmetria X(T). Per descrivere la legge di composizione di gruppo • è utile
disporre di una notazione compatta per indicare le simmetrie. Scriveremo
E(BQ per la simmetria bilaterale che scambia i vertici B e C, e similmente
per le altre due simmetrie bilaterali E(AC) e EiAB). Scriveremo Ri 120) per
indicare la rotazione antioraria di 120°, R(240) per la rotazione di 240° e
Ri0) per la simmetria identità.
La tabella la) presenta una «tavola di moltiplicazione» che mostra come
La classificazione dei gruppi 67

comporre due qualsiasi simmetrie del triangolo. Per ottenere uno dei valori
della tavola si deve prima applicare la corrispondente simmetria nella riga in
alto, poi quella della prima colonna. Ho aggiunto due linee nel centro della
tavola, che la dividono in quattro tavole più piccole: ne vedremo il significato
nel paragrafo 8.
A una prima occhiata sembra difficile cogliere alcunché di interessante
in questa tavola, ma al di là delle apparenze vi si possono leggere parecchie
informazioni interessanti. In primo luogo, ci dice che per trovare l’inversa
di una simmetria cr della prima riga, basta cercare nella colonna sottostante
dove si trovi un Ri0). Questo valore ci dice quale simmetria debba venir
composta con <r per disfare i suoi effetti. Per esempio, scorrendo la colonna
di R(240), troviamo un R(0) nella riga che corrisponde a R(120). Ciò signi­
fica che R(120) • R(240) = R(0), come dire che R(120) inverte R(240). La
tabella 1b) presenta invece una lista completa di inverse.
Una peculiarità assai importante di questa tavola (che la distingue dalle
usuali tavole di addizione e moltiplicazione dei numeri interi) è che non
risulta simmetrica rispetto alla diagonale principale: (t1 • cr2 non è necessa­
riamente uguale a <r2 ■CTj. Per esempio

EiAB) • EiBO = R(120), EiBQ ■EiAB) = Ri240).

E questo significa che la composizione di simmetrie non gode necessaria­


mente della proprietà commutativa.

Tabella 1.
a) Legge di composizione di gruppo per le simmetrie del triangolo.
b) Inverse delle simmetrìe di rotazione del triangolo.

a)
RIO) RÌ120) Ri240) EiBO EiAB) EiAO
Ri 0) R( 0) R(120) RÌ240) EiBO EiAB) EiAO
R(120) R(120) R(240) Ri 0) EiAB) EiAO EiBO
R(240) R(240) R(0) R(120) EiAO EiBO EiAB)
E(BO EiBO EiAO EiAB) Ri 0) RÌ240) RÌ120)
E(AB) E(AB) E(BO EiAO RÌ120) Ri 0) RÌ240)
E(AO EiAO EiAB) EiBO Ri240) R(120) Ri 0)

b)

simmetria 1 R( 0) RÌ120) Ri240) EiBQ EiAB) EiAO


inversa 1 K(0) RÌ240) RH20) EiBO EiAB) EiAO
68 David A. Vogan Jr

Esempio 3.3. Supponiamo che C sia la circonferenza dell’esempio 2.2.


Per poter esprimere la regola di composizione delle sue simmetrie ci serve
una notazione ragionevole per indicarle. Per analogia con il triangolo, pos­
siamo scrivere R04) per la rotazione antioraria di A°. Otteniamo cosi tutte le
possibili rotazioni se consideriamo gli angoli compresi fra 0° e 360°.
Per le simmetrie bilaterali ci serve un po’ più di astuzia. Ricordiamo
che abbiamo indicato con P{B) il punto che si trova a B° da P(0) in senso
antiorario. Per P(B) passa uno e un solo diametro; l’altro suo estremo è
P(B + 180). Definiamo allora E{B) come la simmetria bilaterale che fissa il
diametro P(B)P(B + 180).
Possiamo ora scrivere delle formule che descrivono come entrambi i tipi
di simmetria muovono i punti della circonferenza. La prima di esse è facile: ci
dice che una rotazione antioraria diy4° porta il punto P(D), che dista D° dal
punto base, in P(A + D), che dista (A + D)° dal punto base. In formula:
(3.4) R(A)(P(D)) = P(A + D).
La seconda è un po’ più sottile:
(3.5) E(B)(P(D)) = P(2B - D).
È facile verificare che questa formula manda P{B) in P{B) (come deve,
dato che E(B) tiene fìsso P(B)). Nel caso B = 0, la formula ci dice che la
simmetria bilaterale intorno all'«equatore» orizzontale manda il punto che
si trova D° a nord dell’equatore nel punto che si trova D° a sud (vale a dire,
—D° a nord). Non mi dilungherò a spiegare perché la formula risulti corretta
anche per gli altri valori di B.
Abbiamo ormai quasi tutto quello che ci serve per scrivere una tavola
della legge di composizione del gruppo di simmetria X(C) simile a quella
dell’esempio 3.2. La difficoltà con la quale ci scontriamo sta nel fatto che il
gruppo 2 (Q è infinito, e la nostra tavola avrebbe bisogno di infinite righe
e infinite colonne. Una soluzione possibile potrebbe essere di redigere una
tavola che presenti solo i casi delle rotazioni di un numero intero di gradi
e delle simmetrie bilaterali che fissano i punti P(B) con 2B numero intero.
La cosa sarebbe matematicamente ragionevole, e l’insieme finito di simme­
trie risultante ci darebbe parecchie interessanti informazioni riguardanti la
circonferenza. Ma occorrerebbero comunque 721 righe e colonne per tale
tavola di composizione e le difficoltà pratiche non verrebbero eliminate.
Una soluzione migliore consiste nel notare che la legge di composizione
delle simmetrie della circonferenza è strettamente imparentata con l’addi­
zione dei numeri. Anche una tavola per l’addizione dei numeri interi sarebbe
infinita, ma non abbiamo bisogno di scriverla per esteso, dato che già sap­
piamo come funziona l’addizione. Scriveremo allora la tavola di X(C) in una
forma che possa utilizzare ciò che già conosciamo (tabella 2a).
La classificazione dei gruppi 69

In questa tavola, la prima riga rappresenta in effetti infinite righe, una


per ogni possibile angolo di rotazione A '. Allo stesso modo, l’ultima colonna
descrive infinite colonne, che corrispondono a tutti i diversi valori di B (che
producono ciascuno una simmetria bilaterale intorno a diversi diametri della
circonferenza).
La tabella 2b) (pensatela con infinite colonne) descrive invece le inverse
in 2 ( 0 .

4. I gruppi astratti.

Lo studio delle simmetrie ha origini geometriche, che riguardano la for­


ma e la misura di oggetti fisici. Ma le tavole delle leggi di composizione per
le simmetrie dei triangoli e delle circonferenze assomigliano più all’algebra
che alla geometria, dato che descrivono regole di manipolazione formale di
simboli che rappresentano oggetti reali.
Un’intuizione fondamentale della matematica del xrx secolo fu che le
leggi di composizione delle simmetrie potevano essere studiate indipenden­
temente dalle simmetrie stesse; problemi relativi alla geometria potevano
in questo modo essere messi in relazione con problemi di tipo algebrico.
Una delle prime formulazioni esplicite di questa visione si può trovare nel
«programma di Erlangen» che Felix Klein presentò nel 1872 (aveva allora
ventitré anni) nella sua lezione inaugurale come professore della Friedrich-
Alexanders-Universitàt di Erlangen.
Per cogliere queste idee, dobbiamo isolare alcune importanti proprietà
formali della composizione di simmetrie. Abbiamo già visto che la proprietà
commutativa, o-j • ct2 = ct2 ■o-j, in generale non sussiste. Ma alcune delle
regole dell’algebra elementare rimangono valide: è facile (quasi tautologico)

Tabella 2.
a) Legge di composizione per le simmetrie della circonferenza.
b) Inverse delle simmetrie della circonferenza.

a)
R(A) E(B)
R(A') R(A' +AÌ E(B +A72Ì
E(B') E(B' - A/2) R(2(B' - B))

b)
simmetriai 1 RIA) E(B)
inversa 1 Ri-A) E(B)
70 David A. Vogati Jr

vedere che la composizione di una simmetria con la simmetria identità non


la modifica. Formalmente:
(4.1.tf) ct-1y = 1 x -ct = ct (per ogni ct in 2(X)).
È facile vedere anche che dalla definizione 2.3 segue che
(4.1.&) ct • ct-1 = 1* = ct-1 • ct (per ogni ct in 2(X)).
La composizione ha anche una proprietà più sottile. Siano ct,, <j2e ct}
tre simmetrie di X. Possiamo comporre le prime due, ottenendo una nuova
simmetria ct, • ct2, e possiamo poi comporre questa nuova simmetria con o\,
ottenendo (ct, • ct2) • ct3. In termini di riarrangiamento degli elementi di X
ciò significa:
[(ct, • ct2) • ct3](x) = (ct, • ct2)(ctj(x )) = ct,(ct2(ct3(x ))).
Alternativamente, possiamo comporre ct, con la composizione ct2 • ct},
ottenendo ct, • (ct2 • ct3). In termini di riarrangiamento degli clementi di X ciò
significa:
[ct, • (ct2 • ct3)](x) = ct,((ct2 • CTj)(x)) = ct,(ct2(ct3(x ))).
In altre parole, questi due modi di comporre tre simmetrie significano
esattamente la stessa cosa; la composizione gode della «proprietà associa­
tiva»:
(4.1.c) (ct, • ct2) • ct3 = ct, • (ct2 • ct3) (per ogni ct,, ct2 e ct3 in X(X)).
Le tre proprietà (4.1) risultano essere quelle che caratterizzano i gruppi
di simmetria. In termini più formali:

Teorema 42. Sia X un insieme dotato di una legge di composizione • che


soddisfi le proprietà (4.1). Esiste una struttura matematica X il cui gruppo di
simmetria è esattamente X.

La discussione che abbiamo condotto fino a qui fa sembrare quasi ma­


gico questo teorema: cominciando con alcune tavole non molto divertenti,
come quelle dell’esempio 3.2, si arriva a generare oggetti geometrici dotati di
complesse simmetrie che sono espresse completamente dalle tavole. Questo
almeno sembra a prima vista il contenuto del teorema. La dimostrazione
più facile che se ne può dare (la vedremo nel paragrafo 7) ha tutta l’aria di
un trucco da prestigiatori. La «struttura matematica» X che la dimostra­
zione produce non è un oggetto della geometria euclidea, ma una struttura
algebrica molto simile a 2 stesso. (La definizione 3.1 ci fornisce un gruppo
di simmetria per qualunque struttura matematica, e le strutture algebriche
funzionano altrettanto bene di quelle geometriche).
Ma, a dispetto di questa avvertenza, voglio ripetere che l’impressione
La classificazione dei gruppi 71

di magia che aleggia sul teorema 4.2 è un’impressione corretta, e per tutta
una serie di motivi. Tanto per cominciare, è davvero possibile trovare un’in­
credibile varietà di gruppi che rappresentano le simmetrie di oggetti della
geometria euclidea. Inoltre, è una bella cosa che l’intuizione sia in intima
relazione con tutti i gruppi che possiamo considerare.
Dopo aver presentato questo teorema che ci dice che vale la pena di
considerare i gruppi astratti, dovremo ora definire di cosa si tratta.

Definizione 4.3. Un «gruppo» è un insieme G in cui è definita una Ugge


di composizione \che soddisfa Leseguenti condizioni:
c h i u s u r a : Se gxe g2appartengono aG ,g 1• g2appartiene a G.

i d e n t i t à : Esiste un elemento 1 in G che ha la proprietà seguente:

1 ' g = g ' 1 = g P& ogni g in G.


i n v e r s i : Per ognig in G c’è un elemento g~xin G tale che

g-g~' = g~' 'g = 1.


ASSOCIATI VITA: Per ogni terna di elementi gv g2c g} di G, si ha:
tei • = &i ' te2 ’ &■

Lo scopo che ci prefìggiamo è capire, per quanto possibile, come siano


fatti i gruppi. In altre parole, vorremmo riuscire a compilare un elenco che
contenga tutti i possibili gruppi: è questo il significato che diamo all’espres­
sione «classificazione dei gruppi». Ma perché tale problema sia sensato,
dobbiamo sapere che cosa voglia dire che due gruppi sono lo stesso. Ecco
una definizione: un isomorfismo fra un gruppo G e un gruppo H è un’ap­
plicazione
j : G —+H
che gode delle seguenti proprietà:
(i) se g e g' sono elementi distinti di Gtj(g) ej[g') sono distinti in H\
(ii) se h è un qualunque elemento di H, esiste un elemento g di G tale che
Jig) = h\
(iii) per ogni g, e g2in G, abbiamo/gj • g2) = jlg x) *fig2)•

Questa definizione assomiglia parecchio a quella di simmetria data nella


definizione 2.6. Non si tratta di un’impressione sbagliata: l’aria di famiglia è
reale, e cercare di capirla meglio è fondamentale per classificare i gruppi.

5. I sottogruppi.

D gruppo di simmetria di un oggetto matematico dipende da quale strut­


tura scegliamo di prendere in considerazione. Parlando in modo appros­
72 David A. Vogan Jr

simato e superficiale possiamo dire che le persone hanno una simmetria


bilaterale. Ma non appena prendiamo in considerazione gli organi interni,
ecco che questa simmetria bilaterale scompare.
Fenomeni simili awengono in tutti i campi della matematica. Abbiamo
parlato delle sei simmetrie del triangolo equilatero, ciascuna delle quali con­
serva la distanza d fra i punti del triangolo. Avremmo potuto scrivere
2(T, d) = [R(0), R(120), £(240), E(BC), E(AB), E(AC)}
per sottolineare che questo è il gruppo delle simmetrie, rispetto alla struttura
indotta dalla distanza d. Ma c’è un’altra struttura geometrica che avremmo
potuto considerare: quella indotta dal «senso antiorario». I vertici (A, B,C)
(presi in quest’ordine) sono disposti in senso antiorario, cosi come (B, C, A)
e (C, A, B). Ma i vertici {A, C, B) sono disposti in senso orario. Se cerchiamo
le simmetrie del triangolo che conservano la nozione di disposizione in senso
antiorario, troviamo solo le tre rotazioni R(0), R(120) e R(240). Indicando
con a la struttura «antioraria» di T, otteniamo:
(5.1) 1(T, (d, a)) = IR(0), R( 120), R(240)}.
Se S' e S sono due strutture matematiche sullo stesso insieme X , diremo
che S'è un raffinamento di S seS'comprende tutto ciò che ha S. Per esempio,
la struttura «distanza e senso antiorario» che abbiamo or ora considerato
sul triangolo è un raffinamento della struttura «distanza». Tutte le volte che
raffiniamo una struttura matematica, la collezione di simmetrie o si restrin­
gerà o rimarrà la stessa. La versione astratta di questa idea è contenuta nel
concetto di sottogruppo.

Definizione 5.2. Sia G un gruppo (definizione 4.Ò). Un «sottogruppo» di


G è un sottoinsieme H C G con le seguenti proprietà:

c h iu s u r a : Se hxe h2appartengono a H, allora bx* h2appartiene a H.


id e n t it à : Ilelemento identità 1 di G appartiene a H.
i n v e r s i : Per ogni h in H, il suo inverso h~xappartiene a H.

Teorema 5.3. Sia X un oggetto matematico dotato di una qualche struttura


S. Indichiamo con 2(X, S) il gruppo di simmetria diX rispetto alla struttura S.
Se 5' è un raffinamento di S (ovvero, S' aggiunge struttura a S), allora
2(X, S’) è un sottogruppo diX{X, S).
Inversamente, sia H un qualunque sottogruppo di X(X, S). Esiste un qual­
che raffinamento S' della struttura S tale che 2(X, 5') sia uguale a H.

Esempio 5.4. Presentiamo alcuni raffinamenti della struttura indotta


dalla distanza sulla circonferenza e i corrispondenti sottogruppi di 2(C). In
primo luogo la nozione di «senso antiorario» ha senso sulla circonferenza:
La classificazione dei gruppi 73

dati tre punti distinti qualunque P, Q e R, possiamo dire se sono disposti


in senso antiorario o no. Questa nozione è conservata dalle rotazioni, ma è
invertita dalle simmetrie bilaterali. Di conseguenza,
£(C, (d, a)) = (RU), per ogni angolo A).
Sarebbe facile verificare, utilizzando le tavole di composizione e di cal­
colo dell’inverso dell’esempio 3.3, che si tratta di un sottogruppo di 2 (Q .
Ma la verifica non è necessaria, grazie al teorema 5.3.

Se fissiamo sulla circonferenza un diametro privilegiato - per esem­


pio quello che passa per P(B) e P(B + 180) -, ci sono quattro simmetrie:
quella bilaterale E{B), che ribalta la circonferenza intorno al diametro
(è mostrata nella figura con le frecce non tratteggiate); quella bilaterale
E{B + 90) intorno al diametro perpendicolare al diametro fissato (nella
figura, quella con le frecce tratteggiate); e le due rotazioni di 0° e 180°.
Possiamo scrivere:
(5.5) 2(C, (diametro)) = (R(0), R(180), E(B), E(B + 90)}.
Più in generale, per ogni intero positivo n, possiamo decorare la nostra
circonferenza fissando i vertici di un poligono regolare con n lati: saranno
i punti
P(B), P(B + 360/«), P(B + 2 • 360/»),..., P(B + (n - 1) • 360/*),
dove la collocazione di B (uno dei vertici) è scelta arbitrariamente. Fissare
un diametro corrisponde al caso n = 2: potrà anche sembrare innaturale
parlare di un segmento come di un poligono regolare con due lati, ma per
un matematico la considerazione di casi «degeneri» come questo è quasi una
seconda natura.
74 David A. Vogan J r

In figura è illustrato il caso » = 5. Abbiamo disegnato i lati del pentagono


corrispondente per facilitare la visualizzazione e la discussione, anche se non
fanno parte della circonferenza cosi «decorata».
La circonferenza decorata con » punti posti a ugual distanza ha esatta­
mente » simmetrie bilaterali:
E(B), E(B + 180/»), E(B + 2 • 180/»)......£(B + (« - 1) • 180/»).
La prima è la simmetria bilaterale intorno al diametro che passa per il primo
vertice; la seconda è quella intorno al diametro che biseca il primo lato; e
cosi via. Possiamo fermarci quando arriviamo a metà strada, perché se con­
tinuassimo la lista comincerebbe a ripetersi. Nel caso « = 5, per esempio,
il diametro che passa per il quarto vertice è lo stesso diametro che biseca il
primo lato.
Similmente, la circonferenza decorata ha « simmetrie rotazionali:
R(0),R(36Q/»),R(2 -360/»), ...,R((» - 1) ■360/»).
In tutto, il gruppo delle simmetrie ha 2» elementi:
2(C, (» punti equidistanti)) = {» simmetrie bilaterali e » rotazioni).
Il gruppo di simmetria di una circonferenza decorata con « punti equidi­
stanti è chiamato «gruppo diedrale di ordine 2n» e viene in genere indicato
con il simbolo Dn (ma si ricordi che ha 2» elementi). Il nome deriva dal greco
(«con due facce»), e si riferisce al fatto che è possibile ribaltare il poligono,
oltre che ruotarlo. Il terzo gruppo diedrale D} è isomorfo al gruppo delle
simmetrie del triangolo. Geometricamente, è abbastanza facile crederci: se
A, B, e C sono punti posti a ugual distanza su una circonferenza, allora qua­
lunque loro riarrangiamento che conservi le loro distanze può essere esteso
a un riarrangiamento che conservi la distanza su tutto il triangolo o su tutta
la circonferenza. Con lo stesso ragionamento si vede che, se « ^ 3, allora
2(C, (» punti equidistanti)) — 2(»-gono regolare),
dove il simbolo — significa «è isomorfo a», nel senso della definizione 4.3.
Abbiamo visto un certo numero di esempi speciali di sottogruppi di
un gruppo di simmetria che derivano da raffinamenti della struttura ma­
tematica. Vediamo ora una classe di esempi particolarmente importante e
generale.

Definizione 5.6. Supponiamo che X sia una struttura matematica avente


gruppo di simmetria 2(X); sia Y un sottoinsieme qualsiasi di X. Lo «stabi­
lizzatore» di Y è la collezione di tutte le simmetrie di X che conservano il
sottoinsieme Y. In simboli:
X(X)y = {tutte le ct in 2(X) tali che ct( Y) = Y).
La classificazione dd gruppi 75

Z(X)y risulta automaticamente un sottogruppo di 2(X). Se Y consiste di un


solo elemento x, scriveremo
2(X)x = {tutte le ctin 2(X) tali che cr(x) = x);
2(X)xviene detto il «sottogruppo di isotropia associato a x».
Il sottogruppo stabilizzatore è in realtà un tipo speciale di sottogruppo
«da raffinamento di simmetria». Una maniera di vederlo è quella di consi­
derare un’ulteriore struttura su X, in cui gli clementi di Y siano considerati
come speciali. Allora 2(X)y è esattamente il gruppo di simmetria per questa
struttura raffinata di X. Molti dei casi citati nell’esempio 5.4 sono di questa
forma. Dn, il gruppo diedrale, è lo stabilizzatore di un sottoinsieme Y fatto
da n punti posti a ugual distanza. In particolare, lo stabilizzatore di un punto
è il primo gruppo diedrale D ,f che consiste di due elementi:
2 (Op(B) = {E(B),R(0)}.
Nel caso del triangolo, il gruppo di isotropia di un vertice è fatto dalla sim­
metria bilaterale che scambia gli altri due vertici e dall’identità:
1(T)a = [E(BC),R(0)).
Questo gruppo è anche lo stabilizzatore del punto medio del lato BC. Se
P non è né un vertice, né il punto medio di un lato, allora non è fissato da
nessun elemento di 1(T), tranne che dall’identità:
2(T)P = (R(O)J (se P non è né un vertice né un punto medio).
Nonostante l’importanza dei sottogruppi stabilizzatori, essi non sono i soli
sottogruppi dei gruppi di simmetria. Il gruppo con tre elementi 2(7, (d, a)) di
(5.1) non è lo stabilizzatore di nessun sottoinsieme Y del triangolo.

6. Le orbite.

Per studiare le simmetrie di una struttura matematica è del tutto naturale


analizzare le simmetrie di vari raffinamenti di quella struttura, che danno
luogo a gruppi più piccoli. In termini di gruppi astratti, questo significa che
si può ragionevolmente studiare un gruppo studiando i suoi sottogruppi.
Vogliamo rovesciare questa logica: partiremo da un gruppo di simmetria G
di un qualche oggetto matematico X e da un sottogruppo astratto di G per
arrivare a vedere come il sottogruppo ci aiuti a studiare X. Cominciamo col
dare una definizione generale.

Definizione 6.1. Supponiamo che G sia il gruppo di simmetria di un ogget­


to matematico X (definizione 2.Ò), e che H sia un suo sottogruppo (definizione
5.2). Sia x un elemento di X. Dato che H è una collezione di riarrangiamenti
76 David A. Voganjr

degli elementi di X, ogni elemento di H manda x in qualche nuovo elemento


y ~ h(x) in X. U«orbita di x per l’azione di H» (in simboli H • x) consiste di
tutti questi elementiy di X. In formule:
H • x = {tutti gli elementi dellaforma h{x) per qualche h in H).
Dato H, ogni elemento di X appartiene a una e una sola orbita, né più, né
meno; il che è come dire che, sey è un elemento di H • x, allora H • y = H • x.
In matematica, si usa parlare di «partizione» per indicare la decomposizione
di un insieme in sottoinsiemi che non hanno elementi in comune.
Considerare la collezione delle orbite per l’azione del sottogruppo H
come un nuovo oggetto matematico indipendente si rivela estremamente
utile. Scriveremo:
H\X= {orbite di H in X}
= {tutti i sottoinsiemi di X della forma H • x per qualche x in X}.

Questa espressione simbolica si legge come «X modulo H», ma a noi basterà


parlare semplicemente di insieme delle orbite di H in X.
Si può intendere meglio questa definizione studiando un esempio.

Esempio 6.2. Sia Cla circonferenza degli esempi 2.2 e 3.3; B un angolo
fissato e H il sottogruppo con due elementi H = {R(0), E(B)}.
Ricordiamo che E{B) è la simmetria bilaterale intorno al diametro P(B)P(B
+ 180), e che H è il sottogruppo che stabilizza il punto P(B). Abbiamo scritto
in precedenza (cfr. 3.5) una formula che descrive in che modo E{B) trasforma
il punto P(D):
E(B)(P(D)) = P(2B - D).
Da questa formula e dalla definizione di orbita (6.1) sembra risultare subito
che ogni orbita di H è fatta di due punti:
H-P(D) = {P(D),P(2B-D)}.
La formula è corretta, ma non dice che ogni orbita abbia esattamente due
punti. Infatti non sempre i punti P(D) e P(22B - D) sono distinti.
La classificazione dei gruppi 77

Ogni orbita di H contiene esattamente un elemento P(D) che giace al di


sotto del diametro P{B)P(B + 180). Seguendo il linguaggio della definizione
6.1, ciò permette di identificare H\Ccon la semicirconferenza che va da P(B)
a P(B + 180), estremi inclusi. Possiamo pensare a H\C come se la circonfe­
renza fosse stata «ripiegata» lungo le H-orbite.

L’insieme delle orbite H\C

NeU’esempio precedente l’azione del sottogruppo H crea una partizione


della circonferenza in orbite, ciascuna delle quali è costituita di uno o due
punti (caso generale). Ricordiamo però che il nostro scopo finale è quello di
capire la struttura deU’intero gruppo di simmetria, in questo caso il gruppo di
tutte le simmetrie della circonferenza. Se teniamo presente questo obiettivo,
le orbite di H presentano un inconveniente: una rotazione della circonferen­
za non porta un’orbita di H su un’altra orbita di H. Per esempio, una rota­
zione di 90° porta il punto P(B) (che di per sé è già un’orbita) in un elemento
dell’orbita costituita da due punti {P(B + 90), P(B —90)}. La circonferenza
C possedeva fra le sue simmetrie la rotazione di 90°; ma questa simmetria
non viene ereditata da H\C. Questo difetto rende difficile utilizzare H\C
per comprendere tutte le simmetrie della circonferenza. Qualche traccia
di questo inconveniente si ritrova anche nel disegno che abbiamo fatto
dell’insieme delle orbite H\C: le sole simmetrie che questo insieme eredita
dalla circonferenza sono l’identità R{0) e la simmetria bilaterale E(B + 90)
(che ribalta la semicirconferenza intorno al suo punto medio).
Presentiamo allora un esempio leggermente diverso, in cui questo incon­
veniente viene superato.

Esempio 6.3. Sia Cla circonferenza degli esempi 22 e 3.3; sia N il sotto­
gruppo costituito dall’identità e dalla rotazione di 180°: N = {R(0), R(180)}.
Come gruppo astratto, N è isomorfo al sottogruppo H con due elementi
dell’esempio 6.2, ma le due simmetrie E(B) e R(180) sono completamente
differenti. Ogni orbita di N consiste di un punto e del suo punto diametral­
mente opposto:
N ■P(D) = iP(D), P(D + 180)}.
Come nell’esempio 6.2, le orbite di N determinano una partizione di C.
Ciò che è diverso in questo esempio è il fatto che il gruppo completo delle
78 David A. Vogan Jr

simmetrie rispetta questa partizione: seg è una simmetria di C, allora g porta


una coppia di punti diametralmente opposti in un’altra coppia con la stessa
proprietà. Per esempio, la rotazione di 15° porta {P(D), P(D + 180)} in
(P(D+15),P((D+15) + 180)}.
R

Ecco un modo per visualizzare le orbite di N. Pensiamo alla circonferen­


za come se fosse un cappio di corda lungo 2tt = 6,283185... (ricordiamo

o
che il raggio era lungo 1; la circonferenza di conseguenza è 2tt • 1). Ora ri­
pieghiamo la corda su se stessa, in modo da fare una doppia circonferenza di
raggio j . Ogni punto della corda giacerà accanto al punto che inizialmente
gli era diametralmente opposto.

IQ.Q')

P'ì

(5.5')

L’insieme delle orbite N\C

Il disegno ci indica che l’insieme delle orbite N\C può venir visto come
una nuova circonferenza, di raggio pari a metà di quello di C. Ogni simmetria
di C deriva da una simmetria di N\C. Per esempio, la simmetria bilaterale
di C intorno al diametro QQ ' (che porta P in R, 5' in S e P' in R\ nella figu­
ra qui sopra) deriva dalla simmetria bilaterale di N\C rispetto al diametro
[Q, Q'){StS'ì (che porta {P, P'} in {R, R'}).

L’esempio precedente era inteso a illustrare il processo con cui si può


smontare un gruppo di simmetria in pezzi più semplici. Qui le simmetrie del­
la circonferenza C, quella più grande, sono state divise in due pezzi: il gruppo
delle simmetrie di N\C, la circonferenza più piccola, e il gruppo delle simme­
trie delle orbite con due elementi come {P, P '}. In questo esempio il gruppo
delle simmetrie di N\Cha esattamente lo stesso aspetto di quello di C, e non
La classificazione dei gruppi 79

si capisce bene se con questo processo siamo riusciti a semplificare qualcosa.


Forniremo ora un esempio in cui c’è veramente una semplificazione.

Esempio 6.4. Sia X la figura geometrica composta da un triangolo T (di


vertici A, BeC)e da un quadrato S (di vertici M, N,PeQ). Immaginiamo che
il quadrato e il triangolo non siano collegati l’un l’altro: potremo cosi accettare
che X fra le sue simmetrie possieda la rotazione del triangolo di 120° che lascia
fermo il quadrato, anche se una tale rotazione modifica la distanza fra A e M.
Per essere completamente espliciti, vogliamo accettare come simmetrie di X
tutte le coppie (oj, ct2), dove a. è una simmetria di T(che lascia immutato S),
e< j 2è una simmetria di S (che lascia immutato T). Siccome ci sono sei possi­
bili simmetrie del triangolo T (come abbiamo visto nell’esempio 2.4) e otto
possibili simmetrie del quadrato S (le quali formano il gruppo diedrale D4: si
veda l’esempio 5.4), abbiamo complessivamente 48 simmetrie di X.
Sarà conveniente per la discussione dare un nome ai punti medi dei lati
di T: indicheremo con a il punto medio del lato BC (opposto al vertice A), e
analogamente per gli altri lati.
Vogliamo studiare ii sottogruppo N = {simmetrie del triangolo T}. Come
gruppo astratto, N non è altro che il gruppo 2(71 descritto nell’esempio
3.2. Nella figura seguente sono illustrate alcune orbite di N. Proprio come
nelle illustrazioni degli esempi 6.2 e 6.3, le orbite possono venir realizzate
connettendo le linee tratteggiate. In questo caso, però, un’orbita può avere
più di due punti.
m 9-------- 9n
A

Orbite di N su X

Ecco invece raffigurato lo spazio delle orbite NVX come nella figura del­
l’esempio 6.3. Anche in questo caso può essere utile pensare al triangolo
come fatto da un cappio di corda lungo tre unità.
Af

\A,B,C\•-- •— • Ub.c)

P Q
L'insieme delle orbite N\X
80 David A. Voganjr

È possibile piegare la corda esattamente lungo le orbite del gruppo di


simmetria. Anche se si fa prima a farlo che a dirlo, proverò a spiegare come.
Cominciamo col ripiegare C su B, lasciando A fisso. Poi ripieghiamo A su B.
A questo punto ci ritroviamo con una piccola «v», coricata su uno dei suoi
lati, che ha il vertice in B\il lato superiore che va da B a c ha quattro fili e
quello inferiore, da B ad a, ne ha due. Infine, pieghiamo c su a. Il risultato
è un fascetto di corda lungo un mezzo. In uno dei due estremi ci sono i tre
vertici originari, AyBcC\ dall’altra parte i tre punti medi a,bec. In tutti gli
altri punti il fascio ha sei fili: le altre orbite sono costituite da sei punti. D ’al­
tra parte, l’azione delle simmetrie di T non tocca in nessun modo il quadrato
S: ogni orbita di N su S si riduce a un solo punto e l’insieme delle orbite ha
esattamente lo stesso aspetto di S.
La figura ci mostra che gli elementi di N agiscono su X essenzialmente
come simmetrie del triangolo; l’insieme delle orbite N\X eredita da X le sim­
metrie del quadrato. In questo modo il gruppo completo delle simmetrie di
X (che ha 48 elementi) viene smontato nel gruppo delle simmetrie del trian­
golo (6 elementi) e in quello delle simmetrie del quadrato (8 elementi).

7. Le classi laterali e la dimostrazione del teorema 4.2.

Il nostro prossimo obiettivo è sviluppare in generale il procedimento che


abbiamo illustrato nell’ultimo paragrafo: utilizzare certi sottogruppi speciali
di un gruppo di simmetria per spezzare il gruppo in pezzi più semplici. Tut­
tavia dovremo prima predisporre alcuni strumenti tecnici per raggiungere
questo obiettivo; lo faremo in questo paragrafo, fornendo al tempo stesso
una dimostrazione del teorema 4.2, che afferma che ogni gruppo astratto è
il gruppo delle simmetrie di una qualche struttura matematica.

Dimostrazione del teorema 4.2. Sia G un gruppo astratto. Vogliamo tro­


vare una struttura matematica X di cui G sia il gruppo di simmetria. Ma
conosciamo una sola struttura matematica collegata con G, ed è la sua
struttura di gruppo; sembrerebbe a prima vista che non abbiamo altra
scelta, se non quella di definire X = G. Facendo cosi, per descrivere il
gruppo delle simmetrie di G dobbiamo specificare che cosa intendiamo
con «simmetrie» di G, e di nuovo sembra esserci una sola scelta: le simme­
trie della struttura di gruppo sono gli isomorfismi da G in G (definizione
4.3). Questo gruppo di simmetria è detto il «gruppo degli automorfismi
di G»:

Aut(G) = {isomorfismi j : G -» G}
= {bigezioni j : G -> G I j(gxg2) = j(gx)j(g2)ì-
La classificazione dei gruppi 81

Tra G e Aut(G) sussiste un’elegante relazione. Ogni elemento | £ G


definisce un automorfismo j di G, tramite la formula j g(x) = gxg~{.
In molti casi interessanti (fra cui quello del gruppo delle simmetrie del
triangolo dell’esempio 3.2), questa formula definisce un isomorfismo fra G
e Aut(G). Ma ci sono due cose che possono andar storte. In primo luogo,
l’automorfismo j g può essere quello banale (/^(x) = x, per tutti gli x di G)
anche se g non è l’identità (è quello che succede nel gruppo di isometrie
della circonferenza dell’esempio 3.3 con la rotazione di 180°, g = R(180)).
In secondo luogo, ci possono essere degli automorfismi di G che non sono
esprimibili nella forma j g per nessun g E G (è quello che succede nel sot­
togruppo «del senso antiorario» che conserva le simmetrie del triangolo,
descritto in (5.1). Per questo sottogruppo, tutti gli automorfismi del tipo j g
sono banali, e tuttavia esiste un automorfismo non banale, quello che scam­
bia R( 120) e R(240)).
Per quanto importante sia la relazione fra G e Aut(G), essa non sempre
fornisce un modo di rappresentare G come gruppo delle simmetrie di una
struttura matematica. Possiamo invece cercare di interpretare G più geo­
metricamente, nel senso etimologico della parola: misura di distanze. In
altre parole vogliamo introdurre una nozione di «distanza» sul gruppo G, in
modo tale da ottenere che il gruppo dei riarrangiamenti di G che conservano
tale distanza sia proprio G. Anche se spesso pensiamo a distanze espresse
da numeri reali, abbiamo dimestichezza con altri modi per misurare la sepa­
razione. Quando diciamo che una squadra di pallacanestro è «sotto di due
tiri da tre», stiamo misurando la separazione in un modo molto diverso da
quando diciamo che Roma dista 1107 chilometri da Parigi. E quando dicia­
mo che un cavallo ha vinto la corsa «per un’incollatura» stiamo parlando di
una separazione fisica, ma misurata in modo radicalmente diverso.
Per misurare la separazione degli elementi del nostro gruppo G, useremo
elementi di G stesso. Diremo che la «separazione» fra due elementi x, e x2
del gruppo è l’elemento x,xj! :
(7.1) j ( x , , x 2 ) = X j X j 1.

Se x, è uguale a x2, la loro separazione è data dall’elemento identità


1G = XjXj-1. Se R(A) e R(B) sono due rotazioni della circonferenza, la loro
separazione è R(A — B), la rotazione di angolo A —B. Usando questa no­
zione di separazione per introdurre una geometria nel gruppo G, possiamo
considerare il gruppo
(7.2) 2(G, s) = {applicazioni a : G —►G tali che j(o-(x,), tr(x2)) = j( x ,, x2)}.
Mostreremo che questo gruppo di simmetria è uguale a G. Per ogni
g S G, definiamo l’applicazione di G data dalla moltiplicazione a destra
per g~* : pg(x) = xg~l (moltiplichiamo per l’inversa per una ragione tecnica
82 David A. Vogan Jr

che spiegheremo fra un attimo). Dico che è una simmetria di G, ovvero che
appartiene a X(G, s). Vediamo perché. Se x, e x2sono in G, allora

*(pt (*i).Pj(*2)) = Pg^i)tP4^ 2 ^ _1


= ( w 'K x t f 'r 1
= (x^-'Kgx?]

= X,XJ* = j(x p x2).


La terza uguaglianza usa il fatto che, in un qualsiasi gruppo, (x^)-1 = y~l x-1:
per disfare l’effetto di cosa si ottiene facendo prima agire y e poi x, bisogna
prima disfare x e poi y. Abbiamo appena dimostrato che la «traslazione de­
stra» pgappartiene a 2(G, s). Siccome muove l’elemento g nell’identità, si
vede che pgpuò essere la simmetria identica solo se g coincide con l’identità.
È poi molto facile verificare che il prodotto di p^ e p& è uguale a pg fa (è per
questa ragione che abbiamo usato l’inverso di g nella definizione di e non
g stesso; in questo secondo caso, infatti, il prodotto delle traslazioni sarebbe
risultato uguale a p^,).
Per dimostrare che l’applicazione che associa g a p^ è un isomorfismo
tra G e 1{G, s) (e completare così la dimostrazione del teorema 4.2), rimane
solo da mostrare che qualunque simmetria di 2 dev’essere uguale a qualche
p^. Supponiamo dunque che ct : G —> G sia una simmetria che conserva la
separazione s. Sia g l’elemento di G che viene mandato nell’elemento iden­
tità: <j(g) = 1c. Dimostreremo che ct = p^. Sia x G G; vogliamo dimostrare
che ct(x) = xg_I. Di ct sappiamo due cose: che conserva la separazione, e che
applica g in l c. Sia ct(x) = y. La separazione di x da g è definita da
s(x,g) = xg~l.
La separazione di y = ct(x) da 1G = cr(g) è
s((T(x),<r(g)) = j(>,1g ) = yì~Q = y = <r(x).
Siccome ct conserva la separazione, questi due elementi devono essere ugua­
li: ct(x) = xg~l. Di conseguenza ct = p^, come volevamo mostrare.

Sarà utile enunciare con precisione la versione del teorema 4.2 che ab­
biamo appena stabilito.

Teorema 7.3. Sia G un gruppo. Definiamo la separazione s di due elementi


di G come s{gv g2) = gjgJ1, e indichiamo con 2(G, s) il gruppo di simmetria
La classificazione dei gruppi 83

relativo a tale struttura di separazione. Allora G è isomorfo a 2(G, s) tramite


l’applicazione che associa a ogni gG G la traslazione destra definita da
P*(*) = xg~\
Vogliamo usare questo risultato per studiare le orbite determinate dal­
l’azione di traslazione destra.

Definizione 7.4. Sia G un gruppo e H un sottogruppo di G. Facciamo


agire G su se stesso tramite la traslazione destra (definita nel teorema 7.3). Per
ogni gG G, la «classe laterale destra di H contenente g» è l’orbita di g sotto
l’azione del gruppo H:
(75.a) gH={gh-'\ beH}.
Come avviene sempre con le orbite di un’azione di gruppo, due classi laterali
di H o coincidono, o non hanno elementi in comune; di conseguenza le classi
laterali destre formano una partizione di G. Indicheremo con G/H l’insieme
delle classi laterali destre di H in G.
Il numero di classi laterali destre di H in G è detto indice di H in G. Ogni
classe laterale gH ha esattamente lo stesso numero di elementi di H. Infatti,
se associamo h con gh, ogni elemento di H corrisponde a uno e un solo ele­
mento di gH, e ogni elemento di gH può essere ottenuto in questo modo.
Se indichiamo con #04) il numero di elementi di un insieme A, possiamo
scrivere
(15.b) HgH) = #(H) per ogni g E G.
Siccome ogni elemento di G appartiene a una sola classe laterale destra
di H, possiamo trovare il numero di elementi di G sommando i numeri che
contano gli elementi di ciascuna classe laterale; ma siccome tali numeri sono
tutti uguali al numero di elementi di H, possiamo concludere che
(7.5.*) #(G) = #(H) • #(G/H).
Se G è un gruppo finito, questa equazione riguarda la moltiplicazione di nu­
meri interi. Se G è infinito, è invece possibile interpretare in maniera più astratta
questa relazione, attribuendole un significato ben preciso. Si tratta di una delle
formule più utili di tutta la matematica: ne menzioneremo due applicazioni. La
prima è un teorema molto generale, noto come teorema di Lagrange.

Teorema 7.6. Se Gè un gruppofinito eH è un suo sottogruppo, il numero


di elementi di H è un divisore del numero di elementi di G.

Abbiamo infatti #(G)/#(H) = #(G/H), l’indice H inG . Ciò vuol dire che
il numero di elementi di G diviso per il numero di elementi di H è un numero
intero, come asserisce il teorema.
84 David A. Vogan Jr

La seconda applicazione riguarda le orbite di un gruppo di simmetria.

Teorema 7.7. Sia G il gruppo delle simmetrie di un oggetto matematico X,


e sia x un elemento diX. Ricordiamo che, secondo la definizione 5.6, il sotto­
gruppo di isotropia Gxè il sottogruppo delle simmetrie chefissano il punto x.
(1) Siano gì e g2 due simmetrie di X, cioè due elementi di G. Allora
gx-x = g2' x se e solo seg{Gx = g fi^ In questo modo otteniamo una
corrispondenza biunivocafra l’orbita di x e le classi laterali destre di Gr-
G •x G/Gx; g • x —►gGx.
(2) Il numero di elementi del gruppo di simmetria G è uguale al numero
di elementi dell’orbita x moltiplicato per il numero di simmetrie che
fissano x:
#(G) = #(G • x) • #(GX).
Dimostrazione. Per quanto riguarda la prima asserzione, supponiamo
che gì ‘ x = g2 • x. Applicando la simmetria g f 1 a entrambi i membri di
questa uguaglianza otteniamo x = ( g f ^ ) ' x e, di conseguenza, l’elemento
h = g\xg2deve appartenere al gruppo di isotropia Gx. Ora,
g i’ h = gx-(gfte2) = tei • * r !>& = 1 ' & =
questo mostra che g2 appartiene alla classe laterale glGx di gp come vole­
vamo. Invertendo il ragionamento, si dimostra che se g2 appartiene a gjGx,
allora gj • x = g2 • x. E questo dimostra la prima asserzione.
Sapendo che l’orbita G • x e l’insieme delle classi laterali hanno lo stesso
numero di elementi, la seconda asserzione è una conseguenza immediata
della formula (7.5.c).

8. 7sottogruppi normali.

Nel paragrafo 6 abbiamo visto che si possono usare certi sottogruppi


speciali di un gruppo di simmetria per spezzare il gruppo in blocchi più
semplici. Discuteremo ora in termini generali e astratti come si possa rea­
lizzare questa strategia. Ciò che cerchiamo di fare è di evitare la spiacevole
situazione dell’esempio 6.2, in cui il gruppo di simmetria della circonferenza
non riusciva a trasformare tutte le orbite di un suo sottogruppo in altre or­
bite. Ci serve dunque una condizione che costringa il gruppo più grande a
conservare le orbite di quello più piccolo.

Definizione 8.1. Sia X una struttura matematica il cui gruppo di simme­


tria sia 2(X) (definizione 3.\); esia N un sottogruppo diUiX). Scriveremo N\X
La classificazione dei gruppi 85

per indicare la collezione delle orbite di N su X (definizione 6.1). Diremo che


N è un «sottogruppo normale» se, per ogni a E 2(X) e ogni n E. N esiste un
elemento n' E. N con la seguente proprietà:
(8.2) cr ■(«■x) = »'-(<T-x) (xG X).
Esempio 8.3. Nel contesto degli esempi 6.2 e 6.3, il sottogruppo N, co­
stituito dall’identità e da una rotazione di 180°, è normale. Il sottogruppo
costituito dall’identità e da una simmetria bilaterale E(B) non è normale.
È facile riformulare la definizione 8.1 nel contesto dei gruppi astratti.

Definizione 8.4. Sia G un gruppo astratto, e N un sottogruppo di G (de­


finizioni 4.3 e 5.2). Diremo che N è «normale in G» se, per ognig in G e n in
N, abbiamo
(85.a) gng~' E N.
Ecco un altro modo di dire la stessa cosa: chiediamo che per ogni g E G
e n E N ci sia un elemento »' E N con la proprietà:
(85.b) gn = n'g.
Questa seconda formulazione dovrebbe chiarire che la definizione astratta
è esattamente la stessa di quella più concreta che abbiamo dato per i gruppi
di simmetria (definizione 8.1).
Ed ecco un terzo modo di formulare la definizione, che si avvicina di più a
ciò che faremo con i sottogruppi normali. In questa versione, richiediamo che
per ogni ^ e g2in G e ogni nxe n2in N, ci sia un elemento n” in N tale che
(8.5.c) (gi«i)(g2«2) = teigì)”"-
La terza definizione rispecchia una proprietà della legge di moltiplica­
zione di G. Ecco quello che significa nel contesto delle tavole che abbiamo
presentato nell’esempio 3.2. Supponiamo di usare le classi laterali destre
di N (definizione 7.4) per organizzare la tavola: nel primo blocco di righe
disporremo tutti gli elementi di N; nel blocco successivo tutti gli elementi di
una classe laterale gjN; poi tutti gli elementi di un’altra classe laterale g2N, e
cosi via. Organizziamo le colonne nello stesso modo, cominciando con tutti
gli elementi di N, poi tutti gli elementi di g{N, e via dicendo. «Normale» si­
gnifica allora che se osserviamo un blocco di righe - una classe laterale destra
- e un blocco di colonne - un’altra classe laterale destra - allora i prodotti
corrispondenti della tavola appartengono tutti a un’unica classe laterale.

Esempio 8.6. Abbiamo adottato proprio questo schema di organiz­


zazione nella tavola dell’esempio 3.2, usando il sottogruppo N costituito
dalle rotazioni (K(0), R( 120), R(240)j. Le prime tre righe e colonne della
tavola contengono elementi di N, e le ultime tre riguardano la classe late­
86 David A. Voganjr

rale E(BC)N (che è formata dalle tre simmetrie bilaterali [E(AB), E(BC)t
E(AC)}). Se, per esempio, eseguiamo i prodotti delle prime tre righe e delle
ultime tre colonne - l’angolo superiore destro della tavola - questi appar­
tengono tutti alla stessa classe laterale E(BC)N. Lo stesso vale per tutti e
quattro i blocchi possibili, e possiamo concluderne che il sottogruppo N
delle rotazioni è normale.
Ecco un modo per riflettere su questa struttura speciale della tavola di
moltiplicazione. Riprendiamo la tavola di moltiplicazione per le simmetrie
del triangolo (esempio 3.2), e guardiamola a occhi socchiusi, come se fosse
un quadro impressionista. Il quadrante a sinistra assumerà un’apparenza
confusa, dominata dalle «R». Il quadrante destro in alto è dominato dalle
«E», come quello a sinistra in basso; e le «R» riappaiono in quello in basso a
destra. Riscriviamo la tavola «condensando» le «R» e le «E» (tabella 3).
Ciò che è stupendo rispetto a questa legge di composizione in forma
condensata è che essa è ancora una legge di gruppo: l’insieme {7Z, Sì è un
gruppo, rispetto al prodotto definito dalla tavola, il cui elemento identità è
1Z. Questa è la legge di gruppo per il gruppo della simmetria bilaterale che
abbiamo introdotto fin dal paragrafo 1.
Ci sono molti esempi, più o meno familiari, di questo tipo di leggi di
gruppo. La somma di due numeri pari è pari, la somma di un pari e un
dispari è dispari e la somma di due dispari è pari. Questo è un esempio
relativo al gruppo G = Z dei numeri interi con l’operazione di addizione. Il
sottogruppo normale in questo caso è N = 2Z, il gruppo dei multipli di 2. Ci
sono esattamente due classi laterali di N: quella identica, 2Z, costituita dagli
interi pari; e la classe 1 + 2Z in cui stanno i numeri dispari. L’addizione fra
queste classi laterali funziona allo stesso modo della legge di moltiplicazione
fra le classi laterali delle simmetrie del triangolo: nella tavola 7Z potrebbe
rappresentare i numeri pari e £ i numeri dispari.

Esempio 8.7. Vediamo ora un esempio di un sottogruppo non normale.


Sia H = {1, E(AB)}il sottogruppo con due elementi del gruppo delle simme­
trie del triangolo 2(T). Vogliamo usare le sue classi laterali per organizzare
la tavola di moltiplicazione di 2(T). Faremo dunque corrispondere le due
prime righe e le prime due colonne a l e a E(AB). Nelle due righe e colonne
successive metteremo la classe laterale R(120)H = (R(120), R(120)E04B)

Tabella 3.
Legge di composizione delle simmetrìe del triangolo in forma condensata.

n e
n n £
e £ n
La classificazione dei gruppi 87

= E(AC)\. Le ultime due righe e colonne serviranno per la classe R(240)H


= (R(240), EiBQ }. Nella tabella 4 trovate la tavola così riorganizzata. È stata
suddivisa in blocchi 2 X 2 in modo che sia più facile controllare la condizione
di normalità secondo la definizione 8.4.
Ora, la terza definizione di normalità di H richiederebbe che ciascuno dei
blocchi 2 X 2 in questa tavola di moltiplicazione fosse costituito da elementi
di un’unica classe laterale gH. Il che significa che ciascun blocco dev’essere
uguale a uno degli insiemi (R(0), E(AB)}, o (R(120), E(AC))yoppure (R(240),
EiBO). Questa condizione è soddisfatta dai tre blocchi sul lato sinistro della
tavola, ma non dai rimanenti sei. Ne dobbiamo concludere che il sottogrup­
po H non è normale in 2(T).
Non possiamo condensare questa tavola di moltiplicazione in una legge
di gruppo per la moltiplicazione delle classi laterali destre di H. La difficoltà
risiede nel fatto che la maggior parte dei blocchi della tavola non consiste di
elementi che provengano da una sola classe laterale.
La costruzione di una legge di gruppo in forma condensata che abbia­
mo fatto nell’esempio 8.6 ha senso per ogni sottogruppo normale. Ecco la
definizione precisa.

Definizione 8.8. Siano G un gruppo, N un suo sottogruppo normale e


G/N l’insieme delle classi laterali destre di N in G. Se definiamo il seguente
prodotto in G/N:
(8.9) (gìN) ■ig2N) = (gìg2)N;
questo prodotto è ben definito grazie a (8.5.c). Con questo prodotto l’insieme
G/N risulta un gruppo, detto «gruppo quoziente di G modulo il sottogruppo
N». Velemento identità di G/N è la classe laterale dell’identità di G, \ CN =
N. L’inversa della classe laterale gN èia classe g~lN.
Diremo che il gruppo G è un’estensione del sottogruppo normale N tra­
mite il gruppo quoziente G/N. In generale non è possibile ottenere una
descrizione di G completa a partire dalla conoscenza di N e di G/N, ma

Tabella 4.
Legge di composÌ2 Ìone di gruppo per le simmetrie del triangolo.

Ri 0) EiAB) R(120) E{AO R(240) EiBO


Ri 0) RIO) EiAB) R( 120) E(AO R(240) EiBO
EiAB) E(AB) R( 0) EIBO R(240) EiAO Ri 120)
R(120) R (120) E(AO R(240) E(BO Ri 0) EiAB)
E(AQ E(AO R(120) EiAB) R(0) EiBO R(240)
K(240) R(240) B(BO R(0) EiAB) Ri 120) EiAO
EiBO E(BO R(240) E(AO Ri 120) EiAB) RiO)
88 David A. Vogan Jr

possiamo pensare che G sia descritto almeno «approssimativamente» da


questi due gruppi più piccoli. Un suggerimento in questo senso ce lo dà la
formula (7.5.c):
#(G) = #(H) • #(G/H).
Per capire il processo di ricostruzione di G a partire dalla conoscenza di
N e G/N, studiamo l’esempio più semplice possibile.

Esempio 8.10. Supponiamo che G sia un gruppo che abbia come sotto­
gruppo normale un gruppo N di simmetria bilaterale; supponiamo inoltre
che il sottogruppo quoziente sia ancora un gruppo di simmetria bilaterale.
Vogliamo vedere cosa possiamo dedurre sulla legge di gruppo di G a partire
da queste informazioni. Indichiamo con n l’elemento (unico!) diverso dal­
l’identità del sottogruppo N e con g un qualche elemento di G non appar­
tenente a N. Le nostre assunzioni significano che G/N consiste di due classi
laterali destre: la classe identità, N, e una classe non identica, gN. G inoltre
deve avere quattro elementi, che sono:
(8.11) G = [l,n tgtgn\.
Che cosa sappiamo sulla tavola di moltiplicazione di G? In primo luogo
sappiamo come moltiplicare gli elementi di N: 1-1 = 1, 1 • « = « • 1 = n,
e n • ti = 1. (Si noti che questa legge è la stessa della «legge del triangolo
condensata» dell’esempio 8.6: qui 7Z è rimpiazzato da 1, e £da «). Sappiamo
anche come moltiplicare a destra ogni elemento di G con un elemento di N:
possiamo calcolare, per esempio:
(gn) • n = g •(«•//) = g • 1 = gy
usando la proprietà associativa e la tavola di moltiplicazione di N.
Moltiplicare a sinistra per elementi di N è appena più complicato. Chia­
ramente 1 • g = g. Poiché N è normale, possiamo calcolare il prodotto delle
classi laterali N egN in G/N: dovrà essere (N)(gN) = gN. A livello dei singoli
elementi, questo implica che i due elementi 1 • g e n • g debbano essere g

Tabella 5.
Legge di gruppo parziale.

1 n g g»
1 l n g gn
It n 1 gn g
g g g» } ?
g» gn g ? ?
La classificazione dei gruppi 89

e gn (in un qualche ordine). Poiché sappiamo che 1 • g = g, ne segue che


n ' g = gn> Con un ragionamento analogo si trova che n • gn = g.
Abbiamo ora riempito per tre quarti la tavola di moltiplicazione di G
(tabella 5).
Gli ultimi quattro valori riguardano il prodotto di classi laterali
(gN) • (gN). Sappiamo che il gruppo quoziente G/N è un gruppo di simme­
tria bilaterale: in questo gruppo il quadrato di ogni elemento è l’identità. Di
conseguenza igN) • igN) = N. A livelli di singoli elementi, questo significa
che i due elementi g • g e g -gn dovranno essere 1 e n, in un qualche ordine.
Ma questa volta non è possibile decidere in quale ordine. Succede, di fatto,
che sono possibili due gruppi con le proprietà che abbiamo imposte; trovate
le loro tavole di moltiplicazione nella tabella 6.
Essenzialmente, abbiamo dimostrato che ogni gruppo che sia estensione
di un gruppo di simmetria bilaterale tramite un altro gruppo di simmetria
bilaterale deve necessariamente avere l’una o l’altra di queste due tavole. In
effetti, non abbiamo provato che queste tavole definiscano dei gruppi; vale
a dire che soddisfino le proprietà (4.1). Sarebbe possibile fare questa verifica
esaminando in dettaglio le tavole stesse, ma un metodo migliore consiste
nell'osservare che abbiamo già incontrato questi due gruppi studiando i
gruppi di simmetria. Il primo di essi, il cosiddetto «gruppo di Klein» (noto
anche come Vierergruppe), è isomorfo al gruppo diedrale D2 che abbiamo
descritto nell’esempio 5.4. Corrisponde al gruppo delle simmetrie di una

Tabella 6.
a) Gruppo di Klein.
b) Gruppo di rotazione Z/4Z.

a)
1 n g gn
1 1 n g gn
n n 1 gn g
g g g» 1 rt
g» g rt 1
b)
1 n g gn
1 1 rt g gn
rt n 1 gn g
g g gn n 1
gn gn g 1 rt
90 David A. Voganjr

circonferenza con un diametro fissato; i suoi quattro elementi sono elencati


in (5.5). La tavola di moltiplicazione è parte di quella per le simmetrie della
circonferenza che abbiamo costruito nell’esempio 3.3; basta un semplice
controllo per verificare che è la stessa di quella che abbiamo dato qui sopra
per il gruppo di Klein.
Allo stesso modo, possiamo verificare che la seconda tavola di moltiplica­
zione è la stessa di quella per le simmetrie rotazionali (quelle che conservano
il senso antiorario) di quattro punti posti a ugual distanza su una circonfe­
renza. Si tratta delle rotazioni che abbiamo chiamato R(0), R(90), R(180) e
R(270); corrispondono (in quest’ordine) agli elementi indicati con 1, g, n e
gn nella tavola di moltiplicazione di Z/4Z.

Questo esempio ci fornisce un’idea di massima di quello che possiamo


venire a sapere su un gruppo G studiando un suo sottogruppo normale N
e il quoziente G/N: si possono scoprire un bel po’ di cose con pochissima
fatica e in certi casi (ma con più lavoro) si può scoprire tutto. Nel prossimo
paragrafo adotteremo il punto di vista secondo cui conoscere N e G/N non è
troppo diverso dal conoscere G, e vedremo quali conseguenze se ne possono
trarre in merito al problema di classificare i gruppi di simmetria.

9. I gruppi semplici e le serie di composizione.

Se i sottogruppi normali forniscono un modo comodo per impacchettare


un bel po’ di informazioni su un gruppo G, dobbiamo studiarli più da vicino.
Un sottogruppo normale esiste sempre, ed è il sottogruppo banale-.
N = {lcl.
costituito dal solo elemento identità. Le classi laterali destre di N sono i
singoli elementi di G:
G/N = G.
È certamente vero che possiamo sapere tutto su G se sappiamo tutto su
N = (1G) e su G/N = G. Ma è altrettanto certo che non abbiamo ottenuto
alcuna semplificazione.
Un secondo sottogruppo normale che esiste sempre è N = G. In questo
caso c’è una sola classe laterale destra, 1 • N = G, e G/N è il gruppo banale.
Di nuovo, possiamo sapere tutto su G se conosciamo N = G e G /N = {1G/N},
ma non abbiamo semplificato neanche in questo caso.
I due sottogruppi normali ( lc) e G sono detti impropri. Quel che ci
interessa sono gli altri sottogruppi normali, quelli propri. Una volta che riu­
sciamo a trovare un sottogruppo normale proprio N, possiamo offrire una
descrizione semplificata G descrivendo N e G/N. Possiamo poi ripetere il
La classificazione dei gruppi 91

processo, cercando sottogruppi normali propri di N e G/N per semplificare


le loro descrizioni. Possiamo continuare questo processo, un po’ come fanno
i chimici che dividono le molecole in molecole più semplici: prima o poi il
processo si ferma. Nel caso della chimica, termina con gli atomi: i blocchetti
che non possono essere ulteriormente suddivisi (almeno finché restiamo
nel mondo della chimica). Nel caso dei gruppi, il processo finisce quando
arriviamo a gruppi che non hanno più sottogruppi normali propri. In teoria
dei gruppi, sono questi i nostri atomi: i gruppi semplici.

Definizione 9.1. Un gruppo «semplice» è un gruppo che contiene più di


un elemento e i cui soli sottogruppi normali sono {1G) e G.

Esempio 9.2. Supponiamo che G sia un gruppo finito, e che il numero di


elementi di G sia un numero primo p (come 2,3, 5, 7, 11,. . . ). G dev’essere
per forza un gruppo semplice, ed ecco il perché. Se H è un qualsiasi sotto­
gruppo di G, il teorema di Lagrange (7.5.c) ci dice che
p = #(G) = #(H)#(G/H).
Ma un numero primo ha come divisori solo se stesso e l’unità: p = 1 • p
oppure p = p • 1. Di conseguenza il numero di elementi di H dev’essere l o p.
Se #(H) = 1, allora H = {1G} (perché ogni sottogruppo di G deve contenere
l’elemento identità 1G). Se #(H) = p = #(G), H dev’essere uguale a G. In
entrambi i casi, H non è un sottogruppo proprio di G. Se ne conclude che
G non ha sottogruppi propri (e in particolare non ha sottogruppi normali).
Dunque, G è semplice.
Non è troppo diffìcile mostrare che, a meno di isomorfismi, esiste un solo
gruppo con p elementi. Una realizzazione di questo gruppo è il gruppo delle
simmetrie della circonferenza che conservano p punti posti a egual distanza
e conservano anche la nozione di «senso antiorario». Queste simmetrie sono
le rotazioni di multipli di 360/p gradi:
(9.3) Z/pZ = (R(0),R(360/p),R(720/p), ...,R((p - 1) • 360/p)).
Abbiamo già studiato da vicino Z/2Z (che è anche il gruppo della simme­
tria bilaterale: cfr. § 1) e Z/3Z, che è il gruppo delle simmetrie del triangolo
che conservano il senso antiorario (cfr. 5.1).

Prima di studiare altri esempi di gruppi semplici, vediamo più da vicino


come i gruppi in generale possono venire smontati in gruppi semplici.

Definizione 9.4. Sia G un gruppo. Una «serie di composizione» di G è


una collezione di sottogruppi
G0 C G, C G2 C ••• C Gr
92 David A. Vogan J r

di G, con le seguentiproprietà:
(i) il sottogruppo più piccolo, G# è uguale a ( lc ); il più grande, Gr, è
uguale a G;
(ii) per ogni ifra 1 e r, G,_, è un sottogruppo normale di Gt;
(iii) per ogni i fra 1 e r, il gruppo quoziente G/G-_ l è un gruppo semplice.

I gruppi semplici {G/G,_, I 1 < / < r) sono detti fattori di composizione


della serie. Abbiamo spiegato nel paragrafo 8 come la conoscenza di N e G/N
offra una conoscenza, almeno approssimativa, di G stesso. Esattamente allo
stesso modo, la conoscenza dei fattori di composizione G /G ,_, fornisce una
conoscenza approssimata di G. Un modo di vedere la cosa è di cominciare
con il primo fattore di composizione, G, = G/Gp. Se conosciamo G ì e il
secondo fattore di composizione G JG Vallora per il paragrafo 8 conosciamo
approssimativamente anche G2. Da G2 e dal terzo fattore di composizione
Gy/G2otteniamo informazioni su G3, e cosi via.
Una cosa di G che possiamo sapere, subito e con precisione, è il numero
dei suoi elementi:
(9.5) #(G) = #(Gj/G0) •#(G2/G1) - #(Gr/Gr_,).
Vale a dire: il numero di elementi di G è uguale al prodotto dei nume­
ri di elementi dei suoi fattori di composizione, che sono gruppi semplici.
Abbiamo visto all’opera questa proprietà nell’esempio 8.10, dove abbiamo
studiato i gruppi che hanno come fattori di composizione Z/2Z e Z/2Z.
Una delle prime cose che abbiamo visto è che un tale gruppo deve avere
esattamente 2-2 = 4 elementi.

Un gruppo può avere molte serie di composizione diverse, proprio come


un numero intero può avere diverse fattorizzazioni in numeri primi:
12 = 2- 2- 3 = 3*2-2 = 2*3-2.
Se G è il gruppo di Klein dell’esempio 8.10, siamo costretti a scegliere
G0 = 1e G, = G; ma G, può essere uno qualunque dei tre sottogruppi {1, x),
con x uguale a » , g o gn. Ma, proprio come gli stessi numeri primi devono
comparire in una qualunque delle varie fattorizzazioni che possiamo fare di
un numero intero, anche gli stessi fattori di composizione devono apparire
in tutte le serie di composizione di un gruppo. Ecco l’enunciato preciso di
questo risultato.

Teorema 9.6 (Jordan-Hòlder). Ogni gruppo finito G ammette almeno


una serie di composizione:
G0 C G , C G 2 C - C Gr
La classificazione dei gruppi 93

(definizione 9.4). Inoltre, se


G' c g ; c g ; c c g ;
è seconda serie di composizione, allora si deve avere che r = se che ciascun
fattore di composizione G /G ,_ , è isomorfo a un qualchefattore di composizio­
ne G' /G' _, . 1. Più precisamente, le due successioni di gruppi semplici
(C1/G0,C2/G„...,G,/G,_1),
ig ; / g ;, g ' / c ; c ,/c ,_ ,),

sono le stesse a meno di un eventuale riordinamento.

La dimostrazione di questo teorema non è eccessivamente difficile, ma


va oltre i limiti che ci siamo imposti in questo saggio1.
Abbiamo cosi ottenuto la prima metà di una classificazione, almeno
approssimativa, dei gruppi: ogni gruppo finito è costruito a partire da
una ben definita collezione di gruppi semplici, costruendo ripetutamente
estensioni di gruppo (definizione 8.8). Per completare questa classificazio­
ne approssimativa, ci servirebbe una lista di tutti i gruppi semplici finiti.
Questa lista inizia con i gruppi dell’esempio 9.2: c’è un gruppo semplice
per ogni numero primo p. Tutti i fattori di composizione di tutti i gruppi
finiti che abbiamo incontrato sin qui sono del tipo Z/pZ. Ma di gruppi
semplici ce ne sono molti di più. Termineremo questo saggio descriven­
done uno: dapprima, in modo molto concreto ed elementare (ma diffìcile
da generalizzare); successivamente, seguendo una strada che richiede una
matematica più raffinata (ma che suggerisce un metodo per trovare molti
altri gruppi semplici).
Come si fa a dimostrare che un gruppo è semplice? La definizione è
esposta in termini negativi: si dovrebbe mostrare che non esistono suoi sot­
togruppi normali propri. Nell’esempio 9.2 lo abbiamo dimostrato facendo
vedere che non esistono nemmeno sottogruppi propri, punto e basta. L’idea
è buona, ma non la si può esportare al di fuori di questo esempio. (In effetti,
si ha che ogni gruppo finito non banale la cui cardinalità non sia un numero
primo possiede almeno un sottogruppo proprio). Per trovare altri esempi
di gruppi semplici, abbiamo bisogno di un modo per verificare che i suoi
sottogruppi non siano normali.
A questo scopo adottiamo un approccio geometrico. Ricordiamo che,
secondo la definizione 5.6, un modo per costruire un sottogruppo del grup­
po delle simmetrie di una struttura X è quello di prendere lo stabilizzatore
di un sottoinsieme Y di X. È raro che tali sottogruppi siano normali e si può

1Si veda per esempio Hall [1959].


94 David A. Vogan Jr

mostrare la loro non normalità studiando la geometria di X. Ecco un utile


teorema.

Teorema 9.7. Siano X una struttura matematica, X(X) il suo gruppo di sim­
metria e Y un qualunque sottoinsieme di X. Lo stabilizzatore (definizione 5.6)
£ (X )y è il sottogruppo contenente tutte le simmetrie di X che conservano Y.
Supponiamo che ci sia una simmetria g G 2(X) con la proprietà che g • Y
abbia uno stabilizzatore diverso da quello di Y:
KX)y * n X ) g.y.
In queste ipotesi, il sottogruppo 2(X)y non è normale in X(X).
Viceversa, si supponga che, per ogni simmetria g G X(X), il sottoinsieme
g ■Yabbia lo stessostabilizzatore di Y. Allora £(X )y è un sottogruppo normale
dil(X ).

Dimostrazione. È facile vedere che a fìssa Y se e solo se g<Jg~1fissa g • Y.


Dunque
X X )t.y = |>[I(X)y l i f 1.
La prima asserzione del teorema si può dunque esprimere con la for­
mula
£[X(X)y]*f1 * Z(X)y
e, secondo la definizione 8.4, questo significa che £ (X )y non è normale in
£(X). Rovesciando l’argomentazione, si dimostra la seconda asserzione.

Per dimostrare che un gruppo geometrico di simmetrie X(X) è semplice,


si può cercare di mostrare che:

i) se esiste un sottogruppo normale di 2(X), questo deve essere lo stabi­


lizzatore di un sottoinsieme Y C X;
ii) si può trovare una simmetria g tale che Y e g ■Y abbiano stabilizzatori
diversi.

Esempio 9.8. Uno dei più bei risultati degli Elementi di Euclide è la
classificazione dei solidi regolari. In due dimensioni, per ogni n ^ 3, c’è esat­
tamente un poligono regolare con n lati: il triangolo equilatero, il quadrato,
il pentagono, l’esagono e cosi via. Ma in tre dimensioni le possibilità sono
assai più ristrette. Non è possibile prendere un poligono regolare arbitrario
e usarlo per formare le facce di un solido regolare: soltanto il triangolo equi­
latero, il quadrato e il pentagono si prestano allo scopo. E, in tutto, ci sono
solo cinque solidi regolari: il tetraedro (le cui facce sono quattro triangoli
equilateri); il cubo (le cui facce sono sei quadrati); l’ottaedro (che ha per
La classificazione dei gruppi 95

facce otto triangoli equilateri); il dodecaedro (che ha per facce dodici penta­
goni regolari); infine, l’icosaedro (che ha per facce venti triangoli equilateri).
Ognuno di questi solidi ha un gruppo di simmetria costituito da tutte le
rotazioni dello spazio che trasformano il solido in sé. Si trova che i gruppi
di simmetria del cubo e dell’ottaedro sono esattamente lo stesso, cosi come
quelli del dodecaedro e dell’icosaedro. In questo modo si determinano tre
gruppi di simmetria: il «gruppo tetraedrale»
Tl2 = {rotazioni dello spazio che conservano un tetraedro),
il «gruppo ottaedrale»
^24 — {rotazioni dello spazio che conservano un ottaedro)
e il «gruppo icosaedrale»
^60 = {rotazioni dello spazio che conservano un icosaedro}.
Risulta che questi gruppi hanno rispettivamente 12,24 e 60 elementi. In
ogni caso il numero di elementi è uguale al numero delle facce moltiplicato
per il numero di lati di una faccia. (L’icosaedro, per esempio, ha venti facce
triangolari, dunque il gruppo ha 20 • 3 = 6 0 elementi). Questa formula è
una conseguenza del teorema 7.7. Per capirlo, sia G il gruppo di simmetria
di un solido regolare e sia x il centro di una sua faccia. L’orbita G • x è fatta
dai centri di tutte le facce, e dunque il numero di elementi di G • x è uguale
al numero delle facce. Il gruppo di isotropia Gx consiste delle simmetrie
rotazionali del solido che fissano x. Queste simmetrie sono solo le rotazioni
attorno all’asse che passa per il centro e per x aventi ampiezza pari a un
multiplo di 360/j gradi (dove s è uguale al numero di lati della faccia). Di
conseguenza il numero di elementi di Gxè uguale a s, il numero di lati di
ogni faccia.
Tutti i fattori di composizione dei gruppi T12e 0 2Asono uguali a Z/2Z o
a Z/3Z. Un bel po’ di geometria interessante si nasconde dietro queste asser­
zioni. Per esempio il gruppo di Klein è un sottogruppo normale di Tì2,eTl2
è a sua volta un sottogruppo normale di 0 24. Cercare di capire in dettaglio
queste inclusioni costituisce un ottimo esercizio.
Ma quello che qui ci interessa è il gruppo icosaedrale I ^ Si trova che
16Qnon ha sottogruppi normali propri, ed è dunque un gruppo semplice.
Non dimostreremo questa asserzione. Un modo per farlo sarebbe quello di
trovare tutti i sottogruppi di 7^, realizzarli quindi geometricamente uno per
uno e infine usare il teorema 9.7 per verificare che nessuno di loro è normale.
Facciamo un esempio per capire come funziona questa argomentazione.
Indichiamo l’icosaedro con X , di modo che 7^ = 2(X). Si può dimostrare
che ogni sottogruppo H di 7^ che abbia dieci elementi deve essere lo stabi­
lizzatore di una coppia di vertici opposti (l’icosaedro ha 12 vertici, disposti
in sei coppie opposte). Indichiamo con Y questa coppia di vertici opposti;
% David A. Vogan Jr

sappiamo dunque che H = 2(X)y. Sia ora Y' una nuova e diversa coppia di
vertici opposti (ne abbiamo a disposizione sei in tutto). Siccome le simme­
trie del gruppo icosaedrale portano vertici in vertici, possiamo trovare un
elemento tale che g • Y = Y'. È facilissimo vedere che i gruppi £ (X )y
e £(X )r non sono lo stesso: il primo contiene una rotazione di 72° intorno
all’asse che passa per i vertici della coppia Y, mentre il secondo non ce l’ha.
Il teorema 9.7 ci assicura allora che il sottogruppo H non è normale.

Ciò che l’esempio precedente vorrebbe mettere in luce è che i gruppi di


simmetria complicati possono avere sottogruppi normali solo in condizio­
ni molto speciali. L’inclusione del gruppo di Klein nel gruppo tetraedrale,
o l’inclusione del gruppo tetraedrale nel gruppo ottaedrale (che risultano
sottogruppi normali) sono fenomeni esotici. E molto più tipico il caso del
sottogruppo del gruppo icosaedrale che stabilizza due vertici opposti, la cui
non normalità è quasi ovvia.
La ricerca di gruppi semplici sembra dunque rinviare alla ricerca di
simmetrie geometriche complicate. La cosa stupefacente è che sono stati
classificati tutti i gruppi semplici possibili, e che i tipi di simmetrie necessari
a realizzarli sono piuttosto limitati. Non proverò nemmeno a dire qualcosa
di serio a proposito di questo risultato2. Mi limiterò a fornire un’altra rea­
lizzazione del gruppo icosaedrale, indicando dove esso si collochi nella lista
completa di tutti i gruppi semplici finiti.

Esempio 9.9. Fissiamo un numero primo p. Nell’esempio 9.2 abbiamo


visto il gruppo Z/pZ con l’operazione di addizione; c’è anche una moltiplica­
zione in Z/pZ. Usando l’addizione e la moltiplicazione, possiamo costruirci
un insieme di matrici 2 X 2 :

SL(2, p) =
C:) a,byc,d G Z/pZyad - bc =

Questo insieme di matrici è un gruppo, dove la legge di gruppo è data dal


1

prodotto tra matrici*. Il numero di elementi di SL(2, p) è


#(SL(2,p))=p(p+ l)(p - 1).
Il gruppo SL(2, p) non è mai semplice. Sep è 2, esso è isomorfo al grup­
po di simmetria del triangolo dell’esempio 3.2; ha sei elementi e possiede

1Per un’introduzione si veda Gorcnstcin [1986].


* In termini dei gruppi di automorfìsmi che abbiamo discusso nel $ 7, il gruppo SL(2, p) è
un sottogruppo normale del gruppo Aut(Z/pZ X Z/pZ). In questo senso, potremmo dire che la
teoria generale dei gruppi quasi ci costringe a studiare il gruppo SL(2, p) non appena prendiamo
in considerazione Z/pZ.
La classificazione dei gruppi 97

un sottogruppo normale con tre elementi. Se p è 3, allora ha 24 elementi, e


un sottogruppo normale con otto elementi.
Se p è maggiore di 3, c’è un unico sottogruppo normale proprio di
SL(2, p):

Questo gruppo ha esattamente due elementi (a = 1 e a = p - 1). Il


gruppo quoziente
PSL(2,p) = SL(2,p)/Z
viene detto gruppo lineare speciale proiettivo; hap(p + l)(p - l)/2 elementi,
ed è un gruppo semplice se p è un numero primo maggiore o uguale a 5.
Discutere come PSL(2, p) possa essere realizzato come gruppo di simme­
tria va al di là dei limiti di questo saggio, ma posso almeno menzionare una
struttura matematica su cui esso agisce: la famiglia X di tutti sottogruppi di
(Z/pZ) X (Z/pZ) che hanno esattamente p elementi. Questa famiglia, che
ha esattamente p + 1 elementi, viene detta retta proiettiva e indicata con il
simbolo P'(Z/pZ).
Il primo di questi gruppi semplici (p = 5) ha 5 • 6 • 4/2 = 60 elementi, e
risulta isomorfo al gruppo icosaedrale:
P S L (2 ,5 )- /60.
In questo isomorfismo, l’azione geometrica di 7^ sulle sei coppie di
vertici opposti corrisponde all’azione di PSL(2, 5) sulla retta proiettiva
PMZ/5Z).

Abbiamo appena scoperto che il gruppo icosaedrale è collocato in una


famiglia infinita di interessanti gruppi semplici finiti, i gruppi lineari speciali
proiettivi PSL(2, p). Fatta questa osservazione - il nostro punto di arrivo
- possiamo intuire come procedere nell’affrontare il problema generale di
classificare i gruppi semplici. L’esempio precedente utilizzava l’addizione e
la moltiplicazione di Z/pZ; lo si può generalizzare sostituendo Z/pZ con una
struttura matematica opportuna in cui si possano fare addizioni e moltiplica­
zioni come siamo abituati a fare: i campi. In questo modo possiamo definire
PSL(2, F) per un qualunque campo F: questi gruppi risultano semplici per
quasi tutti i campi. Le matrici 2 X 2 possono essere rimpiazzate da matrici
n X n, e infine dai «gruppi algebrici semplici». A ogni livello di generaliz­
zazione, si scoprono nuove meravigliose famiglie di gruppi semplici, che
possono venir realizzati come gruppi di simmetria di strutture geometriche
sempre più complicate. Molte delle più belle idee in questa direzione si
possono trovare nel libro di Emil Artin [1988].
98 David A. Vogan Jr

Se si studia in dettaglio questo tipo di matematica, uno dei punti misteriosi


è comprendere che cosa possano mai essere i «gruppi algebrici semplici». Un
centinaio di anni fa, Wilhelm Killing ed Élie Cartan compilarono una lista di
tali gruppi, la quale però è tutt’altro che facile da capire. L’articolo di John
McKay [1980] ha fornito nuovi spunti e idee sulla lista di Cartan-Killing.
Essenzialmente, McKay riesce a metterla in relazione con i solidi regolari in
tre dimensioni; i gruppi algebrici semplici esotici corrispondono ai solidi
regolari esotici. In particolare, il gruppo algebrico semplice più esotico di
tutti (un aggeggio a 248 dimensioni detto E8) è collegato con l’icosaedro.

ARTIN, E.
1988 Geometrie Algebra, Interscience Publishers, New York [trad. it. Algebra geo­
metrica, Feltrinelli, Milano 1968].
GORENSTEIN, D.
1986 Classifying thèfinite simple groups, in «Bulletin of thè American Mathematica!
Society», nuova serie, 14, pp. 1-98.
HALL, M. JR
1959 The Theory of Groups, MacMillan, New York.
KLEIN, F.
1872 Vergleichertde Betrachtungen iiber neuere geometrische Forschungen (Erlan-
ger Programm), Deichert, Erlangen; poi in id., Gesammelte matheniatische
Abhandlungen, voi. I, Springer-Verlag, Berlin 1921, pp. 460-97 [trad. it. Il
programma di Erlangen, a cura di L. Magnani e R. Dossena, in «PRiSTEM/Sto-
ria, Note di Matematica, Storia, Cultura», 7 (2004)].
MCKAY, j.
1980 Graphs, singularities, and finite groups, in «Proceedings of Symposia in Pure
Mathematics», 37, pp. 183-86.
WEYL, II.
1952 Symmetry, Princeton University Press, Princeton [trad. it. La simmetria, Fel­
trinelli, Milano 1981].
JO H N S T IL L W E L L

Il teorema fondamentale del calcolo

Il teorema fondamentale del calcolo nacque in concomitanza con la sco­


perta, fatta nel xvn secolo, che il processo di determinazione delle tangenti
a una curva e quello di determinazione delle aree racchiuse dalle curve erano
uno l’inverso dell’altro. Nella sua prima formulazione astratta, il teorema
stabiliva che la differenziazione e l’integrazione di funzioni rappresentavano
operazioni inverse; successivamente la formulazione continuò a trasformar­
si e, in parallelo, si chiarirono e ampliarono le nozioni di differenziazione,
integrazione e funzione. Una delle caratteristiche più salienti della storia di
questo teorema è il ruolo problematico e in qualche modo irritante delle
grandezze infinitesimali, un concetto che sembrò per lungo tempo assurdo,
per quanto indispensabile. La ricerca di una soluzione al problema degli
infinitesimi condusse non solo a chiarire il concetto di funzione, ma anche a
precisare il concetto di numero.
Il teorema fondamentale del calcolo fu dunque all’origine di una com­
pleta revisione della matematica, e questo ci porta ad affermare che si tratta
del teorema più importante della storia della matematica.

1. Il teoremafondamentale del moto.

Attorno al 1361, a Parigi, il matematico Nicola Oresme rappresentò il


moto con una serie di grafici in cui la velocità dipendeva dal tempo1. Egli
dedusse (figura 1) che la distanza percorsa da un corpo A che si muove con
accelerazione costante è pari alla distanza percorsa da un corpo B che si
muove a velocità costante pari alla media delle velocità iniziale e finale del
corpo A [Struik 1986, p. 138].
La linea AD traccia la storia del corpo A , dotato di una velocità iniziale
AO che diminuisce uniformemente fino a zero. La linea BC traccia invece
la storia del corpo B, che si muove con velocità costante BO nel tempo OD

1 Si veda E. D. Sylla, OxfordeParigi nel Trecento, in questa stessa opera, voi. 1.1 luoghi et tempi,
Einaudi, Torino 2007, pp. 209-36. [N.J.C.].
100 John Stillwell

e quindi copre una distanza pari a BO X OD, cioè all’area del rettangolo
ODCB. L’area di questo rettangolo, tuttavia, è uguale a quella del triangolo
OADyche a sua volta rappresenta la distanza percorsa dal corpo A.
In effetti, Oresme sembra assumere che la distanza percorsa da un corpo
qualsiasi èpari all'area sottesa dalgrafico velocità-tempo. È possibile che abbia
pensato di dividere l’area sottostante al grafico in un certo numero di sottili
strisce verticali, corrispondenti a piccoli intervalli di tempo (figura 2). In
ciascuno di questi intervalli la velocità è virtualmente costante, quindi il suo
prodotto per l’intervallo di tempo - ovvero l’area della striscia verticale - è
virtualmente pari alla distanza percorsa in quell’intervallo di tempo. Ad­
dizionando tutte le sottili strisce, si conclude che l’area totale è uguale alla
distanza totale. Indipendentemente dal fatto che questo sia stato davvero
il ragionamento seguito da Oresme, possiamo dire che aveva comunque
intuito un’importantissima relazione.
La relazione inversa, che permette di ricavare la velocità conoscendo la
distanza percorsa, fu scoperta attorno al 1630. In quel periodo, i matematici
erano interessati al problema di trovare le tangenti alle curve e trovarono
utile interpretare una curva come la traiettoria di un punto in movimento e
la direzione della tangente come la direzione istantanea del moto. Qualora
il moto del punto fosse la risultante delle due velocità u e v, si assumeva che
la direzione della tangente fosse quella del vettore somma u + v (figura 3).
L’idea della somma vettoriale viene attribuita al matematico francese Gilles
Personne de Roberval, che la sfruttò per trovare la tangente alla «cicloide»,

Figura 1.
Velocità costante e uniformemente accelerata,

velocità
Il teorema fondamentale del calcolo 101

la curva generata da un punto di una circonferenza che rotola senza strisciare


lungo una retta. Roberval trovò che la velocità del punto mobile è pari alla
somma vettoriale della componente della velocità lungo la direzione della
retta (costante) e lungo la direzione della circonferenza (costante in modulo,
ma variabile in direzione, che coincide con quella della tangente alla circon­
ferenza in ogni posizione assunta dal punto).
Il grafico distanza-tempo di un qualsiasi punto che si muove lungo una
linea verticale, diciamo con velocità v nel tempo /, è generato da un punto
che si muove con velocità orizzontale costante 1 e velocità verticale v nel
tempo t (figura 4).
Il coefficiente angolare, che misura l’inclinazione della tangente nel tempo
/, è semplicemente v/l = v: in altre parole, la velocità è il coefficiente angolare
del grafico distanza-tempo. Questa relazione fu dedotta attorno al 1640 da
Evangelista Torricelli, che peraltro era a conoscenza dell’idea della velocità
rappresentata come l’area sottesa dal grafico velocità-tempo, avendola ap­
presa non da Oresme, ma dal suo maestro Galileo Galilei. Fu probabilmente
Torricelli il primo a intuire la relazione inversa fra velocità e distanza:

La distanza è l’area della velocità (in relazione al tempo).


La velocità è il coefficiente angolare della distanza (in relazione al tempo).

Mi sembra plausibile chiamare queste due affermazioni col nome di «teore­


ma fondamentale del moto».
Possiamo leggere questo teorema fondamentale in termini di grafici, di­
cendo che possiamo considerare il «coefficiente angolare» e l’«area» come

Figura 2.
Distanza rappresentata dall’area.

velocità
102 John Stillwdl

operazioni l'una inversa dell’altra. Se si parte dal grafico che rappresenta una
grandezza qualsiasi - non necessariamente la velocità - e si applica prima
l’operazione «area» e poi l’operazione «coefficiente angolare», si ottiene di
nuovo la grandezza di partenza. Tale teorema venne stabilito per la prima
volta da Isaac Barrow nelle Lectiones geometricae del 16702. Tuttavia, questo
non poteva ancora essere il teorema fondamentale del calcolo, dal momento
che il «calcolo» non esisteva, non essendoci ancora un metodo generale per
«calcolare» coefficienti e aree racchiuse da curve.

2. Prime determinazioni di tangenti (coefficienti angolari) e misurazioni


di aree.

Nell’antichità, molto prima che ci si rendesse conto dell’esistenza di una


loro reciproca connessione, erano state calcolate alcune tangenti e aree. Per
esempio, Apollonio determinò la tangente alle sezioni coniche e Archimede
calcolò l’area di un segmento parabolico. I loro metodi, comunque, erano
basati su particolari proprietà di queste curve e non poggiavano su una teoria
generale.
Questa divenne possibile solo con l’introduzione della geometria algebri­
ca ad opera di Pierre de Fermat e René Descartes, in Francia, attorno al 1630.
Grazie alla corrispondenza fra curve e loro equazioni, la geometria algebrica
permise di definire l’ampia classe delle curve algebriche e di classificarle in
base al loro grado. In generale, una curva algebrica piana è formata dai punti
(x, y) che soddisfano l’equazione
p(x, y) = 0, dove p(x, y) è un polinomio.

'Si veda A. Malet, L'emergenza del calcolo infinitesimale in Gran Bretagna, ibid., pp. 331-61, in
particolare le pp. 347-56. [N.d.C.].

Figura 3.
Il vettore somma di u e v.
Il teorema fondamentale del calcolo 103

Il «grado» di questa curva è il grado del polinomio p(x, y), cioè la somma dei
gradi della x e della y nel termine (monomio) di grado massimo di p{x, y).
Per esempio, le rette di equazione ax + by + c = 0 sono curve algebriche
di grado 1, mentre la circonferenza x2 + y2 = 1, rappresentata dal polino­
mio p(x, y) = x2 + y2 - 1, la parabola y = x2, rappresentata dal polinomio
p(x, y) = y - x2, e l’iperbole xy = 1, rappresentata dal polinomio
p(xt y) = xy - 1, sono curve algebriche di grado 2. Uno dei primi risultati,
ottenuto in maniera indipendente da Fermat e da Descartes, era che le se­
zioni coniche sono esattamente le curve di grado 2.
La tangente in un dato punto a una curva algebrica di grado 2 può essere
determinata con l’aiuto di un espediente geometrico: la tangente interseca la
curva due volte nel punto di contatto. Questo espediente geometrico corrispon­
de a una realtà algebrica, cioè al fatto che sostituendo l’equazione della tangen­
te nell’equazione della curva si ottiene proprio un’equazione con una radice
doppia. Per esempio, la retta y = 2x — 1 incontra la parabola y = x2quando
2x - 1 = x2, e quindi, sostituendo, si ottiene 0 = x2 - 2x + 1 = (x - l)2,
che è un’equazione con radice doppia x = 1. Questo mostra che la retta
y = 2x - 1 è la tangente alla parabola y = x2nel punto x = 1 (figura 5).
In linea di principio, questa idea, opportunamente modificata, può essere
usata per determinare la tangente a qualsiasi curva algebrica in qualsiasi punto,
ma in pratica diventa difficile ottenere l’equazione corretta della tangente.
Negli anni Trenta del Seicento, Fermat trovò una scorciatoia per la deter­
minazione della tangente grazie all’aiuto di un espediente algebrico, un’idea
che si trasformò in un concetto che si poteva generalizzare anche a curve non
algebriche: il concetto di «infinitesimo» [Struik 1986, pp. 222-27].

Figura 4.
Grafico distanza-tempo di un punto che si muove lungo la verticale,

distanza

tempo
104 John Stillwdl

Illustriamo l’idea di Fermat determinando ancora la tangente alla para­


bola y = x2nel punto x = 1, cercando questa volta però il coefficiente ango­
lare della curva in questo punto. Consideriamo il punto (1,1) che giace sulla
curva e ha ascissa x = 1 e un punto infinitamente vicino ad esso, che ha per
ascissa x = 1 + dx e quindi ha ordinata y = (1 + dx)2 = 1 + 2dx + (dxr. Il
coefficiente angolare della retta che congiunge questi punti è dato da
(1 + dx)2 - 1 _ 2dx + (dx)2 _ 2 t ±:
dx dx
che è infinitamente vicino a 2. Sembra dunque ragionevole affermare che il
coefficiente angolare della tangente nel punto (1,1) è 2 e quindi l’equazione
della tangente è y = 2x — 1.
Questo procedimento, innanzitutto, determina la tangente senza dover
azzardare alcuna «congettura fortunata», ma il prezzo da pagare per arriva­
re al risultato è l’uso del misterioso dx. Cosa significa per due valori essere
«infinitamente vicini»? Non significa certo che dx = 0, dal momento che
abbiamo supposto dx 0 per poter dividere per dx nei calcoli visti sopra.
Tuttavia, vorremmo poter dire che alla fine dx è zero, in modo da conclu-

Figura 5.
Tangente alla parabola in x = 1.
Il teorema fondamentale del calcolo 105

dere che il coefficiente angolare è esattamente uguale a 2. Oggi aggiriamo il


problema facendo «tendere a zero» dx e concludendo che il coefficiente an­
golare «tende a 2» o «ha limite 2». Per il momento non voglio approfondire
questioni di metodo, ma solo dar conto di alcuni risultati relativi alle tangenti
e alle aree di figure curvilinee trovati nella prima metà del Seicento.
Come abbiamo detto, i coefficienti angolari delle curve algebriche sono fa­
cili da determinare, e in particolare Fermat e altri trovarono die il coefficiente
angolare della curva y = xn'mx = ah na"~l. L’area sottesa dalla curva y = x*
è più diffìcile da misurare - dipende in qualche modo dalla «somma» di una
collezione di «indivisibili» - e i primi risultati vennero ottenuti in maniera
alquanto laboriosa da Bonaventura Cavalieri per particolari valori di n. Nella
sua Geometria, pubblicata a Bologna nel 1635, Cavalieri calcolò l’area delimi­
tata dalle ascissex = 0 e x = 1 sottesa dalla curvay = x" per n = 1,2,3,..., 9
trovando, per ognuno dei valori di n, che l’area è —-— [Struik 1986, pp.
ti + 1
214-19]. Nella figura 6 sono mostrate le prime quattro di tali aree.
Attorno al 1640, Torricelli precisò meglio il risultato di Cavalieri e lo
generalizzò con l’aiuto del suo «teorema fondamentale del moto». Sempli­
ficando leggermente il suo approccio, possiamo considerare la curva y = x"
come un grafico velocità-tempo, dove l’area sottesa rappresenta la distanza.
Dato che, per il teorema fondamentale, la velocità corrisponde al coefficiente
angolare del grafico distanza-tempo, la questione si riduce a questi termini:
«Quale curva distanza-tempo ha coefficiente angolare x”?» Questo è facile
da determinare, perché una semplice generalizzazione del metodo usato per
x”+1
la determinazione del coefficiente angolare di y = x2mostra che y = ---
n +1
ha coefficiente angolare x", e cosi l’equazione del grafico distanza-tempo è
necessariamente

Figura 6.
L’area sottesa da y = x"+ 1per n = 0,1,2,3.
106 John Siillwcll
In altre parole, l'area sottesa dalla ctirva y = x” compresafra le ascisse x = 0 e

x - a èApan•a ---
^ +' .
r // + 1

3. Prime versioni del teoremafondamentale.

Il calcolo della tangente (coefficiente angolare) e dell’area racchiusa da


curve del tipoy = xn rappresentava certo un grosso passo avanti, ma verso
che cosa? Il «teorema fondamentale», che in qualche modo era stato stabilito
in termini più generali, coinvolgeva la «quantità» chiamata velocità: la di­
stanza è l’area sottesa dal grafico velocità-tempo e la velocità è il coefficiente
angolare del grafico distanza-tempo. Alla metà del x v i i secolo non esistevano
ancora le nozioni di curva arbitraria, di quantità o di funzione.
Isaac Newton cominciò la sua fulminea carriera a Cambridge attorno
agli anni Sessanta del Seicento, come studente di Isaac Barrow, il quale ave­
va peraltro studiato in Italia sotto la guida di Torricelli. Non c’è quindi da
sorprendersi che anche Newton leggesse i problemi fondamentali di ciò che
oggi chiamiamo «calcolo» in termini dinamici:
Per illustrare l’arte analitica non rimane ora che affrontare alcuni problemi ad
essa inerenti che emergono soprattutto a causa della natura delle curve [...] tali
difficoltà possono essere ricondotte a due soli problemi, chc vorrei presentare in
relazione allo spazio percorso con un qualsiasi moto locale, sia esso accelerato o
ritardato:
1. Data la lunghezza della traiettoria in maniera continua (cioè, in ogni istante),
trovare la velocità del moto in ogni istante.
2. Data la velocità del moto in maniera continua, trovare la lunghezza della
traiettoria descritta (cioè della distanza percorsa) in ogni istante.

Questa formulazione dei problemi centrali del calcolo è stata tratta dal­
l’opera di Newton De methodis serierum et fluxionum (Sul metodo delle
serie e delle flussioni). Newton lavorò a questo trattato tra il 1670 e il 1672,
anche se sfortunatamente non ne completò mai la stesura e l’opera non fu
mai pubblicata. Soltanto una ristretta cerchia di scienziati - grazie alle lettere
scritte da Newton nel 1676 - venne dunque a conoscenza dei nuovi metodi
newtoniani [Struik 1986, pp. 284-91]. Nel De methodis Newton estende la
soluzione, già nota, dei due problemi precedenti per la classe delle curve
y = xtt all’assai più ampia classe delle serie infinite di potenze, ottenute som­
mando infiniti termini delle funzioni elementari di tipo axn.
U punto di partenza di Newton è il «teorema binomiale generale»,

a + x)' = ! + - ix + r i i z i * ^
1! 2! 3!
~ 2> x’ + . . . ,
Il teorema fondamentale del calcolo 107

per ogni numero r, che aveva scoperto nel 1665. Questo sviluppo in serie di
(1 + x)r consente di ottenere tutte le funzioni più note, e inoltre operando
sulle singole potenze xn è possibile:
- differenziare (trovare il coefficiente angolare, ovvero la derivata, di)
x" ottenendo «x"'1;
- integrare (trovare l’area sottesa da, ovvero \'integrale di) xTottenendo
x"*1 ,
n + 1’
- trovare i termini della serie inversa (cioè risolvere l’equazione
y —a0 + a ,x + a ^ + ... ricavando x in termini di potenze di y).
Un esempio davvero spettacolare di questo metodo è il modo in cui Newton
riesce a ottenere lo sviluppo in serie di potenze della funzione seno:
sin y = y — y3
— + y5---- — y1 H--- .
3! 5! 7!
Questa funzione è la funzione inversa della funzione arcoseno, ovvero arcsin a,
che Newton sapeva essere l’area sottesa Halla curva
1 - l-
y = -r = (1 - x2) 2
Vi —x2
compresa fra le ascisse 0 e a. Newton inizia col sostituire —x2 al posto di x e
— al posto di r nel teorema binomiale:

= i +i l , . * * , + + ~ 2 h ~ ‘ ) h ~ 2) (_ ^ , +... =

,+
=1 .—
1X2 +
. 1-
--3 X4+, -----
1-3-5 x 6 +. ••• .
2 2-4 2-4-6
Integrando termine a termine da 0 a a si ha
^ 1 a* 1• 3 1• 3 • 5
arcsin a = a + ----1------ H--------- 1-•••.
2 3 2-45 2-4-6 7
Alla fine, dopo calcoli laboriosissimi, Newton arriva a risolvere l’equazione
a = sin y in potenze di y, ottenendo
y3 y5 y7 y9
sin y = y-Z- + ^ ---- Z— + —Z ------.
6 120 5040 362880
108 John Stillwcll

Poche righe dopo osserva (anche se effettivamente non dimostra davvero)


che il coefficiente di y2"*1è (—1)V(2«+1)!, e dunque

sin y = / + ?5 y1 +
3! 5! 7!
come aveva richiesto.
Questo esempio mostra molto bene le finalità e lo stile dell’approccio
di Newton al calcolo. Era convinto che le serie di potenze rappresentassero
un’idonea classe di curve da studiare, poiché si trattava di curve facili da
trattare, che estendevano le curve y = x* allo stesso modo in cui i decimali
infiniti estendevano gli ordinari numeri decimali. Scrisse infatti alle pagine
33-35 del De methodis:
Dal momento che le operazioni di calcolo con i numeri e con le variabili sono
molto simili [...] sono sorpreso che non sia ancora capitato a nessuno [...] di
adattare alle variabili la teoria stabilita di recente per i numeri decimali, soprat­
tutto tenuto conto del fatto che la via è ora spianata verso conseguenze ancora
più stupefacenti. Poiché questa teoria applicata alle specie si rapporta all’Algebra
come la teoria dei numeri decimali si rapporta aH’Aritmetica comune, le nuove
operazioni di addizione, sottrazione, moltiplicazione, divisione ed estrazione di
radice possono essere facilmente ottenute da una rilettura delle corrispondenti
operazioni aritmetiche.

Dal punto di vista di Newton, il teorema fondamentale del calcolo assu­


me questa forma: per ogni serie di potenze, l’operazione di differenziazione
è inversa all’operazione di integrazione. Questo teorema è una conseguenza
del fatto, già noto a Torricelli, che la differenziazione è l’operazione inversa
dell’integrazione per ogni potenza xbisogna inoltre supporre (come face­
va Newton) che in una serie di potenze sia sempre possibile differenziare e
integrare termine a termine.
Newton è considerato uno dei fondatori del calcolo perché i suoi metodi
permettono di differenziare e integrare con calcoli diretti un’ampia classe di
funzioni. Tuttavia il successo dei suoi calcoli dipendeva dal poter disporre
di serie di potenze in forma esplicita e il concetto di funzione dell’epoca
non faceva parte di questo modo di vedere le cose. Il concetto di funzione
(e anche la parola stessa) fu introdotto dal secondo fondatore del calcolo,
Gottfried Wilhelm Leibniz, che giunse al teorema fondamentale del calcolo
seguendo una via totalmente differente.
Nel 1684 Leibniz diede alle stampe l’opera Nova methodus prò maximis
et minimis, la prima pubblicazione sul «calcolo differenziale» inteso nell’ac­
cezione moderna: un metodo e un simbolismo generali per il calcolo delle
tangenti alle curve [Struik 1986, pp. 271-80]. Nello scritto leibniziano veni­
vano introdotte le regole per differenziare la somma, il prodotto e il quozien­
te di funzioni e possiamo trovare anche la notazione «òy/dx» usata oggi nel
calcolo. L’opera è straordinaria per la sua incondizionata acccttazione degli
II teorema fondamentale del calcolo 109

infinitesimi e per il loro conseguente utilizzo. Fu in effetti proprio Leibniz a


introdurre la notazione «dx» per indicare un incremento infinitesimo della x
(«d» sta per «differenza»); egli considerava dy/dx come un quoziente vero e
proprio di infinitesimi e uguagliava senza porsi problemi i termini che erano
solo «uguali a meno di un infinitesimo».
Per esempio, per calcolare il coefficiente angolare della curva y = uv,
dove «et» sono entrambe funzioni di xt Leibniz indicava con d u e dv gli
incrementi subiti da u e v quando x veniva incrementata delTinfinitesimo
dx. L’incremento in y diventava pertanto
dy = (u + du)(v + dv) —uv = udv + vdu + dudv,
e il coefficiente angolare dy/dx della retta che congiunge il punto (x, y) sulla
curva al punto infinitamente vicino (x + dx, y + dy) si calcola (a meno di un
infinitesimo) semplicemente dividendo entrambi i membri per dx:
dy dv
-f- = u —
dx dx
+, v—
du
dx
.
Leibniz prosegui nel 1686 con la prima pubblicazione di calcolo integra­
le, introducendo il simbolo J y dx per indicare l’integrale di una funzione y
di x, dove J (una S allungata) sta per «somma» [Struik 1986, pp. 281-82]. Il
termine y dx che segue il simbolo di «somma» rappresenta l’area di un ret­
tangolo infinitesimo di altezza y e ampiezza dx, sicché J y dx indica la «som­
ma» di queste aree infinitesime, e precisamente l’area sottesa dalla curva la
cui altezza nel punto x è y. La figura 7 mostra l’ampiezza dx del rettangolo
vista con una lente d’ingrandimento infinitamente potente.

Figura 7.
Area intesa come somma di rettangoli infinitesimi.
110 John Stillwell

Un matematico dei giorni nostri si preoccuperebbe di migliorare questa


notazione specificando l’estremo sinistro (x = a) ed evidenziando la dipen­
denza dell’area da x: preferirebbe dunque parlare di «area da a a x»\ Tut­
tavia, la scelta di un limite sinistro non è importante per il passo successivo
che si deve compiere e che consiste nel chiedersi: che cosa significa d f y dx?
Dal momento che J significa «somma» e d significa «differenza», d J y dx
dovrebbe indicare l’ultimo termine della somma, cioè y dx. Non bisogna
preoccuparsi che ci sia effettivamente un «ultimo» termine in una somma
(presumibilmente infinita) di aree infinitesime, dato che la risposta corretta
è sicuramente ^
d I y dx = y dx, e dunque — I y dx = y.

In altre parole: se si integra una funzione y e poi si differenzia il risultato, si


ottiene ancora y. Questa è, sostanzialmente, la versione leibniziana del teo­
rema fondamentale del calcolo. Dal punto di vista concettuale non potrebbe
essere più semplice (beninteso, se si accetta l’esistenza degli infinitesimi) e
non richiede la conoscenza di derivate o integrali particolari!
D ’altra parte, in quell’epoca non era ancora chiaro che cosa fosse vera­
mente una funzione o un infinitesimo e se integrali e derivate esistessero per
ogni funzione. Questi erano importanti interrogativi e il compito di preci­
sarne meglio il significato venne lasciato in eredità ai successori di Newton
e Leibniz. È questa una storia che probabilmente non si può ancora ritenere
conclusa: nei paragrafi successivi cercheremo di delinearne brevemente lo
svolgimento.

4. Differenziabilità, continuità e oltre.

Quando Newton pose il problema «Data in maniera continua la lun­


ghezza di uno spazio percorso, trovare la velocità del moto in ogni istante»,
non soltanto supponeva che la distanza fosse una funzione continua del
tempo, ma che ogni funzione di questo tipo fosse differenziabile. In termini
geometrici, assumeva che una curva continua ammetta una tangente in ogni
punto. Se questa condizione può apparire plausibile per le curve distanza-
tempo, non lo è per una curva generica. Anche nell’ambito della meccanica,
i matematici trovarono ben presto in maniera del tutto spontanea curve che
in certi punti non avevano tangente. Questa scoperta portò a una radicale
revisione dei concetti di funzione e di continuità e si arrivò alla fine a una più

* La notazione usata oggi per indicare l’area sottesa dalla curva y = /(/) fra/ = <*e/ = xè
f7</)dt.
Il teorema fondamentale del calcolo 111

profonda comprensione della derivata, dell’integrale e persino del concetto


di numero.
Il motore di tutti questi sviluppi fu il «problema della corda vibrante»,
un problema che, fin dai tempi antichi, era stato messo in relazione con la
musica. Per esempio, da molto tempo si sapeva che una corda tesa ha diffe­
renti modi di vibrazione che producono differenti toni musicali. La figura 8
mostra i primi modi, che corrispondono a una «lunghezza d’onda» uguale
all’intera corda, a mezza corda, a un terzo di corda e cosi via.
Nel xviii secolo i matematici affrontarono da capo il problema con i
nuovi e potenti mezzi offerti dal calcolo e ottennero risultati inaspettati e
soprendenti [Struik 1986, pp. 351-68]. Nel 1713 il matematico inglese Brook
Taylor trovò che la forza esercitata su un punto della corda posto a distanza
orizzontale x, quando percorre una piccola distanza y in direzione perpen­

dicolare, è proporzionale alla derivata seconda •Partendo da questa


dx
constatazione, Taylor fu in grado di dedurre la più semplice forma possibile

della corda, Yonda semisinusoidale y = ksìn-^y-, dove /è la distanza fra gli

estremi della corda. Questa è la forma del primo modo di vibrazione, come
si può vedere nella figura 8.
Nel 1747 la soluzione di Taylor fu generalizzata a Parigi da Jean d’Alem-
bert. In considerazione del fatto che lo spostamento y dipende, oltre che
dalla x, anche dal tempo /, d’Alembert scopri che la ;y soddisfa un’equazione
in cui compaiono derivate sia rispetto a t sia rispetto a x. Questa «equazione
alle derivate parziali»
d2y = 1 d2y
dx2 v2 dt2
è oggi conosciuta anche come «equazione delle onde unidimensionale».
Nonostante l’assoluta novità rappresentata da questa equazione, d’Alem-
bert la risolse completamente e in breve tempo! Trovò che la soluzione ge­
nerale ha la forma
y = <1>(vt + x) + ¥ {vt - x),
dove le funzioni $ e ¥ sono completamente arbitrarie, purché esistano le
derivate necessarie. In particolare, la forma della corda al tempo iniziale può
essere la funzione, essenzialmente arbitraria,
y = <P(x) + ¥ ( —*).
L’eventualità che una curva arbitraria fosse soluzione di un’equazione
era un fatto che non aveva precedenti e sembrava assai controverso, ma non
irragionevole. Dopo tutto, è possibile immaginare di far assumere a una
112 John Stillwell

corda elastica una forma arbitraria prima di lasciarla vibrare. Comunque,


questo filone sembrava lasciare in disparte la matematica: in matematica, si

cerca una formula per y in modo da poter calcolare le derivate parziali


è2y

Una possibile soluzione del conflitto fra curve arbitrarie e formule fu sug­
gerita dal matematico svizzero Daniel Bernoulli nel 1753. Partendo dall’os­
servazione che differenti modi di vibrazione possono manifestarsi contem­
poraneamente —perché possono essere percepiti dall’orecchio umano come
«sopratoni»-, Bernoulli arrivò a supporre che un’arbitraria forma dell’onda
potesse venire espressa come una somma infinita di onde sinusoidali:
. ttx , . 2 ttx . 3 ttx
y — aj sin — + a2 sin —— + aj sin —— + •••

La felice intuizione di Bernoulli si ritrova anche nella tecnologia musicale


dei nostri giorni, laddove gli strumenti elettronici sintetizzano tutti i tipi di

Figura 8.
Modi di vibrazione.
Il teorema fondamentale del calcolo 113

suoni - fra i quali le «onde quadre» e le «onde triangolari» - come somma


di onde sinusoidali; in pratica, una somma finita riesce ad approssimare in
maniera accettabile ogni forma deH’onda, sebbene le vere onde quadre e
triangolari siano somme infinite di onde sinusoidali. In ogni caso, la questio­
ne al tempo di Bemoulli era assai controversa, perché non esistevano metodi
per calcolare i coefficienti an.
La maggior parte delle difficoltà vennero risolte all’inizio del x ix seco­
lo, quando il matematico francese Joseph Fourier scopri che i coefficienti
dipendono da particolari integrali [Birkhoff 1973, pp. 138-41]. Nel 1822,
infatti, Fourier affermò che se/(x) (fra x = - 1 e x = 1) è una somma infinita
di funzioni seno e coseno della forma

/(x) = ^a0 + ajsim rx + b} costtx + <72 sin2Trx + b2 cos2ttx + •••,


allora
ì
7n = j /(x)C0S«TTxdx, bn = j / (x) sin mix dx.
-i
Questo risultato faceva ripiombare la questione nell’ambito del calcolo:
per sapere quanto potesse essere arbitraria una somma di seni e coseni, si
deve conoscere quali funzioni/(x) ammettano l’esistenza degli integrali

j ^/(x)cos«TTxdx e j' /(x)sin/7TTxdx.

5. Evoluzione del concetto di integrale.

Nelle lezioni tenute da Augustin-Louis Cauchy all’École Polytechnique


di Parigi, pubblicate nel 1821, troviamo la prima definizione precisa di in­

tegrale | /(x)dx. Cauchy divide l’intervallo di estremi a e b in un numero

finito di sottointervalli aventi estremi


a = x0 < x, < x2 < ... < x ff_, < x „ = b,
per poi considerare la somma finita

(Xj - * 0)/(x0> + (*2 ~ *l)/(*|) + ... + (x, - Xn_ 1)f (X|J_ |),
che rappresenta l’area totale dei rettangoli grigi della figura 9.
Come si vede dalla figura, è chiaro che l’area sottesa dalla curva, ammes­
so che la cosa sia possibile e sensata, è il numero approssimato da somme
di questo genere, quando l’ampiezza dei rettangoli tende a zero. Cauchy

definì l ’integrale I /(x)d x come il valore limite comune, quando esiste,


114 John Stillwcll

di queste somme. Riustf anche a dimostrare che l’integrale esiste quando la


curva y —/(x) è continua, dopo aver definito opportunamente il concetto
di «continuità».
Possiamo facilmente immaginare, in modo del tutto intuitivo, che il gra­
fico di una funzione continua sia «tracciato in maniera continua» o «ininter­
rotta», tuttavia Cauchy si rese conto che questa proprietà globale di una fun­
zione continua poteva essere descritta in modo più preciso da una proprietà
locale - una proprietà che vale in un intorno di ogni punto x : stabili quindi
che una funzione è continua in x se la differenza f { x + a ) —/ (a) tende a zero
quando a tende a zero e affermò che/è semplicemente continua se è conti­
nua in ogni punto x del suo dominio di definizione [Birkhoff 1973, p. 2].
Grazie alla definizione precisa di integrale data da Cauchy, diventò pos­
sibile vedere sotto una nuova luce le formule dei coefficienti dello sviluppo
di Fourier di una funzione f{x ) in serie di seni e coseni. Le funzioni sin mrx
e cos mrx sono continue, quindi le funzioni f{x ) sin mix e f(x ) cos mrx sono
continue quando lo è/, nel qual caso, dal risultato ottenuto da Cauchy segue
che i coefficienti

/(x) cos mix dx e bn = /(x) sin mrx dx

esistono sicuramente. Inoltre, quando/è continua, è sempre vero che

come venne dimostrato dal matematico tedesco Johann P eter Gustav


Lejeune-Dirichlet nel 1829 [Birkhoff 1973, pp. 145-46]. E dunque il risul-

Figura 9.
Approssimazione con rettangoli di un’area curvilinea.

,v
1 - /ir)

o A, A.. A
I) teorema Fondamentale del calcolo 115

tato intuito da Daniel Bernoulli nel 1753 e descritto in dettaglio da Fourier


nel 1822 assunse una forma definitiva solo nel 1829.
Naturalmente, le funzioni continue/ esauriscono tutte le possibili con­
figurazioni assunte da una corda vibrante, ma Dirichlet osservò che la sua
dimostrazione rimaneva valida per funzioni che avevano qualche ^«conti­
nuità. Questo fatto scoperchiò un nuovo vaso di Pandora: fino a che punto
una funzione poteva essere discontinua e ammettere tuttavia un integrale?
Nel suo lavoro del 1829, Dirichlet esibì l’esempio di una funzione che
era troppo discontinua per essere integrabile nel senso di Cauchy. Questa
funzione è oggi conosciuta come «funzione di Dirichlet» ed è cosi definita:
. 1 se x e razionale
D(x) =
0 se x è irrazionale.
In qualsiasi intervallo della retta reale sono contenuti sia punti razionali
sia punti irrazionali e quindi la funzione D{x) assume entrambi i valori 0 e
1 in ogni intervallo fissato. Se noi consideriamo una qualsiasi suddivisione
0 = xo < x , < . . . < x >f= 1 dell’intervallo [0, 1], possiamo sempre scegliere
le somme di Cauchy

(*j Xq)D(xq) + (x2 Xj)D(xj) + ... + (xn —xa_ì)D(xn_J)

in modo che i valori D (x,), D ta ), ..., D{x^_i) siano tutti uguali a 0 o tutti
uguali a 1. Dunque la somma di Cauchy può valere 1 oppure essere prossima
quanto si vuole a 0 e di conseguenza non esiste un unico valore limite, per
cui l’integrale di Cauchy di D(x) non esiste.
La funzione di Dirichlet D{x) è discontinua in tutti i punti e quindi non
c ’è da meravigliarsi che il suo integrale di Cauchy non esista. Tuttavia è pos­
sibile che una funzione abbia delle discontinuità in ogni intervallo e rimanga
comunque integrabile secondo Cauchy. Nel suo scritto di abilitazione, pre­
sentato a Gottinga nel 1854 [Hawking2 0 0 5 ,pp. 826-65], Bernhard Riemann
presentò un esempio di questo tipo di funzione e in seguito ne vennero dati
anche di più semplici. Probabilmente il più semplice è il seguente, in cui si
considera la cosiddetta «funzione di Dirichlet modificata»:
1/q se x = p/q, dove p/q è ridotta ai minimi termini
0 se x è irrazionale.
La figura 10 costituisce un tentativo di disegnare l ’area sottesa dal grafico
y = d(x), dove l’ordinata di ogni punto {p/q, 1/q) viene rappresentata con
un segmento (per q < 17).
La differenza cruciale fra d(x) e D(x) è che, per ogni numero naturale q, la
disuguaglianza d(x) > 1/q vale solo per un numero finito di punti. Quando
questo numero finito di punti viene racchiuso in intervalli sufficientemente
piccoli, il loro contribuito alla somma di Cauchy diventa arbitrariamente
116 Jo h n S tillw d l

piccolo, non superiore - diciamo - a \/q. Il resto del grafico di y = d{x) in


[0, 1] è sempre racchiuso in un’infinità numerabile di rettangoli di altezza
s l/q, e quindi di area totale < l/q. Dunque la somma di Cauchy diventa
inferiore a 2/q, per ogni intero q, quando l’ampiezza dei sottointervalli tende
a zero e allora
J ' d(x)óx = 0.

Un’ulteriore interessante differenza fra d{x) e D{x) è che d(x) è molto


«più continua» di D(x), che è completamente discontinua. Infatti, d(x) è
continua per tutti i valori irrazionali di x. Questo succede perché, usando
un argomento analogo a quello visto sopra, per ogni irrazionale x e ogni nu­
mero naturale q, esiste un intorno di x in cui tutti i valori di d(x) sono minori
di ì/q. Di conseguenza, i valori di d{x + a ) tendono a d(x) = 0 quando a
tende a zero, cosi d(x) soddisfa la definizione di continuità secondo Cauchy
in ogni punto irrazionale x. Naturalmente, d(x) è discontinua in ogni punto
razionale, per lo stesso motivo per cui lo è D(x): in ogni intorno di x = p/q
vengono assunti entrambi i valori \/q e 0, quindi il valore di d{x + a ) non
può tendere a d(x) = l/q.
Grazie ai contributi dati daRiemann nel 1854 alla teoria dell’integrazione
(e a una piccola modifica apportata alla definizione di Cauchy), il concetto
di integrale basato sull’approssimazione dell’area sottesa da una curva me­
diante un’infinità numerabile di rettangoli è ora noto com e «integrale di

Figura 10.
Integrale della funzione di Dirichlct modificata d(x).
Il teorema fondamentale del calcolo 117

Riemann». Comunque, la scoperta di Riemann dell’esistenza di funzioni


integrabili con un insieme denso di punti di discontinuità ebbe il merito di
sollevare la seguente questione: esiste un concetto più generale di integrale?
In particolare, è possibile dare un significato all’espressione

j * D(x)dx?

Fu Henri Lebesgue, in una famosa tesi presentata alla Sorbona nel 1902
[Hawking 2005, pp. 1046-87], a rispondere positivamente a questa e a molte
altre questioni. L’idea di Lebesgue era quella di poter approssimare l’area
sottesa da una curva con un insieme infinito di rettangoli, e questo fa una
gran differenza, come vedremo integrando la funzione di Dirichlet D(x) da
Oa 1.
Integrare la funzione D{x) equivale a misurare l’area sottostante al grafico
y = D(x) fra x = 0 e x = 1, e questa, a sua volta, è l’area della regione che sta al
di sotto dei punti per cui D(x) = 1, dal momento che gli altri punti del grafico
giacciono sull’asse delle ascisse e quindi non danno contributi all’area. Ora,
D(x) = 1 precisamente nei punti x razionali dell’intervallo [0, 1], e questi
punti possono essere disposti in questa sequenza infinita:
1 1 Z Ì 2 Ì Z M I 2 1 2 3 4 5 6 1 3 5 7 1 2 4
2 ’ 3’ 3’ 4 ’ 4 ’ 5 ’ 5 ’ 5’ 5 ’ 6 ’ 6 ’ 7 ’ 7 ’ 7 ’ 7 ’ 7 ’ 7 ’ 8 ’ 8 ’ 8 ’ 8 ’ 9 ’ 9 ’ 9 ’ ' " ’
in cui vengono prima le frazioni che hanno 2 al denominatore, poi quelle con
denominatore 3, in seguito quelle con denominatore 4 e cosi via. Al punto
x, situato nella posizione «-sima della sequenza, corrisponde una linea ver­
ticale appartenente alla regione sottostante al grafico; racchiudiamo questa
linea con un rettangolo verticale di altezza 1 e ampiezza e /2" per un e fissato
(sceglieremo il suo valore più avanti).
L’intera regione sottostante al grafico di jy = D(x) è quindi ricoperta di
rettangoli la cui area totale può al massimo valere

- + - + - + — +
2 4 8 16
Dal momento che possiamo scegliere e piccolo a piacere, l’area della regione
sottostante il grafico è necessariamente zero e quindi

f D(x)dx = 0
Jo
quando l’integrale viene inteso nel senso di Lebesgue.
Questa argomentazione mostra anche che l’insieme dei numeri razionali
appartenenti a [0, 1] ha lunghezza totale (o «misura») zero, perché questo
insieme può essere ricoperto da intervalli di lunghezza totale e. Di conse­
guenza, 1 insieme degli irrazionali appartenenti a [0, 1] ha misura 1, e per
118 John Stillwell

questa ragione diremo che quasi tutti i punti di [0, 1] sono irrazionali. In
generale, una proprietà che vale dappertutto tranne che in un insieme di
misura zero si dice che vale quasi ovunque. Questa terminologia ci permette
di spiegare il significato dell’integrale di D(x) in una maniera estremamente
naturale: lafunzione di Dirichlet D(x) ha integrale uguale a zero perché D(x)
è zero quasi ovunque.

6. Il teorema fondamentale del calcolo secondo Lebesgue.

L’integrale di Lebesgue (come viene oggi chiamato) ampliava notevol­


mente la classe delle funzioni integrabili ed eliminava molte delle restrizioni
presenti nei teoremi di analisi. Per esempio, consideriamo ancora il teorema
stabilito da Fourier nel 1822, secondo il quale, se/(x) è una funzione limitata
della forma
f ( x) = sinirx + bl co sir* + <72 sin2irx + b2 cos2irx + ,

allora
an = fW cosm rxà x, bn = f(x )sin m rx ó x .

Quando l’integrale è di Cauchy o di Riemann, il teorema di Fourier è vero


se si pongono alcune condizioni sulla / (*) (per esempio, la continuità), ma
quando abbiamo a che fare con l’integrale di Lebesgue, il teorem a è valido
senza alcuna restrizione.
Le definizioni di misura e di integrale secondo Lebesgue portano anche
ulteriori vantaggi, fra cui:
- virtualmente, ogni funzione limitata è integrabile e ogni regione li­
mitata ha una misura. Le uniche eccezioni, ammesso che esistano,
sorgono da questioni di teoria degli insiemi piuttosto che dall’analisi.
Le eccezioni esistono solo se vale il cosiddetto «assioma della scelta»
ed è coerente assumere che non esista^;
- le proprietà che in precedenza si pensava valessero solo eccezional­
mente valgono invece quasi ovunque. Per esem pio, le funzioni con
molte discontinuità possono tuttavia essere continue e differenziabili
quasi ovunque.

La prima proprietà spiana la strada a una versione davvero generale del


«teorema fondamentale del calcolo». A questo punto possiamo considerare
una qualsiasi funzione limitata/ e assumere che esista la funzione integrale

4 Sull’assioma della scelta si veda Akihiro Kanamori, L’ipotesi del continuo, in questo stesso
volume, pp. 461-514. [N .J.C .].
Il teorema fondamentale del calcolo 119

F(x>= j'/(O d /.
No/1 è sempre vero che F sia differenziabile, sicché non sempre possiamo
ritornare a/differenziando F, come si può vedere dal semplice esempio della
«funzione scalino»:

/</>-) ° K , < 0
[1 se t > 0.

È facile vedere, considerando l’area sottostante al grafico di/, che la funzione


integrale d i/ è

F(x) = f * /(Od/ = 1° paX~°


J -i [x per x > 0.
F (0 ) semplicemente non esiste, dal momento che il grafico di y = F(x) non
ha tangente in x = 0. Per questa ragione F'(x) * /(x) quando x = 0, ma per
tutti gli altri valori di x, possiamo ottenere/ (x) differenziando

F M = I * /(Od/.

Nel 1903 Lebesgue provò che il teorema fondamentale del calcolo vale per
tutte le funzioni limitate (integrabili) nel senso «quasi ovunque»: se f è una
funzione limitata (integrabile) definita su un intervallo [a, b], allora
d [x
/ (*) = — j /(/)d/, quasi ovunque.

Esempi come quelli della funzione scalino rendono evidente che questa for­
mulazione è quanto di più distante dal teorema fondamentale inteso nelle
usuali accezioni di «funzione» e «derivata». Per andare oltre, occorre esten­
dere ancora la nozione di funzione e, sorprendentemente, è possibile am­
pliare la classe di funzioni fino a comprendere una classe di oggetti, chiamati
funzioni generalizzate, le cui «derivate» sono definite ovunque.

7. L’estensione di Schwartz del concetto difunzione.

Nella sua autobiografìa [Schwartz 1997], il matematico francese Laurent


Schwartz racconta che era arrivato a estendere il concetto di funzione in ana­
logia all’estensione del concetto di numero razionale. Nel 1945 trasformò la
classe delle funzioni ampliandola fino a comprendere una classe di oggetti che
chiamò distribuzioni, allo scopo di «risolvere i problemi di differenziazione»:
L a differenziazione pone seri problemi: esistono certam ente funzioni differenzia­
bili, ma W eierstrass fu il prim o a dare un esempio di funzione che non è differenziabi-
120 John Stillwdl

le in nessun punto. [ ...] Le distribuzioni risolvono i problemi di differenziazione, nel


senso che ogni distribuzione è differenziabile, e le derivate sono an cora distribuzioni.
[ . . . ] Se una funzione continua non e differenziabile, allora, se la si co nsidera come
una distribuzione, ammette sempre una derivata, ma la derivata c una distribuzione
che non è necessariamente una funzione. [ ...]
Fenomeni del tutto analoghi si sono presentati più volte nella storia della ma­
tematica. Per fare un esempio, i numeri razionali non erano adeguati a risolvere il
problema dell’estrazione della radice quadrata, dal m om ento che num eri interi come
2 o 3 non hanno radici quadrate razionali. Ma se si am pliano i num eri razionali fino a
comprendere i numeri reali, allora ogni numero razionale positivo ha una radice qua­
drata che e reale ma non necessariamente razionale, e in un co lp o si crea il cam po dei
numeri reali, in cui ogni numero positivo ha due radici qu adrate di segno opposto.

Cerchiamo di dare un’idea di come funziona l’analogia suggerita da


Schwartz. Ogni numero reale può essere definito in termini di numeri ra­
zionali in modi diversi. Il più comune è Xespansione decimale, che consente
di esprimere un numero come somma di un insieme di razionali del tipo

, dove dn è una «cifra», cioè un intero compreso fra 0 e 9.


10"
Per esempio, la successione di cifre nell’espansione decimale
tt = 3,1415926...

rappresenta la somma infinita dei numeri razionali


1 4 1 5 9 2 6
3 + — + — + — + — + — + ----- + — + •••.
10 IO2 IO3 IO4 IO5 IO6 IO7
Dunque, assegnando ad ogni potenza 10” una cifra dn (solo con un’infinità
numerabile di cifre diverse da zero per n > 0), le potenze di 10 vengono
utilizzate per rappresentare tutti i numeri reali.
In maniera del tutto analoga, alcune famiglie di funzioni sem plici pos­
sono servire per rappresentare classi più ampie di funzioni. Com e aveva
osservato Newton, la famiglia delle potenze di x rappresenta m olte funzioni
differenziabili quando si associa a x" un coefficiente reale an. P er esempio, si
vede che associando ( —1 )V (2 « + 1)! a * 2" * 1 si ottiene la funzione seno:
xJ x5
sin x = x --------+ --------------- + •••.
3! 5! 7!

Muovendosi in questo ordine di idee, Fourier andò oltre, utilizzando la fami­


glia delle funzioni d’onda semplice cos mix e sin «irx; associando coefficienti
reali an a cos «-rrx e bn a sin «ire, Fourier (con il con tributo successivo di
Lebesgue) fu in grado di rappresentare virtualmente tutte le funzioni reali
definite sull’intervallo [ —1 ,1 ] ed esprimere i loro coefficienti an e bn come
integrali:
Il teorema fondamentale del calcolo 121

= | /(x) cos mix dx, bn = | /(x) sin «irx dx.

Sfortunamente, questo non garantisce che ogni funzione sia derivabile,


sebbene a prima vista si possa pensare che questo succeda. Purtroppo non
è possibile trovare la derivata di

/(x) = ^aQ+ al sin ttx + ^cos-irx + a2 sin 2irx + £2 cos2irx + •••

differenziando termine a termine l’espressione al secondo membro, perché,


trattandosi di somme infinite, non possiamo concludere che la somma delle
derivate sia necessariamente uguale alla derivata della somma. Ciononostante,
possiamo modificare l’approccio di Fourier in modo da definire un oggetto
che sia sempre differenziabile.
1. Invece di considerare funzioni d’onda semplici, si considerano tutte
le funzioni infinitamente differenziabili cp(x) che siano diverse da zero
fuori da un intervallo limitato. Le funzioni <psono dette «infinitamente
differenziabili» (o «lisce») a supporto compatto e ne esistono molte
(si veda più avanti la figura 11).
2. Al posto dei coefficienti an e bn si considerano i numeri

ai ~ \ /(x)cp(x) dx.
J -3C

Ciascuno di questi integrali è ben definito perché la funzione inte-


granda/(x)<p(x) è nulla fuori da un intervallo limitato.
3. Invece di cercare di usare i numeri J in una somma da uguagliare a
/ (x), si «codifica» semplicemente/(x) con la funzione (p I-» che
associa il numero reale a^ a ogni funzione liscia <p a supporto com­
patto.
4. La funzione <p h» è chiamata «distribuzione associata a/» e defi­
nisce veramente/, perché funzioni differenti/e g generano differenti
distribuzioni <p h-» e <p h» a* (ci siamo presi qualche libertà sul
significato di «differenti», dal momento che l’integrale di Lebesgue
non distingue tra funzioni che coincidono quasi ovunque).

In definitiva, una distribuzione è una funzione <I> definita dall’insieme


delle funzioni lisce tp a supporto compatto ai numeri reali. Tuttavia <t>non è
proprio una funzione qualsiasi, ma è lineare, cioè
<I>(c1(p1 + c2<p2) = ^ ( t p , ) + c2<&{<p2) per ogni coppia di numeri reali cv c2.
La relazione di linearità è valida perché, in virtù delle proprietà fonda-
mentali degli integrali, si ha
122 John Stillwell

f /U ) (c,<p,(*) + c2(p2(x))dx =
J -X

= Cj J f(x) (f>, (x) dx + c2 J / ( x ) tp2(x) dx.

Possiamo quindi definire una distribuzione come un’applicazione lineare che


va dall’insieme delle funzioni lisce a supporto compatto ai numeri reali5. La
distribuzione associata a una funzione/è proprio una distribuzione intesa
in questo senso, stante la linearità dell’integrale, ma esistono anche distri­
buzioni che non sono associate a funzioni. In effetti, alcune funzioni fasulle
usate da fìsici e ingegneri sono in realtà distribuzioni.
Una di queste funzioni fasulle è la cosiddetta «funzione delta di Dirac 8»,
definita sull’insieme dei numeri reali dalle seguenti proprietà:
8(x) = 0 per x # 0;

J 8(x) dx = 1.

La funzione 8 non esiste, ma se esistesse, potremmo facilm ente esprimere la


sua distribuzione! L’integrale

I 8(x) tp(x) dx
j -X

varrebbe cp(0), perché la funzione integranda 8(x)<pU) è zero per x 0 e il


suo integrale avrebbe in definitiva il valore 1, corrispondente al prodotto di
8(x) per <p(0). Come ho già detto, l’integrale è fittizio, ma la funzione che
manda <pin <p(0) è una distribuzione autentica! Si tratta di una distribuzione
che mappa l’insieme delle funzioni lisce a supporto com patto nei numeri
reali e che è anche lineare, perché
(Ci<Pi + c2(p2)(0) = < ^ ( 0 ) + c2<p2(0).
In conclusione, per quanto la delta di Dirac non esista com e funzione, abbia­
mo tuttavia una distribuzione delta di Dirac da usare al suo posto.
Per renderci conto del fatto che funzioni differenti/e g hanno distribu­
zioni differenti, consideriamo un punto in cui f e g abbiano valori diversi,
diciamo /(0) g(0). Consideriamo anche opportune funzioni lisce a sup­
porto compatto, come quella mostrata nella figura 11.

* In effetti dobbiamo richiedere che questa applicazione lineare sia anche continua, proprietà
che è automaticamente soddisfatta dalle applicazioni lineari definite su spazi vettoriali di dimensione
finita, ma non in questo caso. Per una buona introduzione al concetto di distribuzione si rimanda a
Kolmogorov e Fomin [1975], pp. 206-14.
Il teorema fondamentale del calcolo 123

Il grafico di questa funzione <p è quasi un rettangolo, ma ha gli angoli


arrotondati (per far si che la <psia liscia) e i lati verticali leggermente inclinati
(per garantire che <psia una funzione). Si può fare in modo che il grafico di <p
approssimi «bene quanto si vuole» un rettangolo rendendo più piccoli i tratti
arrotondati e aumentando la pendenza dei lati. Inoltre è possibile rendere il
rettangolo arbitrariamente alto e sottile pur mantenendo costante il valore,
pari a 1, dell’area sottostante al grafico.
Chiaramente, quando <pvaria in questo modo, l’integrale

ai = [ / (*) tpU) dx /(0),


j -OC
perché la parte di/(x)<p(x) diversa da zero approssima un rettangolo infini­
tamente sottile di area/(0). Allo stesso tempo si ha

aÌ ~ [ g(*) <P(*) dx -*• g(0),


j —OC

che è diverso. In conclusione, le distribuzioni <p e <p i-> a* sono di­


verse.
Abbiamo dunque visto che le distribuzioni possono servire per rappre­
sentare le funzioni, ma per quale motivo ogni distribuzione ha una derivata?
Q uesto dipende dal fatto che ciascuna delle funzioni <p è differenziabile.
Usiamo ora il trucco chiamato integrazione per parti, che deriva dalla for­
mula di Leibniz per la derivazione di un prodotto:
d dv . du
— uv = u ------ h v — .
dx dx dx

Figura 11.
Una funzione liscia a supporto compatto.

V-

Vi *■A
124 John Siillwcll

Se si integrano entrambi i membri da —oo a 00 si ottiene


fx dv , r 1* fx dw ,
u — dx = \tw\ - v — dx,
J-* dx L J-* J-* dx

dove [wy]_x indica il valore di uv all’oo, a cui si sottrae il valore a —00.


Quando il prodotto uv è nullo fuori da un intervallo limitato, entram bi que­
sti valori sono uguali a zero. Questo fatto si verifica quando v = / e quando
u = (p è una funzione liscia a supporto compatto e quindi in questo caso
abbiamo
f % ( x )^ d )t= - r i i i / ,x ) = d x .
J -* dx J - * dx

Quando esiste la derivata il primo membro dell’equazione prece-


d/
dente definisce la distribuzione corrispondente a — ; ma anche quando
d/
— non esiste, continua tuttavia a esistere il secondo m em bro dell’equazio-
dx j
ne, perché esiste — . Ancora una volta, il secondo membro definisce una
dx
distribuzione-, definisce un numero reale 4>(<p) (cioè il valore dell’integrale)
per ogni <ped eredita la linearità richiesta da quella della derivata:
d , , d<p, d<p,

In entrambi i casi, dunque, possiamo definire la derivata della distribuzione


associata a /, che è definita da

| % (x )/ (x )< k ,

come la distribuzione espressa come — I — / (x) dx. In conclusione, nel


J - * dx
mondo delle distribuzioni ogni funzione ha una derivata, com e Schwartz si
era prefìsso di dimostrare. Potremmo spingerci oltre fino a definire la deri­
vata di ogni distribuzione, ma tralascio qui i dettagli.
Rimane tuttavia da rispondere a un’ovvia domanda: se ogni distribu­
zione ha una derivata, esiste un «teorema fondamentale» che afferma che
la differenziazione è l’operazione inversa dell’integrazione? B ene, con le
distribuzioni non dobbiamo nemmeno parlare di integrazione, perché si
può provare direttamente che ogni distribuzione ammette un'antiderivata
o primitiva. In altre parole, per ogni distribuzione f esiste una distribuzione
F tale che
Il teorema fondamentale del calcolo 125

Anche in questo caso (come nel calcolo differenziale usuale) l’antiderivata F


d if è unica a meno di una costante additivo: cosi si esprime il teorema fonda-
mentale del calcolo per le distribuzioni.

8. L’estensione di Robinson del concetto di numero.

Nella storia che abbiamo delineato fino a questo punto, un importante


filo conduttore è stato il tentativo di sbarazzarsi degli infinitesimi usati da
Newton, Leibniz e dagli altri padri fondatori del calcolo. Gli infinitesimi - o
le «flussioni», secondo la terminologia di Newton - furono aspramente criti­
cati dal filosofo George Berkeley nel suo The Analyst, pubblicato nel 1734:
E cosa sono queste flussioni? L e velocità di incrementi evanescenti. E cosa sono
questi stessi increm enti evanescenti? Essi non sono né quantità finite, né quantità
infinitamente piccole c neppure nulla. Non dobbiamo forse chiamarli i fantasmi di
quantità defunte*?

La critica di Berkeley pungeva i matematici nel vivo, ma dovette trascorre­


re molto tempo prima che potessero trovare una risposta soddisfacente. E
quando la trovarono, la risposta era assai complicata.
Negli anni Venti del xix secolo, come abbiamo visto, Cauchy introdusse
il concetto di limite per definire la continuità. Inoltre, Cauchy definì dy/dx

come limite di un rapporto Ay/Ax e l’integrale J /(x) dx come limite di


una somma, dimostrando che l’integrale esiste per ogni funzione continua.
Anche cosi, tuttavia, alcune proprietà basilari delle funzioni continue ri­
masero indimostrate; per esempio, la proprietà del valore intermedio: s e fè
continua sull’intervallo [a, b] assume ogni valore compreso trofia) ef(b). Un
notevole tentativo di dimostrare la proprietà del valore intermedio fu fatto
a partire dal 1816 dal sacerdote boemo Bernhard Bolzano, ma la dimostra­
zione di Bolzano dipendeva a sua volta da una indimostrata proprietà dei
numeri reali, la proprietà dell’«estremo superiore»: ogni insieme limitato di
numeri reali ha estremo superiore1.
Nel 1858, il matematico tedesco Richard Dedekind si rese conto che i
principali problemi che si presentavano nella fondazione dell’analisi potevano

* Berkeley [1997], pp. 32-33 (traduzione leggermente modificata). Cfr. anche Smith [1959],
voi. II. pp. 627-34.
’ Sulle proprietà dei numeri reali si veda J. K. Truss, l fondamenti dell'analisi, in questo stesso
volume, pp. 427-60. [N.*/.C.].
126 John Stillwell

essere risolti solo mediante una precisa definizione di numero reale. Conside­
rando come dato l’insieme dei numeri razionali Q , Dedekind identificò ogni
numero irrazionale come un «taglio» (o «sezione») in Q . Costruire una sezione
significa semplicemente separare Q in due insiemi I e S («inferiore» e «supe­
riore») in modo tale che ogni elemento di / sia minore di ogni elem ento di S.
Se I non ha massimo e S non ha minimo, allora la sezione (/, S) corrisponde a
un numero irrazionale. Per esempio, i numeri razionali positivi r tali che r2 > 2
costituiscono l’insieme St che corrisponde al numero reale V2 .
In realtà, non soltanto ogni numero irrazionale corrisponde a una coppia
di insiemi (/, 5), ma una tale coppia si può considerare un num ero irraziona­
le, dato che fornisce una descrizione univoca. Com piendo questo salto con­
cettuale, si vede con chiarezza che i numeri razionali e irrazionali considerati
insieme formano una linea senza spazi vuoti, perché i num eri irrazionali
riempiono precisamente i vuoti lasciati dai razionali. Q uesta è la «retta dei
numeri reali», finalmente affrancata dalla geometria. Si può anche mostrare
facilmente, ammessa questa definizione, che ogni insieme lim itato di numeri
reali ha un estremo superiore e quindi che ogni funzione continua gode della
proprietà del valore intermedio.
Dedekind pubblicò questa definizione di numero reale solo nel suo libro
Stetigkeit und irrationale Zahlen (Continuità e numeri irrazionali) del 1872
[Dedekind 1963, pp. 1-27], e dopo di lui vari matematici proposero defini­
zioni equivalenti. Tutti insieme, questi matematici portarono avanti quella
che fu chiamata «aritmetizzazione dell’analisi», ovvero la ricostruzione dei
fondamenti del calcolo sul concetto aritmetico di num ero reale e sull’uso
rigoroso del concetto di limite.
Tuttavia questi matematici non riuscirono ad abband onare l ’uso dei
simboli dx, dy che tempo addietro rappresentavano gli infinitesim i, ma si
limitarono a disciplinarne l’uso, dicendo ad esempio che l’espressione dy/dx
ha senso, anche se i simboli dy e dx considerati singolarm ente non hanno
significato. Queste ambiguità hanno portato a una strana notazione ibrida,
in cui il rapporto fra i numeri Ax e Ay viene indicato con Ay/Ax, ma solo per
essere sostituito dal suo limite fantasma dy/dx non appena le quantità Ay e
Ax «si annullano».
Il nuovo calcolo rigoroso e aritmetizzato non è tanto sem plice quanto il
vecchio calcolo infinitesimale; per rendersene conto basta confrontare una
qualsiasi dimostrazione moderna del teorema fondamentale con quella di
Leibniz. Il matematico americano Abraham Robinson, profondam ente in­
soddisfatto di questa situazione, negli anni Sessanta del secolo scorso rifondò
l’analisi su basi nuove, introducendo un «rigoroso concetto di infinitesimo»
[Robinson 1966]. Per nostra sfortuna gli «infinitesimi rigorosi» sono meno
semplici di quelli di Leibniz, tuttavia è interessante sapere che possono es­
sere definiti, cosi vorrei cercare di descriverli.
Il teorema fondamentale del calcolo 127

Poiché si suppone che un infinitesimo sia diverso da zero ma, allo stesso
tempo, minore di qualsiasi numero non nullo, è certo che un infinitesimo
non è un numero. D ’altra parte si richiede che gli infinitesimi si comportino
come i numeri - si vuole sommarli, sottrarli, moltiplicarli e dividerli - e si
vuole anche che interagiscano con i numeri, in modo da dare un senso a
espressioni come 2 + dx o 3dx quando dx è un infinitesimo. Vogliamo dun­
que lavorare in un mondo in cui le operazioni aritmetiche abbiano senso,
che includa oggetti che si comportano come numeri ma anche oggetti che
possano essere considerati «più piccoli» di ogni numero diverso da 0. Tutto
ciò si può fare nel mondo delle funzioni reali, perché:
- ha senso sommare, sottrarre, moltiplicare e dividere funzioni;
- fra tutte le funzioni esistono le funzioni costanti, che si comportano
come numeri;
- esistono funzioni/(x) «più piccole» di una qualsiasi funzione costante
diversa da zero, nel senso che sono minori di una costante k ± 0 per x
abbastanza grande. Per esempio,/(x) = l/x è una funzione di questo
tipo (tratteggiata nella figura 12).

Per questi motivi si può assumere che gli «infinitesimi» siano funzioni
/ (x) i cui valori tendono a 0 quando x —» » . Questa idea funziona molto
bene per le funzioni razionali/(quozienti di polinomi) e infatti venne usata
da David H ilbert nelle sue Grundlagen der Geometrie (Fondamenti di geo­
metria) del 1899 per costruire un modello di una retta che includesse gli
infinitesimi. Come succede per i numeri reali, le funzioni razionali possono
essere ordinate stabilendo ch e/ > g quando/ (x) > g(x) per tutti gli x ab­
bastanza grandi. È dunque ragionevole parlare della «retta» delle funzioni

Figura 12.
Infinitesimi e costanti.

1/2
1/3
128 John Stillwcll

razionali; in questa retta sono inclusi gli infinitesimi, com e per esempio la
funzione razionale l/x.
È molto più diffìcile costruire una «retta» di funzioni adatte per l’analisi,
una retta che deve per forza comprendere funzioni come il seno e il coseno.
Quando si ordinano le funzioni infinitesime, come si fa a decidere qual è il
maggiore fra i due infìnitesimi/(x) = (sin x)/x e g(x) = (cos x)/x (figura 13)?
Per risolvere gli intricati problemi di ordinamento che nascono con­
frontando funzioni reali, Robinson fece ricorso alla logica matem atica - ma
si tratta di un passaggio assai complicato, che portò il calcolo verso una
direzione che molti preferirono non seguire. In ogni caso, gli infinitesimi
di Robinson permettono di rendere rigorose molte delle intuizioni sugli
infinitesimi che sedussero i matematici del xv n secolo, e consentono di
avere dimostrazioni più brevi di quelle prodotte dal program m a di arit-
metizzazione. Il teorema fondamentale del calcolo è proprio uno di questi
teoremi: la dimostrazione che usa gli infinitesimi di Robinson diventa più
elegante, anche se non uguaglia in bellezza quella fondata sui paradossali
infinitesimi di Leibniz.
Successivamente all’analisi non standard di Robinson, vi sono stati al­
tri tentativi di formalizzare il concetto di infinitesimo in modo da renderlo
meno indigesto alla maggior parte dei matematici. Non c ’è alcun dubbio
che in futuro verranno proposti nuovi tentativi, perché è fonte di insoddi­
sfazione constatare che i «veri» infinitesimi funzionino meno bene di quelli
falsi, come tuttora sembra accadere. E davvero possibile che la strada più
breve per la verità passi attraverso qualcosa di falso? Quasi 4 0 0 anni dopo
l’introduzione degli infinitesimi, questo rimane ancora un interrogativo che
lascia perplessi.

Figura 13.
Due infinitesimi: qual è il più grande?
Il teorema fondamentale del calcolo 129
B E R K E L E Y , G.
1997 Lanalista: un discorso indirizzato a un m atem atico m iscredente, Istituto Italiano
per gli Studi filosofici - Associazione culturale Porta di Massa, Napoli (tit. or.
T he Analyst; or, A Discourse A ddressed to an InfidelM athem atician, 1734).
b i r k h o f f , g . (a c u r a d i )

1973 A Source B o o k in C lassical Analysis, H arvard University Press, Cam bridge


Mass.
d e d e k in d , r .
1963 Essays on th è Theory o f Num bers ( 1901 ), Dover, New York (trad. ingl. di Stetig-
k eit und irrationale Z ahlen e Was sind und was sollen d ie Zahlen?) [trad. it.
Scritti sui fo n d a m en ti d ella matematica, a cura di F. G ana, Bibliopolis, Napoli
1 9 8 2 ].
h a w k in g , s. w . (a c u r a d i)
2005 G o d C reated th è Integers. T heM athem atical Breakthroughs That ChangedH is-
tory, Running Press, Philadelphia.
H IL B E R T , D.
18 9 9 Grundlagen d er G eom etrie (Festschrift zur Einweihung des G óttinger Gauss-
W eber D enkm als), Leipzig (II ed. rivista 1903, numerose edizioni successive)
[trad. it. Fon dam en ti d ella geom etria, con i supplementi di P. Bem ays, intro­
duzione di C . F. M anara, Feltrinelli, Milano 1970].
KOLM OGOROV, A. N. e FO M IN , S . V.
1975 Introductory R ea i Analysis, Dover, New York.
ROBINSON, A.
1966 N on-standard Analysis, Princeton University Press, Princeton.
SC H W A R TZ , L.
1997 Un m athém aticien aux prises avec le siècle , Odile Jaco b , Paris.
s m it h , D. E . (a c u r a d i)
19 5 9 A Source B o o k in M athematics, Dover, New York.
s t r u ik , d . j . (a c u r a d i)
19 8 6 A Source B o o k in M athem atics 1200-1800, Princeton University Press, Prince-
A N D R EW G R A N V ILL E

II teorema fondamentale dell’aritmetica*

1. Introduzione.

1.1. I l te o r e m a f o n d a m e n ta le .

G li interi positivi sono gli interi 1 ,2 , 3 ... .1 numeri primi sono gli interi
maggiori di 1 che possono essere fattorizzati come prodotto di due interi
positivi esattamente in un’unica maniera (senza tenere conto dell’ordine).
Quindi 2, 3, 5 , 7 , 1 1 . . . sono numeri primi, mentre 1 ,4 , 6 ,8 ,9 , 1 0 .. . non lo
sono. Questi numeri non primi > 1 vengono chiamati numeri composti: per
mostrare che 10 è un numero composto, basta notare che possiamo fattoriz­
zarlo in due maniere distinte, come 1 X 10 e come 2 X 5 .
Quando si studiano problemi riguardanti i numeri interi, ci si rende subito
conto che è utile spezzare gli interi nelle loro componenti più piccole, cioè
fattorizzarli come prodotto di primi. Quindi 3 5 è 5 X 7 e 9 0 è 2 X 3 X 3 X 5
e cosi via. In effetti, ogni intero positivo può essere fattorizzato in questo
modo. Una fattorizzazione in numeri primi non può essere ulteriormente
scomposta, dal momento che nessuno dei suoi fattori primi può essere fatto-
rizzato. Scom ponendo un numero intero si vede subito che ne esiste una sola
fattorizzazione; la dimostrazione di questo fatto non è però così semplice. In
ogni caso, si tratta di un risultato che, una volta dimostrato, fornirebbe un
solido fondamento a qualsiasi studio sugli interi positivi; per questa ragione,
nell’aritmetica, viene considerato il più fondamentale.

Teorema fondamentale dell’aritmetica. Ogni intero > 1 può essere fat­


torizzato conte prodotto di primi in maniera unica.

È il caso di sottolineare che i numeri primi che intervengono in una


fattorizzazione non devono essere necessariamente distinti (ad esempio,
12 = 2 X 2 X 3 ) , e che consideriamo due fattorizzazioni uguali se gli stessi
primi sono semplicemente scritti in ordine differente (cioè, 30 = 2 X 3 X 5
e 5 X 2 X 3 vengono considerate la stessa fattorizzazione). La maniera «ca­
nonica» più semplice per scrivere n come prodotto di numeri primi è la
seguente: n = p{'pe2’ “ ’ Pk » con p, < p2 < < pk primi e ev e2, ek
interi positivi1.

* L’autore ringrazia Jord an Bell e H enri Darmon per l’attenta lettura e i preziosi commenti.
1 In qualche caso può essere utile lasciare che alcuni degli <•, possano essere zero.
132 Andrew Granville

Molti autori antichi si interessavano ai numeri perfetti (interi uguali alla som­
ma dei loro divisori propri, come 6 e 28) e alle coppie di numeri amicabili
(ciascun numero è uguale alla somma dei divisori propri dell’altro, come
220 e 284), il che significava che avevano bisogno di poter determinare i di­
visori di un intero dato. Infatti, se n = pj'1p£' •••pi " , con p x < p2 < ■■• < pk
primi e f j, f 2, ..., interi positivi, allora possiamo dedurre dal teore­
ma fondamentale dell’aritmetica che i divisori propri di n sono gli interi
m {m # ì,m # n) della forma m = p™' p2 * •••/>* * » dove è un intero con
0 < n;.
Un’altra conseguenza del teorema fondamentale dell’aritm etica è che
possiamo determinare con facilità il «massimo comun divisore» di due nu­
meri interi qualsiasi m e n, infatti se m = \ [ isXpT' e n = 1”I ,=i P"' >
allora il loro massimo comun divisore, che si indica con (m , «), è uguale a

nk i=i 1
1 (notiamo che si tratta di una cosa «facile» solo se abbiamo
già le fattorizzazioni di m e n). I Greci si resero conto che è possibile determi­
nare il massimo comun divisore di due numeri non negativi senza conoscere
la loro fattorizzazione - il metodo è oggi chiamato algoritmo euclideo. Si
inizia con due interi « > w > 0 e si prende £ = n — m\ anche £ è quindi un
intero non negativo e un multiplo del massimo comun divisore di m e n, in­
fatti se (m , n ) —g con m = gM e « = gN allora £ = g(N —M). Di conseguenza
(m, n) è un divisore comune di £ e m, e quindi (m , n) ^ {£, m). D ’altra parte,
dal momento che n = £ + myil massimo comun divisore di £ e m divide n
e quindi, con un ragionamento analogo, (£, m) ^ (m , n). Q uesti due fatti
assieme implicano che (m , n) = {£, m ), cioè che il massimo com un divisore
di m e n è uguale al massimo comun divisore di due interi più piccoli, £em .
L’algoritmo euclideo consiste nel ripetere questo processo fino a quando uno
degli interi è uguale a 0. Si tratta di un procedimento che deve arrestarsi in
un numero finito di passi, dal momento che ci sono solo un numero finito di
interi non negativi da 0 a «. Per esempio, (22,8) = (1 4 ,8 ) = (8 ,6 ) = (6 ,2 ) =
= (4, 2) = (2, 2) = (2, 0) = 2; è chiaro che è possibile rendere più veloce
il procedimento scrivendo («, m) = (m , r), con r il più piccolo residuo non
negativo di n (mod m ), e quindi (22, 8) = (8 ,6 ) = (6 ,2 ) = (2 ,0 ) — 2.
Ma c ’è di più: l e m sono entrambi combinazioni lineari a coefficienti
interi di m e n\ anche i due interi successivi nell’algoritmo euclideo sono
combinazioni lineari a coefficienti interi di £ e m e conseguentemente di m e
n. Continuando con questo ragionamento deduciamo che anche il massimo
comun divisore di m e n e una combinazione lineare a coefficienti interi di
w e » , cioè che esistono interi u e v tali che
{m, n) = mu + nv.
Ad esempio, 2 = 22 X (—1) + 8 X 3.
Il teorema fondamentale dell’aritmetica 133

Questa sorprendente osservazione ci permette di dare una dimostrazione


elegante, sebbene non intuitiva, della seguente proposizione: se un primo p
divide il prodotto di due interi a c b allora divide almeno uno di loro. Se p
non divide a allora (p, a) = 1 (dal momento che (p , a) dev’essere un divisore
di p, o è 1 o è p stesso, ma non può essere p poiché p non divide a), e quindi
esistono due interi u e v per i quali pu + av — 1. Pertanto pbu + (ab)v = b
e quindi p divide b , dal momento che p divide sia p(bu) che (ab)u. Da qui
deduciamo, per induzione, che un primo p che divide un prodotto di interi
divide almeno uno di loro.
A questo punto siamo pronti a dimostrare che esiste una sola fattorizza-
zione per un qualsiasi intero dato: sepjp2 •••p* — #]<y2 ••• ^ é il più piccolo
controesempio (è possibile che duep,, o due qjy siano uguali), allora q( divide
p,p2 •••Pi» quindi deve dividere uno dei fattori, mettiamo pk. Essendo pk
primo, dobbiamo avere pk = q f\abbiamo cosi trovato un controesempio più
piccolo p,p2 •••p/._i = q {q2 ••• 4,-\, il che è una contraddizione.
Q uesto complesso di idee ha ispirato molti degli sviluppi che si sono
verificati in teoria dei numeri, in algebra e in altri settori della matematica,
come vedremo nel seguito.

1.2. U n a s to r ia c o n fu s a .

Le idee chiave che intervengono nel teorema fondamentale dell’aritmeti­


ca sono state probabilmente individuate da ogni società che abbia riflettuto
a fondo sulla matematica, e fu il genio dei matematici della Grecia antica (e
forse della M esopotamia), e successivamente dell’intero bacino del Medi-
terraneo, a rendersi conto che tali affermazioni, si può dire «autoevidenti»,
sarebbero state giustificate in un modo migliore facendo ricorso a dimo­
strazioni derivanti da proposizioni ancora più evidenti. La maggior parte di
queste culture matematiche antiche compresero che gli interi possono essere
fattorizzati in numeri primi, come passaggio essenziale per determinare tutti
i divisori di un intero dato (come abbiamo fatto sopra). Nel fare questo
devono aver quasi sicuramente assunto, forse senza rendersene conto, che
la fattorizzazione di un intero è unica; fu solo grazie al genio del giovane
Gauss che si capi che questa osservazione fondamentale richiede una di­
mostrazione, il che permise che diventasse la pietra angolare della teoria dei
numeri. In seguito questo risultato è stato celebrato come il più agile e abile
ragionamento nella storia del pensiero umano.
Le parti dei libri degli Elementi di Euclide giunte fino a noi sono tra i più
antichi testi matematici conosciuti. È un’opera in cui si trovano molte cose
degne di nota; in particolare, il tentativo di fornire alla matematica un’ade­
guata base assiomatica l ’ha resa, da questo punto di vista, di fatto insuperata
fino a circa due millenni dopo. Probabilmente non sapremo mai quali parti
134 Andrew Granvilie

siano originali di Euclide, anche se ritengo che le dimostrazioni concise c


irrefutabili indichino che Euclide sia stato uno dei principali esponenti di
una cultura matematica sofisticata.
Quando leggiamo quest’opera oggi dobbiamo fare attenzione ad almeno
due elementi:
- gli obiettivi di Euclide riflettevano i problemi e il pensiero dei suoi
tempi, non dei nostri, un periodo nel quale «pubblicare» era, per gli
standard odierni, incredibilmente costoso. Di conseguenza ciò che
scelse di presentare non può essere giudicato adeguatamente sulla
base di ciò che presenteremmo oggi;
- la notazione di quei tempi era molto meno flessibile di quella odierna,
pertanto il lettore doveva necessariamente dedurre l’intero contenuto
dell’enunciato di un teorema o di una dimostrazione da quello che
trovava scritto, e questo non sempre accadeva1. Retrospettivamente,
può sembrare impossibile che le migliori menti di quel periodo non
percepissero questa limitazione della loro notazione e non vi pones­
sero rimedio; ancora all’inizio dell’età moderna, Ferm at e Descartes,
consapevoli di questa difficoltà, lamentavano che ci fosse chi non riu­
scisse a venirne a capo.
La teoria dei numeri di Euclide comincia con l’algoritmo euclideo, che
fornisce una nozione di numeri primi fra loro. D a questo Euclid e deduce
(libro V II, proposizione 30) che se p divide il prodotto di due interi a e
b allora divide almeno uno di essi1, e ancora (proposizione 31) che ogni
intero ha un fattore primo. Successivamente, nel libro IX , proposizione
14, come se fosse frutto di una riflessione successiva, dim ostra che un
prodotto di numeri primi distinti non è divisibile per nessun altro numero
primo, cioè dimostra il teorema di fattorizzazione unica per i numeri privi
di fattori quadratici.
È facile ricavare il teorema fondamentale dell’aritmetica da queste pro­
posizioni di Euclide, e non c ’è dubbio che se l’avesse ritenuto un risultato
fondamentale l’avrebbe dimostrato. Euclide, invece, era più interessato a
elencare (con dimostrazione) tutti i divisori di alcuni numeri interi. Ad esem­
pio un «numero perfetto» è un intero uguale alla somma dei suoi divisori
propri, ed Euclide osservò (IX , 36) che 2P~xq è un numero perfetto ogni volta
che q = 2P — 1 è primo.

2 Ad esempio, quando Eudide dimostra che esistono infiniti numeri primi (libro IX, proposi­
zione 20), fornisce una dimostrazione per assurdo, assumendo che esistano solo tre numeri primi.
Si intende, evidentemente, che il lettore debba dedurre che la stessa dimostrazione valga indipen­
dentemente dal numero finito di numeri primi che si assume esistano.
’ In realtà dimostra quello che è noto come «lemma di Euclide»: se d divide ab con (d, a) = 1
allora d divide b.
Il teorema fondamentale dell’aritmetica 135

Il testo più antico che contiene una chiara affermazione del fatto che ogni
intero positivo può essere scritto come un prodotto finito di numeri primi
risale ad al-FàrisT, vissuto in Persia attorno al 1300. Nel suo testo sulle coppie
amicabili, forni la coppia 2kpqt 2kr, che è amicabile sep = 3 •2k~x — 1, q =
= 3 •2k — 1 e r = 9 •22* -1 — 1 sono tutti numeri primi, per k > 2 .
Perfino a matematici come Eulero e Legendre sfuggi l’importanza della
fattorizzazione unica, e fu necessario attendere le Disquisitiones Arithmeticae
di Gauss [1801] per poter finalmente leggere, all’articolo 16: «Un numero
composto può essere fattorizzato in maniera unica come prodotto di primi».
In questa sua opera, di grande bellezza, Gauss riconosce a Euclide il
merito di tutte le idee essenziali che si trovano airintem o di questa affer­
mazione4.

1.3. F r a z io n i c o n tin u e .

Riscriveremo l’algoritmo euclideo e alcune sue generalizzazioni in varie


maniere, per mettere l’accento su idee differenti. Forse la più antica è quella
che riguarda la determinazione della frazione continua — , con m e n interi
positivi. Cosi, ad esempio, se m = 30, n = 13, cominciamo l’algoritmo eu­
clideo notando che 13 X 2 ^ 3 0 < 13 X 3 e quindi prendiamo 4 = 3 0 — 13 X 2 .
Di conseguenza passiamo da considerare la frazione — a considerare la
4 13
frazione — . Questo passaggio può essere scritto come

*> = 2 + ^ .
13 13

Notiamo che 2 = ^ove con W indichiamo il più grande numero

intero minore o uguale a t. Nell’algoritmo di Euclide vogliamo che il numero


più grande venga prima e quindi invece della frazione — prendiamo — ;
cioè invertiamo la frazione: ^ ^
M = 2+ ± .
13 13

Ripetiamo quindi questo procedimento: dapprima abbiamo 3 = £“^J» per


cui — = 3 + —, e quindi otteniamo la «frazione continua»
4 4

4Si vedano Collison [1980] e Knorr [1976] per ulteriori informazioni.


136 Andrew Grnnvillc

*> = 2 + *
13 3+ -
4
Se l’algoritmo di Euclide richiede molti passi successivi per una particolare
coppia m, nt allora la frazione continua diventa lunga e difficile da impagi­
nare; adottiamo quindi la notazione più conveniente

Questa notazione contiene però un’ambiguità; avremmo infatti potuto scri­


vere [2 ,3 , 3, 1]. Per evitare questa ambiguità, decidiamo di non terminare
mai una frazione continua con un 1.
Si può creare una frazione continua per ogni numero reale a: si ha
a = [aQ, a., ...] dove an = [a ] e [ait a2, ...] = ---------- . Di solito scri-
p a " ao
viamo — = [a0, ax, ..., a ], e dalla definizione si può dim ostrare che

— < ot < 2* +1 per ogni k > 0 .


42k Qik+x
C ’è un’altra maniera, piuttosto utile, per rappresentare le frazioni con­
tinue, facendo uso di matrici 2 X 2 , che, stranamente, è stata scoperta solo
di recente (negli anni Quaranta del Novecento). Si com incia considerando

la nostra coppia come un punto ^ j nel piano, dopodiché si determinano

tutte le coppie di interi come punti del piano che si ottengono tramite tra­
sformazioni lineari dal punto iniziale. Quindi

G
otteniamo cosi
C :)(:>)-»
C -J(”
)■(:i)C?)GK*}
Moltiplicando entrambi i membri per l’inversa della m atrice 2 X 2 otte-
marno

G K :)»
Il teorema fondamentale dcll'arìtmctica 137

quindi

G K :)(::)(::
doveg = (3 0 ,1 3 ) = 1. In effetti, si ha

(»K :)(: X 3
con — = [2 ,3 ,4 ] e - = [2,3]. Calcolando i determinanti di queste ma­
trici troviamo 3 0 - 3 — 1 3 -7 = —1, cioè otteniamo una combinazione lineare
a coefficienti interi di 30 e 13 che fa 1.
Per ogni numero reale a questo procedimento può essere generalizzato
per ottenere
(Pn P » - . W * o 1) (*„ 0

U„ 1,-1 J U o JU oj (l oj
in maniera tale che - P„-Xq„ — ( - 1 )"“ 1, e quindi

Pn +1 l
a —— < = ------------- <
In 4 n +1 1

Tutti i passaggi di questo esempio si possono generalizzare direttamente


a qualsiasi frazione — con mt n > 0. È importante capire la geometria che

sta dietro a questa rappresentazione. Tutti i punti appartengono al primo
quadrante (quello in alto a destra) del piano complesso; cominciamo con
un punto che sta a destra della retta y = x (o che vi appartiene). Il primo
passo, che consiste nel sottrarre un opportuno numero intero a, si traduce
nel traslare orizzontalmente il nostro punto iniziale di un multiplo intero
di y nell’unico punto avente stessa ordinata yt ma ascissa x a sinistra della
retta y = x, sempre rimanendo nello stesso quadrante. Questo passo, che
può essere visto come a copie del passo base di grandezza y verso sinistra,

viene espresso in forma matriciale come [ 1 -1 1 • II secondo


lo i j lo U
passo prende un punto a sinistra della retta y = x e opera una riflessione
rispetto alla retta stessa, producendo un punto con un valore della y più

piccolo. La matrice corrispondente a questa trasformazione è ^ ^ j . Con

ogni coppia di passi di questo genere troviamo un nuovo punto posto più in
basso e più vicino all’origine rispetto al punto di partenza; iteriamo questo
procedimento finché raggiungiamo l’origine. L’ultimo punto prima di arrivare
138 Andrew GranviUe

all orìgine si troverà sull’asse x con coordinate (g, 0), dove g = (w, rt). Questa
interpretazione e le due trasformazioni base coinvolte torneranno nuovamente
utili in seguito quando avremo a che fare con numeri più complicati.

1.4. R a d ic i q u a d ra te .

Possiamo usare il teorema fondamentale dell’aritmetica per dimostra­


re che, se un numero intero « è il quadrato di un numero razionale allo­
ra dev’essere il quadrato di un numero intero’: se « = f ] .= 1p allora

m2 = *e n ~ 0 ;=iP"!' ' P\< P2 < " ‘ < Pk«® ^ quadrato


di un intero se e solo se ogni ntè pari. Quindi ci possiamo chiedere se si può
scrivere n = come il quadrato di un numero razionale quando
almeno uno dei suoi esponenti ni è dispari, ad esempio n} . Se il numero

razionale di cui « è il quadrato è ^ o possiamo scrivere n = ^ j e

quindi a2 = nb 2. Se la potenza massima con cui pj divide a viene indicata


con p“’ (e rispettivamente pb- per b), allora deduciamo che il massimo
esponente per cui p} divide a2 è 2 aj, che è pari, e il massimo esponente per
cui pjrdivide nb2 è n} + 2 bj, che è dispari, il che contraddice il teorem a fonda-
mentale dell’aritmetica. Abbiamo pertanto dimostrato che V 2 è irrazionale
e, in effetti, yfn è irrazionale quando n è un qualsiasi intero positivo privo
di fattori quadratici.
Il numero emerge in maniera naturale in molti contesti nella matematica
(ad esempio come lunghezza dell’ipotenusa di un triangolo rettangolo isoscele
con i cateti di lunghezza 1) e di conseguenza è interessante capire com e fun­
ziona l’aritmetica di numeri della forma a + b ^ l dove a e b sono numeri in­
teri. Ci possiamo domandare se per questi numeri valga un qualche risultato
analogo al teorema fondamentale dell’aritmetica. Quando si prova a rico­
piare passo per passo la nostra dimostrazione originale in questo caso, ci si
imbatte in una barriera inaspettata: per gli interi usuali abbiamo adoperato il
fatto che esistono solo un numero finito di interi positivi minori di un intero
dato, e per i polinomi (come avremo modo di vedere) useremo che esistono
solo un numero finito di possibili gradi minori di un grado dato.
In tutti e due i casi d siamo serviti dell’esistenza di un minimo intero po­
sitivo. Quindi, anche per i numeri della forma r + jV 2 avremmo bisogno

* Q uesto risultato viene attribuito al giovane Tccteto nell’om onim o dialogo di Platon e, datato
an o m o al 390 a .C
Il teorema fondamentale dell’aritmetica 139

che esistesse il minimo intero positivo della forma r + s j i con r e s interi


positivi, ma questo non è vero! Per mostrarlo facciamo uso di un’elegante
argomentazione dovuta a Dirichlet: dato un qualsiasi numero reale /, definia­
mo {/) come la «parte frazionaria» di /: {/ }= / — [/]. Notiamo che 0 ^ {/} < 1
per ogni numero reale t. Supponiamo adesso che esista il più piccolo intero
positivo della forma r + j-v/I con r e s numeri interi, e scegliamo un intero
N tale che r + syfl > I numeri 0, {V2 }, {2V2 }, {3V2 [Ny/Ì) stanno
tutti fra 0 e 1, e così due di loro, per esempio
r
[N i] e
r
{/V2 } conO
non possono distare più di — Si può scrivere i 4 l = r; + {/V2 } e
N
j 4 l = ri + [jyJ2} per opportuni interi rt e rfì cosicché, posto a = rf — rf e
b = i —jy otteniamo

|a + by[2 j = |{/V2 } - [jyfì) |< -^ < r + j-n/I;

pertanto, o a + b>Ì2 o —a — byfi contraddice la minimalità di r + s-J2.


Euclide si rese conto deH’importanza dell’esistenza di un minimo intero
positivo6, ma solo nel xix secolo si trovò il modo di estendere le idee sull’uni­
cità della fattorizzazione senza ricorrere a questa proprietà.

2. Fattorizzazione unica in altri domini?

2.1. P o lin o m i.

In matematica si impara abbastanza presto che una volta trovate le ra­


dici di un polinomio dato è possibile fattorizzarlo completamente. Questa
affermazione è più insidiosa di quanto potrebbe apparire a prima vista, dal
momento che presuppone che esista un solo modo per fattorizzare un po­
linomio (cioè che è impossibile trovare più di un modo per fattorizzare un
polinomio). Dobbiam o fare molta attenzione ad affermazioni di questo ti­
po, apparentemente innocue; infatti se consideriamo il semplice polinomio
x2 — 1 = (x - l)(x + 1), non nel suo solito contesto ma lavorando (mod m)
per vari interi m , ci rendiamo conto che questa semplice assunzione diventa
subito falsa, perché si ha, per esempio, x 2 - 1 = (x - 3)(x + 3) (mod 8) e
x2 — 1 = (x — 4)(x + 4) (mod 15), e così via7. Comunque, nel contesto usua-

‘ Si veda, ad esem pio, la proposizione 31 del libro V II, nella quale dimostra che ogni numero
intero contiene un fattore primo.
7 D ue polinom i / e g a coefficienti interi sono congrui (mod m ì s e / - g c m voice un polinomio
a coefficienti interi.
140 Andrew Granvillc

le, vale iJ seguente teorema fondamentale; ogni polinomio a coefficienti in


C può essere fattorizzato, in maniera unica, come prodotto di una costante
per un prodotto di polinomi monici di primo grado".
Il teorema fondamentale dd l’aritmetica si può ottenere nel caso dei poli­
nomi più o meno nello stesso modo con il quale abbiamo ottenuto il teorema
fondamentale dell’aritmetica nel caso degli interi, dimostrando che un algo­
ritmo euclideo, adeguatamente modificato, vale anche in questo caso. Qui
il massimo comun divisore di due polinomi è il polinomio monico di grado
massimo che divide tutti e due i polinomi iniziali. Quindi, se cominciamo
l’algoritmo euclideo con due polinomi /e g aventi i termini di grado massimo
risp ettiv a m e n te ^ e Ax°, c o n d ^ D e a e A diversi da zero, allora possiamo
definirei = / — (a/A)xJ~Dg e dimostrare che (/, g) = (g, h). Dal momento che
i gradi di g e b sono minori di quelli di/e g, questo processo terminerà in un
numero finito di passi. Possiamo fare uso di questa analogia con l’algoritmo
euclideo per gli interi per dimostrare il teorema fondamentale per i polinomi
in maniera completamente analoga.
Lo stesso algoritmo, adeguatamente modificato, funziona anche per cop­
pie di polinomi modulo p, con p numero primo, ma non modulo numeri
composti. Il punto chiave è che abbiamo bisogno di poter invertire il coeffi­
ciente j4 (diverso da zero) del termine di grado massimo, il che non è detto
sia possibile se Panello degli interi modulo m contiene divisori dello zero - ad
esempio 4 - 2 = 0 (mod 8) e 5 ■3 = 0 (mod 15).

2.2. D ove non c ’è fa tto r iz z a z io n e u n ic a !

Abbiamo già visto che i polinomi modulo numeri che non sono primi
non hanno tutti fattorizzazione unica. Non si tratta di una cosa troppo sor­
prendente quando ci troviamo a lavorare in anelli con divisori dello zero,
cioè nei quali esistono interi r e i diversi da zero tali che rs = 0 (mod m). La
domanda diventa quindi: c ’è fattorizzazione unica in domini in cui non ci
sono divisori dello zero?
L’insieme dei numeri {a + b -J-6 \a,b e Z} è un anello senza divisori del­
lo zero, ma abbiamo due fattorizzazioni di 6, precisamente - 1 x 6 x 6
e 2 X 3, con ^ , 2 e 3 tutti irriducibili nel nostro anello; in altri ter­
mini 2, 3 e non possono essere espressi com e prodotto di altri
due numeri dell’anello, senza che uno di questi sia 1 o — 1. Per far ve­
dere che né 2 né 3 possono essere scritti in questo modo, notiam o che
se un intero è uguale a {a + b j^ 6 ){c + d j ^ 6 ) allora ad + bc = 0; cioè

' Un polinomio si dice monico se il cocfficicntc del termine di grado m assim o è 1 . Q uindi i
polinomi monici lineari sono quelli della forma x —a per qualche a E C.
Il teorema fondamentale dell’aritmetica 141

esistono interi primi fra loro r, s tali che a + byf^6 = t{r + S y p 6 ) e


c + d-J- 6 = uir - SyJ-6) per opportuni interi t e u. Il nostro intero di
partenza risulta perciò uguale a /«(r2 + ór2) e quindi, evidentemente, di­
verso da 2 o 3, a meno che r — ± 1 e i = 0, una soluzione che non for­
nisce una fattorizzazione valida. Quindi l’anello {a + byf—6 \a,b G Z}
non è a fattorizzazione unica. Per poter essere in grado di studiare la sua
aritmetica abbiamo bisogno di un modo per supplire a questa mancanza.

2.3. L ’ u ltim o te o re m a di F e r m a t’.

Il primo di marzo del 1847 Lamé affermò, in una seduta dell’Académie


des Sciences di Parigi, di aver dimostrato l’ultimo teorema di Fermat: non
esistono soluzioni intere diverse da zero a x" + y" = ? con « > 3. Possiamo
supporre che x, y, z siano a due a due primi tra loro (in caso contrario pos­
siamo dividere ambo i membri per il fattore comune) e che « sia un numero
primo dispari (Fermat aveva dimostrato il caso con n — 4, e una potenza
di grado rs è anche una potenza di grado r). Inoltre, dal momento che « è
dispari possiamo permutare x, y e —z per essere sicuri che « non divida z.
Notiamo che se ax, a2, ..., aksono numeri interi a due a due primi fra loro
il cui prodotto è la potenza «-esima di un intero, allora, usando il teorema
di fattorizzazione unica possiamo dedurre che ciascuno degli è la potenza
//-esima di un intero. L’idea di Lamé era di riprodurre la stessa argomenta­
zione per l’equazione di Fermat. Per prima cosa fattorizzò zP —x" + y* come
(x + y)(x + £y)(x + tfy) ... (x -I- {"''y) con £ = ^ " u n a radice «-esima
primitiva dell'unità, e quindi dimostrò che (x + £')>, x + gy) = 1 se / ^ j. Da
ciò dedusse che ciascun x + XJy era una potenza «-esima, e da questa ricca
messe di informazioni ricavò una contraddizione.
Liouville parlò immediatamente dopo Lamé, notando che sembrava es­
serci una lacuna nella dimostrazione precedente. L’affermazione che, se un
prodotto di polinomi a coefficienti interi in £, a due a due primi è uguale a
una potenza «-esima, allora ciascuno dei polinomi è esso stesso una potenza
«-esima, doveva essere giustificata. L’analogo risultato per gli interi si basa
sulla fattorizzazione unica e Liouville riteneva necessario dimostrare che
valesse anche in questo caso. Inoltre, anche qualora la proprietà di fattorizza-
zione unica fosse verificata - osservò Liouville - tutto ciò che si può dedurre
è che ciascun fattore è un 'unità moltiplicata per una potenza «-esima, dove
con il termine unità intendiamo un numero che divide 1. Ci sono solo due
unità negli interi, cioè 1 e —1, e sono entrambe potenze «-esime, dal mo-

’ Su questo argomento si veda anche M. Bertolini, L'ultimo teorema di Fermat, in questo stesso
volume, pp. 313-34. [ N.d.C.].
142 Andrew Granvillc

mento che n è dispari. Nella nostra situazione, invece, ci sono altre unità: ad
esempio, £* per ogni k , con 1 ^ k ^ n — 1, o esempi anche più complicati,
come £ + £ (infatti (£ + £)( £ + £5 + £9 + • + £2" -1 ) = 1); in molti casi si
può dimostrare che non si tratta di potenze //-esime.
In effetti, l’ipotesi della fattorizzazione unica è sbagliata; Cauchy dimo­
strò un paio di mesi dopo, sempre nel 1847, che non è verificata per n = 23.
Discussioni dello stesso genere si erano tenute alTAccademia di Berlino uno
o due anni prima, con il coinvolgimento di Dirichlet e Kummer, anche se non
ci sono rimaste notizie precise e dettagliate di chi e quando sostenesse cosa.
Ciò che sappiamo è che queste discussioni condussero Kum mer allo svilup­
po di un’appropriata teoria alternativa, quella degli ideali (lo vedremo nel
prossimo paragrafo), e fu in grado di usarla per far risorgere la dimostrazione
che Lamé aveva tentato del teorema di Fermat per certi esponenti primi n, i
primi regolari, come avremo modo di discutere tra breve.

3. Una teoria generale.

3.1. Id e a li.

Iniziamo nuovamente con due interi « > w > 0 e poniamo ( = n — m.


S e r e s sono due interi qualsiasi, allora mr + ns = Cs + m{r + s), e se t e u
sono due interi qualsiasi, allora it + mu = m{u — /) + nt\ l’insieme delle
combinazioni lineari a coefficienti interi di m e n e perciò uguale all’insieme
delle combinazioni lineari a coefficienti interi di t e m. Facendo uso di questa
osservazione a ogni passo deH’algoritmo euclideo, scopriam o che l’insieme
delle combinazioni lineari a coefficienti interi di m e n e uguale all’insieme
dei multipli interi del massimo comun divisore di m e n.
Questo fatto portò Kummer a una feconda generalizzazione della no­
zione di massimo comun divisore. Un intero può essere identificato dal
suo insieme di multipli e quindi il massimo comun divisore di m e n può
essere identificato con l’insieme delle combinazioni lineari a coefficienti
interi di m e n . Si può generalizzare ad altre situazioni: invece di cerca­
re l’intero più grande che divide ogni intero in un insieme dato, lavoria­
mo con l’insieme delle combinazioni lineari a coefficienti interi del nostro
insieme dato. Quindi se A è il nostro «anello degli interi» (per esempio,
Z, Z[t] e Z[yf2] = [a + b^fì |a,b E Z }), allora per ogni m v . ..,m r G A
definiamo l’ideale
(mv ...,m r) = {alml + ■■■ + a/nr \av ...,a r G A }.
L’esempio più semplice di ideale, un «ideale principale», è un ideale che può
essere generato da un solo elemento, in altre parole è della forma (m) per
qualche m E .A . Abbiamo visto prima che in Z ogni ideale generato da due
Il teorema fondamentale delTaritmetica 143

interi può essere scritto come un ideale generato da un solo intero, e quindi
è un ideale principale. Per induzione sul numero dei generatori, possiamo
perciò dedurre che ogni ideale in 2 è principale e quindi che Z è un «domi­
nio a ideali principali».
G li ideali di z\_\[d ] non sono sempre principali, per esempio l’ideale
( 2 , ^ 6 ) non lo è 10. Comunque ogni ideale in z\_\[d] può essere scritto
in termini di al più due generatori e, in effetti, tutti gli elementi dell’ideale
sono combinazioni lineari a coefficienti interi di questi due generatori. Sia
r + s j d un elemento del nostro ideale con s > 0 minimale; affermiamo che
j divide n per ogni altro elemento m + n j d dell’ideale; infatti, supponiamo
non sia cosi, possiamo allora scrivere n = qs + r, con 1 < r < j — l e quindi
{m + nyfd) - q {a + s\fd) = (m - aq) + r\[d appartiene al nostro ideale,
il che contraddice la minimalità di s. Di conseguenza ogni altro elemento
dell’ideale è un multiplo intero di r + s-Jd più qualche intero, cioè una com­
binazione lineare a coefficienti interi di r + syfd e del massimo comun divi­
sore di quei numeri interi, chiamiamolo m. Ora, sd + ryfd = y[d(r + syfd)
appartiene anch’esso all’ideale, come myfd, e quindi s divide sia r sia m.
Scrivendo m = as e r = bs troviamo che gli elementi dell’ideale sono precisa-
mente s volte le combinazioni lineari a coefficienti interi di a e b + >[d.
Un ideale che contiene un’unità coincide necessariamente con tutto l’anel­
lo. Possiamo moltiplicare due ideali I e J ponendo IJ = {ij |/' E /,/ G /); un
insieme di generatori di IJ può essere ricavato moltiplicando fra loro i gene­
ratori di I e J.
Si osservi che IJ è contenuto sia in I sia in / (per esempio, in Z l’insieme
dei multipli di 15 è un sottoinsieme sia dei multipli di 3 sia dei multipli di 5).
Un ideale primo è un ideale che non può essere fattorizzato nel prodotto di
due ideali che lo contengono strettamente". Il risultato notevole di Kummer
è che, pur non essendoci un teorema di fattorizzazione unica per l’anello
degli interi di ogni cam po12, c ’è, in effetti, un teorema di fattorizzazione
unica per gli ideali dell’anello degli interi di ogni campo. In altre parole,
ogni ideale può essere scritto in modo unico come prodotto di ideali primi.
Questa nozione è essenziale per essere in grado di lavorare con l’aritmetica
dei campi di numeri. Nel nostro esempio precedente notiamo che

10 Se ( 2 , ó) fosse uguale a {a + byf^Z) allora a2 + bti* dividerebbe 2, il che implica a = ± 1 ,


b = 0 , ch c è impossibile dal momento che 1 non c una combinazione lineare di 2 e -J-6.
" I n Z ignoriamo per convenzione fattorizzazioni del tipo 5 = 5 X 1; a livello di ideali, ciò
corrisponde a (5) = (5 )( 1 ) = (5 )Z, ma in questo caso solo Z contiene strettamente (5).
12 Definirem o l ’«anello degli interi» di un campo di numeri nel prossimo paragrafo.
144 Andrew Granville

( 2, V ^ ó )2 = (2 2,2 7 ^ 6 1^ 6 • = ( 4 ,2 7 ^ 6 ,6) = (2, 2 7 ^ 6 ) = (2),

e analogamente O . ^ - ó ) 2 = (3), e quindi otteniamo la fattorizzazione del­


l’ideale (6) in z [-\ / 6 ] in ideali primi:

(6) = (2) - (3) = (2, V=:6 ) 2(3, V17^ )2-

D ’altra parte, l’anello z [ 7 ó ] è a fattorizzazione unica e quindi l’ideale


(6) si fattorizza in ideali primi come

(6) = (2 + J 6 ) ( 2 - V ó X 3 + V 6 )(3 - -y/—6 );


ma notiamo che non possiamo dedurre che il prod otto dei numeri
(2 + y/6)(2 - >/6)(3 + V 6)(3 - Vó) sia uguale a 6; infatti è uguale a —6.
Cosa spiega questa differenza di un segno meno? In generale, se abbiamo
due ideali principali (a) = ((3), allora p E (a) e quindi (3 è un multiplo di a,
e viceversa. Si ha quindi a = «p, con u e — appartenenti al nostro anello.
u
Se l’anello è Z allora l’unica possibilità per « è 1 o —l , e l o stesso vale per
Z [V —ó ] . In un campo di numeri più complicato, invece, potrebbero es­
serci più possibilità: per esempio in possiamo avere u = 5 + 2-Vó

poiché — = 5 - 2V6 e, più in generale, se u = ± (5 + ly fb Y per qualche


U 1
intero k , allora — = ± (5 - 2-J&Y . Numeri di questo tipo sono unità, ed è
necessario comprenderne meglio la natura.

3.2. C am pi di n u m e ri, in te r i a lg e b r ic i e u n ità .

Abbiamo fatto uso del termine «anelli di interi» senza definizione, al che
dobbiamo porre rimedio. Si può pensare a una frazione com e la soluzione
di un’equazione di primo grado a coefficienti interi; ciò che caratterizza gli
interi è che l’equazione di primo grado è monica. Questo punto di vista si
può generalizzare facilmente: un numero algebrico a è la radice di un poli­
nomio irriducibile a coefficienti interi (detto polinomio minimo di a ), e un
intero algebrico è un numero algebrico con polinomio minimo monico. Vale
la pena notare che se a è un numero algebrico allora esiste un intero positivo
m tale che ma è un intero algebrico. Inoltre la somma e il prodotto di due
interi algebrici sono ancora interi algebrici.
Dato un insieme finito di numeri algebrici {otj, a 2, ..., a *), l’insieme delle
funzioni razionali, a coefficienti interi, in otj, a2, ..., ak è chiamato «campo di
Il teorema fondamentale ddl'aritmctica 145

numeri», e viene indicato con Q (a j, a 2, a * ) ”. Quindi Q {yfd), l’insieme


delle funzioni razionali in yfd, è un campo di numeri, detto «campo quadra­
tico» (possiamo supporre che d sia privo di fattori quadratici, dal momento
che m = byfd). G li interi di questo campo sono gli interi algebrici ap­
partenenti al campo. Notiamo che moltiplicando numeratore e denomina­

tore di r + 5yfj_ per u _ Vy[ J possiamo assumere che tutti gli elementi di
u + v\Jd

Q {yfd) abbiano la forma - — , con r, s, t interi tali che (r, s, t) = 1 e

t > 0. Ma r + è radice di Ac2 — 2 rtx + t2 — ds2, e quindi può essere

un intero algebrico se e solo se t2 divide (2 rt, r2 —ds2). In questo caso nessun


numero primo disparip può dividere t, perché altrimentip dividerebbe r e p
dividerebbe j, dal momento che d è privo di fattori quadratici; allo stesso mo­
do 4 non divide t. Quindi ci sono solo due possibilità: o / = 1 oppure t = 2
con r t s dispari e d = 1 (mod 4); dunque l’anello degli interi di Q {yfd) è
z [ V 7 ] , l’insieme delle combinazioni lineari a coefficienti interi di 1 e 4 d ,
1 + yfd
se d = 2 o 3 (mod 4), oppure Z 'insieme delle combinazioni

lineari a coefficienti interi di 1 e Sc d = l (m od4).


2
P er determinare le unità dobbiamo trovare quegli interi algebrici u tali

che — sia ancora un intero algebrico; in altre parole le unità sono le radici di
u
polinomi monici irriducibili con termine costante 1 o —1. Quindi in Q (J~d)
stiamo cercando r + s>fd con r, s interi tali che r2 —ds2= 1 o —1 e, nel caso

in cui d = 1 (mod 4), quei r + , con r —s pari, tali che r2 — ds2= 4 o —4.

Per esempio 5 + 2>/ó, 1 + yfì, 1 + e Possiamo dedurne che

in Q (yfd) non ci può essere un’unità diversa da 1 o - 1 quando d < 0 , tran-

“ Una funzione razionale è il quoziente di due polinomi.


146 Andrew Granville

nc nei casi d = —3 e d = —1. Vedremo più avanti che esiste sempre un’unità
diversa da 1 e —1 quando d è positivo e privo di fattori quadratici.
Se u e u' sono unità, allora anche uu' e — sono unità; pertanto, le unità
u'
in un campo di numeri dato formano un gruppo m oltiplicativo. Le unità
di ordine finito sono le radici dell’unità, le altre hanno ordine infinito. II
gruppo delle unità è quindi della forma T © Z r dove T, il sottogruppo
di torsione degli elementi di ordine finito, è un gruppo ciclico finito, e r è
il rango delle unità, che descrive l’insieme delle unità di ordine infinito nel
campo. Le unità di ordine finito nei campi quadratici sono 1 e —1, nonché

± , e Q ( 7 = 7 ) , e ^ i ^ e Q ( 7 U ) . I campi quadratici immaginari


hanno rango delle unità zero, e i campi quadratici reali hanno rango delle
unità uno; quindi ad esempio gli elementi del gruppo delle unità in Q (Vó )
sono ± (5 + 2yJZ)*, k E Z , gruppo che ha la struttura Z / 2Z © Z.

3.3. G li in te ri di G a u s s.

Gli interi di Gauss sono l’insieme degli interi algebrici in Q(/) con
/ = 7 - 1 , che risulta essere uguale a Z[t], le com binazioni lineari a coef­
ficienti interi di 1 e /. Si tratta di un anello a fattorizzazione unica (a meno
di unità), e ci si potrebbe chiedere come si fattorizza in questa struttura
un numero primo di Z. La prima cosa da tenere in considerazione è che se
p = (a + ib)(a - ib) allora p = a2 + b2. Dal m om ento che i quadrati pos­
sono essere solo 0 o 1 modulo 4, è evidente che p ^ 3 (m od 4 ). Abbiamo
che 2 = 1 + 1 = (1 + /)(1 — /) e quindi 2 si fattorizza; di conseguenza la
questione rimane solo peri primi = 1 (mod 4). Ferm at ha m ostrato che primi
siffatti sono la somma di due quadrati; noi lo proveremo assumendo il fatto
(di facile dimostrazione) che - 1 è un quadrato m odulo p ogni volta che
p = 1 (mod 4 )M. Supponiamo che t sia un intero per il quale vale Z2 + 1 = 0
(m odp). L’insieme {/' + jt |0 ^ ^ [>/p]} ha ([>/p] + l ) 2 > p ele­
menti, e quindi due di essi devono essere congrui m odulo p, supponiamo
per esempio i+ j t = l + J t (mod p). Prendendo a = i — l e b = j - J ottenia­
mo che a e b non possono essere entrambi uguali a 0, e che |a |, |b\ < yfp,

MSe x = si^a

(/>- !)(/>- 2) •(/>- - ^ ì - (-1)“ xe x (mod p).


e perciò V 1 /
x2 ^ (p - 1 )! ■ - 1 (mod p)
per il teorema di Wilson.
Il teorema fondamentale delTaritmetica 147

quindi 0 < a 2 + b2 < 2 p . Inoltre, a e - b t (mod p), sicché a2 = b2!2 = - b 1


(mod p); pertanto p divide a2 + b2. Questi due fatti insieme implicano che
a2 + b2 = p.
Ci rimane una cosa da esaminare: se p si spezza in due fattori in Z[z ] , que­
sti due fattori sono distinti? In altre parole, sep = (a + ib)(a —ih) è possibile
che a + ib = u(a — ib) per qualche unità u? Le uniche unità di 7L\i\ sono 1,
— 1, /, — il che porta a& = 0, <* = 0, <* = &, <* = —b rispettivamente. Dedu­
ciamo quindi che 2 = i (1 — i)2 è l’unico primo con fattori multipli. Quindi,
per riassumere, abbiamo dimostrato che il primo p si fattorizza in due primi
in Z[/] se e solo sep = \ (mod 4), nel qual caso i fattori primi sono distinti,
oppure se p = 2, nel qual caso l’ideale (2) è l’ideale quadrato (1 - t)2.
Tutto questo può essere facilmente generalizzato al caso di Q (\fd).
L’ideale (p), per p £ Z primo dispari, si fattorizza in due ideali primi di
<0 (yfd), se e solo se d è un quadrato modulo p. In effetti, d è un quadrato
modulo p se e solo se p appartiene a certe progressioni aritmetiche modulo
Ad. Se p non divide 4 d allora i due ideali primi nella fattorizzazione di (p)
sono distinti. In questo caso, se p divide d, allora l’ideale (p) è il quadrato di
un ideale primo” .

3.4. F a t t o r i z z a r e un p rim o p in un d a to cam p o di n u m e ri.

Come si realizza la fattorizzazione di p in un anello di interi, ad esempio


Z [a ] (l’insieme dei polinomi, a coefficienti interi, nell’intero algebrico a )?
K ronecker fece la sorprendente osservazione che questo è equivalente a
fattorizzare/(x) (mod p), dove f(x ) è il polinomio minimo di a (ricordiamo
che i polinomi minimi sono irriducibili). Supponiamo che la fattorizzazione
(unica) di/ (x) (mod p) sia
f(x ) = g,(x)r' g2(x)e1 gk{x)e* (mod p),
nella quale i gfx) sono polinomi irriducibili distinti modulo p e gli eJ interi
positivi. Allora p divide g,(ct)'' g2(ct)f' •••gt (a)e* e (& ( « ) ,* ,( « ) ,p) = 1 per
i =£ /, e quindi
(p) = (p ,g j(“ )r' • • • £ * (< * )'* ) = (p. (ot)r * ) ( p , ^ ( o t ) ^ ) - - - ( p ,^ ( a ) fO.
Se p non divide il discriminante" di / allora tutti gli e- sono uguali a 1,
pertanto

11 Altrim enti, in che m odo il primo 2 si fattorizzi richiede un'analisi caso per caso, non molto
illuminante.
u II discrim inante di un polinom io f(x ) è, più o meno, il massimo comun divisore di / (x ) e
f'(x) nell'anello Z[x] (definito com e il minimo risultato possibile dell'algorirmo euclideo in questo
contesto). Osserviam o che questo valore dev'essere divisibile per ogni primo/) per c u i/ l x) (mod p)
ha radici ripetute.
148 Andrew Granville

(p) = (p,g\M )(p,g2(<*))“ - (p.g* (<*)),


la fattorizzazione richiesta in ideali primi. Un risultato simile, ma più com­
plicato, vale quando p divide il discriminante di/.
Possiamo mostrare un bell’esempio di quanto detto, considerando il
p-esimo campo ciclotomico, Q (L ), dove i = L = una p-esima radice
gl* _ 1
primitiva dell’unità. Questa ha polinomio m in im o ----------, che è congruo a
x —1
(x - 1 1(modp) dal momento che (x - l)p = x p — 1 (modp). D i conseguenza
(p) = (P, (1 “ Óp~ ') e s»può dedurre che (p) = (1 - 0 P~1‘, cioè (p) si fattoriz­
za in ideali principali, e quindi i due membri differiscono moltiplicativamen­
te per un’unità. Non è facile trovare una buona rappresentazione di questa
unità, per esempio il suo polinomio minimo. La stessa dimostrazione implica
1_
che (p) = (1 - £*)p_1, per ogni intero k, 1 < & < p - l e quindi —— — è
un’unità.
In quella che Lamé riteneva la dimostrazione dell’ultimo teorema di Fer­
mat, di cui abbiamo discusso sopra, egli determinò l’ideale (x + gy, x + t,Jy)
con (x, y) = 1. Questo ideale contiene gli elementi (x + Qy) — (x + t/y) =
= ( £ ' - lj)y e £'(x + Ijy) - £'(x + £'>>) = (£' - £')x, e di conseguenza si ha
1 - t ‘~J
(£ '— V) (x>y) = ’ ~ !)• Abbiamo appena visto che —-— — è un’unità,

quindi il nostro ideale contiene l’elemento (1 — £) e anche l’elem ento

, . w- v . ( 1 - O y d - C ')
y — ò T g )— = *
ricaviamo cosi che (x + Qy, x + tjy) = (1 — £, x + y). P oiché 1 — £ dividep,
il nostro ideale divide (p, x + y), che è uguale a 1 se p non divide z.

4. Gruppi.

4.1. C o s tru ire le u n ità .

Supponiamo che d > 1 sia un intero privo di fattori quadratici. Se


d = 2 o 3 (mod 4), allora Z [yfd ] è l’anello degli interi di Q (yfd ); se quin­
di u = a + byfd è un’unità, allora a2 — db2 = 1 o — 1, e ( 2 a )2 —d (2 b )2 =

= 4 o - 4 . Se d = 1 (mod 4), allora Z * + ^ è l ’anello degli interi


2
di Q (y fd ), e quindi se u = — ------- , con a — b pari, è un’unità, allora
Il teorema fondamentale deM’aritmetica 149

a2 — db2 = 4 o —4. In tutti e due i casi stiamo cercando le soluzioni del-


l’«equazione di Peli»
x2 - dy2 = ± 4 ,
con x e y interi e x — y pari. Non ci interessano soluzioni con y = 0 (caso

che corrisponde alle unità ± 1). Sia (w, v) la soluzione con zd = U + il

x + yyfd_ > j
più piccolo possibile ma maggiore di 1; affermiamo che ogni soluzione con
ja forma

+ yyfd j _ + vyfd j

per qualche intero k > 1. Se cosi non fosse, sia * + il più piccolo

c- j x + y Jd ^ u + vyfd * r. ■ . j.
controesem pio. bi deve a v e re ----- ------ > ------------- per definizione di u,

v, ma allora ± —— • - — j ^ - , con il ‘± ’ scelto in modo da avere lo

stesso segno di u2 —dv2, è un controesempio ancora più piccolo, il che è una


contraddizione. La soluzione «, v è nota come la «soluzione fondamentale»
dell’equazione di Peli e ogni unità di Q ( yfd ) può essere scritta in maniera
unica nella forma ± e j per qualche intero k.
Un numero reale a ha una frazione continua di lunghezza finita se e solo
se a è razionale. Un numero reale appartiene a un campo quadratico, quindi

è della forma —-------—, con a ,b e d interi, se e solo se la sua frazione conti-


2a
nua è periodica [cfr. Baker 1984], cioè, se esiste un intero m tale ehean+m = an
per tutti gli n abbastanza grandi. Quando a = O0, </,,...] è puramente perio­
dico , cioè an+m = an per tutti gli n ^ 0, allora a = la0, aìt. ..yam_v a ] e quindi
per qualche X # 0 abbiamo

da cui possiamo dedurre che

^ - l « 2 + (*m -2 ~ Pm -\)* - Pm-2 = °*


150 Andrrw Gnrnville

La frazione continua di 4d + [V<7] è puramente p eriod ica", e quindi


a**m ~ a» Pcr lutt‘ gli w 2: I nella frazione continua di yfd. P ertanto, se
a , = [a,, a„ , , . . . ] , troviamo che

a" " ~ a' = T j ^ W ì


e, procedendo come sopra,

Espandendo e confrontando i coefficienti (interi) di 1 e y fd nell 'espressione


risultante, deduciamo che

Pm.\ = qm -[>/?]<?„_,, e dqm_x = pm ~ [y f d ] p w_lt


e quindi

p i. = < -ir ,
il che fornisce una soluzione dell’equazione di Peli. Q uesta tecnica può es­
sere fatta risalire a Brahmagupta, un matematico indiano della fine del vi
secolo, e forse addirittura a un’epoca anteriore.
Il problema dei buoi di Archimede è un epigramma di ventidue versi,
inviato dallo scienziato ai matematici di Alessandria nel 251 a.C. Inizia chie­
dendo al lettore di trovare i numeri di tori e vacche con m anto differente
(bianco, nero, fulvo e screziato) quando questi numeri soddisfano otto equa­
zioni lineari date. Archimede scrive: «Amico, se tu dirai veram ente quanti
erano i buoi del Sole, quale era il numero dei ben pasciuti tori e quante erano
le vacche di ciascun colore, nessuno dirà che sei ignorante o inesperto sui
numeri: tuttavia non sarai ancora annoverato tra i sapienti»14. F o rn isce quin­
di altre due equazioni: nella prima, una certa somma delle variabili è uguale
a un quadrato; nella seconda, un’altra somma delle variabili è uguale a un
numero triangolare. Archimede quindi aggiunge: «Se tu troverai queste cose
e se in modo comprensibile indicherai tutte le misure, va orgoglioso come
colui che ha riportato la vittoria, e sarai giudicato del tutto provetto nella
scienza»'*. Si può dimostrare tramite la teoria dell’equazione di Peli che il
problema dei buoi di Archimede è equivalente a trovare la 2329-esim a più
piccola soluzione di x2 - dy1 = 1, con d = 4 729 494 e y divisibile per 9314,
ottenendo come numero totale di capi di bestiame un intero con 2 0 6 545 ci*

” Si veda la pane finale della lezione 6.4 di Baker [1984].


“ Archimede, Opere, a cura di A. Frajeie. Utet, Torino 1984, p. 627.
I] teorema fondamentale d ell’aritm etica 191
fre decimali. Si può presumere che Archimede avesse ben chiara la difficoltà
di questo problema, poiché aveva una solida comprensione della matematica
che sta dietro adequazione di Peli*.

4.2. E l e m e n t i i rr i du c i b i l i .

L’ideale (5) si fattorizza nel campo Q(yf]9) come

( 3 - > / Ì 9 , 5 ) ( 3 + V Ì9.5),

cioè in due ideali non principali. Se restringiamo la nostra attenzione solo


agli interi algebrici del campo, allora 5 non può essere fattorizzato, cioè 5 è
irriducibile ma non primo in Q (yfl9).
Ci si potrebbe chiedere se esistono elementi irriducibili in un dato cam­
po che possono essere spezzati in un numero arbitrario di fattori primi, o
se c ’è un limite al numero di fattori primi. Se esiste un limite allora si tratta
di un qualche tipo di misura di quanto il campo di numeri dato si discosti
dall’avere fattorizzazione unica. In effetti, questo limite esiste, e cercare di
comprenderne la natura ci conduce al nostro prossimo argomento: il gruppo
delle classi.

4.3. Il g r u p p o del l e classi.

Vogliamo misurare quanto siano distanti gli ideali dall’essere principali in


un dato campo K. A questo scopo l’algebrista moderno studia «ideali modu­
lo ideali principali»: con ciò s’intende che due ideali vengono identificati se
differiscono, moltiplicativamente, per un ideale principale. Più precisamen­
te, diciamo che l e } sono equivalenti se esistono interi algebrici a e 0 in K per
i quali (a)/ = (0)/. Quindi due qualsiasi ideali principali sono equivalenti.
Ogni insieme di ideali equivalenti a un altro è una «classe di ideali»; gli ideali
principali formano dunque la «classe degli ideali principali». Ad esempio nel
campo K = Q (V -~5) si ha

(l - y p 5 ) X (2,1 + = (2(1 - y p 5 ),6 ) = (2) X (l - ^ ,3 ) ,

quindi gli ideali (2,1 + \ f-5) e (l - V— 3) sono equivalenti.


Notiamo che se due ideali / e / sono equivalenti rispettivamente a due
ideali A e B, allora IJ è equivalente a AB. Quindi possiamo definire la molti­
plicazione tra classi di ideali tramite la moltiplicazione degli ideali, e questa

1Si veda Lcnsira [2002] per maggiori informazioni su questo affascinarne problema.
152 Andrew Granvillc

moltiplicazione gode della proprietà commutativa. Evidentem ente la classe


degli ideali principali è l’identità di questa moltiplicazione. Se K = Q { J - d )
allora il prodotto di ogni ideale con il suo complesso coniugato21 fornisce
un ideale principale, pertanto ogni classe di ideali ha il proprio inverso; gli
ideali formano quindi un gruppo abeliano, chiamato «gruppo delle classi
di ideali». Se K = Q(yfd) otteniamo l’ideale inverso tram ite l ’applicazione
yfd —> —y[d\ un’analoga costruzione della classe di ideali inversa vale in
ogni anello di interi, anche se non è sempre semplice com e in questo caso.
Quante classi di ideali distinte ci sono nell’anello degli interi di un dato
campo di numeri? (Il «numero delle classi» è definito com e il num ero delle
classi di ideali distinte). In altre parole, quanto è grande il gruppo delle
classi? Se esiste una sola classe di ideali, vale a dire se il num ero delle classi
h(jQ = i t allora tutti gli ideali sono principali, siamo in un «d om inio a ideali
principali», e questo implica che abbiamo la fattorizzazione unica. Se invece
b(FQ ± 1 allora la fattorizzazione non è unica. La prima dom anda alla quale
dobbiamo rispondere è: h{K) è sempre finito o può anche essere infinito?
Se d > 0 è privo di fattori quadratici possiamo usare l ’algoritm o di Gauss,
modellato sull’algoritmo euclideo, per dimostrare che il num ero delle classi
di Z [> / -?] è finito22.
Nell’algoritnio euclideo, dati gli interi n e m, abbiam o due operazioni
possibili:
(i) Se n > m, sostituiamo n con il più piccolo residuo non negativo, ri
di n (mod m), cioè, il residuo che appartiene a [0, m). Evidentem ente
(«, ni) - (ri,m ). Nell’algoritmo della frazione continua di — questo
Tn 1 n m
significa sottrarre — da — per ottenere un num ero appartenente
Im I m
a [0,1).
(ii) Se n < w, allora semplicemente scambiamo i due num eri, confron­
tando m e n. Evidentemente («, m ) = (m , ri). N ell’algoritm o della
frazione continua di — questo significa invertire — , sostituendolo
m m m
con — .
n
Nell’algoritmo di Gauss cominciamo con due generatori a e b + \ J-d di
un ideale di Q ( J - d ) , con - d < 0 privo di fattori quadratici: osserviamo di

11 II complesso coniugato dell’ideale / è l’ideale / = (z |z e /}.


n H i f d \ c l’anello degli interi di Q {yj-d) se - d ■ 2 o 3 (mod 4 ), e un suo sottoanello se
—d s 1 (mod 4).
Il teorema fondamentale deH’arìtmetica 153

nuovo che a divide & + d. Ecco le due operazioni analoghe alle precedenti
nel caso dell’algoritmo di Gauss:

(i) Se non vale - - < b s - , sostituiamo b con il residuo più piccolo,

in valore assoluto, di b (mod a), cioè il residuo b' appartenente a

È evidente che

Ca,b + y f-d ) = (a,b’ + y j-d ).

(ii) Se - - < b < allora invertiamo - + , scrivendo P + d =

= ac per qualche intero c, e otteniam o ------ % = = — Eyi .


b + yj—d C
dentemente

(b - ypd) X {a,b + y P d ) = (d{b —y f-d ),b 2 + d) = (a) X { b - y P d ,c )

e quindi gli ideali ( a,b + -J -d ) e {c,b —y j-d ) sono equivalenti.

IÀ~d
Osserviamo che se a > allora ca = + d < «t2, cioè c < a\ in altre

parole, come 1 algoritmo di Euclide, anche quello di Gauss porta a numeri


sempre più piccoli, almeno nel caso in cui i numeri siano abbastanza grandi.
Questo dimostra, inoltre, che ciascuna classe di equivalenza di ideali contie­

ne un ideale (a, b + y f-d ) con |2b |< a < e quindi che esiste solo un

numero finito di possibilità; cioè il numero delle classi è in effetti finito.


La norma dell’ideale (a,b + y f-d ) è U ;la dimostrazione di Gauss prova

che ogni classe di ideali contiene un ideale con norma ^ ^ possibile

generalizzare questa dimostrazione e ottenere che in ogni campo di numeri


ogni classe di equivalenza contiene qualche ideale con norma al di sotto di
un certo limite, dipendente dal campo, e quindi che il gruppo delle classi è
finito.
Q uanto è grande di solito b(K)? Molto dipende da che tipo di campo
è K. Per campi della forma Q (yfd), il numero delle classi h(K) ha, tipica­
mente, un valore vicino a y[)d\ nel caso in cui d sia negativo, mentre si può
154 Andrew Granville

solo affermare che è limitato quando d è positivo. Gauss pose due domande
importanti:
- È vero che esistono infiniti d > 0 privi di fattori quadratici per i quali
il numero delle classi è uguale a uno?
- Esistono d negativi privi di fattori quadratici per i quali il numero delle
classi è uno, oltre ai nove valori seguenti: - 1 , - 2 , - 3 , - 7 , - 1 1 , - 1 9 ,
- 4 3 ,- 6 7 ,- 1 6 3 ?
La prima domanda rimane del tutto aperta. La ricerca della risposta alla
seconda domanda ha probabilmente segnato la teoria dei num eri del xx
secolo più di ogni altro problema. Negli anni Trenta venne dim ostrato che
non potevano esserci nella lista più di dieci elementi, anche se la dim ostra­
zione, per sua stessa natura, non poteva essere m odificata per determ inare
se ci fosse, in effetti, un decimo d mancante. Negli anni C inquanta Kurt
Heegner dimostrò che non esiste un decimo campo, con una dim ostrazio­
ne che non venne completamente accettata a quel tem po; oggi sappiamo
che Heegner aveva ragione e la tecnica che aveva creato per dim ostrare
questo teorema occupa oggi una posizione centrale nella geom etria aritm e­
tica. Negli anni Sessanta Alan Baker e Harold Starle ottennero due dim o­
strazioni (molto diverse e ampiamente accettate) del fatto che non esisteva
il decimo campo. Negli anni Ottanta Dorian G oldfeld, B en ed ict G ross e
Don Zagier mostrarono come è possibile trovare tutti i —d < 0 aventi un
certo numero delle classi, sia esso 1 ,2 o qualsiasi altro valore.
Con lo strumento del gruppo delle classi dimostriamo ora che, per ogni
campo di numeri K, un a irriducibile in K non può avere più di B(K) fat­
tori primi, per qualche valore B(K) che dipende solo da K. Farem o uso del
risultato di Lagrange che se G è un gruppo finito e g E G allora g*G = 1,
essendo 1 l’identità di G. Se la fattorizzazione dell’ideale (a ) in ideali primi
è V x V2 ... Vk, affermiamo che il numero di Vf in ogni classe di ideali data
non è maggiore di h(K) - 1, poiché se fosse possibile che ce ne fossero
h(K) allora il prodotto di questi ideali sarebbe principale, poniam o, ((ì) e
potremmo scrivere a = con P e 7 interi algebrici, e quindi a sarebbe
riducibile. Quindi B{K) ^ ih(K) - l ) 2; Davenport ha posto la questione,
ancora aperta, di quale sia il miglior valore possibile di questo lim ite B{K)
per un dato campo di numeri K. In effetti B(K) = B(G), dove G è il gruppo
delle classi, e B(G) è il massimo numero di elementi di un gruppo abeliano
G , tale che il loro prodotto sia l’identità, ma il prodotto degli elem enti di
ogni sottoinsieme proprio non sia mai l’identità.
Il teorema fondamentale dell’aritmetica 155

4.4. E s e m p i d i e q u a z io n i.

Troveremo adesso tutte le soluzioni intere dell’equazione


x2 + 2 = y}.
Per prima cosa osserviamo che y dev’essere dispari, perché altrimenti x
sarebbe pari e avremmo 0 + 2 = 0 (mod 4), il che è impossibile. Abbiamo
già visto che Q (> / -2 ) ha numero delle classi uguale a uno e quindi fatto­
rizzazione unica, e che le sue uniche unità sono 1 e —1, tutte e due cubo di
loro stesse. O ra
x 2 + 2 = {x + 4 - 2 .){x - y P Ì)
e i due fattori sono primi fra loro (dal momento che (y, 2) = 1); quindi
x + 4 - 2 e x - 4 —2 devono essere entrambi il cubo di qualche elemento
di /[>/—2 ] . Adesso, se x + 4 —2. = (« + vyj- 2 ) 3 per qualche intero u e v
allora 3 u*v - 2t? - 1 e quindi v = ±\ e ì u 2 = 2 + v. Questo implica che v
= 1, u = ± 1 e di conseguenza x = ± 5 ey = 3.
Applichiamo adesso lo stesso procedimento per trovare tutte le soluzioni
intere dell’equazione
x2 + \ 9 = ys.
Prima di tutto notiamo che 19 non può dividerey (altrimenti dividerebbe
anche x e l’equazione è impossibile modulo 192), e che 2 non può dividerey,
poiché non esiste alcuna soluzione di x2 + 19 = 0 (mod 8). Ora

X2 + 19 = (x + 4 -V )){x - V - I 9)
e i due fattori sono primi fra loro (dal momento che (y, 38) = 1) e quindi,
come ideali, devono entrambi essere uguali al cubo di un ideale. Ma il nu­
mero delle classi per l ’anello degli interi di Q (\ / -19) è uno, e quindi tutti
gli ideali sono principali. I noltre le sole unità sono 1 e —1, tutte e due un
cubo. Quindi se x + V - 19 = (u + v y j- 19)3 per qualche intero u e v, allora
il coefficiente di V —19 è 1 = 3 u*v - 19f^, e quindi v = ± 1 , pertanto 3 u2 =
= 19 + v, il che è impossibile. Quindi non esistono soluzioni della nostra
equazione. M a non è cosi, infatti 182 + 19 = 73!
Che cosa c ’è di sbagliato nella nostra presunta dimostrazione? Un
modo per scoprirlo è osservare che l’anello degli interi non è z [ V - 1 9 ]
ì + yf^ì9 ,
ma p iu tto sto IL --------------- , per cui avremmo dovuto scrivere
156 Andrew Granville

V—19 V
- — ^ --------I per qualche intero u e v con u — v pari. Allora
(
dev'essere 8 = 3 t^v — 191/\ la cui unica soluzione è « = 3 ,v = l e cosi pos­
siamo ricostruire l'unica soluzione (18,7) dell'equazione iniziale.
Se invece avessimo scelto di risolvere l'equazione attraverso l'aritmetica
dell'anello z [> /-1 9 ] , saremmo incappati in un altro problema: il numero
delle classi di questo anello è 3, e questo implica che la radice cubica di
un ideale principale può benissimo non essere principale. Sorgono quindi
nuove complicazioni.
Lavoreremo su altre equazioni diofantee più avanti.

5. Forme quadratiche, ideali e trasformazioni.

5.1. P r o s p e ttiv e d iv e rs e s u lla r id u z io n e .

Supponiamo che d = 1 (mod 4). Con il metodo sviluppato sopra possia-


1 + yfd
mo dimostrare che tutti gli ideali di Z possono essere scritti come

b + yfd
*r , dove a è la norma dell'ideale, b2 — d = 4 ac per qualche intero

c, e tutti gli elementi sono combinazioni lineari a coefficienti interi dei due
b + yfd
generatori, cioè \ax + . Adesso possiamo associare

a ogni coppia di coniugati della forma ax + I e ax + \y


2 Y " l 2
il loro prodotto diviso per la loro norma a, cioè tfx2 + bxy + cy2.
1 + yfd
Esiste dunque un'applicazione ( 2 : 1 ) dagli ideali di Z alle

forme quadratiche binarie f {x, y) = ax2 + bxy + cy2 con discriminante


b2 —Aac = d. Siamo interessati a capire com’è fatto l'insieme degli interi n
rappresentati da /, cioè gli interi per i quali esistono interi u e v tali che n =
= au2 + buv + a / . Sia b' = b + 2ak il più piccolo residuo, in valore assoluto, di
M m o d 2d ),esianoc' = f(\ ,k)eg(x,y) = ax2 + b'xy + c'-f . A llora/(«, v) =
= g(u - kv, v), quindi/e g rappresentano gli stessi interi, cioè/è equivalente
a g. Trasformare/in g è l'analogo del primo passo dell’algoritmo di Gauss di
Il teorema fondamentale dell’aritmetica 157

cui abbiamo discusso precedentemente. Il secondo passo dell’algoritmo di


Gauss ha una descrizione assai migliore in questo contesto, basta associare
a/la forma quadratica h(x,y) = o r - bxy + ay*\ dal momento che f{u ,v ) =
= b(v, —u), f b equivalente a h. Questo algoritmo è quello che si trova effet­
tivamente nel lavoro di Gauss [1801]; la descrizione data sopra, in termini
di ideali, è comparsa per la prima volta nei lavori di Dirichlet.
Nel caso d < 0 abbiamo una terza descrizione equivalente; si consideri

il numero complesso z = —— appartenente al semipiano superiore del


2a
piano complesso. Perla prima parte dell'algoritmo di Gauss mandiamo? —>z' =

= z + k cosicché - - < $ (z') < - . Per la seconda parte dell’algoritmo,

se Izl < 1 mandiamo z —>z'= - - dimodoché Iz'l > 1. L’algoritmo termina

quando z è nel dominio fondamentale - ^ 5 (z) < ^ con Izl ^ 1 (figura 1).
Osserviamo che i due passi dell’algoritmo sono equivalenti ad applicare le
matrici

in maniera analoga a quanto abbiamo visto nella discussione dell’algoritmo


euclideo. In effetti queste due matrici generano moltiplicativamente SL(2, Z),
il gruppo delle matrici 2 X 2 a valori interi con determinante uno.

5.2. F o r m e q u a d r a t ic h e .

Nel paragrafo precedente abbiamo visto che capire quali interi siano
rappresentati da forme quadratiche è collegato alla fattorizzazione unica.
È interessante quindi determinare quali interi siano rappresentati da una
forma quadratica data. Lagrange, per esempio, dimostrò che ogni intero è
somma di quattro quadrati, e Ràmànujan si domandò quali forme quadrati­
che possano rappresentare tutti gli interi. Riguardo a quest’ultimo problema,
piuttosto recentemente Manjul Bhargava e Jonathan Hanke hanno fornito il
seguente criterio, di facile applicazione: una forma quadratica a coefficienti
interi rappresenta tutti gli interi positivi se e solo se rappresenta tutti e ven­
tinove i seguenti numeri interi: 1 ,2 ,3 ,5 ,6 ,7 ,1 0 ,1 3 ,1 4 ,1 5 ,1 7 ,1 9 ,2 1 ,2 2 ,
2 3 ,2 6 ,2 9 ,3 0 ,3 1 ,3 4 ,3 5 ,3 7 ,4 2 ,5 8 ,9 3 ,1 1 0 ,1 4 5 ,2 0 3 e 290.
158 Andrew Granville

6. Equazioni diofantee.
6. 1. L ’ ultim o teorem a di F e rm a t, r iv is ita t o .
Nel 1847 Kummer scrisse a Liouville che era in grado di dimostrare l’ul­
timo teorema di Fermat per esponenti primi rt assumendo due proprietà di
n. Se riprendiamo la discussione precedente sull’ultimo teorema di Fermat,
notiamo che ciascun ideale U + ÌJy) è la potenza w-esima di un ideale, chia­
miamolo Bj. Questo implica che se è nella classe di ideali J, allora In = 1.
Consideriamo adesso solo quei numeri primi n che non dividono l’ordine del
gruppo delle classi dell’anello degli interi di Q (L,); questi primi sono detti
«primi regolari». Evidentemente se In = 1 allora 1 = l e quindi Bf dev’essere

Figura 1.
Dominio fondamentale di SL(2, Z) nel semipiano superiore del piano com plesso.
Il teorema fondamentale dell’aritmetica 159

un ideale principale. Questo significa che esiste un intero algebrico a j tale


che (x + Qy) = (a;)" e, di conseguenza, un’unità u -per la quale x + X*y =
= Uj a ''. La seconda ipotesi assunta da Kummer implicava che u} = v”
per qualche unità vJt ed egli fu in grado di dimostrare che questa seconaa
ipotesi era sempre vera per i primi regolari «. Dedusse quindi che ciascun
x + XJy è la potenza «-esima di un intero algebrico, e grazie a questo riuscì
a salvare la dimostrazione di Lamé ottenendo una contraddizione. In poche
parole, Kummer dimostrò l’ultimo teorema di Fermat nel caso di esponenti
primi regolari.

6.2 . C u rv e e l l i t t i c h e .

Supponiamo che / sia un polinomio monico di grado 3 con coefficienti


interi e senza radici multiple. Una curva ellittica E è l’insieme dei punti della
curva y2 = /(*)• Indichiamo con E(K) i punti appartenenti a E a valori in un
campo K. Poincaré dimostrò che E(K) costituisce un gruppo abeliano, con
la relazione che tre punti hanno somma zero se sono allineati, e si chiese se il
gruppo abeliano fosse finitamente generato, se fosse cioè della forma T © U ,
dove T è un sottogruppo di torsione finito e r un intero. Questo risultato ven­
ne dimostrato da Mordell negli anni Venti; passeremo ora a descrivere quella
parte della sua dimostrazione che riguarda la fattorizzazione unica.
Com inciamo con la curva ellittica y2 = x(x — a)(x — b) dove a e b sono

numeri interi, e supponiamo che , -y j sia un punto razionale su E, con

(r, /) = 1. Di conseguenza r(r - a^){r - bt2) = s2. Ma dx = (r, r - at2) =


= (r, a),d2 = (r, r - bt1) = (r, b )ed } = ( r - at2, r - bt2) = (r —at2,b —a) sono
divisori di a, b e b - a, rispettivamente, e quindi r = dìd2u2, r —at2 = d ^ v 2,
r — bt2 = d2d)iu2ì con u , v, w interi.
Più in generale, supponiamo che/non abbia più di una radice razionale.
Sia K il più piccolo campo che contiene tutte le radici d i/ Se proviamo a
ricalcare la dimostrazione del paragrafo precedente, entrano in gioco que­
stioni di fattorizzazione unica per il campo K : cioè, l’ideale generato da uno
dei fattori lineari in re t2 è uguale a qualche ideale che è un divisore del discri­
minante di/ per il quadrato di un ideale; scriviamolo nella forma (a)^= DP.
Sia I0 l ’ideale di norma minima nella classe degli ideali di /; II0 è un
ideale principale che indicheremo con (0). Quindi (a(N/0)2) = D/q(0)2
e di conseguenza DIq è un ideale principale, poniamo (7 ), che proviene
da un insieme finito. Pertanto a = jryS2 per qualche numero algebrico 8
e qualche unità u. Se uv ..., ur è una base per le unità di K , allora per ogni
unità u esiste un sottoinsieme S di {1, 2 , ..., r) tale che u è i i /g£ w/ Per
160 Andrew Granville

quadrato di un’unità; e quindi a = 7 'p2 dove 7 ' proviene da un qualche in­


sieme finito, calcolabile. Abbiamo cosi dimostrato una generalizzazione del
risultato che avevamo ottenuto quando/si spezzava in fattori lineari su <Q.
Questa è essenzialmente l’argomentazione della quale fece uso M ordell nella
sua dimostrazione di quanto aveva congetturato Poincaré, com e abbiamo
detto sopra. André Weil si rese conto che Mordell, nell’ultimo passaggio,
non lavorava con il gruppo delle unità U, ma piuttosto con il quoziente finito
U/U2, e che in precedenza avrebbe potuto lavorare con C/C2, invece che
col gruppo delle classi C; in effetti, si sarebbe addirittura potuto com inciare
considerando E(Q)/2E{Q). Grazie a questa osservazione W eil sem plificò
notevolmente la complicata dimostrazione di Mordell e inaugurò i metodi
della moderna geometria aritmetica.

7. La fattorizzazione unica, in pratica.

7.1. F a tto riz z a re .

Il teorema di fattorizzazione unica ci dice che ogni intero può essere


fattorizzato come prodotto di numeri primi in maniera unica, ma non ci
dice come farlo in pratica. Come ha scritto Gauss n ell’articolo 3 2 9 delle
Disquisitiones Arithmeticae [Gauss 1801]:
Il problema di distinguere i numeri primi da quelli com posti e di ricav are la scom ­
posizione in fattori primi di questi ultimi è noto com e uno dei più im p o rtan ti e utili
in aritmetica. H a impegnato le energie e le capacità dei geom etri antichi e m od ern i a
tal punto che sarebbe superfluo discuterne a lungo. In ogni caso devo co n fe ssa re che
tutti i metodi che sono stati proposti fino ad oggi o sono ristretti a casi m o lto speciali,
o sono cosi laboriosi e diffìcili che [ ...] mettono a dura prova la pazienza a n ch e del
calcolatore più allenato. E questi metodi non si applicano affatto a n u m eri grandi
[ . . . ] . La dignità della scienza stessa sembra richiedere che sia esplorato ogni possibile
mezzo per la soluzione di un problema cosi elegante e cosifam oso [ . . . ] . F a p a rte della
natura del problema che ogni metodo diventi più com plicato m an m an o ch e i numeri
diventano più grandi. Le tecniche [ ...] note [ . ..] richiedono una fatica intollerabile
anche per il calcolatore più instancabile.

Quello che Gauss scrisse duecento anni fa è ancora vero oggi. M a og­
gi, più che per la «dignità della scienza stessa», studiamo la fattorizzazione
perché la difficoltà della scomposizione degli interi grandi perm ette che le
nostre comunicazioni siano sicure: l’impenetrabilità della crittografia usata
più comunemente si basa sul fatto che nessuno può fattorizzare rapidamente
numeri a 200 cifre.
Poiché ogni numero composto ha fattori primi non più grandi della sua
radice quadrata, è possibile fattorizzare n verificando se è divisibile per cia­
scun numero fino alla sua radice quadrata. Questo è facile, ad esem pio, per
Il teorema fondamentale dell’aritmetica 161

n = 1001 o n = 11 041, ma che dire di n = 1234 567 890 123 456 789? In
questo caso la verifica richiede più di un miliardo di divisioni, e se si sta
provando a fattorizzare un intero di 100 cifre, prodotto di due numeri
primi di 50 cifre, con questo procedimento ci vorrebbe più tempo della
vita restante dell’universo, anche con un computer incredibilmente veloce!
C ’è quindi bisogno di un approccio più raffinato per poter maneggiare
numeri grandi.
Fermat trovò un metodo che funziona bene per interi che sono il pro­
dotto di due numeri primi molto vicini e lo usò nel caso n = 2 027 651 281.
Prima di tutto osserviamo che r = 45 029 = [>/« ] e che n = r2 + 40 440.
L’idea di Fermat consiste nel trovare j tale che (r + j)2 - n sia esso stesso un
quadrato, poniamo s2, dimodoché n = (r + j + i)(r + j - s). Usando una
tecnica efficace, provò con ciascun j uno dopo l’altro, nel modo seguente:
(r + l )2 — = (2 r + 1) — 4 0 4 4 0 = 49 619 e non si tratta di un quadrato
poiché è = 19 (mod 100); anche (r + 2 )2 - n = (2r + 3) + 49 619 si elimina
modulo 100. Procedendo cosi ed eliminando i non quadrati facendo uso
deH’aritmetica modulare, Fermat trovò infine che (r + 12)2 - n - 10202;
dedusse cosi che 2 027 651 281 = 44 021 X 46 061. Sfortunatamente l’algo­
ritmo di Fermat è molto lento nei casi peggiori, cosi come una sua variante
che fa uso delle forme quadratiche binarie, dovuta a Gauss.
G li algoritm i di fattorizzazione moderni sono per la maggior parte
strutturati in maniera tale da lavorare velocemente anche nei casi peggio­
ri. Spesso hanno il difetto di non funzionare in tutti i casi, dal momento
che possono dipendere da un generatore di numeri casuali, e chi si trova
a dover fattorizzare il numero potrebbe semplicemente avere sfortuna. Di
solito però possiamo organizzare le cose in modo che sia molto improba­
bile che in tutta la durata dell’universo capiti una sfortuna simile! Il più
efficiente algoritmo noto si chiama «crivello del campo di numeri»” , ed è
una variante del «crivello quadratico», anch’esso una variante dell’algo-
ritmo originale di Fermat.
Se « è un numero composto e y è primo con n allora esistono almeno
quattro soluzioni x (mod n) di x2 = y2 (mod //), e quindi per almeno metà
di queste soluzioni abbiamo che (x - yyrt)(x + y, n) fornisce una fattoriz­
zazione di n. Nei diversi algoritmi di fattorizzazione cerchiamo di trovare
interi x e y di questo genere (con x2 = y2 (mod «)) attraverso vari metodi.
Di solito si scelgono av a2, ... (mod n) e quindi si considera b il più piccolo
residuo positivo di a2 (mod «). In questo modo si spera di trovare una

21 Dovrei forse dire «oioto pubblicamente». La maggior parte degli stati ricchi e dcUe grandi
aziende hanno alle loro dipendenze dei matematici che in segreto lavorano a questo genere di pro­
blemi, studiandone le implicazioni crittografiche, e può darsi che lontano da occhi indiscreti siano
stati fatti progressi significativi.
162 Andrew GranviUe

successione di valorij\ < j 2 < ... < j k tale che by. b^ ... b^ sia un quadra­
to, poniamo y2; cosi abbiamo la soluzione del nostro problema precedente
con x = af aJt... a^. Una volta trovato un processo per generare gli ap il
punto chiave è determinare una sottosequenza dei b; il cui prodotto sia un
quadrato. È possibile trovare una tale sottosequenza lavorando solo con i b
che non hanno fattori primi > B, per qualche B ben scelto, e conservando le
fattorizzazioni di questi bj. Infatti se b] - ]~ J/=1 P/' ' allora b^ b^ ... b^ è
un quadrato se e solo se cf i è pari p e r/ = 1, 2 , . . . , t. In altre parole,
se creiamo la matrice nella quale la riga corrispondente a b} è il vettore degli
esponenti {cj V ..., c/t), ciascuno preso modulo 2 , allora stiamo cercando un
sottoinsieme non banale di ciascuna di queste righe la cui somma è zero m o­
dulo 2, che può essere determinato in maniera efficiente con l’elim inazione
gaussiana modulo 2. A questo punto, dobbiamo considerare com e scegliere
gli a >Una maniera è prendere interi a caso; un’altra, prendere i valori assunti
da polinomi. I primi ricercatori che studiarono questo m etodo scoprirono
che i numeri collegati alla frazione continua di yfn funzionavano bene. Tutti
questi algoritmi funzionano all’incirca in e ^ passi, dove d è il num ero delle
cifre decimali di n, un deciso miglioramento rispetto agli algoritmi preceden­
ti che richiedevano grossomodo ed passi.
Nel crivello del campo di numeri si cerca di imitare il crivello quadratico
in campi di numeri scelti in maniera astuta al fine di avere un algoritm o più
efficiente. L’argomentazione precedente può essere tradotta in questo conte­
sto e permette di stabilire che il crivello del campo di numeri si conclude in
circa exp (^ /3) passi. Il punto per noi più interessante è quando fattorizziam o
b; in primi piccoli: per prima cosa fattorizziamo l’ideale ih) in ideali primi di
norma piccola, quindi otteniamo una fattorizzazione dell’intero algebrico
b , procedendo più o meno come abbiamo fatto nel paragrafo precedente,
prendendo in considerazione il gruppo delle classi e il gruppo delle unità
del campo. Inoltre, proprio come nel lavoro di Weil, possiamo restringere
la nostra attenzione a C/C2 e U/U2, un’osservazione che rende questo algo­
ritmo utilizzabile in pratica.

7.2. C r itto g r a f ia .

I protocolli per la crittografia erano di solito basati su schem i com ­


binatori complicati e la sicurezza del messaggio segreto veniva garantita
dalla conservazione della chiave al sicuro. Infatti chiunque fosse entrato in
possesso della chiave avrebbe potuto facilmente invertirla e decodificare
cosi il messaggio. Verso la metà degli anni Settanta com inciò ad aum en­
Il teorema fondamentale dell’aritmetica 163

tare l’interesse nei confronti delle cosiddette one-way functions, funzioni


per le quali la conoscenza della funzione stessa non è d’aiuto, in pratica,
per ricavarne l’inversa. Quindi, un protocollo crittografico basato su una
funzione di questo genere comporta che, anche se il nemico conosce la
chiave, non ha - in pratica - alcun aiuto nella decodifica di un messaggio in
codice. Un candidato per una funzione di questo tipo è la moltiplicazione:
è facile moltiplicare due numeri primi grandi, ma non è altrettanto facile
ricostruire i due numeri primi grandi dal loro prodotto, come abbiamo vi­
sto nel paragrafo precedente. Ron Rivest, Adi Shamir e Léonard Adleman
trovarono un semplice protocollo crittografico che può essere infranto,
quando è adeguatamente implementato, se e solo se si è in grado di fatto­
rizzare numeri grandi rapidamente.
Si tratta di una maniera sicura per mantenere i segreti? C ’è qualcosa di
rassicurante, a mio avviso, nel fatto che la difficoltà di violare un codice non
dipende dalla capacità di nascondere o confondere le informazioni, ma da
un problema matematico profondo, che ha messo in scacco molte delle più
grandi menti della storia (si veda, ad esempio, la citazione di Gauss, poco
sopra). P er nascondere segreti è possibile fare uso di altri problemi mate­
matici di grande difficoltà, basati su questioni piuttosto differenti da quelle
viste finora; uno dei metodi che preferisco si basa su un problema difficile
quanto fattorizzare, come mostreremo subito.
Esistono algoritmi veloci per fare radici quadrate modulo p, quando p è
primo [Crandall 2005]. Per poter estendere questi algoritmi a n, con n nu­
mero intero composto, abbiamo bisogno di conoscere la fattorizzazione di n.
Infatti, possiamo trovare la radice quadrata modulo ciascuna potenza di un
primo che divide n> e quindi, grazie al teorema cinese del resto, ricostruire
la radice quadrata modulo n. Di conseguenza, un algoritmo di fattorizzazio­
ne veloce fornirà un algoritmo veloce anche per estrarre le radici quadrate
modulo interi composti n.
D all’altra parte, supponiamo di avere un algoritmo rapido per estrarre
radici quadrate modulo un intero composto «, e vogliamo fattorizzare tt.
Allora possiamo semplicemente selezionare un numero}' (mod ri) a caso, for­
nire il più piccolo residuo di y2 (mod n) al nostro algoritmo che ci restituirà
una delle radici quadrate di y2 (mod //), poniamo x. Allora abbiamo almeno
il 50 per cento di possibilità che (x ~ y , n)(x + y, n) sia una fattorizzazione
di n. Se siamo sfortunati ripetiamo questo procedimento fino a ottenere ciò
che volevamo. La probabilità di non avere successo dopo 100 tentativi è
trascurabile, non più di 1 su 2 100. Di conseguenza abbiamo dimostrato che
un algoritmo veloce per l’estrazione delle radici quadrate modulo interi com­
posti n fornisce un veloce algoritmo di fattorizzazione. Mettendo insieme
quel che abbiamo detto negli ultimi due paragrafi, vediamo che questi due
problemi hanno la stessa difficoltà.
164 Andrew Granvi11e

7.3. T e st di p rim a lità .

Il «piccolo teorema di Fermat» afferma che a? = a (m odp), per ogni inte­


ro a, ogni volta che p è primo. Viceversa sean¥*a (mod rt) per qualche intero
a allora n è composto. È possibile calcolare an (mod ri) in maniera piuttosto
veloce” , e quindi dimostrare rapidamente che un certo intero n è com posto
se 2" ^ 2 (mod rt). Può forse stupire un po’ che questo procedim ento for­
nisca una dimostrazione che n è composto senza darci nessun fattore di rt.
Se questo test fallisce, possiamo vedere se 3" # 3 (mod n), 5 " # 5 (mod «),
ecc. Con questo metodo potremo scoprire la maggior parte dei numeri com ­
posti; se fosse possibile scoprire ogni numero composto cosi, allora il test
potrebbe essere usato anche come test di primalità; i primi sarebbero quei
numeri che non vengono rivelati come numeri composti. Sfortunatam ente
esistono numeri composti n per i quali an = a (mod n) per ogni intero a, ad
esempio 561 e 1729, e questi «numeri di Carmichael», sebbene rari, sono in
numero infinito.
Si può modificare il test precedente attraverso il seguente sviluppo del
piccolo teorema di Fermat: se (tf, p) = 1 allora ap~l = 1 (mod p) e quindi
p-1 H £zl
a 2 = ± 1 (mod p), poiché a 2 è la radice quadrata di ap~l. Se a 2 = 1
(mod p) allora possiamo estrarre nuovamente la radice quadrata, e ancora,
fino a r volte, dove r è tale c h e 2r, ma non 2r+1, dividap — 1. Q uesti residui
devono essere tutti 1, oppure tutti 1 fino ad arrivare a un —1. Se accade
qualunque altra cosa sappiamo che n è composto. Non esistono numeri
composti rt tali che a"~l (mod rt) e tutte le sue radici quadrate verifichino
questa proprietà per tutti gli interi a che sono primi con ri. In effetti, almeno
tre quarti degli interi a primi con n non godono di questa proprietà quando
rt è composto; questi valori sono detti testimoni del fatto che tt è com posto.
Quindi possiamo distinguere i numeri primi da quelli com posti cercando
questi testimoni, anche se non esiste un modo sicuro per trovarne rapida­
mente uno. Se testiamo 100 valori di a presi a caso, allora il test com binato
sbaglierà - identificando erroneamente un numero composto com e primo -
cioè fallirà a trovare un testimone, con una probabilità inferiore a 1 su 2200,
qualcosa che in pratica non accadrà mai. Se accettiamo l’ipotesi di Riemann
generalizzata possiamo dimostrare che prendendo soltanto pochi valori ini­
ziali di a (fino a 2(log rt)2) abbiamo la garanzia di trovare un testim one per
ogni rt composto e quindi abbiamo un vero test di primalità.
Si è a lungo cercato un metodo di cui si potesse dimostrare la validità
assoluta e che arrivasse al risultato in tempi brevi. Un test di questo tipo fu

14 Con il metodo dei «quadrati successivi».


Il teorema fondamentale dell’aritmetica 165

finalmente scoperto nel 2002 da Manindra Agrawal, Neeraj Kayal e Nitin


Saxena [si veda Granville 2005], ed è basato sul seguente teorema: per ogni
intero dato n ^ 2, sia r un intero positivo < «, tale che n ha ordine > (log n)2
modulo r. Allora n è primo se e solo se
- n non è una potenza perfetta;
- n non possiede alcun fattore primo ^ r>
- (x + a)n = x" + a mod (», y — 1) per ogni intero <z, 1 < < v r log n.

8. Ulteriori sviluppi.

In mancanza della fattorizzazione unica, si possono cercare anelli nei


quali valga un analogo molto stretto dell’algoritmo euclideo: un anello di
interi R, in Q (yfd) è euclideo se per ogni a , 0 # 0 G R esistono -y, 8 G R tali
che a = (3*7 + 8 con 181 < Ipl. Si veda Lenstra [1979-80] per una discussione
affascinante su questo argomento.
Gauss mostrò esplicitamente come «comporre» due forme quadrati­
che - l’equivalente della moltiplicazione di ideali neH’appropriato campo
quadratico - e Dirichlet ne esplicito l’espressione. Recentemente Bhargava
ha considerato un nuovo e interessante punto di vista a questo riguardo:
consideriamo otto interi aijh 0 ^ i,j, k ^ 1. Per £ = 1, 2 ,3 siano M , e Nf le
matrici 2 X 2 formate dagli aijk prendendo la £-esima coordinata dell’indice
uguale a 0 e 1, rispettivamente. Indichiamo con f ((xty) il determinante della
matrice Mpc — Nfy , allora le forme quadratiche/Pj/^,/3 hanno tutte lo stesso
discriminante e soddisfano la relazione f xf 2fy = 1 nel gruppo delle classi. Si
veda Bhargava [2004] e i successivi riferimenti per gli straordinari sviluppi
di queste idee.
166 Andrew Granville

BAKER, A.
1984 A Conciselntroduction to thè Theory o f Numbers, Cam bridge University Press,
Cambridge.
BHARGAVA, M.
2004 tìigher composition laws I: A new vieto on Gauss composition and quadratic
generalizations, in «Annals of M athem atics», 159, pp. 2 1 7 -5 0 .
COLUSON, m . j .
1980 The unique factorization theorem, in «M athem atics M agazine», 5 3 , pp. 9 6 -
100.
CRANDALL, R. e POMERANCE, C.
200 5 Primes, a Computational Perspective, Springer-Verlag, N ew Y o rk .
g a u ss, c . F.
1801 Disquisitiones Arithmeticae, Fleischer, Leipzig; poi in i d ., Werke, voi. I, Kònig-
licheGesellschaft der Wissenschaften, Gòttingen 1 870, pp. 3 -4 7 4 .

GRANVILLE, A.
2005 / / is easy to determine whether a given integer is prime, in «B u lletin o f thè
American M athematica! Society», 4 2 , pp. 3 -3 8 .
HARDY, G. H. e WRIGHT, E. M.
1979 An lntroduction to thè Theory o f Numbers (1 9 3 8 ), O x fo rd U niversity Press,
New York.
KNORR, W.
1976 Problems in thè interpretation o f Greek number theory: Euclid an d thè funda-
mental theorem, in «Studies in thè history and philosophy o f scien ce » , 7 , pp.
3 53-68.
LENSTRA, H. W. JR
1979-80 Euclidean numberfields, in «The Mathematical IntelligenceD>, I, 2 , pp . 6-15-
11,2, pp. 7 3 -7 7 ; III, 2 , pp. 99-103.
2002 Solving thè Peli equation, in «Notices of thè American Mathematical Society»
4 9 , pp. 182-92.
RIBENBOIM, P.
1979 13 Lectures on Fermat's Last Theorem, Springer-Verlag, N ew Y o rk - H eid el­
berg.
WEIL, A.
1984 Number Theory. An Approach Through History from Hammurapi to Legendre,
Birkhauser, Boston [trad. it. Teoria dei numeri: storia e matematica da Hammu-
rabi a Legendre, a cura di C. Bartocci, Einaudi, Torino 1 9 9 3 ].
H ARO LD M . ED W A RD S

La risoluzione delle equazioni algebriche

Il prototipo di soluzione di equazione algebrica è la familiare formula


quadratica

2 , » , n ■ r - b - J b 2 - 4c
x + bx + c = 0 implica x = ---------- -----------

che viene insegnata, in una qualche forma, in tutte le scuole superiori del
mondo. L’essenza di questa formula - ma senza alcuna somiglianza con la
notazione algebrica da noi adoperata - si trova già in testi babilonesi risa­
lenti a oltre 3500 anni fa. Più precisamente, i Babilonesi risolsero il seguente
problema: «Trovare due numeri, data la loro somma e il loro prodotto», che
può essere espresso con l’equazione quadratica xs = x2 + p, nella quale x
rappresenta i due numeri ignoti e s e p sono, rispettivamente, la somma e il
prodotto richiesti1.
Utilizzando la moderna notazione algebrica, un potente strumento che
non venne sviluppato fino al xvn secolo, questo problema non è altro che
un caso particolare (con n = 2) del problema generale: «Trovare tutte le
soluzioni x di x" + b x " '1 + cxn~2 +••• + ? = 0, con n intero positivo e
b, c, ..., e quantità date».
Anche se il caso con n = 2 fu risolto migliaia di anni fa, il caso con n = 3
venne risolto per la prima volta, nel Rinascimento, da Scipione Dal Ferro e
successivamente (in maniera indipendente) da Tartaglia (Niccolò Fontana),
e pubblicato da Girolam o Cardano nella sua Ars Magna nel 15452. Una
soluzione per il caso n = 4 segui quasi immediatamente, incrementando in
questo modo le speranze che fosse possibile trovare le soluzioni anche per il
caso con n = 5 e perfino oltre. Ma trascorsero due secoli senza che nessuna
soluzione di questo tipo venisse scoperta e nel 1801 Cari Friedrich Gauss
scriveva:

l Datiduenumerix1e x 2,alloralamoltiplicazioncdii = x 1+ xi p c rx ldà xts = x3, + x,xJ - xj +/>;


analogamente si ottiene x2s = x] + p e quindi x , e x2sono le soluzioni di xs = x1 + p.
1Per i dettagli storici si veda P. D. Napolitani, Il Rinascimento italiano, in questa stessa opera,
voi. I. / luoghi e i tempi, Einaudi, Torino 2007, pp. 253-54. [ N.J.C.].
168 Harold M. Edwards

C om e c ben noto, i più eminenti geometri non sono riusciti a trovare la soluzione
generale delle equazioni di grado maggiore del quarto. [ . . . ] Vi sono pochi dubbi non
solo che questo problema sia oltre le possibilità dell’analisi co n tem poranca ma che
proponga qualcosa di impossibile’.

Gauss, in effetti, era giunto a una comprensione abbastanza chiara della


natura del problema e aveva ottime ragioni per credere che il tipo di soluzio­
ne che veniva cercata fosse, in un senso molto preciso, impossibile. Questa
impossibilità venne dimostrata in modo rigoroso circa tren tan n i più tardi, e
richiedeva, come lo stesso Gauss aveva suggerito, un profondo ripensamento
del significato di soluzione di x" + bx"~x + cx"~2 + ••• + e = 0.
A dire la verità, è necessaria solo una piccola riflessione per convincersi che
il problema «Trovare tutte le soluzioni di x" + bx"~l + cx"~2 + ••• + e = 0»
è mal posto. Quali ragioni vi sono per aspettarsi che vi sia una qualche solu­
zione? Già nel caso n = 2 le uniche soluzioni di x2 + 1 = 0 sono le soluzioni
«immaginarie» x = ± i che hanno un’esistenza molto discutibile. P er valori
più grandi di n, ci si dovrebbe probabilmente aspettare che le soluzioni,
qualora ve ne siano, siano «quantità» ancora meno familiari e ancora più
discutibili.
Per questo motivo, è ragionevole spostare l’attenzione dalle soluzioni ai
sistemi numerici in cui si effettuano i calcoli. L’equazione x2 + 1 = 0 non ha
soluzioni nel senso normale, ma «acquisisce» le soluzioni ± i se si accettano
calcoli con i numeri complessi a + bi.
Si consideri adesso il seguente problem a: «D ata u n ’equazione
x" + bxT~x + cx"~2 + ••• + e = 0, come si possono estendere gli usuali
metodi di calcolo con i numeri in maniera tale che l’equazione data abbia
n soluzioni?» Questo problema, che in termini moderni viene espresso nel
modo seguente: «Costruire un campo di spezzamento* per un polinomio
dato di grado n», ha una soluzione sorprendentemente semplice.
Il caso specifico dell’equazione x2 + 1 = 0 viene affrontato a livello
scolastico con il semplice espediente di dare un nome - tradizionalmente i
o, in qualche testo più vecchio, ^ ~ 1 - alla soluzione, e quindi continuare
a fare i calcoli come se si trattasse di un numero ordinario. È questo, tutto
sommato, il significato dei numeri complessi. Ogni numero com plesso può

1 Disquisiiiones Arithmeticae, articolo 359: «Constat omnes summorum geometrarum laborcs


aequationum ordinem quartum superantium resolutionem generalem [...] inveniendi sempcrhacte-
nus irrìtos fuisse, et vix dubium manet, quin hocce problema non tam analyseos hodiernae vircs
superet, quam potius aliquid impossibile proponat» [Gauss 1801, voi. I, p. 449].
* Sia PiX) un polinomio di grado n a coefficienti in un campo K. Un campo di spezzamento L
per il polinomio P è un’estensione di K che soddisfa le due condizioni seguenti: (a) P si fattorizza
in L nel prodotto di n monomi di primo grado X - at (/ = 1....... n)\ (b) le radici at generano L su
K, ovvero L - K(at....... a ). Si dimostra che ogni polinomio ammette un campo di spezzamento, il
quale è unico a meno di isomorfismi. [N.</.C.l.
La risoluzione delle equazioni algebriche 169

essere scritto nella forma s + ti con s e t numeri reali, dove ; è la soluzione


«immaginaria» dell’equazione x2 + 1 = 0. Tutte le regole per effettuare i
calcoli con i numeri complessi derivano dalle seguenti regole dell’addizione
e della moltiplicazione:

(j + ti) + (s' + t'i) = (s + s') + (t + t')i

(j + ti)(s' + t'i) = ss' + st'i + s'ti + tt'i1 = ss' + st'i + s'ti- tt' =
= (ss '-tt') + (st' + s't)i.

Q ueste formule a loro volta seguono dall’assunzione che le proprietà


commutativa, associativa e distributiva dell’addizione e della moltiplicazione
si applichino a questi «nuovi» numeri s + ti e, nel caso della seconda formu­
la, anche dall’identità i2 = - 1 .
La definizione data sopra di numero complesso come un’espressione
della forma s + // nella quale s e t sono numeri reali è quella che viene nor­
malmente usata, ma i numeri reali - che sono, per dirla in breve, numeri
che possono essere espressi come numeri decimali con un numero di cifre
eventualmente infinito dopo la virgola* - sono più difficili da trattare degli
ordinari numeri razionali (quozienti di interi con denominatore diverso da
zero), e i numeri razionali sono sufficienti per risolvere equazioni algebriche
con metodi razionali. Per questa ragione, la soluzione del problema «esten­
dere i metodi di calcolo per comprendere una soluzione di x2 + 1 = 0» si
ottiene in maniera migliore ammettendo il calcolo con «numeri complessi
razionali», cioè numeri della forma s + ti con s e t numeri razionali e /la
radice quadrata immaginaria di - 1 .
La soluzione algebrica di x2 = 2 è simile. Semplicemente si afferma l’esi­
stenza di un numero il cui quadrato è 2, e si chiama , si procede quindi
a fare calcoli con esso. Un numero è in questo caso un’espressione s + /V2
con s e t numeri razionali. Tutti i calcoli seguono dalle regole per l’addi­
zione:

+ /V2) + + t'yji} = (j + s i + (/ + /0 V I

e per la moltiplicazione:

’ Per un approfondimento si veda il saggio di J. K. Thiss, / fondamenti dell’analisi, in questo


stesso volume, pp. 427-60. \N.d.C.].
170 Harold M. Edwards

(j + /7Ì) •(*' + /'/Vi) = ss' + st’yfl + s'tyfì + //'(Vi)2


= (ss' + 2//') + (s/' + s’t ) &
e queste a loro volta derivano dalle proprietà commutativa, associativa e
distributiva e dall’equazione di definizione V i •V i = 2.
Allo stesso modo si può affermare che l’equazione x3 = 2 ha una soluzio­
ne e chiamarla V i, ma dalla regola

(j + + r Ì li) = ss' + (st' + s't) Vi + //'(Vi)2

si deduce che anche (V i)2 dev’essere inclusa nei calcoli. Una volta fatta
questa osservazione, si trova che le formule necessarie per i calcoli sono le
seguenti:
( j + lift + » $ 2 ) 2) + ( l ' + t'ifc + « '(^ 2 ) * ) =

= (s + s’) + (/ + t') Ili + (« + u'VXÌ)2

+ /V i + «(V i)2) ( j ' + / 'V i + «'(V i)2) =

= + (st' + j'/ )V Ì + (su' + //' + j'« )(V Ì)2 +

+ (tu' + /'«)(V Ì)3 + « « '(V i)4 =

= ss' + (st ' + *'/) Vi + (j«' + //' + j'«)(VÌ)2 + 2(/«' + /'«) + 2««' Vi =
= («' + 2/«' + 2/'«) + (st ' + *7 + 2««0 Vi + (*«' + //' + j'«)(VÌ)2.

Come nel caso precedente, queste regole per l’addizione e la molti­


plicazione sono dedotte dalle usuali proprietà commutativa, associativa e
distributiva e determinano tutte le regole di calcolo necessarie per questa
estensione dell’aritmetica ordinaria dei numeri razionali.
L’aritmetica ampliata quindi ha a che fare con espressioni del tipo
5 + /(V i) + «(V i)2 . che vengono sommate e moltiplicate secondo queste
regole, in base alle quali si ha che il cubo di Vi è 2.
Anche se può sembrare strano che il processo di affermare semplicemen­
te l’esistenza di una soluzione di un’equazione algebrica data xP + bxP~x +
+ ex”- 2 + ••• + e = 0 possa essere un passo di una qualche utilità, questo è
in effetti lo strumento che Évariste Galois (la cui storia verrà brevemente rac­
La risoluzione delle equazioni algebriche 171

contata più avanti) utilizzò per rivoluzionare l’algebra e rendere decisamente


più chiaro il problema generale della soluzione delle equazioni algebriche.
Il processo da noi appena descritto fornisce una sola soluzione; la grande
intuizione di Galois fu che un insieme completo di soluzioni di una qualsiasi
equazione data poteva essere descritto in termini di una singola soluzione di
una adeguata equazione, ausiliario a quella data.
Un esempio che ben illustra questo fenomeno è dato dal fatto che una
soluzione y di y6 + 108 = 0 fornisce tre soluzioni di x3 = 2. In maniera
esplicita,
x = yl_ Wy-yA e -1 8 y - y A
18’ 36 36

sono soluzioni di x3 = 2 se y è una soluzione di y6 + 108 = 0, co ­


me si* può vedere con semplici calcoli. Il cubo del primo valore di x è
y12 _ (—108)2 _ 9 2 •122 _ 122 144
183 2 3 •9 3 23 93 8 .9 “ “ 2 - 11 cuho del secondo può es­
sere calcolato tenendo conto che il secondo è il primo moltiplicato per
— - - , e quindi il cubo del secondo è il cubo del primo (cioè 2) moltipli­

cato per

=2L_x I + I I_
y} ~ 2 ) y9 ~ y6 2 ' y> ' 4 " 8 ~

729 243 27 1
(-1 0 8 )y 3 2(—108) 4y> 8

_ j 7 _ + 243 + 27 1 _ 243 - 27 _ 1
4 y} 216 4y} 8 216

In poche parole, anche il cubo del secondo è 2. Con calcoli quasi identici si
trova che anche il cubo del terzo è 2, come bisognava dimostrare. II lettore
potrebbe forse domandarsi come questa soluzione magica —sia la scelta
della relazione y6 = —108 sia le tre formule per x - sia stata trovata. Deriva,
ovviamente, da un metodo sistematico che è però troppo tecnico per poter
essere spiegato in queste pagine.
Galois fece vedere - la sua trattazione era troppo schematica per poter
essere definita una dimostrazione —che per ogni equazione x" + bx"~l +
+ ex"-2 + ••• + e = 0 esiste un’equazione ausiliario ym + Aym~1 + fly*-2 +
+ — I-D = 0 con l’analoga proprietà: una soluzione^» dell'equazione ausiliaria
172 Harold M. Edwards

può essere usata per esprimere n soluzioni dell’equazione data x" + bxf'~ 1 +
+ cx*~2 + + e = 0.
Come ci si può immaginare, il grado m dell’equazione ausiliaria è di
solito notevolmente più alto del grado n dell’equazione che deve essere ri­
solta. Nell’esempio precedente, n = 3 e m - 6. Un esempio più semplice,
con m = n = 2, è l’equazione quadratica x2 - sx + p = 0 dei B abilo n e­
si, che ha due soluzioni x = 5 + y e x = ~ ~ ~ con y soluzione d el­
l ’equazione ausiliaria y2 = s2 - 4p\ infatti la somma di queste due quan­

tità è chiaram ente ^ + ^ = y = s e il lo ro p ro d o tto è

(s + y)(s - y) _ s2 - y2 _ s2 - s2 + 4p _
4 4 4
Il problema che abbiamo enunciato sopra può, alla luce di queste conside­
razioni, venir espresso nei termini seguenti: data una qualsiasi equazione alge­
brica di grado n, esiste una maniera di estendere la nozione di calcolo speci­
ficamente attraverso il calcolo per mezzo di una radice di una certa equazione
ausiliaria per creare un’aritmetica nella quale l’equazione ha n radici. L’equa­
zione ausiliaria è detta una risolvente di Galois dell’equazione originaria.
È necessario precisare che questo metodo di estendere il calcolo «dichia­
rando» y radice di una qualche equazione ausiliaria ym + Ay m~ 1 + Bym~2 +
-I- ...+ £) = o richiede che venga posta una certa condizione, a dire il vero
non troppo restrittiva, sull’equazione ausiliaria stessa. Il problem a che può
insorgere è ben illustrato nel caso dell’estensione del calcolo tram ite una ra­
dice y diy3 = 1. In questo caso,? - 1 ey2 + y + 1 sono entram bi diversi da
zero (l’equazione y3 = 1 può portare a una riduzione solo quando l’esponente
della? è almeno 3), ma il loro prodotto è{y - \ ){f + y + 1) = y} + y2 + y +
—yt —y — l = y - l = 0 . Un'«estensione di calcolo» nella quale il prodotto
di due quantità diverse da zero fa zero è un’estensione nella quale un fatto
troppo basilare dell'aritmetica diventa falso; vi sono settori della matematica
moderna in cui si verifica questo fenomeno, ma Galois non ritenne che fosse
necessario muoversi verso un territorio cosi inesplorato per raggiungere il
proprio scopo. Il problema nel trattare la relazione y3 = 1 è proprio che que­
sta si fattorizza nel prodotto (y - lMy2 + y + 1). Si può dimostrare che se un
polinomio ym + + By” ~2 + ■■■ + D è irriducibile, nel senso che non
può essere scritto come prodotto di due polinomi con coefficienti razionali,
ciascuno con grado minore di mt allora dichiarare y come soluzione di y’n +
+ AyT~1 + Bym~2 + •••+ D = 0, e proseguire usando y nei calcoli nel modo
naturale, fornisce un’estensione dell’aritmetica ordinaria nella quale si ap­
plicano tutte le regole usuali, compresa la regola che un prodotto può essere
zero solo quando uno dei suoi fattori è zero. In realtà vale la proprietà ancora
più forte che ogni quantità diversa da zero ha un inverso. Cioè, l ’equazione
La risoluzione delle equazioni algebriche 173

ax = 1 ha una soluzione x per ogni a 0. Determinare l’inverso di una


quantità diversa da zero è il punto diffìcile nella descrizione dell’aritmetica
estesa. I lettori che abbiano una certa familiarità con l’algebra dei polinomi
possono capire che si può ottenere questo risultato con il cosiddetto algo­
ritmo euclideo per i polinomi. Alla luce di questa restrizione sul metodo di
estendere i calcoli, l’esatto enunciato del teorema di Galois è:

Dato un polinomio x" + bxn~x + ex"-2 + •••+ e con coefficienti razionali6


b, c, e, è possibile costruire un polinomio irriducibile - detto risolvente di
Galois - con la proprietà che l'estensione dei calcoli tramite l’inclusione di una
radice del risolvente di Galois fornisce un’aritmetica nella quale il polinomio
dato di grado n ha n radici.

Questo teorema fornisce una risposta chiara alla domanda: «Cosa significa
risolvere un’equazione algebrica?» Significa: «Estendere i calcoli aritmetici
(includendo un adeguato nuovo “numero” y) in maniera tale che l’equazione
abbia un numero di radici uguale al suo grado». Dal punto di vista storico,
questa risposta non forni ciò che i matematici avevano cercato per duecento
anni. Avevano trovato comodo trattare con radici quadrate e cubiche nella
risoluzione delle equazioni di secondo e di terzo grado, e senza dubbio si
aspettavano di dover estrarre radici di ordine superiore per risolvere equa­
zioni di ordine superiore, ma non si aspettavano di dover fare qualcos’altro da
estrarre radici. Stranamente, erano pronti - cosa che fecero - a estrarre molte
radici nel corso dei loro calcoli (il che condusse a espressioni molto complicate
e molto difficili da calcolare; era difficile perfino stabilire, in qualche caso, se
due quantità rappresentate tramite espressioni di questo tipo fossero uguali)
ma 1 idea di Galois di effettuare i calcoli con una sola nuova quantità, che non
era un radicale, rappresentò un’innovazione illuminante e inaspettata.
Dopo aver escogitato questo metodo per calcolare tutte le radici di un
polinomio dato, Galois fu in grado di affrontare il problema tradizionale
della risolubilità per radicali, e riuscì a dimostrare che, nel caso di grado
superiore al quarto, solo equazioni molto speciali potevano essere risolte
usando solo i radicali. Fu perfino in grado di descrivere un procedimento di
calcolo che permetterebbe di determinare se un’equazione data è risolubile
per radicali e nel caso di costruire tali soluzioni. Si tratta però di un proce­
dimento che non solo era troppo lungo per quei tempi, ma che anche per le
conoscenze attuali rimane impossibile da completare, pur con l’ausilio dei
moderni computer, ad eccezione di casi particolarmente semplici. Comun­
que rimane un compito chiaramente espresso e finito.

4 In realtà Galois considerò dei casi più generali nei quali i coefficienti potevano includere sia
quantità indeterminate sia numeri razionali.
174 Harold M. Edwards

L’idea sulla quale Galois basò questa analisi della risolubilità delle equa­
zioni - l’idea di un gruppo - era destinata a rivoluzionare non solo la ricerca
di soluzioni delle equazioni algebriche ma tutta la matematica. Un’equazione
data non determina un solo risolvente di Galois; piuttosto, per un’equa­
zione data*" + 1 + cx?~2 + + e = 0 , si possono usare molti diversi
risolventi di Galois per estendere i calcoli in modo che l’equazione abbia n
radici. Comunque, scelto il risolvente di Galois in modo che abbia grado m
minimo, questo determina un gruppo di permutazioni delle radici dell’equa­
zione originaria che dipende solo da quell’equazione e non dalla scelta del
risolvente di Galois.
In breve, questo gruppo di permutazioni è determinato nel modo seguen­
te. Affermare che usare y fornisce n radici dell’equazione data significa, in
maniera più specifica, che esistono n polinomi in y con coefficienti razionali,
chiamiamoli <p,(y), <p2( y ) , 9 w(y), che sono le effettive soluzioni di (p,(y)" +
+ b<p(y)n~l + c<p/y)"-2 H— + e = 0 per effetto delle relazioni di definizione
y4 18 y —y^
soddisfatte da y. (Nell’esempio precedente tp^y) = — , <p2(y) = — ——
4 lo 36
e <pj(y) = — — ). Ma quando m è il più piccolo possibile, non solo
36
l’equazione originaria ha n radici esprimibili in termini di y, ma anche il
risolvente di Galois ha m radici esprimibili in termini di y \indichiamole con
hW* ■■■» tmW* con m ^ 8ra<^0 del risolvente di Galois. Una di queste
radici esprimibili in termini di y è y stessa, poniamo /j(y) = y. Nell’esempio
9
precedente, abbiamo visto che il cubo di — - — = -- -
y 2 (—108) 2 12 2
è 1. Se a) rappresenta questa radice cubica dell’unità, allora le sei radici
del polinomio X6 + 108 possono essere tutte espresse in termini della sola
radice y: sono y, <oy, <o2y, —y, —wy e —a)2y. Se t}{y) è una qualsiasi radice,
allora sostituendo tj (y) al posto di y in <Pj(y), <p2(?)> •■■»9 » ^ ) ottengono le
n radici dell’equazione data
«Pi ((,<?))» <p2(f/y))» <p,(^/y))
in un ordine diverso. Detto in altro modo, scambiare la radice y con la radice
tAy) permuta queste n radici. Nel nostro esempio, scambiare y con -y lascia
4
invariata la prima radice e scambia le altre due. Invece, scambiare y con

<oy cambia — in *** y- = w •— che è la seconda radice . Da ciò


18 18 18 36
possiamo concludere che scambiare y con o)y permuta le tre radici ciclica­
mente: la prima con la seconda, la seconda con la terza e la terza con la prima.
Si può vedere che componendo queste due operazioni si ottengono tutte le
La risoluzione delle equazioni algebriche 175

sei possibili permutazioni delle tre radici, con la sostituzione di uno solo dei
sei possibili valori ±o>ky.
Galois dimostrò che le permutazioni ottenute in questo modo dipen­
dono solo dall’equazione data, non dalla scelta del risolvente di Galois o
da nessun 'altra scelta. Inoltre, fu in grado di descrivere come usare queste
permutazioni per determinare se un’equazione data potesse essere risolta per
radicali. In linguaggio moderno, le permutazioni delle radici determinate da
un risolvente di Galois di grado minimo formano un gruppo di permutazioni.
Galois descrisse una proprietà di questi gruppi - oggi chiamata risolubi­
lità - che determina se l’equazione è risolubile per radicali: un’equazione
è risolubile per radicali se e solo se il gruppo associato di permutazioni è
risolubile7. Bisogna ammettere che, in realtà, Galois descrisse la condizione
di risolubilità solo per le equazioni di grado n, con n numero primo, ma la
condizione generale è implicita nella sua discussione del caso generale e nella
sua dimostrazione nel caso di grado n con n numero primo8.
In questo modo si dimostrò, verso la fine degli anni Venti del xrx secolo,
che duecentocinquant’anni di tentativi per risolvere le equazioni algebriche
di grado quinto o superiore erano stati - come Gauss si aspettava - tentativi
di ottenere l’impossibile. Ma nessuna narrazione di questa storia può omet­
tere di menzionare le circostanze tragiche e drammatiche che coinvolsero i
due giovani uomini che risolsero il problema.
La prima dimostrazione del fatto che l’equazione generale di quinto grado
non può essere risolta per radicali è di solito attribuita al matematico norvegese
Niels Henrik Abel (1802-1829). Un suo articolo del 1826 fornì una dimostra­
zione piuttosto difficile da comprendere per i suoi contemporanei, con alcune
imprecisioni che vennero notate e corrette nella seconda edizione delle sue
(Euvres complète*, pubblicate nel 1881. Si trattò di uno dei primi (tra i molti)
brillanti risultati di Abel. Il mondo matematico, che gravitava allora attorno a
Parigi, si accorse molto lentamente del genio di questo modesto outsider, e nel
momento in cui il riconoscimento arrivò era ormai troppo tardi. Abel, infatti,
visse in povertà per la maggior parte della propria vita e mori di tubercolosi
prima di compiere 27 anni. Due giorni dopo la sua morte, avvenuta in un
remoto angolo della Norvegia, venne spedita una lettera da Berlino in cui gli
veniva offerto un lavoro prestigioso e sicuro come professore presso l’univer­
sità locale. Si sarebbe trattato della realizzazione di una delle poche speranze
cui Abel si era aggrappato negli ultimi disperati mesi della propria vita.

7 Un gruppo G è risolubile se esiste una successione di sottogruppi G = G0DGtDG2D ...D Gm


tale che G/+ ( sia un sottogruppo normale di G, ( i = 0, 1 ,..., m - 1), il quoziente G^, / G, sia un
gruppo abeliano c Gmsia il gruppo banale. Ricordiamo che un sottogruppo H di un gruppo G si
dice normale se. per ogni h S H c per ogni gE G . f'bg E H. [N.d.C'.].
* Per maggiori dettagli si veda B. Fine e G. Rosenoerger, Il teorema fondamentale dell'algebra,
S 4, in questo stesso volume, pp. 177-216. [ N.d.C.Ì.
176 Harold M. Edwards

Ma la storia di Évariste Galois (1811-1832) supera persino quella di Abel,


sia per quanto riguarda il mancato riconoscimento da parte del mondo ma­
tematico, sia per i pochi anni in cui si consumò. Galois fu per due volte
bocciato all’esame di ammissione all’École Polytechnique di Parigi e anche
se ebbe qualche limitato successo con la pubblicazione di alcuni lavori, non
fu mai in grado di presentare il suo rivoluzionario contributo in una forma
che fosse comprensibile all’establishment matematico parigino, e i suoi prin­
cipali trattati non furono pubblicati. Ma le cose andarono ancora peggio: era
infatti un attivista repubblicano piuttosto in vista e, come risultato di questa
sua passione politica, trascorse la maggior parte degli ultimi anni di vita in
prigione. Mori all’età di 20 anni in un duello, apparentemente collegato a una
ragazza con la quale aveva una relazione sentimentale, ma che probabilmente
era anche in qualche modo connesso alle sue attività politiche rivoluzionarie
e che vide il coinvolgimento della polizia segreta. Grazie agli sforzi dei suoi
amici, i lavori di Galois furono portati all’attenzione di Joseph Liouville molti
anni dopo la morte e nel 1846 Liouville ne pubblicò le opere superstiti nel
suo «Journal de mathématiques pures et appliquées». Liouville fu già di per
sé un importante matematico, ma la sua volontà di sforzarsi di comprendere e
difendere i contributi di Galois può essere considerato forse il suo più grande
contributo alla matematica; Galois, infatti, non solo risolse in modo più sem­
plice ed elegante il problema già risolto da Abel (e, come egli stesso sottolineò,
in maniera indipendente), ma soprattutto apri nuove strade al ragionamento
matematico che influenzarono profondamente lo sviluppo successivo della
matematica. Senza dubbio la matematica del xx e del x x i secolo sarebbe stata
notevolmente diversa e più povera se, cosa che rischiò seriamente di accadere,
l’opera di questo genio del xix secolo fosse andata perduta.

ABEL, N. H.
1881 CEuvres complètes, nuova ed. a cura di L . Sylow e S. L ie , 2 v oli., G ron d ai &
sen, Christiania.
EDWARDS, H. M.
1984 Galois Theory, Springer-Verlag, New York.
2005 Essays in Constructive Mathematics, Springer-V erlag, N e w Y o rk .
g a u ss , c . F.
1801 Disquisitiones Arithmeticae, Fleischer, Leipzig; poi in id ., Werke, voi. I, Kònig-
licheGeseUschaft der W issenschaften, G ò ttin g en 1 8 7 0 , p p . 3 -4 7 4 .
ore , o.
1974 Niels Henrik Abel, Mathematician Extraordinary ( 1 9 5 7 ), C h elsea, N ew York.
ROTHMAN, T.
1982 Genius and bioyraphers. The fictionalization o f Évariste Galois , in «American
Mathematical Monthly», 89, pp. 8 4 -1 0 6 .
B EN JA M IN F IN E e GERHARD R O SEN BER G ER

II teorema fondamentale dell algebra

1. Introduzione.

La risoluzione delle equazioni polinomiali ha sempre rappresentato, fin


dall’antichità, uno dei temi centrali della matematica: ha ormai alle spalle una
lunga e ricca storia e un vasto retroterra di risultati, tecniche e concetti, che
include i fondamenti della teoria delle equazioni. Lo studio delle equazioni
polinomiali si impernia su tre idee di base:
(1) l’esistenza di soluzioni;
(2 ) la relazione fra soluzioni di un’equazione e coefficienti del suo poli­
nomio;
(3) le soluzioni tecniche e i metodi per ottenere soluzioni numeriche
approssimate.
La chiave di volta della teoria delle equazioni sui numeri reali e com­
plessi è il fatto che ogni equazione polinomiale non banale a coefficienti
complessi ha sempre soluzioni nel campo dei numeri complessi. Il che equi­
vale a dire che ogni polinomio non costante P(z) a coefficienti complessi ha
una radice, o zero, fra i numeri complessi. Questa asserzione rappresenta il
contenuto del «teorema fondamentale dell’algebra» che ora enunceremo in
modo più formale. Ricordiamo che un polinomio complesso è una funzione
complessa della forma
P(z) = a j? + an_ x7?~x + ••• + a0
dove a0, at,.. ., an sono numeri complessi e n è un numero naturale. Una radi­
ce, o zero, di questo polinomio è un numero complesso Zq tale che PÌZq) = 0.
Se an # 0, allora il numero naturale n si dice grado del polinomio e se n > 0
il polinomio non è una costante. Il teorema fondamentale dell’algebra si
enuncia allora in questi termini:
Se P(z) è un polinomio complesso non costante, allora P(z) ha almeno una
radice complessa.
Questo famoso risultato, la cui prima dimostrazione pienamente accetta­
bile fu fornita nel 1797 da Cari Friedrich Gauss, coinvolge molti settori della
matematica, ed è ben difficile sopravvalutarne l’importanza. Ne esistono og­
gi molte dimostrazioni differenti, che utilizzano strumenti matematici assai
diversi; in questo saggio ci concentreremo in particolare sulle dimostrazioni
178 Benjamin Fine c Gerhard Rosenbergcr

che coinvolgono l’analisi, l’algebra e la topologia. In un nostro libro1abbia­


mo esposto dodici dimostrazioni diverse di questo teorema, le quali non
esauriscono quelle attualmente disponibili a stampa: inoltre, dal 2000 a oggi
sono state pubblicate almeno altre due nuove dimostrazioni.
Si può dimostrare che il teorema fondamentale può essere dedotto so­
lo dal fatto che ogni polinomio reale non costante ha almeno una radice
complessa (cfr. § 4): basta quindi dimostrare il teorema per i polinomi a
coefficienti reali. Inoltre, siccome le radici complesse non reali di un poli­
nomio reale si presentano sempre a coppie (se c ’è una radice c ’è anche la sua
complessa coniugata), ne segue che il teorema fondamentale è equivalente
al fatto che ogni polinomio reale può essere sempre fattorizzato compieta-
mente in fattori lineari e quadratici.
È sorprendente che il teorema fondamentale dell’algebra, in realtà, non
sia affatto un teorema di algebra pura. Tutte le sue dimostrazioni usano in
qualche misura l’analisi. Più specificamente, tutte le dimostrazioni usano
in un modo o nell’altro il teorema del valore intermedio dell’analisi reale o
il teorema del massimo modulo dell’analisi complessa. Il teorema del valore
intermedio asserisce che se una funzione continua assume due valori yl e
y2, allora deve necessariamente assumere tutti i valori compresi fra yl e y2:
da esso segue (cfr. § 4) che ogni polinomio reale di grado dispari deve avere
almeno una radice reale. Le dimostrazioni «algebriche», anche se usano
quasi esclusivamente argomentazioni di algebra, si basano tuttavia su questo
risultato. Il teorema del massimo modulo dice che una funzione analitica
complessa definita su una regione compatta del piano complesso C assume
il suo massimo sulla frontiera. Le dimostrazioni «analitiche» si fondano su
questo fatto o su sue varianti.
Perché ci sono tante possibili dimostrazioni diverse del teorema fonda-
mentale? Ciò dipende dal fatto che i polinomi a coefficienti complessi hanno
molte caratteristiche, di tipo piuttosto diverso. La prima è che i polinomi
complessi sono un caso particolare delle funzioni complesse, delle funzio­
ni da C in C. I polinomi complessi, come quelli reali, sono differenziabili
dappertutto, proprietà che li fa appartenere a una classe di funzioni che,
nel linguaggio dell’analisi complessa, sono dette intere. In questo contesto,
il teorema fondamentale dell’algebra è una conseguenza immediata di un
risultato più generale, noto come «teorema di Liouville». Nel paragrafo 3
vedremo due varianti di questo tipo di approccio.
Da un altro punto di vista, un polinomio complesso è un oggetto al­
gebrico. In questo contesto il teorema fondamentale può essere enunciato
cosi: II campo dei numeri complessi è algebricamente chiuso. Nel paragrafo

1 Fine c Rosenberger [2000], che potrà essere un utile riferimento per la maggior parte del
materiale che presenteremo qui.
11 teorema fondamentale dell’algebra 179

4 presenteremo i risultati relativi alle estensioni dei campi, utilizzandoli per


ottenere una dimostrazione del teorema fondamentale che dipende solo dal
fatto che un polinomio reale di grado dispari ha una radice reale e dal fatto
che, dato un polinomio irriducibile f{x) su un campo F, si può costruire
un’estensione F* di F in modo che f(x) abbia una radice in F*. Questa di­
mostrazione suggerisce la seguente generalizzazione. Se K è un campo in
cui tutti i polinomi di grado dispari hanno radici e se / = >/-!, allora K(i)
è algebricamente chiuso. La dimostrazione di questa generalizzazione fa
ricorso ad alcuni elementi di teoria di Galois: sempre nel § 4 , presenteremo
un’altra dimostrazione basata interamente su questa teoria.
Infine, un polinomio complesso può essere visto come un’applicazione
topologica. Se aggiungiamo il punto all’infinito al piano complesso ottenia­
mo la cosiddetta sfera di Kiemann S2. Poiché, se P(z) è un qualunque polino­
mio complesso P(°°) = P(%) pUò essere considerato come un’applicazione
continua P : S 2 —» S 2. A queste applicazioni si può associare un numero,
detto indice di avvolgimento, che misura quanto l’immagine di una curva
di classe C1 su S 2 si avvolge intorno a un punto quando viene applicata su
S2. Similmente, la funzione f(z) = z" avvolge il numero complesso z intorno
all’origine. Nel paragrafo 5 presenteremo una dimostrazione del teorema
fondamentale che fa uso delle proprietà di avvolgimento dell’applicazione
f(z) = zn. Generalizzeremo poi agli indici di avvolgimento delle applicazio­
ni di S 2 —» S2, riottenendo cosi il teorema fondamentale.
Ci sono molte varianti delle dimostrazioni che presentiamo. Come ab­
biamo appena detto, dodici di esse le potete trovare in Fine e Rosenberger
[2000]; negli ultimi anni ne sono state pubblicate almeno altre due.
Prima di concludere questa introduzione, vogliamo presentare alcuni
momenti della storia di questo teorema. La prima menzione del teorema
fondamentale dell’algebra, enunciato nella forma che ogni equazione polino­
miale di grado n ha esattamente n radici, risale al 1608, ed è dovuta al norim-
berghese Peter Roth, anche se la sua formulazione è in genere attribuita ad
Albert Girard, nella sua ìnvention nouvelle en 1‘algebre del 1629. Ritroviamo
lo stesso risultato nella Géométrie (1637) di René Descartes, che introdus­
se la distinzione fra radici reali e «immaginarie». Leibniz, verso la fine del
xvn secolo, si mostrò scettico a proposito di questo teorema, giacché non
credeva che un polinomio reale potesse essere fattorizzato completamente
in fattori lineari e quadratici. Eulero ne era invece convinto e tentò anche di
dimostrare questo fatto.
La prima dimostrazione del teorema fondamentale dell’algebra a essere
pubblicata fu quella di Jean d’Alembert, nel 1746. È per questo motivo che
spesso nei testi francesi il teorema fondamentale viene detto «teorema di
d’Alembert». Nella sua dimostrazione c erano però varie lacune, dato che il
matematico francese dava per buoni risultati che all’epoca non erano ancora
180 Benjamin Fine e Gerhard Roscnbergcr

stati dimostrati: per esempio il fatto che una funzione continua definita su un
compatto debba necessariamente avere un minimo. Il risultato è vero, ma fu
dimostrato soltanto un centinaio di anni più tardi. Analogamente, Eulero,
nella lettera a Nicolaus Bemoulli datata primo novembre 1742, assumeva
che le soluzioni esistessero e sotto questa ipotesi mostrava che dovevano
essere complesse.
La prima dimostrazione universalmente accettata fu quella data da Gauss
nella sua dissertazione dottorale del 1797 (pubblicata due anni dopo). È
interessante osservare che gli studiosi moderni, esaminando in dettaglio la
dimostrazione originale di Gauss, sono concordi nel ritenere che essa pre­
senti almeno altrettante lacune di quella di d’Alembert, e dello stesso genere.
Gauss, infatti, usò nella sua argomentazione certi risultati che, pur essendo
veri, sarebbero stati dimostrati solo molto tempo dopo. Egli, tuttavia, pub­
blicò altre tre dimostrazioni del tutto rigorose: la seconda e la terza nel 1816,
e quella finale (che era essenzialmente una rivisitazione della prima) nel
1849. Nel paragrafo 2 presenteremo una versione della quarta dimostrazione
di Gauss e discuteremo anche le altre tre.
Il teorema fondamentale dell’algebra va inquadrato nella storia dello svi­
luppo della teoria delle equazioni. Già i Babilonesi, circa 3600 anni fa, sape­
vano risolvere equazioni di secondo grado e conoscevano, sostanzialmente,
la relativa formula. Dopo la scoperta dei numeri complessi, questa formula
si interpreta nel senso che un polinomio di grado due a coefficienti in C ha
radici in C. All’inizio del Cinquecento, il bolognese Scipione Dal Ferro sco­
pri una formula analoga che forniva le radici di certe particolari equazioni
di terzo grado in termini di radicali. Questa formula cubica fu riscoperta
da Niccolò Tartaglia pochi anni dopo, anche se viene oggi erroneamente
detta «formula di Cardano», dato che questi fu il primo a pubblicarla nel
1545. Un allievo di Cardano, Ludovico Ferrari, estese la formula anche alle
equazioni di quarto grado2. La combinazione di queste formule mostrava
che i polinomi complessi di grado minore o uguale a quattro devono avere
radici complesse. Nel corso del xvn secolo ci si rese conto che le proprietà
di continuità dei polinomi implicavano che tutti i polinomi reali di grado
dispari dovessero avere una radice reale. Tutti questi risultati contribuirono
a dar credito al teorema enunciato prima da Roth nel 1608 e successivamente
da Girard nel 1629.
Si noti che tentare di risolvere un’equazione elaborando una formula in
termini di radicali rientra nella seconda idea di base che abbiamo ricordato
all’inizio: determinare le relazioni fra radici e coefficienti di un polinomio.

* Per maggiori dettagli sulla storia della risoluzione delle equazioni di gra d o 3 e 4 e dell’introdu-
zione dei numeri complessi, si veda P. D. Napolitani, II Rinascimento italiano, in questa stessa opera,
voi. 1. 1 luoghi e i tempi, Einaudi, Torino 2007, pp. 2 5 3 -5 4 . [N.d.C.].
Il teorema fondamentale dell’algebra 181

Tutte le formule prima della dimostrazione di Gauss erano di tipo costrutti­


vo, nel senso che contemplavano tutte e tre quelle idee contemporaneamen­
te: presentavano un modo di ottenere la soluzione in termini dei coefficienti,
mostrando cosi in un colpo solo l’esistenza di una soluzione, le sue relazioni
con i coefficienti e un metodo per risolvere l’equazione.
Da Cardano fin quasi all’inizio dell’Ottocento, si cercò di trovare for­
mule simili per i polinomi di quinto grado. Nel 1805 Ruffini dimostrò che le
equazioni di quinto grado non si possono, in generale, risolvere per radicali.
In altri termini, non esiste una formula «risolutiva» per le equazioni di quin­
to grado. Abel negli anni 1825-26 e Galois nel 1831 estesero il risultato di
Ruffini e dimostrarono l’impossibilità di risolvere per radicali l’equazione
generale di grado maggiore o uguale a 5. Nel corso di questa ricerca, Galois
sviluppò una teoria generale delle estensioni di campi e delle loro relazioni
con la teoria dei gruppi, teoria oggi nota come «teoria di Galois»: nel para­
grafo 4 presenteremo una dimostrazione del teorema fondamentale basata
su di essa.
Si noti però la profonda differenza di impostazione fra il risultato di
Gauss e la ricerca di soluzioni per radicali. Il teorema fondamentale del­
l’algebra, cosi come è enunciato e dimostrato, è un teorema di esistenza: le
sue dimostrazioni non forniscono un metodo costruttivo per trovare una
radice. La dimostrazione di Gauss si può considerare, anzi, la prima delle
pure dimostrazioni di esistenza, che svolgono un ruolo cosi importante nella
matematica moderna1.

2 . Le dimostrazioni originali di Gauss.

Gauss elaborò quattro dimostrazioni del teorema fondamentale: la prima


faceva parte della sua tesi di dottorato del 1799, anche se le idee risalivano
a due anni prima. La tesi iniziava con una critica delle dimostrazioni di Eu­
lero e d’Alembert, indicando che avevano assunto tacitamente l’esistenza di
soluzioni. Per la stessa ragione criticava le dimostrazioni di Fontenex e di La-
grange e passava poi a presentare la sua dimostrazione, che avrebbe dovuto
essere quella «corretta». Schematicamente, essa seguiva queste linee.
Poiché, se z è un numero complesso, anche P(z) è un numero complesso,
e poiché z = x + iy con x, y E IR, abbiamo che P(z) si potrà scrivere nella
forma
P(z) = u(x, y) + iv(x, y).

* Maggiori particolari sulla storia del teorema fondamentale si possono trovare in Remmen
[1983] o in Van der Waerden [1985].
182 Benjamin Fine e Gerhard Rosenberger

Le equazioni u(x, y) = 0 e t»(x, y) = 0 rappresentano allora delle curve nel


piano IR2. Gauss ne riscrisse le equazioni nelle coordinate polari r e 8 ; poi,
con un attento esame delle possibili funzioni u(r, 8 ), v(r, 8) per un polino­
mio complesso P(z), mostrava che le curve u(r, 8) = 0 e v(r, 8 ) = 0 dove­
vano intersecarsi in un punto (r0, 80). Il corrispondente numero complesso
Zq = x0 + iy0 doveva dunque essere una radice di P(z).
In effetti Gauss in questa prima dimostrazione non lavorò direttamente
con i numeri complessi, provando invece il risultato equivalente al teore­
ma fondamentale per cui ogni polinomio reale deve fattorizzarsi in fattori
lineari e quadratici. Gli studiosi moderni, analizzando criticamente le sue
argomentazioni, hanno sottolineato che esse presentano gli stessi difetti della
dimostrazione di d’Alembert: Gauss assume la validità di risultati non anco­
ra dimostrati, anche se tutti corretti. Lo stesso Gauss se ne dovette rendere
conto, perché la quarta dimostrazione, pubblicata nel 1849, costituisce so­
stanzialmente una versione corretta della prima. Accenneremo alla seconda
e terza dimostrazione, poi presenteremo una versione della quarta. Si tratta
della dimostrazione forse meno conosciuta dai matematici contemporanei,
che hanno in genere maggiore familiarità con quella di analisi complessa,
basata sul teorema di Liouville. Discuteremo questa dimostrazione più nota
nel prossimo paragrafo.
La seconda dimostrazione di Gauss fu pubblicata nel 1816. Si tratta
di una dimostrazione algebrica, che fa ricorso al risultato dell’analisi per
cui ogni polinomio reale di grado dispari deve avere una radice reale (una
conseguenza del teorema del valore intermedio). In essa si utilizza anche il
fatto che i polinomi complessi di secondo grado hanno radici: un’immediata
conseguenza, questa, della formula quadratica. Tracciamo qui uno schizzo
di questa seconda dimostrazione; nel § 4 forniremo la versione moderna
completa di tutti i dettagli. Sia
Piz) = zn + + •• + a 0
un polinomio a coefficienti reali di grado n. Come abbiamo già notato, sarà
sufficiente mostrare che esso possiede una radice complessa (cfr. § 4).
La dimostrazione procede per induzione sul grado n di/(x). Supponiamo
che n = 2mq con q dispari. Svilupperemo il ragionamento induttivo su m. Se
m = 0,/(x) ha grado dispari e il teorema è vero. Supponiamo allora che il
teorema sia vero per tutti i gradi d = 2kq', con k < m e q' dispari. Sia ora
il grado di/(x) uguale a n = 2mq e a , , ..., a n siano le sue radici in un qualche
campo (Gauss non fece questa assunzione, mostrando invece come lavorare
a ritroso per ottenerle in C).
Sia /una nuova variabile e costruiamo l’equazione ausiliaria
Il teorema fondamentale dell’algebra 183

Nel costruire H(x, t) abbiamo scelto coppie di radici {a^ ajl, cosicché il
numero di tali coppie è uguale al numero di modi di scegliere due elementi
da un insieme di n = 2mq elementi. Questo numero è uguale a

(? ) (2” * )!
2\{2”'q - 2 ) \
-
2
- 2" - ' ? (2"V - 1, = 2" - y

con q' dispari. Di conseguenza il grado di H(x) è 2 m~lq'.


Óra, H(x, t) è un polinomio simmetrico nelle radici a ,, ..., a . Poiché
a ,...... ot„ sono radici di un polinomio reale, Gauss potè dimostrare cne H(x, t)
è reale per tutti i valori di t. Si può allora applicare l’ipotesi induttiva; deter­
minata una radice di questa equazione ausiliaria, allora a, + a ■e sono
note e si può determinare sia a,, sia a;. Gauss mostrava poi come ricostrui­
re la soluzione complessa a partire dalla soluzione ausiliaria: discuteremo i
dettagli nel § 4. Inoltre è da osservare che Gauss costruiva direttamente il
polinomio ausiliario, ma la sua dimostrazione viene semplificata parecchio
usando il teorema di Kronecker, che asserisce l’esistenza di un campo in cui
si possa trovare una radice di un polinomio irriducibile assegnato: da questo
risultato è facile dimostrare l’esistenza di un «campo di spezzamento» del
polinomio (si veda il § 4).
La terza dimostrazione di Gauss è analitica, e fu pubblicata poco dopo
la seconda. Con lo sviluppo dell’analisi complessa, le idee su cui si basava
questa terza dimostrazione si sono trasformate nelle argomentazioni di tipo
analitico che discuteremo nel prossimo paragrafo; ci limitiamo qui a una
descrizione schematica.
Sia, come prima,
P(z) = z" + an_ x7r~' + +a0
un polinomio a coefficienti reali di grado n, ma consideriamo z come varia­
bile complessa. Scriviamo z in coordinate polari,
Z = r(cos <p 4* /'sin <p);

T = r" cos(mp) + an_ lr"-1 cos((« - 1) <p) + •••+ a0,

U = r" sin(rnp) + a s i n ( ( « - 1) <p) + + <7,rsin(<p)


siano, rispettivamente, la parte reale e la parte immaginaria di P(z). Fra poco
ritroveremo questa T e questa U nella quarta dimostrazione di Gauss. Per
provare il teorema fondamentale si deve dimostrare che c’è un punto in cui
T e U si annullano contemporaneamente.
Siano T f e U f le derivate, rispettivamente, di T e U rispetto a <p. Gauss
dimostrò che T V — UU' > 0 per tutti i <p e per tutti gli r > R, per un R
sufficientemente grande.
184 Benjamin Fine e Gerhard Rosenberger

Supponiamo ora che non ci sia nessun punto per cui T = U = 0 simulta­
neamente. Dovrà essere allora T2 + U2 0 e quindi la funzione
(T2 + U2)(TT' - UU') + {-TU' - UT')2 - (TT' - UU')2
r(T 2 + U2)2
avrà ovunque valori finiti. Sia S la regione del piano complesso definita da
0 < r ^ R, 0 ^ 9 ^ 2-77 (dove R è lo stesso di prima) e consideriamo l’inte­
grale doppio


IL /drd<p.

Dato che/ è finita, questo integrale esiste e il suo valore è indipendente


dall’ordine di integrazione. Se integriamo prima rispetto a <p, otteniamo l’in­
tegrale indefinito
f - T U '- U T
J T 2 + U2
Si ottiene lo stesso valore per <p = 0 e per <p = 2 tt, dunque il valore dell’in­
tegrale interno è zero e anche A deve essere zero.
Ma integrando prima rispetto a r si ottiene l’integrale indefinito

TT' - UU'
J T 2 + U2 '
Per r = 0 vale zero, ma per r = R è positivo e indipendente da q>: ne segue
che A > 0. Abbiamo cosi trovato una contraddizione che mostra che/non
può essere definita ovunque e deve quindi esserci un punto in cui T = U = 0
contemporaneamente. Van der Waerden [1985] ha cercato di spiegare come
Gauss possa essere arrivato a concepire questa dimostrazione.
Concludiamo il paragrafo fornendo una versione relativamente mo­
dernizzata della quarta dimostrazione di Gauss, che si basa liberamente su
Uspensky [1948].

2 .1. La quarta d im ostrazione di G a u ss.

Sia
/(z) = ? + an_ lzr-' + ••• + a 0
un polinomio complesso non costante. Come prima possiamo assumere che
il coefficiente di grado massimo sia 1 e che il termine costante a0 sia diverso
da zero; possiamo inoltre assumere che n > 2 . Infatti il caso n — 1 è quello
di un polinomio lineare che ha sicuramente una radice, mentre il caso n = 2
Il teorema fondamentale dell’algebra 185

è coperto dalla formula quadratica. Assumendo dunque che n > 2 , suppo­


niamo che, in coordinate polari, i coefficienti siano dati da
an_ , = >4(cos a + i sin a);
an_2 = fì(cos P + /sin (3);

a0 = L(cos A. + /sin X.);


e la variabile z da z = r(cos <p + i sin <p). Il polinomio/(z) può venir riscritto
in termini della sua parte reale e della sua parte immaginaria:
(2.1) f(z) = T(z) + iV(z)
e, usando le formule di de Moivre e l’espressione dei coefficienti in coordi­
nate polari, possiamo scrivere esplicitamente T e U in funzione di r e di <p:
(2.2) T = r" cos «<p + Af'~x cos((« — l)<p + a ) + •■•+ Lcos

(2.3) U = r" sin «<p + /Ir”-1 sin((« - l)<p + a) + ■■■ + L sin


Per dimostrare il teorema fondamentale, dobbiamo mostrare che esiste un
punto z0 in cui T(z0) e U(z0) si annullano simultaneamente.
Per prima cosa, facciamo vedere che è possibile trovare un numero reale
R tale che, se r > R, si abbia:
(2.4) r" - yf2(Arn~l + Brn~2 + - + L) > 0.
Infatti, sia S un numero reale positivo, maggiore di tutte le quantità A,
B ,..., L. Prendiamo allora R = 1 + yfis. S e r > R , r > 1 + yjl 5, e dunque

1- > 0 . Siccome r > R > 1, avremo che - + H------1- — < —— .


r —1 r r2 rn r- 1
Ne segue dunque che

r. ( 1 _ V & ( i + i + ... + ± ) ) > o

e quindi
rn - j 2 S ( r n-' H------ h l) > 0
ed essendo S maggiore di A, B, ..., L, segue, come si voleva, che
r" - y/2(Arn~l + Brn~2 + ••• + L) > 0.
In secondo luogo, una circonferenza di raggio r > R può essere suddivisa
in 2n archi, sui quali Tprende alternatamente valori positivi e negativi, come
mostrato in figura 1.
Per rendercene conto, sia 0 = — , e su una circonferenza di raggio
An
186 Benjamin Fine e Gerhard Rosenberger

r > R si considerino An punti, P0, Pv .... PA„-\, » cui argomenti saranno


e, 3 0 , (8« - 3)6; (8« - 1)6. Gli argomenti corrispondenti a P2k e P2i+l
sono, rispettivamente:
<p = {Ak + 1)— e <p'= (Ak + 3)-^-.
An An
Ne segue che
cos(mp) = (-1 )* e cos(w<p') = (—1)*+1 -j= .

Moltiplicando i corrispondenti valori di T per (—1)* e ( —1)*+1 ottenia­


mo:

( _ 1 ) * 7 = L - + (-\)k Ar"~ycos((w - l)<p + a ) + ----- h (- l)* L c o s \ ;


v2

(_ 1 )^ * 7 = I-= + ( - i ) k+lAr”- 1cos ((n - l)<p' + a) + •■• + ( - l ) /r+1Lcos\.


v2
Sostituendo
( - 1)* cos((« - l)<p + a ).......( - 1)* cos X
e
( - 1 ) * * 1 cos((« - l)tp' + a ), (~ 1 )* +1 cos X
con - 1 , otteniamo le seguenti disuguaglianze:

(- 1 ) * 7 > - Ì - ARn~l -------- L,


v2

Figura 1.
T su un cerchio di raggio r.
P2 T< 0
U teorema fondamentale dell'algebra 187

( - 1 )k+lT AR.n' ] -------- L.


V2
Grazie a come abbiamo scelto R, i membri destri di entrambe le disugua­
glianze sono positivi, e ne segue che T deve cambiare segno come volevamo
mostrare.
Ora, siccome T varia con continuità con <p, dovrà annullarsi almeno 2n
volte sul cerchio. Questi 2n zeri siano nei punti Qq, Q ,...... Q2n-\> * cui s g o ­
menti siano, rispettivamente, fra 0 e 30, fra 56 e 70 e cosi via, fino a (8n - 3)6
e (8n — 1)0. Se poniamo £ = tan(<p/2 ), abbiamo

1 - i2 21
coscp = -; sino? = --------
\+ i2 \+ i2
Sia ora

1 + l2 1 + £*
Se consideriamo il polinomio originario fiz), con questo cambio di variabile
la sua parte reale T diventa
T_ P2.W
(i + c2r 1
dove p2n( 0 è un polinomio a coefficienti reali di grado non superiore a 2n.
Siccome questo polinomio ha 2n zeri, il suo grado deve essere esattamente
2», e non ci possono essere altre radici. Di conseguenza, Qq, Qv ..., Q * -i
sono i soli punti su questo cerchio in cui T si annulla e i valori positivi e ne­
gativi di T si alternano sul cerchio come mostrato in figura 1.
Il terzo punto da osservare è che U, la parte immaginaria di/, assume va­
lori positivi in Q0, Q2.......Q2„-2 e negativi in Qv Qy ..., Q2n_v L’argomento

j. ^ c [Ak + D'ir {Ak + 3)tt l / 1 \ 1


<pdi Qt sta f r a -------------- e --------------: ne segue che (-lrsin(m p) ^ —j=.
An An V2
Moltiplicando 17per ( —1)* e sostituendo ( - 1 )*sin ((« - 1 )<p+ a ) ,..., ( - 1 )*sin X
con - 1 otteniamo la disuguaglianza

(-l)* l/ > r " (-l)* s in (m p ) - AR" ' ---------L


e dunque anche:
(-1 --------L.
v2
188 Benjamin Fine e Gerhard Rosenberger

Il membro destro è positivo per come abbiamo scelto R; il segno di 17 in Qk


è dunque ( - 1)*
Scegliamo ora un cerchio T di raggio r > R . La sua circonferenza è divi­
sa in In archi dai punti Q0, fra cui T cambia segno. Se facciamo
espandere il raggio del cerchio T, gli archi Q0Q l t QiQ2>ecc* descrivono 2n
regioni del piano che si estendono all’infinito; e in queste regioni - separate
da curve su cui T si annulla - T assume alternatamente valori positivi e
negativi. Seguendo Gauss e Uspensky, chiamiamo mari le regioni esterne
a T in cui T > 0; quelle in cui T < 0, terre. Le curve T = 0 sono allora le
rive. Gli n mari e le » terre si estendono anche all’interno di T passando
attraverso i vari archi. Partendo da Qp muoviamoci lungo la riva in modo
da avere, guardando verso l’interno, la terra sempre sulla destra. Finiremo
necessariamente con uscire da I\ e quando l’attraverseremo di nuovo la
terra dovrà essere ancora alla nostra destra. Se seguiamo la circonferenza
in senso antiorario, terre e mari si alterneranno. Di conseguenza dovremo
uscire da T guardando verso l’esterno in un punto di indice pari, o »
ovvero in Q2, o in Q.,, ecc. C’è dunque un cammino continuo 7 che porta
da Q. in un qualche punto Q2*! Su questo cammino 7 , T si annulla. Ora in
Q,, U < 0, mentre nel punto Q2*, U > 0. Dato che, lungo il cammino 7 ,
U è una funzione continua, ci dovrà essere un qualche punto di 7 in cui U
assume il valore zero. E in questo punto T e U s o n o entrambe nulle, il che
dimostra l’esistenza di una radice.
La figura 2 illustra quanto detto nel caso di uno speciale polinomio di
grado 5 studiato da Gauss. Partendo da Qt, ci muoviamo lungo la riva fino a
Q2. In Q,, U < 0, mentre in Q2, U > 0. Lungo la riva T = 0, e ci deve essere

Figura 2.
«Terrò* e «mari» per un polinomio di grado 5.
Il teorema fondamentale dell’algebra 189

un punto, indicato in figura con A, in cui U = 0: punto che rappresenta una


radice. Similmente, anche i punti B, C, D rappresentano radici. Il punto C è
una radice doppia; le altre sono semplici.

3. Dimostrazioni analitiche.

La terza dimostrazione di Gauss era basata sull’analisi. Col maturare


dell’analisi complessa nel corso della seconda metà delTOttocento, le idee
originali di Gauss furono trasformate nella dimostrazione del teorema fon­
damentale che è oggi quella più comunemente nota. La dimostrazione si
basa sul teorema di Liouville, che è a sua volta una conseguenza della for­
mula integrale di Cauchy. Le idee che hanno portato a questa dimostrazio­
ne rappresentano una concatenazione veramente bella di risultati di analisi
complessa: li presenteremo in questo paragrafo. Cominciamo con una dimo­
strazione che dipende solo da risultati di analisi reale e dalla formula di de
Moivre: ogni numero complesso ha una radice «-esima in C per ogni intero
positivo n. Il risultato più profondo che occorre conoscere è che una funzio­
ne a valori reali definita su un compatto (cioè un insieme chiuso e limitato)
D contenuto nel piano IR2 ha un punto di minimo assoluto in D.
Suddivideremo questa nostra prima dimostrazione in tre lemmi piuttosto
semplici.

Lemma 3.1. S e / : D —►IR è una funzione continua definita in un sottoin­


sieme compatto D C IR2, allora /(x, y) assume un minimo e un massimo in D.

Si tratta di una versione in due dimensioni del risultato di analisi elemen­


tare noto con il nome di «teorema di Weierstrass»: una funzione continua
definita in un intervallo [a, b\ di IR ha un massimo e un minimo in [a, b].
Più in generale, il teorema sussiste per tutte le funzioni continue a valori
reali definite su sottoinsiemi compatti di IR", n ^ 1. Se ne può trovare una
dimostrazione in un qualunque manuale di analisi.

Lemma 3.2. Siaf(x ) un polinomio a coefficienti complessi. Il modulo l/(x)l


assume un minimo in un qualche punto z0 E C.

Dimostrazione. È ovvio che quando \x\ —> °°, l/(x)l—♦ °°. Poiché l/(x)l
assume valori grandi al crescere di Ixl, ne segue che l’estremo inferiore m di
l/(x)l al variare di x in C è uguale all’estremo inferiore di l/(x)l quando x varia
in un disco di raggio r sufficientemente grande. Poiché l/(x)l è una funzione
continua a valori reali e il disco di raggio r è chiuso e limitato, dal lemma 3.1
segue che l/(x)l deve avere un minimo in quel disco.
190 Benjamin Fine e Gerhard Roscnbcrger

Il lemma cruciale è il prossimo, che costituisce una versione del principio


del minimo modulo applicato ai polinomi a coefficienti reali. Tutte le dimo­
strazioni del teorema fondamentale usano in un modo o nell’altro questa
idea o, alternativamente, il teorema del valore intermedio.

Lemma 3.3. Sia f(x) un polinomio a coefficienti complessi non costante.


Se f{x 0) * 0, allora l/(x0)l non è il valore minimo di \f{x)\.

Dimostrazione. Sia x0 un punto in cui/(x0) =£ 0. Con il cambiamento di va­


riabile, x + l’origine viene spostata in x0; possiamo dunque assumere che
/(0) ^ 0. Moltiplichiamo ora/(x) per/(0)_1, in modo che si abbia/(0 ) = 1.
Dobbiamo allora dimostrare che 1 non è il valore minimo per l/(x)l.
Sia k il più piccolo esponente diverso da zero che compare neH’espres-
sione di/(x). Possiamo dunque assumere che/(x) sia della forma
f ( x ) = l + a x k + termini di grado > k.
Sia ora a una radice ^-esima di —a~\radice la cui esistenza è assicurata dalle
formule di de Moivre. Facciamo un ultimo cambio di variabile, sostituendo
ax a x. Il polinomio/(x) assume cosi la forma
/(x) = 1 - x* + x*4'g(x), per un qualche polinomio g(x).
Se x è un numero reale positivo e sufficientemente piccolo, dalla disugua­
glianza triangolare otteniamo
l/(x)l < Il - x*l + x*+Ilg(x)l.
Ma x* < 1, per valori piccoli di x £ R, e la disuguaglianza diventa
l/(x)l < 1 - x* + x*Mlg(x)l = 1 - x*(l - xlg(x)l).
Per valori piccoli di x, xlg(x)l è piccolo: possiamo allora scegliere x0
in modo che x0lg(x0)l < 1. Ne segue che x„ (1 - x0|g(x0)|) > 0 e dunque
l/(x0)l < 1 = l/(0)l, il che completa la dimostrazione.

Combinando questi lemmi, otteniamo la nostra prima dimostrazione


analitica del teorema fondamentale dell’algebra.

Dimostrazione. Sia/(x) un polinomio a coefficienti complessi non costante.


Per il lemma 3.2, l/(x)l ha un minimo in un qualche punto x0 E C. Dal lemma
3.3 segue che l/(x0)l = 0, e quindi/(x0) = 0, perché altrimenti non potrebbe
essere il valore minimo. Di conseguenza,/(x) ha una radice complessa.

Considereremo ora un’altra dimostrazione analitica, basata sull’analisi


complessa. Si sviluppa, come vedremo, in maniera davvero elegante e viene
Il teorema fondamentale dell’algebra 191

studiata in tutti i corsi di analisi complessa. Cominceremo col descrivere


per sommi capi la successione di risultati che permettono di arrivare alla
dimostrazione del teorema fondamentale. Per le definizioni e i risultati di
base sulle funzioni analitiche e sull’integrazione complessa rinviamo il lettore
a qualche manuale classico4.
Il punto di partenza è il «teorema di Cauchy», o «teorema di Cauchy-
Goursat». Per intendere l’enunciato, diciamo (un po’ grossolanamente) che
un dominio semplicemente connesso di C è un dominio privo di buchi al
suo interno.

Teorema 3.4 (di Cauchy). Sia fiz) una funzione analitica in un dominio
semplicemente connesso U C C e sia 7 una curva chiusa interamente contenuta
in U. Si ha allora:
f(z)òz = 0.
' 7
Sia fiz) una funzione analitica*, ponendo/(z) = uiz) + iviz), le equazioni
di Cauchy-Ricmann [cfr. Ahlfors 1953 o Churchill 1960] si scrivono nella
forma:
du _ dv
dx dy

dv _ ctu
dx dy

Se queste derivate parziali sono continue, il teorema è allora una conse­


guenza diretta del teorema di Green. Cauchy, nei primi decenni dell’Ot-
tocento, elaborò la sua dimostrazione seguendo questa linea di attacco.
Successivamente, Goursat dimostrò che la sola ipotesi di analiticità di fiz) è
sufficiente; la sua dimostrazione non dipende dunque dalla continuità delle
derivate parziali, pertanto è più forte di quella che si può ricavare invocando
il teorema di Green.
Il teorema di Cauchy implica che ogni funzione analitica è a sua volta la
derivata di un’altra funzione analitica.

4Per esempio, Ahlfors [1953], Churchill [1960] o Rudin [1966]; si veda anche Fine e Rosen-
berger [2000].
’ Una funzione di variabile complessa definita in U si dice analitica (o olomorfa) in Use, per

ogni z, E U , / è derivabile in Zo, cioè se esiste (finito) il limite /'(z .) = lino, T — /[fo? <jj
^ 2-Zo
dimostra che una funzione è analitica se e solo se la sua parte reale e la sua parte immaginaria sod­
disfano le equazioni di Cauchy-Riemann. [N.d.C],
192 Benjamin Fine e Gerhard Rosenberger

Teorema 3.5. Staf(z) unafunzione analitica nel dominio U semplicemen­


te connesso. Esiste allora una qualche funzione analitica F(z) definita in U,
tale che F i z ) = f(z).

Col teorema di Cauchy prende il via una serie di risultati che costitui­
scono il cuore dell’analisi complessa e conducono - come vedremo - a una
dimostrazione del teorema fondamentale dell’algebra. Il primo di essi è la
formula integrale di Cauchy.

Teorema 3.6 (formula integrale di Cauchy). Sia f(z) una funzione anali­
tica in un dominio semplicemente connesso U C C e sia y una curva semplice
e chiusa, interamente contenuta in U.SezQè un punto interno a y, allora

f( , 1 f f(z ) ,
= -------- dz-
2™ J y z ~ zo
dove l’integrale è eseguito lungo y, percorsa in senso antiorario.

Questo teorema implica che, per una funzione analitica nel dominio U,
i valori interni a una curva contenuta in U sono completamente determinati
dai valori che la funzione assume sulla curva. La condizione di analiticità
impone dunque una relazione assai forte fra valori assunti sulla frontiera
della regione delimitata da tali valori e valori all’interno della regione. Da
questa formula si ricava il «teorema del massimo modulo».

Teorema 3.7 (teorema del massimo modulo). Sia f(z) una funzione ana­
litica non costante in un dominio limitato D, continua sulla frontiera di D.
Allora il modulo di f, \f(z)\, assume il suo massimo sulla frontiera di D e non
in un punto interno.

La dimostrazione dipende dal «principio del massimo modulo», una


conseguenza della formula integrale di Cauchy.

Teorema 3.8. Se f(z) è una funzione analitica non costante in un do­


minio U, e Zq E U, allora ogni intorno di z0 contiene dei punti z tali che
\fiz)\ > I/ M .

Concludiamo questo paragrafo usando il principio del massimo modulo


per ottenere una dimostrazione del teorema fondamentale che rispecchia la
prima che abbiamo fornito.
Non è difficile ottenere la formula integrale di Cauchy dal teorema di
Cauchy. Sia C0 un cerchio di raggio r0 e di centro z0. Se r0 è sufficientemente
piccolo, C0 sarà tutto interno a y, come illustrato in figura 3.
Il teorema fondamentale dell’algebra 193

La funzione g(z) = risulta dunque analitica nella regione a forma


z - z0
di anello limitata da y e da C0. Allora, per il teorema di Cauchy:

(3.1) f ^ L d z - f ^ L d z = o,
J 7 Z “ *0 J C. Z * *0
e dunque
f _( JH La,
J , * - *0 J c. « - *0

Si ha allora

(3.2) [ - ^ - d z = / ( z 0) [ - ^ - + [ / (z)- / (V d,
J y Z Z0 J C„ Z Zo j c0 z z0

Ora, siccome su C0 abbiamo che z = z0 + r0é>" e dz = ir^ d t, ne segue che


r2ir
di = 2iri.
f — - ' f

Poiché f i z ) è continua in z0, se scegliamo r0 abbastanza piccolo, avremo


|
fiz) — /(Zq) I < £ per Iz — Z0I ^ r0 (cioè all’interno di C0). Dunque

Figura 3.
La regione a forma di anello.
194 Benjamin Fine e Gerhard Rosenberger

Di conseguenza, si può rendere piccolo a piacere il valore assoluto del secon­


do integrale in (3.1); quindi tale integrale deve essere nullo e abbiamo

dz = 2 ttì / ( z 0 ).
I, z ~ zo
Ricordiamo che se g(x, t) è una funzione differenziabile in due variabili e

si ha

Vale a dire: se si definisce una funzione di una variabile integrando una


funzione di due variabili rispetto a una variabile, allora la derivata della fun­
zione cosi definita si ottiene integrando la derivata parziale rispetto alla va­
riabile libera nell’integrale. Applicando questa idea alla formula integrale di
Cauchy, si ottiene un’espressione per la derivata di una funzione analitica.
Abbiamo:

Differenziando sotto il segno di integrale rispetto a z0 si ottiene

Induttivamente, possiamo differenziare più volte rispetto a Zq, ottenendo


la formula data dal seguente corollario della formula integrale ai Cauchy.

Corollario 3.9. Sia/iz ) analitica in un dominio U semplicemente connes­


so e U contenga una curva semplice chiusa y. Se Zq è interno a y allora la sua
derivata n-esima si può esprimere come
11 teorema fondamentale dell’algebra 195

In particolare, questo mostra che, se fiz ) è analitica in una data regione


U, allora ha in U derivate di tutti gli ordini.

Corollario 3.10. Se fiz) è analitica in un dominio U semplicemente con­


nesso, allora ha in U derivate di tutti gli ordini.

Ricordiamo che una funzione analitica è sempre la derivata di un’altra


funzione analitica. Una conseguenza del corollario 3.10 è che la derivata di
una funzione analitica è ancora analitica.

Corollario 3.11. La derivata di una funzione analitica è essa stessa una


funzione analitica.

Vale la pena di notare la differenza con le funzioni a valori reali definite su


R. Una funzione y = /(*) con x, y G IR può benissimo essere derivabile una
volta ma non due. In generale, una funzione/: [a, b] —►R si dice di classe
C" se è derivabile n volte. Per ogni «, CW+1 è un sottoinsieme proprio di C",
ovvero ci sono funzioni differenziabili n volte ma che non sono differenzia­
bili n + 1 volte.
La classe C' è fatta dalle funzioni che sono differenziabili infinite volte,
per esempio e* o sin x. Il corollario 3 .10 ci dice che una funzione analitica in
una data regione di C è anche C' in quella regione.
Le funzioni analitiche reali sono quelle che possono venir rappresentate
con serie di Taylor convergenti. E ovvio che tali funzioni debbano necessa­
riamente essere Cx; tuttavia, esistono funzioni Cx reali che non sono analiti­
che. Questo non può accadere con le funzioni complesse; se una funzione
è analitica in una certa regione, allora ha uno sviluppo in serie di Taylor in
quella regione.

Teorema 3 .12. Sia fiz) una funzione analitica in tutti i punti interni di un
cerchio C0 di raggio r0 e di centro Zq. All’interno di C0, fiz) è rappresentabile
con una serie di Taylor convergente centrata in z& ovvero, per ogni z interno
a Cnsi ha:
f laì(7 )
m = /(z „ ) + /'(z „ )(z - z0 ) + - + - z0r + - .
n!
La formula integrale di Cauchy ci fornisce poi la stima di Cauchy per il
modulo della derivata //-esima.

Teorema 3.13 (stima di Cauchy). Siafiz) analitica in un dominio U sem­


plicemente connesso che contenga la circonferenza C0 di raggio r0 e di centro
Zq. Se M è il massimo valore assunto da \f{z)\ su C& allora
1% Benjamin Fine e Gerhard Rosenberger

nlM

In particolare, se \f(z)\ < M in tutti i punti di C0 e in tutti i punti interni,


allora
| / -w | < -
ro
per tutti gli z interni a C0.

Dimostrazione. Dal corollario 3.9 segue che

fiz)
( z - z 0)"+l
dz _Mn\
__
2t t
f dZ
Jc„ i z - z 0r +'

Sulla circonferenza di C0>z = Zq + r^é1e dz = ir0e“àt, dunque

f dz .
J c . (*-*„> 1
[
1 J0
r " V in,d/ = 2tt r -\

Di conseguenza
Mn\
|/'”’Uo)|s

Grazie alla stima di Cauchy possiamo dimostrare ora il teorema di Liou­


ville, da cui si ottiene facilmente la nostra seconda dimostrazione completa
del teorema fondamentale dell’algebra. Una funzione intera è una funzione
analitica su tutto il piano complesso.

Teorema 3.14 (di Liouville). (i) Siafiz) unafunzione intera il cui modulo
\fiz)\ sia limitato per ogni z E C. Sotto queste ipotesi, fiz) è costante.
(ii) Più in generale, se il modulo della derivata n-esima, [/Tw)(z) \, è limitato
su tutto C, fiz) è un polinomio di grado al più n + 1.

La dimostrazione del teorema di Liouville segue facilmente dai risultati


precedenti. Supponiamo che/(z) sia intera e che l/(z)l ^ M per ogni z E C.
Allora, la stima di Cauchy su una circonferenza di raggio r centrata nell’ori­
gine ci dà
M

Poiché fiz) è intera, possiamo far tendere r all’infinito, ottenendo così


l/'(z)l = 0 e dunque f i z ) = 0. Ciò, ovviamente, implica che fiz ) debba
essere costante, il che completa il punto (i).
Il teorema fondamentale dell’algebra 197

Per il punto (ii), se \fn)(z)\ ^ M per tutti gli z E C, la stima di Cauchy


fornisce
|/'’ * " (z )| s —
I I r
per ogni circonferenza di raggio r centrata nell’origine e abbastanza grande
da contenere z. Facendo tendere r all’infinito, otteniamo che/^'Kz) = 0 e
dunque ehe/tw,(z) è costante. Di conseguenza,/(z) è un polinomio di grado
al più n + 1.
Presentiamo ora una dimostrazione del teorema fondamentale dell’al­
gebra basata sul teorema di Liouville. Come abbiamo già detto, questa è
la dimostrazione più comunemente nota, e la chiameremo «dimostrazione
standard».

Dimostrazione. Sia P(z) un polinomio complesso non costante; esso è una


funzione analitica su tutto il piano complesso. Poniamo

Se, per assurdo, P(z) non avesse radici complesse, anche f(z) sarebbe una
funzione intera.
Poiché IP(z)l —» 00 quando Izl —» esistono M e r > 0 tali che
IP(z)l > M se Izl > r.
Questo implica che, per Izl > r,

1 ^ =1 ^
Se fiz) fosse intera, dovrebbe essere continua e, di conseguenza, limitata
sul compatto Izl ^ r. Ne segue che se fiz) fosse intera, sarebbe limitata su
tutto C. Per il teorema di Liouville,/(z) dovrebbe essere costante; ma allora
anche P(z) sarebbe costante, il che è assurdo. Dunque P(z) deve annullarsi
in almeno un punto z G C .

In effetti, ciò che abbiamo dimostrato è che se fiz) è una funzione intera
non costante con la proprietà che l/(z)l —* <* quando Izl —* °°, allora fiz) deve
avere almeno uno zero in C: deve cioè esistere un punto Zq E C tale che
/(Zq) = 0. Tuttavia, uno studio attento delle funzioni intere mostra che una
tale funzione deve necessariamente essere un polinomio. Più precisamente, i
polinomi complessi possono essere caratterizzati come quelle funzioni intere
che sono infinite aH’infìnito. Per maggiori particolari, si veda il libro di Lars
Ahlfors [1953].
Chiudiamo questo paragrafo fornendo un’altra breve dimostrazione
analitica del teorema fondamentale, che ricalca le linee della prima, solo
198 Benjamin Fine e Gerhard Rosenbergcr

che adesso abbiamo a nostra disposizione il principio del massimo modulo.


Il lemma 3.3 diventa cosi non più necessario, anche se, alla luce dell’analisi
complessa, tale lemma non è altro che il principio del massimo modulo
applicato ai polinomi.

Dimostrazione. Poiché un polinomio a coefficienti in un campo può avere


solo un numero finito di radici, ne segue che, se piz) è un polinomio comples­
so non costante, esso non può essere localmente costante. Ciò significa che
non può esistere un aperto U C € su cui piz) sia costante, perché se piz) = c
per ogni z E U , allora il polinomio g(z) = piz) — c avrebbe infiniti zeri.
Sia piz) = <z0 + a {z + •••+ a j? un polinomio complesso di grado n > 1.
Per ogni r > 0 sia Ur = Br(0) il disco chiuso di raggio r e centro in 0. Ur è
compatto e dunque, dato che piz) è una funzione continua, lp(z)l ha un mi­
nimo in qualche punto zr G Ur. Poiché lp(z)l —>00 quando Izl —>» , possiamo
scegliere un R abbastanza grande da assicurarci che il punto di minimo
zR cada nella parte interna di UR. Si scelga infatti s > 0 tale che, se Izl > s,
lp(z)l > l<z0l = lp(0)l. Scegliamo R > s\ allora, sulla frontiera di UR, abbiamo
che lp(z)l > lp(0)l, e quindi il punto di minimo del polinomio sul compatto
UR deve cadere al suo interno.
Dunque, zR si trova nella parte interna di UR e pertanto si avrà che
|p(zR)l ^ lp(z)l per ogni z G UR. Poiché zRappartiene alla parte interna di UR,
deve esservi incluso tutto un suo intorno: esiste quindi un e > 0 tale che, se
Ul = BtizR) è il disco chiuso di raggio e e centro zR, U ! deve essere contenuto
in UR. Ma siccome piz) è una funzione analitica su tutto il piano complesso,
è analitica anche su 17,; inoltre lp(zR)l ^ lp(z)l per tutti gliz G 17,. Allora, per
il principio del massimo modulo, o pizR) = 0, o piz) è localmente costante su
U v Ma come abbiamo osservato, un polinomio non costante non può essere
localmente costante, e quindi deve necessariamente essere p izR) = 0 .

4. Dimostrazioni algebriche.

La seconda dimostrazione di Gauss era di natura algebrica e in questo


paragrafo ne forniremo due di questo tipo. La prima è una versione moder­
nizzata di quella di Gauss; la seconda utilizza la teoria di Galois. Tuttavia,
nessuna delle due è completamente indipendente dall’analisi: entrambe as­
sumono il fatto che un polinomio reale di grado dispari debba avere almeno
una radice reale.
Inizieremo col dimostrare formalmente che, per provare il teorema fon­
damentale, basta provare che ogni polinomio reale non costante ha una ra­
dice complessa.
Il teorema fondamentale dell’algebra 199

Per cominciare, ci serve la nozione di coniugato di un polinomio e alcune


sue conseguenze immediate. Se
Pix) = a0 + ■■■ + a ^
è un polinomio complesso, allora il suo coniugato è il polinomio
Pix) = à Q+ ••• + a j?
In altre parole, il coniugato di un polinomio è il polinomio i cui coefficienti
sono i complessi coniugati dei coefficienti del polinomio dato. Ne deriva
immediatamente il seguente lemma.

Lemma 4.1. Se Pix) è un polinomio complesso:

(1) P(z) = P iz) per ogniz E C;


(2) Pix) è un polinomio a coefficienti reali se e solo se Pix) = P (x);
(3) seP{x)Qix) = H{x), allora Hix) = P(x)Q(x).

Sia ora Pix) un polinomio a coefficienti complessi e poniamo


H(x) = Pix) Pix). Prendendo il coniugato di Hix), per il lemma preceden­
te abbiamo
Hix) = Pix) Pix) = Pix) Pix) = Pix)P(x) = Pix) Pix) = Hix).
Di conseguenza, Hix) è un polinomio reale. Otteniamo cosi il seguente teo­
rema.

Teorema 4.2. Se ogni polinomio non costante a coefficienti reali ha alme­


no una radice complessa, allora anche ogni polinomio non costante a coeffi­
cienti complessi ha una radice complessa.

Dimostrazione. Supponiamo che ogni polinomio non costante a coef­


ficienti reali abbia almeno una radice complessa. Sia Pix) un polinomio a
coefficienti complessi e Hix) = Pix)Pix). Da quanto appena detto,H {x )è
un polinomio a coefficient^reali, e dunque esiste ZqE C tale che H ìzq) = 0.
Abbiamo allora che Piz0)P (z0 ) = 0, e poiché in C non ci sono divisori dello
zero, o Piz0) = 0, o P (z0) = 0. Nel primo caso, Zq è una radice di Pix). Nel
secondo, Piz0) = 0 , cosicché 0 = Piz0) = P ÌZq) = P (^). Dunquez0 è, in
questo caso, radice di Pix).
Si osservi che questo teorema ci dice che per dimostrare il teorema fon­
damentale basta dimostrarlo per i soli polinomi a coefficienti reali.
Presentiamo ora la nostra versione modernizzata della seconda dimostra­
zione di Gauss. Ci serviranno quattro ingredienti: il fatto che i polinomi reali
di grado dispari hanno sempre una radice reale; il fatto che i polinomi reali di
200 Benjamin Fine e Gerhard Rosenberger

secondo grado hanno sempre radici complesse; il teorema di Kronecker, che


afferma che per ogni polinomio irriducibile su un campo F esiste un’esten­
sione di F in cui il polinomio ha almeno una radice; e infine le proprietà
fondamentali dei polinomi simmetrici.
Affronteremo questi punti uno dopo l’altro e poi presenteremo la dimo­
strazione del teorema fondamentale.

Lemma 4.3. Un polinomio a coefficienti reali di grado dispari ha almeno


una radice reale.

Dimostrazione. Sia P(x) E R[x] di grado n = 2k + 1 e supponiamo che


a , il coefficiente di grado massimo (o coefficiente direttore), sia maggiore
ai zero (la dimostrazione sarebbe praticamente identica se fosse an < 0).
Abbiamo allora
P(x) = a + (termini di grado minore) e n dispari.
Allora:
(1) limx_ x Pix) = limx_ x a ^ = » dato che an > 0 ;
(2) limx___ Pix) = lini,___ anxP = -oc dato che an > 0 e n è dispari.
Da (1) ricaviamo che Pix) diventa sempre più grande, e quindi esiste
un Xj tale che P(xt) > 0. Similmente, da (2 ) segue che esiste un x2 tale che
P M <0.
Un polinomio a coefficienti reali è una funzione a valori reali, continua
per ogni x E R. Poiché P(xj)P(x,) < 0, dal teorema del valore intermedio
segue che esiste un x3, compreso fra x, e x2, tale che P(x3) = 0.

Una conseguenza immediata è il seguente corollario.

Corollario 4.4. Se Pix) E R[x] è irriducibile e di grado maggiore di 1,


deve necessariamente avere grado pari (vedremo fra breve che tale grado deve
essere 2).

Consideriamo ora un polinomio a coefficienti complessi di grado 2 :


Pix) = ax2 + bx + c con a 0 . La formula quadratica ci dice che le radici
di Pix) sono _______ ________
- b + 4 b 2 - 4 ac - b - yjb2 - Aac
x, = --------------------- , x , = ----------------------- .
1 2a 2 2a
Le formule di de Moivre ci dicono che ogni numero complesso ha due radici
quadrate, quindi x., x2 esistono e appartengono a C. Naturalmente possono
coincidere, cosa che accade se e solo se P — Aac = 0. Abbiamo dunque
dimostrato il risultato seguente.
Il teorema fondamentale dell’algebra 201

Lemma 4 .5. Ogni polinomio a coefficienti complessi di grado 2 ha radici


in C.

Dobbiamo ora stabilire il teorema di Kronecker; a tal fine ci occorrono


alcune definizioni. Se F è un campo e f(x) un polinomio a coefficienti in F,
f(x) si dice irriducibile se non può venir fattorizzato in polinomi non costanti
di grado minore. Ovviamente, se il grado di/(x) è 1, alloraf(x) è irriducibile.
Se/(x) è irriducibile e ha grado maggiore di 1, non può avere radici in F.
Se F e F' sono due campi e F è contenuto in F\ allora F' viene detto
un’estensione di F. F' può allora essere visto come uno spazio vettoriale su
F e con grado dell’estensione si intende la dimensione di F' come spazio
vettoriale su F. Denoteremo tale grado con IF' : FI. Se F' è un’estensione di
F di grado finito (cioè, IF' : FI < °°), F' è uno spazio vettoriale di dimensione
finita su F, e F' viene detto un’estensione finita di F.

Teorema 4.6 (di Kronecker). Se F è un campo e f(x) un polinomio irri­


ducibile a coefficienti in F, F possiede uri estensione finita, F', in cui f(x) ha
una radice.

Il campo F' viene costruito aggiungendo una radice, a, a F in modo assai


simile a come vengono costruiti i numeri complessi a partire dai reali, ag­
giungendo cioè l’unità immaginaria 4 -\ .
Sia/(x) = + axx + ••• + aj<? con an ± 0. Definiamo a in modo che
soddisfi la relazione:
a0 + tf,ot + ••• + anatt = 0.
Definiamo ora
F M = { f o + f a + ••• a "-1;/’ E F}.
Su F (a) possiamo allora definire un’addizione e una sottrazione componente
per componente, e possiamo definire una moltiplicazione algebricamente,
rimpiazzando le potenze di a maggiori di a "-1 usando la relazione

a » _ - “o - “>a --------
",
Si può a questo punto dimostrare facilmente che F' = F(a) forma un
campo di grado finito su F 6.
Nell’estensione che abbiamo costruito, il polinomio x - a divide/(x),
cosicché/(x) = ( x - a)g(x). Continuando per questa strada, possiamo tro­

* Per ulteriori dettagli rinviamo il lettore a Fine e Rosenberger [2000].


202 Benjamin Fine c Gerhard Roscnbcrgcr

vare un'estensione F* di Fin cui il polinomio dato si spezza in fattori lineari:


questa estensione viene detta il campo di spezzamento di /(x) quando F* è
l’estensione di F che si ottiene aggiungendo a F le radici di/(x). Otteniamo
cosi il seguente corollario.

Corollario 4.7. Se F è un campo ef{x) un polinomio irriducibile a coeffi­


cienti in F, allora esiste un campo di spezzamento di/(x).

Gli ultimi materiali di cui necessitiamo riguardano le proprietà dei po­


linomi simmetrici. Supponiamo ch e?,, y„ siano variabili indipendenti
su un dato campo F. Un polinomio f{y x,.. . , yn) in n variabili e a coefficienti
in F viene detto simmetrico nelle variabili yv ..., y„ s e f { y v ■■■, y„) non
cambia quando si opera una permutazione tr su [ylt in altre parole
/(yp •••*>„) = ffa iyX ...,v(y„)), per ogni permutazione cr delle variabili.
Se F C F' sono due campi e a p an G F', diremo che un polinomio
/ ( a ,,.... a„) a coefficienti in F è simmetrico in a , , a „ s e / ( a , , a ) non
cambia quando si operi una qualunque permutazione cr di {a ,, ..., a n}.
Per esempio, sia F un campo e/0,/j E F. Consideriamo il polinomio

b(ylty2) =Uy\ + y2) +A(y\y2)-

Possiamo permutare [ylty2) in due modi: cr, : y1 —1► y., y2 —►


y2>c ( J 2 : y 1 ~ * Tz»
y2 —* yv L’applicazione di una qualsiasi di queste aue permutazioni lascia
invariato h{yv y2)t che risulta cosi un polinomio simmetrico.
Siano ora x, yx,..., yn variabili indipendenti su un campo F o elementi di
un’estensione F' di F. Costruiamo il polinomio
p(x,yu . ..,y„) = ( x - y x) ... (x - y „ ) .
Mi-esimo polinomio simmetrico elementare st nelle variabili yv ...,y n è,
per definizione, uguale al coefficiente di x""' in p(x, y l t ..., yn).
I polinomi simmetrici elementari hanno dunque la forma:

*1 = y \ + y 2 + "■ + y»>
*2 = + w ? + ••• +
+ y1 ^4 + - + yn -$n -\y *

s„ = y 1 -y „ -
L’importanza dei polinomi simmetrici elementari sta nel fatto che, a par­
tire da essi, si può costruire qualsiasi polinomio simmetrico. Il seguente
teorema è di importanza cruciale7.

7 Per la dimostrazione si veda ibid.


11 teorema fondamentale deU’algebrs 203

Teorema 4 .8 (teorem a fondamentale sui polinomi simmetrici). Se P


è un polinomio simmetrico nelle variabili yv .... indipendenti su F,
allora esiste un unico polinomio g tale che P(y,.......yH) — g(sx........s„). In
altre parole, ogni polinomio simmetrico in yx, ...,y n sipuò rappresentare
come uri espressione polinomiale nei polinomi simmetrici elementari in
yv •••*?»•

Da qui possiamo ricavare due lemmi che avranno un ruolo centrale nella
nostra dimostrazione del teorema fondamentale dell’algebra.

Lemma 4 .9 . Sia pix) E F[x] e le sue radici nel suo campo di spezzamento
F' siano otj, ..., cr„. I polinomi simmetrici elementari valutati in a ,,
sono elementi di F.

Dimostrazione. Sia pix) = f 0 + f xx + ••• + f j ? E F[x]. In F [x ],p ix ) si


spezza e le sue radici sono a ,, ..., a„; di conseguenza, in F'[x] abbiamo:
pix) = f nix - a ,) ... ix - ot„).

I coefficienti sono allora /„( —1Ysjav ..., an), dove gli st(a ,,..., otw) deno­
tano i polinomi simmetrici elementari in a , , ..., a„. Ma i coefficienti di pix)
appartengono a F : dunque, per ogni /,/„ (—D'i/ot,, ..., a,,) E F, e quindi
anche j/ a ,, . . . , o j G F , dal momento che/, E F.

Lemma 4 .1 0 . Sia pix) E F[x] e le sue radici nel campo di spezzamento


F' siano a j, ..., a n. Consideriamo il polinomio gix) = g(x, a , , . . a„) a coef­
ficienti in F'. Se gix) è un polinomio simmetrico in a , , ..., allora g(x) è a
coefficienti in F.

Dimostrazione. Se gix) = gix, a , , ..., a ) è un polinomio simmetrico in


a j , ..., a„, allora, per il teorema 4.8 è un polinomio nei polinomi simmetrici
elementari in a ì, . . . , a„. Ma, per il lemma 4.9, questi appartengono al campo
F, e dunque i coefficienti di g(x) appartengono a F.

Dotati ormai di tutti questi ingredienti, possiamo dimostrare il teorema


fondamentale.

Dimostrazione. Dimostreremo che ogni polinomio non costante a coeffi­


cienti reali ha una radice complessa: abbiamo visto che questo è sufficiente
per ottenere il risultato.
Sia fix) = a0 + aìx + ••• +<vc"con/i> un polinomio di grado di­
spari a coefficienti reali. La dimostrazione si sviluppa per induzione sul grado
204 Benjamin Fine e Gerhard Roscnbcrgcr

n di/(*). Supponiamo che n —2mqt con q dispari. Sviluppando l’induzione


su m, se m = 0,/(x) ha grado dispari e il teorema segue dal lemma 4.3. Sup­
poniamo allora che il teorema sia vero per tutti i gradi d = 2 kq' con k < m c
q* dispari e dimostriamolo nel caso che il grado di/(x) sia n = 2 mq.
Sia F il campo di spezzamento di/(x) su 03, in cui /ha radici a , , . . . , a^.
Mostreremo che almeno una di esse deve essere in C (di fatto, sono tutte in
C, ma per dimostrare il teorema ci basta mostrare che ce n’è almeno una).
Sia h un intero e costruiamo il polinomio
H(x) = J | ( x - (a, + a y + h a ^ j)) .
•</
Si tratta di un polinomio a coefficienti in F '. Per costruire H(x) scegliamo
coppie di radici (a,, oty) in modo che il numero di queste coppie sia uguale al
numero di modi di scegliere due elementi da un insieme di n = 2 mq elementi.
Questo numero è uguale a

( r A _ _ a ^ n _ _ a r g r , - u . 2„ - , _ . 2. . ,
{2 J 2!<2"f-2>! 2
dove q' è dispari. Di conseguenza il grado di H(x) è 2 m~xq ' .
H(x) è un polinomio simmetrico nelle radici a ,, Poiché a ,,
sono le radici di un polinomio a coefficienti reali, il lemma 4 .10 ci assicura
che ogni polinomio a coefficienti nel campo di spezzamento e simmetrico
rispetto a queste radici deve essere in effetti a coefficienti reali.
Di conseguenza, H{x) è un polinomio reale di grado 2 m~xq '. Grazie al­
l’ipotesi induttiva, Hix) dovrà avere una radice complessa: il che implica che
esista una coppia (ar, a f) tale che
a , + a , + h a ra s
appartenga a C.
Siccome l’intero h era stato scelto arbitrariamente, per ogni intero hx
deve esistere una coppia (a,, a;) che soddisfi
a , + ay + h {a ta- G C.
Facciamo variare hxfra gli interi: siccome c e solo un numero finito di cop­
pie di radici, mentre i numeri interi sono infiniti, ne segue che dovranno
necessariamente esistere due interi distinti b .,h - ,e una coppia {a-, a ) tali
che gli dementi ' '
z, = a, + a, + A,a,a, e z2 = a , + a , + A ,a,a,.
appartengano entrambi a C.
Di conseguenza, anche la differenza z, - z, = (h x - hJcLpij deve appar­
tenere a C e, poiché h]tb2S Z c C , n e segue cne a,a.f G C. Ma allora anche
Il teorema fondamentale dell’algebra 205

è in C, da cui segue che la somma a l + a; appartiene a C. In questa


situazione, il polinomio di secondo grado
p(x) = (x - a,)(x - a,) = x2 - (a, + af)x + a,a,
è un polinomio a coefficienti complessi e, per il lemma 4.5, le sue radici sono
complesse. Ne segue che a,, a ; G C, e che fix ) ha una radice complessa.

Nel linguaggio della teoria dei campi, il teorema fondamentale dell’alge­


bra afferma che i numeri complessi costituiscono un campo algebricamente
chiuso: ovvero che ogni estensione finita di C è necessariamente uguale a C
stesso. Alla teoria delle estensioni dei campi appartiene la teoria di Galois,
quella branca della matematica che tratta delle interazioni fra teoria alge­
brica dei campi, teoria delle equazioni e teoria dei gruppi. Questa teoria fu
introdotta da Évariste Galois verso il 1830 nel corso dei suoi studi sull’im­
possibilità di risolvere per radicali le equazioni di quinto grado, un risultato
che era stato dimostrato qualche decennio prima da Ruffini e ripreso più
recentemente, in maniera indipendente, da Abel8. Galois fu il primo a com­
prendere la stretta connessione che c’era fra le estensioni di un campo e i
gruppi di permutazioni, dando in questo modo il via allo studio dei gruppi
finiti. Fu il primo a utilizzare il termine «gruppo» come concetto astratto,
anche se la sua definizione era relativa a un insieme di permutazioni chiuso
rispetto alla composizione.
Il metodo sviluppato da Galois non solo rendeva più facile la dimostra­
zione deH’impossibilità di risolvere l’equazione generale di quinto grado
per radicali, ma portava anche ad altre applicazioni e a una teoria assai più
vasta.
L’idea centrale della teoria di Galois è quella di associare a certi tipi
speciali di estensioni algebriche di un campo, dette oggi «estensioni di
Galois», un gruppo, il «gruppo di Galois». Le proprietà dell’estensione si
riflettono in quelle del gruppo che sono un po’ più semplici da studiare.
Cosi, per esempio, il fatto che un’equazione sia risolubile per radicali si
riflette nel fatto che il gruppo associato è risolubile, una proprietà generale
dei gruppi. Mostrare che per ogni polinomio di grado maggiore o uguale a
5 esiste un’estensione il cui gruppo di Galois non gode di questa proprietà
dimostra che non esiste una formula generale che permetta di risolvere le
equazioni per radicali.
Il legame con la teoria delle equazioni sta nel seguente fatto. S e/(x) = 0
è un’equazione polinomiale su un qualche campo F, possiamo costruire il
campo di spezzamento di f(x ), K, che, usualmente, è un’estensione di Galois

1 Si veda H. M. Edwards, La risoluzione delle equazioni algebriche, in questo stesso volume, pp.
167-76. [N.d.C.].
206 Benjamin Fine e Gerhard Rosenberger

e possiede dunque un gruppo di Galois detto «gruppo di Galois dell’equa­


zione». Allo stesso modo di prima, le proprietà del gruppo rifletteranno
quelle dell’equazione.
Grazie alla teoria di Galois possiamo fornire una dimostrazione molto
diretta del teorema fondamentale. Ci servirà il teorema fondamentale della
teoria di Galois - che enunciamo qui sotto - e vari risultati minori della teoria
dei gruppi finiti9.
Sui reali e sui complessi ogni estensione finita che sia un campo di spez­
zamento è un’estensione di Galois. Inoltre, se F C E C K sono tre campi,
diremo che F è il campo base e che E è un campo intermedio.

Teorema 4.11 (teorema fondamentale della teoria di G alo is). Sia K


un'estensione di Galois di F, il cui gruppo di Galois sia G = Gsd(K/F ). Se E è
un campo intermedio, sia t (E) il sottogruppo di G che fissa E. Si ha allora:
stabilisce una corrispondenza biunivoca fra i campi intermedi conte­
(1 ) t
nenti F e i sottogruppi di G;
(2 ) se H è un sottogruppo d iG e E = KH, cioè il sottocampo di K che con­
tiene F e vienefissato da H, allora t (E) = H ;
(3) K è un’estensione di Galois di E, e Gal(KJE) = t(E );
(4) 1GI = \K : FI;
(5) IE : FI = IG : t (E) I: in altre parole, il grado di un’estensione intermedia
sul campo di base è uguale all’indice del corrispondente sottogruppo nel
gruppo di Galois;
(6 ) E è un’estensione di Galois su F se, e solo se t (E) è un sottogruppo
normale di G. In tal caso,
Gal (E/F ) = G/t(E) = Gal (K/F )/Gal (K/E);
(1) Il reticolo dei sottocampi di K che contengono F è isomorfo al reticolo
invertito dei sottogruppi di Gal (K/F ).

Se F è un campo, una sua estensione semplice è un campo F (a) ottenuto


come nella dimostrazione del teorema di Kronecker, dove avevamo un po­
linomio irriducibile su F,/(x), e a era una sua radice in F '. Denoteremo tale
polinomio che definisce l’estensione con irr(a, F ). Si può allora dimostrare
il seguente lemma.

Lemma 4.12. Tutte le estensioni finite di R o di C sono estensioni sem­


plici.

* Per le definizioni fondamentali della teoria di Galois rinviamo il lettore a ibìd, o a Edwards
[1984].
Il teorema fondamentale dell'algebra 207

Ci serve infine il seguente risultato della teoria dei gruppi finiti; è un caso
particolare dei cosiddetti «teoremi di Sylow» [Fine e Rosenberger 2000;
Rotman 1988]).

Lemma 4.13. Sia G un gruppo finito di ordine pmq, con p primo e p, q


primifra loro. Allora:
(1) esiste un sottogruppo H C G di ordine pm ed è detto sottogruppo
p-Sylow;
(2 ) se q = 1, G ha sottogruppi di ordine ph per k = 1, ..., m.
E ora, dimostriamo il teorema fondamentale usando la teoria di Galois.

Dimostrazione. Se f(x ) è un polinomio complesso, possiamo costruire il


campo di spezzamento K di f{x ) su C. Questo campo sarà un’estensione di
Galois di C e dunque anche un’estensione di Galois di R. Il teorema fon­
damentale dell’algebra asserisce che K deve coincidere con C, ed è quindi
equivalente ad asserire che ogni estensione di Galois non banale di C deve
essere C stesso.
Sia K una qualunque estensione finita di R tale che \K : RI = 2mq con
q dispari. Se m = 0 , K è un’estensione di grado dispari di R. D campo K è
un’estensione semplice e quindi K = R(a), e irr(a, R) ha grado dispari. Ma
ogni polinomio a coefficienti reali di grado dispari ha una radice reale e quin­
di irr(a, R) è irriducibile solo se il suo grado è uguale a 1. Ma allora a E R e
K = R. Dunque, se K è un’estensione non banale di R, possiamo assumere
che m > 0 , il che dimostra, più in generale, che non esistono estensioni finite
di grado dispari di R.
Sia ora K un’estensione di grado 2 di C. Allora K = C(a) con il grado
di irr(a, 0 = 2 . Ma i polinomi complessi di secondo grado hanno sempre
radici in C, e otteniamo una contraddizione. Di conseguenza, C non ha
estensioni finite di grado 2 .
Sia K un’estensione di Galois di C. Allora K è anche un’estensione di R
e sia IJC : RI = 2 mq, con q dispari; inoltre, per il ragionamento precedente,
deve essere m > 0 . Sia G = Gal(JC/R) il gruppo di Galois di K; lordine di G
sarà uguale a 2mq e, di conseguenza, G ha un sottogruppo 2-Sylow di ordine
2me di indice q. Ciò dovrebbe corrispondere a un campo intermedio E, tale
che \K : E\ = 2 m e \E : R I = q. Ma allora questo £ sarebbe un’estensione di
grado dispari di R. Ne segue quindi che q = 1 e £ = R. Di conseguenza,
\K : RI = 2me IGI = 2 “
Ora, \K : CI = 2m~l perché C ha grado 2 su R. Sia G, = GaÌ(K/ C) il
gruppo di Galois di K su C, che è un 2 -gruppo. Se questo gruppo non fosse
banale, esisterebbe un sottogruppo di ordine 2m~2 e indice 2 , che dovrebbe
corrispondere a un campo intermedio E di grado 2 su C. Ma, dal ragiona­
mento precedente, segue che C non ha estensioni di grado 2: quindi G,
208 Benjamin Fine e Gerhard Rosenberger

deve essere il gruppo banale, IG,I = 1. Dunque \K : C I = 1 e K = C, il che


completa la dimostrazione.

In effetti abbiamo dimostrato un risultato più generale. Nella dimostra­


zione precedente abbiamo utilizzato questi due fatti, estranei alla teoria di
Galois: i polinomi reali di grado dispari hanno radici reali e i polinomi com­
plessi di secondo grado hanno radici complesse. Usando questi due fatti
come proprietà possiamo dimostrare la seguente generalizzazione.

Teorema 4.14. Sia K un campo ordinato in cui tutti gli elementi positivi
possiedano radice quadrata. Supponiamo inoltre che ogni polinomio di grado
dispari abbia radici in K. Se indichiamo con i = V -T una radice del polinomio
irriducibile x2 + 1 E JC[x], K(i) è un campo algebricamente chiuso.

5. Dimostrazioni topologiche.

Le ultime dimostrazioni che prenderemo in considerazione sono quelle di


natura topologica. Un polinomio complesso può essere visto anche come una
trasformazione topologica: se aggiungiamo il punto all’infinito al piano com­
plesso, otteniamo una sfera, detta «sfera di Riemann» S 2. Poiché P(°°) = oo
qualunque sia il polinomio a coefficienti complessi P(z), un tale polinomio
può essere considerato come un’applicazione continua P : S 2 —* S2. Queste
trasformazioni topologiche possiedono un cosiddetto indice di avvolgimen­
to, che indica quanto si avvolge l’immagine di una curva C 1 definita in S2
quando la curva viene mappata su S2. Allo stesso modo, la funzione f(z) = ?
avvolge il numero complesso z intorno all’origine. In questo paragrafo presen­
teremo una dimostrazione del teorema fondamentale usando le proprietà di
avvolgimento di/(z) = zf. Passeremo poi a generalizzare il risultato agli indici
di avvolgimento di funzioni S2 —* S2, riottenendo cosi il nostro teorema.
Consideriamo la curva
-y(/) = ^ + re", 0 < / < 2mr.
Geometricamente, si tratta di una circonferenza di centro Zq percorsa n volte.
Cerchiamo di precisare questo concetto. Integrando lungo 7 , otteniamo

i [ - S ì - .- l P "
2™ J y z - z0 2 tti J o reu

Il numero n è detto indice di avvolgimento della curva 7 intorno a zQ. Più in


generale, se 7 è una curva in C, chiusa e differenziabile con continuità, e Zq
non appartiene all’immagine di 7 , si può mostrare che
11 teorema fondamentale dell’algebra 209

f i = —1
»h»z0) dz
f ------
2ITI J y Z -Z 0

è un intero, detto indice di avvolgimento della curva y intorno a Zq.


Consideriamo ora la funzione g(z) = z". Sia Cr la circonferenza z = ré1,
0 ^ t < 2tt, di raggio r e centro nell'origine. Su questa circonferenza abbia­
mo z" = r"ei"‘. Quando / varia da 0 a 2-tt, z si avvolge una volta intorno al
cerchio. Al tempo stesso, nt varia da 0 a 2«tt, e dunque z? si avvolge n volte
intorno al cerchio di raggio r". Possiamo allora dire che n è l’indice di avvol­
gimento intorno all’origine della funzione z".
Usiamo questa nozione per mettere a punto una dimostrazione topo­
logica del teorema fondamentale dell’algebra. Per prima cosa dobbiamo
generalizzare il concetto di indice di avvolgimento di una funzione. Se *y è
una curva chiusa differenziabile con continuità e/: C —►C è una funzione
continua, allora f(y ) è ancora una curva chiusa. Diremo che/avvolge n volte
la curva chiusa y intorno a Zqse/(-y) ha indice di avvolgimento n intorno a Zq.
Il caso più importante per noi è quando y è una circonferenza.
Se due funzioni/(z) e g(z) sono abbastanza vicine l’una all’altra quando
Z varia su una circonferenza CTdi raggio r centrata nell’origine, entrambe
avvolgeranno CTlo stesso numero di volte. In altri termini, se l/(z) —g(z)l < e
per un qualche e abbastanza piccolo e per z che vària su una circonferenza di
raggio r, allora/(Cr), g(Cr) avranno lo stesso indice di awolgimentp intorno
all’origine.
Potremmo rendere preciso quanto abbiamo appena detto, ma ci limite­
remo a illustrarlo usando la cosiddetta proprietà del compagno di viaggio (è
sorprendente che questa idea abbia assunto una notevolissima importanza
nella teoria geometrica dei gruppi). Immaginiamo due viaggiatori legati in­
sieme da una corda. Se uno dei due - diciamo /(z) - attraversa un cerchio
centrato nell’origine, anche il suo compagno g(z) l’attraverserà, pur seguen­
do un percorso diverso, a patto che la lunghezza e della corda sia minore del
raggio del cerchio. La situazione è illustrata in figura 4.
Vediamo ora come si può sfruttare questa idea.

Dimostrazione. Sia fiz) = a j? + + a0 un polinomio complesso con


an ¥= 0 e n ^ 1. Siccome stiamo cercando una radice, possiamo supporre
senza ledere la generalità che an = 1. Se a0 = 0, z = 0 è una radice, cosi pos­
siamo assumere che a0 0.
Ricordiamo che/(z) è una funzione continua C —» C. Inoltre,
210 Benjamin Fine e Gerhard Rosenberger

e dunque su una circonferenza Cr di raggio r abbastanza grande avremo


(5.1) U "-/ (z )l< \ r"
con 0 < X < 1 e z che varia su Cr.
Ora, se r > 0, z" avvolge n volte Cr intorno all'origine. Dunque, per la
proprietà del compagno di viaggio,/(z) avvolgerà n volte intorno all’origi-
ne una circonferenza Cr di raggio sufficientemente grande. Se il raggio r è
invece abbastanza piccolo,/(z) è approssimativamente uguale ad a0 su Cr.
Ne segue che f{C r) fa un piccolo laccio intorno ad aQe non si avvolge affatto
intorno aH’origine. Dato che/(z) è una funzione continua, l’immagine/fC,.)
dipenderà da r con continuità. E siccome l’indice di avvolgimento di f(C r)
intorno all’origine è 0 se il raggio è abbastanza piccolo, mentre è n > 0 se il
raggio è abbastanza grande, ci dovrà essere un valore del raggio rx tale che
/(Cr ) passi attraverso l’origine. Ne segue che ci deve essere un punto z0 su
Cr tale che/(Zq) = 0, il che dimostra il teorema.

Nel caso delle dimostrazioni algebriche e analitiche abbiamo potuto for­


nire dimostrazioni più semplici del teorema fondamentale, pagando però la
maggiore semplicità con l’uso di una teoria più elaborata. Allo stesso modo,
usando tecniche di topologia algebrica che estendono il concetto di indice
di avvolgimento, possiamo costruire un’altra dimostrazione del nostro teo­
rema.
Ricordiamo che due spazi topologici X e Y sono detti omeomorfi se esiste
un’applicazione biunivoca f : X —>Y tale che sia /, sia la sua inversa f ~ l siano
continue. II principale problema che si incontra in topologia è quello di clas­
sificare gli spazi topologici a meno di omeomorfismi. La topologia algebrica
è quella branca della topologia che cerca di risolvere questo problema di
classificazione associando a uno spazio topologico certi oggetti algebrici,

Figura 4.
Proprietà del com pagno di viaggio.
corda (e) percorso del compagno
di viaggio g(z)
Il teorema fondamentale dell’algebra 211

che nei casi più comuni sono gruppi. Questa associazione viene fatta in
modo che a spazi omeomorfi corrispondano oggetti algebrici isomorfi. In
questo modo, se si riesce a dimostrare che gli oggetti algebrici associati a
due spazi non sono isomorfi, quei due spazi topologici non potranno essere
omeomorfi. Dato che le questioni di tipo algebrico sono in genere più agevoli
da trattare di quelle topologiche, in questo passaggio a un ambiente algebri­
co il problema di classificazione risulta in qualche modo semplificato.
Gli elementi fondamentali per ottenere la nostra ultima dimostrazione
del teorema fondamentale dell’algebra sono l’omologia delle sfere e il grado
di Brouwer. Quest’ultimo concetto è un’estensione della nozione di indice di
avvolgimento10.
Una «-sfera è uno spazio topologico omeomorfo a

s" = {(*o ...... *„> e R ”+ l l * o + - + ** = !}•


In generale, una « sfera è omeomorfa alla superfìcie di un simplesso
(« +1 )-dimensionale. La 1-sfera S 1è omeomorfa a un triangolo, la 2-sfera S2
è omeomorfa alla superficie di un tetraedro, e cosi via. Al riguardo, si può
dimostrare il seguente teorema, che caratterizza i gruppi di omologia delle
«-sfere.

Teorema 5.1. Sia S n una n-sfera con n > 1. Allora H0(Sn) = Z e, per
q ^ l , si ha
H n{S") = Z ; Hq(S”) = 0 se n =£ q.

In questo modo IV-esimo gruppo di omologia di una «-sfera è il gruppo


ciclico infinito. Supponiamo ora che S" e X " siano due «-sfere e conside­
riamo un’applicazione continua /: 5 " —►2 ":/induce un omomorfismo di
gruppi
/* : H„(Sn) -
Il gruppo H n(Sn) è il gruppo ciclico infinito; sia a un suo generatore.
Similmente, anche H n{X'1) è ciclico infinito e sia 3 un suo generatore.
Siccome/. è un omomorfismo,/*(a) dovrà essere un multiplo intero di p. In
altri termini, per un qualche intero m si avrà
/*(<*) =
Il numero m è detto «grado di Brouwer», o semplicemente grado dell’ap­
plicazione/, lo indicheremo con il simbolo deg(f). Intuitivamente, deg(/0

10 P er le definizioni fondamentali sull’omotopia e l’omologia rinviamo a Hocking e Young


[1961] e Massey [1 9 6 7 ].
212 Benjamin Fine e Gerhard Rosenberger

è il numero delle volte (contate algebricamente) con cui l’immagine f(S n) si


avvolge intorno a 2 ". In questo senso il grado di Brouwer è un’estensione
del concetto di indice di avvolgimento.
I tre seguenti risultati relativi al grado di Brouwer sono i lemmi chiave per
ottenere la dimostrazione del teorema fondamentale ddl'algebra".

Lemma 5.2. Il grado di uriapplicazione continua non dipende dalle de­


composizioni simpliciali di Sn e 2

Abbiamo bisogno di questo lemma perché, anche se Hn(Sn) e H n( S fl) sono


entrambi ciclici infiniti, l’azione di/ sul ciclo a che genera Hn(S") potrebbe
essere diversa per decomposizioni simpliciali diverse. Il lemma ci dice che, a
meno di omologia, nelle applicazioni fra sfere questo non può accadere.

Lemma 5.3. (i) Il grado di un 'applicazione continua f di una n-sfera Snin


una n-sfera 2 " dipende solo dalla classe di omotopia di f In particolare, due
applicazioniomotope, f :S n-+'Zn,g : S n -+ 2 " , devono avere lo stesso grado.
(ii) Se f : Sn -+ Zn e g : Sn -* 2 " sono due applicazioni continue e si ha
degif) = deg(g), allora f e g sono omotope.

Questo lemma serve a classificare completamente, a meno di omotopia,


le applicazioni continue fra //-sfere. In particolare, le classi di omotopia delle
applicazioni continue f : S n —+2 " sono in corrispondenza biunivoca con gli
interi.

Teorema 5.4. S e f : S n ~* 2 " e deg(/") 0, allora ogni punto di 2 " sta


nell’immagine di f.

Questo teorema è la chiave di volta della nostra ultima dimostrazione del


teorema fondamentale. Prima di affrontarla, enunciamo però un famoso teore­
ma di Brouwer, il «teorema del punto fìsso», che si dimostra anch’esso usando
il grado di Brouwer. Se/: X -* X, un punto fisso di /è un punto x0 6 X tale
che/(x0) = x0. Di fatto, si tratta di una versione generalizzata del teorema del
valore intermedio che (attraverso la sua conseguenza per cui un polinomio
reale di grado dispari deve avere una radice reale) ha avuto un ruolo assolu­
tamente cruciale in molte delle dimostrazioni che abbiamo presentato.

Teorema 5.5 (teorema del punto fìsso di Brouwer). Sia D” la palla


n-dimensionale, ovvero la parte interna e la frontiera della sfera unitaria
Sn~l C R". Se/ : D” —*D ” è continua, allora f ha almeno un punto fisso.

11 Per queste dimostrazioni, si veda Hocking e Young [1961 ].


Il teorema fondamentale dell’algebra 213

Possiamo ora presentare la nostra ultima dimostrazione. Consideriamo la


sfera unitaria S 2 tangente al piano complesso C nell’origine (0, 0 , 0) (figura 5).
Applichiamo questa sfera su C nel seguente modo. Se N = ( 0 ,0 ,1) è il
polo nord, si tracci per ogni punto w G S2 — N la retta che congiunge w e
N. Questa retta intersecherà il piano C in un unico punto p{w). Tale appli­
cazione è detta proiezione stereografica. Le equazioni di questa applicazione
possono essere scritte esplicitamente12, ma qui è sufficiente sapere che p è
un’applicazione biunivoca e continua fra C e S2 — N. Se ora identifichiamo
il polo nord N con oo, allora p è una biezione d iS2 tutta intera con C U {°°}.
Si può dimostrare che p è un’applicazione conforme (cioè, che conserva gli
angoli) che fornisce cosi un modello conforme del piano complesso esteso
C U {«»}. Quando si parla di S2 in questi termini, essa viene detta - come
abbiamo già visto - sfera di Riemantt.
Supponiamo ora che P(z) = a0 + axz + ••• + an ^ 0, sia un poli­
nomio complesso di grado n > 0. Dato che stiamo cercando una radice e
a ± 0 , possiamo assumere, senza ledere la generalità, che si abbia an = 1.
Consideriamo allora
P(z) = a0 + axz + + t\ n > 1.

“ Si veda, per esempio, Ahlfors [1953].

Figura 5.
La proiezione stereografica.

Ni0,0,1)
214 Benjamin Fine e Gerhard Roscnberger

Poiché P(°°) = » , Piz) può essere visto come un’applicazione continua del­
la sfera di Riemann sulla sfera di Riemann, ovvero Piz) risulta un’applica­
zione continua di S2 —* S2 e, come tale, ha grado di Brouwer uguale a m.
Cominciamo col dimostrare che il grado di Brouwer coincide con il grado
del polinomio.

Lemma 5.6. P(z) e l’applicazionefiz) = z" sono omotope.

Dimostrazione. Definiamo
H(z, /) = ** + ( 1 - t)(a0 + atz + - + a ^ z " - 1)
per z E C e / E [0, 1]; H(“ , /) = 00 per t E [0, 1]. Chiaramente, H(z, /) è
continua su C X I —» C. Ora, il limite
lim H(z,t) = 30 = H(<*,/)
z -» *

per tutti i /E [0,1], cosicché H(z, /) è un’applicazione continua di (C U {oc})


X / —>C U {30), e dunque da ^2 X / —»^2. PoichéH(z.O) = P(z)eH (z, 1) = z",
questo definisce un’omotopia tra le due applicazioni.

Si può inoltre dimostrare che il grado di Brouwer di/(z) = zn è «: per


i polinomi complessi il grado di Brouwer e quello polinomiale coincidono
[cfr. Hocking e Young 1961]. Mettendo insieme tutti i pezzi otteniamo infine
il teorema fondamentale dell’algebra.

Dimostrazione. Sia
Piz) = a0 + a{z + ••• + a ^
un polinomio complesso non costante. Possiamo supporre che an # 0 e,
come prima, possiamo assumere che an = 1. Dal lemma 5.6, P(z) è omotopa
a fiz) = z”, e quindi il grado di Brouwer di Piz) è n 0 . Per il teorema 5.4,
ogni punto di S2 è allora nell’immagine di Piz). In particolare esiste almeno
un punto Z oE S2 con P(zq) = 0. Poiché P(») = » , ne segue che z0 deve ap­
partenere a C.

Si osservi anche che per dimostrare il teorema fondamentale dell’algebra


non abbiamo avuto bisogno del concetto generale di grado di Brouwer, ma
soltanto della sua versione limitatamente alle 2 -sfere.

Abbiamo qui discusso varie dimostrazioni diverse del teorema fonda-


mentale dell’algebra, utilizzando tecniche riprese dall’analisi, dall’algebra
e dalla topologia. Ma quelle che abbiamo presentato non esauriscono le
Il teorema fondamentale dell’algebra 215

dimostrazioni di questo teorema cosi notevole, che fa la sua comparsa in tanti


settori diversi della matematica. Come abbiamo già detto, nel nostro libro si
trovano dodici dimostrazioni e altre ancora se ne stanno sviluppando. Que­
ste nuove dimostrazioni sono un indice del fascino che il teorema esercita
ancora oggi sui matematici.

AHLFORS, L. V.
1953 Complex Analysis. An lntroduction to thè Theory o f Analytic Functions o f One
Complex Varia b le, M cG raw -H ill, New York - Toronto - London.
ARTIN, M.
1991 Algebra, P ren tice-H all, Englew ood Cliffs [trad. it. Algebra, Bollati Boringhieri,
T orin o 1 9 9 7 ].
CHURCHILL, R.
196 0 Complex Variables and Applications, M cGraw-Hill, New York - Toronto - L o n ­
don.
EDWARDS, H. M .
1984 Galois Theory, Springer-Verlag, New York.
FINE, B. e ROSENBERGER, G.
2000 The Fundamental Theorem o f Algebra, Springer-Verlag, New York.
GAUSS, c . F.
1799 Demonstratio nova theorematis omnem functionem algebraicam rationalem in­
tegravi unius variabilis in factores reales primi vel secundi gradus resolvi posse,
tesi di d o tto ra to , Università di Helm stedt, in i d ., Werke, voi. Ili, Kònigliche
G esellschaft d er W issenschaften, G òttingen 1876, pp. 1-30.
1816 a Demonstratio nova altera theorematis omnem functionem algebraicam rationa­
lem integram unius variabilis in factores reales primi vel secundi gradus resolvi
posse, in i d ., Werke, v o i. I li c it ., p p . 3 1-56.
1816£ Theorematis de resolubilitate functionum algebraicarum integrarum in factores
reales demonstratio tertia, in i d ., Werke, voi. I li cit., pp. 59-64.
1 8 4 8 /5 0 Beitràge zur Theorie der algebraischen Gleicbungen, in i d ., Werke, voi. Ili cit.,
pp. 7 3 -8 5 .
HOCKING, J . G. e YOUNG, G. S.
1961 Topology, Addison-W esley, Reading.
LANG, S.
1984 Algebra, Addison-W esley, Reading.
MASSEY, W . S.
1967 Algebraic Topology: an lntroduction, H arcourt, Brace and World, New York.
REMMERT, R.
1983 Fundamentalsatz der Algebra, in h .- d . e b b in g h a u s et al. (a cura di), Zahlen,
Springer-Verlag, Berlin-Heidelberg.
216 Benjamin Fine e Gerhard Rosenberger

ROTMAN.J. J .
1988 An lntroduction to thè Theory o f Groups, William C. Brow n, D ubiiquc.

ru din, w .
1966 Reai and Complex Analysis, M cG raw -H ill, New Y ork - T o ro n to - London
[trad. it. Analisi reale e complessa, Boringhieri, Torino 1 9 7 4 ].

U S P E N S K Y , J. v.
1 948 Theory ofEquations, M cGraw -Hill, New York - T oron to - L o n d o n .

V A N D E R W A E R D E N , B. L.
1 985 A History o f Algebra from al-Khwarizmi to Emmy Noether , Springer-Verlag,
Berlin -Heidelberg.
F R A N C E S C O A M O R O SO e C AR LO VIOLA

Numeri irrazionali e numeri trascendenti

1. Introduzione.

La teoria della trascendenza ha origini antiche: il problema della quadratu­


ra del cerchio è stato certamente una delle motivazioni principali per la ricerca
sui numeri trascendenti. Ricordiamo brevemente di cosa si tratta: è possibile,
col solo ausilio di riga e compasso, costruire un quadrato di area pari a quella
del cerchio di raggio unitario? Questo equivale alla possibilità di costruire
con riga e compasso un segmento di lunghezza Vìr. I numeri costruibili sono
particolari numeri algebrici (intersecare una retta e un cerchio o due cerchi
equivale a risolvere un’equazione di secondo grado...); dunque se la quadra­
tura del cerchio fosse possibile, allora Vrr, e quindi ir, sarebbe un numero alge­
brico. Conviene ricordare la definizione di numero algebrico: un numero
complesso a si dice algebrico se è radice di un polinomio Pix) non identica­
mente nullo a coefficienti razionali, e quindi anche - moltiplicando l’equa­
zione Pia) = 0 per il minimo comune multiplo dei denominatori dei coef­
ficienti di P{x) - radice di un polinomio a coefficienti interi; cioè se risolve
un’equazione del tipo
Pia) = aQa d + H— + ad_xa + dj = 0
con aQ,...,a d interi non tutti nulli. Il grado deg a di un numero algebrico a è il
grado minimo dei polinomi Pix), a coefficienti interi non tutti nulli, tali che
Pia) = 0 . 1 numeri razionali sono i numeri algebrici di grado 1: se a = p/q
ip, q interi, q > 0 ), a è soluzione dell’equazione di primo grado qa - p = 0, e
viceversa ogni soluzione di un’equazione di primo grado a coefficienti interi
è evidentemente razionale. I numeri irrazionali e i numeri trascendenti sono
definiti «in negativo»: un numero complesso a è irrazionale se non è raziona­
le (in particolare ogni numero immaginario è irrazionale) ed è trascendente
se non è algebrico. Lindemann [1882] dimostrò la trascendenza di ir dando
una definitiva risposta negativa al problema della quadratura del cerchio che
aveva, per secoli, appassionato una parte dell’umanità'. Nella dimostrazione
di Lindemann interviene un altro numero «notevole»,

1 Nella Divina Commedia Dante Alighieri scrive: «Qual è ’l geomètra che tutto s’affìge I per
misurar lo cerchio, e non ritrova, I pensando, quel principio ond’egli indige, I tal era io...» (Paradiso,
XXXIII, 133-36).
218 Francesco Amoroso e Carlo Viola

, _ J L + ! + ± + ± + ....
0! 1! 2! 3!
Lindemann (cfr. teorema 8.1) dimostra che ea è trascendente per ogni
numero a algebrico e non nullo. Questo risultato contiene in particolare
la trascendenza di e, precedentemente dimostrata da Hermite [1873], e la
trascendenza di ir: infatti se ir fosse un numero algebrico anche iri sarebbe
algebrico e quindi, per il teorema 8.1, sarebbe trascendente, contro la ben
nota relazione di Eulero: e™ = —1.

2 . Irrazionalità.

Come si dimostra l’irrazionalità di un numero? Un semplice criterio di ir­


razionalità per numeri algebrici è noto a ogni studente della scuola superiore:
se p/q (con p, q interi primi fra loro) è una radice razionale di un polinomio
ajcn + axx n~x + ••• + an a coefficienti interi (con a0an ^ 0 ), allora p è un
divisore di an e q un divisore di a0. Dunque le eventuali radici razionali si
determinano esplicitamente, e ciò fornisce un criterio d’irrazionalità per le
rimanenti radici. In particolare, le radici di un polinomio a coefficienti interi
monico (cioè con coefficiente direttivo = 1) o sono intere, e vanno cercate
fra i divisori del termine noto an>o sono irrazionali. Ad esempio, yfì non è
intero (infatti 1 < V i < 2) ed è radice del polinomio monico a coefficienti
interi x2 - 2 : quindi è irrazionale. Questo criterio si applica soltanto a numeri
algebrici, in quanto definiti come radici di un polinomio a coefficienti interi.
Che fare per numeri definiti in altro modo, come e o ir? È necessario utilizza­
re la proprietà che l’insieme Z dei numeri interi, a differenza dell’insieme Q
dei razionali, è «ben spaziato» nell’insieme R dei numeri reali. L’idea è molto
semplice: ogni numero intero e strettamente positivo è maggiore o uguale a 1
(«principio fondamentale»). Questa osservazione apparentemente banale è
alla base delle dimostrazioni d’irrazionalità o trascendenza. Vediamo come,
nel caso dell’irrazionalità.

Teorema 2.1 (criterio d’irrazionalità). Sia a un numero reale e supponia­


mo che per ogni e > 0 la disuguaglianza

(2.1) 0 < |<7<x - p |< e

abbia soluzioni in interi p e q. Allora a è irrazionale.


Dimostrazione. Sia, per assurdo, a razionale, diciamo a = alb con a e b
interi, b > 0. Dalla (2 .1) si ha
Numeri irrazionali e numeri trascendenti 219

0 < Ig -fe l < e.


b

In particolare \aq — bp |è un intero strettamente positivo, e dunque, per il


principio fondamentale, \aq — bp \^ 1. Se ne deduce che e > 1/b. Dunque
per nessun e G (0 , 1/b\ la disuguaglianza (2 .1) ammette soluzioni intere p e
q, contro l’ipotesi fatta.

Nei casi concreti il precedente criterio si applica costruendo successioni


di interi (pn) e (qn) tali che
(2.2) 0 * qna -/ > „-» 0 (« -» »).
La prima dimostrazione di irrazionalità per un numero che si rivelerà
essere trascendente risale a Eulero [1744], che nel 1737 dimostra che e è irra­
zionale. Nel 1761 Lambert [1768] dimostra l’irrazionalità di alcune costanti
notevoli, tra le quali tt. Sia Eulero che Lambert formulano l’opinione che
questo numero sia in effetti trascendente. Come esempio di applicazione del
criterio di irrazionalità espresso dal teorema 2 .1, dimostriamo l’irrazionalità
di e. La dimostrazione che proponiamo non è quella originale di Eulero, che
utilizza lo sviluppo di e in frazione continua sul quale torneremo in seguito
(cfr. formula 3.5), ma quella presentata nel 1815 da Fourier. Sia n un intero
positivo e consideriamo il numero razionale rn = 1/0 ! + 1/1!+ ••• + 1/»!.
Chiaramentepn = n\ rnè un intero. Inoltre

n '-e ~P„ = « ! X >0


*=»+i *•
e
ni e —p = ------- [ 1 H----------H--------------------- + •••
" « + l|^ n+2 (» + 2)(n + 3)

< ^ f 1+ ± + ± + J L i z l .
n + l{ 21 3! ) n+1
Se ne deduce che le successioni di interi pn = n\ rne q n = ni soddisfano la
condizione (2 .2 ) con a = e. Dunque e è irrazionale.
In maniera simile in linea di principio, ma tecnicamente più complessa, si
dimostra l’irrazionalità di -ir e di altre costanti «classiche» dell’analisi. Alcuni
di questi risultati sono relativamente recenti; ad esempio l’irrazionalità di

t(3) = 1 + 42 > + 4} > + ••

è stata dimostrata soltanto nel 1979 da Apéry.


220 Francesco Amoroso e Carlo Viola

Ogni numero «ragionevole» è irrazionale: l’insieme dei numeri razionali


è un insieme trascurabile, nel senso della teoria della misura. Purtroppo
questa affermazione è solamente qualitativa, e non dà nessuna informazione
concreta su come dimostrare che un numero assegnato è irrazionale. Per
esempio

5<5> = i + 7 +7 + ",
o la costante di Eulero-Mascheroni

o la costante di Catalan

c - y (- i ) " - i -L + - L - J - + -
J 0 (2« + l )2 32 52 72

sono «certamente» irrazionali, ma nessuno sa dimostrarlo.


Ciò nonostante, almeno da un punto di vista teorico, ogni numero reale
irrazionale è identificabile utilizzando il criterio (2 .1). Precisamente, per ogni
a G R\Q e per ogni e > 0, la disuguaglianza (2 .1) ha soluzioni intere p e q (e
quindi infinite soluzioni intere). Questa affermazione si può dimostrare in
due modi: con la teoria delle frazioni continue, oppure direttamente, come
è stato fatto da Dirichlet nel 1842, utilizzando il cosiddetto «principio dei
cassetti»: se si collocano, in un modo qualsiasi, N + 1 oggetti in N cassetti,
dovrà esserci almeno un cassetto contenente almeno due oggetti.

Proposizione 2.2 (lemma di Dirichlet). Sia N > l un intero e sia a un


numero reale. Allora esistono interi p e q tali che 1 < < N e

l9“ - p l < N'


Dimostrazione. Dato un numero reale x, il simbolo {x} denota la parte fra­
zionaria di x, ovvero l’unico numero reale y G [0, 1) tale che x — y sia un
intero. Gli N + 1 numeri
0,{<x},{2a},...,{Not}

sono tutti contenuti nell’intervallo [0, 1), che suddividiamo nell’unione degli
N sottointervalli:
Numeri irrazionali e numeri trascendenti 221

Per il principio dei cassetti, almeno due fra gli N +1 numeri sono contenuti
in uno stesso sottointervallo, e hanno quindi distanza < 1/N. Dunque esi­
stono due interi h e k con 0 ^ h < k ^ N tali che |{&a} - {£a}| < 1/N. Ma
{£a} - {ha) = ( k - h ) a - p per un opportuno intero p; quindi, posto q - k - h y
si ha 0 < q =£ N e

Dato un qualunque a G IR\Q>, per ogni e > 0 scegliamo un intero


N > l/e. Per il lemma di Dirichlet esistono interip e q con q ^ 1 tali che
\qct-p\< 1/N < e; inoltre \q a - p\ > 0 perché ^ O e a è irrazionale.
Dunquep e q risolvono la (2.1).
Ritorniamo ai valori negli interi della funzione zeta di Riemann:

£(j) = 1 + — + — + •■■,
2s y
dove la serie converge per 3?(j) > 1. Nella sua opera Tractatus de seriebus
infinità ( 1689), Jacob Bernoulli pone il problema di trovare una formula per
la somma della serie

, +-L +-L +....


2 3
Nel 1735 Eulero risolve questo problema dimostrando che

«2)=^-Ì
e più in generale, per ogni intero positivo «,

£(2«) = (_1)'’- , 2 2',- , - ^ tr2",


(2 n)\

dove i B2„ sono certi numeri razionali, detti «numeri di Bernoulli», definiti
dallo sviluppo di Taylor

Grazie alla trascendenza di -ir, la precedente formula per £(2») dimostra in


particolare che i valori della funzione £ negli interi pari sono trascendenti, e
che per ogni N E N i numeri
1,5(2), 5(4).......5(2 N)
222 Francesco Amoroso e Girlo Viola

sono linearmente indipendenti sul campo Q dei numeri razionali (cfr. defi­
nizione 8.2).
L’assenza di una formula analoga a quella di Eulero per i valori della £
negli interi disparì spiega in parte perché la già citata irrazionalità di £(3) sia
un risultato relativamente recente. Come abbiamo ricordato, il problema
dell’irrazionalità di £(5) è tuttora aperto. Recentemente un progresso im­
portante è stato compiuto da Rivoal [2000], che ha dimostrato che per ogni
N G N, fra gli N + 1 numeri

1,5(3), £ (5),...,£(2N + 1)

ve ne sono almeno j log N linearmente indipendenti su Q . In particolare,


esistono perciò infiniti interi dispari nei quali la funzione £ prende valori
irrazionali.

3. Approssimazione diofantea e frazioni continue.

Come abbiamo visto nel paragrafo precedente, il lemma di Dirichlet impli­


ca che per ogni numero reale irrazionale a e per ogni e > 0 la (2.1 ) ha soluzio­
ni intere p e q , e quindi che esistono successioni di interi (pn) e (qn) con qn> 0
tali che l i m ^ J ^ a - p„) = 0. Questo equivale a dire che ogni a G
ha infinite approssimazioni razionali pn !qn tali che

(3.1) = o \— | (« -> *> ).

In realtà il lemma di Dirichlet ha un’immediata conseguenza più forte della


(3.1), e cioè l’esistenza di infinite approssimazioni razionali ad a tali che

Pn
(3.2) a -
K7 ;
Sia infatti N, un intero positivo; per il lemma di Dirichlet esistono interi p, e
q xtali che 1 < <y, < N, e \qxa - p,| < 1/N ,. Poiché a è irrazionale abbiamo
\qxa —p j > 0; scegliamo un intero N2 > \qxa — p j -1, e siano p2 e q2 interi
tali che 1 < ^2 < N2 e \q2(x - p2|< 1/N2 < \qxct — p x\. Cosi proseguendo
otteniamo

^ > \ q xa - pl \ > j j - > \ q 2c t - p2\> j j - > \q)a - p ^


Numeri irrazionali e numeri trascendenti 223

con 1 < <7n < N„ per ogni n. Dunque \qna. - p j < 1/N„ ^ \/qn, da cui la
(3.2). La (3.2) è una disuguaglianza tipica in approssimazione diofantea, cioè
in quel ramo della teoria dei numeri che studia l’approssimabilità dei numeri
irrazionali mediante i razionali (o, più in generale, l’approssimabilità di nume­
ri non appartenenti a un campo IK mediante numeri appartenenti a IK). Dato
un irrazionale a , in approssimazione diofantea interessa la ricerca di razionali
p/q (con p e q interi, q > 0 ) che rendano piccola la distanza |a - p/q\ pur
avendo denominatore q (e quindi anche numeratore p) non troppo grande;
dunque tali che il prodotto q\a - p/q\ = \qa. - p| sia più piccolo possibile.
Scegliendo «a caso» approssimazioni razionali p j q ad a con un errore
la — P n^n\< prefissato, non ci si può aspettare cne la distanza di qna
dall’intero più vicino pn sia significativamente minore di e quindi per
n —>00 non si avrà in generale una stima asintotica migliore di\qna - p j = 0 (1),
cioè|a ~p„/q„\ = 0 { l / q n). Dunque le infinite approssimazioni soddisfacenti
la (3.1) o, a più forte ragione, la (3.2) sono eccezionalmente buone in senso
diofanteo.
Storicamente, il primo esempio di buona approssimazione in senso dio­
fanteo è attribuito ad Archimede, che nella sua opera Misura del cerchio
trovò che il rapporto fra la lunghezza di una circonferenza e quella del suo
diametro è approssimativamente uguale a — . Si ha infatti -ir = 3,14159... e
22 22 ^
— = 3,14285..., e quindi l'ir —— |< 0,0013, che è una quantità ben più picco-

la di
7
Il lemma di Dirichlet, essendo basato sul principio dei cassetti, ha però
l’inconveniente di essere esistenziale ma non costruttivo: assicura l’esistenza
di infinite approssimazioni razionali ad a soddisfacenti la (3.2), ma non for­
nisce in modo esplicito un algoritmo atto a calcolarle. Questo inconveniente,
nel caso dell’approssimazione diofantea a un singolo numero a , è parzial­
mente superato dalla teoria delle frazioni continue.
Indichiamo con [x ]= x —{x } la parte intera di un numero reale x , cioè il
massimo intero che non supera x, e con ||x|| la distanza di x dall’intero più
vicino. Premettiamo una definizione.

Definizione 3.1. Dati un numero reale a. (non necessariamente irraziona­


le) e un numero razionale p /q ( pe q interi, q > 0), si dice che p/q è un 'approssi­
mazione ottimale ad a quando \\qa\\ = \qa —p| (conp =\<qa\se||^a|| = ^ e
inoltre ||^a|| < \\q'a ||per ogni intero q' tale che 0 < q ' <q.

Siano 1 = q x < q2 < qy < i denominatori delle approssimazioni ot­


224 Francesco Amoroso e Carlo Viola

rimali ad a. Se a è razionale, a = P/Q con P e Q > 0 interi primi fra loro,


la successione (qH) è evidentemente finita e il suo ultimo termine è Q. Se a
è irrazionale, una facile applicazione del lemma di Dirichlet mostra che la
successione qnè infinita. Inoltre, per definizione di approssimazione ottima­
le, i numeri ||^wa ||(n = 1,2,3 ,...) sonoi minimi successivi fra tutti i valori ||qa ||
al crescere di q = 1, 2,3 ,... Dunque per n = 1 ,2 ,3 ,... si h a \\q„+{OL||< ||<7wot|| <
||^a|| per ogni q tale che 0 < q < qn+v e se ne deduce facilmente che
ll?„a ll — I 4n+1 < Da qui, indicando con pn l’intero più vicino a qna,
si ottiene
1

e quindi le approssimazioni ottimali ad a soddisfano la (3.2).


Il concetto di approssimazione ottimale ad a è intimamente connesso
con lo sviluppo di a in frazione continua. Definendo successivamente

a0 = [a], a, =

1
al = [a,], ot2 =
« , - «,

1
*2 = ta 2],
a 2 ~ a2

si ottiene a = a0 + l/a, , a , = ax + l/ a2 , ..., e quindi lo sviluppo di a in


frazione continua, nella forma

dove i quozienti parziali aQ, av a2, ... sono interi, con alta2,a y ... > 0 .
Il precedente sviluppo in frazione continua, per semplicità di scrittura,
si suole indicare

(3.3) a = [a0;a l,a 2,...'],


Numeri irrazionali e numeri trascendenti 225

e contiene infiniti quozienti parziali se e solo se a è irrazionale. Si dimostra


che le frazioni continue ridotte nello sviluppo (3.3):

(3.4) [<?o>a \> a 2 ' •••>a n - \ ^ “ °0 i

(« =1, 2, 3 ,...) , dette anche i convergenti ad a, sono (ad eccezione del solo
aQnel caso in cui si abbia {a } > ì cioè ax = 1) tutte e sole le approssima­
zioni ottimali ad a . L’importanza ddl'algoritmo delle frazioni continue in
approssimazione diofantea consiste nella coincidenza delle approssimazioni
ottimali ad a con i convergenti (3.4).
I primi contributi sistematici alla teoria delle frazioni continue sono do­
vuti a Eulero, che ottiene gli sviluppi in frazione continua di alcune costanti
collegate a valori della funzione esponenziale in opportuni punti razionali.
Fra l’altro, Eulero [1744] dimostra che

(3.5) e = [2; 1, 2, 1, 1, 4 , 1,..., 1, 2«, 1,...],

e naturalmente questo risultato implica l’irrazionalità di e. Ma il fondatore


della teoria aritmetica delle frazioni continue è Lagrange, che ne espone
i principi fondamentali con varie applicazioni, fra le quali la dimostra­
zione - indipendente dal principio dei cassetti e ben anteriore al lemma
di Dirichlet - della disuguaglianza (3.2) per i convergenti a un numero a
[1769], il suo celebre teorema sulla periodicità dello sviluppo in frazione
continua degli irrazionali quadratici, e le applicazioni della teoria delle fra­
zioni continue alla risoluzione delle equazioni diofantee di secondo grado
in due incognite [1770].

4. Misure d ’irrazionalità.

È facile dimostrare che i numeri irrazionali a =[a0; av a2, ...] per i quali
la successione dei quozienti parziali è limitata, cioè tale che a „ < H per ogni
n e per un’opportuna costante H > 0 dipendente da a, sono tutti e soli quelli
per cui la disuguaglianza (3.2) è, a meno di costanti moltiplicative, la migliore
possibile, cioè quelli per cui
226 Francesco Amoroso e Carlo Viola

per ogni razionale p/q e per un’opportuna costante K > 0 dipendente da a.


Come abbiamo accennato nel paragrafo precedente, un teorema di Lagrange
afferma che lo sviluppo in frazione continua (3.3) è periodico, cioè tale che
esistano due interi m > 0 e k ^ . 1 per i quali si abbia an = aH+k per ogni n > m,
se e solo se a è un irrazionale quadratico (cioè un numero reale algebrico di
grado 2 ). In particolare, la (4.1) vale per ogni irrazionale quadratico a. Tenuto
conto delle (32) e (4.1), è naturale chiedersi per quali esponenti \ la disugua­
glianza |ot —p/q\ < 1/q* abbia infinite soluzioni razionali p/q. La risposta a que­
sta domanda non è univoca, ma dipende dall’irrazionale a che si considera.

Definizione 4.1. Dato un irrazionale a, si dice che |x è una misura d'irra­


zionalità di a se per ogni e > 0 esiste una costante C = C(a, e) > 0 tale che

ap**
per ogni p e q interi con q > 0.
La più piccola misura d’irrazionalità di a, cioè il minimo esponente |i per
cui vale la condizione precedente, si indica con |x(a). In altre parole, |x(a) è
l’estremo inferiore degli esponenti \ tali che |a —p /q |< 1/q x valga al più per
un numero finito di razionali p/q, e quindi è anche l’estremo superiore degli
esponenti \ tali che la precedente disuguaglianza valga per infiniti p/q.
Per la (32) si ha pUa) ^ 2 per ogni numero reale irrazionale a , e si dimo­
stra elementarmente che quasi tutti gli a E IR\Q (cioè tutti tranne un insieme
di misura nulla) sono tali che pi(a) = 2 . D ’altra parte, utilizzando l’algoritmo
delle frazioni continue, dato un qualunque numero reale |x > 2 si possono
costruire facilmente esempi di irrazionali a tali che |x(a) = |x. Inoltre, data
una funzione/^) tendente a +® (per<? —►+ « ) con crescita arbitrariamente
rapida, è facile fornire esempi di irrazionali a tali che |a —pn/q n |< 1//(<?„),
dovepn/qn sono i convergenti ad a. In particolare, se f(q ) tende a +°° più
rapidamente di q x per ogni \ (per es. se/(<?)= e«), si ha |a - p /q |< 1/q x
per infiniti p/q qualunque sia l’esponente \, e quindi |x(a) = + « (un irra­
zionale a tale che p.(a) = + » si dice un numero di Liouville, e ne daremo
un esempio al paragrafo 6).
La conoscenza dello sviluppo in frazione continua di un irrazionale a, cioè
la possibilità di determinare per ogni n il quoziente parziale an in modo non
ricorsivo (ovvero senza dover precedentemente calcolare a0, a,,..., an_ , ), im­
plica conseguenze molto forti sull’approssimazione diofantea ad a e usual­
mente permette il calcolo esatto di ft(a). Ad esempio, lo sviluppo euleriano
(3.5) implica facilmente \ì\e) = 2. Purtroppo, ad eccezione degli irrazionali
quadratici e di qualche numero (trascendente) come e o come altre costan­
ti collegate a valori della funzione esponenziale, di solito non si conosce
Numeri irrazionali e numeri trascendenti 227

(nel senso specificato sopra, e cioè nella sua totalità) lo sviluppo in frazione
continua di numeri irrazionali definiti in modo indipendente dalle frazioni
continue stesse. Per esempio, dal calcolo numerico dei primi 17 milioni di
quozienti parziali nello sviluppo di t t in frazione continua non appare alcun
tipo di regolarità, cosi che la distribuzione dei quozienti parziali di ir sem­
bra essere di tipo casuale, con una percentuale di quozienti parziali uguali
a 1 corrispondente a ciò che ci si aspetta statisticamente nello sviluppo in
frazione continua di un irrazionale a generico, congetturalmente tale che
ji(a) = 2 . Un’analoga osservazione si può fare ad esempio per lo svilup­
po in frazione continua di y/2, per cui, allo stato attuale delle conoscenze,
l’algoritmo delle frazioni continue non sembra in grado di distinguere le
proprietà diofantee di un irrazionale algebrico di grado 3 da quelle di un
numero trascendente «naturale» come tt. In virtù di un celebre teorema di
Roth (teorema 5.2) si ha p.(a) = 2 per ogni numero algebrico a E R\Q, ma
la congettura (x(tt) = 2 non sembra dimostrabile con i metodi noti finora, e
la migliore misura d’irrazionalità di ir ottenuta fino ad oggi è il risultato di
Hata [1993]: (x ( t t ) < 8 , 0 1 6 0 4 ....
Per quanto riguarda i valori negli interi della funzione zeta di Riemann,
le migliori misure d’irrazionalità dimostrate per 5(2) e 5(3) sono |x(5(2)) =
jjU'nr2) < 5 ,4 4 1 2 4 ... [RhineViola 1996] e |x(^(3)) < 5,5 1 3 8 9 ... [RhineViola
2001]. Questi risultati sono stati ottenuti mediante lo studio della struttura
aritmetica di integrali doppi e tripli di funzioni razionali che generalizzano
gli integrali di Beukers [1979]; tale studio è basato sull’introduzione di grup­
pi di trasformazioni birazionali e di gruppi di permutazioni che agiscono su
famiglie di integrali multipli [Rhin e Viola 1996; 2001].
Le misure d’irrazionalità sopra indicate per tt, 5(2), 5(3), e per alcune
altre costanti «classiche» trascendenti (o congetturalmente tali), si ottengono
costruendo successioni di approssimazioni razionali convergenti abbastan­
za rapidamente in senso diofanteo alle costanti considerate, e applicando
opportune versioni quantitative del criterio d’irrazionalità (2 .2 ) come, ad
esempio, la seguente.

Proposizione 4.2. Sia a E IR e siano (pn) e (qn) successionidiintert tali che

lim —log |qHct - p„\ = - R


"-** n
limsup —log \qH\^ S
n

per certi numeri positivi R e S . Allora ct(£Q, e

M-(“ ) * | + 1-
228 Francesco Amoroso e Carlo Viola

5. Approssimazioni razionali a numeri algebrici.

Particolare importanza storica ha l’approssimazione diofantea degli ir­


razionali algebrici. Il primo risultato ottenuto per numeri algebrici di grado
qualsiasi è il teorema seguente.

Teorema 5.1 (di Liouville). Per ogni numero algebrico a di grado n > 2
esiste una costante K = K(a) > 0, dipendente da a. ed esplicitamente calcola­
bile, tale che

<1
per ogni p e q interi con q > 0.

'Dimostrazione. Se a £ IR il teorema è banale perché, indicando con 5 (a )


la parte immaginaria di a, si ha |a - p/^|^|S(a)|>|^(a)|/^" . Se a E R,
sia P(x) = a0x n + axx*~x + 4- an_ xx + an il polinomio minimo di a su 2,
cioè il polinomio di grado minimo n a coefficienti interi primi fra loro, con
a0 > 0, tale che P(a) = 0. Per il teorema del valor medio si ha, per ogni p e
q interi con q > 0 e tali che |a —p /q |< 1,

(5.1) — P(a) —p[ —ì —a -?


UJ UJ ?

per un opportuno £ compreso fra a e p/q, e quindi soddisfacente a — 1 < £ <


a + 1. Posto M = maxa_ 1SxSa+| |P'(x)|, dalla (5.1) si ha \P(p/q)\<
M|ot-p/q\, con M > 0 perché P(x) non è costante. Dunque

'( i l
_1_
(5.2)
M

Ma P{p/q) # 0, perché altrimenti il polinomio P(x) sarebbe divisibile per


qx — p e quindi a, essendo radice del polinomio P(x)/(qx — p), sarebbe
un numero algebrico di grado < n - 1 (in altre parole, P(x) non sarebbe il
polinomio minimo di a). Ne segue
Numeri irrazionali e numeri trascendenti 229

perché + a^pn~]q + ••• + anq n è un intero non nullo e quindi ha va­


lore assoluto 5: 1 (principio fondamentale). Dalla (5.2) si ottiene allora
jot ~ p/q\— l/{Mq").
Se invece p e q sono tali che |a - p/q\ ^ 1, si ha a più forte ragione
|a-p/q \ > 1!q n . Il teorema segue scegliendo K > max {M, 1}.

Il teorema di Liouville implica in particolare che se a è un irrazionale


algebrico di grado n allora jx(a) ^ e questo risultato è evidentemente ot­
timale per n = 2. il primo miglioramento al teorema di Liouville fu ottenuto
nel 1909 da Thue, che dimostrò che per ogni numero algebrico a di grado
tt > 3 e per ogni e > 0 esiste una costante C = C(ot, e) > 0 tale che

a- —
Cq"
per ogni p e q interi con q > 0. Dunque n(a) ^ ^ + 1. Al contrario del teore­
ma di Liouville, la costante C(ot, e) nel teorema di Thue non è effettivamente
calcolabile: il metodo di Thue dimostra l’esistenza di C(a, e) ma non fornisce
un procedimento che permetta di calcolarla.
Dopo successivi miglioramenti all’esponente di Thue, dovuti a Siegei, a
Dyson e a Gel'fond, nel 1955 Roth dimostrò il teorema seguente2.

Teorema 5.2 (di R oth ). Per ogni irrazionale algebrico a di grado qualsiasi
e per ogni e > 0 esiste una costante C = C(a, e) > 0 (non calcolabile) tale che

(5.3) a -£
<y
per ogni p e q interi con q > 0.

Dal teorema di Roth segue che per ogni numero algebrico a E R\Q,
senza eccezioni, si ha |x(a) = 2 . Dunque dal punto di vista del calcolo delle
misure d’irrazionalità il teorema di Roth è ottimale. Il principale difetto
dei teoremi di Thue e di Roth è Vineffettività, cioè la non calcolabili della
costante C. Negli ultimi decenni sono stati ottenuti alcuni miglioramenti
effettivi al teorema di Liouville nel caso n ^ 3, ma tali risultati sono as­
sai frammentari e quantitativamente insoddisfacenti; una versione effettiva
del teorema di Roth, cioè una dimostrazione della (5.3) con una costante
C = C(a, e) calcolabile esplicitamente, sembra irraggiungibile con i metodi
finora conosciuti e rappresenta uno dei problemi più diffìcili dell’approssi­
mazione diofantea attuale.

* Per una dimostrazione del teorema di Roth si veda il capitolo vi di Cassels [1957].
230 Francesco Amoroso e Carlo Viola

Il teorema di Roth equivale evidentemente ad affermare che per ogni


irrazionale algebrico a e per ogni e > 0 la disuguaglianza

ha al più un numero finito di soluzioni (p, q) con p e q interi, q =£ 0 . Al primo


membro di questa disuguaglianza compare il prodotto dei valori assoluti
delle due forme lineari L,(p, q) = p — aq e L2(p, q) = q, linearmente indi-
pendenti e a coefficienti algebrici.
In questa forma, il teorema di Roth è stato generalizzato da Schmidt
[1972], che ha dimostrato l’enunciato seguente.

Teorema 5.3 (teorema del sottospazio). Sia m ^ .2 ,e siano date m forme


lineari Lj(x), ■■■, Lm(x), linearmente indipendenti e a coefficienti algebrici,
in x =(xj, ..., xm). Per ogni e > 0 esiste al più un numero finito t di sottospazi
linearipropri Tx, ... ,T tdi Qwtali che ogni soluzione non nulla x = (xv ..., xm)
E Zmdella disuguaglianza

|L,(x)...L„(x)|<|x|-,

dove |x| = yjxj H----- •" . na contenuta in T, U •••U T( .

Fra le numerose conseguenze del teorema del sottospazio citiamo la se­


guente generalizzazione del teorema di Roth, anch’essa dovuta a Schmidt,
suH’approssimazione simultanea di numeri algebrici.

Teorema 5.4. Sia k > \ , e siano otj,. . a k numeri irrazionali algebrici tali
che d j , aksiano linearmente indipendenti su Q (cfr. definizione 8.2). Per
ogni e > 0 esiste al più un numero finito di k-ple (p jq , . . pJ<Ù di razionali
aventi lo stesso denominatore q e tali che

P,

6. 7 primi numeri trascendenti: Liouville.

A differenza di quanto visto per l’irrazionalità (teorema 2.1), non esiste


nessun criterio «elementare» che permetta di caratterizzare i numeri trascen­
denti. Per questo motivo la dimostrazione dell’esistenza di numeri trascen­
denti è un risultato relativamente recente. È infatti nel 1844 che Liouville
Numeri irrazionali e numeri trascendenti 231

fornisce una condizione sufficiente (ma non necessaria) per la trascendenza


di un numero reale, e tale condizione gli permette di esibire «concretamen­
te» una classe di numeri trascendenti.

Teorema 6.1 (di Liouville). Sia a un numero reale, e supponiamo che per
ogni \ > 0 la disuguaglianza

0 < « -£
q
abbia infinite soluzioni in interi p e q con q > 0. Allora a è trascendente.

Le ipotesi del teorema 6.1 dicono che a è un irrazionale tale che


ji(a) = +oo, cioè un numero di Liouville (cfr. paragrafo 4 ), e quindi il teore­
ma 6.1 è un’immediata conseguenza del teorema di Liouville 5.1 che implica
|a(oc) < n per ogni numero algebrico a di grado n > 2 . Osserviamo che il
teorema di Roth 5.2 permette di migliorare il teorema 6.1: ogni irrazionale
a tale che p.(a) > 2 è necessariamente trascendente.
La dimostrazione moderna dell’esistenza di numeri trascendenti si basa
sul fatto che l’insieme dei numeri algebrici è numerabile, poiché ad ogni poli­
nomio a0x n + •■■+ an a coefficienti interi di grado n si può far corrispondere
il punto (a0, ..., an) in Zw+1, che è evidentemente un insieme numerabile; e
l’unione numerabile Z2 U Z3 U ... è a sua volta un insieme numerabile. Poi­
ché R (o C) non è numerabile, quasi tutti i numeri reali (o complessi) sono
trascendenti. Tuttavia argomenti di questo tipo basati sulla cardinalità degli
insiemi [Cantor 1874] non erano noti all’epoca di Liouville, e perciò fino al
1844 l’esistenza di numeri trascendenti non era dimostrata. Inoltre il metodo
di Liouville ha il vantaggio di essere costruttivo poiché, utilizzando opportu­
ni algoritmi di convergenza (serie, frazioni continue, ecc.), fornisce esplicita­
mente esempi di numeri a tali che p.(a) = +oo e quindi trascendenti.
Dimostriamo ad esempio che il numero reale

e = X 10"*' = 0,1100010000000000000000010...
è un numero di Liouville, e quindi trascendente. Sia m un intero positivo
qualsiasi; chiaramente

P. = 1 0 " ! 1 0 -
*-[
è un intero. Inoltre
232 Francesco Amoroso e Carlo Viola

è un numero reale positivo il cui sviluppo decimale presenta come pri­


ma cifra non nulla un 1 nella (m + 1).'-esima posizione dopo la virgola.
Quindi
1
10" ! 10,w+l,! (l(T !r ’
e per ogni intero n ^ m si ha perciò
1 1
0< e--
10" (io"')" ao "!r '
Se ne deduce che per ogni m la disuguaglianza

0 < e-£ -

ha le infinite soluzioni p = p „ e q = 10"! con « > Per il teorema 6.1 l è


trascendente.
Vale la pena di sottolineare l’analogia fra il criterio d’irrazionalità espres­
so dal teorema2.1 eia condizione di trascendenza di Liouville (teorema 6.1),
e l’analogia fra la dimostrazione dell’irrazionalità di e e quella della trascen­
denza del numero l. Questa analogia è in realtà ingannevole: come abbiamo
visto nel paragrafo 2, ogni numero irrazionale soddisfa il criterio del teorema
2.1, mentre - come abbiamo accennato nel paragrafo 4 - gli irrazionali a tali
che ji(a) > 2 formano un insieme di misura nulla, e quindi solo un insieme
trascurabile (per la misura di Lebesgue) di numeri reali trascendenti viene
identificato dalle ipotesi del teorema 6.1. Dunque la maggior parte dei nu­
meri trascendenti passa attraverso la condizione di Liouville senza essere
riconosciuta. Questo accade, ad esempio, per due numeri che da sempre
hanno interessato i matematici: e e ir.

7. La trascendenza di e secondo Hermite.

Il criterio espresso dal teorema 2.1 afferma che se una retta di equazione
y = qx - p, con p e q interi, passa «molto vicino» al punto di coordinate
(a, 0), allora a è irrazionale. Una possibile generalizzazione consiste nel con­
siderare più rette parallele, diciamo
r , : y = q x - pjt
(j = 1,.. . , d) e dimostrare che se ogni retta r ■passa molto vicino al punto di
coordinate (a ', 0) (in un senso da precisare), allora a è trascendente. In altri
termini, si tratta di costruire approssimazioni simultanee ad a , a 2, ..., a d.
Numeri irrazionali e numeri trascendenti 233

Osserviamo che per ogni numero reale a , per ogni intero d ^ l e per ogni
e > 0, il sistema di disuguaglianze

(7.1) |^a/ - p / | < e , j = l,...,d,

ammette sempre una soluzione in interi q, p ,...... pd con q > 0. Questa affer­
mazione si dimostra utilizzando il principio dei cassetti, esattamente come
abbiamo fatto nel paragrafo 2 . Sia ora a un numero algebrico reale, radice
di un polinomio
P(x) = adx J + ad_xx J~' + ••• + atx + a0

con coefficienti interi e con ad iz 0 , e supponiamo che gli interi q ,p l ....... pd


risolvano (7.1). Poiché P (a) = 0 , si ha

ao<ì = -<7(<V*‘/ + ad.ì^ d' 1 + ■" + ata)


e dunque
\*j Pj + - + «,p, + «0*1 =
= |a j ( q a J - pd) + ■•• + *,(?< *- p,)| < (\ad |+•••+ |a, |)e.

Se scegliamo e > 0 tale che (\ad\+ ••• + |*j|) e < 1, si ha

I ajPj +"■ + a,P, + M l<

Ma adp j + ••• + a lp l + a0q è un intero e dunque, per il principio fonda-


mentale,

* j Pj + - + + a oe? = 0 -

Per dimostrare la trascendenza di a , bisogna quindi dimostrare che tale re­


lazione non è possibile. Più precisamente, è necessario dimostrare che, asse­
gnati comunque interi non tutti nulli a0...... ad, è possibile determinare interi
q, Pi........p d che verifichino il sistema di disuguaglianze (7.1) per qualche
E < ( M + •■• + k il)-1 e inoltre tali ehea jp j + ••• + <*,p, + a0q =£ 0.
Illustriamo questa costruzione prendendo come esempio la dimostra­
zione della trascendenza di e data da Hermite nel 1873. Supponiamo per
assurdo che e sia algebrico; esistono allora a0, ax....... ad interi non tutti nulli
tali che
a0 + ate + — I- ade d = 0.
Sia e > 0 tale che (|ad\+ ••• + |<*,|) e < 1. L’idea fondamentale di Hermite
è la seguente: ottenere approssimazioni razionali simultanee ai numeri e ,
234 Francesco Amoroso c Carlo Viola

e2, e* approssimando 1c funzioni e z, e 2z, ..., e Jl. Si tratta di determi­


nare polinomi a coefficienti interi Q ¥* 0 e P p ..., Pd tali che le funzioni
fji'à — Q{z)e^- Pj(z)abbiano uno zero di molteplicità elevata nell’origine.
Le approssimazioni razionali a e, e 2.......e d s\ otterranno ponendo

q = Q(l) e P / =P, (1), j = 1...... d.


Siano w e « interi non negativi che saranno scelti (in funzione di a0, ap ..., ad
e di e) alla fine della dimostrazione. Se i polinomi incogniti Q, Pl.......Pd
hanno grado ^ n, imporre alle funzioni f- di avere uno zero di molteplicità
> m + 1 nell’origine equivale a risolvere un sistema lineare omogeneo di
d(m + 1) equazioni (annullamento delle derivate di ordine ^ m delle fun­
zioni / ) avente come incognite i (d + 1)(« + 1) coefficienti dei polinomi Q,
P p JiY S e
(d + 1)n 2: dm,
il sistema omogeneo proposto ha più incognite che equazioni, e quindi am­
mette una soluzione non banale, ovvero esistono polinomi Q, Pv ...,P j non
tutti nulli che soddisfano le condizioni richieste. Inoltre, è possibile deter­
minare questi polinomi in maniera tale che i loro coefficienti siano interi;
infatti i coefficienti del sistema lineare corrispondente sono numeri razionali,
perché i coefficienti dello sviluppo in serie di e* lo sono. È lecito sperare che
le quantità/(1) = Q (l)e '-P ;-(1) siano piccole? La risposta è si, e il motivo
proviene dall’analisi complessa. Per costruzione^ ha uno zero di moltepli­
cità > m + 1 nell’origine; dunque/^ (z) = z m+ lg, (z) per una certa funzione
intera (cioè olomorfa in tutto C). Per il principio del massimo si ha

|/,d)| =|*/(1)ls = R'""‘p|!ìk(rtl


per ogni numero reale R ^ 1. D ’altra parte, se i coefficienti di Q e P- sono in
modulo ^ C, si ha, per ogni numero complesso di modulo ^ R,

( f * + l)max{|Q(z)|,|P; (z)|} £ 2C{n + 1)e^R ".

Dalle ultime due formule si ottiene la maggiorazione

|/; (1)|^ 2C (n+

valida per ogni R > 1. Scegliamo ora R in maniera da ottenere la migliore


stima possibile per |/J(1)|, cioè in maniera tale che la funzione edRR-{m-n+"
sia minima. Supponiamo m — n + ì ^ d ,u n facile calcolo dà allora il valore
R = {m - n + \)/d ^ 1. Per tale valore di R si ottiene
Numeri irrazionali e numeri trascendenti 235

Il senso di questa disuguaglianza è il seguente. I parametri tntn sono legati


dalle sole relazioni (d + \)n ^ dm e m - n + 1 > d\ quindi è possibile sce­
gliere m e rt in maniera tale chc (ed Km —n + sia piccolo a piacere
rispetto a e. Dunque se i coefficienti dei polinomi Q, P,, •••►?/ non sono
troppo grandi si ha |f} ( 1 )| < e, e perciò gli interi q = Q (l) e = P .(l) ri­
solvono il sistema di disuguaglianze (7.1).
Si pone allora il problema di determinare i polinomi Q e P; in maniera
tale che i loro coefficienti non siano troppo grandi. Questo si può fare in due
modi diversi. Seguendo Hermite, possiamo scegliere n tale che
(d + l)n = dm\
con questa scelta, il sistema lineare omogeneo soddisfatto dai coefficienti dei
nostri polinomi risulta essere un sistema di d(m + 1 ) equazioni in d(m + 1)+ 1
incognite di rango massimo; quindi i polinomi Q e P, sono univocamente
determinati, a meno di una costante moltiplicativa. Il vettore di polinomi
(Q, P„ ..., Pd) prende allora il nome di «approssimante di Padé» di tipo II
alle funzioni \t e\ ..., e Jl. Hermite esprime esplicitamente questi polinomi
utilizzando certe formule di rappresentazione integrale, chiamate appunto
«formule di Hermite»\ e attraverso queste dà stime precise per il massimo
dei loro coefficienti. Meglio ancora, le formule di Hermite permettono diret­
tamente di stimare la bontà delle approssimazioni razionali/,( 1 ),...,//( 1 ).
Una seconda possibilità, ed è quella che oggi si utilizza abitualmente nelle
dimostrazioni di trascendenza, consiste nel ridursi a un sistema con molte
più incognite che equazioni, scegliendo ad esempio n in maniera tale che
(d + \)n = 2dm.
Un lemma ormai classico (lemma di Thue-Siegel), utilizzato per la prima
volta da Thue nel già citato lavoro del 1909, permette di affermare che il
sistema lineare omogeneo ammette una soluzione non banale in interi di
modulo sufficientemente piccolo. Il vantaggio di questo secondo metodo
è la sua generalità: si applica infatti a funzioni, anche diverse dall’esponen­
ziale, che verifichino opportune proprietà analitiche (crescita controllata
all’infinito) e funzionali.
L’ultimo ostacolo da superare per concludere la dimostrazione è forse il
più serio: assicurarsi che il numero intero
ajPj + "• + a\P\ + M ~ ajPj(l) + ■■■+ atPt(l) + a0Q(ì)

* Per un’esposizione chiara e com pleta di queste formule si veda il testo di Siegcl [1949].
236 Francesco Amoroso e Carlo Viola

non sia nullo. Per garantire questo, Hermite costruisce per ogni n una fami­
glia di approssimanti Qk, P, PdJ( (k = 0 ....... d), in maniera tale che il
determinante della matrice (d + 1) X (d + 1)

Qo<D - Pj.od)'
Q,(l) P„(l) - P ,,» )

Q,<» V » ••• V »

non sia nullo. Questo assicura che, per almeno un indice k,

* 0Q*(D + aA ,k ^ + •■•+ ajPj,k^) * o

e permette di concludere la dimostrazione della trascendenza di e.

8. Il teorema di Gel'fond-Schneider.

La dimostrazione di Hermite è stata in seguito generalizzata da Linde-


mann:

Teorema 8.1 (di Hermite-Lindemann). Per ogni numero algebrico a =£0


il numero e a è trascendente.

Come abbiamo accennato ndl’introduzione, questo teorema implica in


particolare la trascendenza di tt. Più generalmente se ne deduce la trascenden­
za di a per ogni a complesso, a 0 , 1 , tale che e a sia un numero algebrico.
La naturale generalizzazione del teorema di Hermite-Lindemann è un
teorema di Weierstrass del 1885. Per poterlo enunciare nella sua forma mo­
derna è necessario introdurre due definizioni.

Definizione 8 2 . Siano K C L due campi e a ,, . . E L


(i) a p ..., a t si dicono linearmente indipendenti su IK se la relazione
b xOLx + ••• + bka k = 0 con b {, ..., bk E IK implica b x = = bk = 0.
(ii) a ,, ..., a k si dicono algebricamente indipendenti su IK se per ogni
polinomio non identicamente nullo P(xt, ..., xk) a coefficienti in (K si
ha Pi,a , , ..., a*) =£ 0 .

Per brevità, nel caso di numeri complessi (L = C) diremo semplicemente


che a , , ..., a* sono linearmente indipendenti, o algebricamente indipenden­
Numeri irrazionali e numeri trascendenti 237

ti, se sono linearmente indipendenti su Q o, rispettivamente, algebricamente


indipendenti su Q.
Analogamente, se f v ...,/ * sono funzioni di una variabile complessa z,
diremo che esse sono linearmente indipendenti, o algebricamente indipen­
denti, se lo sono sul campo C(z) delle funzioni razionali.

Teorema 8.3 (di Lindemann-Weierstrass). Siano a , , ..., a kS C numeri


algebrici linearmente indipendenti. Allora i numeri complessi e a', ..., e ak sono
algebricamente indipendenti.

Il teorema 8,3 è uno dei pochi risultati di indipendenza algebrica per


famiglie di numeri a noi noti. Cosa possiamo dire di altri numeri, costruiti «a
partire» da e e tt? Per esempio, qual è la natura aritmetica di e w? Nel 1900,
durante il Congresso intemazionale dei matematici a Parigi, Hilbert [1902]
propose una lista di 23 problemi, la cui soluzione giudicava importante per
il progresso della matematica. Nel settimo, Hilbert pone il problema della
trascendenza dei numeri e mz, dove z è un numero algebrico irrazionale. Si
osservi che una soluzione affermativa di questo problema implica la tra­
scendenza di e'n: infatti = e m. Hilbert dà un’elegante formulazione
geometrica di questo problema:
Quando, in un triangolo isoscele, il rapporto fra l'angolo alla base e l'angolo al
vertice è algebrico, ma non razionale, il rapporto fra la base e l’altro lato sarà sempre
trascendente4.

Più avanti, Hilbert propone la seguente congettura:


La potenza aP per una base algebrica a e un esponente algebrico irrazionale 3,
come per esempio il numero 2 ^ o é" = i~z\ rappresenta sempre un numero trascen­
dente o perlomeno irrazionale’.

La quantità aP nel passaggio citato va intesa come É>P|o*a, dove Ioga è


un’arbitraria determinazione del logaritmo di a, ovvero uno dei numeri
complessi / tali che é = a. Il 1° aprile 1934 Gel'fond risolve questo pro­
blema; meno di due mesi dopo (il 28 maggio) Schneider ne dà una seconda
soluzione utilizzando un metodo essenzialmente diverso.

Teorema 8.4 (di Gerfond-Schneider). Per ogni numero algebrico a ^ 0,


1 e per ogni numero algebrico irrazionale 3 il numero aP è trascendente.

4«L orsq u e, dans un triangle isoscèle, le rapport entre l’angle à la base et l’angle au sommet est
algébrique, mais non rationnel, le rapport entre la base et l’autre còte sera toujours transcendant».
’ «La puissance a » pou r une base algébrique a et un exposant algébrique irrationnel 3 , comme
par exem ple le nom bre 2 ^ ou e" = i représente toujours un nombre transcendant ou pour le
moins irrationnel».
238 Francesco Amoroso e Girlo Viola

Le due dimostrazioni proposte danno origine a due criteri generali di tra­


scendenza (teoremi 9.3 e 9.7) che contengono tutti i risultati di trascendenza
che abbiamo enunciato, più numerosi altri. I due metodi presentano due dif­
ferenze sostanziali rispetto alla dimostrazione analizzata nel paragrafo prece­
dente. Invece di cercare approssimazioni simultanee ad a , ..., a d si cerca di
costruire un’opportuna combinazione lineare 7 = b0 + b {a + ■■• + bda J, che
sia piccola ma non nulla, avente coefficienti b0, ...,b d algebrici e di altezza
piccola (cfr. definizione 9.2). Inoltre, questa combinazione lineare non viene
calcolata esplicitamente, ma la sua esistenza deriva dal lemma di Thue-Siegel
già citato. Ad esempio, per dimostrare il teorema di Hermite-Lindemann
8 . 1 , si costruisce dapprima un polinomio non nullo P(x, y) a coefficienti
interi, tale che la funzione ausiliaria
Fiz ) = P(z,ez)
sia nulla in z = 0 con molteplicità elevata (metodo di Gerfond), oppure nulla
in z = a, 2 a , ..., na per un certo n E N grande (metodo di Schneider). Si
dimostra in seguito che un’opportuna derivata di F è non nulla in a (meto­
do di Gel'fond), oppure che F è non nulla in un opportuno multiplo di a
(metodo di Schneider). Se a e e a sono entrambi algebrici, si ottiene nei due
casi un numero algebrico 7 non nullo che si maggiora utilizzando tecniche
(elementari) di analisi complessa e si minora utilizzando tecniche (ancora
elementari) di teoria algebrica dei numeri. La maggiorazione e la minora­
zione non risultano tra loro consistenti, e questo permette di concludere la
dimostrazione del teorema 8.1 per assurdo.

9. I metodi di Gel'fond e Schneider.

Il metodo di Schneider è stato assiomatizzato da Lang, Ramachandra e


Waldschmidt. Prima di enunciare il loro risultato, abbiamo bisogno di due
definizioni.

Definizione 9.1. Sia f : C —>C una funzione intera e sia p > 0 . Diciamo
che fh a ordine se per ogni numero complesso z si ha
|/(z)| ^ exp(C|z|P)
per un opportuna costante positiva C (dipendente solo da f) .

Ad esempio una funzione polinomiale ha ordine ^ e per ogni e > 0 , e la


funzione esponenziale ha ordine ^ 1 .
La definizione seguente introduce l’altezza di Weil h(a) che permette di
valutare la «complessità aritmetica» di un numero algebrico a.
Numeri irrazionali e numeri trascendenti 239

Definizione 9.2. Sia a un numero algebrico di grado n, sia


Pix) = a0x " + axxn~x H------1- an
il polinomio minimob di a. su l., e siano a . = a, cu, ..., a n i coniugati di a,
cioè le radici di Pix). Definiamo l’altezza ai Weil\\\(x) di a come

h(a) = - log! aQf\ m axim a*


n \ k~\
Ad esempio y fi ha polinomio minimo x2 —2 e altezza h( yfì ) = ^log 2 ,
mentre la radice reale 0 del polinomio cubico x 3 — x — 1 ha altezza
h(0 ) = -j log 0 (infatti i suoi due coniugati # 0 hanno modulo < 1 ).

Teorema 9.3 (criterio di Lang-Ramachandra-Waldschmidt). Sia EK


un’estensione algebrica finita di Q e siano f , ...,fm(m > 2) funzioni intere di
una variabile complessa, algebricamente indipendenti, di ordine rispettivamen­
te ^ pp ..., pm. Siano inoltre SN(N E N) sottoinsiemifiniti di C e supponiamo
che esistano numeri reali positivi cr, cv c2 e c3 tali che:
(i) per ogni N E fH l’insieme SNha cardinalità ^ CjNa ed è contenuto in
una sfera di raggio < c2N;
(ii) per i = 1, ..., m e per ogni N E N, la funzione f t manda SNin IK e
h ift iz)) ^ c3Np* per ogni z G S N.
Allora si ha:

m- 1

Il criterio precedente implica il teorema di GeTfond-Schneider 8.4: siano a


e p due numeri algebrici con a =£ 0,1 e (3 irrazionale; scegliamo una determina­
zione /del logaritmo di a e consideriamo le funzioni interefiz ) = z e f 2iz) = e lz.
Fissiamo inoltre un numero reale e E (0,1). È facile mostrare che/, e f2 sono
algebricamente indipendenti. Inoltre /, ha ordine ^ e e f 2 ha ordine ^ 1.
Supponiamo per assurdo = f 2i p) algebrico e sia IKun’estensione algebrica
finita di Q contenente a, 0 e aP. Consideriamo per ogni N E W l’insieme
SN = [a + b$, a ,b G h J, 1 < < ;,£ < N }
di cardinalità N2 (infatti p è irrazionale): possiamo dunque scegliere cr = 2 nel­
l’enunciato del teorema 9.3. Poiché IK contiene a, (3 e a p, si ha f iS N) C IK e

* Per la definizione di polinom io m inim o si veda la dimostrazione del teorema 5.1.


240 Francesco Amoroso e Carlo Viola

^2^ ) Q IK. Si verifica inoltre che per ogni z E SN si ha h(/,(z)) ^ c}N£ e


h {f2iz)) ^ cyN per un'opportuna costante c} > 0 (dipendente da e). Per il
teorema 9.3 si ha allora
2 < e + 1,
assurdo.
Il criterio 9.3 permette inoltre di dimostrare il cosiddetto teorema dei
sei esponenziali.

Teorema 9.4 (di Lang). Siano ot,, a 2, a } numeri complessi linearmente in­
dipendenti. Siano 0,, 02 numeri complessianch’essi linearmente indipendenti.
Allora almeno uno dei sei esponenziali
e a(\ / = 1,2,3, > = 1,2,
è trascendente.

Per dedurre questo risultato dal teorema 9.3, supponiamo per assur­
do che i sei esponenziali siano tutti algebrici. Consideriamo le funzioni
/(z)= e a,z (i = 1 , 2 , 3 ) che sono algebricamente indipendenti, grazie all’ipo­
tesi di indipendenza lineare degli or, e di ordine ^ 1 . Sia IK un’estensione
algebrica finita di <Qcontenente i sei esponenziali e a Consideriamo inoltre
per ogni N E h I l’insieme
SN = { b ^ - h b 2p2, bv b2E N, 1 * b v b2 * N ]
di cardinalità N2 (questa volta per l’ipotesi di indipendenza lineare dei 0 y):
possiamo dunque scegliere nuovamente ct = 2 nell’enunciato del teorema
9.3. Per la scelta di IK abbiamo/ (SN) C IK per / = 1, 2, 3. Si verifica inoltre
che per ogni z E S Ne per / = 1 ,2 ,3 si ha h(/j(z)) ^ c} N per un’opportuna
costante c} > 0. Per il teorema 9.3 si ha allora

assurdo.

Si noti che si può dare una dimostrazione duale del teorema dei sei espo­
nenziali considerando le funzioni/(z) = e$>z ( j = 1,2) e gli insiemi
Ss = {tfjOt, + a2a 2 + *,<*,, av a2,a i E 1< < N }.
La dimostrazione del precedente teorema suggerisce la seguente con­
gettura.

Congettura 9.5 (dei quattro esponenziali). Siano a v a 2 numeri complessi


linearmente indipendenti. Siano 0,, 02 numeri complessi anch’essi linearmen­
te indipendenti. Allora almeno uno dei quattro esponenziali
Numeri irrazionali e numeri trascendenti 241

e a t i / = 1,2, / = 1,2,
è trascendente.
Si osservi che se tentiamo di dimostrare questa congettura utilizzando lo
schema della prova del teorema 9.4, otteniamo la disuguaglianza 2 ^ 2 che
non permette di ottenere una conclusione per assurdo.
Il metodo di Gel'fond si può anch’esso assiomatizzare. Per questo abbia­
mo bisogno della seguente definizione.

Definizione 9.6. Siano f x, ..., f mfunzioni di una variabile complessa z e


sia I K c C « « campo. Diciamo che la derivazione d/dz opera su IK[fx, /m]
sef\ = P,(fv •■•,/„,) (/= 1, ni) per certi polinomi Pv Pmin m variabili
a coefficienti in (K.

Teorema 9.7 (criterio di Schneider-Lang). Sia m un intero > 2 e siano


f\> • f mfunzioni intere di una variabile complessa z, con f xe f 2 algebricamen­
te indipendenti e di ordine finito. Sia IK un’estensione algebrica finita di Q e
supponiamo che la derivazione d/dz operi su K\fx, .. .,/ J. Allora l’insieme dei
numeri complessi £ tali che f t.(g) G IK per i = 1, ..., m è finito.

Il criterio precedente implica ancora il teorema di Gerfond-Schneider


8.4: per questo, si considerino le due funzioni/,(z) = e z e/2(z) = e*1e l’in­
sieme infinito { jl\ j G Z}, dove /è, come in precedenza, una determinazione
del logaritmo di a , e si osservi che f\ = f xe/2 = p/2.
Il criterio 9.7 contiene inoltre il teorema di Hermite-Lindemann 8.1: si
scelga/,(z) = z,/2(z) = e z e si consideri l’insieme {jl\j G Z}.

10. E-funzioni e G-funzioni.

Le nozioni di E- e G-funzioni sono state introdotte da Siegei [1929] come


generalizzazioni, rispettivamente, della funzione esponenziale e 1= 1 + z/1 ! +
+ z2/2 ! + ••• e della serie geometrica (1 —z)-1 =1 + z + z2 + •••
Una funzione/di una variabile complessa z è una_E-funzione se soddisfa
un’equazione differenziale lineare a coefficienti in Q(z) (Q è il campo dei
numeri algebrici), e se i coefficienti del suo sviluppo di Taylor nell’intorno
dell’origine:
( 10. 1)

appartengono a un’estensione algebrica finita IK di Q e, per n —* » , soddi­


sfano le due condizioni seguenti:
242 Francesco Amoroso c Carlo Viola

(i) Il logaritmo del massimo modulo dei coniugati di ctl è o(n log »);
(ii) Sia dn il più piccolo intero positivo tale che dnc0....... dncn siano tutti
interi algebrici (cioè radici di polinomi monici a coefficienti in 2 );
allora log dn - o(n log n).

Si osservi che la condizione (i) implica in particolare log |cj = o(n log n), da
cui segue che il raggio di convergenza della serie ( 1 0 . 1 ) è infinito; dunque
una E-funzione è necessariamente intera. La funzione esponenziale è un
esempio (anzi l’esempio tipico) di E-funzione. Un’altra famiglia notevole di
E-funzioni è data da7

dove il parametro X è un qualunque numero razionale diverso dagli interi


negativi. La funzione Kx(z), facilmente esprimibile in termini della funzione
di Bessel J x(z), è soluzione dell’equazione differenziale lineare omogenea

jdzf + — z £dz + * =

Il metodo di Hermite-Lindemann (teorema 8 . 1 ) è stato esteso da Siegei


[1949] alle E-funzioni che soddisfano un sistema differenziale lineare omo­
geneo

(10.2) ^ = £**> > > , (* = 1.......m)

avente per coefficienti funzioni razionali aki E. Q(z), sotto una condizione
tecnica di normalità in seguito rimossa da Sidlovskij [1 9 5 9 ; 1989], il
quale considera inoltre soluzioni di sistemi differenziali lineari non ne­
cessariamente omogenei.

Teorema 10.1 (di Siegel-Sidlovskij). Siano Em E-funzioni solu­


zioni di m

= a t.o w + ^ = 1 ..........

’ Utilizziamo la notazione di Pochhamm cr (a)„ = aia +1 ) . .. (a + n - 1 ) per o 6 C c » G N. con


la convenzione (a)n = 1 .
Numeri irrazionali e numeri trascendenti 243

con ak ( G Q (z U sia a un numero algebrico non nullo e distinto dai poli delle
funzioni ak ,. Se E,, . Emsono algebricamente indipendenti, i numeri com­
plessi E, (a), . . Em(a) sono algebricamente indipendenti.

Diremo che una funzione /, soluzione di un’equazione differenziale li­


neare a coefficienti in Q(z), è una G-funzione se

(10.3) =
n-0
dove i coefficienti yn appartengono a un’estensione algebrica finita K di Q
e, per n —► soddisfano:
(i) Il logaritmo del massimo modulo dei coniugati di yn è 0(«);
(ii) Sia 8 ^ il più piccolo intero positivo tale che 8 n7 0, ..., bnynsiano tutti
interi algebrici; allora log 8 n = 0{n).
La condizione (i) implica log |*yj = 0 (« ), da cui segue che il raggio di con­
vergenza della serie (10.3) è strettamente positivo.
Tra le G-funzioni annoveriamo le funzioni ipergeometriche

con a , b e c razionali (e con —c £ foJ). Altri esempi importanti di G-funzioni


sono (1 + z)r con r E <Q>, log(l + z) e, più in generale, i polilogaritmi

n ,W = Ì 4 (1 = 1.2,...).
»=ì n
I primi risultati parziali di indipendenza lineare per valori di G-funzioni
sono enunciati (senza dimostrazione) dallo stesso Siegei [1929]. Tali risultati
sono stati notevolmente generalizzati da Bombieri [1981], utilizzando fra
l’altro metodi di analisi p-adica. Bombieri introduce il concetto di operatore
differenziale fuchsiano di tipo aritmetico, e studia G-funzioni soluzioni di un
sistema differenziale ( 10 .2 ) fuchsiano e di tipo aritmetico (il che comporta
una condizione di finitezza sui raggi di convergenza p-adica delle soluzioni).
In particolare dimostra il seguente teorema.

Teorema 10.2 (di Bombieri). Siano G ,,. . GmG-funzioni definite su un


campo di numeri 0< e soluzioni di un sistema ( 10 .2 )fuchsiano e di tipo aritme­
tico. Se G u ..., Gmsono linearmente indipendenti su K(z), i numeri complessi
Gì (a ) ,. . Gm(ct) sono linearmente indipendentisu 0<per ogni a E K non nullo,
244 Francesco Amoroso c Carlo Viola

distinto dai poli dellefunzioni aki, avente modulo inferiore al minimo dei raggi
di convergenza delle serie che definiscono G,, . . Gme tale che

log |oc| + C,h(a) + C2 < 0,

dove C, e C2 sono numeri reali positivi che non dipendono da a.

11. Il teorema di Baker e qualche altro risultato notevole.

Indichiamo con
C = {/ G C, e 1 G <□}
l’insieme dei logaritmi dei numeri algebrici. Osserviamo che il teorema di
GeTfond-Schneider 8.4 può essere riformulato nella maniera seguente: siano
L, l2 E C linearmente indipendenti; allora /,, l2 sono linearmente indipen­
denti sul campo Q dei numeri algebrici (per passare da questo enunciato a
quello del teorema 8.4 è sufficiente scegliere per /, una determinazione del
logaritmo di a e l2 = (31{). Analogamente il teorema di Hermite-Lindemann
8.1 si traduce nella forma seguente: sia /, E C non nulloj^allora /, non è al­
gebrico, ovvero le/ , sono linearmente indipendenti su Q . Con questa for­
mulazione i due risultati citati divengono un corollario del celebre teorema
seguente [Baker 1966-67].

Teorema 11.1 (di Baker). Siano /,,..., lm E C linearmente indipendenti.


Allora 1, /,,..., lmsono linearmente indipendenti su <Q>.

Continuando a manipolare in vario modo e , arriviamo al problema se­


guente: il numero ee è trascendente? Il problema è ancora aperto. Nel 1957
Schneider enuncia a sua volta una lista di otto problemi; nell’ultimo conget­
tura che almeno uno dei due numeri ee ed e el sia trascendente (quindi qual­
cosa di più debole rispetto alla trascendenza di ee). Questa congettura viene
risolta indipendentemente da Brownawell [1974] e Waldschmidt [1973],
che dimostrano quanto segue:

Teorema 11.2 (di Brownawell-Waldschmidt). Sia l i 1 0 un numero com­


plesso tale che e 1ed e 12 siano entrambi algebrici; allora e e l sono algebrica­
mente indipendenti.

La soluzione dell’ottavo problema di Schneider si ottiene dall’enunciato


precedente scegliendo l - e. Inoltre, ponendo / = ttì si trova:
Numeri irrazionali e numeri trascendenti 245

Corollario 11.3. Se e™2 è algebrico, allora e e ir sorto algebricamente in­


dipendenti.
Sembra improbabile che e^ sia algebrico, e sembra altrettanto improba­
bile che e e tt siano algebricamente dipendenti. Tuttavia, sia la trascendenza
di e^ che l’indipendenza algebrica di e e ir sono problemi aperti e probabil­
mente di difficile soluzione.
Un altro problema classico è l’indipendenza algebrica di ir e e* (ambedue
trascendenti: il primo per il teorema di Hermite-Lindemann, il secondo per
quello di Gel'fond-Schneider), risolto recentemente da Nesterenko [1996]
utilizzando la teoria delle curve ellittiche e delle funzioni modulari.

Teorema 11.4 (di Nesterenko). 1 numeri ir e e v sono algebricamente


indipendenti.
Terminiamo questa esposizione con una congettura che contiene tutti i
risultati di trascendenza e tutte le congetture precedentemente enunciate a
proposito della natura aritmetica dei valori della funzione esponenziale.

Congettura 11.5 (di Schanuel). Siano a p ...,a nnumeri complessi linear­


mente indipendenti. Allora tra i numeri complessi

CLl , . . . , a n, e a\ . . . , e a-

ce ne sono almeno n algebricamente indipendenti.

A FÉR Y , R.
1979 /rrationalitéde Ì(2) et 10), in «Astérisque», 61, pp. 11-13.
BA KER, A.
1966-67 Linearforms in thè logarithms of algebraicnumbers I, II, III, in «Mathematika»,
13, pp. 2 0 4-16; 14, pp. 102-7 e 220-28.
1975 Transcendental Number Theory, Cambridge University Press, Cambridge.
BE U K E R S, F .
1979 A note on thè irrationality o f £(2) and £,(3), in «Bulletin of thè London Math­
ematical Society», 1 1 , pp. 268-72.
B O M B IE R I, E .
1981 On G-functions, in a a . v v ., Recent Progress in Analytic Number Theory ( 1979),
Academic Press, London - New York, voi. II, pp. 1-67.
BROWNAWELL, D.
1974 The algebraic independence o f ccrtain numbers related to thè exponentialfunc-
tion, in «Journal o f Number Theory», 6, pp. 22-31.
246 Francesco Amoroso e Carlo Viola

CANTOR, G.
1874 Ober eine Eigenscbaft des Inbegriffes aller reellen algebraischen Zablen , in
«Journal fùr die reine und angewandte M athem atik», 7 7 , pp. 2 5 8 -6 2 [trad. it.
in id ., Ym formazione della teoria degli insiemi, a cu ra di G . R igam onti, Sansoni,
Firenze 1992, pp. 17-22].

CASSELS, J . W. S.
1957 An lntroduction to Diophantine Approximation, C am b rid ge University Press,
Cambridge.

EULER, L.
1744 Defractionibus continuis dissertatio, in «C om m entarti A cadem iae Scientiarum
Imperialis Petropolitanae», I X , 1737, pp. 9 8 -1 3 7 ; in Opera omnia, serie I, voi.
XIV , Teubner, Leipzig-Berlin 1925, pp. 1 8 7 -215.

FEL'DMAN, N. I. e NESTERENKO, YU. V.


1998 TranscendentalNumbers, Encydopaedia of M athem atical Sciences, 4 4 , Springer-
Verlag, Berlin-Heidelberg.

GEL'FOND, A. O.
1934 Sur le septième problème de Hilbert, in «Izvesdja Akadem ii N auk SSSR», serie
«M athem atika», 7 , pp. 6 23-30.

HATA, M.
1993 Rational approximations to ir and some otber numbers, in « A età A rithm etica»,
6 3 , pp. 335-49.

HERMJTE, CH.
1873 Sur lafonction exponentielle, in «C om ptes rendus de l’A cadém ie des Sciences
de Paris», 7 7 , pp. 1 8 -2 4 ,7 4 -7 9 ,2 2 6 - 3 3 ,2 8 5 -9 3 .

HILBERT, D.
1902 Sur les problèmes futurs des matbématiques, in Compie rendu du Deuxième
Congrès International des Matbématiques tenu à Paris du 6 au 12 aout 1900,
Gauthier-Villars, Paris.
KHINCHIN, A. YA.
1964 Continued Fractions, University o f Chicago Press, C h icag o -L o n d o n .
LAGRANGE, J.-L .
1769 Sur la résolution des équations numériques, in «M ém oires de l’A cadém ie royale
des Sciences et Belles-lenres de Berlin», X X I I I , 1 7 67, pp. 3 1 1 -5 2 ; in (Euvres
compiètes, a cura di J . A. Serret e G . D arboux, 14 voli., Paris 1 8 6 7 -9 2 , voi. II,
pp. 5 39-78.
1770 Additions au mémoire sur la résolution des équations numériques, in «M émoires
de l’Académie royale des Sciences et Belles-lettres de Berlin», X X I V , 1768, pp.
111-80; in (Euvres complètes, a cura di J . A. Serret e G . D arb o u x, 14 voli., Paris
1867-92, voi. n , pp. 5 8 1 -6 5 2 .
Numeri irraionali e numeri trascendenti 247

la m bert, j . h.
1768 Mémoire sur quelques propriétés remarquables des quantités tramcendantes cir-
culaires et logarithmiques, in «H istoire de l’Académie Royale des Sciences et
des Belles L ettres de Berlin», 1761, pp. 265-322.
lan g , s.
1961 Introduction lo Transcendental Numbers, Addison Wesley, Reading.
l in d e m a n n , f .
1882 (Jber die Zahl ir, in «M athem atische Annalen», 20, pp. 213-25.
LIOUVILLE, J .
1844 Sur des classes très-étendues de quantités doni la valeur n'est ni algébrique;
ni m im e réductible à des irrationnelles algébriques, in «Com ptcs rendus de
l’A cad ém ie des Sciences de Paris», 18, pp. 883-85.
MAHLER, K.
1976 Lectures on Transcendental Numbers, Springer-Verlag, Berlin-Heidclberg.
n ester en k o , y u . v.
199 6 Modular functions and transcendence questions, in «Matematiceskij sbomik»,
1 8 7, n. 9 , pp. 6 5 - 9 6 (in russo); trad. ingl. in «Sbomik: Mathematics», 187, n.
9 , pp. 1 3 1 9 -4 8 .

RHIN, G. e VIOLA, C.
1 99 6 On a permutation group related to £(2), in «A cta Arithmetica», 77, pp. 2 3-56.
2 00 1 The group structurefor £ (}), in «Acta Arithmetica», 97, pp. 269-93.
RIVOAL, T.
2000 La fonction zèta de Riemann prend une infinité de valeurs irrationnelles aux
entiers impairs, in «C om p tes rendus de l’Académie des Sciences de Paris»,
3 3 1 , pp. 2 6 7 -7 0 .

ROTH, K. F.
1955 Rationalapproximations to algebraic numbers, in «Mathemadka», 2 , pp. 1-20.
SCHMIDT, W . M .
1972 Norm form equations, in «Annals o f Mathematics», 96, pp. 526-51.
1980 Diopbantine Approximation, Springer-Verlag, Berlin-Hcidelberg.
SCHNEIDER, TH.
1934 Transzendenzuntersuchungenperiodischer Funktionen, in «Journal fiir die reine
und angew andte M athem atik», 172, pp. 65-74.
1957 Ein/uhrung in die transzendenten Zahlen, Springer-Verlag, Berlin-Heidel-
berg.
SlDLOVSKIJ (SHIDLOVSKn), A. B.
1959 A criterion fo r algebraic independence o f thè values ofa class o f entirefunctions,
in «Izvestija A kadem ii Nauk SSSR», serie «Mathcmatika», 23, n. 1, pp. 35-66
(in russo); trad . ingl. in «Am erican Mathematica] Society Translation Series»,
2 , 2 2 (1 9 6 2 ), pp. 3 3 9 -7 0 .
1989 Transcendental Numbers, W alter de Gruyter, Berlin - New York.
248 Francesco Amoroso e Carlo Viola

s ie g e l , c . L.
1929 Ober einige Anwendungen diopbantiscber Approximationen, in «Abhandlun-
gen der Preussischen Akademie der W issenschaften», n. 1 ; in Gesammelte
AbbandUtngen, voi. I, Springer-Verlag, Berlin-Heidelberg 1966, pp. 209-66.
1949 Transcendental Numbers, Princeton University Press, Princeton.
THUE, A.
1909 Ober Annàberungswerte algebraiscber Zablen, in «Journal fur die reine und
angewandte Mathematik», 135, pp. 284-305.
WALDSCHMIDT, M.
1973 Solution du buitième problème de Scbneider, in «Journal o f N um ber Theory»,
5, pp. 191-202.
1974 Nombres transcendants, Springer-Verlag, Berlin-H eidelberg.
2000a Un demi siècle de transcendance, in j .- p . p i e r (a cura di), Developmertt o f Math­
ematics 1950-2000, Birkhàuser Verlag, Basel, pp. 1121-86.
2000 b Diopbantine Approximation on Linear Algebraic Groups, Springer-Verlag,
Berlin-Heidelberg.
WEIERSTRASS, K.
1885 Zu Lindemanris Abbandlung «Ober die Ludolph’scbe Zahl», in «Sitzungs-
berichte der Preussischen Akademie der W issenschaften», 2 , pp. 1067-85.
JONATHAN M . BO RW EIN

La vita dipi greco*

1. Preambolo: pi greco nella cultura popolare.

Il desiderio di capire -tt, la sfida, e - almeno all’inizio - la necessità di


calcolare valori sempre più precisi di tt, il rapporto fra la circonferenza di
un cerchio e il suo diametro, ha messo alla prova matematici, grandi e meno
grandi, per moltissimi secoli. Soprattutto recentemente, inoltre, il calcolo di
tt ha fornito convincenti esempi di matematica computazionale. Pi greco,

unico esempio nella matematica, è diffuso nella cultura e nell’immaginazione


popolare1.
Alternerò la descrizione dello status matematico di pi greco - perlopiù in
ordine cronologico - con alcuni esempi della sua ubiquità. Maggiori dettagli
si possono trovare nella bibliografia al termine di questo saggio e, inoltre, in
Pi: a Source Book [Berggren, Borwein e Borwein 2004], dov’è a disposizione
una gran quantità di altro materiale sia serio sia più divertente. Si può trovare
altra documentazione interessante nel testo di Pierre Eymard e Jean-Pierre
Lafon [1999], che contiene anche discussioni su argomenti quali le frazioni
continue e gli integrali ellittici.
Il fascino esercitato da tt è dimostrato dai molti libri popolari, dai pro­
grammi televisivi, dai film, perfino dal nome di un profumo, in cui viene
menzionato. In un episodio del 1967 della serie Star Trek dal titolo «Fan­
tasmi dal passato»2 il Capitano Kirk domanda: «Esiste qualche problema
matematico che non può essere risolto?» Spock quindi «frigge il cervello» di
un computer criminale dicendogli: «Calcola il valore di pi greco fino all’ulti­
ma cifra decimale». Nell’episodio de I Simpson trasmesso per la prima volta
negli Stati Uniti il 6 maggio 1993* Apu si pavoneggia cosi: «Posso recitare pi
greco fino alla quarantamillesima cifra. L’ultima cifra è uno».

* Sono grato a molte persone, c in special modo ai mici stretti collaboratori P. Borwein c
D. Bailey.
1 II sito MacTutor (www-history.mcs.st-andrews.ac.uk/history/) dell'Università di St Andrews
in Scozia, la mia città natale, è una fonte piuttosto buona e di facile accesso per la storia della
matematica. In internet si può reperire molto materiale su pi greco; una buona selezione si trova
all’indirizzo www.experimentalmath.info.
1 Titolo inglese «Wolf in thè Fold». [N.d.T.l
* Si tratta dell’episodio «Marge in catene», trasmesso in Italia il 27 novembre 1994. [N.</.T].
250 Jonathan M. Borwein

Nel novembre del 1996, la rete televisiva americana m s n b c mandò in


onda, nel giorno del Ringraziamento, un programma interamente dedicato
a tt, airinterno del quale comparivano la scena di Star Trek che abbiamo
ricordato poco sopra, assieme a interviste all’autore del presente articolo e
ad altri matematici della Simon Fraser University. Il film Contact con Jodie
Foster, uscito nel 1997, è tratto dal romanzo del 1986 del famoso astronomo
Cari Sagan. Nel libro la protagonista cerca delle regolarità nella sequenza
delle cifre di tt e, dopo una misteriosa esperienza, trova valide conferme
nell’espansione di tt in base 11. Il libro The Joy o f Pi [Blatner 1997] ha
venduto molte migliaia di copie e continua a vendere bene. Il film del 1998
intitolato Pi* inizia mostrando le cifre di tt che scorrono sullo schermo. In­
fine, in Matrix Reloaded (2003) uno dei personaggi, il Fabbricante di Chiavi,
avverte che una cena porta sarà accessibile esattamente per 314 secondi: un
riferimento a tt, secondo quanto riportato da un articolo di «Time».
Come esempio particolarmente significativo, si provi a immaginare se
sarebbe mai possibile scrivere il seguente brano, tratto dal romanzo Vita
di Pi di Yann Martel, vincitore del premio Booker nel 2002, per un altro
numero trascendente:
Mi chiamo
Piscine Molitor Patel
conosciuto da tutti c o m e ...
Pi Patel
E poi aggiunsi:
TT = 3,14
Sotto la lettera greca disegnai un grande cerchio e tracciai il diam etro per evocare
quel parametro geometrico fondamentale’.

Analogamente la National Public Radio degli Stati Uniti riferì che a New
York «andavano di moda» dei malfunzionamenti molto particolari di alcuni
nuovi bancomat: mostravano un saldo di ben 314 159,26 dollari. Uno avreb­
be potuto semplicemente prenderne nota e, senza pensare che vi fosse nulla
di male, rimanere stupito dell’ottima salute del conto in banca in questione,
ma Scott Simon, il conduttore del programma, notò la somiglianza con tt.
Sempre sulla stessa linea, il «New York Times» del 18 agosto 2005 riportava
che Google aveva messo sul mercato esattamente «14 159 265 nuove quote
di ricca tecnologia» quale numero di azioni della propria offerta di collo­
camento. E allo stesso modo, il 14 marzo, in Nord America è divenuto il
«Giorno di pi», dal momento che negli Stati Uniti il mese viene scritto prima
del giorno («3 14»). Nelle scuole di tutto il Nord America è l’occasione per

* Tradono in italiano come Pi greco. Il teorema del delirio. [N.d.T.].


* Y. Martel, Life of Pi, Knopf Canada, Toronto 2001 [trad. it. Vita di Pi, Piemme, Casale Mon­
ferrato 2003, p. 40].
La vita di pi greco 251

progetti di matematica, in particolare su pi greco. È difficile immaginare


che e ,y o log 2 possano ricoprire un simile ruolo. Un esempio dello stesso
fenomeno, tratto stavolta dal mondo scientifico, è il seguente:
Un messaggio in codice [ ...] potrebbe essere considerato un discorso incom-
prensibile da una persona e un’informazione preziosa da un’altra. Prendiamo il nu­
mero 1 4 1 5 9 2 6 5 ...: a seconda delle tue conoscenze pregresse, può trattarsi di una
sequenza di cifre casuali senza alcun significato, o della parte frazionaria di pi greco,
un tassello importante del sapere scientifico [Baeyer2003, p. 11].

Per coloro che conoscono la Guida galattica per gli autostoppisti, può
essere divertente notare che le cifre 042 si trovano al cinquemùiardesimo
posto dello sviluppo decimale di ir e di —, il che fornisce un’eccellente
TT
risposta alla Domanda fondamentale: «Che cos’è quarantadue?» Più intel­
lettuale, infine, è la presenza di tt nel romanzo di Umberto Eco, Il pendolo
di Foucault.

2. Presentazione di pi greco.

Il nostro personaggio principale,


'it = 3,14159265358979323...
viene tradizionalmente definito in termini dell’area o del perimetro del cerchio
unitario. Il simbolo -tt fu introdotto da William Jones nel 1737, al posto di p o
altri analoghi, e si diffuse grazie a Leonhard Euler, al quale dobbiamo gran parte
delle notazioni attualmente usate in matematica. Una definizione moderna, più
formale, di -ir fa uso del primo zero positivo del seno, definito come serie di po­
tenze. Le prime mille cifre decimali di pi greco sono riportate nella tabella 1.
Nonostante quello che si è detto per molto tempo, ir non è uguale a
22 22
— (cfr. § 16.1). Naturalmente — è una delle prime approssimazioni di tt in
frazione continua. I primi sei convergenti sono
22 333 355 103993 104348
’ 7 ’ 106 ’ 113’ 33102 ’ 33215 '
I convergenti sono necessariamente buone approssimazioni razionali per tt.
II sesto differisce da tt solo di 3,31 IO-10. La corrispondente frazione conti­
nua semplice inizia cosi:
tt = [3 ,7 ,1 5 , 1 ,2 9 2 ,1 ,1 ,1 ,2 ,1 ,3 ,1 ,1 4 ,2 ,1 ,1 ,2 ,2 ,2 ,2 ,1 ,8 4 ,2 ,1 ,1 ,...] ,
facendo uso della notazione concisa standard. Non si è ancora compresa
appieno la struttura di questa frazione continua. Si faccia il confronto con
quella di e, che inizia nel seguente modo:
252 Jonathan M. Borwein

c = [2 ,1 ,2 ,1 ,1 ,4 ,1 ,1 ,6 ,1 ,1 ,8 ,1 ,1 ,1 0 ,1 ,1 ,1 2 ,1 ,1 ,1 4 ,1 ,1 ,1 6 ,1 ,1 ,1 8 ,...].
Osservando la sua struttura si vede che e non è un irrazionale quadratico,
dal momento che tali numeri hanno frazioni continue periodiche da un certe
punto in poi.
La famosa approssimazione di Archimede di cui discuteremo in seguito
è la seguente:

(1) 3 + 7T < ,r < 3 + S - .


La figura 1 mostra questa stima in maniera grafica: le diverse cifre deci­
mali vengono rappresentate con diverse sfumature; si può apprezzare una
. . . . 22 .223
certa regolarità in — , meno ovviamente in -y j-, per niente in ir.

3. Linfanzia di pi greco.

Quattromila anni fa, i Babilonesi facevano uso dell’approssimazione


3 + - = 3,125. Successivamente, o prima secondo antichi papiri, gli Egiziani
8
ritenevano che un cerchio con diametro nove avesse la stessa area di un
quadrato di lato otto, il che implica ir = = 3,1604— Alcuni hanno so­

stenuto che gli Ebrei si accontentassero di tt = 3: «Fece un bacino di metallo


fuso di dieci cubiti da un orlo all’altro, rotondo; la sua altezza era di cinque
cubiti e la sua circonferenza di trenta cubiti» (I Re, 7, 23; si veda anche
2 Cronache, 4,2).

Tabella 1.
1001 cifre decimali di ir.

3.1415926535897932)8462643)832795028841971693993751058209749445923078164062
86208998628034825)421170679821480865132823066470938446095505822317253594081
284811174502841027019)85211055596446229489549303819644288109756659334461284
756482)378678)16527120190914564856692)4603486104543266482133936072602491412
737245870066063155881748815209209628292540917153643678925903600113305305488
204665213841469519415116094 ) )057270)657595919530921861173819326117931051185
480744623799627495673518857527248912279381830119491298336733624406566430860
21394946)952247 )7 19070217986094)7027705)921717629) 1767523846748184676694051
320005681271452635608277857713427577896091736371787214684409012249534301465
495853710507922796892589235420199561121290219608640344181598136297747713099
605187072113499999983729780499510597317328160963185950244594553469083026425
223082533446850352619311881710100031378387528865875332083814206171776691473
035982534904287554687311595628638823537875937519577818577805321712268066130
0192787661119590921642019893
La vita di pi greco 253

Si dovrebbe comunque sapere che il cubito era una misura personale


non universale. A difesa ulteriore dell’ebraismo ricordiamo che, secondo
l’interpretazione di Langermann [1996, p. 165], il grande filosofo Maimo-
nide (1135-1204) accenna abbastanza chiaramente all’irrazionalità di pi nel
suo commento alla Mishnah:
Tu devi sapere ch c il rapporto del diametro del cerchio alla sua circonferenza è
ignoto, né sarà mai possibile esprim erlo precisamente. Questo non è dovuto a una
qualche m ancanza di conoscenza da parte nostra, com e pensa chi è ignorante. Invece,
questa m ateria è ignota per sua natura, e la sua scoperta non sarà mai raggiunta.

In tutti e tre i casi l’interesse delle varie civiltà nei confronti di tr era do­
vuto principalmente alle necessità pratiche dell’ingegneria, dell’astronomia,
del governo delle acque o di settori analoghi. Nel caso dei Greci, invece,
cosi come nel caso degli Indiani, l’interesse era principalmente di carattere
metafisico e geometrico.

3.1. Il m e to d o di A rch im ed e.

Il primo calcolo matematicamente rigoroso di tt è dovuto ad Archime­


de, che fece uso di un brillante schema basato sul raddoppio dei poligoni
inscritti e circoscritti
6 h-> 12 i-> 24 (-> 48 (-> 96
e sul calcolo dei perimetri relativi, fino a ottenere le approssimazioni
3 + y ^ < 'i r < 3 + ~ che abbiamo ricordatosopra.il caso con esagoni e dode­
cagoni è mostrato nella figura 2; per n = 48 si «vedono» già delle figure che
sono quasi dei cerchi. Senza dubbio nessuna matematica raggiunse nuova­
mente questo livello di rigore fino al xix secolo.

F ig u r a i.
Una dimostrazione visiva del risultalo di Archimede: ----- < tt < — .
71 7

■■1
■ ■ ■ ■■■■ ■ ■■ ■
!■■■ ■ ■ ■a ■ ■■
■ m ■ ■■ ■
■ ■■■ mm m mm m
■■ ■■ mm m mm
m m mm m mm m
m mm m mm m
mm ■ mm m mm
■ m mis m
254 Jonathan M. Borwein

Il metodo di Archimede rappresenta il primo vero algoritmo per ir, nel


senso che è in grado di produrre un valore arbitrariamente preciso. Rappre­
senta anche la nascita dell’analisi numerica e dell'analisi dell'errore, e tutto
ciò senza notazione posizionale e senza trigonometria moderna. Come si è
scoperto in maniera indipendente nel x ix secolo, questo procedimento può
essere formulato attraverso una successione ricorsiva semplice e numerica-
mente stabile, nel modo seguente [Borwein e Borwein 1987].

Iterazione archimedea della media (Pfaff-Borchardt-Schwab). Si pren­


dano a0 = 2 -Jl e b 0 = 3 quali valori del perimetro dell’esagono circoscritto
e inscritto. Quindi si definisca

(2) (H> <G >-


an n
Questa successione converge a ir, con un errore che si riduce di un fattore
quattro a ogni iterazione. In questo caso è facile fare una stima dell’errore;
calcolare quanto viene il limite è un po’ più difficile, ma ancora ragionevol­
mente semplice [Borwein e Bailey 2004; Borwein e Borwein 1987].

La base di tutti i procedimenti per ricavare approssimazioni di ir con


grande precisione, per i successivi 1800 anni, fu sempre rappresentata dal
metodo geometrico di Archimede o da sue variazioni - nessuna «data di sca­
denza». Per esempio, nella Cina del v secolo d.C. Tsu C h ’ung-Chih fece uso
di una variante di questo metodo per ottenere un valore di ir corretto fino

Figura 2 .
Il metodo di calcolo di Archimede per ir con esagoni e dodecagoni.
La vita di pi greco 255

alla settima cifra decimale. Un millennio più tardi, a Samarcanda, al-KàshT,


«colui che calcola come le aquile volano», ottenne una stima di 2tt in base
sessagesimale, usando poligoni di 3 •228 lati:

6 ^+ ----
2-17 ~ / 1 6- +
^ ----
5 9- H
a--------
. 28 H 0 17 H
.i.------- .i.------
3 4- H
.i.------
5 1- H
.i.------
4 6- H
.i.------
1 4r H
^------
5 0-,
60 60 60 60 60 606 607 608 609
un’approssimazione esatta fino alla sedicesima cifra decimale. È la mia ap­
prossimazione preferita; averla inserita nel mio computer secoli dopo e aver
ottenuto la risposta prevista mi ha fatto venire la pelle d’oca.

4. Approssimazioni di tt prima del calcolo infinitesimale.

Nelle tabelle 2,3 e 4 presentiamo la cronaca dei principali record di calcolo


conseguiti nei periodi indicati, limitandoci a commentare solo alcuni singoli
casi fuori dall’ordinario. Ben pochi progressi si riscontrarono in Europa du­
rante i «secoli bui», ma un miglioramento significativo si ebbe in India attorno
al 450 d.C. con l’introduzione della moderna aritmetica posizionale decimale,
basata sullo zero. Questo sistema, noto come sistema indo-arabico, permise
un grande sviluppo, in generale dell’aritmetica e, in particolare, del calcolo di
n e giunse in Europa attorno al Mille con gli Arabi. L’introduzione di questi
nuovi numeri incontrò alcune resistenze: da parte dei contabili, che temevano
di perdere il loro lavoro, e del clero, che considerava il sistema «diabolico»
ritenendo, erroneamente, che fosse di origine islamica. Il mondo commerciale
europeo riuscì a resistere alla novità fino al xvm secolo, ma anche nei circoli
scientifici l’uso dei nuovi numeri, fino al xvn secolo, fu piuttosto limitato.
Le difficoltà che si riscontravano nell’aritmetica prima di questa innova­
zione sono ben rappresentate dal seguente consiglio, dato a un ricco mer­
cante tedesco del xv secolo, a proposito della scelta dell’università da far
frequentare al figlio:
Un ricco mercante tedesco, desiderando fornire al proprio figlio una buona edu­
cazione com m erciale, si rivolse a un uomo colto per avere informazioni sull’istitu­
zione europea che offriva la migliore istruzione. «Se vuoi solamente che tuo figlio sia
in grado di affrontare addizioni c sottrazioni,» rispose l’esperto, «allora può andar
bene qualsiasi università francese o tedesca. Ma se invece hai intenzione che tuo figlio
giunga fino alla moltiplicazione e alla divisione - se ha capacità sufficienti - allora
devi mandarlo in Italia» (George Ifrah, in Borwein e Bailey [2004]).

Claude Shannon (1916-2001) possedeva un calcolatore meccanico, ironi­


camente chiamato Throback 1 (cioè, «ritorno al passato 1»), costruito presso
i Laboratori Bell nel 1953, per fare i calcoli utilizzando i numeri romani,
allo scopo di dimostrare che è possibile in pratica fare i calcoli con le cifre
romane!
256 Jonathan M. Borwein

L’ultimo grande calcolo di t t con il metodo di Archimede fu pubblicato


postumo ed è dovuto a Ludolph Van Ceulen (1540-1610), che fece uso di
2^-goni, ottenendo 39 cifre decimali, di cui 35 corrette. Il numero in alcune
parti d’Europa viene ancora oggi chiamato «numero di Ludolph» e fu inciso
sulla sua lapide. Questa lapide spari secoli fa, ma è stata ricostruita recente­
mente, in parte sulla base delle descrizioni rimaste (figura 3). È stata nuo­
vamente consacrata il 5 luglio del 2000 alla presenza dei reali olandesi. Van
Ceulen, un matematico molto valido, scopri anche il teorema del coseno.

5. Ladolescenza di pi greco.

L’alba della matematica moderna si manifesta con il «prodotto di Viète»


(1579) ______ ____ _____
2 _ yfì ^2 + \2 + V2 + yfl
tt 2 2 2

che viene considerato il primo prodotto realmente infinito, e con la «prima


2
frazione continua infinita» per — fornita da Lord William Broun cker (1620-
TT

1684), primo presidente della Royal Society di Londra:

1+
2 H------- — —
2 + 49
2 +

Tabella 2.
Approssimazioni di ir prima del calcolo infinitesimale.

Nome Anno C ifre

Babilonesi 2 0 0 0 ? a.C.
Egiziani 2 0 0 0 ? a.C.
Ebrei (! Re, 7 ,2 3 ) 5 50? a.C.
Archimede 2 5 0 ? a.C.
Tolomeo 150
Liu Hui 263
Tsu Ch'ung Chih 480?
al KàshT 1429 14
Adriano Romano 1593 15
Van Ceulen 1615 35
La vita di pi greco 257

Quest’ultimo risultato si basava sul prodotto «interpolato» in maniera


brillante da John Wallis (1616-1703, uno dei pochi matematici che Newton
rispettava e un prodigio nel fare i calcoli)
Ak2 - 1 2

che portò alla scoperta della funzione Gamma (cfr. § 16.2), e a molto di
più.
Ci si può fare un’idea degli scritti di Francois Viète (1540-1603) leggendo
la seguente citazione dalla sua opera:

Figura 3.
La lapide ricostruita di Ludolph Van Ceulen, a Leida.

>\ Ais
r>t VIIIHH.LIYNIS

«SDLN OMI . WP MI I KIHRA15 3


1 v’ 5597932 3 R4£l2ìi4 3 3 8 3 2 Ì8 8 Ì xi
% é ó o ó ó ^ K XK)00(^WOOÒÒOU^
eN M 1 N D F R A IS

^ggoèSaxxxxxxxxwòòòòo^
^ a I K A L S DC M 1D D E L L Y N K

X X XXMX MXX XX U XJO O O n tfS


238 Jonathan M. Borwein

L’aritmetica è una scienza quanto la geom etria. Le grandezze razionali sono in­
dicate con numeri razionali in maniera opportuna e quelle irrazionali con numeri
irrazionali. Se qualcuno misura delle grandezze con dei numeri c poi dai suoi calcoli
ricava che sono diverse da quanto sono in realtà, la colpa non è del calcolo ma di chi
10 ha effettuato.
Piuttosto, afferma Proclo, « l’aritmetica è più esatta della g eom etria». Per un
calcolatore accurato, se il diametro è posto uguale a una unità, la circonferenza del
dodecagono inscritto sarà il lato del binomio [cioè la radice qu adrata della differen­
za] 72 - 7 3 8 8 8 . Chiunque affermi che viene un qualsiasi altro risultato si sbaglia, o
11 geometra nelle sue misure o il calcolatore nei suoi numeri*.

L’equazione (3) può essere ottenuta dalla formula per tt in forma di


prodotto di Eulero, fornita qui sotto nella (4), ponendo x = - , oppure
TT 2
integrando ripetutamente 2 sin2"(/)d/ per parti. Si può divinare la (4),

proprio come fece Eulero, considerando sin (ir*) conte un polinomio «in-
finito», ottenendo così un prodotto in termini delle radici escluso lo 0,

|-^|w = ± l , ± 2 , ...J . Di conseguenza è plausibile che

(4 )
* «-1 V n
Eulero, ben conscio che si trattava di un’argomentazione di carattere
euristico, dedusse che, esattamente come nel caso dei polinomi, cera il valore
in zero, cioè uno, e che il coefficiente di x2 nella serie di Taylor era uguale
alla somma delle radici. Quindi, fu in grado di ricavare i coefficienti per
determinare il valore della funzione zeta calcolata in due:

{(2, = ? 7 = T - t
Questo porta anche a] calcolo di ((2 n) = V , —- come un multiplo ra­
zionale di ir2’ : ^ * - 1 * 2.

in termini dei «numeri di Bernoulli», essendo

— ----------T b -
expW-l Xd ’

4Citato in Bcrggrcn, Borwein c Borwein [2004], p. 759.


La vita di pi greco 259

una funzione generatrice per i /3„, i quali risultano necessariamente razionali.


La formula esplicita7 che risolse il cosiddetto «problema di Basilea» posto
dai Bernoulli è ,

Molto meno si sa a proposito di £ calcolata in valori interi dispari, anche se


quasi sicuramente non si tratta di multipli razionali di potenze di tt. Più di due
secoli dopo, nel 1976, Roger Apéry dimostrò che £(3) è irrazionale*, e adesso
possiamo anche dimostrare che almeno uno tra £(5), £(7), £(9) e £(11) e irrazio­
nale, anche se non siamo in grado di sapere con sicurezza quale. Si ritiene molto
probabile che tutti i valori sugli interi positivi siano irrazionali. Anche se non
è importante per la nostra storia, vale la pena ricordare che gli studi di Eulero
sulla funzione zeta avrebbero condotto alla famosa ipotesi dii Riemann*.

6. La vita adulta di p i greco e il calcolo infinitesimale.

Verso la fine del xvn secolo, Newton e Leibniz fondarono il calcolo infini­
tesimale, e questo potente strumento venne subito utilizzato per scoprire nuo­
ve formule per tt. Una delle prime formule si ottiene dal seguente integrale:

arctan x - f * —
J o 1 + t2 -
v) 5 v7 9
(1 - t 2 + t 4 - t 6 + - ) d / = x - — + — + — + -------- .
-1 o 3 5 7 9

Sostituendo per x = 1 si dimostra in maniera formale la famosa «formula


di Gregory-Leibniz» ( 1 6 7 1 - 7 4 ) :

(5, Z = 1 - L + > - i + . L - ± + ....


4 3 5 7 9 11
James Gregory, o più propriamente Gregorie ( 1 6 3 8 - 1 6 7 5 ) , fu il più im­
portante di una numerosa famiglia scozzese di matematici. Il punto x = 1,
però, è l’estremo dell’intervallo di convergenza della serie. Per giustificare
ia sostituzione, quindi, è richiesta un’attenta stima dell’errore per il resto o il
teorema della convergenza monotona di Lebesgue, ecc., ma la maggior parte
dei testi introduttivi ignorano questo punto.

7A questo proposito si può vedere anche H. Tsumura, in «The American Mathematical Mon-
thly», maggio 2004, pp. 430-31.
' Cfr. Bcrggrcn, Borwein c Borwein [2004], p. 439; Borwein e Borwein [1987].
[N J c V eda sa®*'° Conrc* Vipotesi di Riemann, In questo stesso volume, pp. 383*426.
260 Jonathan M. Borwein

6.1. Una cu riosa anom alia nella serie di G re g o ry .

Nel 1988, venne notato che la serie di Gregory per t t ,

f a 2k - 1 t 3 5 7 9 11
troncata dopo cinque milioni di termini, differiva dal vero valore di tt in una
maniera strana:
3.14159245358979323846464338327950278419716939938730582097494182230781640...
3.14159265358979323846264338327950288419716939937510582097494459230781640...
2 -2 10 -1 2 2 2770

I valori differiscono come ci si aspetterebbe per una serie a segni alterni,


alla settima cifra c’è un «4» che dovrebbe essere un «6». Ma le tredici cifre
successive sono corrette e dopo un altro salto, altre 12 cifre esatte. Delle
prime quarantasei cifre, solo quattro sono diverse dalle cifre corrispondenti
di tt . Ma c’è di più, le cifre «sbagliate» si ripetono con un periodo di quat­
tordici, come si può vedere sopra. Un comportamento così strano esige una
spiegazione. Un buon posto per cominciare è il tool per il riconoscimento
delle sequenze di interi di Neil Sloane, disponibile su internet aH’indirizzo
www.research.att.com/~njas/sequences. Senza alcun problema individua la
sequenza degli errori come il doppio dei «numeri di Eulero». I numeri di
Eulero di ordine pari sono generati da

- S , — 5 « 5 —

I primi sono 1 ,-1 , 5 ,-6 1 ,1 3 8 5 ,-5 0 5 2 1 ,2 702 765. Questa scoperta ha


portato alla seguente espansione asintotica:
N/2 / |\jt + 1 x p

(7) - - 27 « 7
2 £ r ,2 A - l £ oN2" +i

A questo punto l’origine dell’anomalia è chiara: il caso ha voluto che la


serie venisse troncata al 5 000 000-esimo termine - esattamente a metà di
una potenza di dieci abbastanza grande. In effetti, ponendo N = 10 000 000
nell’equazione (7) si vede che all’incirca le prime cento cifre della serie tron­
cata sono piccole perturbazioni dell’espansione decimale corretta di tt . E le
espansioni asintotiche appaiono sullo schermo del computer, come abbiamo
visto prima. Su un computer esadecimale con N = 167 le stringhe corrispon­
denti sono:
La vita di pi greco 261

3.2 4 3 F 6 A 8 8 8 5 A 3 0 8 D 3 1 3 1 9 8 A 2 E 0 3 7 0 7 3 4 4 A 4 0 9 J8 2 2 2 9 9 F 3 1 D 0 0 8 2 E F A 9 8 E C 4 E 6 C 89 4 5 2 8 2 1 E ...
3 2 4 3 F 6 A 6 8 8 5 A 3 0 8 D 3 1 3 19A A 2E 03707344A 3693822299F31D 7A 82E FA 98E C 4D B F69452821E ...
2 -2 A -7 A 2AD2

dove la prima riga è il valore corretto di t t . In esadecimale o hex si usano «A,


B , F » per scrivere i numeri da 10 a 15 come singole «cifre esadecimali».
Fenomeni simili accadono per altre costanti [Berggren, Borwein e Borwein
2004]. Inoltre, conoscere l’espressione degli errori significa poterli correg­
gere e quindi fare uso della (7) per rendere la formula di Gregory utilizzabile
per il calcolo, nonostante quanto diremo nel prossimo paragrafo.

7. Le approssimazioni di t t nell’epoca del calcolo infinitesimale.

Usata in maniera ingenua, la meravigliosa formula (5) è inutilizzabile da


un punto di vista computazionale - converge cosi lentamente che sono ne­
cessari centinaia di termini per calcolare due cifre. Abraham Sharp, sotto la

direzione di Edmond Halley10 (cfr. tabella 3), in realtà adoperò arctan-U


che converge in maniera geometrica.
Inoltre, l’identità trigonometrica di Eulero (1738)

(8) arctan 1 = arctan — + arctan -


2 3
fornisce una serie razionale con convergenza geometrica

" L'astronomo e matematico cui si deve la costruzione dell’osservatorio di Greenwich e che


diede il proprio nome alla cometa.

Tabella 3.
Approssimazioni di ir con metodi basati sul calcolo infinitesimale.

Nome Anno Cifre corrette

Sharp (e Halley) 1699 71


Machin 1706 100
Strassnitzky e Dase 1844 2 00
Rutherford 1853 440
Shanks 1874 (7 0 7 )5 2 7
Ferguson (Calcolatore) 1945 808
Reitwiesner e altri ( e n ia c ) 1949 2037
Gcnuys 1958 10000
Shanks e Wrench 1961 1002 6 5
Guilloud e Bouyer 1973 1 001 2 5 0
262 Jonathan M. Borwein

(9)* = * - - L .+ 1 + + 1 1 1
4 2 3 •2} 5 •25 7 •27 3 3 •3} 5 •35 7 •37
Una formula ancora più rapida, scoperta in precedenza da John Machin,
si trova facendo uso dell’identità
ir 1 1
(10) — = 4 arctan ——arctan .

Questa formula venne usata nel calcolo di molte approssimazioni per


riportate nella tabella 3, a partire dal 1706, per culminare con il famoso
tt ,

calcolo di tt con una precisione di 707 cifre decimali effettuato da William


Shanks nel 1874. Nel 1945 Donald Ferguson, nel corso dell’ultimo calcolo
effettuato con l’aiuto di una macchina addizionatrice, prima dell’era del
computer, scoprì che era sbagliato dopo la 527-esima cifra".

7.1. I ca lco li di N ew ton con l ’a rc o se n o .

Newton scopri una formula diversa e più efficiente - in realtà si trattava


di un arcoseno camuffato. Prese in considerazione l’area A della regione più
a sinistra nella figura 4. L’area A è l’integrale
ì

(11) u ,
J0
Ma A è anche l’area del settore circolare, — , meno l’area del triangolo,
V3 ^
— . Newton applicò il proprio «teorema del binomio», appena scoperto,

alla (11), ottenendo

A = \4 x w (l - x )U2 d * = [ V 2 ( l - - ...ì d x =
J o \ 2 8 16 12 8 J

= f 4 [ x^2 - ì dx.
} o { 2 8 16 128 )

Integrando termine a termine e combinando i due risultati precedenti,


si ha:

" Si tratta probabilmente del record di tempo trascorso prima di scoprire un errore in mate­
matica.
La vita di pi greco 263

1 1 1
5-32 7-128 9-512

Newton adoperò questa formula per calcolare 15 cifre di 'ir. Successiva­


mente ebbe a dichiarare: «Mi vergogno di dirti fino a quante cifre ho fatto que­
sti calcoli, non avendo a quel tempo altro da fare». Una cronologia standard
[Berggren, Borwein e Borwein 2004, p. 294] afferma che «è significativo che
Newton non abbia mai calcolato un valore per t t » . Caveat emptor è una mas-
sima che non devono dimenticare tutti coloro che usano fonti secondarie.

7.2. I l c a lc o la to r e v ien n ese.

Fino a pochi anni fa - attorno al 1950 - un «calcolatore» era una persona.


Il calcolatore Zacharias Dase (1824-1861) dimostrava la propria straordina­
ria capacità di calcolo, per esempio, moltiplicando
79 532 853 x 93 758 479 = 7 456 879 327 810 587
in 54 secondi; due numeri di venti cifre in sei minuti; due di quaranta cifre
in quaranta minuti; due numeri di cento cifre in otto ore e quarantacinque
minuti. Nel 1844, a partire dalla formula

— = arctan —+ arctan —+ arctan —


4 2 5 8

Figura 4.
Il metodo di Newton per il calcolo di ir.
264 Jon ath an M. Borwein

Dasc cnlcolò tt con 200 cifre a mente in due mesi, completando cosi, in
maniera corretta - a mio modo di vedere - il più grande calcolo mentale
di tutti i tempi. In seguito calcolò una tavola di logaritmi fino alla settima
cifra decimale e compilò una tavola di scomposizione in fattori primi fino
a 10 000 000. Gauss fece richiesta all’Accademia delle Scienze di Amburgo
di sostenere Dase nei suoi progetti, ma questi mori pochi anni dopo, nel
1861 (per quel tempo lo stesso Gauss era già morto da sei anni).
Una formula piacevole - dello stesso tipo di quella scoperta da M achin
di cui abbiamo scritto poco sopra (cioè che esprime pi greco come com­
binazione lineare di arcotangenti) - si deve al logico di Oxford Charles
Dodgson, meglio noto come Lewis Carroll, l’autore di Alice nel Paese
delle Meraviglie. Si tratta di un’identità valida quando 1 + p2 si fattorizza
come qr:
1 = arctan
arctan — 1
1- arctan------- . 1
P p +q P+r

8. L‘irrazionalità e la trascendenza di tt .

Una delle motivazioni per il calcolo di approssimazioni di tt molto vicina


allo spirito della moderna matematica sperimentale era costituita dal cercare
di determinare se l’espansione decimale di tt fosse periodica, poiché questo
avrebbe significato che tt si esprime come rapporto di due interi (cioè un
numero razionale), oppure di stabilire se tt fosse algebrico - cioè la radice
di un polinomio a coefficienti interi - e in seguito osservare la distribuzione
delle cifre. Il problema della razionalità di tt venne risolto verso la fine del
xvni secolo, quando Lambert e Legendre dimostrarono (usando le frazioni
continue) che si tratta di una costante irrazionale.
Se tt fosse algebrico o no venne appurato nel 1882, quando Lindemann
dimostrò che 'ir è trascendente. La dimostrazione di Lindemann chiuse
anche, una volta per tutte, l’antico problema, risalente ai Greci, della qua­
dratura del cerchio con riga e compasso. Si tratta di un problema insolubi­
le, dal momento che le lunghezze delle linee che possono essere costruite
con riga e compasso (rappresentate dai cosiddetti «numeri costruibili»)
sono necessariamente numeri algebrici, e quadrare il cerchio è equivalen­
te a costruire il valore 'ir. Forse il commediografo ateniese Aristofane era
già «a conoscenza» di questo risultato quando derise l’astronomo Metone
come colui che rende «il cerchio quadrato» nella commedia G li uccelli,
rappresentata nel 414 a.C.12. Analogamente, l’Académie frangaise smise
di accettare dimostrazioni delle tre famose costruzioni dell’antichità clas-

12Gli uccelli, 1005, in Aristofane, Commedie, Mondadori, Milano 2007, pp. 328-29.
La viu di pi greco 265

sica - quadratura del cerchio, duplicazione del cubo e trisezione dell’an­


g olo-secoli fa.
Diamo ora, per esteso, la dimostrazione del 1947 di Ivan Niven dell’ir-
razionalità di t t . Si tratta di una dimostrazione molto breve che ben illustra
gli ingredienti delle dimostrazioni successive e più difficili dell'irrazionalità
di altre costanti, in particolare della dimostrazione di Lindemann della
trascendenza di t t , basata su quella del 1873 di Hermite della trascendenza
di e.

Dimostrazione. Supponiamo che tt sia il quoziente di due interi positivi,


cioè * = T- Definiamo ipolinom i
, x"(a - bx)n
/(x) = ----------------,

F(x) = f( x ) - /,2,(x) + /,4,(x) - + (-1 r / ‘w (x);

specificheremo successivamente l'intero positivo n. Dal momento che n\f{x)


ha coefficienti interi e che i suoi termini in x hanno grado minimo n, /(x) e le
sue derivate/ ^ ( x ) assumono valori interi per x = 0 e anche per x = tt =>- ,

dal momento che f{ x ) = / ^ - x j. Usando gli elementi di base del calcolo


infinitesimale otteniamo

- 7 - { F ( x ) s in x - F (x )cosx } = F"(x)sinx + F(x)sinx = /(x)sinx


dx

(12) J o /(x)sinx dx = [F'(x)sinx - F(x)cosx]*

= F(ir) + FIO).

Ora, F(tt) + F(0) è un numero intero, poiché/ (t)(0) ef^Ktt) sono interi.
Ma per 0 < x < t t , ^^
0 < /(x)sinx < 17 — ,
n\
e quindi l'integrale nella (12) è «positivo ma arbitrariamente piccolo» per n
sufficientemente grande. La (12) è quindi falsa, e quindi lo è anche la nostra
assunzione che tt sia razionale.
266 Jonathan M. Borwein

8.1. M isure di irrazio n a lità .


Terminiamo questo paragrafo accennando alla questione delle «misure
di irrazionalità»,\ L’estremo inferiore |i(a) dei jjl > 0 tali che

per tutti gli interi p, q con q sufficientemente grande, è detto la «costante


di Liouville-Roth» per a e diciamo che abbiamo una misura di irrazionalità
p era se |i(a) <
Le misure di irrazionalità sono diffìcili. H teorema di Roth [Borwein e
Borwein 1987] implica che |i(a) = 2 per tutti gli irrazionali algebrici e per
quasi tutti i reali. Chiaramente |i(a) = 1 quando a è razionale e ji(a ) = oo

se e solo se a è un numero di Liouville, come, per esempio, V —^—r. È


10"’
noto che pi(e) = 2, mentre nel 1993 Hata ha dimostrato che (jl(tt) ^ 8,02.
Analogamente si sa che |jl(£(2)) ^ 5,45, |i(£(3)) ^ 4,8 e |x(log 2) ^ 3,9.
Una conseguenza dell’esistenza di una misura di irrazionalità |x per ir
i
è la possibilità di stimare quantità come limsup |sin(«) |» = 1 per interi »,

dal momento che per interi grandi w e « , con — -ir, abbiamo definiti­
vamente n

l iI = I sinlmir) - sin(«) Ii ^ -2 1i mn —n\>


iI sin(n) i — -—- .
2wp._i

9. Pi greco nell1era digitale.

Con lo sviluppo della tecnologia dei computer negli anni Cinquanta


del Novecento, -ir venne calcolato con migliaia e poi con milioni di cifre.
Il calcolo di queste approssimazioni fu molto facilitato dalla scoperta, nel
periodo immediatamente successivo, di algoritmi avanzati per effettuare le
operazioni aritmetiche di grande precisione necessarie per questi calcoli.
Per esempio, nel 1965 venne dimostrato che la «trasformata di Fourier
veloce» (fast Fourier transform, f f t ) [Borwein e Borwein 1987; Borwein
e Bailey 2004], appena scoperta, poteva essere adoperata per effettuare
moltiplicazioni con grande precisione in maniera più rapida di quanto non

11 Questi argomenti tono traiuti più in dettaglio nel saggio di F. Amoroso c C. Viola, Numeri
irrazionali e numeri trascendenti, m quoto stesso volume, pp. 217-48. [N.d.C. ].
La vita di pi greco 267

fosse possibile con il metodo tradizionale. Questo genere di metodi14 ab­


bassarono notevolmente il tempo necessario per calcolare approssimazioni
sempre migliori di tt e di altre costanti. Oggi siamo in grado di calcolare
valori algebrici di funzioni algebriche essenzialmente con la stessa velocità
con la quale possiamo effettuare le moltiplicazioni, Ob(M(N)), dove con
M(N) abbiamo indicato il costo della moltiplicazione e 0 B conta i bits o i
flops.
Nonostante tutti questi miglioramenti, negli anni Settanta i calcoli di tt
al computer facevano ancora uso di formule classiche, usualmente di tipo
Machin (cfr. tabella 3 ). Vedremo più avanti metodi che calcolano N cifre di
tt con complessità temporale Ob(M(N)) log 0 B(M(N)). La dimostrazione
che il termine logaritmico non si può evitare, come sembra altamente pro­
babile, fornirebbe una dimostrazione algoritmica che tt non è algebrico.

9.1. L ’ E l e c t r o n i c N u m e rica l In te g ra to r and C a lcu la to r


( e n ia c ).

Il primo calcolo di pi greco al computer venne effettuato su en ia c - un


dinosauro con un cervello minuscolo dal punto di vista odierno. L ’en ia c
venne costruito ad Aberdeen nel Maryland dairesercito americano: aveva
18 000 valvole, 6000 interruttori, 10000 condensatori, 70000 resistenze,
1500 relè; era alto tre metri e occupava poco meno di 170 metri quadrati,
per un peso totale di 30 tonnellate. Per quanto riguarda la velocità, un Pen­
tium da 1,5 GHz, già lento per i canoni attuali, fa 3 milioni di addizioni al
secondo: e n ia c ne faceva 5000, tre ordini di grandezza più veloce di qualsiasi
macchina precedente, e n ia c era anche il primo computer con una memoria:
poteva conservare 200 cifre. I dati scorrevano da un accumulatore a un altro,
e dopo che ciascun accumulatore terminava un calcolo, ne comunicava il
risultato a quello successivo nella fila. Gli accumulatori erano collegati l’uno
all’altro manualmente. Il calcolo di tt con e n ia c nel 1949, con 2037 cifre,
durò settanta ore, durante le quali gli output dovevano continuamente essere
reintrodotti come input.

9.2. L a s e r ie di B a lla n tin e per tt (1 9 3 9 ).

Un’altra formula di Eulero per l’arcotangente è la seguente:


~ (n\)2A" 1
= arctan — .
„_0 (2» + l)!(x2 + l)*

MPer esempio, si veda Borwein e Borwein [ 1987; 1988]; Borwein e Bailcy [2004] per la divisione
c l'estrazione di radice quadrata.
268 Jonathan M. Borwein

È interessante notare che questa permise a Jean Guilloud e Martine


Bouyer di riesprimere la formula che avevano usato nel 1973 per calcolare
un milione di cifre di pi greco, cioè
IT 1 1 _ 1
— = 12 arctan-----1- 8 arctan------ 5 arctan-------,
4 18 57 239
nelTeffìciente forma

ir = 8 6 4 V -------------------- + 1824 £ ------- --------------- — - 20arctan — ,


(2n + 1)!325 „=0 + 1 )!3250"+1 239
nella quale i termini della seconda serie, in questo caso, sono solamente
scostamenti decimali della prima.

9.3. Le serie e llittich e di R am an u jan .

Un genere veramente nuovo di formule espresse tramite serie infinite,


basate sulle approssimazioni di integrali ellittici, venne scoperto, attorno al
1910, da Srinivasa Ramanujan (1887-1920). Queste formule, tuttavia, rima­
sero poco note (né furono dimostrate completamente) fino a tempi recenti,
quando i suoi scritti furono pubblicati in maniera ampia”.
Una di queste serie è davvero notevole:
1 2V I y (4A)!(110? + 2 6 3 9 0 * )
n 9801 £ 0 (* !)43 9 6 u
Ciascun termine fomisce un risultato con otto cifre esatte in più. R. W.
Gosper utilizzò questa formula nel 1985 per calcolare 17 milioni di cifre di
ir e ìa sua approssimazione coincise per molti milioni di cifre con i calcoli
precedenti; questo concluse la prima dimostrazione della (13), come viene
raccontato in Borwein, Borwein e Bailey [1996]. In realtà, Gosper per prima
cosa calcolò la frazione continua semplice per tt, sperando di scoprire qual­
cosa di nuovo nella sua espansione, senza tuttavia trovare niente.
Più o meno nello stesso periodo, David e Gregory Chudnovsky scopri­
rono la seguente variazione razionale alla formula di Ramanujan. Questa
formula esiste dal momento che yf- 163 corrisponde a un campo quadratico
immaginario con numero delle classi uno16:

” Le formule basate sulle funzioni ellittiche sono descritte dettagliatamente in Berggren,


Borwein e Borwein [2004]; Borwein e Borwein [ 19871; Borwein e Bailey [2004].
u Sulla nozione di numero delle classi si veda A. Granville, Il teoremafondamentale dell'aritme­
tica, in questo stesso volume, pp. 131-66. [N.d.C.].
La vita di pi greco 269

1 = 2y (-1)*(6*)!(13 591 409 + 545 140 134/;)


ir “ 1 p'o (3/r)!(*!), 640 320J*+V2

Ciascun termine di questa serie fornisce 14 cifre esatte in più. I Chud-


novsky implementarono questa formula con un metodo intelligente che
permise loro di usare i risultati di un primo livello iniziale di precisione per
estendere il calcolo a una precisione ancora più alta. Fecero uso di questo
metodo in numerosi calcoli di tt , di dimensioni molto grandi, culminando
con quello che per allora, il 1994, era un record: oltre quattro miliardi di
cifre. La loro straordinaria storia è stata narrata in maniera avvincente da
Richard Preston in un articolo sul «New Yorker» dal titolo The mountains
ofPi (2 marzo 1992).
Se da una parte le serie di Ramanujan e dei Chudnovsky sono in pratica
più efficienti delle formule classiche, dall’altra hanno entrambe la proprietà
che il numero di termini necessari cresce in maniera lineare con U numero
delle cifre desiderate: se vuoi calcolare il doppio delle cifre di tt, devi calcolare
il doppio di termini delle serie.
A questo proposito, possiamo aggiungere che la serie di tipo Rama­
nujan

Tabella 4.
Approssimazioni di ir con metodi successivi al calcolo infinitesimale.

Nome Anno Cifre corrette

Miyoshi e Kanada 1981 2 000036


Kanada-Yoshino-Tamura 1982 16777206
Gosper 1985 17 526200
Bailcy genn.1986 29360111
Kanada e Tamura sett. 1986 33 554 414
Kanada e Tamura ott. 1986 67 108839
Kanada e altri genn.1987 134217 700
Kanada c Tamura genn. 1988 201326551
Fratelli Chudnovsky maggio 1989 480000000
Kanada e Tamura luglio 1989 536870898
Kanada c Tamura nov. 1989 1073 741799
Fratelli Chudnovsky ago. 1991 2 260000000
Fratelli Chudnovsky maggio 1994 4044 000 000
Kanada e Takahashi ott. 1995 6442450 938
Kanada e Takahashi luglio 1997 51539600000
Kanada e Takahashi sett. 1999 206 158430000
Kanada-Ushiro-Kuroda die. 2002 1241 100000000
270 Jonathan M. Borwein

(14) i = j ( L J V ig ili.
* S i 16" I 16

permette di calcolare la miliardesima cifra di — , senza calcolare la prima


TT
metà della serie: un assaggio della nostra prossima discussione delle formule
Borwein-Bailey-Plouffe (o b b p ).

10. Algoritmi a complessità operazionale ridotta.

Nel 1976, indipendentemente, Eugene Salamin e Richard Brent scopri­


rono un algoritmo a complessità ridotta per calcolare t t , basato sull’iterazio­
ne della media aritmetico-geometrica [arithmetic-geometric mean iteration,
agm ) e su altre idee elaborate da Gauss e da Legendre attorno a l 1800, anche
se Gauss - e come lui molti altri successivamente - non si rese mai conto del
collegamento con il calcolo effettivo di ir.

Algoritmo quadratico (Salamin-Brent). Siano a0 = 1, b0 = -j= e


&
2

( 15) M) bt = (G)

(16) ck = t \ - b \ , * * - * * . . - 2 kck e p* = ^ .
Sk
Allora p. converge in maniera quadratica a t t . Si noti la somiglianza fra
l’iterazione della media aritmetico-geometrica (15), che per valori iniziali ge­
nerali converge velocemente a un limite non elementare, e l’iterazione della
media armonico-geometrica (2), praticamente inutilizzabile - che in generale
converge lentamente a un limite elementare. Quest’ultima è un’iterazione
aritmetico-geometrica dei reciproci [Borwein e Borwein 1987].
Ciascuna iterazione raddoppia le cifre corrette. Iterazioni successive pro­
ducono 1,4,9,20,42,85,173,347 e 697 cifre decimali di t t esatte, e ci voglio­
no log N operazioni per N cifre. Venticinque iterazioni calcolano tt con una
precisione di oltre 45 milioni di cifre decimali. Uno svantaggio è costituito
dal fatto che ogni iterazione dev’essere fatta con la stessa precisione richiesta
per il risultato finale. Nel 1985, mio fratello Peter e io scoprimmo alcune
famiglie di algoritmi di questo genere.
La vita di pi greco 271

Algoritmo cubico. Siano a0 = e sQ = ^ ~ • Si iterino

_ ______ \______ _ rk +1 ~ 1 _ 2 ,* ,2 ,v
1 + 2(1 - j 3)173 ’ 2 * +1 * +1 * *

Allora — converge in maniera cubica a tt. Ciascuna iterazione triplica il nu-


*k
mero di cifre corrette.

y<>
Algoritmo di ordine quattro. Siano aQ= 6 - 4>/Ì e yn = >/Ì - 1. Si
itenno

l + ( l - 7yt)
Ì)“

Allora — converge con ordine quattro a tt. Notiamo che, in entrambi gli
ak
algoritmi, solo le potenze di 2 o 3 usate in ak dipendono da k.

Tabella 5.
Espedienti mnemonici per ricordare pi greco.

Esistono numerose filastrocche per ricordare le cifre di pi greco, anche molto più lunghe degli
esempi riportati qui. Una buona selezione si trova in Berggren, Borwein e Borwein [2004],
pp. 405,560,6 5 9 .

Now I, evert I, would celebrate


In rhyme inapt, thè great
Immortai Syracusan, rivaled nevermore,
Who in bis wondrous lore,
Passed on before
Left men for guidatice
How to circles mensurate.
Now I want a drink, alcoholic o f course, after thè heavy lectures involving quantum mechanics!
Ave o Roma, o Madre gagliarda di latine virtù che tanto luminoso splendore prodiga spargesti
con la tua saggezza. Che n‘ebbe d’utile Archimede da ustori vetri sua somma scoperta? (tratta da
I. Ghersi, Matematica dilettevole e curiosa, Hoepli, Milano 1972,4a ed.).
272 Jonathan M. Borwein

10.1. F ilo so fia della m atem atica.


Nel 1997 venne trovata la prima occorrenza della sequenza 0123456789
(più tardi di quanto ci si attendesse euristicamente) nell’espansione decimale
di tt , che inizia alla 17 387 594 880-esima cifra dopo la virgola. Di conseguen­
za è cambiato lo status di molti e famosi «esempi intuizionistici» dovuti a
Brouwer e Heyting. Si tratta di esempi che mettono in dubbio il «principio
del terzo escluso» - una proposizione o è vera o è falsa - e coinvolgono
oggetti che, da un punto di vista classico, vengono considerati ben definiti,
mentre per un intuizionista non hanno solidi fondamenti fino a quando non
si stabilisce se e quando la sequenza si presenta [Borwein 1998].
Per esempio, consideriamo la successione costituita da tutti «0», tran­
ne un «1» nella posizione in cui, nello sviluppo di -ir, inizia la sequenza
0123456789 in quest’ordine, per la prima volta, sempre che questo si veri­
fichi. Era una successione convergente quando Brouwer la usò come esem­
pio? È convergente oggi? Era ben definita allora? Lo è oggi? Dal punto di
vista classico è sempre stata ben definita e convergente a 0. Dal punto di vista
intuizionistico converge solo ora. Che cosa succede se ridefiniamo la suc­
cessione nel modo seguente: ha il suo «1» nella posizione in cui la sequenza
0123456789101112 inizia per la prima volta?

11. Ritomo al futuro.

Nel dicembre del 2002, Yasumasa Kanada calcolò tt con oltre 1,24 bi­
lioni dii cifre. Il suo gruppo per prima cosa calcolò -tt in esadecimale (base
16) fino a 1 030 700000000 di cifre, tramite le due seguenti relazioni di
arcotangenti:

ir = 48 arctan — + 128 arctan —— 20 arctan —— + 48 arctan----------


49 57 239 110 443

ir = 176 arctan — + 28 arctan —----- 48 arctan — + 96 arctan — — - .


57 239 682 12 943

La prima formula venne scoperta nel 1982 da K. Takano, un insegnante di


scuola superiore e compositore di canzoni. La seconda da E C. W. Stórmer
nel 18%. Kanada verificò che i risultati di queste due formule erano uguali e
quindi convertf la sequenza esadecimale in base dieci. L’espansione decima­
le risultante venne nuovamente controllata riconvertendola in esadecimale.
Queste conversioni di per sé non sono banali e richiedono calcoli molto
lunghi.
La vita di pi greco 273

Si tratta di un processo decisamente differente da quelli del quarto di se­


colo precedente. La prima ragione è che gli algoritmi a complessità operazio­
nale ridotta richiedono l’esecuzione completa di moltiplicazioni, divisioni ed
estrazioni di radice quadrata che a loro volta necessitano di operazioni f f t su
larga scala, con impiego di immense quantità di memoria e di massicce co­
municazioni fra tutti i nodi di un grande sistema parallelo. Per quest’ultimo
calcolo perfino l’enorme sistema disponibile a Tokyo non aveva né memoria
né banda sufficientemente ampie per compiere queste operazioni con livelli
di efficienza ragionevoli - almeno non nel caso di calcoli con bilioni di cifre.
Utilizzare nuovamente formule basate sulle arcotangenti significava fare uso
di molte più operazioni aritmetiche, ma poter fare a meno di f f t a livello del­
l’intero sistema; il metodo, inoltre, poteva essere implementato utilizzando
moltiplicazioni e divisioni con valori interi più piccoli e lavorando in base
sedici si guadagnava ancora un po’ di efficienza!
Kanada e il suo gruppo calcolarono queste formule usando uno schema
analogo a quello utilizzato da Gosper e dai Chudnovsky nei loro calcoli con
le serie, e furono in grado di evitare di memorizzare in maniera esplicita
i numeri in precisione multipla coinvolti. Questo produsse un metodo di
calcolo grosso modo competitivo, per efficienza numerica, con gli algoritmi
di ordine quattro di Salamin-Brent e di Borwein adoperati in precedenza,
ma con una significativa diminuzione della memoria totale utilizzata. Ka­
nada fece uso di un sistema con 1 Terabyte di memoria principale, come
nel calcolo precedente, ma ottenne un numero di cifre sei volte maggiore.
Il calcolo durò 600 ore su un Hitachi a 64 nodi, compresi i calcoli esade-
cimali e decimali, con la parte principale del programma che lavorava a
velocità sostenuta, pari a 1 Teraflop, cioè IO12 (un bilione) di operazioni
al secondo.

12. Perché p i greco?

Quali motivazioni vi possono essere dietro ai moderni calcoli di t t , dato


che problemi quali la sua irrazionalità e la sua trascendenza sono stati risolti
più di cento anni fa? Una motivazione è rappresentata dalla semplice sfida
di riuscire a imbrigliare l’incredibile potenza dei computer moderni. L’im-
plementazione di calcoli di questo genere non è affatto banale, soprattutto
su sistemi con grandi memorie distribuite.
I vari tentativi di migliorare l’approssimazione di pi greco hanno porta­
to in qualche caso a importanti applicazioni a livello pratico. Per esempio,
alcune nuove tecniche per il calcolo della trasformata di Fourier veloce, di
cui viene fatto un notevole uso nel calcolo scientifico e ingegneristico, hanno
avuto la loro origine nei tentativi di rendere più veloci i calcoli delle appros­
simazioni di t t . Questo genere di calcoli, inoltre, è sempre utile nella «prova
274 Jonathan M. Borwein

su strada» dei computer, e permette spesso di scoprire errori di hardware o


software altrimenti molto diffìcili da scovare.
Al di là di queste considerazioni di natura pratica, rimane il duraturo
interesse per la questione della normalità (cioè la casualità delle cifre) di
ir. Kanada, per esempio, ha compiuto una dettagliata analisi statistica dei
propri risultati, al fine di controllare se vi fosse qualche anomalia statistica
che potesse suggerire che ir non è normale: per sapere quanto «non» lo sia si
veda la tabella 5. In effetti, il primo calcolo di ir e di e sul calcolatore e n ia c ,
cui abbiamo accennato sopra, venne proprio motivato in questo modo da
John von Neumann. Le cifre di ir sono state studiate più di quelle di qual­
siasi altra costante, in parte a causa del profondo fascino che questo numero
esercita e della sua notorietà. Kanada riferisce che le dieci cifre decimali
che terminano nella bilionesima posizione sono 6680122702 e le dieci cifre
esadecimali 3F89341CD5.

12.1. C am biare la visione del m ondo.

In retrospettiva, possiamo domandarci per quale ragione nell’antichità

ir non venne misurato con una precisione maggiore di — . Forse questo ri­
flette non tanto un’incapacità a farlo ma piuttosto un diverso atteggiamento
mentale rispetto a quello sperimentale moderno —baconiano o popperiano.

Tabella 6.
Comportamento apparentemente casuale di ir in base 10 e 16.
Cifre decimali Occorrenze Cifre esadecimali Occorrenze

0 99999485134 0 62499881108
1 99999945664 1 62500212206
2 100000480057 2 62499924780
3 99999787805 3 62500188844
4 100000357857 4 62499807368
5 99999671008 5 62500007205
6 99999807503 6 62499925426
7 99999818723 7 62499878794
8 100000791469 8 62500216752
9 99999854780 9 62500120671
Totale 1000000000000 A 62500266095
B 62499955595
C 62500188610
D 62499613666
E 62499875079
F 62499937801
Totale 1000000000000
La vita di pi greco 275

Nello stesso spirito, possiamo dire che una ragione per la quale Gauss e
Ramanujan non svilupparono ulteriormente le idee presenti nelle loro identi­
tà per tt risiede probabilmente nel fatto che, a loro modo di vedere, i risultati
espliciti erano più soddisfacenti di un algoritmo iterativo (questo vale soprat­
tutto per Ramanujan). Ramanujan preferiva formule come le seguenti:

ir = -^== log (5280), J?— log (640 320) = tt

corrette fino alla nona e quindicesima cifra che dipendono entrambe da pro­
fondi concetti di teoria dei numeri. In ogni caso, in contrasto con quan­
to affermato finora, nel suo famoso articolo del 1914 Modular Équations
and Approximations to Pi [Berggren, Borwein e Borwein 2004, p. 253]
Ramanujan trovò che j
2 192 V
9 + -----
22 ) = 3,14159265258...

«empiricamente senza alcuna connessione con la teoria precedente». Solo la


cifra contrassegnata è sbagliata.

12.2. S c o p r ir e le ite r a z io n i di tt.

La genesi degli algoritmi per il calcolo di -ir e del materiale collegato è un


esempio che ben illustra la matematica sperimentale. Mio fratello e io negli
anni Ottanta avevamo a disposizione una famiglia di algoritmi quadratici per
ir [Borwein e Borwein 1987] - indichiamoli con VN- del tipo che abbiamo
visto sopra. Eravamo in grado di dimostrarne la correttezza solo per N = 1,
2 ,3 ,4 mentre per N = 5, 7 potevamo solo congetturarla. In ogni caso, sem­
brava che l ’algoritmo convergesse in maniera quadratica a ir. A una verifica
più precisa, mentre nei casi dimostrabili erano corrette 5000 cifre, nei casi
empirici le cifre esatte erano solo un centinaio. Ora, per molti motivi, aver
scoperto un numero «naturale» che era in accordo con tt fino a tal livello
- e non di più - sarebbe stato ancora più interessante dell’altra possibilità.
La cosa non ci sembrava plausibile, ma dopo aver nuovamente codificato e
aver ripetuto le iterazioni ottenemmo lo stesso risultato.
Vent’anni fa era molto più difficile poter effettuare calcoli con preci­
sione - anche solo moderatamente - elevata e il nostro programma venne
fatto girare in remoto, tramite una linea telefonica, su un pacchetto softwa­
re per il calcolo con numeri interi di un calcolatore Unix Berkeley. Dopo
circa sei settimane, venne fuori che l’algoritmo per il calcolo della radice
quadrata del pacchetto aveva un errore, ma solo quando veniva fatto girare
con una certa precisione superiore a sessanta cifre! Per ragioni particolari
era stato cosi solo nei due casi non dimostrati. Ovviamente, individuare
276 Jonathan M. Borwein

il bug fu un’esperienza istruttiva e salutare. Da questa storia emerge chia­


ramente come mai i calcoli vengano controllati usando differenti metodi
e subroutines.

13. Come calcolare l’N-esima cifra di t t .

Sarebbe da perdonare chi pensasse che è stato detto praticamente tutto


ciò che cera di interessante da dire riguardo a t t .Questo è quanto viene asse­
rito nei capitoli conclusivi del libro A History o / t t di Petr Beckmann, uscito
nel 1971. Ironia della sorte, l’iterazione Salamin-Brent con convergenza qua­
dratica è stata scoperta solo cinque anni dopo e gli algoritmi convergenti di
ordine superiore, ancora dopo, negli anni Ottanta. In seguito, addirittura nel
1990, Rabinowitz e Wagon scoprirono un algoritmo spigot («a rubinetto»)
per tt - cioè un metodo nel quale le cifre «escono» una per volta. Si tratta
di un algoritmo che permette il calcolo di cifre successive di t t (in qualsiasi
base) tramite un algoritmo ricorsivo relativamente semplice sulla base di
tutte le cifre generate in precedenza.
Perfino gli addetti ai lavori talvolta rimangono sorpresi da una nuova
scoperta. Prima del 1996, la maggior parte delle persone pensava che se si
fosse voluto determinare la «/-esima cifra di t t , si sarebbero dovute generare
un numero di cifre dell’ordine di d. Non è vero, almeno per le cifre esadeci-
mali o binarie di ir. Nel 1996, Peter Borwein, Plouffe e Bailey trovarono un
algoritmo per il calcolo di singole cifre esadecimali di t t . Questo algoritmo
presenta varie caratteristiche degne di nota:
1. produce una stringa, non troppo lunga, di cifre esadecimali o binarie
di t t , da una posizione arbitraria, senza usare bit precedenti;
2. può essere implementato in qualsiasi computer moderno;
3. non richiede software a precisione multipla;
4. ha bisogno di poca memoria;
5. ha un costo computazionale che cresce solo poco più velocemente del
numero delle cifre richieste.
Per esempio, la milionesima cifra esadecimale (quattromilionesima cifra bi­
naria) di tt viene calcolata in quattro secondi su una workstation Apple G5,
appartenente all’ultima generazione.
Questo nuovo metodo non è sostanzialmente più veloce dei migliori
algoritmi noti, se viene usato per calcolare tutte le cifre di t t fino a una certa
posizione, ma la sua eleganza e la sua semplicità sono di notevole interesse; è
inoltre facile da calcolare in parallelo. Si basa sulla seguente formula, nuova
per l’epoca, di t t :
La vita di pi greco 277

( 17) TT = £ — f — -------------------------!------------ —
16' y S i+ \ Si + 4 8/ + 5 8/ + 6
che venne scoperta facendo uso dei metodi di combinazione lineare intera
[Borwein e Bailey 2004] con un programma che girò su un computer per vari
mesi e alla fine produsse la relazione (equivalente alla precedente)

1r = 4 F( 1' 4' - - j ) + 2 “m a n i - l o g 5

dove F ^ l, —; —, ——j = 0,955933837... è una funzione ipergeometrica

di Gauss.
Sia Maple che Mathematica possono dimostrarla, mentre una dimostra­
zione «umana» si può trovare in Borwein [2004].

13.1. L ’a lg o r itm o in a z io n e.

Nel 1997, Fabrice Bellard d e ll’iNRiA (Institut National de Recherche en


Informatique et en Automatique) calcolò 152 cifre binarie di tt a cominciare
dalla bilionesima posizione. Il calcolo durò dodici giorni su venti worksta­
tion che lavoravano in parallelo, collegate via internet. Lo schema utilizzato
da Bellard si basa sulla seguente variante della (17):

ir = 4 V (-» * 1 y ( - » * f 32 | 8 | 1 )
” * r 0 4 * ( 2 * + l) 64 £*„ 1024* U * + 1 4k + 2 4 * + 3/

che permette di calcolare cifre esadecimali o binarie di tt con una velocità di


circa il 43 per cento maggiore rispetto alla (17).
Nel 1998 Colin Percival, uno studente diciassettenne della Simon Fraser
University, utilizzò venticinque computer per calcolare prima la cinquebilio-
nesima cifra esadecimale, e quindi la diecibilionesima cifra esadecimale. Nel
settembre del 2000 trovò che la 1000-bilionesima cifra binaria è 0, un calcolo
che ha richiesto 250 anni-cpu, usando 1734 computer in 56 paesi del mondo.
Riportiamo alcuni risultati di questi calcoli nella tabella 6.
A conclusione di questo paragrafo, ricordiamo che Kanada fu in grado
di confermare il proprio calcolo del 2002 in solamente ventun ore, calco­
lando una stringa di venti cifre esadecimali con inizio alla bilionesima cifra,
e confrontandola con la stringa che aveva ottenuto originariamente in oltre
seicento ore. Il fatto che fossero uguali ha fornito una conferma estremamen­
te forte della correttezza del calcolo.
278 Jonathan M. Borwein

14. Altre formule di tipo bbp per il calcolo di una cifra.

Con motivazioni analoghe a quelle viste sopra, costanti a della forma


p{k)
(18) — 2
~o ?<A>2* '
dove p(k) e q(k) sono polinomi a coefficienti interi, si dicono nella classe dei
«numeri binari b b p » (Borwein-Bailey-Plouffe). Illustrerò nel caso di log 2 co­
me mai questo permette il calcolo di cifre isolate nell’espansione decimale:

(19)
*=o
Desideriamo calcolare qualche cifra binaria a cominciare dalla posizione
d + 1. Questo equivale a calcolare [2d\og 2), dove {■} indica la parte frazio­
naria. Possiamo scrivere

d -J~k ■>d-k
(20 ) { 2 J log 2 j =
l 2-
k=0 K k=J+l )■
J-k
= ^ x 2</~*m
k od^
>=0 k=J+l
L’osservazione chiave è che il numeratore della prima somma della (20),
2dJt mod k t può essere calcolato rapidamente tramite 1'esponenziazione bi­
naria, modulo k. Questo calcolo può essere effettuato in modo economico
basandosi sull’espansione dell’esponente come potenza di due. Per esempio
3 17 = ((((32)2)2)2) •3

Tabella 7.
Le scoperte esadecimali di Percival.

Posizione Stringa di cifre esadecimali che inizia in questa posizione

IO6 26C65E52CB4593
IO7 17AF5863EFED8D
IO8 ECB840E21926EC
IO9 85895585A0428B
IO10 9 2 1C73C6838FB2
10" 9C381872D 27596
1,25 X IO12 07E45733CC790B
2,5 x 10M E 6 2 16B069C B6C 1
La vita di pi greco 279

utilizza solo cinque moltiplicazioni a differenza delle usuali sedici. È im­


portante che ogni prodotto sia ridotto modulo *. Quindi, 317 mod 10 viene
calcolato come
32 = 9. 92 = 1 ; 12 = I ;l 2= i; i x 3 = 3.
Una domanda che sorge spontanea alla luce della (17) è se esiste una
formula di questo tipo e una strategia computazionale associata per calco­
lare singole cifre decimali di t t . Le ricerche condotte da molti studiosi sono
state finora infruttuose, e recentemente mio padre David Borwein, William
Galway e io abbiamo dimostrato che non esistono formule bbp di tipo Ma-
chin (come definito in Borwein e Bailey [2004]) per approssimare pi greco,
se la base non è una potenza di due.

14.1. F o r m u le bbp in b a se tre.

Comunque, formule b b p per alcune costanti esistono in altre basi. Per


esempio, David Broadhurst ha scoperto la seguente formula bbp in base tre
penH:
^2 2 y 1 ( 243________ 405 (
27 ~ 0 39* l (12* + l)2 (12* + 2)2 +
81__________ 27__________72 [
(12* + 4)2 (12* + 5)2 (12* + 6)2

______ ?___________ ?___________ * — + - 1 1


( 1 2 * + 7)2 ( 1 2 * + 8)2 (12* + IO)2 (12* + 11)2 J

ha anche una formula in base due.


tt 2
Inoltre, è ben noto che il volume iperbolico V8 del complementare del
nodo a otto (sulla sfera S}) vale
* 1 2#i—1 1
V8 = 2 V 3 £ —-— r X 7 = 2,029883212819307250042405108549...
... . ( 2; ) *

Sorprendentemente questa quantità è anche esprimibile come


280 Jonathan M. Bonvein

una formula scoperta ancora da Broadhurst in maniera numerica e dimostra­


ta in Borwein e Bailey [2004].

14.2. N orm alità e dinam ica.


Alla fine, nel 2001 Bailey e Crandall dimostrarono che vi sono dei col-
legamenti emozionanti fra l’esistenza di una formula b b p in base b per a e
la sua normalità in base b (distribuzione uniforme delle cifre in base b)11.
Avanzarono inoltre una congettura ragionevole, e perciò molto ardua da
dimostrare, sulla distribuzione uniforme di un sistema dinamico caotico as­
sociato. Questa congettura implica che l’esistenza di una formula b b p in base
b per a garantisce la normalità di a in base b. Nel caso di log 2, per esempio18,
il sistema dinamico, in base due, consiste nel porre x0 = 0 e calcolare

.v ., = [ 2x + — - ! mod 1
"+1 " n + l)

17 Si veda w w w .scien cen eu -s.o rg /20010901/b o b 9.asp .


11 In questo caso è facile lare uso del criterio di equid istrib u zio n e di W e y l p e r stab ilire questa
equivalenza senza fare ricorso ai num eri bbp.

Figura 5.
I cerch i bbp acrilic i. Q u e s ti ce rc h i acrilici « s o ttr a ttiv i» r a p p r e s e n t a n o i p e si [ 4 , - 2 , - 2 , - 1 ]
n ell’eq u azio n e (171.
La vita di pi greco 281

(mod 1 sta a indicare che si considera solo la parte frazionaria; per appro­
fondimenti si veda Bailey e Crandall [2001]).

15. Vita di p i greco.

Come abbiamo visto, la vita di pi greco riguarda molti aspetti della mate­
matica - algebrici, geometrici e analitici, sia di matematica pura sia applica­
ta - assieme a un po’ di storia e di filosofia. Lungo la sua strada, ha coinvolto
molti dei più grandi matematici e qualche personaggio piuttosto interessante.
Uno degli episodi più singolari e meno comprensibili riguarda il fallito tenta­
tivo, risalente al 1896 nello Stato dell’indiana, di decidere per legge il valore
di pi greco. La legge, riportata in Berggren, Borwein e Borwein [2004, pp.
231-35], è descritta con precisione da David Singmaster [ibid., pp. 236-39].
Rimane ancora molta vita in questo che è il più importante tra i numeri.
Alla fine del romanzo, Piscine (Pi) Molitor scrive:
Sono una p erso n a ch e cred e nella form a, nell’armonia dell’ordine. Quando è
possibile, do v rem m o dare alle cose una forma significativa. Per esempio, sareste in
grado di ra cco n ta re questa mia storia confusa, in cento capitoli esatti, non uno di più,
non uno di m en o ? Se c ’è una cosa che odio del mio soprannome è quella cifra che
non finisce m ai. N ella vita è im portante che ogni cosa abbia una giusta conclusione.
Solo cosi si trov a la p a c e ".

Possiamo anche non essere d’accordo con quest’ultima affermazione, ma


dovremmo celebrare il fatto che Pi sappia che ir è irrazionale.

16. Note di chiusura.

16.1. Perché t t è diverso da . Oggi «lo sanno» perfino i programmi di

computer algebra Maple o Mathematica, dal momento che

(21) 0 < f - ~ x)Af dx = — - ir,


J o 1+ x 7
anche se sarebbe prudente domandarsi «perché» possono calcolare questo
integrale e «se» sono affidabili. Assumendo di fidarci, allora l’integrando è
strettamente positivo su (0, 1) e il risultato della (21) è un’area e quindi un
valore strettamente positivo, nonostante millenni di affermazioni che tt è
22
— . In questo caso, chiedere al programma di fornire l’integrale indefinito
fomisce una conferma immediata. Otteniamo

" Y. Martcl, Life o f Pi, trad. it. cit. p. 340.


282 Jonathan M. Borwein

f * <(1 dx = V - + /’ - 1 1’ + 41 - 4arctan(<),
J» l t * ! 7 3 3
come si vede facilmente derivando, e quindi il teorema fondamentale del
calcolo dimostra la (21).
Si può portare un po’ più avanti l’idea contenuta nell’equazione (21),
come viene fatto in Borwein e Bailey [2004]. Notiamo che

(22) P x4(l - x)4dx = — - ,


Jn 630
e osserviamo che

(23) - fx4(l - x)4dx < [ —— j - dx < f


x 4( l - x ) 4dx.
2 Jo Jo 1 + x2 Jo
Combiniamo quest’ulrima con la (21) e la (22) e ricaviamo:
223 22 1 22 1 22
----- < ------------ < TT < --------------- < -----
71 7 630 7 1260 7
ottenendo cosi nuovamente la famosa approssimazione archimedea

Questo modo di ricavare l’approssimazione di Archimede sembra sia


stato pubblicato per la prima volta su «Eureka», un giornale studentesco di
Cambridge, nel 1971”.

162. Qualche informatone in più sulla funzione Gamma. Si può definire

H x )= j V - V ' d /

per 9R(x) > 0. Il punto di partenza è che


(25) xnx) = r(x+i), n i) = i.
In particolare, per interi n, T(« + 1) = ni. Inoltre, per 0 < x < 1

rw rO -x) = T 7 - ; ,
Sin(TTx)
dal momento che per x > 0 abbiamo

* L'equazione (21) era riportata in un compito d'esame della Sydney University risalente ai
primi anni Sessanta.
La vita di pi greco 283

n ! n"
r(x) = lim
« • n • » -.< * + * >
Si tratta di una bella conseguenza del teorema di Bohr-Mollerup che
dimostra che T è Tunica funzione logaritmicamente convessa sulla semiretta

positiva che soddisfa la (25). Quindi, —j = Vtt, il che è equivalente a


calcolare il valore delVintegrale gaussiano

J e~x dx = yfrt,

di importanza cosi centrale nella teoria della probabilità. In maniera analoga,


l’integrale improprio della funzione sinc ha il valore di
sin(x)
- d x = TT.
II X

Molte informazioni riguardo ai rapporti fra T e tt si trovano in Borwein


eBailey [2004], Eymard [2003].

16.3. Qualche informazione in più sulla riduzione della complessità. Per


illustrare l’incredibile riduzione di complessità degli algoritmi ellittici per pi
greco, scriviamo un insieme completo di equazioni algebriche che approssi­
mano tt a più di tre bilioni di cifre.

Hnumero tt è trascendente e il numero che calcoleremo è algebrico;


a 20
nonostante questo coincidono per oltre 1,5 bilioni di cifre.
Poniamo a0 = 6 - Ayfl, y0 = V i - 1 e risolviamo il sistema in tabella 7.
Questo algoritmo di ordine quattro, assieme a quello Salamin-Brent, è
stato usato per la prima volta da Bailey nel 1986 e più volte, negli ultimi tre
lustri, da Yasumasa Kanada a Tokyo per calcolare approssimazioni di ir; il
maggior successo è stato raggiunto con il calcolo di 200 miliardi di cifre deci­
mali nel 1999 (si veda la tabella 4). Solo 35 anni prima, nel 1963, Dan Shanks
- un protagonista ben informato di questa storia - era sicuro che sarebbe
rimasto per sempre impossibile calcolare un miliardo di cifre. Oggi è una
cosa che si riesce a fare facilmente su un modesto computer portatile.
284 Jonathan M. Borwein

Tabella 8.

- * ( i + y,)‘ + + yf) y„ ■ ' V y,,)* - 2,,y„(i +y„ + rM


1+ V1 -

i - V>“
- ' )(i+y,)‘ -a’yiO +y, + rf) r„ m^ j r = = - é» ' J«(^y„Y - 2,’y,1(, + y.j +/„)

i-
~ V ~ T-' ■<, - « , 0 ^ , ) ' - 2 Ty,(i + y, * y ; ) y„ ~ * “ ■'i,(l + v,,)* - 2*1 (i + y„ + yf,)
«■yi-yj •+v, -y. «

~ | - - ■«, -« ,(« + 7.)‘ - 2 , y,(i + y. + y|) y,. " * ^ *’ 0 + *« )‘ - 2,’ y.. (' + y„ + yM
'i-?:
+ i/l-y.‘ 1•*- V1 “ >. «

- é'{ ! +,,)• - 2 '*,,(i + r, + »j) y„ - ‘ --.« O * *.)' - 2 ” *..(•+*, +rf,)


+ Vi - y.‘ i + 71 - y„

-'.O +j J -2,’r.(* + y. + >;’) ?.. ~ ‘ ^ ^ ■«,. *=*i.O ♦y,.)* - 2 '’yl4(i +y„ +.»',)
♦ {/l - r,‘ * + v* ” vi'

~ V— * .<, - * . ( l + y r)‘ - 2 , , y,(l+y? + » ;) y„ - ' ^ ■«„ = <*,. 0 + y„ )* - 2" y1I (l + y„ + *',)


+yl - y* I+V|-^.

■ ^ 4 . . , - -, (1♦ y. J* - 2" >. (l ♦ >. ♦ ) *• " + *•)* - 2” *. (1+r„ +yf.)

^ 4 . - . -<.0 * y.r - f ’M 1+ ». + ri) *• " " * ! > ■« “ + *•)* - 2” >»(‘ + *♦ + A)

" ~ * . 4 , -<.(• + * .) ' ~ 2" y„ (1 ■*•y,4 + y f.), « " , + iT T 7 ' ,<rt “ ‘,’^ 1 + ■ 2*’ y* '( 1 + >« + rf.)-
♦ i/i-».* "’ v1 y1*
La vita di pi greco 285

ARNDT, J . C HAENEL, CII.


2001 Pi Unleashed, Springer-Verlag, New York.
baey er, h . c h . von
2003 Information. The New Language o f Science, Weidenfcld and Nicolson, Lon­
don.
BAILE*. D. H. e CRANDALL, R. E.
2001 On thè random character o f fundamentalConstant expansions, in «Experimental
M athem atics», 10, pp. 175-90.
b e r g g r e n , l ., b o r w e i n , j . m . e b o r w e i n , p. b . (a c u ra di)
2004 Pi: a Source hook, 3a ed., Springer-Verlag, New York.
blatn er, d .

1997 The Joy o f Pi, W alker and Co., New York.


b o r w e in , j. M.
1998 Brouwer-Heyting sequences converge, in «Mathematica! Intelligencer», 20, pp.
14-15.
b o r w e in , j . m . e b a il e y , d . h .
2004 Mathematics by Experiment: Plausible Reasoning in thè 21st Century, AK Pe-
ters, N atick Mass.
b o r w e in , j . m . e b o r w e in , p . b .
1987 Pi and thè AGM, Jo h n Wiley and Sons, New York.
1988 Ramanujan and Pi, in «Scientifìc American», febbraio, pp. 112-17, poi in b . C.
b e r n d t e r . a . r a n k in (a cura di), Ramanujan: Essays and Surveys, Ameri­
can M athem atical Society, Providence 2001, pp. 187-99 (ora in b e r g g r e n ,
b o r w e i n e b o r w e i n 2004).

BORWEIN, J . M ., BORWEIN, P. B. e BAILEY, D. A.


1989 Ramanujan, modular equations and pi orhow to computea billion digits ofpi, in
«T he American Mathematical Monthly», 96, pp. 201-19, poi in «Proceedings
o f thè O rganic M athematics Workshop», 1996, www.cecm.sfu.ca/organics
(ora in b e r g g r e n , b o r w e i n e b o r w e in 2004).
EYMARD, P. e LAFON, J .- P .
1999 Autour du nombre ir, Hermann, Paris [trad. ingl. The Number ir, American
Mathematical Society, Providence 2003].
LANGERMANN, T .
1996 The True Perplexity: thè Guide o f thè Perplexed, parte II, cap. xxiv, in j. L.
k r a m e r (a cura di), Perspectives on Maimonides. Philosophicaland Historical
Studies, T h e Littman Library, London-Portland, pp. 159-74.
U M B E R T O ZANNIER

Risultati e metodi nella teoria delle equazioni diofantee*

1. Generalità.

Tra i più tipici e amichi problemi delFaritmetica si annoverano quel­


li riguardanti la soluzione di equazioni in cui si richiede che le incognite
assumano valori interi o razionali1. Tradizionalmente tali equazioni sono
denominate «diofantee», da Diofanto di Alessandria (ca. 250 d.C.), che le
aveva considerate in un trattato (solo parzialmente giunto sino a noi) che
doveva in seguito ispirare Pierre de Fermat (1601-1665), col quale inizia
la moderna teoria dei numeri. Non si tratta dunque di un tipo speciale di
equazioni, quanto di soluzioni particolari. In pratica comunque le equazioni
considerate sono di solito algebriche, definite da polinomi2.
Molte questioni fondamentali e naturali dell’argomento sono esprimi­
bili usando solo un minimo di formalismo, ma spesso si rivelano poi cosi
difficili da eludere anche le indagini più sofisticate: questo duplice aspetto,
condiviso con altre problematiche nella teoria dei numeri, ha decisamente
contribuito al fascino di questa disciplina. L’esempio più noto si ha con
l’equazione X" + Yn = Z"; solo recentemente Andrew Wiles ha dimostrato
la secolare congettura detta «ultimo teorema di Fermat» per cui, se » è un
intero ^ 3, non vi sono soluzioni in interi X, Y, Z tutti diversi da zero. (Per
n = 2 esistono invece infinite soluzioni in interi coprimi, su cui torneremo).
Sottolineiamo che la restrizione posta sulle variabili è di natura assai
forte: spesso vi sono soluzioni nell’ambito dei numeri reali, ma non in quello
dei numeri interi o razionali. Possiamo intuirlo considerando che nelle equa­
zioni compaiono quadrati, cubi, ecc., numeri assai rari tra i numeri interi (ma
non tra i numeri reali, o complessi); corrispondentemente, ci si aspetta che
le relazioni tra numeri di questo tipo siano in certo senso rare1.

* L'autore desidera ringraziare la dott.ssa Renata Scognamillo, della Scuola Normale, per una
lettura della versione originale del testo e per molti utili consigli di carattere espositivo.
1 Ossia le usuali frazioni. Diciamo subito che si è rivelato col tempo conveniente considerare
soluzioni più generali, in un campo di numeri algebrici o ncll’associato anello di interi, che incon­
treremo ancora. Tuttavia per semplicità ometteremo nel seguito queste precisazioni. Useremo le
comuni notazioni Z per gli interi e Q per i razionali.
1 Si sono però considerate anche equazioni diofantee esponenziali, talvolta ausiliarie nello stu­
dio delle prime.
1 Queste ultime sono considerazioni «probabilistiche», talvolta quantificabili. Sia data ad cscm-
288 Umberto Zannier

Osserva John W. S. Cassels [1966]: «Lo studio di queste equazioni è an­


tico quanto la matematica», e Yuri Manin [1974] scrive che «uno psicologo
della scuola di Jung classificherebbe questi problemi come “archetipi di gra­
do elevato”». In effetti le equazioni diofantee comparvero già nell’antichità,
spesso accanto a una concezione quasi mistica dei numeri (come tra i pitago­
rici). I numeri figurati considerati dai Greci (alludiamo ai numeri triangolari,
quadrati, e a quelli associati a configurazioni geometriche notevoli) spesso
coinvolgevano equazioni diofantee. Altre motivazioni si ebbero con le equa­
zioni lineari, le cui soluzioni intere comparvero nello studio del calendario e
dei fenomeni periodici. Un’attenzione verso le soluzioni intere e razionali è
stata poi naturale anche perché questi numeri erano gli unici che gli antichi
concepissero o comunque sapessero maneggiare. Invece i numeri definiti
da passaggi al limite sfuggono alla nostra intuizione e spesso si può operare
con essi solo ricorrendo ad approssimazioni piuttosto che a calcoli «esatti».
(Anche più recentemente Leopold Kronecker (1823-1891), affermando che
«Dio creò i numeri interi, il resto è opera umana», ribadiva come problemi
di carattere diofanteo fossero alla base dell’intera matematica).
Osserviamo ancora che nella nozione stessa di numero irrazionale (cui
si pervenne attorno al 500 a.C.) è implicita un’equazione diofantea priva di
soluzioni: l’irrazionalità di 4 Ì ad esempio (che sconvolse le convinzioni dei
pitagorici), corrisponde geometricamente al fatto che il lato di un quadrato è
incommensurabile con la diagonale, e algebricamente al fatto che l’equazione
X2 = 2 Y 2 non ha soluzioni intere, tranne quella banale X = Y = 0 .
La prima raccolta sistematica di problemi di questo tipo è dovuta ap­
punto a Diofanto, le cui opere vennero pubblicate nel 1621 dal nobiluomo
Claude-Gaspard Bachet de Méziriac, matematico dilettante, accanto a una
traduzione latina e a un commentario. I problemi erano tipicamente riferiti
a figure geometriche ed era tacitamente inteso che le quantità dovessero es­
sere razionali. Spesso apparivano le «teme pitagoriche», ovvero le soluzioni
intere dell’equazione X2 + Y2 = Z2 (la questione 8 di Diofanto era «scom­
porre un quadrato dato in due quadrati»). In virtù appunto del teorema di
Pitagora, queste teme corrispondono a triangoli rettangoli con lati di lun-

pio l equazione Y1 + 1 = X* in numeri interi. Senza informazioni ausiliarie, ha senso dire grosso
modo che la probabilità che un intero N sia un cubo è circa Vn /N (infatti vi sono circa Vn
cubi ira I e N). Analogamente, la probabilità che N sia della forma Y2 + 1 è circa > /n /N . Allora
(considerando quoti eventi come indipendenti) la probabilità combinata che N = X ’ = Y* + 1 per
certi X , y interi, sarà àrea |l/VN1Ul/V N j = 1/N 7'*. Siccome la somma su N di queste quantità
è finita, ci si aspetta solo un monetofinito di soluzioni per l'equazione (un fatto che si sa dimostrare,
ma non in modo facile). Le soluzioni con X, Y reali sono invece infinite. Argomentazioni siffatte
tuttavia sono solo parzialmente affidabili. Ad esempio l'equazione Y1= X ’ + X 2, apparentemente
analoga alla precedente, ammette la famiglia infinita di sofuzioni X =» t2 - I , Y - r —t, per /inte­
ro; infatti (/ - i f « U1 - I )* + (/J - l)2. Questo è un primo esempio di «parametrizzazione»: le
soluzioni provengono per soatituzione in tm'idaiiità algebrica.
Risultati e metodi nella teorìa delle equazioni diofantee 289

ghezze intera; alcune soluzioni, come 32 + 42 = 52, erano note ai Babilonesi


già prima del 1600 a.C., e Diofanto e Bachet conoscevano formule generali,
che ricorderemo in seguito, per le soluzioni [Fermat 2006, porisma 6 di
Bachet, p. 3]. Pierre de Fermat, giurista a Tolosa e matematico per diletto
(ma autore di scoperte fondamentali nella teoria dei numeri e nelle origini
del calcolo differenziale), studiò lo scritto di Bachet, annotando sui margini
delle pagine le proprie «Osservazioni», che rappresentano la nascita della
moderna teoria dei numeri. (Proprio a margine della questione 8, Fermat
[2006, p. 4] enunciava l’«ultimo teorema»: «non è possibile invece dividere
un cubo in due cubi, o un biquadrato in due biquadrati, né in generale divi­
dere alcun’altra potenza di grado superiore al secondo in due altre potenze
dello stesso grado, della qual cosa ho scoperto una dimostrazione veramente
mirabile, che non può essere contenuta nella ristrettezza del margine». Oggi
si è praticamente certi che una tale argomentazione contenesse lacune).
Dopo Fermat, che non aveva pubblicato nulla, questa disciplina lenta­
mente si sviluppò con Eulero, Lagrange, Legendre, Gauss e altri. Anche di
recente, ha costituito un settore centrale nella ricerca di molti tra i matema­
tici più illustri.
Nel seguito useremo un linguaggio geometrico, osservando che le soluzioni
in un problema diofanteo corrispondono a punti a coordinate intere (o razio­
nali) su certe varietà, ossia curve, superfìci, ecc.; queste varietà sono definite in
un diagramma cartesiano dalle equazioni in oggetto quando le variabili sono
invece libere di assumere valori reali o complessi. Si parla cosi di «punti interi»
o «punti razionali», nell’insieme più vasto dei punti reali o complessi4.
Una concezione geometrica dei problemi diofantei è importante: recen­
temente è emerso come i principi fondamentali che regolano la distribuzione
delle soluzioni intere e razionali abbiano origine nella geometria, oltre che
nell’algebra.
Un primo attributo geometrico è la dimensione della varietà: i punti han­
no dimensione 0, le curve 1, le superfìci 2. Grosso modo, la dimensione è il
numero di gradi di libertà, ossia il massimo numero di coordinate che possia­
mo scegliere liberamente in una generica soluzione (in numeri complessi) del
sistema di equazioni. Le varietà di dimensione 0 corrispondono a equazioni
/ (X) = 0 in una singola variabile. Dal punto di vista diofanteo, questo è
un caso facile in cui le soluzioni anche complesse sono in numero finito, al
più uguale al grado di / Inoltre (data / a coefficienti razionali) le soluzioni
razionali si possono esplicitamente calcolare usando elementari concetti di
divisibilità tra interi.

* La distinzione ira punti «interi)» e «razionali» corrisponde a uno spazio ambiente «affine» o
«proiettivo». In effetti, un numero razionale è definito da una coppia di interi a meno di un/attore
di proporzionalità, come per le coordinate proiettive; peraltro le equazioni su spazi proiettivi sono
omogenee e per esse non sussiste differenza nel ricercare soluzioni intere o razionali.
2 90 Umberto Zannier

Il caso successivo è quello delle curve, di dimensione 1. Già Euclide (ca.


300 a.C.). aveva completamente chiarito la questione dei punti interi sulle
rette, con equazioni aX - bY = c. Oggi tutto ciò si studia ai primi livelli, ma
non per questo è meno significativo: già per c = 0 si ottiene aX = bY che
rappresenta una duplice scomposizione in fattori di uno stesso intero e per­
tanto conduce direttamente ai numeri primi e agli studi sulla fattorizzazione;
per c generale si hanno equazioni legate ai fenomeni periodici, risolubili se
e solo se mcd(i, b) divide c. Tuttavia, malgrado questi casi sviscerati già nel­
l’antichità, la teoria generale delle curve lascia ancora, come vedremo, punti
oscuri che resistono alla profondità delle tecniche attuali.

2. Le questioni principali.

Nel 1900, David Hilbert, con la sua celebre lista di ventitré problemi, affer­
mava la propria concezione riguardo alle questioni più centrali nella matemati­
ca dell'epoca. Il decimo problema chiedeva «un metodo generale per decidere
se un’equazione diofantea assegnata ammetta soluzioni». (Per «metodo» si
pensi a un algoritmo, ovvero una procedura sistematica di un numero finito
di istruzioni, inseribili ad esempio in un computer, che porti a una risposta
certa in un numero finito di passaggi). La questione di Hilbert si può meglio
apprezzare ricordando che allora le equazioni diofantee erano spesso trattate
una alla volta, con artifici ingegnosi, ma del tutto speciali e poco adattabili a
situazioni generali. Inoltre essa sottolineava l’importanza matematica di una
procedura universale e certa per la soluzione di un dato problema*.
Che il problema di Hilbert fosse di estrema difficoltà era noto, ma fu una
sorpresa quando, circa settantanni dopo, Yuri Matijasevic dimostrò che un
tale algoritmo addirittura non esiste [Davis, Matijasevic e Robinson, 1979];
in questa generalità il problema di esistenza è intrinsecamente irrisolvibile.
Questo risultato negativo, che appartiene alla logica matematica piuttosto
che alla teoria dei numeri, va tenuto ben presente in una scelta degli obiet­
tivi.
La questione di Hilbert riguardava l’esistenza di una soluzione. Tuttavia
altri simili problemi, eventualmente formulati solo per una classe particolare
di equazioni, sono altrettanto spontanei:

Osserviamo che decidere dell'esistenza di soluzioni intere può essere ben lontano dall’ovvio,
anche per semplici equazioni come ad esempio Y2 = X* + 7. Questa ha infinite soluzioni reali: per
X > 0, basta estrarre Laradice quadrata di Xf + 7 per ottenere Y. Tuttavia, per X intero Y sarà spesso
irrazionale per X = 1.2.3,4, ...si trova Y ± V8 , ± >/l5, ± ^34, ± V7T...... tutti numeri irrazionali;
non è affatto chiaro come decidere per quest* via se vi siano soluzioni con X cY entrambi interi, il
che a priori comporta infinite operazioni. Da esempi come questo deriva l’arcaica denominazione
«indeterminate* per le equazioni diofantee [cfr. Nagell 19291.
Risultati e metodi nella teoria delle equazioni diofantee 291

(i) Si può stabilire se una data equazione ha infinite soluzioni intere o


razionali?
(ii) Se le soluzioni di una data equazione sono infinite, esiste un modo
semplice di descriverle (ossia, ad esempio, le si possono generare
sistematicamente con formule parametriche)?
(iii) Se le soluzioni di una data equazione sono in numero finito, le si
possono trovare tutte?

E potremmo proseguire con altre domande sulla distribuzione delle eventuali


soluzioni. Tuttavia, anche nel caso di queste domande specifiche, a tutt’oggi la
risposta è affermativa solo in casi particolari. Per contro, la nostra conoscenza
è enormemente aumentata dai tempi di Hilbert, ed è assai vasta nel caso delle
curve (ossia, sostanzialmente, per le equazioni diofantee del tipo/(X, Y ) = 0,
in due variabili). Vediamo brevemente cosa si sa oggigiorno al riguardo.
In primo luogo, esiste un algoritmo per rispondere a (i) e (ii) nel caso
delle soluzioni intere. Quando esse sono infinite, possono sempre essere de­
scritte da formule parametriche con funzioni razionali oppure esponenziali,
a seconda dei casi. Ossia, esistono opportune identità algebriche tali che
le soluzioni in questione si possono ottenere per semplice sostituzione di
numeri interi arbitrari al posto delle variabili presenti (come in un esempio
visto). Invece non si sa rispondere a (iii) in generale, nemmeno restringen­
dosi alle soluzioni intere.
Per le soluzioni razionali le cose sono ancor meno complete. Si sa però
rispondere a (i), a meno che la curva sia di genere 1; inoltre, in tal caso esiste un
notevole risultato - che si può considerare una risposta a (ii), come accennere­
mo - riguardo alla struttura delle soluzioni, talvolta in numero infinito4.

3. Alcuni risultati notevoli.

In questo paragrafo riassumeremo in prospettiva storica alcuni tra i prin­


cipali risultati ottenuti nel xx secolo, limitandoci per brevità soprattutto alle
curve. Discuteremo poi sommariamente parte dei metodi.

* Il genere di una curva è un numero intero s 0, che si può definire in modo puramente geo­
metrico. Rette e coniche (e le altre curve parametrizzabili con funzioni razionali) hanno genere 0;
le curve piane definite da equazioni nonsingolari di grado 3 hanno genere 1, mentre il genere tende
a crescere per equazioni più complicale. (Però un’equazione complicala può talvolta definire una
curva di genere piccolo, espressa più semplicemente dopo un cambiamento di variabili). Il genere
non cambia quando si applica una trasformazione (di coordinate) bimtontle, ossia razionale e con
inversa pure razionale. Tali trasformazioni sono per noi rilevanti, poiché (quando i coefficienti sono
numeri razionali) fanno corrispondere punti razionali a punti razionali e viceversa. È anche impor­
tante osservare che il genere di una curva si può sempre determinare a parare da un’equazione, in
modo algebrico e sistematico e senza nozioni di natura diofantea.
292 Umberto Zannier

Teorema di Hilbert-Hurwitz. Nel 1890 David Hilbert e Adolf Hurwitz


stabilirono che urta curva di genere 0 (definita da equazioni a coefficienti razio­
nali) si può sempre trasformare in una retta (con equazione aX + bY + c = 0
di grado 1) o in una conica (definita da aX2 + bXY + cY2 + dX + eY + f = 0
di grado 2). Ciò si può realizzare mediante trasformazioni birazionali con
coefficienti in Q (come si diceva, queste trasformazioni lasciano invariata la
struttura dei punti razionali).
In particolare, questo risultato consentiva di trovare equazioni semplici
per le curve di genere 0, in modo da poter scoprire tra l’altro l’esistenza di
punti razionali (con la teoria delle forme quadratiche, sviluppata già nel xix
secolo) e in caso affermativo di parametrizzarli. Il risultato precisava poi che
un singolo punto razionale (non singolare) su una curva di genere 0 consente
di trasformarla in una retta e di ottenervi dunque infiniti punti razionali. Ad
esempio, i punti razionali sul cerchio di equazione X 2 + Y2 = 1 si ottengono
1 - tj22 ^2 ( 21 V
dall’identità + ------ - = 1 sostituendo a t (che è il parametro)
W + /V
un arbitrario numero razionale. Torneremo su questo più avanti.

Teorema di Thue. (Axel Thue, 1909). Dati un polinomio omogeneo f e


un numero intero c i 1 0, un’equazione diofantea f { X , Y ) = c b a solo un nu­
merofinito di soluzioni intere, a meno che f sia una potenza di un polinomio
lineare o quadratico.

Osserviamo che la condizione posta su/è rilevante, in quanto altrimen­


ti possono esistere infinite soluzioni. Ad esempio, l’equazione quadratica
X —2 Y2 = 1 ha infinite soluzioni intere (come si vedrà), mentre il teorema
di Thue implica che Xì - 2Yy = 1 ne ha solo un numero finito. Fatta ecce­
zione per la teoria delle forme quadratiche (sviluppata da Eulero, Lagrange,
Legendre, Gauss) questo rappresentò il primo caso in cui si considerassero
simultaneamente equazioni di intere famiglie, per di più con gradi arbitrari.
Fino ad allora queste equazioni venivano studiate una a una, con metodi ad
hoc, sempre ammesso che questi potessero funzionare: va infatti osservato
che anche il singolo caso speciale del risultato è di solito altamente non
banale.
U teorema inaugurò l’approssimazione diofantea moderna, su cui tor­
neremo nel 54, ispirando importanti ricerche di autori successivi. Esso era
però parzialmente ineffettwoynel senso che non permetteva di scoprire tutte
le eventuali soluzioni (e nemmeno di stabilire se ve ne fossero), ma solo di
maggiorarne esplicitamente il numero7.

' Per una dimostrazione cfr. ad esempio Mordell [1969].


R isultati c m etodi nella teoria delle equazioni diofantee 293

Teorema di Mordell. (Louis Joel Mordell, 1922). Il teorema riguarda le


curve piane definite da un’equazione omogenea di grado 3, non singolare,
ossia la curva ammette tangente (unica) in ogni punto. (Si sa che le cubiche
non singolari rappresentano le curve di genere 1, mentre le cubiche singolari
hanno genere 0 e sono quindi di natura più semplice). Se C è una curva sif­
fatta, è possibile definire una notevole procedura geometrica per produrre
nuovi punti razionali da alcuni punti già in nostro possesso. Considerati due
punti P, Q su C, si osserva che la retta per P eQ incontra C precisamente in tre
punti (teorema di Bézout ); dunque otteniamo un nuovo punto R come terza
intersezione. (Un caso speciale è P = Q, nel qual caso la retta sarà la tangente
alla curva in P). È poi facile vedere che le coordinate di R sono espresse da
funzioni razionali delle coordinate di P e di Q; pertanto, se i coefficienti
delle equazioni sono in Q e se P e Q sono punti razionali, allora anche R sarà
razionale. Questo «metodo della corda e della tangente»*, iterato più e più
volte, è spesso sufficiente per generare infiniti punti razionali su C a partire
da pochi tra essi; anche un singolo punto può bastare, come nell’esempio
Y2 = X 3 — 2 e il punto (3,5).
Ebbene, il teorema di Mordell prevede che, inversamente, tutti ipunti
razionali su C possono essere ottenuti col metodo della corda e della tangente a
partire da un numero finito tra essi. (Naturalmente, quello che è cruciale qui
è il termine «finito», contrapposto alla possibile esistenza di infiniti punti
razionali)’.
Un altro fatto notevole è che, scelto un punto come elemento neutro, il
metodo origina in modo semplice una legge di gruppo abeliano tra i punti
di C. Ossia, si può definire a partire dalla procedura descritta un’addizione
tra punti della curva (da non confondersi con l’usuale addizione tra nu­
meri o vettori), espressa da funzioni razionali delle coordinate. Il teorema
di Mordell si può allora formulare elegantemente in linguaggio algebrico,
affermando che questo gruppo dei punti razionali sulla curva è un gruppo
abeliano finitamente generato. In altre parole ancora, esistono punti razio­
nali (in numero finito) P ,....... P{ tali che ogni punto razionale si può scri­
vere come m ìPl + ... + m P s, essendo mx.......ms numeri interi, e laddove
i «multipli» wrP; e le varie operazioni di somma vanno intesi appunto nel
senso del gruppo in questione. Questo si può vedere come un nuovo tipo di
parametrizzazione. (Tutto ciò è estremamente significativo, anche alla luce
delle «formule di addizione» - analoghe a quelle per le funzioni trigonome­
triche- nella classica teoria analitica delle funzioni ellittiche. Tramite queste

' Le formule algebriche soggiacenti al metodo della tangente erano note già a D iofantoeBachet.
Pare invece che la costruzione geom etrica sia stata osservata per la prima volta da Newton.
’ La storia di questa scoperta è alquanto peculiare: Mordell infatti stava cercando di ottenere
un risultato di tipo diverso. Non vi riusef, ma il formalismo dei suoi calcoli gli suggerf la validità di
quella che, a sua insaputa, era un’ipotesi formulata da tempo da Henri Poincaré.
294 Umberto Zannier

funzioni l’operazione di addizione sulla curva corrisponde grosso modo al­


l’usuale addizione tra numeri complessi. Abbiamo qui un ottimo esempio di
connessioni tra soggetti matematici apparentemente lontani, come l’analisi
complessa, la geometria e la teoria dei numeri).
Un importante invariante è il minimo numero di punti necessari a generare
l’intero gruppo. Data che sia C, i punti di ordine finito (ossia che possiedono
solo un numero finito di multipli) si possono determinare e costituiscono in un
certo senso la parte «finita», meno importante nell’intero gruppo. Il numero r
dei punti generatori rimanenti è invece più misterioso: esso si denomina rango
della curva e non sono noti algoritmi che permettano con certezza di determi­
narlo (anche se in pratica questo è spesso possibile); nemmeno si sa se il rango
possa essere arbitrariamente grande al variare della curva C.
H rango «regola» la densità dei punti razionali su C, in ogni caso assai più
rarefatti di quelli su una curva di genere 0 come il cerchio: essi sono infiniti
se e solo se r > 0 e si sa che il numero di quelli con «altezza» ^ T (cfr. nota
19) è «* (log T)"'2; sul cerchio invece il loro numero è ~ T.
Esiste una celebre congettura che lega il rango con le serie L della curva.
Queste ultime sono funzioni L(s) di una variabile complessa s che grosso
modo si ottengono come prodotti infiniti in cui il fattore p-imo (dove p è un
numero primo) tiene conto dei punti della curva considerata «modulo p».
Tali serie L erano state introdotte in analogia con le serie L di Dirichlet nella
teoria dei numeri primi. Negli anni Sessanta, motivati anche da estensivi
esperimenti numerici al computer, Bryan Birch e Sir Peter Swinnerton-Dyer
intuirono che il comportamento analitico della serie vicino al punto s = 1
rispecchiava la densità dei punti razionali. Formularono quindi la «conget­
tura di Birch e Swinnerton-Dyer» per cui lordine di zero di L(s) in s = 1 è
proprio il rango della curva. La congettura inserisce il soggetto in un quadro
più ampio; si è rivelata centrale, ma è tuttora misteriosa, ad eccezione di
alcuni casi spedali [cfr. Cassels e Fròhlich 1967; Lang 1990].
Tornando al teorema di Mordell, André Weil nel 1928 lo estese alle varietà
abeliane, che generalizzano in dimensione superiore le curve di genere 1: su
di queste varietà proiettive è pure definita un’addizione tra punti (razionali)
espressa da (unzioni razionali delle coordinate. Il risultato finale prende oggi il
nome di «teorema di Mordell-Weil». Esso ha un forte contenuto geometrico;
ricordiamo ad esempio che Francesco Severi, apprendendo l’enunciato dal
giovane Weil in visita a Roma, immediatamente ne comprese l’analogia col
proprio «teorema della base» sulla generazione finita del gruppo (detto «di
Néron-Severi») di curve su una superficie, a meno di equivalenza algebrica10.

Per un* dìmonrazione dei teoremi di Mordell e/o di Mordell-Weil. cfr. Bombieri c Gubler
[2006], Cauels [1966; 1991],Hindry cSilvermtn [2000], Mordell [ 1969], Nateli [ 1929], Siivcrman
[ 1986], Serre [1989] e Silvcrinan e Tate [19921
Risultati e metodi nella teoria delle equazioni diofantee 295

Teorema di Siegei. (Cari Ludwig Siegei, 1929). Un’equazione diofantea


f{X,Y) = 0, dove f è un polinomio irriducibile, ha solo un numero finito di
soluzioni intere, a meno che la curva definita da f sia di genere 0 e abbia al piti
due punti all’infinito.
Si tratta di un risultato di grande generalità (ad esempio, il teorema di
Thue ne è un corollario assai speciale). Si osservi che quando la curva/(X, Y)
= 0 è una cubica non singolare (di genere 1) possono esistere, come abbiamo
visto, infiniti punti razionali, ma questo teorema dice che i punti interi sono
comunque in numero finito.
Inoltre, a partire dal teorema si può vedere che se esistono infiniti punti
interi essi si possono parametrizzare. Vediamo alcuni esempi che illustrano
il caso generale: abbiamo già incontrato la curva di equazione Y2 = X 3 + X 2
(una cubica singolare, di genere 0); come si era osservato, si può porre
X = n2 — 1, Y = « 3 — «, dove il parametro » è un intero qualunque. An­
cora più semplicemente, i punti interi sulla retta 5X + 1Y = 1 si otten­
gono ponendo X = 3 + 7 n, Y = — 2 — 5«. Un altro caso, più comples­
so, si ha con l’iperbole di equazione X 2 — 2Y2 = 1, laddove si può porre
± IX = a ” + a~n, ± 2yflY = a " - a ”", essendo a = 3 + 2-J2 e n un nu­
mero intero. (Si noti che i valori cosi ottenuti per X, Y sono sempre numeri
interi). In quest’ultimo caso le formule sono di natura esponenziale e i punti
interi sono più rarefatti (invece i punti razionali su questa stessa iperbole si
possono parametrizzare con formule più semplici, come per il cerchio). È un
fatto che la differenza nelle parametrizzazioni in questi esempi sia di natura
geometrica: le prime due curve hanno un solo «punto all’infinito», mentre
l’iperbole ne ha due.
Dimostrato da Siegei con metodi per l’epoca assai avanzati, usando un
rafforzamento delle tecniche di Thue, nonché il citato teorema di Mordell-
Weil, anche questo è un risultato ineffettivo11.
Una sorprendente e profonda connessione, evidenziata soprattutto da
Paul Vojta negli anni Ottanta, ha mostrato come questo teorema sia analogo al
famoso teorema di Picard nell’analisi complessa: unafunzione meromorfa non
costante assume su C tutti i valori tranne al più due (compreso»). Nella visione
di Vojta una famiglia infinita di soluzioni intere è qualcosa di analogo a una
soluzione in funzioni olomorfe [cfr. Bombieri e Gubler2006; Lang 1990].

Teoremi di Baker. (Alan Baker, 1968 circa). Le soluzioni intere nel teo­
rema di Thue possono essere effettivamente determinate. Inoltre, ipunti interi
su una curva affine di genere 1 si possono effettivamente determinare.

" Dimostrazioni moderne si trovano in Bombieri e Gubier [2006], Silverman £J986J, Serre
[1989] cZannier [2002].
296 Umberto Zannier

Questi risultati vanno in direzione opposta alla soluzione negativa al


decimo problema di Hilbert, sopra ricordato. Si noti che per i teoremi di
Thue e di Siegei i punti in questione sono in numero finito, ma quei metodi
non danno una regola per calcolarne le coordinate. (Invece il teorema di
Siegei per curve di genere > 1 non ricade nei metodi di Baker, né si sa al
momento come renderlo completamente effettivo). Gli algoritmi di Baker
richiedono in generale un’elevata complessità di calcolo, ma l’importanza
concettuale di queste possibilità è fondamentale: i problemi che vi rica­
dono possono essere risolti con una procedura puramente meccanica, per
quanto laboriosa.
I risultati di Baker, tra i pochi che siano effettivi in questo genere di que­
stioni, vennero dimostrati con tecniche provenienti dalla teoria dei numeri
trascendenti [Baker 1975]. Un importante approccio effettivo compieta-
mente nuovo, più vicino ai metodi di Thue, è stato invece proposto più
recentemente da Enrico Bombieri, che attorno al 1990 ha trovato dimo­
strazioni effettive di tipo diverso (e in certi casi vantaggioso) per i teoremi
in questione.

Teorema di Faltings. (Gerd Faltings, 1982). Una curva di genere ^ 2 ha


al più un numero finito di punti razionali.

Come si è visto, possono invece esistere infiniti punti razionali, para-


metrizzabili semplicemente, quando il genere della curva è 0. E quando il
genere è 1 essi possono ancora essere infiniti, quantunque siano più rarefatti.
Dunque il teorema completa un quadro in cui è il genere (piuttosto che il
grado) alla base dell’esistenza e della distribuzione di infiniti punti razionali
su una curva. Ricordiamo ancora che il genere di una curva data si può de­
terminare semplicemente, pertanto il teorema è facilmente applicabile.
Con questo risultato di grande generalità, dimostrato con tecniche geo­
metriche estremamente sofisticate, Faltings confermava una congettura
avanzata già da Mordell circa sessantanni prima. Si osservi che, se il genere
è ^ 2, la conclusione rafforza in modo sostanziale il teorema di Siegei, che
prevede la finitezza solo delle soluzioni intere. Prima della dimostrazione
di Faltings, per le curve di genere ^ 2 era noto solo un risultato di David
Mumford (1965) che affermava come gli eventuali punti razionali fossero
estremamente rari. I metodi di Mumford [cfr. Bombieri e Gubler 2006;
Hindry e Silverman 2000; Serre 1989], sempre geometrici, ma di natura di­
versa rispetto a quelli di Faltings, vennero ripresi da Vojta, che ottenne una
seconda dimostrazione per la congettura di Mordell. A sua volta, Faltings
estese le idee di Vojta alle varietà abeliane. (Queste dimostrazioni usavano
certi risultati assai difficili di geometria aritmetica, dovuti ad Arakelov, Gillet,
Soulé). Bombieri intuì un legame fra queste tecniche e quelle usate da Klaus
Friedrich Roth nel contesto del teorema di Thue (cfr. §4); ne risultò un prò­
R isultati c m etodi nella teorìa delle equazioni diofantee 297

fondo chiarimento della logica complessiva e un’ulteriore dimostrazione del


teorema di Faltings, sostanzialmente più accessibile e con il gran pregio di
produrre una stima esplicita per il numero di punti razionali su una curva di
genere ^ 2 [Bombieri e Gubler 2006; Hindry e Silverman 2000].
Altri profondi risultati sulle curve sono dovuti a Barry Mazur, Loie Merel
e altri, che hanno trovato in certi casi tutti i punti razionali su intere famiglie
di curve modulari. Tralasciamo però gli enunciati, perché troppo tecnici.
Ricordiamo infine la già citata soluzione di Andrew Wiles (1993) all’ul­
timo teorema di Fermat [cfr. Cornell, Silverman e Stevens 1997], che pos­
siamo riformulare dicendo che per n > .ò , i soli punti razionali sulla curva
Xn + Yn = 1 sono tali che XY = 0. L’ipotesi era stata dimostrata per n = 4
già da Fermat, per « = 3 da Eulero, per n = 5 da Dirichlet, mentre Ernst
Eduard Kummer, introducendo nuove idee rivelatesi poi fondamentali in
tutta la matematica, ne era venuto a capo per moltissimi altri valori di n
[Borevic e Safarevic 1967]. È un fatto semplice che la curva X” + Yn = 1
ha genere ^ 2 per n ^ 4, cosicché il teorema di Faltings implicava che le
soluzioni fossero in numero finito per ciascun singolo n 4, un notevole
avvicinamento al teorema in questione. Però tali idee non consentivano di
attaccare il problema simultaneamente per tutti gli n ^ 411.
E anche opportuno precisare che Wiles ha in realtà dimostrato la con­
gettura di Taniyama-Shimura, sul fatto che le curve ellittiche su Q si possano
parametrizzare mediante funzioni modulari. Che tale congettura implicasse
l’ultimo teorema di Fermat era stato osservato da Gerhard Frey e Ken Ribet
precedentemente alla dimostrazione di Wiles, una connessione questa di per
sé molto profonda e sorprendente1*.

3.1. R is u lta ti in d im e n sio n e su p erio re.

Ci siamo limitati finora alle curve. Per varietà di dimensione superiore


(ad esempio, per equazioni in più di due variabili), la conoscenza attuale è
più frammentaria. Ci limitiamo a qualche cenno.
L’esempio più semplice si ha con i sistemi lineari: i punti razionali rica­
dono nell’algebra lineare, mentre quelli interi si parametrizzano facilmen­
te a partire dal caso delle rette trattato da Euclide. Anche la teoria delle
equazioni quadratiche in un numero arbitrario di variabili è per certi versi
completa, quantunque presenti problemi assai più spinosi del caso lineare.
Fu sviluppata da vari autori a partire da questioni poste da Fermat. Qui ri­

11 Va detto c h c l’ipotesi di Ferm at è specifica di Q, mentre il risultato di Faltings si estende alle


soluzioni in cam pi di num eri algebrici, che incontrerem o nella discussione dei metodi.
11 Per un’introd uzione alla dim ostrazione di W iles cfr. Cornell. Silverman e Stevens [1997]; per
precedenti risultati in prospettiva storica, Edwards r 1977]. Si veda anche il saggio di M. Bcrtolini,
L'ultimo teorema di Fermat, in questo stesso volume, pp. 313-34.
298 Umberto Zannier

cordiamo solo che le domande (i), (ii), (iii) poste sopra ammettono risposta
affermativa per questo tipo di equazioni. Invece già i sistemi di due equazioni
quadratiche omogenee in quattro variabili sfuggono a una risposta completa
(le soluzioni rappresentano talvolta punti razionali su curve di genere 1).
Wolfgang M. Schmidt dimostrò intorno al 1970 importanti teoremi di
finitezza per equazioni del tipo F(xv ..., xn) = c dove F è un polinomio
omogeneo che si spezza in fattori lineari su una chiusura algebrica. Le con­
clusioni estendono il teorema di Thue a una dimensione arbitraria [Bombieri
e Gubler 2006]. Recentemente i risultati di Schmidt hanno avuto nuove
applicazioni allo studio dei punti interi su altre varietà affini di dimensione
> 1, con ipotesi di riducibilità del divisore all*infinito\ per certi versi questo
generalizza il teorema di Siegei [Zannier 2002].
Risultati molto profondi sono quelli di Faltings, a cui si accennava, che
si applicano alle varietà X che (come le curve di genere positivo) possono
essere immerse in una varietà abeliana A Ad esempio Faltings dimostra in tal
caso che (congettura di Lang) X può contenere infiniti punti razionali solo se
contiene un traslato di una sottovarietà abeliana di A con dimensione positiva.
Questo notevole teorema contiene la congettura di Mordell.
Faltings stesso e poi Vojta hanno dimostrato enunciati di finitezza per i
punti interi su sottovarietà affini di varietà semiabeliane (rinunciamo qui a
ogni approfondimento). Per varietà generali, Bombieri, e poi Lang e Vojta,
hanno proposto congetture molto suggestive che descrivono gli insiemi di
punti razionali o interi a partire da invarianti geometrici come la classe ca­
nonica [Lang 1990]. Purtroppo sembra che una dimostrazione di queste
ipotesi sia molto lontana”.

4. Alcuni metodi notevoli.

I metodi sviluppati a tutt oggi fanno spesso capo ai filoni che descrivere­
mo in questo paragrafo (e alle loro combinazioni).

4.1. Il m etod o della d iscesa.

Inaugurato da Fermat, il metodo della discesa consiste nel produrre, data


un’ipotetica soluzione in interi positivi, una nuova soluzione per la stessa
equazione però con numeri più piccoli (da cui la «discesa»). Quando questa
procedura è possibile, una sua indefinita iterazione contraddice l’iniziale

14Sorvoliamo invece tulle ricerche sul «problema di Waring», di rappresentare i numeri interi
come somma di un numero dato di potenze fucate (ad esempio auarte potenze) di interi. Si tratta di
un soggetto che sconfina in un altro settore della matematica, e cne oggi viene affrontato soprattutto
con tecniche analitiche.
Risultati c m etodi nella teoria delle equazioni diofantee 299

ipotesi di esistenza di soluzioni: non possono esistere infiniti numeri interi


positivi, ciascuno inferiore al precedente.
In questa forma, più che un metodo quello della discesa è un principio
logico, peraltro equivalente al «principio di induzione», un assioma di fon­
damento per gli stessi numeri interi. Il fatto notevole evidenziato da Fermat
è tuttavia rappresentato dalla possibilità concreta di una tale discesa in molti
contesti diofantei. Cosi Fermat dimostrava ad esempio che «l'area di un
triangolo rettangolo in numeri interi non può essere un quadrato» [Fermat
2006, p. 70]. In maniera equivalente, nessuna delle equazioni X 4 —Y4 = Z2
zY (Y + 1) = 2 X 4 ha soluzioni intere, tranne quelle (date daXYZ = 0
e da Y = 0, ± 1 nei due casi). Ne segue in particolare anche il caso n = 4
dell’ultimo teorema di Fermat.
Fermat e più tardi Eulero e altri applicarono il principio anche in forma
costruttiva, agli interi rappresentabili come somma di due quadrati e a simili
questioni. Anche certe teorie moderne conservano un’importante traccia di
questo metodo, come nel caso del teorema di Mordell-Weù (cfr. anche § 4.5).
Come semplice esempio di discesa, mostriamo che l’equazione X 2 + 1
= (4 Y + 3)Z non ha soluzioni in numeri interi xty ,z ^ 0. Altrimenti è facile
vedere (cambiando x col suo resto nella divisione per 4y + 3 e cambiando z
di conseguenza) che si può supporre x minore di 4y + 3. Inoltre, cambiando
se necessario x con 4y + 3 — x, possiamo anche assumere che x sia pari. Sic­
come in tal caso x2 +1 ha resto 1 nella divisione per 4, ne risulta facilmente
che z deve avere resto 3 nella divisione per 4, e si potrà scrivere z = 4/ + 3,
con y' intero. D ’altra parte, si ha
z = (x2 + l)/(4 y + 3) :£ ((4)' + 2)2 + l)/(4;y + 3) <4y + 3.
Pertanto y' < y. Ora l’uguaglianza x2 + 1 = (4/ + 3)z\ dove z' = 4y + 3,
mostra che l’equazione di partenza ha un’altra soluzione in cui al posto di
y figura il numero più piccolo y'. Proseguendo in tal modo si ottiene una
contraddizione. (Un’elegante applicazione di questa conclusione si ha per i
punti interi sulla curva di genere 1 di equazione Y2 = X 3 + 7. Si vede facil­
mente anzitutto che, per un’eventuale soluzione intera X = a,Y = b,a deve
essere dispari, per cui a = 2c + 1, con c intero. Scrivendo poi l’equazione
equivalente b 2 + 1 = a} + 8 = (a2 —2a + 4 )(a + 2) = (4c2 + 3)(2c + 3) si
ottiene una contraddizione con il risultato precedente, ove si ponga y = c2t
z = 2c + 3. Pertanto la curva considerata non ha punti interi).

4.2. M e to d i a lg e b r ic i.
Nella loro forma più arcaica, i metodi algebrici consistono in una manipola­
zione opportuna delle formule. Identità quali (a2 + PHc2 + d 2) = (ac —bd)2+
+ (ad + oc)2furono fondamentali nelle ricerche sugli interi somma di due qua­
drati. Un altro esempio è una notevole formula per l’equazione Y2 = X* + c
che Diofanto e Bachet trovarono algebricamente; ovvero, se (x, y) è
300 Umberto Zannier

-8 c x - x 6 - 2 0 cx 3 + 8 c 2
una soluzione (razionale), allora anche
4y2 8y3
una soluzione (razionale). (L’identità è riconducibile al sopra citato «metodo
della tangente»).
Più profondi sono però gli aspetti aritmetici dei metodi algebrici, come ad
esempio il ben noto principio di fattorizzazione unica in numeri primi, valido
per i numeri interi. Dovuto nella sua essenza già a Euclide, esso consente di
estrarre informazioni considerando due scomposizioni in fattori di una stessa
quantità. Un semplice esempio viene dall’equazione X 2 + Y2 = Z2 delle teme
pitagoriche. Scrivendo Y2 = (Z + X){Z —X), si ottiene che ciascun divisore
primo del prodotto (Z + X)(Z —X) deve comparirvi con un esponente pari,
per cui compare con esponenti di uguale parità nei due fattori. Si raggiungo­
no allora facilmente le formule X = 2abc, Y = {a2 - P )c, Z = {a2 + P )c, che
danno tutte le soluzioni per sostituzione di numeri interi arbitrari al posto
di a, b, c. Per esempio, con a = 2, b = c = \ s i ritrova la terna X = 4, Y = 3,
Z = 5. Si ha qui un esempio di risposta completa alla domanda (ii).
Talvolta le scomposizioni hanno luogo non con interi, ma con irrazionali
algebrici15. D principio di fattorizzazione unica deve allora essere esteso fuori
da Z. Ad esempio, l’equazione Y2 +2 = X 3 (proposta da Fermat [2006],
questione 19 di Diofanto) si scrive come ^Y + -y/^2j(y - yj-2^ = X 3; il
termine additivo Y2 +2 è diventato moltiplicativo, della stessa natura del
termine X\ Per poter proseguire è però ora necessario disporre di teoremi
aritmetici per interi di tipo più generale, nel caso specifico quelli della forma
a + b y[-2, dove a , b sono usuali interi in Z. È possibile dimostrare che il
concetto di primo e l’aritmetica si generalizzano a questi numeri, il che con­
sente di risolvere facilmente l’equazione posta, dimostrando che le uniche
soluzioni intere sono date da X = 3, Y — ± 5 , risultato a priori hen lontano
dall’ovvio. Un altro esempio celebre si ritrova con gli interi gaussiani, della
forma a + b y j - 1, con a, b interi usuali. In generale, si può dimostrare un
principio di fattorizzazione unica negli anelli di interi algebrici, costruiti a
partire da singoli numeri algebrici (un po’ come gli interi gaussiani sono
costruiti a partire da yf-ì ). Il principio in generale non vale però per gli
elementi dell’anello (come invece accade per Z e per gli interi gaussiani), ma
solo per i cosiddetti ideali degli anelli stessi16. Questa proprietà, più debole

^ Ricordiamo che un numero 4 si dice algebrico se è soluzione di un’equazione algebrica +


••• + d.-ifc + =* 0, doveav ....a msono numeri razionali.
. Concetto introdotto da Kummer nelle ricerche sull’ultimo teorema di Fermai e diventato
poi fondamentale nell’intera matematica. Su questo argomento si veda A. Granvfllc, Il teorema
fondamentale delttritmetica, in questo stesso volume, pp. 1) 1-66.
Risultati e metodi nella teoria delle equazioni diofantee 301

di quella valida per Z, è spesso però altrettanto efficace per le applicazio­


ni. In questa forma, tali risultati sono stati stabiliti con ricerche a partire
da Gauss, Kummer, Richard Dedekind e altri [Borevic e Safarevic 1967;
Edwards 1977].
Oggi spesso le equazioni diofantee e le loro soluzioni si considerano di­
rettamente in anelli generali di questo tipo, la cui aritmetica presenta molti
altri punti che meritano considerazione. Per brevità ci limitiamo qui a un
cenno sugli elementi invertibili x dell’anello, ossia tali che \/x stia anch’esso
nell’anello. Tra gli interi ordinari, solo ± 1 hanno questa proprietà, mentre
dobbiamo aggiungere ± 7 nel caso degli interi gaussiani. Già per anelli
quadratici più generali, costituiti dai numeri x + yy/d , dove x, y variano tra
gli usuali interi e d è un fissato intero non quadrato, le cose cambiano: per d
positivo gli elementi invertibili sono infiniti, e forniscono soluzioni dell’equa­
zione di Peli (proposta in realtà da Fermat) X2-d Y 2 = ±1 [cfr. Mordell
1969]. Ecco un esempio (già incontrato) di curva non lineare (un’iperbole)
con infiniti punti interi, descritti da opportune formule esponenziali. Per
d = 2 si trovano ad esempio le formule x + yyfì = ± (l + ^2 )" per le solu­
zioni di X 2 — 2 Y2 = ± 1 , che danno le uguaglianze l 2 - 2 X l 2 = - 1 ,
32 - 2 X 22 = 1, ..., 992 — 2 X 702 = 1,239* - 2 X 1692 = - 1 , . . . .Esse
risolvono l’antico problema greco di trovare (infiniti) numeri N che siano
simultaneamente quadrati e triangolari (basta porre, quando il segno è po­
sitivo, N = 3^/4).
Nel caso di un anello arbitrario di interi algebrici, la struttura degli ele­
menti invertibili fu completamente chiarita da Dirichlet, che dimostrò [cfr.
Borevic e Safarevic 1967] che esistono sempre elementi -q,, ...,7), nell’anello
(e Dirichlet determinò il numero r) tali che ogni elemento invertibile del­
l’anello stesso si può scrivere come prodotto •••i)/ per opportuni nu­
meri interi j j , ..., ar. Questo teorema «di generazione finita»17consente di ri­
condurre certe equazioni diofantee usuali a equazioni diofantee esponenziali
(in quanto qui a variare sono appunto gli esponenti ...... a). Queste ultime
possono essere talvolta risolte con metodi di approssimazione diofantea, cui
accenneremo.

4.3. M e to d i lo c a li.

Di natura analitica, nella loro forma più semplice i metodi locali consi­
stono nel considerare i numeri razionali come inclusi in un ambito più vasto,
come i numeri reali, nel quale le cose si semplificano. Cosi ad esempio l’equa­
zione X 2 4- Y2 4- 1 = 0 non ha soluzioni razionali, poiché non ne ha di reali.

L o si può vedere com e analogo moltiplicativo del teorema di Mordell-Weil.


302 Umberto Zannier

Al posto dei numeri reali, si possono considerare tuttavia altri campi locali,
come il campo p-adico Qp> costruito a partire dalle congruenze modulo le
potenze di un fissato primo pia. In generale, la solubilità p-adica di un’equa­
zione f(x) = 0 è equivalente alla solubilità di tutte le congruenze associate
f(x) = 0 (mod pm), modulo le potenze pmdel numero primo p.
La considerazione di congruenze associate a un’equazione diofantea è
motivata dal fatto che esse individuano una condizione necessaria alla solu­
bilità dell’equazione stessa. Ad esempio, l’equazione 4X — 6Y = 5 non ha
soluzioni intere, poiché il termine sinistro è comunque pari, se X, Y sono
interi, ossia la congruenza associata AX —6Y = 5 (mod 2) non ha soluzioni.
E in modo simile, ma un po’ meno evidente, X 2 + Y2 = 21 non ha soluzioni
razionali (mentre ne ha di reali), poiché non ha soluzioni in numeri 3 -adici\
in sostanza, ciò si riduce al fatto che la congruenza X 2 + Y2 = 21 (mod 9)
non ha soluzioni (un fatto quest’ultimo verificabile per sostituzione al po­
sto di X, Y di interi compresi tra 1 e 9: 81 possibilità al più).
Fu stabilito da Helmut Hasse e Hermann Minkowski [cfr. Borevic e
Safarevic 1967; Serre 1975] che per le equazioni quadratiche il test locale è
condizione non solo necessaria, ma anche sufficiente all’esistenza di soluzio­
ni razionali, purché lo si esegua per i numeri reali IR e per tutti i campi p-adici
Qp. In altri termini, un’equazione quadratica ha soluzioni razionali se e solo
se ha soluzioni reali e le congruenze corrispondenti sono tutte risolubili.
(Per le coniche, definite da equazioni quadratiche omogenee in tre variabili,
il risultato risaliva a Lagrange e Legendre, che avevano usato il metodo della
discesa; cfr. Weil [1984]).
Questo criterio, denominato «principio locale-globale», o «principio di
Hasse», è importante anche perché la solubilità locale è facilmente controllabi­
le. (Infatti, per un dato modulo di una congruenza bastano un numero finito di
verifiche. Inoltre si sa ragionare in un colpo solo per tutti i moduli abbastanza
grandi). Purtroppo il principio di Hasse si conosce solo per poche famiglie
di equazioni, accanto a quelle quadratiche: vale ad esempio per ogni curva di
genere 0 (d si riconduce a un’equazione quadratica per il teorema di Hilbert-
Hunvitz), ma fallisce già per certe curve di genere 1 (come dimostrato da Ernst
Selmer) e per le soluzioni intere di equazioni quadratiche. Tuttavia il metodo
costituisce quantomeno una cruciale condizione necessaria per la solubilità.

wSi parla del campo dei numeri p-adici [cfr. Borevif e Safarevil 1967; Serre 1975] come il
completamento di Q rispetto al valort assoluto p-adico. che si definisce ponendo |/>" <i/£ | = p~m se
p è un primo che non divide gli interi a,b. Ad esempio, |l2/5|z = 1/4, 112/5|5 = 5, 112/5|7 = 1-
In tal modo, gli interi divisibili per un’elevata potenza di p sonop-adicamente piccoli. In questa con­
cezione, Q , è analogo al più familiare campo R dei numeri reali, che è il completamento di Q rispetto
al valore assoluto usuale. Questi campi si dicono «locali» poiché sono per molti versi analoghi ai
campi costituiti da funzioni considerate «localmente», in un intorno di un punto prefissato.
Risultati c metodi nella teorìa delle equazioni diofantee 303

Successivamente a Hasse, importanti studi sulla validità di un principio


locale-globale sono stati condotti da J. W. S. Cassels, J.-L. Colliot-Thélène,
M.J. T. Guy, Yu. Manin, E. S. Selmer, P. Swinnerton-Dyer.J. Tate e altri [cfr.
Colliot-Thélène 1992 o Manin 1974].
I numeri p-adici, introdotti da Kurt Hensel all’inizio del Novecento,
hanno anche ispirato vaste teorie che generalizzano quella classica delle
funzioni analitiche [cfr. Borevic e Safarevic 1967]. Le informazioni pro­
dotte dalle congruenze possono essere cosi studiate in modo sistematico,
con tecniche prima note solo per i numeri reali o complessi. Un esempio
relativamente semplice si ha con l’equazione 2" = X 2 + 7, con le soluzio-
ni n = 3, X = 1; n = 4, X = 3; n = 5, X = 5; n = 7, X = 11 e, sor­
prendentemente, n — 15, X = 181. Scrivendola nella forma fattorizzata

-(x +p ) ( x - p ) . si perviene con metodi

ri+pr 2 fi-P)
algebrici (§ 4.2) all’equazione ± V T 7 = o.
. * J “y 2 /
Ebbene, scelto un numero primo p 2, il termine sinistro può essere visto in
termini di una funzione analitica di una variabile intera p-adica n. Come per
i numeri complessi in un compatto, la funzione può avere solo un numero
finito di zeri, per cui l’equazione esponenziale ha solo un numero finito
di soluzioni in numeri interi p-adici n , e dunque a fortiori in interi usuali.
Procedendo a ritroso, pure l’equazione di partenza ha solo un numero finito
di soluzioni intere. (Spingendo più a fondo questa analisi, si trova, con p = 7,
che le soluzioni sono solo quelle elencate).
Thoralf Albert Skolem, Claude Chabauty e altri, nella prima metà del
xx secolo, hanno usato questi metodi in modo sistematico [cfr. Borevic e
§afarevic 1967; Serre 1989], giungendo a risultati di notevole generalità (ad
esempio Skolem ottenne una nuova dimostrazione di un risultato solo di
poco più debole del teorema di Thue); i metodi sono stati riconsiderati an­
che di recente, e talvolta conducono alla determinazione esplicita di tutte le
soluzioni, anche laddove altre tecniche più sofisticate falliscono.

4.4. M e to d i di a p p ro ssim a z io n e d iofan tea.

Introdotti a partire da Thue all’inizio del Novecento (almeno nella loro


forma attuale), i metodi di approssimazione diofantea si fondono con tec­
niche sviluppate nello studio dei numeri trascendenti (ossia non algebrici).
Grosso modo, si impiegano per studiare e costruire buone approssimazioni
razionali per numeri irrazionali. Ricordiamo che ogni numero irrazionale
reale si può approssimare con precisione arbitraria con numeri razionali;
304 Umberto Zannicr

un’approssimazione però si considera buona quando la precisione ottenuta


è elevata relativamente alla complessità della frazione usata: ci si vuole avvi­
cinare a un numero reale usando numeri razionali «semplici». Ad esempio,
con 141/100 ci si avvicina a >Ì2 per circa 1/250, mentre con la frazione più
semplice 99/70 la precisione è superiore a 1/10 000. Esempi come questo
rivelano come possa essere importante comprendere la natura delle frazioni
che forniscono buone approssimazioni.
Già Dirichlet aveva stabilito che, dato un numero irrazionale reale £ ar­
bitrario, si possono trovare infinite frazioni p/q tali che |£ - (p/q)\ < 1/ q 2.
Il matematico norvegese Axel Thue, all’inizio del Novecento, stabili una
limitazione alla possibilità di fare molto meglio nel caso in cui £ sia un nu­
mero algebrico. Per gli irrazionali quadratici, come V2 , questo era un fatto
elementare e già chiaro da tempo, ma Thue si occupò di numeri di grado
superiore, dimostrando ad esempio che

ad eccezione di un numero finito di frazioni p/q. Ciò migliorava un preceden­


te risultato di Liouville, in cui in sostanza 11/4 veniva sostituito da 3. Questa
differenza, che può apparire insignificante, è invece decisiva nell’applicazio­
ne del risultato a un’equazione diofantea come X } — 2 Y } = 1. Infatti, scri­
vendo quest’ultima come (X/Y)} - 2 = 1/Y}, si vede facilmente che le sue
soluzioni intere forniscono approssimazioni X /Y per IJl, che contraddico­
no (per Y grande) il risultato di Thue (ma non quello di Liouville). Ne segue
che le soluzioni dell’equazione sono in numero finito. (Invece l’equazione di
Peli X 2 —dY2 = ± 1 già ricordata, pur corrispondendo anch’essa a buone
approssimazioni, questa volta per yjd, non contraddice il risultato di Thue
e in effetti ammette infinite soluzioni intere quando d > 0 è un intero non
quadrato).
Il metodo di Thue (che egli sviluppò per numeri algebrici £ arbitrari,
applicando poi i risultati alle equazioni /(X, Y) = c, con / polinomio omo­
geneo) non richiedeva strumenti matematici particolarmente avanzati, ma
era estremamente ingegnoso. Con tecniche di algebra lineare egli costruiva,
a partire da un’ipotetica «ottima» approssimazione p/q per £, una serie di
nuove approssimazioni p j q n, n = 1,2, ..., anch’esse relativamente buone,
e laddove la successione dei denominatori qn aveva crescita non troppo ra­
pida. (La costruzione avveniva tramite un’interpolazione polinomiale che
sfruttava l’equazione algebrica per £). A questo punto egli usava un semplice
ma cruciale «principio delle lacune»: più le approssimazioni a £ sono buone ,
più esse sono rare, ossia vi sono grosse lacune tra i rispettivi denominatori.
Siccome le approssimazioni p j q ncostruite non presentavano lacune troppo
grandi, non c’era spazio per altre ottime approssimazioni.
Risultati c metodi nella teoria delle equazioni diofantee 305

Tale metodo venne sviluppato e potenziato, tra gli altri, da Siegei, Alek-
sandr Gel'fond, Frecman Dyson. Roth dimostrò nel 1955 un risultato con­
clusivo: nella disuguaglianza (*) al posto di 11/4 si può usare un numero
arbitrario > 2, e ciò per ogni numero algebrico al posto di yfì. In seguito
Schmidt trattò il caso molto importante di approssimazioni in dimensione
superiore.
Tutti questi teoremi, per quanto rilevanti, hanno tuttavia il difetto di es­
sere ineffettivi: pur stabilendo la finitezza del numero di soluzioni, essi non
consentono di trovarle. E questo perché nel metodo di Thue, che abbiamo
brevemente illustrato, si parte con un’ipotetica ottima approssimazione che
potrebbe anche non esistere [cfr. Bombieri e Gubler 2006; Mordell 1969;
Schmidt 1980 per dimostrazioni]. Solo più recentemente, intorno al 1990,
Bombieri ha trovato importanti risultati effettivi introducendo nuove idee
in metodi di quella stessa natura.
Tecniche simili a quella di Thue, ma applicate all’interpolazione di fun­
zioni trascendenti (come exp ex), erano state usate da Charles Hermite e
vennero riprese in forma nuova da Siegei e poi da Gel'fond, che nel 1934
risolse (indipendentemente da Theodor Schneider) un altro problema di
Hilbert (il settimo), dimostrando la trascendenza di numeri quali 2^ . Il
teorema generale di Gerfond-Schneider era equivalente al fatto che i lo­
garitmi di due numeri algebrici sono linearmente indipendenti sui numeri
algebrici, fatta eccezione per certi casi speciali facilmente classificabili. Più
avanti Baker [1975] riuscì a estendere le tecniche di Gel'fond al caso di un
numero arbitrario di logaritmi. Questi stessi metodi permettevano di quan­
tificare certe esplicite minorazioni per numeri complessi del tipo a0 log Ho
+ ax log T], + ... + a log ”nr, dove a0, sono numeri interi eTi0, ..., T]r
numeri algebrici. Al ai là di un loro intrinseco interesse, questi risultati am­
mettevano un’applicazione alle equazioni diofantee. Vediamo brevemente
come, considerando ad esempio un’equazione di Thue, qualeX3 —2V3 = c.
Ebbene, con metodi algebrici di fattorizzazione, già Siegei aveva mostrato
come fosse possibile ricondursi a un’equazione del tipo<ni + b\L = 1, in cui
a, b erano numeri algebrici fissati e le variabili x|, jjl erano elementi invertibili
in un anello di interi algebrici (cfr. § 4.2), con fi per giunta molto «piccolo».
Per il teorema di Dirichlet sopra citato, *n poteva essere espresso in forma
esponenziale come -r) = "n". Prendendo a questo punto i logaritmi, la
forma esponenziale diventa lineare, aprendo la strada a un’applicazione delle
disuguaglianze di Baker. L’importanza di queste idee è dovuta anche al fatto
che, siccome le stime di Baker sono esplicite, alla fine le eventuali soluzioni
si possono esplicitamente enumerare, ossia i teoremi ottenuti sono, come si
suol dire, effettivi. In tal modo, anche equazioni quali 2a} b —5C7J = 11 e
altre simili si possono risolvere, trovando tutte le soluzioni intere (in ciascun
caso in numero finito).
306 Umberto Zannier

I metodi di approssimazione diofantea hanno avuto poi ulteriore impulso


con importanti ricerche di David Masser, Gisbert Wùstholz e altri nel con­
testo delle curve ellittiche e varietà abeliane [Lang 1990].

4.5. M etodi g eom etrici.


Spesso soggiacenti a costruzioni algebriche anche antiche, i metodi geo­
metrici hanno rappresentato gli strumenti più moderni nello studio delle
equazioni diofantee. La loro importanza si può tra l’altro intuire osservando
che criteri geometrici appaiono già negli enunciati di alcuni dei teoremi
diofantei qui ricordati.
A partire da Weil, e poi con Jean-Pierre Serre, Alexander Grothendieck
e altri, i principi fondamentali della geometria algebrica, studiati originaria­
mente solo nel caso dei numeri reali o complessi, sono stati estesi a campi
e anelli (come Q e Z ) con struttura aritmetica. Probabilmente a ritardare
questo passaggio fu l’assenza di una visualizzazione geometrica, possibile
invece nel caso classico. Cionondimeno, in molti casi proprietà geometriche
visualizzabili si traducono in un formalismo algebrico che conserva validità
anche laddove non si possa visualizzare.
Un esempio classico si ha con i punti razionali su un cerchio, di equazione
ad esempio X 2 + Y2 = 1 di cui abbiamo già ricordato una semplice parame-
trizzazione. Essa può essere suggerita proprio dalla geometria: considerato
un particolare punto razionale, come P = (-1 ,0 ) (ma qualsiasi scelta sarebbe
efficace), sorge spontanea l’idea di proiettare da P il cerchio su una retta
(scegliamo quella di equazione X = 0), ottenendo una corrispondenza che
si intuisce subito essere biunivoca (eccettuato il caso del punto P). In formu­
le, il punto Q = (x, y) sul cerchio viene proiettato nel punto (0, y/{x + 1
21
e, viceversa, il punto (0, /) sulla retta corrisponde a Q =
V + /* 1 + t
11
Queste formule descrivono i punti sul cerchio in termini del parametro
t = y/(x + 1 ). Il fatto (per noi) notevole è che questo mostra come per t
razionale si ottengano tutti i punti razionali sul cerchio (e similmente per t
reale i punti reali, ecc.). Meno intuitivo è pervenire a queste formule per via
puramente algebrica. (Notiamo per inciso che scrivendo X , Y come frazioni
X = x/z, Y = y/z, con interi x, y, z, si perviene all’equazione x2 + y2 = z2.
Ovvero, i punti razionali sul cerchio corrispondono alle teme pitagoriche,
trattate sopra con metodi algebrici). Il metodo di proiezione è applicabile
a ogni conica, purché si disponga di un punto razionale su di essa. (Invece
proiettare da un punto esterno alla curva conduce a una corrispondenza non
biunivoca e non birazionale).
Questo è anche un esempio di come i metodi geometrici forniscano mo­
delli convenienti per le varietà algebriche in oggetto. Ossia, con opportune
Risultati c metodi nella teoria delle equazioni diofantee 307

trasformazioni (nel caso del cerchio con una proiezione su una retta) ci si può
talvolta porre in un contesto più semplice o ricco di struttura. Esempi più
profondi si ottengono quando i punti sono soggetti a leggi di composizione
che generalizzano le usuali operazioni di somma e prodotto tra numeri; un
caso notevole è rappresentato dalle varietà abeliane (come ad es. le curve di
genere 1). Si è già visto, col teorema di Mordell, come sia possibile un’ad­
dizione tra punti di una curva cubica. Quando la curva ha genere ^ 2 tale
procedura non è più definita. Tuttavia la geometria algebrica prevede che la
curva possa in ogni caso essere immersa in una varietà abeliana. Dunque, a
patto di estendere lo spazio ambiente, i punti possono ancora essere addi­
zionati. In virtù del teorema di Mordell-Weil, nuovamente i punti razionali
possono essere ottenuti per addizione a partire da un numero finito tra essi,
e ciò costituisce una preziosa informazione per l’analisi di quelli che stanno
sulla curva. (Questo approccio fu usato sia da Siegei che da Faltings e Vojta,
nei teoremi sopra citati).
Inoltre vale spesso un principio di specializzazione che traduce proprietà
geometriche in proprietà aritmetiche di singoli punti. Ad esempio, Weil
scopri che i valori di una funzione razionale su una curva (calcolata in punti
razionali o algebrici) si fattorizzano a seconda degli zeri e poli della funzione.
E Siegei dimostrò che Yaltezza aritmetica19di quei valori è legata al grado della
funzione stessa (una quantità questa di natura geometrica). O ancora, rivesti­
menti non ramificati di varietà algebriche danno luogo per specializzazione
a estensioni non ramificate di campi di numeri, come previsto dal teorema
di Chevalley-Weil. A posteriori ciò non sorprende, in quanto i campi di
funzioni razionali su una varietà presentano molte analogie con i campi di
numeri algebrici. Un semplice esempio è costituito dai polinomi, analoghi
ai numeri interi (ad esempio vale per essi la fattorizzazione unica), e dalle
usuali funzioni razionali, corrispondenti ai numeri razionali.
In senso ancora più ampio, è oggi emerso che le proprietà geometriche
influenzano in un certo senso le proprietà diofantee, un fatto questo non
proprio intuitivo in quanto la geometria in senso tradizionale concerne il
continuo mentre le questioni diofantee si occupano del discreto.

Concludiamo con qualche breve cenno tecnico sulle dimostrazioni, li­


mitandoci al teorema di Mordell sulle curve cubiche di genere 1 e a una

” L’altezza aritmetica fu introdotta da Siegd e Weil per misurare la complessità di un numero


algebrico. Ad esempio, l’altezza H(x) di una frazione razionale x = p/q ai minimi termini e sempli­
cemente il massimo tra Ipl e \q\, ed esiste un’opportuna generalizzazione a tutti i numeri algebrici.
Si può poi misurare la complessità H(P) di un punto P = ( x ,,.... x ) a coordinate algebriche sem-
pliccmcntc calcolando ad esempio la massima tra le altezze nix). II concetto di altezza si è rivelato
fondamentale nella teoria delle equazioni diofantee, per molti motivi tra cui certe proprietà che
quantificano il cambiamento dell’altezza in seguito a trasformazioni razionali. (Un semplice esempio
è H (x - ) = H ( * H ) .
308 Umberto Zannier

descrizione assai sommaria sul teorema di Siegei. Per il teorema di Mordell


è intanto possibile una prima semplificazione: la geometria algebrica preve­
de infatti che una curva di genere 1 si possa porre in form a di Weierstrass,
ossia una sua parte affine si può definire con un’equazione Y2 = / (X), con/
polinomio di grado 3 con radici distinte p,, p,, p3. L’unico punto all’infinito
può essere scelto come elemento neutro per la legge di gruppo.
Sia ora P = (x, y) un punto razionale sulla curva, cosicché y2 = /(x). Fat­
torizzando il termine/(x) in un prodotto a{x — p,)(x — p,)(x — p}), si può
vedere col principio di fattorizzazione unica (in ideali) negli anelli ai numeri
algebrici (cfr. § 4.2) che esistono punti razionali (in numero finito) R v ...,R m
sulla curva tali che si può scrivere P = 2Q + Rt, essendo Q un punto raziona­
le, e R, uno opportuno tra i punti precedenti; è fondamentale che R v ...,R m
sono indipendenti da P nel loro insieme (benché la scelta di R{ possa invece
variare con P). Qui con 2 Q intendiamo la somma Q + Q nel senso della legge
di gruppo sulla curva: in pratica, 2 Q si ottiene da Q mediante il «metodo
della tangente» sopra ricordato (similmente per la somma 2Q + R{).
Stabilito questo fatto, si considerano le «altezze» H(P) dei punti coinvol­
ti. Si può dimostrare che l’operazione geometrica di duplicazione, ossia il
passaggio da Q a 2Q col metodo della tangente, si riflette in un’uguaglianza
approssimata H(2Q) < = H*(Q). Similmente, si vede che, se Rt sta in un insie­
me finito prefissato di punti razionali e se R è un punto razionale arbitrario,
H{R ± R) ^ cH^R), dove c è un’opportuna costante. Applicando tutto ciò
all’uguaglianza P - Rt = 2 Q, si ottiene che H(Q) yjH(P): in pratica,
se ne deduce che se H(P) è grande, allora H(Q) è molto più piccolo di H(P).
A questo punto, si riparte con Q al posto di P e il principio della discesa di
Fermat si applica: dopo un numero opportuno di iterazioni si finisce in un
insieme di punti con altezza controllata. Ma un tale insieme di punti deve
essere finito (come risulta subito dalla definizione di altezza). Ciò dimostra
il teorema di Mordell”.
Abbiamo già ricordato come Thue fosse ricorso all’approssimazione
diofantea per trattare un’intera famiglia di equazioni diofantee. Fu Siegei
a trovare un modo, piuttosto recondito, di applicare quegli stessi principi a
famiglie ancora più vaste. Egli considerò una sequenza infinita P lf P2, ... di
punti interi distinti su una curva C. Le loro coordinate, espresse da numeri
interi, non possono rimanere limitate e dunque passando a una sottosuc­
cessione possiamo assumere che essi convergano verso un punto all'infinito
(che denotiamo » ) di C. Tale punto (in una compattificazione proiettiva
della curva) avrà coordinate algebriche. Nel caso delle equazioni di Thue,
l’approssimazione diofantea permette subito di concludere, confrontando la

1Questo approccio, un po’ più diretto di quello originario di Mordell, è dovuto a Weil.
Risultati c metodi nella teoria delle equazioni diofantee 309

distanza dei Pt da con l’altezza H{Pt) e ottenendo una contraddizione con


la disugaglianza di Thue per l’approssimazione ai numeri algebrici. (Questo
linguaggio costituisce essenzialmente una «traduzione» geometrica di quan­
to si era già detto a proposito del metodo di Thue sul legame tra «equazioni»
e «approssimazioni» diofantee).
Per equazioni più generali, la disuguaglianza di Thue (o uno dei suoi
rafforzamenti) non è più sufficiente. Siegei usò allora lo stesso tipo di di­
suguaglianza, ma applicata a nuovi punti. Osserviamo che i punti Pt sono
interi, dunque a fortiori razionali: se la curva è di genere 1, si può applicare
il teorema di Mordell. (Nel caso in cui il genere sia ^ 2, bisogna immer­
gere la curva in una varietà abeliana e usare il teorema di Mordell-Weil).
Se ne può dedurre che, se d ^ 2 è un intero prefissato, è possibile scrivere
P, = dQt + R', dove Qt, Ri sono punti razionali e dove gli Ri giacciono tutti
in un certo insieme finito22. Pertanto, passando a un’opportuna sottosuc­
cessione infinita di punti, si può supporre che Rt = R sia un punto fissato.
Ora, lavorando su un modello compatto della curva, si può ulteriormente
supporre che i Qt convergano verso un ceno punto Q. Non è detto che Q
sia anch’esso razionale; ma siccome i Pi convergono verso il punto algebrico
®, si vede che Q sarà un punto a coordinate perlomeno algebriche. Allora
l’approssimazione diofantea ai numeri algebrici stabilisce che Q non potrà
essere «troppo vicino» a Q, in un senso che si può quantificare elicendo che
la distanza di Q/da Q sarà superiore a H(Q/)‘J (dove il numero 3 non riveste
alcun particolare significato e potrebbe essere sostituito da qualunque nu­
mero > 2, in virtù del teorema di Roth)” .
Usando le proprietà di trasformazione dell’altezza a cui si alludeva, se ne
deduce che la distanza di P da è superiore circa a H(P;)“}/</(omettiamo qui
ogni altro tecnicismo). Nella nozione di distanza a cui si accennava, ciò signi­
fica che le coordinate di Pi sono pressappoco inferiori a H(P;)3f/</, per un’op­
portuna costante c > 0. Ma, essendo P- un punto intero, la massima tra le sue
coordinate sarà appunto l’altezza H{Pt)u. Se ne deduce H(PJ) H{Pt)
scegliendo d > 3 c, ne risulta che le coordinate di Pt sono limitate, ossia P) ha
un numero finito al più di possibilità, come si voleva.

Come applicazione dei metodi geometrici potremmo anche ricordare,


oltre ai già citati teoremi di Faltings, Vojta e altri, il caso delle equazioni sui

21 Nozione questa facilmente definibile in un completamento proiettivo della curva.


Nuovamente il «multiplo» dQ , e le altre operazioni di somma devono essere intesi nel senso
della legge di gruppo sulla curva.
2111 risultato di approssimazione diofantea soggiacente era noto a Siegei solo in forma meno
forte. La sua dimostrazione presentò pertanto ulteriori complicazioni tecniche.
Al contrario, un numero (o un punto) razionale ma non intero può avere altezza grande, pur
essendo piccolo: come esempi si considerino i numeri l/n, con n numero intero.
310 Umberto Zannier

campi finiti, ovvero in pratica le congruenze modulo p. Queste si possono


considerare come equazioni diofantee, seppure in senso non tradizionale,
su campi diversi da Q. Dopo alcuni risultati frammentari ma profondi già
ottenuti da Gauss per certe curve ellittiche [cfr. Borevic e Safarevic 1967 o
Silverman e Tate 1992], una massiccia e suggestiva teoria è stata sviluppata,
prima da Hasse [cfr. Silverman 1986], poi da Weil e altri, culminando nei
lavori di Pierre Deligne sul caso di varietà nonsingolari di dimensione arbi­
traria. Ma qui ci fermiamo, poiché una descrizione, per quanto superficiale,
anche di uno solo tra questi risultati ci porterebbe troppo oltre.

BAKER, A.
1975 Transcendental Number Theory, Cambridge University Press, Cambridge.
BOMBIERI, E. e GUBLER, W.
2006 Heigfits in Diophantine Geometry, Cambridge University Press, Cambridge.
BOREVIC, z . I. e § AFAREVIC, I. R.
1967 Théorie des nombres, traduzione dal russo, Gauthier-Villars, Paris.
c a ssels, J . w . s.
1966 Diophantine équations, with special reference to elliptic curves, in «Journal of
thè London Mathematical Society», 41, pp. 193-291.
1978 Rational Quadratic Forms, Academic Press, London - New York.
1991 Lectures on Elliptic Curves, Cambridge University Press, Cam bridge.
. w . s . e frò h u c h , a.
c a ssels, j

1967 Algebraic Number Theory (Cb. XII, XIII), Academ ic Press, London - New
York.
COLLIOT-THÉLÈNE, J.-L .
1992 Uaritbmctique des variétés rationnelles, in «Annales de la Faculté de Sciences
deToulouse», 1(3), pp. 295-336.
CORNELL, G., SILVERMAN, J. e STEVENS, G. (a Cura d i)
1997 Modular Forms and Fermat’s Last Theorem, Springer-Verlag, Berlin-Heidel-
berg.
DAVIS, M ., MATIJASEVld, Y. e ROBINSON, J.
1979 Diophantine équations: positive aspeets o f a negative solution , in «Proceedings
of tne American Mathematical Society», 27(3), pp. 319-23.
EDWARDS, H. M.
1977 Fermat’s Last Theorem, Springer-Verlag, Berlin-Heidelberg.
FERMAT, P. DE
2006 Osservazioni su Dio/anto, a cura di A. Conte, Bollati Boringhieri, Torino.
H1NDRY, M. e SILVERMAN, J.
2000 Diophantine Geometry, Springer-Verlag, Berlin-Heidelberg.
Risultati e metodi nella teoria delle equazioni diofantee 311

l an g , s.
1990 Number Theory , Encyclopaedia of Mathematical Sciences, III, Springer-Ver­
lag, Berlin-H eidelberg.
MANIN, YU . I.
1974 Cubie Forms, North Holland, Amsterdam.
MORDELL, L. J.
1969 Diophantine Equations, Academic Press, London - New York.
NAGELL, T .
1929 L’analyse indéterminée de degré supérieur, Gauthier-Villars, Paris.
s c h m id t , w . M.
1980 Diophantine Approximation, Springer-Verlag, Berlin-Heidelberg.
SERRE, J.-P .
1975 Cours d ’arithmétique, Presses Universitaires de France, Paris.
1989 Lectures on thè Mordell-Weil Theorem, Friedrick Vieweg & Son, Wiesbaden.
SILVERMAN, J .
1986 The A rith me tic o f Elliptic Curves, Springer-Verlag, Berlin-Heidelberg.
SILVERMAN, J . e TA TE, J .
1992 Rational Points on Elliptic Curves, Springer-Verlag, Berlin-Heidelberg.
WEIL, A.
1984 Number Theory. An Approach through History from Hammurapi to Legendre,
Birkhàuser, Boston [trad. it. Teoria dei numeri. Storia e matematica da Ham-
murabi a Legendre, a cura di C. Bartocci, Einaudi, Torino 1993].
ZANNIER, U.
2002 Some Applications o f Diophantine Approximation to Diophantine Equations,
Forum , Udine.
M A S S IM O B E R T O L IN I

Lultimo teorema di Fermat

1. Introduzione.

Le vicende che hanno portato alla soluzione dell’ultimo teorema di Fer­


mat si sono sviluppate lungo un arco temporale di oltre tre secoli e rappre­
sentano un’avventura intellettuale straordinaria. La storia ha inizio intorno al
1630, quando il matematico francese Pierre de Fermat lascia la seguente an­
notazione, a margine di una traduzione latina òdi'Arithmetica di Diofanto:
Cubum autem in duos cubos, aut quadratoquadratum in duos quadratoquadra-
tos, et generaliter nullam in infinitum ultra quadratum potestatem in duas ejusdem
nominis fas est dividere: cujus rei demonstrationem mirabilem sane detexi. Hanc
marginis exiguitas non caperet'.

Rappresentare un cubo come somma di due cubi significa, in termini


matematici, risolvere l’equazione X 3 + Y3 = Z3. Più in generale, Fermat
considera il problema di rappresentare una potenza «-esima come somma di
due potenze «-esime, ossia considera tutte le equazioni della forma
(i) X” + Yn = z\
dove l’esponente « è un intero positivo maggiore di 2 (cioè appartenente
all’insieme infinito di interi 3 ,4 ,5 , 6 ,...) . Egli afferma, detto in linguaggio
matematico moderno, che l’equazione (1) non ha soluzioni (X, Y, Z) negli
interi relativi diversi da zero (ovvero i numeri ± 1, ± 2, ± 3, ± 4, ...),per tutti
gli esponenti interi n > 2. La condizione XYZ 0 assicura che la potenza
«-esima non nulla Z ” venga realmente divisa nella somma di due potenze
«-esime. L’ipotesi « > 2 è necessaria per la validità dell’enunciato: se « = 2,
l’equazione X 2 + Y2 = Z2 (che esprime la relazione pitagorica tra le lunghez­
ze dei cateti e dell’ipotenusa di un triangolo rettangolo) ha soluzioni intere,
per esempio la tema (3 ,4 ,5 ).
Per completare la dimostrazione dell’enunciato di Fermat, noto come
«ultimo teorema di Fermat» (UTF), sono serviti 350 anni di ricerche. È sta­

1 «Non è, invece, possibile dividere un cubo in due cubi, o un biquadrato in due biquadrati, né,
in generale, dividere alcun’altra potenza di grado superiore al secondo in due altre potenze dello
stesso grado: della qual cosa ho scoperto una dimostrazione veramente mirabile, che non può essere
contenuta nella ristrettezza del margino» (R de Fermat, Osservazionisu Diofanto, a cura di A. Conte,
Bollati Boringhieri, Torino 2006, p. 4).
314 Massimo Bettolini

to molto dibattuto se Fermat avesse realmente trovato una «dimostrazione


mirabile, ma troppo lunga per poter essere contenuta nel margine di una
pagina dell’Arithmetica». Ormai, restano pochi dubbi in proposito: si ritiene
che Fermat fosse erroneamente convinto che la sua dimostrazione nel caso
n = 4, certamente corretta e basata sul metodo della discesa infinita, potes­
se essere estesa a un qualunque esponente n\ il fatto che gli altri suoi lavori
ignorino il caso generale delTUTF e si concentrino sui casi « = 3 ,4 , sembra
confermare questa supposizione. L’UTF, dunque, ai tempi di Fermat non era
realmente un teorema; si trattava invece di un enunciato ritenuto vero ma
non dimostrato, cioè di una congettura. La prima dimostrazione completa
dell’UTF è stata pubblicata nel 1995; si ottiene combinando un lavoro di
Andrew Wiles [1995] con un altro in collaborazione con Richard Taylor
[Taylore Wìles 1995]. La dimostrazione ha richiesto l’utilizzo di teorie prò-
fonde ed estremamente sofisticate nell’ambito dell’algebra, della geometria
e dell’analisi matematica, sviluppate nel corso dei decenni precedenti da
diversi matematici.
Dire che la storia dell’UTF abbia avuto inizio con Fermat nel 1630 non
è del tutto accurato: questo problema trova le sue radici nello studio delle
soluzioni intere o razionali di certe equazioni algebriche che compaiono nel-
l 'Arithmetica di Diofanto, matematico greco del 250 a.C. Specularmente, è
azzardato affermare che la storia delle ricerche ispirate dall’U T F si concluda
nel 1995: le idee introdotte da Wiles stanno prepotentemente indirizzando
il lavoro di ricerca dei primi anni del xxi secolo su questioni centrali nella
teoria dei numeri, quali la congettura di Serre (la cui dimostrazione è stata
completata recentemente da Khare e Wintenberger) e la congettura di Sato-
Tate (dimostrata in questi ultimi anni grazie al lavoro di Clozel, Harris, She-
pherd-Barron e Taylor)1. Quanto detto illustra come la ricerca sui temi dav­
vero fondamentali della matematica possegga un respiro millenario, e come
i ricercatori di punta di un dato momento storico si trovino a lavorare sulle
spalle dei giganti del passato.
Poche questioni hanno affascinato i matematici dilettanti quanto l’UTF:
ciò è indubbiamente dovuto alla semplicità disarmante di questo problema,
che a prima vista sembra essere accessibile a metodi diretti ed elementari. La
capacità di produrre innumerevoli problemi di questo tipo, cioè dall’aspetto
semplice ed elementare, e tuttavia estremamente diffìcili a scardinarsi, al
punto da restare per lungo tempo (anche centinaia di anni) allo stato di
congettura, è una peculiarità della teoria dei numeri. Una difficoltà, nello
studio di questi problemi, consiste nell’incardinarli a strutture matematiche
sufficientemente ricche da suggerire possibili tecniche dimostrative (che so­
no spesso sofisticate e provengono da diversi rami della matematica).

1Si veda il paragrafo 7 per maggiori dettagli tu questi lavori.


L’ultimo teorema di Fermat 315

Come accennato sopra, l’UTF può essere classificato come appartenente


al dominio delle equazioni diofantee (cioè di quelle equazioni algebriche a
coefficienti interi per le quali si ricerchino soluzioni intere o razionali). Più
precisamente, un problema diofanteo consiste nello studio delle soluzioni
intere o razionali di un sistema di equazioni algebriche
(2) //X ,....... Xn) = 0,
dove/^X,....... Xn) è un polinomio a coefficienti interi nelle indeterminate
X ,....... X/r L’U TF può allora essere visto come una famiglia (infinita) di
equazioni diofantee, dipendenti dal parametro «. Questa classificazione di
massima non basta tuttavia per associare all’UTF le corrette strutture ma­
tematiche, se si considera il fatto che vi sono famiglie infinite di equazioni
diofantee che ammettono soluzioni non banali. Si vedrà nelle pagine se­
guenti come la teoria delle curve modulari, per il tramite della congettura di
Shimura-Taniyama, abbia permesso di agganciare l’UTF a strutture matema­
tiche fondamentali, rendendone cosi possibile la dimostrazione.

2. Cenni storici.

Questo paragrafo ha lo scopo di mettere in evidenza alcuni momenti in


cui la storia dell’U TF si è intrecciata con l’evoluzione della teoria dei numeri
verso la sua forma attuale. Per informazioni storiche dettagliate, il lettore è
invitato a consultare il libro di H. M. Edwards [1996] ; per ulteriori informa­
zioni, si vedano anche l’articolo di D. Cox [1994] e l’introduzione al saggio
di H. Darmon, F. Diamond e R. Taylor [1997].
Un protagonista di questi sviluppi è il matematico Ernst Eduard Kummer;
grazie ai risultati ottenuti intorno al 1850, fu colui che durante il xrx secolo si
avvicinò maggiormente alla dimostrazione dell’UTF. I predecessori di Kum­
mer si erano dedicati allo studio di casi particolari dell’UTF: oltre al caso rt = 4
trattato dallo stesso Fermat, Eulero, nel 1753, aveva ottenuto la dimostrazio­
ne del caso n = 3; circa settantanni dopo, Dirichlet e Legendre trattarono
l’equazione di esponente 5 e successivamente Lamé quella di esponente 7.
Le dimostrazioni di questi singoli casi divennero sempre più complicate col
crescere dell’esponente, cosi che fu presto chiara l’importanza di introdurre
nuove idee per studiare l’intera famiglia delle equazioni di Fermat. A eccezione
di un risultato parziale ottenuto da Sophie Germain intomo al 1820, i risultati
di Kummer rappresentano il primo tentativo di affrontare l’intera questione,
mediante l’uso di tecniche sofisticate della teoria algebrica dei numeri. Va an­
che detto che gli studi di Kummer furono soprattutto motivati dal desiderio di
generalizzare precedenti risultati di Gauss (sulla reciprocità quadratica).
Prima di descrivere sommariamente il lavoro di Kummer premettiamo
una semplice osservazione: poiché ogni intero positivo n maggiore di 2 è
316 Massimo Bertolini

divisibile per 4 oppure per un numero primo dispari (un numero primo è
un intero maggiore di 1 divisibile solo per 1 e per se stesso), tenuto conto
del caso tt = 4 delTUTF risolto dallo stesso Fermat, concludiamo che è suf­
ficiente dimostrare l’UTF per i soli esponenti primi dispari.
Consideriamo allora l’equazione
(3) XP + YP = ZP,
dove p è un primo dispari. Se £ indica la radice p-esima dell’unità e2'1^ =
cos(2tt/p) + /sin(2ir/p), dove / = yf^l è l’unità immaginaria (£ è dunque
un numero complesso diverso da 1 con la proprietà che = 1), vale la
fattorizzazione

(4) (X + Y)(X + iY)(X + l 2Y) •••(X + tf-'Y ) = Zp,


come si verifica con un calcolo diretto. Ragionando per assurdo, Kummer
cerca di ottenere una contraddizione - utilizzando l’uguaglianza (4) - a par­
tire dall’ipotesi che l’equazione (3) ammetta una soluzione in interi {a, b, c)
con abc 0. Infatti, sostituendo (X, Y , Z) con (a, b , c) nell’equazione (4), si
ottiene

(5) (a + b)(a + Zjb){a + £2£) (a + ^p~lb) = c p.


Ciò conduce a lavorare con l’insieme Ap dei numeri complessi della for­
m a^ + <2,£ + tf2£2+ ••• + aP-\ip~l>dovei coefficienti a0, ...,a p_ xsono interi.
Il fatto che il secondo membro di (5) sia una potenza p-esima suggerisce la
questione se ogni fattore a primo membro sia anch’esso la potenza p-esima
di un numero complesso dell’insieme Ap (nel qual caso si può poi dedurre
una contraddizione). È possibile ottenere risposte (essenzialmente) affer­
mative nel caso in cui gli elementi di Ap godano di una proprietà analoga al
«principio di fattorizzazione unica» per gli interi positivi, che afferma che
ogni intero siffatto si fattorizza, in modo unico a meno dell’ordine dei fattori,
come prodotto di numeri primi’. Tuttavia, la fattorizzazione unica vale in Ap
quando p è un primo minore di 23; è invece falsa per tutti gli altri primi (che
sono in numero infinito). Ragionando lungo queste linee, Kummer ottiene
una serie di fondamentali scoperte, che lo portano a generalizzare il concetto
di numero, introducendo la nozione di ideale (anche detto numero ideale).
Utilizzando gli ideali di Apt egli definisce il numero delle classi di ideali, un
intero positivo hp che misura di quanto il principio di fattorizzazione unica
non valga in Ap (più hp è grande e più il principio fallisce in Ap\è invece
valido precisamente quando hp è uguale a l ) . Inoltre, Kummer dimostra

* Sul teorema fondamentale dell'aritmetica e le sue generalizzazioni si veda il saggio di A. Gran-


ville in questo stesso volume, pp. 131-66. [N.i.C.].
L’ultimo teorema di Fermat 317

una generalizzazione del principio di fattorizzazione unica per gli ideali di


Ap (questo risultato è un prototipo dei teoremi sulla decomposizione prima­
ria ottenuti dalla moderna algebra commutativa). Applicando tutto questo
all’UTF, lungo le linee degli argomenti accennati sopra, Kummer dimostra
che l’U TF vale per gli esponenti p tali che p non divide l’intero h . Un primo
p siffatto è detto regolare, mentre è chiamato irregolare altrimenti. Questo
risultato spinge Kummer a ricercare un criterio per stabilire se un primo p sia
0 meno regolare: a questo scopo mette in relazione i «numeri di Bemoulli»
ossia i numeri razionali definiti dalla formula

— = É ^ *".

con il numero delle classi di ideali, dimostrando che p è regolare se p non


divide il numeratore di B2, B4, ..., Bp_3, e viceversa. Questo criterio permette
di dimostrare che per p < 100, i soli primi irregolari sono 37, 59 e 67; per
tutti gli altri vale l’UTF. In effetti, argomenti euristici sembrano indicare che
1 primi regolari siano circa il 60 percento del totale; però, a tutt’oggi non è
dimostrato che i primi regolari siano infiniti (mentre, curiosamente, è nota
l’infinità dei primi irregolari). Gli studi di Kummer hanno dato origine a una
fertile linea di ricerca, che si è estesa nel xx secolo; sviluppi e varianti del
criterio di Kummer, combinati con l’uso del calcolatore, hanno permesso
di verificare l’U TF per gli esponenti primi minori di 4 milioni [Buhler et al.
1993]; inoltre, si è dimostrato che un eventuale controesempio all’UTF (con
p > 4 000 000) coinvolgerebbe soluzioni di (3) di grandezza inaccessibile.
Il criterio di Kummer può essere compreso per mezzo della «formula
analitica per il numero delle classi di ideali», che collega hp con i valori di
certe serie (dette «serie L di Dirichlet»). Vale la pena di osservare come una
simile formula analitica, per oggetti più complicati di quelli studiati da Kum­
mer - come pure il metodo della discesa infinita di Fermat - abbia avuto un
ruolo centrale nella dimostra; ' ne di Wiles dell’UTF.
Un’altra linea di ricerca con applicazioni notevoli all’UTF ha inizio intor­
no al 1920, con la formulazione della «congettura di Mordell», dimostrata
da Gerd Faltings [1983]. Questa congettura afferma che ogni equazione
algebrica
(6) f( x >y) = 0
di genere maggiore di 1 ha al più un numero finito di soluzioni nei nume­
ri razionali. Il genere g dell’equazione (6) è un intero non negativo lega­
to al grado d del polinomio/(x, >): in generale vale la disuguaglianza g ^
(d — 1)(d — 2)/2 e si-ha un’uguaglianza in questa relazione precisamente
quando l’equazione è non singolare. Si noti che quanto detto ha un contenu­
to geometrico, dato che (6) è l’equazione di una curva piana e la condizione
di non singolarità significa che i punti della curva sono sufficientemente
318 Massimo fienolini

regolari. In questi termini, la congettura di Mordell afferma chc le curve del


tipo considerato hanno solo un numero finito di punti a coordinate razionali,
detti «punti razionali». Ponendo
(7) f H{x,y) = xr + y” - 1 = 0 ,
si ottiene la seguente applicazione all’equazione di Fermat (1). Intanto, si
può verificare chef{ x , y) = 0 è sempre non singolare e dunque il suo genere
g = (« — !)(« —2)/2 è maggiore di 1 se n > 3. Usando la trasformazione di
coordinate x = X/Z, y = YIZ ed eliminando i denominatori, si passa da (7)
a (1). Ne deriva che ogni soluzione nei razionali della prima equazione dà
luogo a un’unica soluzione (a meno del segno) in interi relativamente primi,
cioè senza fattori in comune, della seconda equazione, e viceversa. (È chiaro
che da una soluzione intera di (1) se ne ottengono infinite moltiplicando
le componenti per uno stesso fattore intero). In definitiva, il teorema di
Faltings implica che l’equazione di Fermat ha un numero finito di soluzioni
in interi relativamente primi.
Questo tipo di risultato è ancora lontano dal dimostrare l’U T F; tuttavia,
usando il teorema di Faltings, Granville [1985] e Heath-Brown [1985] han­
no dimostrato che l’UTF vale per un insieme di esponenti interi n di densità
uno, cioè la percentuale di esponenti per i quali l’U T F può essere falso tende
a zero per tt tendente a infinito (osserviamo che questo non implica la validità
dell’UTF per un numero infinito di esponenti primi).
D teorema di Faltings è un risultato fondamentale sui punti razionali delle
curve; la sua applicazione all’UTF descritta sopra collega dunque quest’ulti­
mo a un risultato centrale della teoria dei numeri e della geometria aritmetica
moderne. Per un altro verso, alla fine degli anni Ottanta del secolo scorso,
si è evidenziato come l’UTF sia conseguenza (almeno per esponenti grandi)
di importanti congetture in teoria dei numeri, rappresentando quindi un
importante banco di prova per la loro validità. Per citare solo alcune delle
congetture a cui stiamo alludendo, ricordiamo la «congettura abc», la «di­
suguaglianza di Bogomolov-Miyaoka-Yau» per le superfici aritmetiche e la
«congettura di Shimura-Taniyama» sulla modularità delle curve ellittiche.
La dimostrazione di Wiles e Taylor dell’UTF passa per la dimostrazione di
quest’ultima congettura. Pertanto, il prossimo paragrafo è dedicato a una
descrizione della congettura di Shimura-Taniyama, mentre in quello succes­
sivo spiegheremo perché l’UTF ne è conseguenza.

3. La congettura di Shimura-Taniyama.

Seguendo Barry Mazur [ 1991], si può descrivere la congettura di Shimura-


Taniyama come un enunciato che postula l’esistenza di una relazione, del
tutto inaspettata, tra due diversi tipi di «spazi di orbite». H primo spazio si
L’ultimo teorema di Fermat 319

incontra descrivendo le curve ellittiche - una classe di curve piane definite


da equazioni cubiche - come tori complessi. U secondo spazio si ottiene dal­
l'identificazione dei punti del semipiano superiore rispetto all’azione di certe
trasformazioni lineari frazionarie; questa costruzione dà luogo a una fami­
glia di curve algebriche, dette «curve modulari». La congettura di Shimura-
Taniyama afferma che ogni curva ellittica a coefficienti razionali è «immagi­
ne» di un’opportuna curva modulare.
Indichiamo con C l’insieme dei numeri complessi, cioè i numeri della
forma a + ib, dove a e b sono numeri reali e/' = - J - 7 è l’unità immaginaria.
Possiamo anche rappresentare gli elementi di C come i numeri della forma
<7to, + b(a2, con a e b numeri reali, per una qualunque scelta di numeri com­
plessi non nulli co, e io2 tali che co/o)2 non sia un numero reale. (La forma
algebrica a + ib si ottiene dunque scegliendo co, = 1 e co2 = i).
Un reticolo A è un sottoinsieme di C i cui elementi sono della forma
<7to, + bo)2, con o), e to, come sopra, dove i coefficienti a e b sono numeri
interi. Fissato un reticolo A, l’orbita di un numero complesso z rispetto a A
è l’insieme
(8) z + A = {z + <7(o, + bu 2 |<7 e b interi}.
Indichiamo l’insieme di tutte le orbite con C/A. In modo equivalente, l’in­
sieme C/A si ottiene identificando tra loro i numeri costruiti applicando a
un dato numero complesso z una qualunque sequenza delle traslazioni T, :
z i-> z + co, e T2 : Z i-> z + (02. Geometricamente, lo spazio delle orbite C/A
è il toro complesso (una «ciambella con un buco») ottenuto identificando i
lati opposti del parallelogramma nel piano complesso avente per vertici i
numeri 0, co,, co2 e o), + co2.
Dato un qualunque punto P0 di C/A, è possibile definire opportune
identificazioni di regioni f i di C/A contenenti P0 con dischi aperti del piano
complesso, cioè regioni della forma
Dr = {z = a + ib\a2 + b2 <r2)
con r > 0, in modo tale che P0 corrisponda al centro 0 del disco. Ne viene che
una funzione F (a valori complessi) definita su fi può essere identificata con
una funzione/su un disco Dr. Diciamo che F è olomorfa su f ì se/è derivabile
(in senso complesso) in tutti i punti di Dr. Più generalmente, ammetteremo
che /possa essere della forma g(z)/z", per un intero positivo «, con g(z)
derivabile in ogni punto di Dr e g(0) * 0. La F corrispondente a/è detta me-
romorfa su fi, il punto P0 (in cui Fnon è definita) è una singolarità chiamata
polo (di ordine n). Infine, diciamo che una funzione F su C/A è olomorfa,
rispettivamente meromorfa, se è possibile ricoprire C/A con regioni fi del
tipo considerato sopra, in modo tale che la restrizione di F a ciascun fi sia
olomorfa, rispettivamente meromorfa.
320 Massimo Bettolini

Un modo equivalente di introdurre le nozioni precedenti si basa sull’os­


servazione che una funzione F su C/A definisce una funzione/su C perio­
dica rispetto a A (cioè vale l’uguaglianza f(z) = f( z + X) per ogni elemento
\ del reticolo). Allora, F è olomorfa se/ è derivabile in tutti i punti di C;
analogamente, si descrive il concetto di funzione meromorfa\
Per ogni reticolo A, la teoria di Weierstrass [cfr. ad es. Lang 1987] de­
finisce una funzione p(z) su C, periodica rispetto a A, che è olomorfa nei
punti di C — A e ha un polo (di ordine 2) in ogni punto di A. La proprietà
fondamentale di p(z), detta «funzione p di Weierstrass», risiede nel fatto
che p(z) e la sua derivata prima p'(z) soddisfano una relazione algebrica
cubica della forma
p'(z)2 = 4 p(z)} + Apiz) + B,
dove A e B sono due numeri complessi definiti a partire da A e il polinomio
cubico 4** + Ax + B ha zeri distinti. La curva piana
(9) y2 = 4x> + Ax + B
è chiamata «curva ellittica». I punti del toro C/A si identificano con i punti a
coordinate complesse di (9), secondo la corrispondenza che associa l ’orbita
P = z + A al punto di coordinate (piz), p'(z)). Poiché p e p ' hanno un polo
nei punti del reticolo A, l’orbita P = A corrisponde al punto all’infinito su
(9), ottenuto facendo tendere a infinito le coordinate (x, y) del punto mobile
sulla curva.
Viceversa, data una qualunque curva ellittica, si dimostra che i suoi punti
a coordinate complesse si identificano, mediante la procedura indicata so­
pra, con i punti di un toro C/A, per un’opportuna scelta del reticolo A.
Per enunciare la congettura di Shimura-Taniyama, è necessario introdur­
re un altro tipo di spazio di orbite. Sia
H = {z = a + bi £ C |b > 0}
il semipiano superiore dei numeri complessi con parte immaginaria positiva.
Definiamo le trasformazioni T z + 1 e S i-> —1/z di H. Si vede che ap­
plicando successivamente, in sequenze arbitrarie, le trasformazioni S e T si
ottengono tutte le trasformazioni del tipo
/1
(10)
az + b
: z h -------- ,
cz + d
dove a, b, c e dsono interi tali ehe ad —b c — 1. Indichiamo con r o( 1) l’insie­
me di queste trasformazioni*.

4 Per maggiori dettagli su queste nozioni, invitiamo il lettore a consultare il lib ro di Lars Ahlfors
[1973] sull'analisi complessa.
’ r o ( 1) 4 un gruppo rispetto alla composizione di trasformazioni.
L’ultimo teorema di Fermat 321

È utile osservare che 5 e T non commutano, nel senso che applicando


prima S e poi T si ottiene la trasformazione TS : z i-> (z — 1)/z\ applicando
invece S e T nell’ordine inverso, si ottiene ST : z »-> - 1 /(z + 1), diversa da
TS. (Al contrario, le traslazioni T, e T2, considerate nella definizione delle
curve ellittiche come tori complessi, commutano: T,T2 e T2T, coincidono
entrambe con la traslazione z (-» z + u>. + o>2).
Introduciamo ora lo spazio delle orbite
W T 0( 1 ),
ottenuto identificando tra loro i punti di H che si ottengono da un dato
punto applicando le trasformazioni -y definite in (10); dunque, gli elementi
di H/ro(l) sono le orbite

(11) \aZ + ^ |a,b tc,d interi, ad - bc = l i ,


1 cz + d ' I
dei diversi elementi z di H.
Com’è fatto lo spazio H / r o( 1)? Uno studio dettagliato dell’azione delle
trasformazioni di r o( 1) su H mostra che ogni orbita (11) contiene un punto
della regione
D = jz = a + tbE .H \ —1/2 ^ a ^ 1/2 e a2 + b2 ^ l j.
(I punti di D sono i punti di H che stanno nella strìscia verticale —1/2 ^ a ^
1/2 e nello stesso tempo si trovano all’esterno o sul bordo del disco unitario).
Inoltre, le sole identificazioni tra punti di D indotte da elementi di r o(1) si
ottengono identificando i punti delle semirette verticali che delimitano la
striscia, simmetrici rispetto all’asse;y (basta usare T o la traslazione inversa
z h» z — 1 per passare da una semiretta all’altra), e in aggiunta identificando
i punti sull’arco di cerchio che delimita inferiormente D, simmetrici rispetto
all’asse y (usare qui la trasformazione S)‘. Lo spazio ottenuto da D effettuan­
do le identificazioni descritte sopra è una «superficie sferica privata di un
punto» e può anche essere identificato all’occorrenza, mediante proiezione
stereografica, con il piano complesso. Indicheremo con X0(l) la sfera ot­
tenuta «compattificando» lo spazio 7 i/r o(ì) con l’aggiunta di un singolo
punto.
Come detto poc’anzi, i punti di H /ro(l) possono essere identificati con
quelli del piano complesso C; ma C può anche essere visto come l’insieme
dei punti a coordinate complesse di una retta, nello stesso modo in cui i
numeri reali possono essere identificati con i punti della retta reale. (Queste
osservazioni possono forse confondere il lettore, dato che stiamo dicendo
che un piano e una retta sono la stessa cosa; l’apparente contraddizione si

‘ P e rd ettag li, consultare Lang [1987].


322 Massimo Bertolini

risolve notando che C, cioè l’insieme dei numeri complessi z = a + ib, ha


dimensione reale 2, in quanto servono due parametri reali a e b per descrive­
re z e dunque dal punto di vista della geometria reale C è un piano; d’altra
parte, bastando un solo parametro complesso (z stesso) per descrivere z,
concludiamo che C ha dimensione complessa 1 e che nell’ambito della geo­
metria complessa C è una retta). In definitiva, da un punto di vista algebri­
co, lo spazio X 0(l) è l’insieme dei punti complessi di una retta (proiettiva),
cioè una curva definita da un’equazione lineare (con l ’aggiunta di un punto
all’infinito).
Ricordando la discussione sul genere di una curva svolta nel paragrafo
2, la curva in questione ha genere 0, essendo descritta da un’equazione di
primo grado; invece le curve ellittiche, descritte dall’equazione (9), hanno
genere 1 . (Il fatto che gli zeri del polinomio 4x} + Ax + B siano distinti
assicura che le curve ellittiche siano non singolari).
La costruzione di X j( 1 ) si presta a una generalizzazione. Dato un intero
N ^ 1 , indichiamo con r o(N) l’insieme delle trasformazioni (10) il cui coef­
ficiente c è divisibile per N 7e con 7i/T0(N) lo spazio delle orbite definito in
modo analogo a Ti/TAl), utilizzando Tq(N) invece di r o(l). In questo modo
si ottiene una superficie (nel senso della geometria reale) che può essere
compattificata con l’aggiunta di un numero finito di punti, detti cuspidi;
la indicheremo con X 0(N). Analogamente al caso di X 0( l), la superficie
X 0(N) può essere identificata con l’insieme dei punti complessi di una cur­
va, detta curva modulare di livello N; si tratta in generale di una curva più
complicata di X 0(l), dato che il suo genere g non è limitato superiormente
al crescere di N.
Tornando alla descrizione come superficie, X 0(N) è una «ciambella con
g buchi». In generale, il genere di una curva può anche essere definito come
il numero dei buchi presenti nella superfìcie che descrive i punti complessi
della curva stessa; da questo punto di vista, X 0(l) ha genere 0 perché la sfera
non ha buchi, mentre una curva ellittica ha genere 1 perché si identifica con
un toro complesso.
Esattamente come nel caso dei tori C/A, possiamo identificare opportu­
namente regioni fi di X 0(N), contenenti un dato punto P0, con dischi aperti
del piano complesso, in modo tale che P0corrisponda ai centri dei dischi.
Ciò permette di definire la nozione di funzione olomorfa su X 0(N), e quella
di funzione olomorfa da X 0(N) a un toro C/A.
Possiamo ora enunciare la congettura formulata dai matematici Goro
Shimura e Yutaka Taniyama. Diciamo che una curva ellittica è definita sui
razionali se i coefficienti A e B nell’equazione (9) sono numeri razionali.

’ T0(N) è un sottogruppo di f 0( 1).


L’ultimo teorema di Fermat 323

Congettura 3.1 (Shimura-Taniyama). Sia E una curva ellittica definita


sui razionali e sia C /A il toro complesso che si identifica con ipunti a coordina­
te complesse di E. Allora esiste una funzione olomorfa non costante da X 0(N)
a C/A, per una scelta opportuna dell’intero positivo N.

Concludiamo questo paragrafo con una descrizione esplicita, in termini


di certi integrali, di una funzione olomorfa non costante
<p : X 0 (N ) - > C / A ,

la cui esistenza è postulata per un N opportuno dalla congettura 3.1.


Dall’esistenza di cp, si deduce l’esistenza di un differenziale non nullo u>(z) =
lit if iz)dz sul semipiano H, con le seguenti proprietà:
1. o)(z) è invariante rispetto all’azione di T0(N), cioè vale l’uguaglianza

per ogni trasformazione z b ( « + h)/(cz + d) di T0(N);


2. la funzione/ (z) è olomorfa su H e si annulla nelle cuspidi di X 0(N);
3. fiz ) ammette uno sviluppo in serie di Fourier della forma
X

dove i coefficienti an sono interi e a, = 1.


Le prime due proprietà esprimono il fatto che o>(z) definisce un differen­
ziale olomorfo su X0(N). Inoltre, l’invarianza di o>(z) rispetto a I\(N) implica
l’invarianza di/(z) rispetto alla traslazione T: zi-» z + 1 , cioè il fatto che/(z
+ 1 ) = /(z); questa proprietà di periodicità di fiz) ne garantisce la rappre­
sentabilità come serie di Fourier. Dato un punto P su X 0(N), indichiamo con
t un qualunque elemento dell’orbita di P; vale allora la formula

12
( )

ricordando la notazione z + A introdotta nell’equazione (8) per descrivere


gli elementi di C/A.
(La descrizione del differenziale o>(z) data sopra comporta l’invarianza
di u>(z) rispetto all’azione di certe corrispondenze su X 0(N), dette opera­
tori di Hecke, che per semplicità non definiamo. Nel seguito del testo,
ogniqualvolta prenderemo in considerazione differenziali analoghi a oj( z ),
ammetteremo tacitamente che una simile proprietà di invarianza sia veri­
ficata).
324 Massimo Bertolini

Osserviamo infine che il genere g di X0(N) può essere alternativamente


descritto come il numero massimo di differenziali olomorfi indipendenti* su
X0{N). Di conseguenza, la curva X0{N) che compare nell’enunciato della con­
gettura di Shimura-Taniyama deve avere genere g ^ 1 , poiché vi è almeno
un differenziale olomorfo non nullo su di essa grazie alla discussione svolta
sopra.

4. Shimura-Taniyama implica Fermat.

La strategia che ha condotto alla dimostrazione dell’U TF consiste nel-


Passociare a un’ipotetica soluzione dell’equazione di Fermat (3) una curva
ellittica, per poi mostrare che l’esistenza di questa curva è incompatibile con
la congettura di Shimura-Taniyama.
Più precisamente si ragiona «per assurdo», supponendo che esista una
soluzione intera (a, b, c) di (3) con abc =É 0. Sappiamo già (cfr. § 2 ) che l’UTF
vale per tutti gli esponenti più piccoli di 4 milioni; per la validità dell’ar­
gomento che andiamo a presentare, ci basta supporre che p sia maggiore
di 7. Possiamo anche richiedere che gli interi a, b, c non abbiano fattori
comuni - infatti, rimuovendo un eventuale fattore comune, si ottiene una
nuova soluzione di (3). Inoltre, scambiando eventualmente a ,b e c , possiamo
supporre che b sia pari e a sia un intero della forma 4& — 1. Associamo a
{a, b , c) la curva ellittica
(13) y2 = x(x - aP)(x + fr),
chiamata «curva di Frey».
Supponiamo vera la congettura di Shimura-Taniyama. Allora, vi è un
intero N ^ 1 e un differenziale olomorfo non nullo to(z) = 2TTÌf(z)dz sulla
curva X0(N), con le proprietà elencate nel paragrafo 3, che definisce grazie
alla formula ( 12) una funzione olomorfa non costante da X0(N) ai punti a
coordinate complesse di (13) (identificati con un toro complesso). Attraver­
so uno studio dettagliato delle proprietà aritmetiche delle curve modulari,
Barry Mazur [1977-78] e Kenneth Ribet [1990] hanno dimostrato l’esistenza
di un nuovo differenziale olomorfo non nullo to'(z), questa volta sulla curva
X 0(2 ), i cui coefficienti di Fourier a' sono congruenti modulo p ai coefficienti
di Fourier a? di (0(2). Usando il collegamento tra i differenziali olomorfi su
una curva e il genere della stessa ricordato alla fine del paragrafo 3, conclu­
diamo che il genere di X 0(2) dev’essere almeno 1 . D ’altra parte, studiando
l’azione di T0(2) sul semipiano superiore, si vede - in modo del tutto simile

' Più precisamente, indipendenti significa linearmente indipendenti nello spazio vettoriale com­
plesso da differenziali olomorfi.
L’ultimo teorema di Fermat 325

a quanto descritto per X 0(l) - che X 0(2) è una sfera e dunque il suo genere
è 0. Ecco la contraddizione cercata!
In conclusione, l’UTF segue dalla congettura di Shimura-Taniyama, gra­
zie al lavoro di Mazur e Ribet. Citiamo qui anche il lavoro di Gerhard Frey
[1986], che per primo ebbe l’idea di usare la congettura 3.1 per dimostrare
che la curva ( 13) - già studiata da Yves Hellegouarch [1974-75] - non può
esistere, e di Jean-Pierre Serre [1987], la cui congettura (su cui torneremo
nel § 7 ) ha ispirato il lavoro di Ribet, anticipando l’esistenza del differenziale
o)'(z) che compare nel precedente argomento.
A questo punto della storia - siamo nel 1990 - resta da dimostrare la con­
gettura di Shimura-Taniyama. Questo è il compito che si è assunto Andrew
Wiles, lavorando per diversi anni in completa solitudine e avvalendosi infine
della collaborazione di Richard Taylor.
La strategia ideata da Wiles consiste in un computo, svolto con tecniche
assai sofisticate, da un lato degli elementi dell’insieme delle curve ellittiche
definite sui razionali, e dall’altro lato degli elementi del sottoinsieme co­
stituito da quelle curve ellittiche che soddisfano la congettura di Shimura-
Taniyama, con l ’obiettivo di dimostrare che i due insiemi coincidono. Ri­
torneremo su questa strategia nel paragrafo 6, dopo aver introdutto alcuni
concetti preliminari.
Conviene infine avvertire il lettore che i lavori di Mazur, Ribet, Wiles
e Taylor-Wiles citati nella bibliografia, che costituiscono il cuore della di­
mostrazione dell’UTF, attingono alle più raffinate tecniche sviluppate dal­
l’algebra, dall’analisi e dalla geometria del xx secolo e risultano pertanto
accessibili a pochi specialisti. La trattazione presentata nelle pagine pre­
cedenti ha cercato di spiegare alcune delle idee emerse dal lavoro di quei
matematici, evitando il più possibile di insistere sugli aspetti tecnici della
dimostrazione.

5. Appendice 1. Preliminari algebrici.

Le tre appendici al testo principale di questo scritto intendono fornire


al lettore alcuni strumenti di approfondimento. La prima richiama i concetti
matematici necessari per meglio precisare la strategia dimostrativa di Wiles,
trattata nella seconda appendice; la terza si occupa delle conseguenze del
lavoro di Wiles, e include applicazioni alla congettura di Birch e Swinner-
ton-Dyer e l’osservazione che l’uso delle tecniche di Wiles, opportunamente
generalizzate, ha permesso di ottenere la dimostrazione delle congetture di
Serre e di Sato-Tate.
Sebbene il livello tecnico di queste appendici sia stato limitato il più
possibile (compatibilmente con gli scopi esplicativi che ci si è posti) la loro
comprensione necessita della padronanza di strumenti matematici più sofì-
326 Massimo Bettolini

sticati di quelli utilizzati nei precedenti paragrafi, per i quali le conoscenze


matematiche richieste si riducono a poco più del concetto di funzione deri­
vabile. In particolare, si richiede qui che il lettore abbia una certa familiarità
con alcuni concetti algebrici trattati nei testi introduttivi all’algebra astratta,
come per esempio il libro di Israel Nathan Herstein [1975], quali le defini­
zioni di base su gruppi, anelli, campi e spazi vettoriali.
Diciamo che un numero complesso a G C è un «numero algebrico» se
a è lo zero di un polinomio pix) = aQ+ axx + ... + a j ? di grado n ^ 1 , i
cui coefficienti a*, a , , ..., anappartengono al campo Q dei numeri razionali.
Il sottocampo Q [a] di <C, generato su Q> da un numero algebrico a , è detto
«campo di numeri». In altre parole, Q [a] è il più piccolo sottocampo di C
contenente a ; i suoi elementi sono le espressioni polinomiali in a a coeffi­
cienti razionali.
Dato un numero algebrico a , sia p (x) un polinomio a coefficienti ra­
zionali, di grado n ^ 1 minimo, tale cne p i a) = 0. Il campo di numeri
K = Q [a] è detto «di Galois» se tutti gli zeri (nel campo complesso) di paix)
appartengono a K.
Se K è di Galois, il suo «gruppo di Galois» Gal(K/<Q>) è definito come il
gruppo degli automorfìsmi di K, rispetto all’operazione di composizione. (Si
ricordi che un automorfismo di K è un’applicazione bigettiva <p: K —» K che
rispetta la somma e il prodotto in K, cioè <p(P + 7 ) = <p(P) + 9(7 ) e 9 (^ 7 )
= <p(p) 9(7 ) per ogni scelta di elementi P e 7 in K). Si dimostra che l’ordine
di GaliK/Q) è uguale al grado di pa(x); in particolare, il gruppo di Galois di
K è un gruppo finito.
Dati due numeri algebrici a e P, si vede che il campo Q [a , p] generato
su Q da a e P è anch’esso un campo di numeri Q [ 7 ] ; ne consegue che l’unio­
ne insiemistica €$ di tutti i campi di numeri Q[otj è un sottocampo di C. Il
campo Q può anche essere descritto come l’unione di tutti i campi di numeri
di Galois. Se indichiamo con Gal(Q/Q) il gruppo degli automorfìsmi di 0 ,
valgono le due proprietà seguenti:
1 . G al(0/Q ) è un gruppo infinito;
2. per ogni campo di numeri di Galois <Q>[a], vi è un omomorfismo sur-
gettivo di gruppi iTa: Gal(0/Q ) —* Gal(Q[a]/Q).
La teoria delle curve ellittiche permette di costruire una classe di campi
di numeri, che avrà un ruolo fondamentale nelle considerazioni successive.
Se £ è una curva ellittica, sappiamo dal paragrafo 3 che l’insieme Ei C) dei
punti a coordinate complesse di E si identifica con un toro complesso C/A.
Lo spazio delle orbite C/A è dotato di una struttura naturale di gruppo
(quoziente del gruppo additivo dei numeri complessi): date due orbite zx +
A e z2 + A, la loro somma è definita come l’orbita (z, + z2) + A. Essendo
questa somma commutativa, otteniamo che C/A, e dunque anche E i C), è
un gruppo abeliano. Notiamo che l’elemento neutro della legge di gruppo
L’ultimo teorema di Fermat 327

su E(C) è il punto all'infinito O di E, poiché esso corrisponde all’orbita A. È


bene menzionare che vi è un modo equivalente, detto «della corda e tangen­
te», di natura geometrica, per definire la somma di punti su E\
Se « è un intero maggiore di 1 e P è un punto in E(C), possiamo definire il
punto nP come P + •••+ P, dove il numero di addendi in questa espressione
è pari a n. Consideriamo l’insieme
£ „ = { P E E(C) |nP = 0 }
dei punti di E «annullati» dalla moltiplicazione per n. Si vede subito che En
è un sottogruppo di E(C); inoltre, l’identificazione di quest’ultimo gruppo
con il toro C/A identifica E con il sottogruppo (l/w)A/A. Ricordando che
A è un gruppo della forma É(ot © Z(o2 otteniamo che En è un gruppo finito,
isomorfo a U n i © U n i.. Ne consegue che il gruppo Aut(En) degli auto­
morfismi di E è isomorfo al gruppo (non commutativo) G l^ iU n l) delle
matrici invertitili 2 X 2, a coefficienti nell’anello U n i.
Supponiamo ora che £ sia definita sui razionali. In questo caso, si trova
che il campo Q KEJ, generato su Q dalle coordinate dei punti nell’insieme
E„, è un campo di numeri di Galois. Più precisamente, si verificano i fatti
seguenti:
1. le coordinate di ogni punto P in En sono numeri algebrici e quindi
il campo da esse generato su Q è un campo di numeri, contenuto in
0 ;
2. dato P in £„ e un elemento ct del gruppo di Galois Gal(Q /Q), il punto
<j{P) ottenuto applicando ct alle coordinate di P appartiene a En.
L’automorfismo ct induce pertanto un automorfismo p „ ( ct) del gruppo
En, mediante la regola
(14) p> ) ( P ) = ct(P),
per ogni P in En. In conclusione, il gruppo di Galois Gal(Q(E>I)/Q) si identi­
fica con un sottogruppo di Aut(E„), e quindi anche di GLJ U n l ) . Salvo che
in casi speciali, G al(Q (£>>)/Q) «tende» a essere uguale aaAut(E>I) e dunque
a essere non commutativo.
Notiamo un’altra proprietà del gruppo GaKQKEJ/Q). Se £ è un numero
primo che non divide nNE, dove NE è un intero positivo detto «conduttore»
di E, definito unicamente in termini di E [Silverman 1986], è possibile defi­
nire in questo gruppo un particolare elemento, indicato con <rn(i ) e chiamato
«elemento di Frobenius» in £. Per definire v n(£), si dimostra che vi è un
sottogruppo di G al (Q(En)/Q) isomorfo al gruppo di Galois di un campo

* Si rimanda al libro di Joseph H. Silverman [19S6] per i dettagli. Si veda anche il saggio di
U. Zannici-, Risultali c metodi nella teoria delle equazioni diofantee, in questo stesso volume, pp.
287-312.
328 Massimo Bertolini

finito di caratteristica v n(t) è l’automorfìsmo che corrisponde in questa


identificazione all’automorfismo x i-> x* in caratteristica t. Va detto che a n(£)
non è ben definito in generale (solo la classe dei suoi coniugati lo è), t