Sei sulla pagina 1di 952

Corso di Laurea in Matematica – Geometria 2

Foglio di esercizi n. 2 – a.a. 2015-16

Soluzioni

Gli esercizi sono presi dal libro di Manetti. Per svolgere questi esercizi,
studiare con cura i paragrafi 3.5, 3.6, 3.7, 4.1 e 4.2 del libro.
È consigliato svolgere tutti gli esercizi del libro. Riportiamo qui il testo
per chi non ha ancora il libro. Sul libro ci sono (a volte) suggerimenti sulllo
svolgimento.

Definizione 3.57. Una funzione continua ed iniettiva f : X → Y si dice


una immersione (topologica) se gli aperti di X sono tutti e soli i sottoinsiemi
del tipo f −1 (A), al variare di A tra gli aperti di Y .

Esercizio 1. Dimostrare che f : X → Y è un’immersione se e solo se induce


un omeomorfismo fra X e il sottospazio topologico f (X).
Dire se la funzione f dell’esercizio 3.47 (svolto in classe) è un’immersione
oppure no.

Soluzione.

Gli aperti di f (X) (con la topologia indotta da Y ) sono tutti e soli gli insiemi
della forma B ∩ f (X), con B aperto in Y . Poiché f : X → f (X) è continua e
biunivoca, è un omeomorfismo se e solo se è aperta.
Dunque

f : X → f (X) aperta ⇐⇒ ∀A ⊆ X, A aperto =⇒ f (A) aperto in f (X)


⇐⇒ ∀A ⊆ X, A aperto =⇒ ∃B aperto in Y : f (A) = B ∩ f (X)

Si ha f −1 (B ∩ f (X)) = f −1 (B) e poiché f è iniettiva f −1 f (A) = A. Quindi


l’ultima condizione dice

∀A ⊆ X, A aperto =⇒ ∃B aperto in Y : A = f −1 (B)

e cioè f è un’immersione.
La funzione dell’esercizio 3.47 non è un’immersione in quanto X e la sua
immagine Y non sono omeomorfi.
Esercizio 3.46. Due sottoinsiemi A e B di uno spazio topologico X si
dicono separati se non sono aderenti, e cioè se

A∩B =A∩B =∅

Dimostrare che:
1. Se F , G ⊆ X sono entrambi aperti o entrambi chiusi, allora A = F − G e
B = G − F sono separati.
2. Se A, B ⊆ X sono separati, allora A e B sono entrambi aperti e chiusi in
A ∪ B.

Soluzione.

1.a Supponiamo F e G aperti. Consideriamo l’intersezione A ∩ B. Se


x ∈ B = (G − F ) allora in particolare x ∈ G. Poiché G è aperto, esiste un
intorno U di x tale che x ∈ U ⊆ G. Allora U ∩ A = U ∩ (F − G) = ∅ e
quindi x ∈
/ A e dunque A ∩ B = ∅. Usando il fatto che F è aperto, si dimostra
analogamente che A ∩ B = ∅ e quindi A e B sono separati.
1.b Supponiamo F e G chiusi. Consideriamo l’intersezione A ∩ B. Se
x ∈ B = (G − F ) allora in particolare x ∈ / F . Poiché F è chiuso, esiste un
intorno U di x tale che U ∩ F = ∅. Poiché A = (F − G) ⊆ F si ha U ∩ A = ∅ e
quindi x ∈
/ A e dunque A ∩ B = ∅. Usando il fatto che G è chiuso, si dimostra
analogamente che A ∩ B = ∅ e quindi A e B sono separati.

2. Siano A, B ⊆ X separati. Osserviamo che questo implica che A∩B = ∅


e cioè sono disgiunti. Si ha:

1. A ∩ B = ∅ =⇒ A ⊆ (X − B) =⇒ A ∩ (X − B) = A
2. B ⊆ B =⇒ B ∩ (X − B) = ∅.
Dunque
(A ∪ B) ∩ (X − B) = A
e poiché (X − B) è aperto in X, si ha A aperto in A ∪ B. Poiché B è il
complementare di A in A ∪ B, si ha che B è chiuso in A ∪ B.
Scambiando i ruoli di A e B si ha che B è aperto e A è chiuso in A ∪ B e
dunque la tesi.
Esercizio 3.51 Siano X, Y spazi topologici, A ⊆ X, B ⊆ Y sottoinsiemi.
Dimostrare che
A×B =A×B
In particolare, il prodotto di due chiusi è chiuso nel prodotto.

Soluzione.

Facciamo due osservazioni preliminari:


1. Sia X uno spazio topologico e A ⊆ X. Sia x ∈ X un punto e fissiamo
U = {Ui }i∈I un sistema fondamentale di intorni di x. Allora:

x ∈ A ⇐⇒ ∀i ∈ I Ui ∩ A 6= ∅

(cioè basta controllare quello che capita per un sistema fondamentale di intorni
e non per tutti gli intorni).
2. Siano X, Y spazi topologici, x ∈ X, y ∈ Y e siano U = {Ui }i∈I un sistema
fondamentale di intorni di x e V = {Vj }j∈J un sistema fondamentale di intorni
di y. Poniamo Wij = Ui × Vj ⊆ X × Y . Allora:

W = {Wij }(i,j)∈I×J

è un sistema fondamentale di intorni di (x, y) ∈ X × Y . Dimostriamolo in


dettaglio.
Sia W un intorno di (x, y) in X × Y . Allora esiste un aperto A tale che
(x, y) ∈ A ⊆ W . Poiché una base di aperti nella topologia prodotto è data
dai prodotti di aperti, esistono due aperti Ax ⊆ X e Ay ⊆ Y tali che (x, y) ∈
Ax × Ay ⊆ W . Poiché x ∈ Ax e Ax è aperto, Ax è un intorno di x e quindi
esiste un intorno fondamentale Ui ∈ U tale che x ∈ Ui ⊆ Ax e analogamente
esiste Vj ∈ V tale che y ∈ Vj ⊆ Ay . Abbiamo perciò:

(x, y) ∈ Ui × Vj ⊆ Ax × Ay ⊆ A ⊆ W

e quindi abbiamo trovato un intorno Wij ∈ W contenuto in W . Questo dice che


W è un sistema fondamentale di intorni.
Dimostriamo ora l’enunciato richiesto. Siano x ∈ X, y ∈ Y e fissiamo
U = {Ui }i∈I un sistema fondamentale di intorni di x e V = {Vj }j∈J un sistema
fondamentale di intorni di y.

(x, y) ∈ A × B ⇐⇒ x ∈ A e y ∈ B
⇐⇒ ∀i ∈ I Ui ∩ A 6= ∅ e ∀j ∈ J Vj ∩ B 6= ∅
⇐⇒ ∀(i, j) ∈ I × J (Ui × Vj ) ∩ (A × B) 6= ∅
⇐⇒ (x, y) ∈ A × B
Esercizio 3.52. Sia (X, d) uno spazio metrico. Dimostrare che la funzione
distanza
d:X ×X →R
è continua rispetto alla topologia prodotto.

Soluzione.

Osserviamo che per x ∈ X un sistema fondamentale di intorni di x è dato


dalle palle aperte B² (x) di centro x e raggio ².
Sia (x0 , y0 ) ∈ X × X e sia d(x0 , y0 ) = α. Fissiamo ² > 0. Per dimostrare che
d è continua nel punto (x0 , y0 ) dobbiamo trovare un intorno W di (x0 , y0 ) tale
che d(W ) ⊆ (α − ², α + ²) (la topologia su R è naturalmente quella euclidea).
Siano A = B²/2 (x0 ) e B = B²/2 (y0 ) le palle aperte di raggio ²/2 e cen-
tro rispettivamente x0 e y0 . Allora W = A × B è un aperto in X × X che
contiene (x0 , y0 ) e quindi è un intorno.
Se (x, y) ∈ A × B si ha, per la diseguaglianza triangolare

d(x, y) ≤ d(x, x0 ) + d(x0 , y0 ) + d(y0 , y) < α + ²

e anche

α = d(x0 , y0 ) ≤ d(x0 , x) + d(x, y) + d(y, y0 ) < d(x, y) + ²

Dunque, per ogni (x, y) ∈ A × B = W si ha

α − ² < d(x, y) < α + ²

e quindi la tesi.
Esercizio 3.59. Dimostrare che uno spazio topologico X è di Hausdorff se
e solo se per ogni suo punto x vale
\
{x} = U
U ∈I(x)

Confrontare questa proprietà con la definizione di spazio T1 (Esercizio 3.12)

Soluzione.
T
Supponiamo che per ogni x ∈ X si abbia {x} = U ∈I(x) U . Se x, y ∈ X con
T
x 6= y allora y ∈ / {x} = U ∈I(x) U e quindi esiste un intorno U di x tale che
y∈ / U . Questo vuol dire che esiste un intorno V di y tale che U ∩ V = ∅ e questa
è la definizione di spazio di Hausdorff.
Viceversa, supponiamo che lo spazio X sia di Hausdorff e fissiamo x ∈ X.
Per ogni punto y 6= x esistono un intorno U di x e un intorno
T V di y tali che
/ U e quindi per ogni y 6= x si ha y ∈
U ∩ V = ∅. Allora y ∈ / U ∈I(x) U . Abbiamo
dunque la tesi.
Esercizio 3.60. Sia f : X → Y continua e Y di Hausdorff. Provare che il
grafico
Γ = {(x, y) ∈ X × Y | y = f (x)}
è chiuso nel prodotto.

Soluzione.

Ricordiamo il Teorema 3.69: Y è di Hausdorff se e solo se la diagonale è


chiusa nel prodotto.
Consideriamo allora la diagonale

∆ = {(x, y) ∈ Y × Y | x = y}

e la funzione
h:X ×Y →Y ×Y
data da h(x, y) = (f (x), y). La funzione h è continua, come si dimostra immedia-
tamente usando la proprietà universale del prodotto (vedi anche Esercizio 3.49
sul libro di Manetti) e basta osservare che

Γ = h−1 (∆)

Dunque: Y Hausdorff =⇒ ∆ chiuso =⇒ Γ chiuso.


Esercizio 4.6 Siano n ≥ 2 e f : S n → R una funzione continua. Denotiamo
con A il sottoinsieme dei punti t ∈ f (S n ) tali che la controimmagine f −1 (t) è
un insieme di cardinalità finita.
Dimostrare che A contiene al più due punti. Trovare tre esempi di funzioni
continue tali che A abbia cardinalità 0, 1 e 2

Soluzione.

Osserviamo in generale che, se f : X → Y è una funzione continua tra spazi


topologici, Z ⊆ Y e W = f −1 (Z), la funzione f induce, per restrizione, una
funzione continua f¯ : X \ W → Y \ Z.
Consideriamo ora f : S n → R continua. Poiché S n è connesso, l’imma-
gine f (S n ) è connessa e quindi è un intervallo I della retta reale (oppure un
punto). Un intervallo della retta reale contiene al massimo due estremi.
Notiamo che poiché S n è compatto, sappiamo anche che I è compatto, e
quindi I = [a, b] e cioè contiene esattamente due estremi (oppure è un punto, nel
caso a = b). Questo esercizio è stato dato prima dello studio della compattezza e
in effetti questa informazione non serve. Il punto importante è che un intervallo
ha al massimo due estremi.
Sia ora t ∈ I, poniamo Z = {t}, W = f −1 (Z) e supponiamo che W sia un
insieme finito di punti. Allora S n \ W è ancora connesso. Infatti S n meno un
punto è omeomorfo a Rn e quindi S n meno k punti è omeomorfo a Rn meno
k − 1 punti. Poiché n ≥ 2, Rn meno un numero finito di punti è connesso per
archi e quindi connesso. Dunque:

f (S n \ W ) = I \ {t}

è ancora connesso. Ma l’unico modo di rimuovere un punto da un intervallo


lasciandolo connesso è rimuovere un estremo. Dunque ci sono al massimo due
possibilità per il punto t e questa è la tesi.
È facile trovare esempi in cui A ha cardinalità 0 oppure 2:
|A| = 0 Si può prendere f : S n → R costante, per esempio f (x) = 0 per
ogni x. In questo caso A = ∅.
|A| = 2 Consideriamo S n = {(x1 , . . . , xn+1 ) ∈ Rn+1 | x21 +· · ·+x2n−1 = 1}.
Si può prendere f : S n → R data da f (x1 , . . . , xn+1 ) = xn+1 , la proiezione
sull’asse “verticale”. Si ha f (S n ) = [−1, 1] e A = {−1, 1}, i valori minimo e
massimo della funzione f . Infatti f −1 = {(0, . . . , 0, −1)}, f 1 = {(0, . . . , 0, 1)} e
per −1 < t < 1 la controimmagine f −1 (t) è il “parallelo” di latitudine t ed è
una sfera S n−1 . Poiché n ≥ 2, S n−1 ha infiniti punti e t ∈/ A.
Questo secondo caso suggerisce come fare per il caso di cardinalità 1:
|A| = 1 consideriamo S n = {(x1 , . . . , xn+1 ) ∈ Rn+1 | x21 + · · · + x2n−1 = 1}.
Si può prendere f : S n → R data da f (x1 , . . . , xn+1 ) = |xn+1 |. In questo caso
f (S n ) = [0, 1] e A = {1}. Si ha f −1 (1) = {(0, . . . , 0, −1), (0, . . . , 0, 1)} e per
−1 < t < 1 la controimmagine f −1 (t) è la coppia di “paralleli” di latitudine t
e −t ed è quindi una coppia di sfere S n−1 . Poiché n ≥ 2, S n−1 ha infiniti punti
et∈ / A.
Nel caso n = 2, disegnare le funzioni appena descritte. La tesi risulterà
particolarmente evidente.
Esercizio 2. Dimostrare che ogni omeomorfismo trasforma componenti
connesse in componenti connesse e cioè: se f : X → Y è un omeomorfismo
e C ⊆ X è una componente connessa di X, allora f (C) è una componente
connessa di Y .
Concludere che due spazi omeomorfi hanno lo stesso numero di componenti
connesse.

Soluzione.

Sia f : X → Y un omeomorfismo e sia g : Y → X l’omeomorfismo inverso.


Sia C una componente connessa di X. Allora f (C) è connesso ed è quindi
contenuto in una componente connessa D di Y .
Applicando g si ottiene

f (C) ⊆ D =⇒ C = g(f (C) ⊆ g(D)

Dunque g(D) contiene una componente connessa ma, essendo connesso, deve es-
sere g(D) = C e quindi f (C) = D, cioè l’immagine di una componente connessa
è una componente connessa.
Sia C(X) l’insieme delle componenti connesse di X e analogamente per Y .
La funzione f induce una funzione f¯ : C(X) → C(Y ), che associa ad ogni
componente connessa C di X la componente connessa f (C) di Y .
Poiché f è biunivoca, è chiaro che due componenti connesse distinte di X
hanno immagini componenti connesse distinte di Y e cioè la funzione f¯ è iniet-
tiva. Si ha
g ◦ f = ḡ ◦ f¯
e g ◦ f = idX = idC(X) , f ◦ g = idY = idC(Y ) e dunque le funzioni f¯ e ḡ sono
inverse l’una dell’altra. Questo significa che sono biunivoche e cioè C(X) e C(Y )
hanno la stessa cardinalità.
Versione 15 set. 2020

Giambattista Marini

Algebra Lineare
e

Geometria Euclidea
ii

Modulo da 12 crediti

Questo testo è rivolto a studenti iscritti a corsi di laurea in materie scientifiche, vengono
trattati gli argomenti che normalmente si svolgono nel corso di geometria.

“non entri nessuno che non conosca la geometria”

(epigrafe all’ingresso dell’accademia di Platone)


iii

Indice

Introduzione 1

0. Elementi di Teoria degli Insiemi 2

§1 Insiemistica di base 2
§2 Funzioni 5
§3 Due tecniche di dimostrazione 7
§4 Soluzione degli esercizi 8

I. Algebra Lineare 9

§1 Introduzione ai sistemi lineari 9


§2 L’eliminazione di Gauss 14
§3 Matrici 20
§4 Matrici quadrate e sistemi lineari 25
§5 Determinante 28
§6 Matrici invertibili e inversa di una matrice 35
§7 Teorema di Cramer 38
§8 Spazi vettoriali 41
§9 Rango di una matrice 53
§10 Sottospazi di uno spazio vettoriale 57
§11 Sottospazi affini di Rn 64
§12 Applicazioni lineari 70
§13 Trasformazioni lineari di uno spazio vettoriale: autovalori e autovettori 77
§14 Matrice rappresentativa di una applicazione lineare 82
§15 Problema della diagonalizzazione 84
§16 Approfondimenti 94
§17 Soluzione degli esercizi 110
iv

II. Geometria Euclidea 114

§1 Geometria Euclidea del piano 114


§2 Rette nel piano 120
§3 Geometria Euclidea del piano: applicazioni ed esercizi 125
§4 Geometria Euclidea dello spazio 128
§5 Rette e piani nello spazio 134
§6 Geometria Euclidea dello spazio: applicazioni ed esercizi 141
§7 Geometria Euclidea di Rn 143
§8 Spazi vettoriali Euclidei e Spazi Euclidei 155
§9 Soluzione degli esercizi 160

Appendice: I Numeri Complessi 163

III. Esercizi di riepilogo e Testi d’Esame 169

§1 Matrici 169
§2 Sistemi Lineari 173
§3 Spazi Vettoriali 177
§4 Applicazioni Lineari 184
§5 Diagonalizzazione 189
§6 Geometria Euclidea 195
§7 Soluzione degli esercizi 200

Indice Analitico 231

Indice dei simboli e delle abbreviazioni 232

Altro materiale didattico si trova nella sezione


“Area Esami”
della mia pagina web
www.mat.uniroma2.it/˜marini
1

INTRODUZIONE

I prerequisiti sono minimi. Si assume che lo studente abbia un minimo di dimestichezza


con l’insiemistica e l’algebra elementare che si studiano nella scuola secondaria. Nel capitolo
zero vengono richiamate le nozioni di insiemistica, comprese quelle riguardanti le funzioni
tra insiemi, utili nel resto del testo.

La trattazione viene mantenuta ad un livello molto elementare, solo passando al para-


grafo dedicato agli approfondimenti di algebra lineare inevitabilmente c’è un piccolo salto
di qualità; a quel punto della trattazione è giusto assumere che lo studente sia matematica-
mente un po’ più maturo, quindi in grado di recepire insegnamenti a un livello più avanzato.

Si dà particolare enfasi alle definizioni. La matematica è fatta al 90% di definizioni! È


solo chiarendo in modo formale ed inequivocabile di cosa si sta parlando che è possibile
svolgere un lavoro rigoroso e gettare le basi necessarie agli eventuali sviluppi. I concetti
che ci sembrano familiari spesso nascondono delle insidie. Per contro, il rigore necessita di
astrazione, ma quello dell’astrazione non è un terreno dove mancano punti fermi e certezze, il
rigore e l’astrazione conducono a semplificazioni e chiarificazioni che permettono di risolvere
problemi altrimenti inattaccabili. Perché la strada sia in discesa si deve solo comprendere
che non c’è nulla di mistico o filosofico o immaginario nelle astrazioni, queste sono solo
scelte “concrete” dei matematici: ad esempio, due rette parallele si incontrano all’infinito
semplicemente perché qualcuno ha deciso di aggiungere ad entrambe uno stesso punto, che
sarà il loro punto di intersezione, ed ha deciso che il punto aggiunto venga chiamato punto
all’infinito (citiamo quest’esempio nonostante in questo testo non vi sia neanche un cenno di
geometria proiettiva, perché emblematico). Naturalmente quanto appena detto è tutt’altro
che fine a se stesso, come ogni altra astrazione si inserisce in una costruzione elegante e ricca
di proprietà nonché portatrice di indubbi vantaggi.

Gli spazi vettoriali, e questo testo è un libro sugli spazi vettoriali, sono oggetti astratti.
Eppure, a dispetto dell’apologia dell’astrazione di cui sopra, evitiamo astrazioni gratuite e
cerchiamo di accompagnare i concetti discussi con molti esempi concreti.

Gli esercizi che si incontrano nel testo sono parte integrante della teoria, possono essere
funzionali a scopi diversi, come quello di fissare le nozioni viste o quello di acquisire quella
sensibilità utile, se non indispensabile, per poter andare avanti. In ogni caso, non devono
essere saltati ma svolti immediatamente dallo studente. Nella quasi totalità dei casi si tratta
di esercizi che sono applicazioni dirette delle definizioni o dei teoremi visti, lo studente che
non riuscisse a risolverli è invitato a rileggere il paragrafo che sta studiando, solo come ultima
spiaggia può andare a vedere le soluzioni!

L’ultimo capitolo è un capitolo di esercizi di riepilogo e testi d’esame. Questi esercizi


servono a familiarizzare con la materia e a confrontarsi con essa, le loro soluzioni come stru-
mento di verifica ed autovalutazione e non come mezzo per l’apprendimento. Lo studente che
non riuscisse a svolgerli non deve “imparare” a svolgerli ma deve tornare indietro allo studio
della teoria. Imparare “come” si fa una certa cosa non serve a nulla se non si comprende
quello che si sta facendo. Sapete qual è la differenza tra uno studente che ha capito la teoria
e uno che non l’ha capita? ...quello che l’ha capita dice che gli esercizi (i testi d’esame) sono
tutti uguali, l’altro dice che sono tutti diversi!

Infine, quando introduciamo un nuovo termine (quasi sempre all’interno di una defini-
zione) lo indichiamo in corsivo, ad esempio scriveremo “la traccia di una matrice è la somma
degli elementi sulla diagonale”.
2

ELEMENTI DI TEORIA DEGLI INSIEMI

In questo breve capitolo raccogliamo alcune nozioni di base che chiunque faccia uso della
matematica deve conoscere, nonché introduciamo alcuni simboli del linguaggio matematico
di uso comune.

§1. Insiemistica di base.

In matematica il concetto di insieme è fondamentale. Secondo il nostro vocabolario, un


insieme è una “collezione, classe, aggregato di elementi che solitamente si individuano o elen-
candoli o assegnando una proprietà che li caratterizza”. Naturalmente a questo punto viene
da chiedersi cosa sia una collezione, un elemento, un elenco e/o una proprietà! L’impossibilità
di rispondere a questa domanda senza ricorrere a sinonimi o ad altri concetti che a loro volta
hanno bisogno di essere definiti, cadendo cosı̀ in un circolo vizioso senza vie d’uscita, è il
motivo per il quale il concetto di insieme viene considerato come primitivo, non definibile.
Premesso che un discorso più approfondito apparterrebbe all’area della logica matematica e
non è assolutamente tra gli scopi di questo testo, funzionalmente ad alcune esigenze concrete
di questo testo e comuni ai corsi di geometria ed analisi (per le lauree in matematica, fisica,
chimica, ingegneria, scienze dei media eccetera) illustriamo esempi di insiemi e le costruzioni
che si fanno a partire da uno o più insiemi.

Gli elementi di un insieme possono essere oggetti astratti. In particolare, ad esempio, è


lecito considerare insiemi i cui elementi sono essi stessi insiemi; ma non si deve esagerare:
parlare dell’insieme di tutti gli insiemi che non contengono se stesso come elemento conduce
ad una antinomia1 , questo è il famoso paradosso di Russell. Può accadere di essere interessati
ad una collezione di insiemi ma per una qualche ragione, anche solo linguistica, non si è
interessati a vedere la collezione stessa come insieme, in questo caso si parla di famiglia di
insiemi. Si considera insieme, anche l’“insieme” privo di elementi. Questo viene chiamato
insieme vuoto e viene denotato col simbolo ∅ . Gli insiemi vengono denotati tra parentesi
graffe, cosı̀, ad esempio, l’insieme costituito dalle prime tre lettere del nostro alfabeto è
l’insieme {a, b, c} . Nel linguaggio matematico si usano i simboli

∃ , ∃! , ∀ , | , := ,
(esiste) (esiste un unico) (per ogni) (tale che) (uguale, per definizione)
=⇒ , ⇐= , ⇐⇒ ,
(implica) (è implicato da) (se e solo se)

(“tale che” viene anche indicato coi due punti). I simboli “esiste” e “per ogni” vengono
chiamati quantificatori. Quanto agli insiemi numerici, gli insiemi dei numeri naturali, interi,
razionali, reali, complessi si denotano rispettivamente coi simboli N, Z, Q , R, C :

N , Z , Q , R , C ,
(naturali) (interi) (razionali) (reali) (complessi)

(la costruzione di questi insiemi non la discutiamo, affinché la notazione sia chiara almeno
in termini naı̈ves, ricordiamo che i naturali sono gli interi non negativi, i razionali sono le
frazioni aventi numeratore e denominatore intero, i reali sono i numeri che scritti in forma
decimale possono anche avere infinite cifre dopo la virgola, i numeri complessi li introduciamo
1 È possibile dimostrare che se non contiene se stesso allora deve contenere se stesso e, viceversa, che se
contiene se stesso allora non può contenere se stesso!
3

in Appendice). Tornando ai quantificatori e agli altri simboli introdotti, ad esempio,

{ x ∈ R | senx ≥ 0 } è “l’insieme dei numeri reali x tali che senx ≥ 0”.

Un sottoinsieme B di un insieme A è un insieme i cui elementi (tutti) appartengono


anche ad A, in questo caso diremo che B è incluso in A o, equivalentemente, che A
contiene B . Quanto all’appartenenza di un elemento ad un insieme e all’inclusione tra
insiemi si usa la simbologia che segue:

a ∈ A A ∋ a B ⊆ A A ⊇ B
(a appartiene ad A) (A contiene l’elemento a) (B è incluso in A) (A contiene B)

(usiamo lettere minuscole per indicare elementi, maiuscole per indicare insiemi). Un simbolo,
se barrato, assume il significato opposto: “6∈” significa “non appartiene”, “6=” significa
“diverso”, “∄” significa “non esiste”, eccetera. Dati due insiemi A e B si definiscono la
loro intersezione A∩B e la loro unione A∪B rispettivamente come l’insieme degli elementi
comuni ad entrambi e l’insieme degli elementi in uno dei due insiemi in questione, in simboli:

A∩B := {x|x ∈ A e x ∈ B}
A∪B := { x | x ∈ A oppure x ∈ B }

Gli insiemi A e B si dicono disgiunti se hanno intersezione vuota, cioè se A ∩ B = ∅ . Si


definisce inoltre la differenza insiemistica A r B come l’insieme degli elementi appartenenti
ad A ma non appartenenti a B . In simboli

ArB := { x | x ∈ A e x 6∈ B } .

Qualora si abbia B incluso in A, la differenza insiemistica ArB si definisce complementare


di B in A e si denota con B c (con A sottinteso).

Naturalmente, intersezione ed unione si definiscono più in generale per famiglie arbitrarie


di insiemi: l’intersezione è l’insieme degli elementi comuni a tutti gli insiemi considerati;
l’unione è l’insieme degli elementi in uno degli insiemi in questione. In simboli, data una
famiglia {Ai } di insiemi, si pone quanto segue:
\
Ai := { x | x ∈ Ai , ∀ Ai }
[
Ai := { x | ∃ Ai con x ∈ Ai }

Nota. In matematica, “uno” significa sempre “almeno uno”, cosı̀ come “esiste un” signi-
fica sempre “esiste almeno un”, cioè uno o più (ovviamente a meno che l’unicità non venga
dichiarata esplicitamente). Ad esempio, con frasi del tipo “quel sistema ammette una solu-
zione” oppure “esiste un elemento che soddisfa la tale proprietà” non si esclude che di
soluzioni del sistema ce ne possano essere più d’una o che di tali elementi ce ne possano
essere più d’uno.

Vediamo alcuni insiemi notevoli.

Definizione 1.1. Sia A un insieme. L’insieme delle parti di A, denotato con P(A), è
l’insieme di tutti i sottoinsiemi di A. In simboli

P(A) := {B|B ⊆ A}

Nel caso dell’esempio dell’insieme delle prime tre lettere dell’alfabeto si ha



P({a, b, c}) = ∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}
4

Esercizio 1.2. Sia A un insieme costituito da n elementi, determinare il numero di


elementi di P(A).

Definizione 1.3. Siano A e B due insiemi. Il prodotto cartesiano di A con B , denotato


con A × B , è l’insieme di tutte le coppie (a, b) al variare di a in A e b in B , dove,
naturalmente, due coppie (a, b) e (a′ , b′ ) sono uguali se e solo se a = a′ e b = b′ . In
simboli
A×B := { (a, b) | a ∈ A , b ∈ B }

Esercizio 1.4. Siano A e B due insiemi, rispettivamente di n ed m elementi. Deter-


minare il numero di elementi di A × B .

Definizione 1.5. Sia A un insieme. Un ricoprimento di A è una famiglia di sottoinsiemi


di A la cui unione è uguale ad A. Una partizione di A è un ricoprimento di A costituito
da insiemi non vuoti a due a due disgiunti.

Un concetto equivalente al concetto di partizione è quello di relazione d’equivalenza.

Definizione 1.6. Sia A un insieme. Una relazione d’equivalenza su A è un sottoinsieme


Ω ⊆ A × A tale che

(a, a) ∈ Ω, ∀ a ∈ A (a, b) ∈ Ω ⇒ (b, a) ∈ Ω (a, b), (b, c) ∈ Ω ⇒ (a, c) ∈ Ω


(proprietà riflessiva) (proprietà simmetrica) (proprietà transitiva)

Solitamente, una relazione d’equivalenza viene denotata col simbolo ∼ . Inoltre, per
indicare che la coppia (a, b) vi appartiene si usa scrivere a ∼ b . Si preferisce usare questa
notazione perché in termini forse meno formali ma sicuramente più intelligibili una relazione
d’equivalenza su A di fatto è una regola (riflessiva simmetrica e transitiva) che consenta di
dire quali elementi di A siano “in relazione”. Nella nuova notazione le richieste citate sono

a∼a∀a ∈ A a∼b ⇒ b∼a a∼beb∼c ⇒ a∼c


(proprietà riflessiva) (proprietà simmetrica) (proprietà transitiva)

Inoltre, dato a ∈ A si definisce classe di equivalenza di a, e si denota con [a], l’insieme


degli elementi in relazione con a. In simboli

[a] := {b ∈ A|a∼b}

Esercizio 1.7. Provare che dare una partizione è come dare relazione d’equivalenza. Più
precisamente, provare quanto segue:
i) data una partizione, mettendo in relazione a con b se e solo se c’è un insieme della
partizione al quale appartengono entrambi si ottiene una relazione d’equivalenza;
ii) data una relazione d’equivalenza, considerando l’insieme delle classi d’equivalenza si
ottiene una partizione;
iii) le costruzioni i) e ii) sono l’una l’inversa dell’altra.
5

§2. Funzioni.

Siano A e B due insiemi. Una applicazione o funzione da A a B è una legge f che


ad ogni elemento di A associa un elemento di B . Una tale legge la denoteremo scrivendo
f : A → B . In questo caso A e B si chiamano rispettivamente dominio e codominio della
funzione f . Volendo indicare chi è f , spesso si usa la notazione che segue:
f : A −−−−→ B
a 7→ “descrizione di f (a)”
Quando è chiaro dal contesto chi sono dominio e codominio si usa denotare una funzione
scrivendo b = f (a), ovviamente intendendo che ad a si associa l’elemento f (a). Conside-
riamo un’applicazione f : A −→ B . Dato a ∈ A , l’elemento f (a) si chiama immagine
di a. L’immagine di f , che denotiamo scrivendo Imf , è il sottoinsieme di B costituito
da tutti gli elementi del tipo f (a) (con a che varia tra gli elementi di A ). In simboli,

Im f := b ∈ B ∃ a ∈ A con f (a) = b

Esempio. La funzione
f : R −−−−→ R
x 7→ sen(x)
denota la funzione sen(x) incontrata nei corsi di analisi: la funzione che al numero reale x
associa il numero reale sen(x). In questo caso, dominio e codominio sono l’insieme dei
numeri reali. L’immagine di questa funzione è l’insieme dei “possibili valori sen(x)”, cioè
l’intervallo [−1, 1]. L’immagine di una funzione non va confusa con il codominio.

Definizione 2.1. Sia f : A −→ B una applicazione.


i) Se Im f = B diciamo che f è suriettiva;
ii) se elementi distinti di A hanno immagini distinte diciamo che f è iniettiva;
iii) se f è sia suriettiva che iniettiva, diciamo che è biunivoca;
iv) fissato b ∈ B , l’insieme degli elementi a ∈ A tali che f (a) = b si chiama fibra
(o immagine inversa) di b e si denota con f −1 (b) .

Si osservi che f è iniettiva se e solo se ogni sua fibra è l’insieme vuoto oppure è costituita
da un solo elemento, f è suriettiva se e solo se ogni sua fibra è non-vuota. Se f è biunivoca,
tutte le fibre sono costituite da un solo elemento, ovvero
per ogni b ∈ B esiste un unico elemento a ∈ A tale che f (a) = b .
In questo caso si dà la definizione che segue.

Definizione 2.2. Sia f : A −→ B una funzione biunivoca. Si definisce l’inversa di f ,


e si denota con f −1 , ponendo

f −1 : B −→ A , f −1 (b) = “l’unico a tale che f (a) = b”.

Avvertenza. C’è un piccolo abuso di notazione! Data una funzione f : A −→ B biuni-


voca, fissato a ∈ A e posto b = f (a), l’espressione f −1 (b) può avere due significati:
f −1 (b) = a f −1 (b) = {a}
(Definizione 2.2) (Definizione 2.1, iv )

nel primo caso abbiamo un elemento di A, nel secondo abbiamo un sottoinsieme di A (che
ha senso anche se f non è biunivoca e può essere vuoto come avere più di un elemento).
6

Definizione 2.3. Il grafico Γf di una funzione f : A → B è il sottoinsieme del prodotto


cartesiano A × B delle coppie del tipo a, f (a) . In simboli
 
Γf := a, f (a) a ∈ A ⊆ A×B

Esempio. Quando y = f (x) è una funzione reale di variabile reale (di quelle che si
incontrano nel corso di analisi), il prodotto cartesiano R × R viene rappresentato come in
figura, dove l’asse (x) denota il dominio R e l’asse (y) denota il codominio (sempre R). Da
notare che la fibra di un elemento y0 si ottiene intersecando il grafico della funzione con la
retta (orizzontale) y = y0 .
asse (y)

y = f(x) •
retta y = y0
y0

asse (x)
a x b c

Nel caso della funzione disegnata abbiamo f −1 (y0 ) = {a, b, c} .

Nota. Suriettività e iniettività di f si traducono in termini di proprietà del grafico:


i) f è suriettiva se e solo se Γf incontra ogni retta orizzontale in almeno un punto;
ii) f è iniettiva se e solo se Γf incontra ogni retta orizzontale in al più un punto.

Esempio. Di seguito consideriamo funzioni reali (dominio = R, codominio = R):


• la funzione y = x3 è sia iniettiva che suriettiva (ovvero è biunivoca);
• la funzione y = ex è iniettiva ma non è suriettiva;
• la funzione y = x3 −x è suriettiva ma non è iniettiva (la retta y = 0 ne incontra
il grafico in 3 punti);
• la funzione y = x2 non è né iniettiva né suriettiva.

Attenzione. Nell’esempio precedente abbiamo fissato dominio = R, codominio = R.


Cambiando il dominio e/o il codominio la funzione cambia (e ne cambiano le proprietà):
la funzione y = x2 , come funzione da R+ (l’insieme dei numeri reali maggiori o uguali a
zero) a R è iniettiva ma non è suriettiva, come funzione da R a R+ è suriettiva ma non
+ +
√ da R a R è sia iniettiva che suriettiva
è iniettiva, come funzione (il che consente di
definirne l’inversa y = x , naturalmente come funzione definita su R+ ).
Analogamente, la funzione logaritmo y = log(x) è la funzione (definita sui reali strettamente
positivi nonché a valori reali) inversa della funzione esponenziale y = ex intesa come funzione
definita sui reali e a valori reali strettamente positivi (vista cosı̀ è biunivoca).
7

§3. Due tecniche di dimostrazione.

Concludiamo con un cenno sulla dimostrazione per assurdo e la dimostrazione per in-
duzione. Avvertiamo lo studente che ci limitiamo a poche, e soprattutto superficiali, parole.
Una trattazione seria è oggetto di studio della logica matematica.

La dimostrazione per assurdo. Supponiamo di dover dimostrare un Teorema P . L’idea


geniale di Zenone di Elea (500 a.c.), conseguente all’intuizione secondo la quale “una cosa o
è oppure non è” del suo maestro Parmenide, è quella di “aumentare” le ipotesi: assumere,
insieme alle eventuali ipotesi già in P , l’ipotesi che P sia falso. Se, sotto queste ipotesi più
ricche si riesce a trovare una contraddizione, allora P è necessariamente vero. Da notare che
anche solo dimostrando P si ottiene una contraddizione (questo perché si sta assumendo
che P sia falso), quindi non solo si hanno a disposizione più ipotesi, ma sarà sufficiente
dimostrare una tesi a priori più debole!

Esempio. Proviamo, effetuando una dimostrazione per assurdo, la seguente affermazione:


esistono infiniti numeri primi
(ricordiamo che un numero è primo se e solo se è un intero positivo, diverso da uno, divisibile
solamente per 1 e per se stesso).

Dimostrazione. Assumendo per assurdo che i numeri primi siano in numero finito, ovvero
che i numeri primi siano
p1 , . . . , pk ,
possiamo considerare il numero n = p1 · . . . · pk + 1 (il prodotto dei nostri primi più uno).
Per come è definito n, la divisione n : pi dà resto 1 per ogni valore dell’indice i . Di
conseguenza n non è divisibile per nessun primo (n.b.: i pi sono tutti i primi).
Questo è assurdo perché
(♣) ogni numero è divisibile per almeno un primo! 

Nota. Quanto all’affermazione (♣), ci sono due possibilità: un numero m è primo oppure
non è primo. Se m è primo, è divisibile per un primo (se stesso), se non è primo allora si
decompone come prodotto di primi ed è divisibile per ognuno di essi. Chi non fosse soddis-
fatto da questa spiegazione (perché usa un’affermazione che va giustificata, l’affermazione
“ogni numero si decompone come prodotto di primi”), può dimostrare (♣) direttamente (a
tal fine suggeriamo di ragionare di nuovo per assurdo, assumendo non vuoto l’insieme dei
numeri non divisibili per alcun primo, si prenda il più piccolo di tali numeri...).

La dimostrazione per induzione. Supponiamo di avere affermazioni Pn che dipendono


da un indice n (un intero strettamente positivo), allora queste saranno tutte vere qualora
risulti verificata P1 e si possa stabilire che ogni affermazione implica la successiva. In
simboli
 
P1 vera; 
=⇒ Pi vera, ∀ i
(Pi vera =⇒ Pi+1 vera), ∀ i

La giustificazione di quanto affermato sta nel fatto che P1 è vera, quindi P2 è vera, quindi
P3 è vera, quindi P4 è vera, e cosı̀ via. Più formalmente possiamo ragionare per assurdo:
se esiste un indice j per il quale Pj è falsa, allora posto j0 = min{ j | Pj è falsa } si ha
la contraddizione “ Pj0 −1 è vera e Pj0 (la successiva) è falsa”.

In inciso, esistono versioni più sofisticate di induzione (che in questo testo non utilizze-
remo mai) dove gli indici dai quali dipendono le affermazioni che si vogliono dimostrare
appartengono a insiemi molto più complicati di quello considerato sopra.
8

§4. Soluzione degli esercizi.

1.2. 2n . Infatti, nello scegliere un sottoinsieme di A, abbiamo due possibile scelte per
ogni elemento di A, quindi, in totale, 2n possibili scelte.
1.4. n · m . Infatti, abbiamo n elementi in A e, per ogni elemento a ∈ A, abbiamo m
possibili coppie del tipo (a, b).
1.7. i) la riflessività segue dal fatto che, per definizione, una partizione è un ricoprimento; la
simmetria è ovvia; la transitività a ∼ b e b ∼ c ⇒ a ∼ c segue dal fatto che esiste un unico
insieme della partizione cui b appartiene, e pertanto questo deve essere lo stesso insieme
cui appartengono a e c. ii) ogni elemento appartiene alla propria classe di equivalenza,
in particolare si ottiene un ricoprimento; se [a] ∩ [c] 6= ∅ , preso b ∈ [a] ∩ [c] si ottiene
[a] = [b] = [c] (quindi, per assurdo, due classi distinte [a] 6= [c] non possono avere
intersezione non vuota, ovvero sono disgiunte). iii) è palesemente tautologica.
9

ALGEBRA LINEARE

§1. Introduzione ai sistemi lineari.

Cominciamo con alcuni esempi. Una definizione formale di sistema lineare la daremo alla
fine del paragrafo, per ora lo studente può tranquillamente pensare al concetto di “equazione,
ovvero sistema di equazioni” visto al liceo.

L’esempio più elementare di sistema lineare è il sistema di una equazione in una incognita

a·x = b, a, b ∈ R .

In questo caso la discussione delle soluzioni è molto semplice: ci sono tre possibilità
i) se a 6= 0 esiste una unica soluzione: x = ab ;
ii) se a = b = 0 ogni valore di x è una soluzione del sistema;
iii) se a = 0 e b 6= 0 il sistema non ha soluzioni.

Esempio. Discutiamo le soluzioni del sistema lineare di una equazione in due incognite

(1.1) a·x + b·y = c, a, b, c ∈ R .

Anche in questo caso l’esistenza di soluzioni dipende dai valori dei coefficienti a, b, c .
Assumendo a 6= 0 (lasciamo allo studente il problema di discutere gli altri casi possibili),
dividendo per a si ottiene 
x = c − by /a .
Pertanto, se a 6= 0 l’insieme delle soluzioni del sistema lineare (1.1) è

(1.2) x, y x = (c − by)/a .

La notazione usata è quella introdotta nel Capitolo 0, la ricordiamo per comodità: “{ ... }”
significa “l’insieme ...” e la barra verticale “|” significa “tale che”. In definitiva, la (1.2) si
legge dicendo “l’insieme degli x, y tali che x = (c − by)/a”. Si osservi che y può assumere
qualsiasi valore. Per questo motivo, diciamo che y è un parametro libero (relativamente alla
descrizione data dello spazio delle soluzioni del sistema (1.1)).

Esempio. Studiamo il sistema lineare di due equazioni in due incognite


(
a·x + b·y = λ
(1.3) , a, b, c, d, λ, µ ∈ R .
c·x + d·y = µ

Se moltiplichiamo la seconda equazione per a e vi sostituiamo ax = λ − by (ottenuta


dalla prima equazione del sistema) troviamo

(1.4) (ad − bc) · y = aµ − cλ .

Si potrebbe obiettare che potremmo aver moltiplicato per zero (se a = 0). Vero, comunque
l’uguaglianza scritta resta valida. Un calcolo simile mostra che

(1.5) (ad − bc) · x = dλ − bµ .


10

Dalle formule (1.4) e (1.5) deduciamo quanto segue.

Proposizione. Se ad − b c 6= 0 , esiste una unica soluzione del sistema lineare (1.3),


si ha
dλ − bµ aµ − cλ
(1.6) x = , y =
ad − bc ad − bc

Dimostrazione. Dividendo sia la (1.4) che la (1.5) per ad − b c troviamo le espressioni di


x ed y che abbiamo scritto. Questo dimostra che c’è al più una soluzione, quella indicata.
L’esistenza è un facile conto: basta sostituire le espressioni (1.6) nel sistema (1.3). 

Resta da studiare il caso ad − b c = 0 (poniamo ∆ := ad − b c). A tal fine osserviamo


che se ∆ = 0 , cioè ad = bc , le due funzioni
f (x, y) := ax + b y e g(x, y) := cx + dy
sono proporzionali: una delle due funzioni è un multiplo dell’altra. Infatti, se assumiamo
ab 6= 0 (lasciamo allo studente l’esercizio di studiare i rimanenti casi possibili), dividendo
la relazione ad = bc per ab troviamo db = ac . Posto k := db , abbiamo
cx + dy = k (ax + b y) .

Ne segue che ci sono due possibilità:


i) µ = k λ , in questo caso le due equazioni di (1.3) si riducono ad una ed abbiamo
infinite soluzioni (cfr. Esempio 1.1);
ii) µ 6= k λ , in questo caso il sistema (1.3) non ammette soluzioni in quanto del tipo

ax + b y = λ
k (ax + b y) = µ 6= k λ
Anche nel caso che abbiamo lasciato per esercizio “ab = 0” si presenta lo stesso fenomeno:
il sistema (1.3) non ammette soluzioni oppure ne ammette infinite. In definitiva vale la
proposizione che segue.

Proposizione 1.7. Se ad − b c = 0 possono verificarsi solo due possibilità:


i) esistono infinite soluzioni del sistema (1.3);
ii) il sistema (1.3) non ammette soluzioni.

A questo punto ci domandiamo, cosa accade con i sistemi di n equazioni in n incognite,


è possibile trovare delle formule che generalizzano la (1.6) e caratterizzare il caso in cui esiste
una unica soluzione? Inoltre, come si affronta lo studio dei sistemi lineari in cui il numero
delle equazioni è diverso da quello delle incognite?

Risponderemo a queste domande nei prossimi paragrafi. Ora, come promesso, definiamo
in modo formale i concetti di “sistema lineare” e di “soluzione di un sistema lineare”.

Definizione 1.8. Un sistema lineare di m equazioni in n incognite è una scrittura


formale del tipo
 a x + ... + a x = b1
 1,1 1 1,n n




 a2,1 x1 + ... + a2,n xn = b2
(⋆) .. ..

 . .




am,1 x1 + ... + am,n xn = bm
dove gli ai,j ed i bi sono numeri reali (detti coefficienti del sistema), mentre x1 , ..., xn
sono dei simboli detti incognite del sistema.
11

Nota. Ci preme sottolineare che un sistema lineare (s.l.) non è un insieme di uguaglianze
bensı̀ un oggetto formale: anche “ {0x = 2 ” è un s.l..

Definizione 1.9. Una soluzione del sistema è una n−pla di numeri x′1 , ..., x′n che,
sostituiti in (⋆) al posto delle incognite, soddisfano tutte le equazioni.

Definizione 1.10. Se i coefficienti b1 , ..., bm (detti anche termini noti) sono tutti nulli
diciamo che il sistema è omogeneo.

Definizione 1.11. Il sistema omogeneo associato al sistema lineare (⋆) è il sistema di


equazioni

 a1,1 x1 + ... + a1,n xn = 0

 .. ..
. .



am,1 x1 + ... + am,n xn = 0
(ottenuto sostituendo i termini noti con degli zeri).

Definizione 1.12. Un sistema lineare si dice compatibile se ammette soluzioni (una o più),
se non ammette soluzioni si dice incompatibile.

Definizione 1.13. Due sistemi lineari, nelle stesse incognite, si dicono equivalenti se hanno
le stesse soluzioni.

L’equivalenza di sistemi lineari è una relazione di equivalenza per l’insieme di tutti i


sistemi lineari, in particolare è definita la nozione di classe di equivalenza di sistemi lineari.
Questo concetto si incontra studiando l’insiemistica di base (cfr. Cap. 0, Def. 1.6), per chi
non avesse confidenza con esso diamo la definizione che segue.

Definizione 1.14. La classe di equivalenza di un sistema lineare S è l’insieme di tutti i


sistemi lineari equivalenti ad S .

Per quel che ci riguarda è solo una questione di linguaggio: dire che due sistemi lineari
sono equivalenti e dire che appartengono alla stessa classe di equivalenza è dire la stessa
cosa. Di fatto la Definizione 1.14 ci serve solo per dare un nome all’insieme di tutti i sistemi
lineari equivalenti ad un sistema lineare dato (si veda, ad esempio, l’osservazione 1.18).

Esempio 1.15. I sistemi lineari


( (
3x + 2y = 7 5x + 6y = 17
2x + 5y = 12 8x + 3y = 14

sono equivalenti. Infatti, hanno entrambi x = 1 , y = 2 come unica soluzione.

Esercizio. Risolvere i sistemi dell’esempio precedente.

Esempio 1.16. I sistemi lineari


 
 3x + 2y + 2z
 = 7  3x + 2y + 2z
 = 7
S1 := 2x + 5y + 2z = 1 , S2 := 2x + 5y + 2z = 1

 

2x + 2y + 3z = 8 9 x + 14 y + 9 z = 17

sono equivalenti. Ma non è necessario risolverli per rendersi conto che sono equivalenti: le
equazioni di S2 le abbiamo ricavate da quelle di S1 (ricopiando le prime due equazioni
e sommando, alla terza equazione, la prima equazione più il doppio della seconda), quindi
se x′ , y ′ , z ′ è una soluzione di S1 , soddisfa anche S2 ; viceversa, le soluzioni di S2 sono
soluzioni anche di S1 perché è possibile ricavare le equazioni di S1 da quelle di S2 (basta
12

ricopiare le prime due equazioni e sottrarre, alla terza equazione, la prima equazione più il
doppio della seconda).

Passiamo dall’esempio al caso generale.

Definizione 1.17. Una combinazione lineare delle equazioni f1 (...) = λ1 , ..., fk (...) = λk
è un’equazione del tipo σ1 f1 (...) + ... + σk fk (...) = σ1 λ1 + ... + σk λk . I numeri σ1 , ..., σk
si chiamano coefficienti della combinazione lineare.

Esempio. La combinazione lineare di coefficienti 2 e 3 delle equazioni


4x + 3y + 5z = 7
2x + 4y + 2z = 3
è l’equazione
14x + 18y + 16z = 23 ,
ottenuta sommando il doppio della prima equazione al triplo della seconda equazione.

Generalizzando quanto visto nell’esempio 1.16, se modifichiamo un sistema lineare som-


mando ad una sua equazione una combinazione lineare delle altre, otteniamo un sistema
lineare equivalente a quello da cui siamo partiti. Naturalmente, anche l’operazione di molti-
plicare un’equazione per una costante non nulla non cambia la classe di equivalenza di un
sistema lineare. In definitiva, abbiamo “l’osservazione fondamentale sulla quale si basano i
metodi per risolvere un sistema lineare”:

Osservazione 1.18. La classe di equivalenza di un sistema lineare non cambia se


i) si moltiplica un’equazione per una costante non nulla;
ii) ad un’equazione si somma una combinazione lineare delle altre;
iii) si scambiano due equazioni tra loro .

Torniamo al sistema (⋆) della Definizione 1.8. Le informazioni che lo identificano sono
racchiuse nei numeri ai,j e bi , numeri che raccoglieremo in delle tabelle ponendo
   
a1,1 ... a1,n a1,1 ... a1,n b1
 . . .   . . . . 
   
    
A := ai,j :=  . . .  , Ae :=  .
 . . .  .

   
 . . .   . . . . 
am,1 ... am,n am,1 ... am,n bm
Tabelle di questo tipo si chiamano matrici (cfr. Definizione 1.21).

Definizione 1.19 Le matrici A ed A e si chiamano rispettivamente matrice incompleta e


matrice completa associata al sistema lineare (⋆) della Definizione 1.8.

Esercizio 1.20. Indicare quali dei seguenti sistemi di equazioni sono sistemi lineari e, di
quelli lineari, indicarne le matrici incompleta e completa:
(
x+y =1
a) il sistema, nelle incognite x, y, di equazioni ;
x−y =3
(
ax + 2y = 3
b) il sistema, nelle incognite x, y, z, di equazioni ;
x − sent · y = 3
(
x·y = z
c) il sistema di equazioni .
x|t|+1 = z · y
13

Useremo le matrici in maniera sistematica, e non solo come oggetti associati ai sistemi
lineari. È bene iniziare a familiarizzare fin d’ora con alcune notazioni di uso frequente
concernenti le matrici.

Definizione 1.21. Una matrice m × n è una tabella di numeri costituita da m righe ed


n colonne. L’insieme delle matrici m × n lo indichiamo con Mm,n (R) . Data una matrice
A ∈ Mm,n (R) , useremo la notazione “ A = (ai, j )” per indicare che il numero ai, j è
l’elemento che si trova sulla riga i e colonna j (detto anche “di posto i, j ”).

Definizione 1.22. Se A ∈ Mn, n diciamo che è una matrice “quadrata”. In questo caso
la sequenza degli elementi a1, 1 , a2, 2 , ..., an, n si chiama diagonale principale:
 
a1,1 a1,2 · · · a1,n
 a2,1 a2,2 · · · · 
  
 · · · · · · 
A = ai,j =   .
 · · · · · · 
 
· · · · · ·
an,1 an,2 · · · an,n

Definizione 1.23. Sia A ∈ Mn, n una matrice quadrata. Se risulta ai, j = 0 per ogni
i > j diciamo che A è una matrice triangolare superiore (la definizione ci dice che una
matrice triangolare superiore è una matrice dove gli elementi che si trovano sotto la diagonale
principale sono tutti nulli).

Definizione 1.24. Sia A ∈ Mn, n una matrice quadrata. Se risulta ai, j = 0 per ogni
i 6= j diciamo che A è una matrice diagonale.

Definizione 1.25. La matrice diagonale A ∈ Mn, n soddisfacente ai, i = 1 per ogni i si


chiama matrice identica e si indica con In .

Esempi.
     
3 2 9 5 8 7 0 0 0 0 1 0 0 0 0
0 4 1 2 7 0 2 0 0 0 0 1 0 0 0
     
0 0 4 3 9 0 0 4 0 0 0 0 1 0 0
     
0 0 0 6 1 0 0 0 6 0 0 0 0 1 0
0 0 0 0 5 0 0 0 0 8 0 0 0 0 1
 
matrice
(matrice diagonale) (matrice identica I5 )
triangolare superiore

Nel prossimo paragrafo spieghiamo un procedimento, l’algoritmo di Gauss, che consente


di ridurre un qualsiasi sistema lineare dato ad un sistema “a scala”, e quindi di risolverlo.
14

§2. L’eliminazione di Gauss (E.G.).

L’algoritmo di eliminazione di Gauss (E.G.), è un procedimento che consente di risolvere


qualsiasi sistema lineare. L’idea alla base di questo procedimento è molto semplice: dato
un sistema lineare, si considera la matrice completa associata, si opera su questa matrice
effettuando delle “operazioni elementari” (cfr. Definizione 2.1), ottenendo cosı̀ una nuova
matrice il cui sistema lineare associato, che risulta essere equivalente a quello di partenza, è
di un tipo molto particolare che si risolve facilmente.

Definizione 2.1. Sia A una matrice. Le operazioni che seguono si definiscono operazioni
elementari:
i) la moltiplicazione di una riga per una costante non nulla;
ii) l’operazione di sommare ad una riga una combinazione lineare delle altre;
iii) lo scambio di due righe tra loro.
Diremo inoltre che due matrici A e B sono E.G.-equivalenti, ovvero diremo che l’una si
ottiene dall’altra tramite l’E.G., e scriveremo
A ∼ B,
se è possibile passare da A a B utilizzando le operazioni elementari di cui sopra.

Inciso 2.2. La definizione di combinazione lineare di righe di una matrice è analoga a quella
di combinazione lineare di equazioni di un sistema: la combinazione Pr lineare Pdi coefficienti
r
σ1 , ..., σr delle righe (c1,1 ... c1,n ) , ..., (cr,1 ... cr,n ) è la riga ( t=1 σt ct,1 ... t=1 σt ct,n ) .

Enunciamo ora un risultato fondamentale che bisogna tenere sempre presente.

Lemma 2.3. Sia A e una matrice, sia Be la matrice ottenuta eseguendo operazioni ele-
e e e B
mentari su A . Si ha che i sistemi lineari le cui matrici complete sono le matrici A e
sono equivalenti. In sintesi:
e ∼ B
A e =⇒ “i rispettivi sistemi associati sono equivalenti”.

Dimostrazione. Scrivere una matrice non è altro che un modo compatto di scrivere le
informazioni che individuano un sistema lineare e le operazioni descritte nella Definizione 2.1
non sono altro che la traduzione in termini di questa nuova notazione delle operazioni (dette
anch’esse elementari) indicate nella Osservazione 1.18. 

Come corollario del Lemma 2.3, possiamo risolvere un sistema lineare applicando il
metodo che segue: scriviamo la matrice completa associata al sistema lineare, la “sem-
plifichiamo” utilizzando le “mosse” previste in nella Deifnizione 2.1, risolviamo il sistema
lineare la cui matrice completa associata è quella ottenuta mediante la “semplificazione”
effettuata. Più avanti vedremo i dettagli di questa procedura, intanto illustriamo qualche
esempio concreto.

Esempio. Consideriamo il sistema lineare



 x + 3y + z
 = 2
4x + 9y + 3z = 8 .


3x + 5y + 2z = 7
Per risolverlo, il primo passo da fare consiste nello scrivere la matrice completa associata
 
1 3 1 2
4 9 3 8 .
3 5 2 7
15

A questo punto operiamo sulla matrice:


     
1 3 1 2 1 3 1 2 1 3 1 2
 4 9 3 8  ∼(1)  0 −3 −1 0 ∼(2) 0 −3 −1 0  ∼(3)
3 5 2 7 0 −4 −1 1 0 0 1/3 1
     
1 3 1 2 1 0 0 2 1 0 0 2
 0 −3 0 3  ∼(4)  0 −3 0 3 ∼(5) 0 1 0 −1  ,
0 0 1/3 1 0 0 1/3 1 0 0 1 3

dove i passaggi effettuati sono: 1) alla seconda riga abbiamo sottratto il quadruplo della
prima ed alla terza abbiamo sottratto il triplo della prima, 2) alla terza riga abbiamo
sottratto i quattro terzi della seconda, 3) alla seconda riga abbiamo sommato il triplo
della terza, 4) alla prima riga abbiamo sommato la seconda e sottratto il triplo della terza,
5) abbiamo diviso la seconda riga per −3 ed abbiamo moltiplicato la terza riga per tre. Il
sistema associato all’ultima matrice che abbiamo scritto è il sistema
 
 1x + 0y + 0z = 2
 x = 2

0 x + 1 y + 0 z = −1 ovvero y = −1

 

0x + 0y + 1z = 3 z = 3
In virtù del Lemma 2.3 quest’ultimo sistema è equivalente a quello da cui siamo partiti,
pertanto il sistema considerato è compatibile ed ammette un’unica soluzione, questa è la
terna x = 2 , y = −1 , z = 3 .

Le cose non vanno sempre cosı̀ bene, se non altro perché potremmo partire da un sistema
che ammette infinite soluzioni o che non ne ammette affatto.

Esempio. Consideriamo il sistema lineare

x + 3y − 7z = 2.

La matrice completa associata è la matrice



1 3 −7 2

e non c’è modo di “semplificarla”. In compenso le soluzioni di questo sistema sono evidenti:
possiamo considerare y e z come parametri liberi e porre x = −3y + 7z + 2 . Vogliamo
sottolineare che le soluzioni di questo sistema sono infinite, e sono tutte e sole le terne x, y, z
ottenute scegliendo arbitrariamente due valori per y e z e ponendo x = −3y + 7z + 2 .

Esempio. Consideriamo il sistema lineare


(
x + 2y + 5z = 2
2 x + 4 y + 10 z = 3

La matrice completa associata è la matrice


 
1 2 5 2
.
2 4 10 3
Sottraendo alla seconda riga il doppio della prima troviamo la matrice
 
1 2 5 2
,
0 0 0 −1
che è la matrice completa associata al sistema ovviamente incompatibile
(
x + 2y + 5z = 2
0 = −1
16

Torniamo alla teoria generale.

Definizione 2.4 Una matrice a scala superiore è una matrice A = (ai,j ) ∈ Mm,n (R)
in cui ν(i) , che per definizione è l’indice massimo ν tale che ai,1 = ... = ai,ν = 0 , è
una funzione strettamente crescente dell’indice di riga i , con l’ovvia eccezione che se una
riga è tutta nulla ci limiteremo a richiedere che le successive siano anch’esse nulle (...non
potrebbero avere più di n zeri, poverine hanno solo n elementi!). Di una matrice a scala,
il primo elemento non nullo di una riga non nulla viene chiamato pivot.

Questo è un esempio di matrice a scala superiore:


 
1 3 −1 5 0 1 2
 0 2 2 −7 0 0 11 
 
 0 0 0 −1 21 3 8 .
 
0 0 0 0 3 0 0
0 0 0 0 0 −4 2

Esercizio 2.5. Provare che in una matrice A a scala superiore gli elementi che si trovano
sotto ai, i sono tutti nulli, per ogni i. In particolare, una matrice quadrata a scala superiore
è necessariamente triangolare superiore (cfr. Definizione 1.23).

Esercizio 2.6. Indicare quali matrici tra quelle che seguono sono a scala superiore.
       
1 3
4 3 1 1 2 3 1 1 0 0 0
 0 −1 
A = 0 2 2 , B = 0 0 2 1 , C = 0 0 2 0 , D =  
0 5
0 0 0 0 0 −1 1 0 0 0 0
0 0
     
0 2 3 1 −1 3 3 1   2 1
 0 0 2 1   0 0 9 4  0 0 0
E= , F = , G= , H = 0 0
0 0 1 5 0 0 0 4 0 0 0
0 0
0 0 0 1 0 0 0 0

Esercizio 2.7. Dimostrare che una matrice è a scala se e solo se soddisfa quanto segue:
se a sinistra di un elemento ci sono solo zeri
(♣)
allora anche sotto di esso ci sono solo zeri

(L’elemento a1, 1 , trovandosi nella prima colonna, non ha nulla alla sua sinistra, ovvero
soddisfa automaticamente l’ipotesi di “avere solo zeri alla sua sinistra”. Pertanto in una
matrice soddisfacente la proprietà (♣), gli elementi a1, 2 , ..., a1, n sono tutti nulli).

Osservazione 2.8. I sistemi lineari la cui matrice completa associata è a scala supe-
riore, che chiameremo sistemi a scala, si risolvono rapidamente per sostituzione partendo
dall’ultima equazione e “tornando indietro”. Infatti, per questo tipo di sistemi lineari, accade
che la prima incognita di ogni equazione non compare nelle equazioni successive e dunque
può essere ricavata come funzione delle incognite che la seguono. Vediamo un esempio:

Esempio. Il sistema a scala (nelle incognite x, y, z, w, s)



 2x + y − 3z + w − s = 2


(2.9) 3z − w + 2s = 3



w + 5 s = 10
si risolve nel modo che segue: si considera l’ultima equazione e si considerano come parametri
liberi tutte le variabili che seguono w , quindi si scrive

w = − 5s + 10 ;
17

si sostituisce quanto ottenuto nella penultima equazione e si isola la variabile z (la prima
variabile che compare in tale equazione), ottenendo cosı̀

z = − 7s + 13 / 3

(in questo passaggio non sono apparsi altri parametri liberi oltre s, che abbiamo già consi-
derato); si sostituisce quanto ottenuto nella prima equazione e si isola la variabile x (che,
come sempre, è la prima variabile dell’equazione che stiamo considerando), quindi si scrive

x = − y − s + 5 /2

tenendo le eventuali altre2 variabili, in questo caso solamente la y , come parametri liberi.
In definitiva, lo spazio delle soluzioni del sistema (2.9) è l’insieme
  
 x = − y − s + 5 /2 
  

(2.9′ ) x, y, z, w, s z = − 7s + 13 / 3 ,

 

w = − 5s + 10

dove, lo ripeto, y ed s sono parametri liberi, ovvero sono variabili che possono assumere
qualsiasi valore.

L’esempio esposto non ha nulla di particolare, ogni sistema lineare la cui matrice completa
associata è a scala superiore si risolve nello stesso modo. L’unica cosa che potrebbe accadere
è ritrovarsi qualcosa del tipo “ 0 = 3 ” come ultima equazione e, di conseguenza, di fronte
ad un sistema lineare palesemente incompatibile.

Il primo coefficiente non nullo di ogni equazione viene chiamato pivot. Si osservi che i
parametri liberi sono le variabili che non corrispondono ad un pivot. Nell’esempio consi-
derato i pivot sono 2, 3, 1 (coefficienti di x, z, w , rispettivamente della prima, seconda e
terza equazione) ed i parametri liberi sono le restanti variabili: y ed s .

Inciso 2.10. Spesso è opportuno usare i simboli t1 , t2 , ... per indicare, ed evidenziare, i
parametri liberi. In questo modo le soluzioni del sistema dell’esempio vengono scritte nella
forma   
 x = − t1 − t2 + 5 / 2 

 


 y = t 


 1 



(2.10 )
x, y, z, w, s z = − 7t2 + 13 / 3 ,

 


 w = − 5t2 + 10 


 

 s = t 
2

detta anche rappresentazione parametrica dell’insieme delle soluzioni del sistema dato.

Visto che sappiamo risolvere i sistemi a scala resta da imparare a ridurre un qualsiasi
sistema ad un sistema a scala, ed in virtù dell’osservazione 2.8, resta da illustrare l’algoritmo
che trasforma una qualsiasi matrice in una matrice a scala. Questo algoritmo viene descritto
nella prossima dimostrazione e si chiama algoritmo di riduzione a scala (ovvero di Gauss).

Proposizione 2.11. Sia A = ai,j ∈ Mm,n (R) una qualsiasi matrice rettangolare.
L’E.G. per righe consente sempre di trasformarla in una matrice a scala superiore.

Dimostrazione. Sia k l’intero più grande tale che la sottomatrice B costituita dalle prime
k colonne di A è a scala. Il valore k può anche essere zero (per l’esattezza, k 6= 0 se e
solo se a2,1 = ... = am,1 = 0 ). Se B non ha righe identicamente nulle, A è a scala ed
2 Oltre quelle già considerate.
18

abbiamo concluso. Altrimenti, assumiamo k < n (se k = n la matrice A è già a scala e


non c’è nulla da dimostrare). Posto r uguale all’indice della prima riga identicamente nulla
di B (se k = 0 scegliamo r = 1 ), consideriamo ar,k+1 , ..., am,k+1 . Questi numeri non
sono tutti nulli perché altrimenti la sottomatrice delle prime k + 1 colonne di A sarebbe a
scala.
∗ gli “∗” denotano pivot


riga r → ? il blocco B costituito dalle prime k colonne è a scala
.. (si noti che B ha tutti zeri dalla riga r in poi)
tutti zeri .
? i “ ? ” sono gli elementi ar,k+1 , ..., am,k+1 (non tutti nulli)
| {z }
B = “prime k colonne”

A meno di cambiare l’ordine delle righe di indice r, ..., m possiamo assumere ar,k+1 6= 0 ,
ai,k+1
quindi per ogni i > r sottraiamo alla i−esima riga il prodotto della r−esima riga per ar,k+1 .
In questo modo sotto ar,k+1 otteniamo tutti zeri, quindi la sottomatrice delle prime k + 1
colonne della “nuova” A (stiamo modificando la nostra matrice) è a scala.
Iterando questo procedimento arriveremo ad avere k = n ed avremo quindi concluso la
riduzione a scala di A . 

Esempio. Questa è la riduzione a scala di una matrice effettuata iterando il procedimento


descritto nella dimostrazione precedente:
   
0 2 0 5 8 1 0 2 0 5 8 1
0 0 0 3 9 6 0 0 2 2 0 4
A :=   ∼(1) B :=   ∼(2)
0 0 2 2 0 4 0 0 0 3 9 6
0 0 3 10 0 2 0 0 3 10 0 2

   
0 2 0 5 8 1 0 2 0 5 8 1
0 0 2 2 0 4  0 0 2 2 0 4 
C :=   ∼(3) D :=  .
0 0 0 3 9 6 0 0 0 3 9 6
0 0 0 7 0 −4 0 0 0 0 −21 −18
In quest’esempio, consideriamo la prima colonna. Poiché questa, come matrice 4 × 1 , è a
scala, andiamo avanti e consideriamo la sottomatrice 4 × 2 delle prime due colonne che è
anch’essa a scala. Quindi guardiamo la sottomatrice delle prime tre colonne. Questa non è
a scala e purtroppo a2,3 = 0 , ma scambiando la seconda riga con la terza riga, passo 1,
possiamo fare in modo che l’elemento della seconda riga e terza colonna diventi diverso da
zero (in questo modo arriviamo alla matrice B ). La sottomatrice delle prime tre colonne
di B non è ancora a scala perché sotto b2,3 non ci sono tutti zeri. Sottraendo alla quarta
riga i tre mezzi della seconda, passo 2, otteniamo la matrice C , che è una matrice le cui
prime tre colonne sono a scala. Andiamo avanti: consideriamo la sottomatrice delle prime
quattro colonne di C . Questa non è a scala ma lo diventa se sottraiamo alla quarta riga
i sette terzi della terza riga, passo 3. In questo modo otteniamo la matrice a scala D ed
abbiamo concluso.

Ricapitolando, il metodo per trovare le soluzioni di un qualsiasi sistema lineare è il


seguente: scriviamo la matrice completa ad esso associata A e , quindi la trasformiamo in una
matrice a scala superiore effettuando l’E.G. per righe. Il risultato che si ottiene in questo
modo è un sistema lineare equivalente a quello di partenza ma che si risolve immediatamente
per sostituzione (partendo da xn e “tornando indietro”).

Esercizio 2.12. Risolvere i sistemi lineari le cui matrici complete associate sono quelle
dell’esercizio 2.6. Naturalmente, indicare esplicitamente quante e quali sono le incognite,
discutere la compatibilità ed indicare i parametri liberi (si controlli la correttezza dei risultati
ottenuti, a tal fine si veda il paragrafo §17, “Soluzione degli esercizi”).
19

Esercizio 2.13. Risolvere i sistemi lineari nelle incognite x, y, z, w, s



 x + y − 7z + w − s
 = 3
S1 : 3z + y + 2s = 8


w + 3s = 6
(
x + y − 7z + w − s = 3
S2 :
3x + y + 2s = 2
(
y = 3
S3 :
3x + y + 2s = 2

specificando quali incognite sono parametri liberi ed indicando lo spazio delle soluzioni nella
forma
 
 x1 = c1,1 t1 + ... + c1,ℓ tℓ 
 

(2.13 ) x1 , x2 , ... ...

 
xn = cn,1 t1 + ... + cn,ℓ tℓ ... 

(cfr. Inciso 2.10), dove t1 , ..., tℓ denotano i parametri liberi.


20

§3. Matrici.

In questo paragrafo introduciamo le operazioni di somma e prodotto tra matrici. Vediamo


inoltre come si collocano queste operazioni nell’ambito della teoria dei sistemi lineari. Prima
di procedere ricordiamo la Definizione 1.21: la matrice

A = (ai, j ) ∈ Mm,n (R) (m righe ed n colonne)

è la tabella di numeri il cui elemento di posto i, j è l’elemento ai, j .

Definizione 3.1. Consideriamo due matrici delle stesse dimensioni


   
a1,1 . . . a1,n b1,1 . . . b1,n
  . . . . .    . . . . . 
   
A := ai,j :=  . . . . .  , B := bi,j :=  . . . . .  .
   
. . . . . . . . . .
am,1 . . . am,n bm,1 . . . bm,n
Si definisce la loro somma A + B ponendo
 
a1,1 + b1,1 . . . a1,n + b1,n
 . . . . . 
 
A + B :=  . . . . .  .
 
. . . . .
am,1 + bm,1 . . . am,n + bm,n
Osserviamo che A + B ∈ Mm,n (R) .

Esempio.
     
4 3 1 0 1 2 3 11 5 5 4 11
0 2 2 0 + 3 7 2 19  = 3 9 4 19  .
2 −5 0 1 3 0 −1 57 5 −5 −1 58

Definizione 3.2. Siano A = (ai,j ) ∈ Mm,n (R) e C = (ci,j ) ∈ Mn,k (R) due matrici (si
osservi che il numero delle colonne di A è uguale al numero delle righe di C ). Si definisce
il prodotto righe per colonne
A · C ∈ Mm,k (R)
ponendo
n
X

(3.2′ ) A·C i,j
:= ai,h · ch,j
h=1

dove A·C i,j
denota l’elemento di posto i, j della matrice A · C .

Si osservi che secondo questa formula, l’elemento di posto “ i, j ” della matrice prodotto
è il “prodotto” della i−esima riga di A per la j −esima colonna di C . Ad esempio,
 
  ⋆ ⋆ α ⋆  
⋆ ⋆ ⋆ ⋆ ⋆ ⋆ ⋆
· ⋆ ⋆ β ⋆ = .
a b c ⋆ ⋆ aα + bβ + cγ ⋆
⋆ ⋆ γ ⋆

Esempio 3.3.
 
  1 2 0 3  
4 0 1 0 7 7 8 −1 11
· 2 1  = .
2 −5 0 2 −31 −10 1
3 0 −1 −1
21

Esercizio 3.4. Calcolare i seguenti prodotti


   
      5 1 0 5
1 −2 4 3 2 −1 3
· ; · 1 1 1 ;  2  · ( 2 −1 ) ;
2 3 −1 1 5 7 −4
−2 2 4 1
     
1 5 5
 2  · ( 5 7 −4 ) ;  7  · (1 2 3) ; (1 2 3)·  7  .
3 −4 −4

(dovete ottenere rispettivamente matrici 2×2 , 2×3 , 3×2 , 3×3 , 3×3 , 1×1) .

Per giustificare la Definizione 3.2, ci limitiamo a fare una considerazione: se sostituiamo


le relazioni

(
 y1 = z1 + 2z2 + 0z3 + 3z4

x1 = 4y1 + 0y2 + y3
y2 = 0z1 + 7z2 + 2z3 + z4 nelle relazioni

 x2 = 2y1 − 5y2 + 0y3
y3 = 3z1 + 0z2 − z3 − z4

otteniamo proprio (
x1 = 7z1 + 8z2 − z3 + 11z4
x2 = 2z1 − 31z2 − 10z3 + z4
Si noti che le matrici associate a queste relazioni sono quelle del prodotto nell’esempio 3.3.

Osservazione 3.5. Quanto visto nell’esempio vale in generale: il prodotto (righe per
colonne) tra matrici “codifica” l’operazione di sostituzione. Infatti, date A e C come nella
Definizione 3.2, se x1 , ..., xm , y1 , ..., yn e z1 , ..., zk soddisfano le relazioni
Xn Xk
xi = ai,1 y1 + ... + ai,n yn = ai,h yh e yh = ch,1 z1 + ... + ch,k zk = ch,j zj ,
h=1 j=1
(dove i = 1, ..., m e h = 1, ..., n ), allora risulta
n n k k n
!
X X X X X
xi = ai,h yh = ai,h ch,j zj = ai,h ch,j zj
h=1 h=1 j=1 j=1 h=1

(n.b.: tra le parentesi c’è l’elemento di posto i, j del prodotto A · C , cfr. Definizione 3.2).

Proposizione 3.6. Le operazioni tra matrici soddisfano le proprietà

(A + B) + C = A + (B + C) (associatività della somma),


(A · D) · E = A · (D · E) (associatività del prodotto),

(A + B) · D = A·D + B ·D
(proprietà distributive),
A · (D + D′ ) = A · D + A · D′

dove naturalmente si richiede che le dimensioni delle matrici in questione siano compatibili
con le operazioni scritte: A, B, C ∈ Mm,n (R) , D, D′ ∈ Mn,k (R) ed E ∈ Mk,h (R)

Osservazione 3.7. Il prodotto non è commutativo, ad esempio


           
4 3 1 2 13 29 1 2 4 3 4 7
· = ma · = .
0 2 3 7 6 14 3 7 0 2 12 23

Peraltro, se le dimensioni delle matrici in questione non sono “giuste”, non ha neanche senso
invertire l’ordine dei fattori (il numero delle colonne della matrice a sinistra deve essere
uguale al numero delle righe di quella a destra).
22

L’osservazione che segue deve assolutamente essere compresa a fondo in quanto basilare
per la teoria che svilupperemo.

Osservazione 3.8. Un modo compatto per denotare il sistema lineare (⋆) introdotto
nella Definizione 1.8 consiste nello scrivere

A · ~x = ~b ,
   
x1 b1
. .
dove, per definizione, ~x =  ..  , ~b =  ..  , A è la matrice incompleta associata al
xn bm
sistema lineare dato ed il prodotto “·” è il prodotto righe per colonne della Definizione 3.2.
Infatti, usando la Definizione 3.2 di prodotto righe per colonne si ottiene proprio
 
  a1,1 x1 +... + a1,n xn
a1,1 . . . a1,n    
 . . . . .  x1  ... 
   ..   
A · ~x =  . . . . . · . = 
 ...  ∈ Mm,1 (R) .

   
. . . . . xn  ... 
am,1 . . . am,n
am,1 x1 +... + am,n xn

Esempio. (  
  x  
2x − y + 5z = 2 2 −1 5   2
Il sistema lineare si scrive y = .
x + 3z = −1 1 0 3 −1
z

Esercizio. Scrivere i sistemi lineari incontrati nel paragrafo § 2 nella forma A · ~x = ~b.

Inciso/Definizione 3.9. Abbiamo introdotto i simboli ~x e ~b come matrici costituite


da una sola colonna. D’ora in avanti oggetti di questo tipo li chiameremo vettori, quindi
parleremo di “vettore delle incognite”, “vettore dei termini noti” o semplicemente di “vet-
tore” (naturalmente, sempre riferendoci a un oggetto di questo tipo). Osserviamo che questi
oggetti, in quanto matrici, li possiamo sommare tra loro, naturalmente a condizione che ab-
biano lo stesso numero di elementi (cioè di righe, la colonna è una sola). Gli spazi vettoriali,
quindi la nozione di vettore, verranno introdotti nel paragrafo § 8. La definizione appena
introdotta prendetela semplicemente come una anticipazione su qualcosa che vedremo in
seguito.

Inciso 3.10. Vediamo un’applicazione alla teoria dei sistemi lineari dell’uso delle matrici.
Sia ~x1 una soluzione del sistema lineare

(⋆) A · ~x = ~b

e sia ~x0 una soluzione del sistema omogeneo associato A · ~x = ~0 (dove ~0 denota il vettore
dei termini noti quando questi sono tutti nulli). Allora risulta

A · (~x1 + ~x0 ) = A · ~x1 + A · ~x0 = ~b + ~0 = ~b .

In altri termini, se a una soluzione del sistema (⋆) sommo una soluzione del sistema omogeneo
associato, trovo di nuovo una soluzione del sistema (⋆). Inoltre, fissata a priori una qualsiasi
soluzione del sistema (⋆), ogni altra soluzione di (⋆) è somma della soluzione fissata e di una
soluzione del sistema omogeneo associato. Infatti, se ~x2 è un’altra soluzione di (⋆), si ha
A · (~x2 − ~x1 ) = ~b −~b = ~0 , quindi ~x2 si scrive come ~x2 = ~x1 + (~x2 − ~x1 ) , essendo il vettore
tra parentesi una soluzione del sistema omogeneo associato. Questo risultato è noto come
teorema di struttura dell’insieme delle soluzioni di un sistema lineare.
23

Teorema (di struttura) 3.11. Sia ~x1 una soluzione del sistema lineare

(⋆) A · ~x = ~b

e sia S0 l’insieme delle soluzioni del sistema omogeneo associato A·~x = ~0 . Allora l’insieme
S di tutte le soluzioni del sistema (⋆) è l’insieme

S = S0 + ~x1 := ~x ~x = ~x1 + ~s , ~s ∈ S0

Osservazione 3.12. Facciamo un passo indietro


 e torniamo all’osservazione 3.5. Posto
   
x1 y1 z1
.   .
~x :=  ..  , y :=  ...  ,
~ ~z :=  ..  ,
xm yn zk
le relazioni
Xn Xk
xi = ai,h yh , yh = ch,j zj
h=1 j=1
possono essere scritte nella forma compatta

~x = A · ~y , ~y = C · ~z .

Sostituendo ~y = C ·~z nella relazione ~x = A·~y si ottiene



~x = A · C · ~z

Quindi, usando l’associatività del prodotto tra matrici, si ottiene

~x = (A · C) · ~z ,

k n
!
X X
che è esattamente la forma compatta della relazione xi = ai,h ch,j zj ottenuta
j=1 h=1
nell’osservazione 3.5.

Esercizio 3.13. Calcolare i prodotti che seguono.


           
α 0 0 2 4 9 2 4 9 α 0 0 2 4 9 α
 0 β 0 · 1 6 7 ; 1 6 7 ·  0 β 0 ; 1 6 7 · β  .
0 0 γ 3 5 8 3 5 8 0 0 γ 3 5 8 γ

Le operazioni consentite dall’E.G. (cfr. Definizione 2.1) possono essere espresse come
prodotti con matrici opportune. L’esercizio che segue serve ad introdurre questo tipo di
risultato.

Esercizio 3.14. Si considerino le matrici 5 × 5 che seguono


     
1 0 0 0 0 1 0 0 0 0 1 0 0 0 0
0 1 0 0 0 0 1 0 0 0 0 1 0 0 0
     
E1 :=  0 0 1 0 0  ; E2 :=  0 0 1 0 0  ; E3 :=  0 0 0 1 0.
     
0 0 0 λ 0 α β γ 1 δ 0 0 1 0 0
0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
ed una matrice M , questa 5 × 7 (scrivetene una!). Calcolate i prodotti

E1 · M , E2 · M , E3 · M .
24

Osservazione 3.15. Chi ha svolto l’esercizio precedente avrà notato che la moltiplicazione
a sinistra per E1 equivale a moltiplicare una riga di M per il coefficiente λ (nel caso
specifico, la quarta riga), la moltiplicazione a sinistra per E2 equivale a sommare una riga
di M con una combinazione lineare delle altre (nel caso specifico, alla quarta riga viene
sommata la combinazione lineare di coefficienti α, β, γ, δ delle righe I, II, III e V), la
moltiplicazione a sinistra per E3 equivale a scambiare due righe di M (nel caso specifico,
la terza riga con la quarta).

Definizione 3.16 Sia E una matrice quadrata n × n . Diremo che E è una matrice
elementare se è di uno dei seguenti tipi (ricordiamo che In denota la matrice identica,
cfr. Definizione 1.25):
i) la matrice che si ottiene sostituendo un “1” di In con un coefficiente λ 6= 0 ;
ii) la matrice che si ottiene sostituendo gli zeri di una riga di In con dei numeri
arbitrari;
iii) la matrice che si ottiene scambiando due righe di In .

Si osservi che E1 è di tipo i), E2 è di tipo ii), E3 è di tipo iii).

Osservazione 3.17. Generalizzando quanto già visto con l’osservazione 3.15, fissata una
matrice M , la moltiplicazione a sinistra per una matrice elementare equivale ad effettuare
una delle operazioni consentite dall’Eliminazione di Gauss (cfr. Definizione 2.1).

Concludiamo il paragrafo con una definizione.

Definizione 3.18. Sia A = (ai, j ) ∈ Mm, n (R) una matrice. La matrice che si ottiene
“scambiando le righe con le colonne”, ovvero la matrice in Mn, m (R) il cui elemento di posto
“riga i, colonna j” è l’elemento aj, i , si chiama trasposta di A e si indica con tA :

t
 t
A i, j
= aj, i , A ∈ Mn, m (R) .

Inoltre, le matrici che coincidono con la propria trasposta si dicono simmetriche.


 
  2 5
2 −1 3
Esempio. Se A = , allora tA =  −1 7  .
5 7 −4
3 −4
 
8 3 −7
Esempio. La matrice A =  3 1 4  è una matrice simmetrica.
−7 4 5

È utile conoscere come si comporta la trasposizione rispetto alle operazioni di somma e


prodotto di matrici. Quanto alla somma la situazione è molto semplice, si ha
t
 t
A+B = A + tB , ∀ A, B ∈ Mm, n (R) .

Per quel che riguarda il prodotto si deve fare attenzione all’ordine dei fattori (che deve essere
scambiato), infatti risulta
t
 t
(3.19) A·D = D · tA , ∀ A ∈ Mm, n (R) , D ∈ Mn, k (R) .

Questo perché l’elemento di posto i, j della matrice t(A · D), essendo l’elemento di posto
j, i della matrice A · D , si ottiene moltiplicando la riga di posto j di A per la colonna di
posto i di D , esattamente come l’elemento di posto i, j della matrice t D · tA.
25

§4. Matrici quadrate e sistemi lineari.

Due matrici in Mn,n (R) (stesso numero di righe e colonne) possono essere sia sommate
che moltiplicate tra loro, inoltre il risultato che si ottiene è sempre una matrice in Mn,n (R).
In effetti Mn,n (R) , con le due operazioni di somma e prodotto, è un esempio di anello
unitario (un anello è un oggetto algebrico che noi non studieremo). Non entreremo troppo
in questioni algebriche, però alcune considerazioni le vogliamo fare.

Nella trattazione che segue la matrice identica ha un ruolo fondamentale. Ricordiamone


la definizione: la matrice identica di ordine n, che si denota con In , è la matrice n × n
che ha tutti 1 sulla diagonale principale e tutti zeri altrove:
 
1 0 0 ··· 0
 0 1 0 ··· 0 
 
In :=  0 0 1 ··· 0  .
 . . . . 
 .. .. .. . . ... 
0 0 0 ··· 1

Osservazione 4.1. Risulta

A · In = In · A = A, ∀ A ∈ Mn, n (R)

(questo comportamento di In rispetto al prodotto tra matrici è uno dei motivi per i quali
si chiama matrice identica).

Definizione 4.2. Consideriamo A ∈ Mn,n (R) . Se esiste B tale che A · B = In diciamo


che A è invertibile, B la chiamiamo inversa di A e la denotiamo A−1 . Le matrici che
non sono invertibili usualmente vengono chiamate singolari.

Proposizione 4.3. Si ha che A · B = In se e solo se B · A = In . L’inversa di una


matrice, se esiste, è unica.

Rimandiamo la dimostrazione di questa proposizione al paragrafo §16, in parte perché


la vogliamo arricchire con dei commenti che coinvolgono argomenti che dobbiamo ancora
trattare, in parte perché in questo momento non vogliamo appesantire il discorso (comunque,
invitiamo lo studente a dare fin d’ora un’occhiata alla dimostrazione, ...se non altro perché
ci siamo presi la briga di scrivere una dimostrazione che utilizza esclusivamente gli strumenti
introdotti fin qui!).

Torniamo al sistema lineare (⋆) del paragrafo §1, ovvero al sistema:

(4.4) A · ~x = ~b

Se il numero delle equazioni è uguale al numero delle incognite la matrice incompleta A


è una matrice quadrata n × n mentre la matrice completa A e è una matrice n × (n + 1) .
Ora, assumiamo che la matrice A sia invertibile. Se ~x è una soluzione del “sistema (4.4)”,
allora moltiplicando ambo i membri della “uguaglianza (4.4)” per A−1 , si ottiene

A−1 · (A · ~x) = A−1 · ~b .

Per l’associatività del prodotto, A−1 · (A · ~x) = (A−1 · A) · ~x = In · ~x = ~x , quindi

(4.5) ~x = A−1 · ~b .

Quest’uguaglianza mostra l’unicità dell’eventuale soluzione del nostro sistema e ci fornisce un


candidato per tale soluzione. Poiché il passaggio effettuato è “invertibile”: rimoltiplicando
26

la (4.5) per A si torna alla (4.4), abbiamo l’esistenza della soluzione del sistema dato. Vista
l’importanza, vogliamo ripetere il risultato appena dimostrato:

Proposizione 4.6. Se A ∈ Mn,n (R) è una matrice invertibile allora il sistema lineare

A · ~x = ~b

è compatibile ed ha un’unica soluzione. Inoltre, la soluzione è

~x = A−1 · ~b .

Osservazione 4.7. La richiesta dell’invertibilità di A è l’unica ipotesi della proposizione


precedente. In particolare, le ipotesi di tale proposizione non coinvolgono affatto la colonna
dei termini noti ~b .

Il risultato può essere rafforzato, vale anche il “viceversa”:

Proposizione 4.8. Se il sistema lineare di n equazioni in n incognite

A · ~x = ~b

ha un’unica soluzione allora la matrice A è invertibile.

Nel § 7 vedremo che questo risultato segue in modo naturale dalla teoria che per allora
avremo sviluppato. Ma, si sa, le dimostrazioni non servono (solo) a dimostrare i teoremi!
...ma anche a comprendere meglio gli strumenti coi quali si sta lavorando. La dimostrazione
che segue vi servirà ad affinare la sensibilità sull’E.G. e sulla natura del prodotto di matrici.

Dimostrazione. Poiché il sistema ammette un’unica soluzione, l’E.G. sul sistema non deve
produrre né parametri liberi né incompatibilità. Questo accade se e solo se la riduzione a
scala di A produce un pivot su ogni elemento della diagonale, in particolare, indipendente-
mente da ~b . Infatti, da un lato se
A ∼ T
è una riduzione a scala di A, le stesse identiche operazioni effettuate sulla matrice completa
Ae = A | ~b (ad A viene agiunta la colonna ~b ) producono qualcosa del tipo

e = A | ~b
A ∼ Te = T | d~
(una matrice n × n+1 le cui prime n colonne sono esattamente le colonne di T ). D’altro
canto, la matrice a scala T ha elementi sulla diagonale non nulli (tutti) se e solo se Te è
del tipo desiderato, ovvero il sistema ad essa associato ammette un’unica soluzione.
Di conseguenza, se il sistema lineare dato A·~x = ~b ammette un’unica soluzione, ciò accade
per ogni sistema lineare A · ~x = ~c (i.e. con ~c arbitrario). A questo punto non solo siamo
in grado di dimostrare l’invertibilità di A, ma siamo persino in grado di costruire l’inversa.
Infatti, indicando con ~ei la i−esima colonna di In (che sarà quindi il vettore che ha tutti
zeri eccetto un 1 nell’elemento di posto i), risulta che l’inversa di A è la matrice B la cui
i−esima colonna è la soluzione del sistema lineare A · ~x = ~ei . Quanto appena affermato
segue da com’è fatto il prodotto righe per colonne: la i−esima colonna del prodotto A · B
si ottiene facendo scontrare A con la i−esima colonna di B , ma questa colonna, per come
è stata costruita B , è la soluzione del sistema lineare A · ~x = ~ei . Questo dimostra che la
i−esima colonna di A · B è ~ei , quindi che A · B = In . Detto in termini visivamente più
intellegibili, si deve avere    
| |
A · B = A ·  ... ~bi ...  =  ... ~ei ...  = In .
| | 
27

L’esercizio che segue aiuta a comprendere meglio la dimostrazione appena vista.


       
1 0 5 1 0 0
Esercizio 4.9. Sia A =  −1 1 −2 , e1 =  0 , e2 =  1 , e3 =  0  . Si
2 −1 8 0 0 1
risolvano i sistemi lineari
(♣) A · ~x = ~e1 , A · ~x = ~e2 , A · ~x = ~e3
e si scriva la matrice B le cui colonne sono, nell’ordine, le soluzioni dei tre sistemi lineari
dati. Si verifichi che B è l’inversa di A.

Nella dimostrazione della Proposizione 4.8, cosı̀ come nell’esercizio 4.9, utilizziamo i sis-
temi lineari per costruire l’inversa di una matrice. In realtà il lavoro al quale siamo interessati
va esattamente nella direzione opposta: usare l’inversa di una matrice per risolvere, grazie
alla Proposizione 4.6, i sistemi lineari. I prossimi tre paragrafi sono dedicati, tra le altre
cose, a questo scopo.

Esercizio 4.10. Trovare l’errore nel ragionamento che segue. Consideriamo una matrice
A ∈ Mm, n (R) (m righe, n colonne) e consideriamo il sistema lineare A·~x = ~b . Assumiamo
per ipotesi che esista una matrice B ∈ Mn, m (R) (questa volta, n righe, m colonne) tale
che B · A = In (osserviamo che il prodotto B · A ha senso ed è una matrice di n righe e
colonne). Procedendo come nel passaggio dalla (4.4) alla (4.5), abbiamo che

A · ~x = ~b =⇒ B · A · ~x = B · ~b =⇒ In · ~x = B · ~b =⇒ ~x = B · ~b

Ne segue che abbiamo risolto il sistema lineare dato e che ~x = B · ~b ne è una soluzione,
che pertanto risulta anche essere unica.

Il fatto che il risultato ottenuto sopra sia falso lo possiamo dimostrare con un esempio:
se consideriamo il sistema lineare
   
2 2   1  
 −1 1  · x 1 1 −1
= 1 e la matrice B =
y 4 8 −5
0 3 1

(e, mantenendo le stesse notazioni del ragionamento di cui sopra, indichiamo con A la
matrice incompleta del sistema e con ~b il vettore dei termini   abbiamo B · A = I2
noti),
~ 1
(verificatelo, cioè svolgete il prodotto B · A) nonché B · b =
7
...peccato che questo vettore (cioè la coppia x = 1, y = 7 ) non sia una soluzione del sistema
lineare dato (fate la verifica)!

Che dire! ...chi non trova l’errore deve tornare alle Definizioni 1.8 e 1.9 e non può andare
avanti fino a che non lo trova. È importante!

Comunque, a chi sta resistendo alla tentazione di andare a vedere il capitolo dedicato alla
soluzione degli esercizi proposti (dove viene spiegato l’arcano) proponiamo un altro esercizio:

Esercizio 4.11. Il ragionamento dell’esercizio 4.10 non è tutto da buttare, dire cosa
dimostra.

Il prossimo obiettivo è quello di studiare l’invertibilità e calcolare l’inversa di una matrice.


A tal fine avremo bisogno della nozione di “determinante”, oggetto di studio del prossimo
paragrafo.
28

§5. Determinante.

In questo paragrafo introduciamo la funzione determinante, funzione che ad una matrice


quadrata (cioè che ha uguale numero di righe e colonne) associa un numero. Ci sono diverse
definizioni equivalenti del determinante, noi lo definiamo tramite lo sviluppo di Laplace
(cfr. Def. 5.2 e Prop. 5.4). La formula (16.6′ ) e la Proposizione 16.8 forniscono altri due
modi possibili di definire il determinante. Cominciamo con alcuni casi particolari.

Se A = (a) è una matrice 1 × 1 si pone


det (A) := a.
 
a b
Se A = è una matrice 2 × 2 si pone
c d
det(A) := ad − b c .
Per le matrici di ordine superiore la definizione è più complicata, ad esempio già per le
matrici 3 × 3 si pone
 
a b c
det  d e f  := aei − af h − bdi + bf g + cdh − ceg .
g h i
...ma vediamo la definizione generale! La definizione che segue è induttiva, nel senso che si
definisce il determinante di una matrice di ordine n utilizzando il determinante di matrici
di ordine più basso. Premettiamo una notazione.

Notazione 5.1. Sia A ∈ Mn,n (R) una matrice. Indichiamo con Ci,j ∈ Mn−1,n−1 la
matrice che si ottiene prendendo A e cancellando la i−esima riga e la j −esima colonna. Ad
esempio, C1, 2 è la sottomatrice in neretto:
 
3 5 1  
  7 4
se A = 7 2 4 , si ha C1,2 =
8 9
8 6 9
(cancelliamo prima riga e seconda colonna).

Definizione 5.2 (Sviluppo di Laplace del Determinante). Come abbiamo già menzionato,
se A = (a) è una matrice di ordine 1 si pone det A := a . Sia quindi n ≥ 2 e consideriamo
A = (ai,j ) ∈ Mn,n (R) . Si definisce
n
X
(5.2′ ) detA := (−1)1+j a1,j · det C1,j ,
j=1

dove la notazione usata è quella appena introdotta.

Si osservi che l’uguaglianza (5.2′ ) definisce in maniera ricorsiva il determinante: si conosce


il determinante delle matrici di ordine 1; quindi per la formula (5.2′ ) si sa calcolare il deter-
minante delle matrici di ordine 2; conoscendo quest’ultimo, di nuovo per la formula (5.2′ ) si
sa calcolare il determinante delle matrici di ordine 3; ...di quelle di ordine 4; ...eccetera.

Osservazione. Applicando l’uguaglianza (5.2′ ) per n = 3 si ottiene


 
a b c      
e f d f d e
det  d e f  : = a · det − b · det + c · det
h i g i g h
g h i
= a · (ei − f h) − b · (di − f g) + c · (dh − eg) ,
che coincide con la definizione data precedentemente.
29

Esempio. Si ha
 
2 5 3      
2 7 3 7 3 2
det  3 2 7  := 2 · det − 5 · det + 3 · det
4 6 1 6 1 4
1 4 6
= 2 · (12 − 28) − 5 · (18 − 7) + 3 · (12 − 2) = −57 .

Visto che ci siamo vediamo cosa si ottiene per le matrici di ordine 4:


 
a b c d
e f g h
det   :=
i l m n
o p q r
       
f g h e g h e f h e f g
a·det  l m n  − b·det  i m n  + c·det  i l n  − d·det  i l m .
p q r o q r o p r o p q
Si osservi che in questa espressione compaiono 4 determinanti di matrici 3 × 3 , ognuno dei
quali è un polinomio di 6 termini. Quindi, sviluppando i determinanti delle matrici di ordine
4 si perviene ad un polinomio costituito da 4 · 6 = 24 termini. Lo sviluppo del determinante
di una matrice di ordine 5 è un polinomio molto lungo: ha 5 · 24 = 120 termini. Dalla
Definizione 5.2 è evidente per ragioni induttive che questa considerazione si generalizza:

Osservazione 5.3. Per le matrici di ordine n , la funzione determinante è un polinomio


di 1 · 2 · 3 · ... · n termini (questo prodotto si chiama fattoriale di n e si indica con n! , il
punto esclamativo fa parte della notazione).

Vedremo comunque che il calcolo del determinante di una matrice è una operazione molto
più semplice di quanto si possa immaginare ...e temere! Questo perché la funzione determi-
nante soddisfa una serie di proprietà che ne rendono possibile il calcolo tramite l’eliminazione
di Gauss. Proprietà che ora introduco.

Proposizione 5.4. Il determinante di una matrice coincide col suo sviluppo di Laplace
rispetto ad una riga arbitraria, come pure rispetto ad una qualsiasi colonna: sia k un indice
che fissiamo, si ha n
X
detA = (−1)k+j ak,j · detCk,j (sviluppo rispetto alla riga k)
j=1
(5.4′ ) n
X
= (−1)i+k ai,k · det Ci,k (sviluppo rispetto alla colonna k)
i=1

dove come al solito Ci,j è la matrice che si ottiene prendendo A e sopprimendo la i−esima
riga e la j −esima colonna.

La dimostrazione di questa proposizione verrà data negli approfondimenti, § 16, sezione


“aspetti algebrici del determinantene” (lo studente che lo desideri, può leggerla fin d’ora).

Esempio. Sviluppando rispetto alla seconda riga il determinante dell’esempio precedente


si ottiene
 
2 5 3      
  5 3 2 3 2 5
det 3 2 7 : = − 3 · det + 2 · det − 7 · det
4 6 1 6 1 4
1 4 6
= − 3 · (30 − 12) + 2 · (12 − 3) − 7 · (8 − 5) = −57 .

Come promesso dalla formula (5.4 ) il risultato ottenuto è lo stesso di prima: −57 .

Esercizio. Calcolare il determinante della matrice dell’esempio tramite lo sviluppo di


Laplace rispetto alla terza colonna.
30

Definizione 5.5. Il prodotto (−1)i+j · det Ci,j si chiama complemento algebrico di ai,j .

Osservazione 5.6. Alla luce di questa definizione, la Proposizione 5.4 ci dice che il
determinante di una matrice è uguale alla somma degli elementi di una qualsiasi riga o
colonna moltiplicati per i propri complementi algebrici.

Ora osserviamo che se B è la matrice ottenuta da una matrice A scambiando due righe
adiacenti, la i−esima riga con la (i+1)−esima riga, la matrice che si ottiene da A cancellando
la i−esima riga coincide con la matrice che si ottiene da B cancellando la (i+1)−esima riga.
Quindi, per effetto del coefficiente (−1)i+j che appare nella Definizione 5.5, i complementi
algebrici degli elementi della i−esima riga di A coincidono con i complementi algebrici degli
elementi della (i + 1)−esima riga di B cambiati di segno. Ne segue che lo sviluppo di
Laplace di A rispetto alla i−esima riga coincide con lo sviluppo di Laplace di B rispetto alla
(i+1)−esima riga cambiato di segno. Quanto affermato può sembrare complicato, in realta
non lo è affatto, l’esempio che segue aiuta a comprenderlo: posto
   
1 2 3 1 2 3
A = 4 5 6 e B = 7 8 9 ,
7 8 9 4 5 6
quando si cancellano le righe in neretto, quello che resta della matrice A coincide con quello
che resta della matrice B, ma mentre “i segni” (cfr. Definizione 5.5) dei complementi
algebrici degli elementi della riga in neretto di A sono dei (−1)2+j , abbiamo che “i segni”
dei complementi algebrici degli elementi della riga in neretto di B sono dei (−1)3+j .

Come conseguenza di quanto appena osservato, la possibilità garantitaci dalla Propo-


sizione 5.4 di poter calcolare il determinante effettuando lo sviluppo di Laplace rispetto
ad una riga arbitraria, ci dice che se in una matrice scambiamo due righe adiacenti allora
il determinante cambia segno. Questo risultato si generalizza allo scambio di due righe
arbitrarie.

Lemma 5.7. Il determinante è una funzione antisimmetrica delle righe di una matrice: se
scambiamo tra loro due righe qualsiasi il determinante cambia segno.

Dimostrazione. Lo scambio di due righe arbitrarie si può effettuare con un certo numero di
scambi di righe adiacenti e questo numero è necessariamente dispari (questo è un dettaglio di
teoria delle permutazioni che dimostriamo negli approfondimenti, § 16). Pertanto il Lemma
segue da quanto osservato precedentemente. 

Esempio. Scambiando prima e terza riga tra loro il determinante cambia segno:
   
2 5 3 1 4 6
det  3 2 7  = −det  3 2 7  .
1 4 6 2 5 3
Si osservi che lo scambio tra prima e terza riga si può effettuare scambiando la prima con
la seconda, poi la seconda con la terza e poi di nuovo la prima con la seconda:
“1 2 3” “2 1 3” “2 3 1” “3 2 1”
(questi scambi sono tre, come previsto dalla teoria delle permutazioni sono in numero dis-
pari).

Il determinate di una matrice n × n è una funzione che dipende da n2 variabili (gli


elementi di una tale matrice). Possiamo immaginare di fissare tutti gli elementi di una
matrice tranne quelli che si trovano su una data riga, in questo modo otteniamo una funzione
che dipende solo da n variabili, quelle della riga in questione. Il lemma che segue ci dice come
si comporta il determinante visto in questo modo, appunto come funzione degli elementi di
una data riga.
31

Lemma 5.8. Il determinante è una funzione multilineare delle righe della matrice: sia k
un indice di riga, λ un numero reale e siano A , A′ , A′′ e B quattro matrici tali che
ai,j = a′i,j = a′′i,j = bi,j , ∀ i 6= k , ∀ j ;
ak,j + a′k,j = a′′k,j , ∀ j;
bk,j = λak,j , ∀ j.
(cioè coincidono ovunque tranne che per il fatto che la k −esima riga di A′′ è la somma
della k −esima riga di A con quella di A′ , mentre la k −esima riga di B è il prodotto della
k −esima riga di A per λ). Allora
detA + det A′ = det A′′ ;
detB = λ · detA .

Questo enunciato sembra poco digeribile per via dell’uso degli indici. In realtà il lemma è
molto semplice, ci sta dicendo che se fissiamo tutti gli elementi di una matrice eccetto quelli
di una data riga, la funzione determinante, come funzione di quella riga, è lineare. ...ma è
meglio dirlo con due esempi:

Esempio.
   
2λ 5λ 2 5
det = λ · det ;
−7 3 −7 3
     
2+3 5+1 2 5 3 1
det = det + det .
4 7 4 7 4 7

Esempio.
   
2 4 6 2 4 6
det  1 5 9  = λ · det  1 5 9  ;
3λ 2λ 7λ 3 2 7
     
6 3 8 6 3 8 6 3 8
det  1 9 5  = det  1 9 5  + det  1 9 5 .
5+1 2+3 4+7 5 2 4 1 3 7

Esercizio. Calcolare i determinanti delle matrici indicate negli esempi.

Si noti che, in particolare, il determinante della matrice ottenuta moltiplicando una riga
di A per il coefficiente λ (la matrice B del lemma precedente) è uguale a λ · detA.

Osservazione 5.9. Sia A una matrice di ordine n e sia λA la matrice che si ottiene
moltiplicando tutti gli elementi di A per la costante λ. Poiché moltiplicare tutta la matrice
per λ è come moltiplicare ognuna delle sue n righe per λ, abbiamo

det λA = λn · detA .

Dimostrazione (del Lemma 5.8). Poiché le matrici coincidono fuori della k −esima riga,
calcolando il determinante utilizzando lo sviluppo di Laplace proprio rispetto alla k −esima
riga (formula 5.5), si ottiene
n
X n
X
det A + det A′ = (−1)k+j ak,j · det Ck,j + (−1)k+j a′k,j · det Ck,j
j=1 j=1
n
X 
= (−1)k+j ak,j + a′k,j · detCk,j
j=1

= det A′′ .
32

Analogamente, n
X
detB = (−1)k+j bk,j · detCk,j
j=1
n
X
= (−1)k+j λ · ak,j · det Ck,j
j=1

= λ · det A′′ . 

Proposizione 5.10. Si abbia A = (ai,j ) ∈ Mn,n (R) . Si ha


det A = det tA
dove tA è la matrice trasposta della matrice A (def. 3.18).

Dimostrazione. Questa proposizione segue dalla Proposizione 5.4. Infatti, confrontando lo


sviluppo di Laplace rispetto ad una riga con lo sviluppo di Laplace rispetto alla corrispon-
dente colonna della trasposta, ci accorgiamo che si tratta della stessa identica formula! 

Osserviamo che, come corollario, i Lemmi 5.7 e 5.8 continuano a valere qualora si sosti-
tuisca (ovunque) la parola “riga” alla parola “colonna”.

Ricapitoliamo alcune proprietà utili per il calcolo del determinante di una matrice:

Proposizione 5.11. Sia A una matrice quadrata. Si ha che


a) se scambiamo tra loro due righe di A il determinante cambia segno (quindi se A
ha due righe uguali il suo determinante è nullo);
b) se ad una riga (ovvero colonna) sommiamo una combinazione lineare delle altre il
determinante non cambia;
c) se moltiplichiamo una riga (ovvero colonna) per una costante λ , il corrispondente
determinante risulta moltiplicato per λ ;
d) se A ha una riga (ovvero colonna) nulla, allora detA = 0 ;
e) il determinante di una matrice triangolare superiore è uguale al prodotto degli ele-
menti sulla diagonale.

Dimostrazione. Le proprietà (a) e (c) le abbiamo già dimostrate (Lemmi 5.7 e 5.8). La (d)
segue dal fatto che si può calcolare il determinante effettuando lo sviluppo di Laplace rispetto
a una riga (ovvero colonna) qualsiasi, in particolare rispetto a quella nulla. Anche la (e)
segue dalla natura dello sviluppo di Laplace (si scriva lo sviluppo rispetto all’ultima riga).
La (b) segue dai Lemmi 5.7 e 5.8: se si somma ad una riga un multiplo di un’altra (se poi si
vuole sommare una combinazione lineare delle altre righe basta iterare questo passaggio), il
corrispondente determinante viene sommato a un multiplo del determinante di una matrice
che ha due righe uguali e che, per questo motivo, è nullo (qui sotto, chiariamo quello che
abbiamo appena detto con un esempio). 

Esempio.
     
3+9λ 2+4λ 5+8λ 3 2 5 9λ 4λ 8λ
det  1 6 7  = det  1 6 7  + det  1 6 7 
9 4 8 9 4 8 9 4 8
     
3 2 5 9 4 8 3 2 5
= det 1 6 7  + λdet 1 6 7  = det  1 6 7
9 4 8 9 4 8 9 4 8
(la prima matrice si ottiene dall’ultima matrice sommando alla prima riga λ volte la terza
riga. Il conto ci mostra che queste due matrici hanno lo steso determinante).
33

Esempio. Per le proprietà dell’osservazione 5.11 sappiamo che


   
1 2 −1 −3 8 9
det  4 7 −3  = − det  4 7 −3  (abbiamo scambiato prima e terza riga);
−3 8 9 1 2 −1
   
1 2 −1 1 2 −1
det  4 7 −3  = det  4 7 −3  (alla terza riga abbiamo sommato la
−3 8 9 11 33 −2
combinazione lineare di coefficienti 2 e 3 delle prime due righe);
     
1 2 −1 1 2 −1 13 4 −7
5 · det  4 7 −3  = det  20 35 −15  ; det  0 0 0  = 0;
−3 8 9 −3 8 9 −3 11 4
 
3 7 1 8
 0 4 −2 3 
det   = 3 · 4 · (−6) · 2 = −144 .
0 0 −6 5
0 0 0 2

Osservazione. Le operazioni di cui ai punti (5.11.a) e (5.11.b) sono sufficienti per


ridurre in forma triangolare superiore la matrice A , infatti basta eseguire l’algoritmo di
Gauss descritto nella dimostrazione della Proposizione 2.11. D’altro canto, per la (5.11.e),
sappiamo calcolare facilmente il determinante di una matrice triangolare superiore. Quanto
appena osservato permette di calcolare il determinante di una matrice, nell’esempio che
segue vediamo concretamente come.

Esempio. Utilizzando i passi (5.11.a) e (5.11.b) troviamo


   
0 77 33 88 0 7 3 8
 1 2 −1 2   1 2 −1 2 
det   =(1) 11 · det   =(2)
4 1 −4 5 4 1 −4 5
−3 8 15 23 −3 8 15 23
   
1 2 −1 2 1 2 −1 2
 0 7 3 8  0 7 3 8 
−11 · det   =(3) −11 · det   =(4)
4 1 −4 5 0 −7 0 −3
−3 8 15 23 0 14 12 29
   
1 2 −1 2 1 2 −1 2
0 7 3 8  (5) 0 7 3 8
−11 · det   = −11 · det   = −11 · (1 · 7 · 3 · 3) = −693
0 0 3 5 0 0 3 5
0 0 6 13 0 0 0 3
dove: (1) abbiamo diviso la prima riga per 11; (2) abbiamo scambiato le prime due righe;
(3) alla terza riga abbiamo sottratto quattro per la prima riga ed alla quarta riga abbiamo
sommato il triplo della prima; (4) alla terza riga abbiamo sommato la seconda ed alla quarta
abbiamo sottratto il doppio della seconda; (5) alla quarta riga abbiamo sottratto il doppio
della terza.

Per le proprietà a), b) e c) della Proposizione 5.11 che ci dicono cosa accade al determi-
nante di una matrice quando si effettuano i passi dell’E.G., abbiamo quanto segue:
L’annullarsi del determinante è una proprietà invariante rispetto ai passi dell’E.G.
(nel senso che se Ae si ottiene da A tramite l’E.G., l’una ha determinante nullo se e solo
se l’altra ha determinante nullo). Ai fini di quanto affermato ci si ricordi del fatto che
l’E.G. consente di moltiplicare le righe di una matrice solo per costanti non nulle (cfr.
Definizione 2.1).
34

Proposizione 5.12. Sia A una matrice quadrata. Si ha che


detA = 0 se e solo se una riga di A è combinazione lineare delle altre.

Dimostrazione. Come appena osservato, l’annullarsi del determinante è una proprietà inva-
riante rispetto ai passi dell’E.G., anche l’avere una riga che è combinazione lineare delle altre
è una proprietà invariante rispetto ai passi dell’E.G.. D’altro canto, per le matrici a scala,
queste due proprietà sono equivalenti (in quanto entrambe equivalenti all’avere l’ultima riga
nulla). In definitiva, se Ae è una riduzione a scala di A possiamo affermare quanto segue
detA = 0 ⇐⇒
e = 0
detA ⇐⇒ e è c.l. delle altre
una riga di A
⇐⇒ una riga di A è c.l. delle altre
Ciò conclude la dimostrazione. 

Il determinante si comporta molto male rispetto all’operazione di somma di matrici (non


esistono formule per il calcolo del determinante di una somma di matrici). Rispetto al
prodotto, invece, il determinante si comporta nel modo migliore possibile: vale il teorema
che segue.

Teorema 5.14 (Binet). Siano A e B due matrici quadrate. Allora



det A · B = (det A) · (det B) .

Nel paragrafo § 16 dedicato agli approfondimenti vedremo due dimostrazioni del Teorema
di Binet (rimandiamo la dimostrazione non perché sia difficile ma perché a questo punto
della teoria ci interessano soprattutto le conseguenze di questo Teorema). Vedremo anche
che questo Teorema può essere dedotto come conseguenza di una interpretazione geometrica
del determinante della quale daremo qualche cenno nel paragrafo § 16 (cfr. Inciso 16.16) e
sulla quale torneremo anche nel Capitolo II (§§1 e 4).

Nel prossimo paragrafo ci occupiamo del calcolo dell’inversa di una matrice (se questa
è invertibile). Concludiamo osservando che come conseguenza del teorema di Binet, una
matrice il cui determinante è nullo non può essere invertibile. Infatti, se, per assurdo, lo
fosse, allora si avrebbe
  
1 = detIn = det A · A−1 = detA · detA−1 = 0.

In inciso, vedremo che le matrici a determinante nullo sono le uniche matrici non invertibili.

Esercizio 5.15. Calcolare il determinante delle matrici che seguono


     
  3 271 583 2 0 0 0 0 1
7 −3 0 1
; 49  ;  4729 1 0 ; 0 3 237  .
2 8
0 0 2 357 9041 5 2 795 9467

Esercizio 5.16. Calcolare il determinante (in funzione del parametro k) delle matrici
che seguono ed indicare per quali valori di k non sono invertibili.
     
  k 3k −k k −1 5 2−k 3k−7 −k+71
k k+1
;  −1 2 1  ;  3k 2 6 ;  0 k 2 −11 23−k 3  .
2−k 3k−5
5 6 1 −k 1 1 0 0 k−8
35

§6. Matrici invertibili e inversa di una matrice.

Come già osservato alla fine del paragrafo precedente, dal teorema di Binet segue che se
A è una matrice invertibile, allora

det A 6= 0.

Viceversa, se det A 6= 0 , allora A è invertibile ed esiste una formula che ne calcola l’inversa.
Tale formula è contenuta nel teorema che segue:

Teorema 6.1. Consideriamo A ∈ Mn,n (R) . Si ha che A è invertibile se e solo se


det A 6= 0 . In questo caso risulta

 det Cj,i
A−1 i,j
= (−1)i+j · ,
det A

dove come al solito Cj,i è la matrice ottenuta da A sopprimendo la j -esima riga e la i-esima
colonna.

Attenzione! Non ci siamo sbagliati: a sinistra dell’uguaglianza abbiamo scritto “ i, j ”,


a destra abbiamo scritto “ j, i ”.

Osservazione. La formula del Teorema 6.1 ci dice che A−1 è la trasposta della matrice
dei complementi algebrici (cfr. Definizione 5.5) divisi per il determinante di A .

Avendo già provato che se A è invertibile allora det A 6= 0 , per concludere la di-
mostrazione del Teorema è sufficiente calcolare il prodotto di A per la matrice indicata
nel Teorema e verificare che il risultato è la matrice identica. Tale calcolo lo svolgiamo nel
paragrafo §16.
 
−1 12 4
Esempio. Determiniamo l’inversa della matrice A =  3 1 0 .
−4 5 2
Poiché det A = 2 , la matrice A è invertibile. La matrice dei complementi algebrici è la
matrice
       
1 0 3 0 3 1
 det − det det 
 5 2 −4 2 −4 5

   
      
  2 −6 19
 12 4 −1 4 −1 12   −4 14 −43  .
− det det − det  =
 5 2 −4 2 −4 5 
  −4 12 −37
 
       
 12 4 −1 4 −1 12 
det − det det
1 0 3 0 3 1

 
1 −3 19/2
Dividendo per det A si ottiene la matrice  −2 7 −43/2  . Infine, trasponendo
−2 6 −37/2
quest’ultima matrice si ottiene
 
1 −2 −2
A−1 =  −3 7 6  .
19/2 −43/2 −37/2
36

La formula del Teorema 6.1 non è molto pratica, per calcolare l’inversa di una matrice
di ordine tre abbiamo dovuto fare molte operazioni. Tra poco vedremo che utilizzando
l’algoritmo di Gauss è possibile calcolare l’inversa di una matrice abbastanza rapidamente.
     
−1 12 4 1 −2 −2 1 0 0
Esercizio. Verificare che  3 1 0  ·  −3 7 6  = 0 1 0 .
−4 5 2 19/2 −43/2 −37/2 0 0 1
Esercizio 6.2. Calcolare l’inversa delle matrici che seguono utilizzando la formula del
Teorema 6.1.
 
2 7 5        
 −3 1 −8  , 7 2 7 0 0 5 2 5
, , , ,
−3 5 0 5 7 0 3 0
−1 1 −3
       
2 1 3 1
2 0 2 2 2 0 3 −3 3
7 1 8 , 7 8 1 ,  4 −4 5  , 6 2 6 2 
  ,
5 0 −3 −1
4 8 9 1 6 7 3 −2 7
4 3 1 0
Si verifichi inoltre la correttezza dei risultati ottenuti. Ricordiamo che per verificare che due
matrici sono l’una l’inversa dell’altra è sufficiente moltiplicarle tra loro, come risultato si
deve ottenere la matrice identica (Definizione 4.2 e Proposizione 4.3).

Ora vediamo in che modo l’eliminazione


 di Gauss può essere utilizzata per calcolare
l’inversa di una matrice. Sia A = ai,j ∈ Mn,n (R) una matrice invertibile, la ricetta da
seguire per calcolare A−1 consiste dei passi indicati nell’algoritmo seguente.

Algoritmo (di calcolo dell’inversa di una matrice tramite l’E.G.).


i) si scrive la matrice n × 2n costituita da due blocchi n × n:
 a1,1 a1,2 a1,3 a1,4 
1 0 0 0

 
 a2,1 a2,2 a2,3 a2,4 0 1 0 0 
 
 
 a3,1 a3,2 a3,3 a3,4 0 0 1 0 
 

a4,1 a4,2 a4,3 a4,4 0 0 0 1
(qui abbiamo preso n = 4 esclusivamente per non appesantire le notazioni);
ii) con i passi dell’eliminazione di Gauss si trasforma la matrice considerata fino ad
ottenere la matrice identica al posto del primo blocco n × n ;
iii) si ricopia il secondo blocco n × n : tale blocco è l’inversa di A .
 
1 2 5
Esempio 6.3. Calcoliamo l’inversa della matrice  3 7 18 . A tal fine scriviamo
−4 −9 −22
   
1 2 5 1 0 0 1 2 5 1 0 0
 3 7 18 0 1 0  ∼(1)  0 1 3 −3 1 0  ∼(2)
−4 −9 −22 0 0 1 0 −1 −2 4 0 1
   
1 2 5 1 0 0 1 2 5 1 0 0

 0 1 3 −3 1 0  ∼(3)  0 1 0 −6 −2 −3  ∼(4)

0 0 1 1 1 1 0 0 1 1 1 1
 
1 0 0 8 −1 1

 0 1 0 −6 −2 −3  ,

0 0 1 1 1 1
37

dove: 1) alla seconda riga abbiamo sottratto il triplo della prima riga ed alla terza riga
abbiamo sommato il quadruplo della prima riga; 2) alla terza riga abbiamo sommato la
seconda; 3) alla seconda riga abbiamo sottratto il triplo della terza; 4) alla prima riga
abbiamo sottratto il doppio della seconda
 ed il quintuplo della terza. L’inversa della matrice
8 −1 1
data è la matrice  −6 −2 −3  .
1 1 1
Esercizio. Verificare l’uguaglianza
     
1 2 5 8 −1 1 1 0 0
 3 7 18  ·  −6 −2 −3  = 0 1 0 .
−4 −9 −22 1 1 1 0 0 1

Esercizio. Calcolare, utilizzando il metodo descritto, l’inversa delle matrici indicate


nell’esercizio 6.2. ...dovreste ritrovare gli stessi risultati trovati precedentemente!

Inciso 6.4. Il motivo per cui questo metodo funziona è presto detto. Scelto un vettore
numerico ~b , alla matrice a blocchi (A|I ) , dove I denota la matrice identica, associamo
il sistema lineare A · ~x = I · ~b . Ai passi che trasformano la matrice (A|I ) nella matrice
(I |B ) corrisponde il fatto di trasformare il sistema lineare A · ~x = I ·~b nel sistema lineare
I · ~x = B ·~b . Poiché i passi dell’eliminazione di Gauss non cambiano la classe di equivalenza
di un sistema lineare, i due sistemi lineari A · ~x = I · ~b e I · ~x = B · ~b , cioè

A · ~x = ~b e ~x = B · ~b ,

sono equivalenti. Poiché questa equivalenza vale per ogni scelta di ~b , la matrice B deve
necessariamente essere l’inversa di A. Questa affermazione oltre ad essere molto ragionevole
si dimostra come segue: dall’equivalenza dei due sistemi lineari si deduce, sostituendo la
seconda equazione nella prima, A · B · ~b = ~b , sempre per ogni scelta di ~b ; ne segue che
deve essere A · B = In , cioè che B è l’inversa di A. Infatti, quanto appena affermato
segue dal Lemma 6.5.

Lemma 6.5. Sia C una matrice n × n. Allora,


se C · ~b = ~b per ogni ~b , allora C = In (la matrice identica).

Dimostrazione. Indicando con ~ei la i−esima colonna di In , si deve avere C · ~ei = ~ei ,
d’altro canto il prodotto C · ~ei non è altro che la i−esima colonna di C . 

Nel paragrafo § 12 daremo una interessante chiave di lettura di questo Lemma in termini
dell’applicazione lineare associata ad una matrice.
38

§7. Teorema di Cramer.

Torniamo a considerare il sistema lineare

A~x = ~b , A ∈ Mn,n (R) .

Osservazione 7.1 Sia A ∈ Mn,n (R) una matrice quadrata a scala. Per Proposizione 5.11,
proprietà e), il determinante detA è il prodotto degli elementi sulla diagonale. Inoltre, se
ak0 ,k0 = 0 per un qualche indice k0 , si ha anche ak,k = 0 per ogni k > k0 (altrimenti
A non sarebbe a scala). Pertanto le condizioni

i) det A 6= 0 ; ii) an,n 6= 0 ; iii) ak,k 6= 0 , ∀ k ;

sono equivalenti tra loro.

Lemma 7.2. Sia A ∈ Mn,n (R) una matrice quadrata a scala. Il sistema lineare
~
A~x = b ha una unica soluzione se e solo se detA 6= 0 .

Dimostrazione. Poiché A è a scala, abbiamo a che fare con un sistema lineare a scala del
tipo


 a1,1 x1 + ... ... = b1


 a2,2 x2 + ... = b2
.

 ...



an,n xn = bn

Se detA 6= 0 , per l’osservazione 7.1 gli elementi a1,1, ..., an,n sulla diagonale principale sono
non nulli. Ne segue che tale sistema si risolve (partendo dall’ultima equazione e tornando
indietro) senza produrre parametri liberi né incompatibilità.
Viceversa, nel caso risulti det A = 0 , e quindi an,n = 0 (sempre per l’osservazione 7.1),
ci sono due possibilità: il sistema è incompatibile oppure è compatibile. Nell’ipotesi che
si verifichi questo secondo caso, l’ultima equazione deve essere l’equazione 0 = 0 (se fosse
bn 6= 0 il nostro sistema sarebbe incompatibile) ed il sistema in questione è in realtà un
sistema, compatibile per ipotesi, di al più n − 1 equazioni in n incognite; il metodo visto
nel paragrafo § 2 di “soluzione all’indietro” di un tale sistema a scala produce almeno un
parametro libero e quindi infinite soluzioni (in effetti già xn è un parametro libero).
In definitiva, abbiamo provato che nel caso risulti det A = 0 , il sistema è incompatibile
oppure ammette infinite soluzioni. 

Teorema 7.3. Sia A ∈ Mn,n (R) una matrice quadrata (non richiediamo che sia a
scala). Il sistema lineare A~x = ~b ha una unica soluzione se e solo se det A 6= 0 .

In particolare, questo Teorema ci dice che la proprietà di avere una unica soluzione non
dipende da ~b, cioè basta conoscere la matrice incompleta A per poter dire quale delle due
seguenti eventualità si verifica:
i) il sistema ammette una unica soluzione;
ii) il sistema è incompatibile oppure ammette infinite soluzioni.

Dimostrazione. Effettuando la riduzione a scala di un sistema lineare quadrato si ottiene,


in particolare, un sistema la cui matrice incompleta è a scala. Il determinante della matrice
ottenuta è non nullo se e solo se detA 6= 0 , infatti i passi dell’E.G. non inficiano l’annullarsi
o meno del determinante. Per il lemma precedente abbiamo concluso. 
39

Analizziamo le due possibilità da un altro punto di vista. Come prima, consideriamo il


sistema lineare A · ~x = ~b .

Caso 1: det A 6= 0 . L’esistenza e l’unicità della soluzione del sistema lineare A~x = ~b
segue anche3 dal Teorema 6.1: nel paragrafo § 5 abbiamo osservato che l’esistenza dell’inversa
di A garantisce l’esistenza e l’unicità della soluzione del sistema lineare: si ha ~x = A−1~b .

Caso 2: det A = 0 . Per la Proposizione 5.12, l’annullarsi del determinante è equivalente


a che una riga sia combinazione lineare delle altre. Di conseguenza, abbiamo la stessa dico-
tomia incontrata studiando il sistema (1.3): o il termine noto corrispondente a quella riga
di A non è compatibile con la combinazione lineare, cosa che rende il sistema lineare incom-
patibile, oppure tutta l’equazione corrispondente a quella riga è combinazione lineare delle
altre equazioni e questo, di fatto, significa avere meno di n equazioni (il che significa avere
infinite soluzioni oppure, comunque, incompatibilità; di sicuro, dalla stessa E.G. si evince
che un sistema di meno di n equazioni in n incognite non può avere un’unica soluzione).

Si osservi che come conseguenza si ottiene una seconda dimostrazione del fatto che la
matrice incompleta di un sistema quadrato che ammette un’unica soluzione è una matrice
invertibile (cfr. Proposizione 4.8):
∃ ! soluzione di A · ~x = ~b =⇒ det A 6= 0 =⇒ A è invertibile.

Teorema 7.4 (Cramer). Consideriamo il sistema lineare A~x = ~b ed assumiamo


 
x1
 .. 
det A 6= 0 . Sia quindi ~x = . la soluzione (che esiste ed è unica per il Teorema
xn
precedente). Si ha
det A~b/col i
xi = ,
detA
dove A~b/col i è la matrice che si ottiene sostituendo la i-esima colonna di A con il vettore
dei termini noti ~b .

Osservazione 7.5. Nel caso n = 2 , ad esempio nel caso del sistema (1.3)
    
a b x λ
= ,
c d y µ
questo Teorema si riduce alla formula (1.6):
   
λ b a λ
det det
µ d c µ
x =   , y =   .
a b a b
det det
c d c d

Esempio. Risolviamo il sistema lineare



 3x + 3y + 4z
 = 19
5x + 6y − 7z = 13 .


7x + 9y − 17z = −31
Il determinante della matrice incompleta è 3, quindi la soluzione esiste ed è unica. Si ha
     
19 3 4 3 19 4 3 3 19
det  13 6 −7  det  5 13 −7  det  5 6 13 
−31 9 −17 7 −31 −17 7 9 −31
x = , y = , z = .
3 3 3
3 Oltre che dal ragionamento nella dimostrazione del Teorema 7.3.
40

Esercizio. Risolvere il sistema lineare (utilizzando il teorema di Cramer)




 x + 2y − 4z = 19
−3x − 5y + 7z = 13 .


−2x − 3y + 13z = −31

Del teorema di Cramer ne espongo due dimostrazioni (sono entrambe molto brevi, ma,
almeno la seconda, concettualmente delicata).

Dimostrazione #1. Poiché ~x = A−1 · ~b , abbiamo che xi è il prodotto della “i-esima riga
di A−1 ” per ~b :
X X det Cj,i
xi = (A−1 )i,j · bj = (−1)i+j · · bj ,
j j
det A

dove la seconda uguaglianza segue dalla formula del Teorema 6.1 (come al solito, Cj,i è
la matrice ottenuta da A sopprimendo la j -esima riga e la i-esima colonna). L’espressione
trovata è esattamente il quoziente tra lo sviluppo di Laplace del determinante della matrice
A~b/col i rispetto alla i-esima colonna (quella dove appare il vettore dei termini noti ~b) e
det A . 

Dimostrazione #2. Denotiamo con I~x/col i la matrice che si ottiene sostituendo la i-esima
colonna della matrice identica I con il vettore delle incognite ~x . Risulta

(7.6) A · I~x/col i = A~b/col i .

Infatti, svolgendo il prodotto righe per colonne A · I~x/col i , quando la riga α di A si scontra
con la colonna β di I~x/col i , se β 6= i si ottiene aα, β , mentre se la riga α di A si scontra
proprio con la i-esima di I~x/col i (cioè col vettore ~x) si ottiene bα (che è l’elemento di posto
α del vettore ~b). A questo punto possiamo scrivere la seguente catena di uguaglianze:

det A~b/col i = det A · I~x/col i = (det A) · (det I~x/col i ) = (det A) · xi ,
(1) (2) (3)

dove la (1) si ottiene prendendo il determinante dell’equazione (7.6), la (2) segue dal teorema
di Binet, infine la (3) segue dal fatto che det I~x/col i = xi .
Dividendo per det A i termini alle due estremità della nostra catena di uguaglianze si ottiene
l’uguaglianza di Cramer, ciò conclude la dimostrazione. 

Esercizio 7.7. Risolvere il sistema lineare



 x + 3y − z
 = 1
2x + 7y + 2z = 2


x + 4y + 5z = 3

utilizzando
i) il metodo di Gauss;
ii) il calcolo dell’inversa della matrice incompleta A nonché la formula (4.5);
iii) il teorema di Cramer.
Se il risultato che vi viene non è sempre lo stesso ... rifate i conti!!!
41

§8. Spazi Vettoriali.

Accade spesso che “oggetti” molto diversi tra loro hanno una certa “struttura matema-
tica” comune, in questo caso ci si inventa un nome per quella struttura e la si studia. Tra i
vantaggi di questo modo di lavorare: in colpo solo si studiano più oggetti, si impara a capire
cosa dipende da cosa il che consente una visione più profonda.

In questo paragrafo la struttura matematica che studiamo è quella di spazio vettoriale reale
astratto. La definizione la daremo dopo aver illustrato alcuni esempi, comunque vogliamo
anticipare che uno spazio vettoriale reale astratto non è altro che un insieme, i cui elementi
verranno chiamati “vettori”, sul quale è definita una somma tra vettori e sul quale è definito
un prodotto per gli scalari (operazione che ad un numero reale ed a un vettore associa un
altro vettore). Naturalmente, per definizione, queste operazioni dovranno godere di alcune
proprietà (cfr. Definizione 8.8). Vogliamo procedere dal concreto all’astratto, per cui ora
non ci soffermiamo su tali proprietà e passiamo subito agli esempi. Lo diciamo una volta
per tutte: negli esempi che seguono λ denoterà sempre un numero reale.

Esempio 8.1. Spazio Rn delle n-ple di numeri reali. In questo caso i vettori sono
elementi del tipo (x1 , ..., xn ) , la somma è definita ponendo (x1 , ..., xn ) + (y1 , ..., yn ) :=
(x1 + y1 , ..., xn + yn ) , ed il prodotto per gli scalari è definito ponendo λ · (x1 , ..., xn ) :=
(λx1 , ..., λxn ) . Questo esempio è fondamentale perché nello studio degli spazi vettoriali di
dimensione finita ci si riconduce sempre ad esso. Più avanti vedremo come e perché.

Nell’indicare un elemento di Rn abbiamo utilizzato una notazione “per righe” (x1 , ..., xn ).
In realtà la notazione giusta consiste nello scrivere le n-ple di numeri reali come “vettori
colonna”:  
x1
 .. 
è opportuno scrivere . invece di (x1 , ..., xn ) .
xn
Si osservi che questa notazione diventa obbligata se si vuole che il prodotto righe per colonne
A · ~v , dove A ∈ Mm,n (R) e ~v ∈ Rn , abbia senso.

Esempio 8.2. Spazio delle soluzioni di un sistema lineare omogeneo. In questo caso gli
elementi del nostro insieme, cioè i vettori, sono le soluzioni del sistema lineare omogeneo
   
x1 0
~  .
.  ~  .. 
A · ~x = 0 , dove A ∈ Mm,n (R) , ~x = . e dove 0 := . . Per la proprietà
xn 0
distributiva del prodotto tra matrici, se (s1 , ..., sn ) e (t1 , ..., tn ) sono soluzioni del sistema
dato, anche la “somma” (s1 + t1 , ..., sn + tn ) nonché il “prodotto” (λ · s1 , ..., λ · sn ) ne sono
soluzioni. Queste “naturali” operazioni di somma tra vettori e prodotto per uno scalare sono,
per definizione, le operazioni che definiscono la struttura di spazio vettoriale dell’insieme
considerato. Il lettore sagace avrà intuito che questo spazio è un sottospazio di Rn (cfr.
esempio 8.1).

Esempio 8.3. Spazio delle funzioni continue definite su un intervallo I . Nel corso di
analisi avete visto, o state per vedere, che la somma di due funzioni continue è ancora una
funzione continua e che anche il prodotto λ · f (x) ha senso ed è una funzione continua,
dove λ ∈ R ed f (x) è una funzione continua. Di nuovo, queste operazioni definiscono la
struttura di spazio vettoriale dell’insieme considerato.

Esempio 8.4. Spazio delle successioni. Chiaramente, se {an }n∈N e {bn }n∈N sono
successioni, anche {an + bn }n∈N e {λan }n∈N sono successioni... .

Esempio 8.5. Spazio delle successioni convergenti. Di nuovo, la somma di successioni


convergenti è una successione convergente, il prodotto per un numero reale di una successione
42

convergente è una successione convergente. In effetti questo esempio è un “sottospazio


vettoriale” del precedente.

Nell’esempio che segue utilizzo la struttura di spazio vettoriale per risolvere un problema.
È opportuno che lo studente legga ora questo esempio, accettando le considerazioni che
inevitabilmente non hanno ancora una giustificazione formale, e che lo analizzi in maniera
più critica dopo aver studiato gli spazi vettoriali in astratto.

Esempio 8.6. Spazio delle successioni di Fibonacci. Il problema è il seguente: trovare


una formula per i termini della successione
(8.6.1) {1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, ...} ,
dove ogni numero è la somma dei due numeri che lo precedono, e.g. 13 = 5+8, 55 = 21+34,
89 = 34 + 55 eccetera.

Soluzione. Per risolvere questo problema consideriamo lo spazio delle successioni, dette
successioni di Fibonacci, {a0 , a1 , a2 , ... } che soddisfano la legge
(8.6.2) an+2 = an+1 + an , ∀n ≥ 0.
Non è difficile verificare che questo è uno spazio vettoriale, in particolare la somma di
successioni che soddisfano (8.6.2) è ancora una successione che soddisfa (8.6.2) nonché il
prodotto per uno scalare di una tale successione soddisfa anch’esso (8.6.2) . L’insieme,
o meglio lo spazio vettoriale, di tali soluzioni lo chiameremo V . Chiaramente (8.6.1) è
un vettore di V . Premesso ciò, dimentichiamoci di (8.6.1) e concentriamoci sullo spazio
vettoriale, o meglio, sulla legge (8.6.2) che ne definisce gli elementi. Qualche vettore di
V siamo in grado di trovarlo: tentiamo con una successione del tipo {an := xn } , con x
numero reale. La proprietà (8.6.2) si traduce nella richiesta xn+2 = xn+1 + xn , ∀ n ≥ 0 ,
cioè nella richiesta (portiamo al primo membro xn+1 + xn quindi raccogliamo xn a fattore
comune) (x2 − x + 1) · xn = 0 , ∀ n ≥ 0 . A√questo punto, risolvendo l’equazione di secondo
grado x2 − x + 1 = 0 troviamo x = (1 ± 5)/2 e quindi troviamo che le due successioni
  √ n    √ n 
1+ 5 1− 5
i) bn := , ii) cn :=
2 2
sono vettori di V , cioè soddisfano (8.6.2). A questo punto non abbiamo certo risolto il
problema da cui siamo partiti. Lo ripeto, abbiamo semplicemente trovato due vettori di V .
D’altronde sappiamo che questi vettori li possiamo moltiplicare per degli scalari e sommare
tra loro. In termini più espliciti, sappiamo che ogni successione del tipo
λ · {bn } + µ · {cn } = {λ · bn + µ · cn }
  √ n  √ n 
(8.6.3) 1+ 5 1− 5
= λ· + µ· , λ, µ ∈ R
2 2
è un vettore di V . Ora che abbiamo a disposizione molti vettori di V siamo in grado
di risolvere il problema dal quale siamo partiti: la successione (8.6.1) del nostro problema
comincia√con a0 = a1 = 1√ , mentre la successione (8.6.3) comincia con a0 = λ + µ , a1 =
λ · (1 + 5)/2 + µ · (1 − 5)/2 . Imponendo l’uguaglianza,√ovvero risolvendo√il sistema
lineare di due equazioni in due incognite λ + µ = 1 , λ · (1 + 5)/2 + µ · (1 − √ 5)/2 = 1
(sistema che√ lo studente è invitato a risolvere per esercizio), si trova λ = (5 + 5)/10 e
µ = (5 − 5)/10 . Poiché la successione di Fibonacci (8.6.1) è univocamente individuata
dai valori iniziali a0 = a1 = 1 e dalla legge (8.6.2), abbiamo risolto il nostro problema: la
successione (8.6.1) deve necessariamente essere la successione
( √  √ n √  √ n )
5+ 5 1+ 5 5− 5 1− 5
{an } = · + · .
10 2 10 2
43

Lo studente scettico, ma anche quello che non lo è, verifichi ad esempio che per n = 6
questa espressione vale 13 , che è il termine a6 della (8.6.1), e che per n = 8 questa
espressione vale 34 , che è il termine a8 della (8.6.1). ...sono rari i casi in cui calcolare
qualche potenza di un binomio ha fatto male a qualcuno!

L’esempio che abbiamo appena discusso è importante perché l’equazione (8.6.2) è l’analogo
discreto di un tipo di equazioni che descrivono dei fenomeni fisici: le equazioni differenziali
lineari. Naturalmente non abbiamo intenzione di studiare in questa sede tale tipo di equa-
zioni, il che è oggetto di studio di un corso di analisi del secondo anno. Vogliamo comunque
dire due parole a riguardo.

Esempio 8.7. Spazio delle soluzioni di un’equazione differenziale lineare. Consideriamo un


punto che si muove lungo una retta, la sua posizione sarà una funzione del tempo x(t) (dove
t indica il tempo trascorso). Questo punto sarà soggetto a delle forze, ad esempio possiamo
supporre che c’è una molla ideale che lo spinge con una forza pari a −3x newton (dove x
è la coordinata sulla retta, relativa ad un sistema di riferimento la cui origine corrisponde
al punto di equilibrio della molla) e che c’è una resistenza che ne rallenta la velocità pari a
−2v newton , dove v denota la velocità del punto. Assumendo che il nostro punto abbia
massa unitaria troviamo che la legge che ne descrive il moto è data dall’equazione
d2 d
(8.7.1) x(t) = −3 x(t) − 2 x(t) .
d2 t dt
Ricordiamo che la velocità è la derivata della posizione rispetto al tempo e che l’accelerazione
(derivata della velocità) è la derivata seconda della posizione rispetto al tempo ed è pari alla
somma delle forze applicate diviso la massa del corpo considerato. Il bello dell’equazione che
abbiamo trovato è che la somma di due sue soluzioni è ancora una sua soluzione (la derivata
di una somma è la somma delle derivate), nonché il prodotto per una scalare di una sua
soluzione è anch’esso una sua soluzione. In definitiva, l’insieme delle soluzioni dell’equazione
(8.7.1) ha la struttura di spazio vettoriale. Interrompo qui le mie considerazioni perché
andare oltre sarebbe oggetto di un corso di analisi sulle equazioni differenziali.

È arrivato il momento di enunciare la definizione di spazio vettoriale reale4 .

Definizione 8.8. Uno spazio vettoriale reale V è un insieme sul quale è definita una
operazione di somma ed una operazione di moltiplicazione per gli scalari
V × V −→ V R × V −→ V

~ 7→ ~v + w
(~v , w) ~ (λ , ~v ) 7→ λ · ~v
che soddisfano le proprietà che seguono
~u + (~v + w)
~ = (~u + ~v ) + w ~ , ∀ ~u, ~v , w
~ ∈ V (associatività della somma);
~u + ~v = ~v + ~u , ∀ ~u, ~v ∈ V (commutatività della somma);
~
∃ 0 ∈ V ed inoltre ∀~v ∈ V ∃ − ~v ∈ V tali che
~0 + ~v = ~v , ~v + (−~v ) = ~0, 0~v = ~0, 1~v = ~v , (−1)~v = −~v
(in particolare, esistenza dell’elemento neutro e degli opposti);
(λ + µ)~v = λ~v + µ~v , λ(~v + w) ~ = λ~v + λw, ~ ∈ V , λ, µ ∈ R
~ λ(µ~v ) = (λµ)~v , ∀~v , w
(proprietà distributive).
Osserviamo che sono tutte proprietà molto naturali e che nei casi degli esempi discussi
sono tutte praticamente ovvie. Nello scrivere queste proprietà non ci siamo preoccupati di
“evitare le ripetizioni”, ad esempio la proprietà 0~v = ~0 può essere dedotta dalle altre:
(⋆) 0~v = (1 − 1)~v = 1~v + (−1)~v = ~v + (−~v ) = ~0 .
4 In realtà, tutto quello che diciamo in questo capitolo e nei prossimi due capitoli, oltre a valere per spazi
vettoriali reali, vale anche per spazi vettoriali definiti sul campo dei numeri complessi nonché vale per spazi
vettoriali definiti su un campo astratto arbitrario.
44

Esercizio. Indicare, per ognuna delle uguaglianze in (⋆), quale proprietà è stata utilizzata
tra quelle elencate nella Definizione 8.8. Inoltre, provare che i) ~v + ~v = 2~v ; ii) se λ 6= 0,
~v 6= ~0 ⇔ λ~v 6= ~0 ; iii) il vettore nullo è unico; iv) l’opposto di un vettore è unico;

Ora introduciamo la nozione di sottospazio vettoriale. Nella sostanza un sottospazio


vettoriale W di V è uno spazio vettoriale W contenuto in V .

Definizione 8.9. Sia V uno spazio vettoriale e sia W un sottoinsieme non-vuoto di V .


Se risulta
w ~2 ∈ W ,
~1 + w ∀w ~2 ∈ W ;
~ 1, w
(8.9′ )
~ ∈ W ,
λw ~ ∈ W, λ ∈ R .
∀w
allora diciamo che W è un sottospazio vettoriale di V . Notiamo che la (8.9′ ) può essere
scritta nella forma più compatta
(8.9′′ ) λw ~2 ∈ W ,
~1 + µw ∀w ~ 2 ∈ W , λ, µ ∈ R .
~ 1, w

Osservazione 8.10. Si osservi che un tale W ha anch’esso una naturale struttura di spazio
vettoriale: alla luce della (8.9′ ), le due operazioni di somma e moltiplicazione per gli scalari
definite su V inducono altrettante operazioni su W (i vettori di W sono anche vettori di
V ), queste, per definizione, sono le due operazioni su W . Tali operazioni soddisfano tutte
le proprietà richieste dalla Definizione 8.8 perché le soddisfano come operazioni su V (qui
usiamo l’ipotesi che V è uno spazio vettoriale).

Alla luce di quanto abbiamo appena osservato, un modo equivalente di definire la nozione
di sottospazio vettoriale è quello di dire che W è un sottospazio di V se
i) W e V sono entrambi spazi vettoriali;
ii) W ⊆ V (l’inclusione è una proprietà insiemistica);
iii) w1 +W w2 = w1 +V w2 , ∀ w1 , w2 ∈ W
(dove +W e +V denotano rispettivamente la somma su W e la somma su V ).

Lo spazio dell’esempio 8.2, è un sottospazio vettoriale dello spazio dell’esempio 8.1, quelli
degli esempi 8.5 e 8.6 sono sottospazi di quello dell’esempio 8.4, quelli degli esempi 8.3 e
8.7 sono sottospazi dello spazio vettoriale di tutte le funzioni (reali di variabile reale).

Esercizio. Suggerire altri esempi di spazi vettoriali e loro sottospazi.

Per comprendere meglio la proprietà iii) vediamo un esempio dove non è verificata.

Esempio. Sia V = R , questo è l’esempio 8.1 con n = 1 . Sia inoltre W l’insieme


dei numeri reali strettamente maggiori di zero, con le “strane” operazioni indicate sotto,
operazioni che denotiamo con + e strana· :
strana


W = x ∈ R x > 0 , · x = xλ
x + y = x · y , λstrana
strana

(è possibile verificare che l’insieme W con le due operazioni indicate, soddisfa tutte le
proprietà della Definizione 8.8). Nonostante W sia un sottoinsieme di V , non è un suo
sottospazio vettoriale: le operazioni sono cambiate!

Non ci si preoccupi troppo dell’esempio dello spazio W con le due operazioni “strane”,
in un senso piu profondo che ora non voglio spiegare questo esempio non ha nulla di diverso
dagli altri esempi visti! Basti dire che un po’ come in un gioco da settimana enigmistica di
esempi strambi se ne possono costruire molti, è sufficiente prendere un qualsiasi esempio di
spazio vettoriale e cambiare i nomi dei vettori cosı̀ da rendere le operazioni non più naturali.
45

Definizione 8.11. Sia V uno spazio vettoriale e siano ~v1 , ..., ~vk vettori in V . Una
combinazione lineare dei vettori considerati è una espressione del tipo

α1~v1 + ... + αk ~vk , α1 , ..., αk ∈ R .

Definizione 8.12. Sia V uno spazio vettoriale e siano ~v1 , ..., ~vk vettori in V . Diciamo
che i vettori considerati sono linearmente dipendenti se e solo se esistono α1 , ..., αk ∈ R
non tutti nulli tali che

(8.12′ ) α1~v1 + ... + αk ~vk = ~0 .

Altrimenti, diciamo che sono linearmente indipendenti. Gli aggettivi “dipendente” e


“indipendente” possono riferirsi anche all’insieme dei vettori: è corretto dire { ... } è un
insieme dipendente (ovvero indipendente) di vettori.

In inciso, è meglio riferirsi “all’insieme” invece che “ai vettori”, in questo modo si evitano
possibili ambiguità linguistiche. Ad esempio, dire “~u e ~v sono dipendenti” può dar luogo
a errori interpretativi. Infatti, se ~v = ~u 6= ~0, si ha che ~u è indipendente, e anche che ~v è
indipendente, pur non essendo ~u e ~v indipendenti!

Osservazione 8.13. Poiché nella (8.12) possiamo isolare un qualsiasi vettore che vi appare
con coefficiente non nullo, possiamo affermare quanto segue:
Un insieme B di vettori è un insieme indipendente di vettori se e solo se
nessun vettore ~v ∈ B è combinazione lineare degli altri vettori di B .

Vediamo più da vicino i casi dove k = 1 e k = 2 della Definizione 8.12.


Il vettore nullo (ovvero l’insieme costituito solo dal vettore nullo) è dipendente, infatti
1 · ~0 = ~0 . Viceversa, un vettore non nullo è indipendente (infatti, dato λ 6= 0, si ha che
~v 6= ~0 se e solo se λ~v 6= ~0 ). Ricapitolando: un insieme costituito da un solo vettore è
dipendente se e solo se questo vettore è il vettore nullo.
Due vettori sono indipendenti se e solo se non sono proporzionali, intendendo che nessuno
due è un multiplo dell’altro (ciò segue dall’Osservazione 8.13).

Definizione 8.14. Sia V uno spazio vettoriale e sia S un suo sottoinsieme. Si definisce
SpanS l’insieme di tutte le combinazioni lineari di vettori di S :
 
α1 , ..., αk ∈ R
Span S := α1~v1 + ... + αk ~vk
~v , ..., ~v ∈ S
1 k

(da notare che, in particolare, l’insieme SpanS contiene S ).

Proposizione 8.15. Si abbiamo V ed S come sopra. Si ha che SpanS è un sottospazio


vettoriale di V .

Dimostrazione. Si deve verificare che SpanS soddisfa le proprietà della Definizione 8.9. La
somma di combinazioni lineari è una combinazione lineare ed il prodotto di una combinazione
lineare per una costante è una combinazione lineare, infatti

(α1~v1 + ... + αk ~vk ) + (β1~v1 + ... + βk~vk ) = (α1 +β1 )~v1 + ... + (αk +βk )~vk ,

λ · α1~v1 + ... + αk~vk = (λα1 )~v1 + ... + (λαk )~vk .


Ora osserviamo che se W è un sottospazio vettoriale di V ed S è un sottoinsieme di W ,


allora W contiene SpanS (questo perché le c.l. di vettori in S già appartengono a W ). In
46

altri termini, ogni sottospazio vettoriale di V contenente S contiene anche SpanS . Questa
osservazione, insieme alla Proposizione 8.15, ci dice che Span S è il più piccolo sottospazio
vettoriale di V contenente S (cioè SpanS è un sottospazio vettoriale contenente S nonché
contenuto in ogni altro sottospazio vettoriale contenente S ).

Definizione 8.16. Sia V uno spazio vettoriale e sia S un suo sottoinsieme,


i) se SpanS = V diciamo che S genera V ;
ii) se esiste un insieme finito che genera V diciamo che V è finitamente generato.

Studieremo esclusivamente gli spazi vettoriali finitamente generati. D’ora in poi, con la
locuzione “spazio vettoriale” intenderò sempre “spazio vettoriale finitamente generato”.

Definizione 8.17. Sia V uno spazio vettoriale e sia S un suo sottoinsieme. Diciamo che
S è una base di V se è un insieme indipendente che genera V .

Osservazione 8.18. Sia B = {~b1 , ..., ~bn } una base di uno spazio vettoriale V . Poiché
per ipotesi B genera V , per ogni ~v ∈ V esistono dei coefficienti α1 , ..., αn tali che

~v = α1~b1 + ... + αn~bn ;

poiché B è un insieme indipendente, tali coefficienti sono unici: se α1~b1 + ... + αn~bn =
~v = α′1~b1 + ... + α′n~bn , allora (α1 − α′1 )~b1 + ... + (αn − α′n )~bn = ~0 e quindi, essendo B
un insieme indipendente, si deve avere αi = α′i , ∀ i = 1, ..., n .

Definizione 8.19. I coefficienti dell’osservazione precedente α1 , ..., αn si chiamano


coordinate del vettore ~v rispetto alla base B .

Esempio. Una base dello spazio vettoriale R2 è costituita dall’insieme di vettori


    
1 0
~e1 = , ~e2 = .
0 1
 
λ
Infatti, questi sono indipendenti e generano R2 : da un lato, = λ~e1 + µ~e2 (ogni vettore
µ
di R2 è combinazione lineare di ~e1 e ~e2 ), d’altro canto ~e1 e ~e2 non sono proporzionali.

La base B = {~e1 , ~e2 } si chiama


 base canonica dello spazio vettoriale R2 . Si osservi che
λ
le coordinate del vettore rispetto alla base canonica sono proprio i coefficienti λ e µ.
µ
Generalizziamo quanto abbiamo appena visto: consideriamo lo spazio vettoriale Rn .
L’insieme di vettori      
( 1 0 0 )
0 1  ... 
BCan =     
~e1 :=  ..  , ~e2 =  ..  , ... , ~en =   
. . 0
0 0 1
costituisce una base, detta base canonica, di Rn . Anche in questo caso, le coordinate del
 
α1
.
vettore  ..  rispetto alla base canonica sono proprio i coefficienti α1 , ..., αn (lo studente
αn
verifichi quanto abbiamo appena affermato).
     
1 2 9
Esercizio. Sia B = , e sia ~v = . Verificare che B è una base di
3 1 2
2
R , calcolare le coordinate di ~v rispetto alla base B .
47

2
Soluzione.
  I   di B sono indipendenti e generano R . Infatti,
vettori   il sistema lineare
1 2 x x
α1 + α2 = ammette un’unica soluzione per ogni .
3 1 y y
Lecoordinate
 α1 ~v rispetto alla base B si trovano risolvendo il sistema lineare
, α2 di 
1 2 9
α1 + α2 = . Risulta α1 = −1, α2 = 5 .
3 1 2 

Osservazione 8.20. Sia V uno spazio vettoriale. Nel momento in cui fissiamo una base
di V abbiamo a disposizione delle coordinate: associando ad ogni vettore ~v ∈ V la n−pla
delle sue coordinate (α1 , ..., αn ) otteniamo una identificazione di V con Rn . In altri
termini, la funzione
coordinate : V −−−−→ Rn
~v 7→ “ coordinate di ~v ”
è biunivoca (ad ogni vettore di V corrisponde un unico elemento di Rn e viceversa). Torne-
remo su questa funzione nel §12 (vedremo che è una applicazione lineare, cfr. Oss. 12.26).

Lo studio della dipendenza lineare ed il problema della determinazione di una base di uno
spazio vettoriale si basano su un risultato preliminare fondamentale.

Lemma 8.21. Siano S ′ ed S due insiemi di vettori di uno spazio vettoriale V .


i) Se S ′ ⊆ S allora SpanS ′ ⊆ SpanS ;
ii) se S è un insieme indipendente di vettori e w
~ 6∈ Span S , allora l’insieme S ∪ {w}
è anch’esso un insieme indipendente di vettori;
iii) sia w~ ∈ S , se w ~ è combinazione lineare degli altri vettori di S , allora, posto
S ′ := S − {w}~ (l’insieme ottenuto togliendo w~ dall’insieme S ), risulta
Span S ′ = SpanS .

Dimostrazione. La proprietà i) segue dal fatto che le combinazioni lineari di vettori di S ′


sono, a maggior ragione, combinazioni lineari di vettori di S .
Dimostriamo la ii). Ragionando per assurdo, se una combinazione lineare (c.l.) di vettori
di S ∪ {w} dà il vettore nullo, abbiamo la seguente dicotomia: o la c.l. coinvolge w ~, e
~ ∈ Span S , oppure la c.l. non coinvolge w
in questo caso w ~ , e in questo caso S non è un
insieme indipendente di vettori.
Dimostriamo la iii). Stiamo supponendo che esistono ~v1 , ..., ~vk ∈ S e α1 , ..., αk ∈ R tali
che
w~ = α1~v1 + ... + αk ~vk
e vogliamo provare che ogni elemento di SpanS appartiene anche a SpanS ′ (il viceversa
segue dalla i)). Se ~u ∈ SpanS allora è possibile scrivere ~u = λ1 ~u1 + ... + λr ~ur , dove gli
~ui stanno in S . Se tra gli ~ui non c’è w
~ non c’è nulla da dimostrare perché la combinazione
lineare scritta è anche una combinazione lineare di vettori di S ′ . Se tra gli ~ui c’è w
~ , ad
esempio ~u1 = w ~ , abbiamo
~u = λ1 ~u1 + λ2 ~u2 + ... + λr ~ur ,
= λ1 (α1~v1 + ... + αk ~vk ) + λ2 ~u2 + ... + λ~ur .
Quest’ultima espressione scritta è una combinazione lineare di vettori di S ′ . 

Supponiamo di avere un insieme finito di vettori S e di essere interessati esclusivamente


a SpanS . L’affermazione iii) del Lemma 8.21 ci consente di buttare via un vettore ~v ∈ S
48

qualora sia combinazione lineare degli altri vettori di S , quindi ci consente di trovare una
base di SpanS . Vediamo come:

Algoritmo dell’estrazione di una base 8.22. Consideriamo un primo vettore (non


nullo) di S ; scegliamo un secondo vettore, se questo è un multiplo del primo lo scartiamo,
altrimenti lo teniamo; scegliamo un terzo vettore e se questo è combinazione lineare dei
primi due lo scartiamo, altrimenti lo teniamo. Quindi iteriamo il procedimento di scegliere
un nuovo vettore e tenerlo se e solo se non è combinazione lineare di quelli scelti preceden-
temente. N.b.: per il Lemma 8.21, affermazione ii), l’insieme dei vettori che stiamo tenendo
è indipendente.

Terminati i vettori di S , avremo trovato la base cercata. Infatti, come già osservato i
vettori scelti sono indipendenti, d’altro canto generano anch’essi SpanS per Lemma 8.21,
affermazione iii).

In particolare, l’algoritmo dell’estrazione di una base ci assicura la seguente proposizione.

Proposizione 8.23. Sia V uno spazio vettoriale e sia S ⊂ V un sottoinsieme finito che
genera V . Esiste una base B di V contenuta in S , per trovarla è sufficiente applicare
l’algoritmo dell’estrazione di una base.
       
3 5 8 1
 2   4   6   2
Esempio. Consideriamo i vettori ~b1 =   , ~b2 =   , ~b3 =   , ~b4 =   e
2 1 3 3
n 4 o 3 7 4
~ ~ ~ ~
determiniamo una base di V := Span b1 , b2 , b3 , b4 ⊆ R : 4

prendiamo ~b1 , quindi consideriamo ~b2 e lo teniamo perché non è un multiplo di ~b1 ,
consideriamo ~b3 e lo eliminiamo perché è combinazione lineare di ~b1 e ~b2 , consideriamo
~b4 e lo teniamo perché non è combinazione lineare degli altri vettori scelti. In definitiva
abbiamo che l’insieme B ′ := {~b1 , ~b2 , ~b4 } è una base di Span S .

Osservazione 8.24. Ogni spazio vettoriale ammette moltissime basi, può accadere che
abbiamo bisogno di trovare una base contenente certi particolari vettori fissati a priori.
Una base di tale tipo si chiama “completamento ad una base di un insieme indipendente
di vettori”, per trovarla possiamo utilizzare l’algoritmo dell’estrazione di una base 8.22:
dati dei vettori indipendenti ~v1 , ..., ~vk di uno spazio vettoriale V , possiamo considerare
(in questo ordine) i vettori ~v1 , ..., ~vk , w ~ m , dove {w
~ 1 , ..., w ~ m } è un insieme di
~ 1 , ..., w
vettori che genera V (l’esistenza di quest’insieme di vettori è garantita dall’ipotesi che V
è finitamente generato, cfr. Definizione 8.16). Applicando l’algoritmo dell’estrazione di una
base troviamo una base di V contenente i vettori ~v1 , ..., ~vk (questo perché sono i primi che
scegliamo e sono indipendenti). In particolare, il ragionamento esposto dimostra il teorema
del “completamento ad una base di un insieme indipendente di vettori”:

Teorema 8.25 (del completamento). Sia V uno spazio vettoriale finitamente generato
e siano ~v1 , ..., ~vk dei vettori indipendenti di V . Allora esiste una base di V contenente i
vettori dati.
   
1 2
 −1  ~  3 
Esercizio 8.26. Trovare una base di R4 contenente i vettori ~b1 =   e b2 =  .
2 −4
−1 2
Suggerimento: utilizzare i vettori della base canonica per completare l’insieme {b1 , b2 } , ~ ~
cioè si applichi l’algoritmo 8.22 all’insieme dei vettori {~b1 , ~b2 , ~e1 , ~e2 , ~e3 , ~e4 } .
49
 
4
Esercizio. Si determini una base di R3 contenente il vettore ~v =  −3  .
0

Proposizione 8.27. Sia V uno spazio vettoriale finitamente generato e sia B una base
di V . Allora B è costituita da un numero n finito di vettori, il numero n dipende solo
dallo spazio V : se B ′ è un’altra base di V allora anche B ′ ha n elementi. Inoltre, ogni
insieme S di vettori che ha più di n elementi è linearmente dipendente nonché ogni insieme
indipendente costituito da n vettori è una base.

L’idea della dimostrazione consiste nel sostituire uno alla volta i vettori di B con quelli
di B ′ mantenendo la proprietà di avere una base di V .

Dimostrazione. Innanzi tutto verifichiamo che B è necessariamente un insieme finito: per


ipotesi V è finitamente generato, indichiamo con G un insieme di generatori di V , ogni
elemento di G è c.l. di un numero finito di elementi di B ed il il sottoinsieme B0 di B
degli elementi coinvolti in queste c.l. è finito e genera esso stesso V (infatti SpanB0 ⊇ G
=⇒ SpanB0 ⊇ Span G = V ), ne segue l’uguaglianza B0 = B e pertanto la finitezza di
B (risulta B0 = B perché, ragionando per assurdo, un eventuale vettore nella differenza
insiemistica B r B0 sarebbe c.l. dei vettori di B0 e ciò violerebbe l’indipendenza di B ).
Sia B = {~b1 , ..., ~bn } e sia B ′ = {d~1 , ..., d~k } . Come primo passo consideriamo i vettori
{d~1 , ~b1 , ..., ~bn } , quindi applichiamo l’algoritmo dell’estrazione di una base. Iteriamo questo
procedimento: ogni volta aggiungiamo un vettore di B ′ (inserendolo all’inizio) e applichiamo
l’algoritmo. Alla fine arriveremo ad avere solamente i vettori di B ′ . Quando aggiungiamo
un vettore, passiamo da una base a un sistema dipendente di generatori, quindi, quando
applichiamo l’algoritmo togliamo almeno un vettore. Poiché ad ogni passo aggiungiamo un
vettore e ne togliamo almeno uno, i vettori di B ′ sono in numero minore o uguale a quelli
di B , cioè risulta k ≤ n. Scambiando i ruoli tra B e B ′ otteniamo n ≤ k . In definitiva
n = k. 

Definizione 8.28. Sia V uno spazio vettoriale finitamente generato e sia B una base. Si
definisce la dimensione di V ponendo

dim V := n = “numero degli elementi di B ” .

Sottolineiamo che la definizione ha senso (è ben posta) perché, in virtù della Proposizione 8.27,
tale numero non dipende dalla particolare base B che abbiamo a disposizione.

Esercizio 8.29. Siano


       
−1 2 8 9
~b1 =  4  ~b2 =  −8  ~b3 =  1 
 ~b4 =  −3 
 ,  , ,  .
2 −4 3 1
−3 6 7 10

Si determini una base di V := Span ~b1 , ~b2 , ~b3 , ~b4 ⊆ R4 .

Esercizio 8.30. Verificare che gli insiemi


       
 2 −1   4 3 
B =  −1  ,  1  , B′ =  1  ,  7 
5 −3 7 −1

costituiscono due basi dello stesso sottospazio di R3 .


50
   
 2 −1 
Esercizio 8.31. Sia B = ~b1 =  3  , ~b2 =  4  una base di un sottospazio W
5 −1
di R3 . Si determini un’altra base di W .

Esercizio
n 8.32. o Determinate le coordinate del vettore ~v ∈ R3 rispetto alla base
B = ~b1 , ~b2 , ~b3 quando:
       
0 1 −3 −4
a) ~b1 =  −2  , ~b2 =  2  , ~b3 =  −2  , ~v =  −2  ;
1 1 2 7
       
3 3 −3 3
b) ~b1 =  −2  , ~b2 =  5  , ~b3 =  7  , ~v =  −2  ;
1 −1 5 1
       
4 0 0 0
c) ~b1 =  0  , ~b2 =  5  , ~b3 =  7  , ~v =  −1  .
0 −7 −10 1

Esercizio 8.33. Si consideri lo spazio vettoriale V := Span{~b1 , ~b2 , ~b3 } . Estrarre


dall’insieme {b1 , b2 , ~b3 } una base BV di V , verificare che ~v ∈ V e determinare le
~ ~
coordinate di ~v rispetto alla base BV , quando:
       
1 2 1 5
a) ~b1 =  1  , ~b2 =  −1  , ~b3 =  1  , ~v =  2  .
2 3 1 7
       
1 −2 1 3
b) ~b1 =  0  , ~b2 =  −1  , ~b3 =  1  , ~v =  2  .
2 1 −3 −4
       
7 −473 0 −473
~b1 =  0  ~  189  ~ 0  189 
c)   , b2 =   , b3 =   , ~v =  .
−45 32 0 32
38 18 0 18

Esercizio 8.34. Determinare la dimensione di Span ~b1 , ~b2 , ~b3 , ~b4 quando:
       
−1 −2 4 0
a) ~b1 =  −3  , ~b2 =  6  , ~b3 =  5  , ~b4 =  0  ;
2 4 −8 0
       
1 −2 −2 1
~b1 =  −4  ~  4  ~  −3  ~  −1 
b)   , b2 =   , b3 =   , b4 =  .
1 −5 −6 1
2 3 11 −1

Nell’introduzione a questo paragrafo abbiamo accennato a molti esempi di spazi vettoriali


(spazi di funzioni, di successioni eccetera), poi di fatto mentre da un lato discutevamo
concetti e teoremi astratti, come unico esempio trattavamo l’esempio dello spazio Rn . Nella
parte finale di questo paragrafo trattiamo l’esempio dello spazio dei polinomi e l’esempio
dello spazio delle matrici.
51

Esempio 8.35. Lo spazio dei polinomi di grado minore o uguale a d è uno spazio vettoriale
di dimensione d + 1 (quindi finita), l’insieme
BV = {1, x, x2 , ..., xd }
costituisce una base di V .

I polinomi possono essere sommati tra loro e possono essere moltiplicati per una costante,
nonché tutte le proprietà della Definizione 8.8 sono soddisfatte. Questo spazio vettoriale non
è finitamente generato, lo è il sottospazio dei polinomi di grado limitato dall’intero d (che
l’insieme dei polinomi aventi tale limitazione sul grado sia un sottospazio dello spazio di tutti
i polinomi è evidente: la somma di polinomi di grado limitato da d è anch’essa un polinomio
di grado limitato da d, stessa cosa per il prodotto di un tale polinomio per una costante).
In effetti l’insieme BV è una base di V per ragioni banali: i polinomi in V sono espressioni
del tipo p(x) = a0 + a1 x + ... + ad xd , dove a0 , a1 , ..., ad ∈ R, ovvero combinazioni lineari
dei polinomi 1, x, x2 , ..., xd . L’unicità della scrittura garantisce l’indipendenza dell’insieme
BV (in merito alla dimostrazione dell’indipendenza di BV vale la pena essere più precisi
ed osservare che dipende dal modo in cui si introducono i polinomi: se si introducono i
polinomi come espressioni formali non c’è assolutamente nulla da dimostrare, mentre se si
introducono i polinomi come funzioni reali di variabile reale del tipo a0 + a1 x + ... + ad xd
tale indipendenza si riduce al fatto che la funzione p(x) è la funzione nulla se e solo se gli
ai sono tutti nulli).

Esercizio 8.36. Verificare che l’insieme W dei polinomi p(x) di grado minore o uguale
a 3 che si annullano in x = 2 , cioè soddisfacenti la condizione p(2) = 0 , costituisce uno
spazio vettoriale, determinarne la dimensione ed una base.

Soluzione. Dati p, q ∈ W si ha (αp + βq)(2) = αp(2) + βq(2) = 0 , ovvero αp + βq ∈ W .


Questo prova che W è un sottospazio dello spazio dei polinomi di grado minore o uguale a
3 e pertanto è esso stesso uno spazio vettoriale (cfr. Def. 8.9 e Oss. 8.10).
Per trovarne una base possiamo ragionare come segue: i polinomi in W soddisfano la
condizione p(2) = a0 + 2 a1 2 + 4 a2 + 8 a3 = 0 , ovvero a0 = −2 a1 2 − 4 a2 − 8 a3 . Quindi
i polinomi in W sono i polinomi del tipo −2 a1 −4 a2 −8 a3 + a1 x + a2 x2 + a3 x3 essendo
a1 , a2 , a3 liberi di assumere qualsiasi valore. In definitiva

BW := − 2 + x , −4 + x2 , −8 + x3
è una base di W . In alternativa, avremmo potuto dire (evitando qualsiasi calcolo)


BW := x − 2 , (x − 2)2 , (x − 2)3
è una base di W semplicemente perché i vettori indicati appartengono a W , sono indipen-
denti per ragioni di grado, generano W per ragioni di dimensione (se non lo generassero si
avrebbe dimW > 3 il che è impossibile essendo W un sottospazio strettamente contenuto
in uno spazio di dimensione 4).

Osservazione. Se l’esercizio ci avesse chiesto di scrivere una base dello spazio U dei
polinomi p(x) di grado minore o uguale a 6 soddisfacenti le condizioni p(2) = p(5) =
p(11) = 0 , per trovarne una base utilizzando il primo metodo avremmo dovuto risolvere
un complicato sistema di 3 equazioni in 7 incognite (essendo 7 la dimensione dello spazio
di tutti i polinomi di grado minore o uguale a 6), mentre, utilizzando il secondo metodo
avremmo potuto affermare immediatamente che

BU := (x−2)(x−5)(x−11), (x−2)2 (x−5)(x−11), (x−2)3 (x−5)(x−11), (x−2)4 (x−5)(x−11)
è una base di U (senza bisogno di fare calcoli!). Infatti, i polinomi indicati sono indipendenti
per ragioni di grado (come nell’esercizio). D’altro canto ognuna delle tre condizioni p(2) = 0,
p(5) = 0, p(11) = 0 fa scendere almeno di uno la dimensione, quindi si avrà dim U ≤ 4 e
l’insieme indipendente BU genererà U per ragioni di dimensione.
Una precisazione in merito all’affermazione “ognuna delle tre condizioni p(2) = 0, p(5) = 0,
52

p(11) = 0 fa scendere almeno di uno la dimensione”. Il polinomio (x−2)(x−5) si annulla


per x = 2 ed x = 5 ma non per x = 11 (stessa cosa se permutiamo i ruoli dei tre numeri in
questione), questo ci dice che imponendo una alla volta le condizioni in questione ad ogni
passo si trova uno spazio strettamente contenuto nel precedente e pertanto dimostra quanto
affermato.

Esempio 8.37. Fissati due interi m ed n, lo spazio Mm, n (R) delle matrici m × n è uno
spazio vettoriale di dimensione mn (quindi finita), l’insieme B delle matrici ∆i, j nulle
ovunque tranne che nell’elemento di posto i, j dove hanno un 1 costituisce una base di
Mm, n (R). Per intenderci, ad esempio, l’insieme
           
 1 0 0 0 0 0 0 1 0 0 0 0
BM3, 2 (R) =  0 0 ,  1 0 ,  0 0 ,  0 0 ,  0 1 ,  0 0 
0 0 0 0 1 0 0 0 0 0 0 1
costituisce una base di M3, 2 (R) .
Infatti, le matrici in Mm, n (R) (con m ed n interi fissati) possono essere sommate tra loro e
possono essere moltiplicate per una costante, nonché tutte le proprietà della Definizione 8.8
sono soddisfatte. Il fatto che l’insieme B costituisca una base di Mm, n (R) è anch’esso
immediato (ogni matrice 3 × 2 la possiamo scrivere, in modo unico, come c.l. delle sei
matrici indicate ed è evidente che ciò si generalizza al caso m × n con m ed n arbitrari).

Si noti che, nella sostanza, lo spazio vettoriale delle matrici Mm, n (R) non è molto diverso
dallo spazio vettoriale Rn m , i due spazi differisco solo per come sono disposti gli elementi
(sono entrambi tabelle di numeri), ad esempio
 
a
n  o n o
a b 4 b
M2, 2 (R) = a, b, c, d ∈ R , R =   a, b, c, d ∈ R
c d c
d
(ciononostante sono oggetti distinti, non vanno confusi).

Esercizio 8.38.
a) Provare che l’insieme delle matrici simmetriche n × n è un sottospazio di Mn, n (R).
b) Determinare la dimensione ed una base dello spazio delle matrici simmetriche 2 × 2 .

Esercizio 8.39. Stabilire, nei casi che seguono, se W è un sottospazio vettoriali di V e,


in caso di risposta affermativa, determinare la dimensione di W .

i) V = Mn, n (R), W = A ∈ V detA = 0 ;

ii) V = Mn, n (R), W = A ∈ V tracciaA = 0 ;
n   o
2 1
iii) V = M2, 3 (R), W = A ∈ V ·A=0 ;
4 2

iv) V = Mn, m (R), W = A ∈ V X · A = 0
(essendo X ∈ Mk, n (R) una matrice fissata a priori);

v) V = Mn, n (R), W = A ∈ V A · A = 0

vi) V = M2, 2 (R), W = A ∈ V esiste un intero k tale che Ak = 0

vii) V = Mn, n (R), W = A ∈ V esiste un intero k tale che Ak = 0

viii) V = M3, 3 (R), W = A ∈ V A è antisimmetrica, cioè t A = −A

ix) V = Mn, n (R), W = A ∈ V A è antisimmetrica, cioè t A = −A

dove, data una matrice A quadrata, Ak denota il prodotto A · ... · A (k-volte), mentre
traccia A denota la somma degli elementi sulla diagonale.
53

§9. Rango di una matrice.

Sia A ∈ Mm,n (R) una matrice.

Definizione 9.1. Un minore estratto da A è una matrice quadrata ottenuta cancellando


alcune righe ed alcune colonne di A, l’ordine di una matrice quadrata è il numero delle
sue righe. Il rango di A, che indicheremo con rg A , è il massimo degli ordini dei minori
invertibili.
 
−14 -3 4 2  
−3 4
Esempio 9.2. Un minore di A =  5 −1 7 −9  è la matrice B =
−4 11
−9 -4 11 −7
ottenuta cancellando la seconda riga, la prima colonna e la quarta colonna di A . Poiché
det B 6= 0 , il rango di A è maggiore o uguale a 2. A priori, non possiamo dire altro.

Osservazione 9.3. Data una matrice A, se una riga è combinazione lineare di certe altre
righe, a maggior ragione continuerà ad esserlo se in A cancelliamo alcune colonne.

Lemma 9.4. Sia A una matrice. Le righe (ovvero colonne) di A individuate da un


minore invertibile sono indipendenti. In particolare, il rango di A non può superare né il
numero massimo di righe indipendenti né il numero massimo di colonne indipendenti.

Dimostrazione. Per l’osservazione 5.12, le righe di un minore invertibile sono indipendenti.


D’altro canto, per l’osservazione 9.3, le righe di A coinvolte da tale minore sono indipendenti
(se per assurdo fossero dipendenti, sarebbero dipendenti anche le righe del minore). Ciò
prova che il rango di A non può superare il numero massimo di righe indipendenti.
Poiché possiamo scambiare ovunque (anche nell’osservazione 9.3) il termine “riga” col ter-
mine “colonna”, lo stesso risultato vale anche per le colonne. 

Vedremo che valgono dei risultati più forti: se una riga di una matrice è combinazione
lineare delle altre, ai fini del calcolo del rango può essere eliminata; da un insieme di righe
indipendenti è possibile estrarre un minore invertibile; il rango di una matrice è uguale al
numero massimo di righe indipendenti. Cfr. Teorema 9.6 e Corollario 9.8.

Tornando all’esempio 9.2, poiché la terza riga di A è uguale alla somma delle prime due,
non è possibile trovare 3 righe indipendenti e pertanto il rango di A non può essere maggiore
o uguale a 3. D’altro canto, avendo già visto che rg A ≥ 2 , si ha rg A = 2 .

Lemma 9.5. Se S è una matrice a scala, i quattro numeri


p := numero dei pivot (cfr. Def. 2.4),
r := rg (S) , ρr := max righe indip. , ρc := # max col. indip.
sono uguali tra loro.

Dimostrazione. Direi che basta guardare com’è fatta una matrice a scala (si veda l’esempio
sotto)! ...entriamo nel dettaglio.
Di sicuro il rango di S non può superare il numero di righe non nulle (uguale al numero
dei pivot). Quindi r ≤ p (e ρr ≤ p). D’altro canto la matrice che si ottiene cancellando
le righe nulle e le colonne che non corrispondono ad alcun pivot è una matrice quadrata, di
ordine uguale al numero delle righe non nulle di A, triangolare superiore, con gli elementi
sulla diagonale che sono non nulli, e quindi invertibile. Questo dimostra la disuguaglianza
opposta e, visto il Lemma 9.4, che le righe, come pure le colonne, corrispondenti ai pivot
sono indipendenti. Quindi r = p = ρr , p ≤ ρc . Infine, le colonne non corrispondenti ai
pivot possono essere scritte come c.l. di quelle corrispondenti ai pivot e pertanto si ha anche
ρc ≤ p (per esercizio, convincersene). 
54

Esempio. Consideriamo la matrice a scala


0 1 2 3 4 5 6 7 
 
0 0 8 9 10 11 12 13 
 
 
A = 0 −4 
 0 0 0 -1 -2 −3  .
 
 
0 0 0 0 0 -5 −6 −7 
0 0 0 0 0 0 0 0

Le colonne seconda, terza, quinta e sesta sono quelle dei pivot. Cancellando la quinta riga,
la prima, la quarta, la settima e l’ottava colonna si ottiene il minore invertibile di ordine
massimo
 
1 2 4 5
 0 8 10 11 
  .
0 0 −1 −2
0 0 0 −5
Pertanto, si ha rg A = 4 .

Teorema 9.6. Il rango rg A di una matrice A ∈ Mm,n (R) coincide con


i) il numero massimo di righe indipendenti di A;
ii) il numero massimo di colonne indipendenti di A.

Dimostrazione. Abbiamo già visto (Lemma 9.4) che

rg (A) ≤ # max righe indip. , rg (A) ≤ # max col. indip.

D’altro canto, posto k = ρc (A) uguale al numero massimo di colonne indipendenti e indi-
cata con C la matrice ottenuta considerando un insieme massimale di k colonne indipen-
denti di A, dal fatto che il sistema lineare C · ~x = ~0 non ha soluzioni non banali (non
ci stanchiamo di ripetere che il prodotto C · ~x non è altro che la combinazione lineare di
coefficienti x1 , ..., xk delle colonne di C ) e dalla teoria svolta studiando i sistemi lineari,
segue che il sistema ha k equazioni indipendenti, ovvero C ha almeno k righe indipen-
denti, e che il determinante della matrice costituita da tali k righe di C è non nullo. In
particolare, rg (A) ≥ k . Stessa cosa per il numero massimo di righe indipendenti ρr (A):
basta scambiare i ruoli di righe e colonne (ovvero considerare la trasposta di A). 

Osservazione 9.7. I passi dell’E.G. non mutano né il numero massimo di righe indipen-
denti, né il numero massimo di colonne indipendenti, né tantomeno il rango. Infatti, come
già sototlineato più volte, i passi dell’E.G. non mutano le relazioni tra le colonne di una ma-
trice, a maggior ragione non mutano il numero massimo di colonne indipendenti (che certe
colonne siano indipendenti equivale a dire che tra esse non ci sono relazioni non banali).
Pertanto, dal Teorema 9.6 segue che anche il rango di una matrice è invariante rispetto alle
operazioni dell’E.G., come pure il numero massimo di righe indipendenti. Quindi, un modo
per calcolare il rango di una matrice è quello di effettuare la riduzione a scala e poi contare
il numero dei pivot (equivalentemente, delle righe non nulle).

Corollario 9.8. Data una matrice A,


i) da h righe indipendenti è possibile estrarre un minore invertibile di ordine h;
ii) se una riga di A è combinazione lineare delle altre, ai fini del calcolo del rango può
essere eliminata;
Analoghi risultati valgono per le colonne.
55

Dimostrazione. Nella dimostrazione del Teorema 9.6 abbiamo visto che se ci sono k colonne
indipendenti, allora da queste si può estrarre un minore invertibile di ordine k. Da questo
risultato, letto per la trasposta di A, segue la i).
La ii) segue dall’osservazione 9.7 . Infatti, se una riga ρ è combinazione lineare delle altre,
con un passo dell’E.G. può essere sostituita con la riga nulla e pertanto eliminata. 

Riassumendo e andando al cuore di quanto visto per dimostrare il Teorema 9.6 ed il


Corollario 9.8, data una matrice A abbiamo quattro numeri
r := rg (A) , ρr := max righe indip. di A , ρc := # max col. indip. di A
p := p(S) = r(S) = ρr (S) = ρc (S) (cfr. Lemma 9.5),
dove S è una qualsiasi riduzione a scala di A. Si tratta di dimostrare che questi numeri
sono uguali tra loro. Le disuguaglianze r ≤ ρr e r ≤ ρc valgono per ragioni elementari
(Lemma 9.4). D’altro canto p = ρc (S) = ρc (A), questo perché vale il già menzionato
risultato più forte che non mi stanco di ripetere: tra le colonne di A ci sono le stesse
identiche relazioni che ci sono tra le colonne di S. Si noti che essendo p uguale a ρc (A),
un numero che non coinvolge S , si ha che p non dipende dalla particolare matrice a scala
S trovata, cioè non dipende dalla riduzione a scala effettuata. D’altro canto si ha anche
ρr (A) = ρr (S) (questi due numeri sono il numero massimo di equazioni indipendenti di
due sistemi lineari equivalenti). Quindi ρr (A) = ρc (A) (in quanto entrambi uguali a p).
A questo punto la strada è in discesa: abbiamo ρr (X) = ρc (X) per ogni matrice X , in
particolare ciò vale per la matrice A′ costituita da ρr (A) righe indipendenti di A per cui,
da A′ , possiamo estrarre ρr (A) = ρr (A′ ) = ρc (A′ ) colonne indipendenti. Il corrispondente
minore (che è anche un minore di A) sarà una matrice quadrata di ordine ρr (A) avente
colonne indipendenti e, per questa ragione (cfr. proprietà del determinante), invertibile.

Esercizio 9.9. Determinare il rango delle matrici che seguono.

       
1 3
4 3 1 1 2 3 1 1 0 0 4
 1 1 2 , 4 4 5 3 ,  3 0 0 0
2 0 ,  
3 9
−1 3 1 2 0 −1 1 −1 2 0 0
2 6
     
0 2 3 9 −1 3 3 1   2 1
0 0 2 2  3 4 9 4 0 0 0 0
  ,   , , 0
0 0 1 1 1 2 0 4 0 0 0
4 2
0 0 0 0 0 −1 1 7
 
0 7 1 2 4 9
     0 0 1 2 4 9
 
0 0 1 1 3 9 1 −3 4 0 0 0 2 4 9
, ,   .
1 0 1 1 3 9 −2 6 −8 0 0 0 0 4 9
 
0 0 0 0 0 9
0 0 0 0 0 0

Esercizio 9.10. Determinare il rango delle matrici che seguono al variare di k .


       
k 3
0 k 1 k 2 3 k+2 1 0 0 4
 1 1 2 , 4 4 5  0 0
3  , k − 1 0 2 0 ,  ,
3k 9
−1 3 1 2 0 −1 0 3 0 1 0
2k 6
   
0 k−1 3 9 −1 3 3 1  
0 0 2k − 1 3   0 4−k 1 0 0 k 0
  ,   , ,
0 0 k 3k −2 k + 2 5 4 0 3k 0
0 0 0 0 0 4 3 5
56

 
0 k k k k k
    0 0 k k k k
 
0 0 k k−6 3k 2k + 12 k −4 12 0 0 0 k k k
, ,  ,
0 0 −1 k + 4 −3 2k + 8 −9 k −3k 0 0 0 0 k k
 
0 0 0 0 0 k
  0 0 0 0 0 0
  k2 + k    
0 0 0 0
 0  2 1−k k k
0 0 0 1−k   0
  ,  0  , 0  , k k .
0 0 5 0  
0 4 2 k k
0 1−k 0 0 3 2
k +k
Sebbene la riduzione a scala rappresenti il modo più rapido per calcolare il rango di una
matrice è bene conoscere un importante risultato noto come “Teorema degli Orlati”. Per
affermare che il rango di una matrice è maggiore o uguale di un certo intero k è sufficiente
trovare un minore invertibile di ordine k . D’altro canto per limitare dall’alto il rango di una
matrice, ad esempio per provare che questo è minore o uguale di k , dovremmo verificare
che tutti i minori di ordine maggiore o uguale di k+1 non siano invertibili. Il teorema che
segue ci dice, rendendo meno pesante tale verifica, che è sufficiente guardare solo “alcuni”
minori della nostra matrice: quelli ottenuti “orlando” un minore invertibile.

Teorema 9.11 (degli orlati). Sia A ∈ Mm, n (R) una matrice e sia B un minore
invertibile di ordine k . Se i minori di ordine k+1 contenenti B non sono invertibili allora

rg (A) = k

Dimostrazione. È sufficiente provare che se il rango di A è maggiore di k allora esiste un


minore invertibile di ordine k+1 contenente il minore B .
Sia V lo spazio generato dalle colonne di A. Risulta dimV ≥ k+1 . D’altro canto le colonne
individuate da B sono indipendenti e, non potendo generare V , non generano almeno
una delle colonne esterne a B . In questo modo individuiamo k + 1 colonne indipendenti
contenenti le colonne individuate da B . Sia ora A′ la matrice costituita da queste colonne.
Questa ha rango k+1 (Teorema 9.6) e contiene B come suo minore invertibile. Applicando
lo stesso argomento di prima, ma questa volta ragionando per righe, individuiamo k + 1
righe di A′ che sono indipendenti nonché contengono le righe di B .
Le k+1 righe e colonne di A cosı̀ individuate costituiscono un minore come richiesto. 

Si noti che l’argomento esposto non solo dimostra l’esistenza di un minore invertibile di
ordine k+1 contenente B ma esibisce anche un algoritmo per individuarlo.

Come dimostra l’esercizio che segue, punto a), il passaggio “restrizione ad A′ ” è fonda-
mentale.

Esercizio 9.12.
a) Scrivere una matrice A ∈ M3, 3 (R) avente due righe indipendenti, due colonne indipen-
denti, il cui minore M individuato da quelle due righe e colonne non è invertibile.
b) Dimostrare che se A è una matrice soddisfacente le condizioni in a), allora risulta
(necessariamente) rangoA = 3, rangoM = 1 .

Esercizio. Sia A una matrice 7 × 8 e sia B un minore invertibile di ordine 4. Verificare


che ci sono 1380 minori di ordine maggiore o uguale a 5 (1176 di ordine 5, 196 di ordine 6,
8 di ordine 7), dei quali solamente 12 di ordine 5 contenenti B ...un bel risparmio!
57

§10. Sottospazi di uno spazio vettoriale.

Definizione 10.1. Sia V uno spazio vettoriale e siano U e W due suoi sottospazi. Si
definiscono la loro somma e la loro intersezione ponendo

U + W := ~v = ~u + w ~ ~u ∈ U , w
~ ∈ W

U ∩ W := ~v ~v ∈ U , ~v ∈ W

Proposizione 10.2. Gli insiemi U + W e U ∩ W sono entrambi sottospazi vettoriali


di V .

Dimostrazione. Basta verificare che soddisfano la proprietà (8.9′′ ). Siano λ, µ ∈ R .


Dati ~h, ~k ∈ U +W possiamo scrivere ~h = ~u1 + w ~ 1 , ~k = ~u2 + w
~ 2 . Risulta:
~h, ~k ∈ U +W =⇒ λ~h + µ~k = λ(~u1 + w ~ 1 ) + µ(~u2 + w~ 2)
= (λ~u1 +µ~u2 ) + (λw ~ 2 ) ∈ U +W ;
~ 1 +µw
analogamente,
~x, ~y ∈ U ∩ W =⇒ λ~x + µ~y ∈ U, λ~x + µ~y ∈ W =⇒ λ~x + µ~y ∈ U ∩ W . 

Esercizio 10.3. Sia V uno spazio vettoriale e U , W due suoi sottospazi. Provare che
U +W = Span{U ∪W } , dove “∪” denota l’unione di insiemi. Osservare che, in particolare,
da questa proprietà ritroviamo che U + W è un sottospazio vettoriale di V .

Teorema 10.4 (formula di Grassmann). Sia V uno spazio vettoriale e siano U , W


due suoi sottospazi. Le dimensioni di somma e intersezione di U e W sono legate dalla
seguente formula
 
dim U + W = dim U + dim W − dim U ∩ W

Questa formula non va imparata a memoria, è intuitivamente ovvia: la dimensione dello


spazio somma è uguale alla somma delle dimensioni meno un fattore correttivo che in un
certo senso tiene conto delle “ripetizioni”. Lo studente osservi l’analogia con l’ovvia formula
di insiemistica #(A ∪ B) = #A + #B − #(A ∩ B) , dove A e B sono insiemi finiti e
“#” indica il numero degli elementi di un insieme. L’analogia è ancora più evidente alla
luce della seguente dimostrazione delle formula di Grassmann (che invitiamo quindi a non
saltare).

Dimostrazione. Consideriamo una base {~b1 , ..., ~br } di U ∩ W e completiamola ad una base
{~b1 , ..., ~br , ~u1 , ..., ~us } di U nonché ad una base {~b1 , ..., ~br , w ~ t } di W . Il teorema
~ 1 , ..., w
~ ~
segue dal fatto che {b1 , ..., br , ~u1 , ..., ~us , w ~ t } è una base di U + W : è chiaro che
~ 1 , ..., w
questi vettori generano U + W , d’altro canto sono anche indipendenti per l’esercizio che
segue. Pertanto,

dim (U + W ) = r + s + t = (r + s) + (r + t) − r = dim U + dim W − dim U ∩ W .


Esercizio 10.5. Completare la dimostrazione del teorema precedente provando che non
può esistere una relazione di dipendenza lineare
α1~b1 + ... + αr~br + αr+1 ~u1 + ... + αr+s ~us + αr+s+1 w ~ t = ~0 .
~ 1 + ... + αr+s+t w

Esempio. Consideriamo R3 e due piani distinti U e W passanti per l’origine. Si osservi


che la loro intersezione deve essere una retta, quindi ha dimensione 1 , mentre il loro spazio
somma, non potendo essere un piano è necessariamente tutto R3 . Questo è in accordo con
la formula di Grassmann:
 
dim U + dim W − dim U ∩ W = 2 + 2 − 1 = 3 = dim U + W .
58

Osservazione 10.6. Per determinare un insieme di generatori dello spazio somma U + W


è sufficiente considerare l’unione di un insieme di generatori di U ed un insieme di generatori
di W , per determinarne una base è quindi sufficiente applicare l’algoritmo dell’estrazione
di una base 8.22 all’insieme considerato.

Osservazione 10.7. Per determinare l’intersezione U ∩ W bisogna invece risolvere un


sistema di equazioni: se U = Span {~u1 , ..., ~uh } e W = Span {w ~ k } , l’intersezione
~ 1 , ..., w
Ph
U ∩ W è data dalle combinazioni lineari i=1 x i ~
u i ovvero dalle combinazioni lineari
Pk 
~ i , dove x1 , ..., xh , y1 , ..., yk sono le soluzioni del sistema lineare di n = dimV
i=1 yi w
equazioni (una per ogni coordinata) in h + k incognite

h
X k
X
xi ~ui = yi w
~i .
i=1 i=1

       
 3 2   4 1 
Esempio. Siano U = Span  5 ,  1  e W = Span  3 ,  2  due
   
−7 −1 8 1
3
sottospazi di R . Risolvendo il sistema lineare
       
3 2 4 1
(⋆) x1  5  + x2  1  = y1  3  + y2  2  ,
−7 −1 8 1
ovvero 
  x1 = t
3 x1 + 2 x2 = 4 y1 + y2 


 

  x2 = −2t
5 x1 + x2 = 3 y1 + 2 y2 , si trova

 
 y1 = −t
 

−7 x1 − x2 = 8 y1 + y2 

y2 = 3t
(dove t è un parametro libero, vedi paragrafo §3). Ne segue che
       
 3 2   −1 

U ∩W = ~v = t ·  5  − 2 t ·  1  t ∈ R = Span  3  .
   
−7 −1 −5

Si osservi che avremmo potuto anche utilizzare le espressioni a destra dell’uguaglianza (⋆):
       
 4 1   −1 

U ∩W = ~v = −t ·  3  + 3 t ·  2  t ∈ R = Span  3  .
   
8 1 −5

Esercizio 10.8. Sia V = R4 , U = Span {~u1 , ~u2 } , W = Span {w ~ 1, w ~ 3} .


~ 2, w
Determinate una base dello spazio somma U + W ed una base dell’intersezione U ∩ W
quando
         
0 1 −3 1 2
 −2  2  −2  1  −2 
a) ~u1 =   , ~u2 =   , w
~1 =  , w
~2 =   , w ~3 =  ;
1 1 5 2 3
2 2 3 4 2
         
−2 5 −3 1 4
 −2   −2   −2  0  −2 
b) ~u1 =   , ~u2 =  , w~1 =  , w~2 =   , w~3 =  ;
6 0 5 1 −1
5 4 3 2 2
59

         
−5 1 −3 1 −1
 −4  0  −2  0  −2 
c) ~u1 =   , ~u2 =   , w
~1 =  , w
~2 =   , w
~3 =  .
11 0 5 1 7
8 0 3 2 7
Inoltre, verificate che le dimensioni degli spazi trovati soddisfano la formula di Grassmann
(se non la soddisfano c’è un errore in quello che avete fatto).
...attenzione all’esercizio (c)!

Esercizio 10.9. Siano U e W due sottospazi di R19 . Determinate le possibili dimensioni


della loro intersezione sapendo che dim U = 9 , dim W = 14 .

Esercizio 10.10. Siano U e W due sottospazi di R8 . Supponiamo che dim(U ∩W ) = 3


e che dimU = 6 . Provare che 3 ≤ dimW ≤ 5 .

Esercizio 10.11. Si considerino i seguenti sottospazi di R4 .


         
0 0 2 1 1
 k + 1 2
    0  0
  3
Uk = Span{ ,  ,  } , W = Span { ,  } .
1 1 0 0 0
0 0 7−k 1 1
a) Calcolare la dimensione dell’intersezione Uk ∩ W in funzione del parametro k ;
b) scegliere un valore k̃ per il quale Uk̃ ∩ W ha dimensione 1 e scrivere esplicitamente
una base di Uk̃ ∩ W ;
c) completare la base di Uk̃ ∩ W trovata al punto b) a una base di Uk̃ .
Suggerimento: determinare la dimensione dello spazio somma Uk + W , quindi utilizzare la
formula di Grassmann.

Esercizio 10.12. Si considerino i sottospazi U e V di R4 ed il vettore ~vk ∈ R4


(dipendente dal parametro k) definiti come segue:
         
 1 5   3 2  2
3  1  2 6  2t 
U = Span  ,   , V = Span  ,   , ~vt =   .
2 −2 0 4 4
1 4 6 9 3t
a) determinare una base BU ∩V dell’intersezione U ∩ V ;
b) determinare i valori del parametro t per i quali ~vt appartiene allo spazio U nonché i
valori per i quali ~vt appartiene all’intersezione U ∩ V ;
c) completare la base di U ∩ V trovata al punto a) a una base di U + V .

Il prossimo obiettivo è quello di caratterizzare la dimensione di uno spazio vettoriale (Teo-


rema 10.13). Osserviamo che se conosciamo la dimensione di uno spazio vettoriale possiamo
eseguire l’algoritmo dell’estrazione di una base 8.22 in modo più efficace: se sappiamo a
priori che un certo “Span” ha dimensione k , una volta trovati k vettori indipendenti
interromperemo l’esecuzione dell’algoritmo.
n o
Consideriamo W := Span ~b1 , ..., ~bk ⊆ Rn . Possiamo disporre le coordinate dei
vettori ~b1 , ..., ~bk in una matrice: definiamo una matrice in Mn,k ponendo le coordinate del
vettore ~bi nella i−esima colonna. La matrice appena introdotta è qualcosa del tipo
 
| |
 
B :=  ~ ~ 
 b1 ... bk  ,
| |
la chiameremo matrice associata ai vettori ~b1 , ..., ~bk .
60
n o
Teorema 10.13. Consideriamo W = Span ~b1 , ..., ~bk ⊆ Rn e la matrice B
associata ai vettori ~b1 , ..., ~bk . Si ha

dim W = rg B .

Inoltre, se i1 , ..., ir sono le colonne di B individuate


 da un minore invertibile di rango
massimo r (vedi la definizione di rango), l’insieme ~bi1 , ..., ~bir è una base di W .

Dimostrazione.
 La dimensione di W è il numero massimo di vettori indipendenti dell’insieme
~b1 , ..., ~bk . Per il Teorema 9.6 questo numero è uguale al rango r di B . Inoltre, es-
sendo le colonne di posto i1 , ..., ir indipendenti, i corrispondenti vettori devono costituire
una base di W (si veda la parte finale della Proposizione 8.27). 
n o
Esempio. Consideriamo il sottospazio V := Span ~b1 , ~b2 , ~b3 , ~b4 di R3 , dove
       
3 −1 7 2
~b1 =  2 , ~b2 =  −3 , ~b3 =  7 , ~b4 =  −1  . La matrice associata ai vettori
5 3  7 1  
3 −1 7 2 3 −1 2
~b1 , ~b2 , ~b3 , ~b4 è la matrice B =  2 −3 7 −1  . Poiché  2 −3 −1  è un minore
5 3 7 1 5 3 1

invertibile di ordine tre (rg B = 3), l’insieme di vettori ~b1 , ~b2 , ~b4 è una base di V .

Si osservi che lo spazio V di questo esempio è un sottospazio di R3 di dimensione 3,


quindi si ha V = R3 . È un errore non accorgersene! ...ed una base di V tra le tante
possibili è la base canonica di R3 .

Esercizio 10.14. Determinare dimensioni e basi degli spazi vettoriali degli esercizi 8.33 e
8.34 utilizzando il Teorema 10.13.
n o
Consideriamo lo spazio Rn ed un suo sottospazio W = Span ~b1 , ..., ~br . Possiamo
rienunciare la definizione di “Span” dicendo che lo spazio W è l’insieme delle n−ple
(x1 , ..., xn ) che soddisfano le equazioni

 x1
 = b1,1 t1 + ... + b1,r tr
(10.15) ...


xn = bn,1 t1 + ... + bn,r tr

per qualche t1 , ..., tr ∈ R . Qui, come al solito, B = (bi,j ) è la matrice associata ai


vettori ~b1 , ..., ~br : per definizione, bi,j è la i−esima coordinata di ~bj .
n o
Definizione 10.16. Assumiamo che ~b1 , ..., ~br sia una base di W . Le equazioni (10.15)
si chiamano equazioni parametriche dello spazio W e le variabili t1 , ..., tr si chiamano
parametri o coordinate.

Consideriamo lo spazio Rn ed una matrice di coefficienti Λ = λi,j ∈ Ms,n (R) .
Abbiamo visto (esempio 8.2) che l’insieme U delle soluzioni del sistema lineare omogeneo

 λ1,1 x1 + ... + λ1,n xn
 = 0
(10.17) Λ · ~x = ~0 , ovvero ... ,


λs,1 x1 + ... + λs,n xn = 0

è un sottospazio di Rn .
61

Definizione 10.18. Le equazioni del sistema lineare omogeneo (10.17) si chiamano equa-
zioni cartesiane dello spazio U .

Il passaggio da equazioni cartesiane a parametriche di un sottospazio W si effettua sem-


plicemente risolvendo il sistema lineare. È sempre possibile anche effettuare il passaggio
inverso, ovvero quello da equazioni parametriche a cartesiane. Questo significa che ogni sot-
tospazio vettoriale di Rn è rappresentabile in forma cartesiana. Il passaggio da equazioni
parametriche a cartesiane si effettua “eliminando i parametri”. Nei due esempi che seguono
vediamo come si passa da equazioni cartesiane a parametriche e come si effettua il passaggio
inverso.

Esempio. Per determinare delle equazioni parametriche del sottospazio U di R5 definito


dalle equazioni 

 2x1 + x2 − 3x3 + x4 − x5 = 0
6x1 + 3x2 − 6x3 + 2x4 − x5 = 0 ,


2x1 + x2 − 3x3 + 2x4 + 4x5 = 0
si risolve il sistema lineare, quindi si scrivono le soluzioni nella forma (2.13′ ):
 
 x1 = −3 t1 − 3 t2 

 


 x = 6 t1 


 2 


x1 , x2 , x3 , x4 , x5 x3 = −14 t2 .

 


 x4 = −30 t2 


 

 x 
5 = 6 t2

Le equazioni appena trovate sono equazioni parametriche dello spazio U .

Esempio 10.19. Per determinare delle equazioni cartesiane del sottospazio di R4


   
8 3
 6 ~  2 
~ ~
W := Span b1 , b2 , ~
dove b1 :=   , b2 :=   ,
9 11
4 5

dopo aver verificato che {~b1 , ~b2 } è una base di W , si scrive il sistema di equazioni


 x1 = 8 t1 + 3 t2


 x2 = 6 t1 + 2 t2
(⋆) ,

 x3 = 9 t1 + 11 t2



x4 = 4 t1 + 5 t2

quindi dalle ultime due equazioni si determina t1 = 5x3 − 11x4 , t2 = −4x3 + 9x4 .
Sostituendo infine le espressioni trovate nelle prime due equazioni del sistema (⋆), si trovano
le equazioni cartesiane di W :
(
x1 = 8(5x3 − 11x4 ) + 3 (−4x3 + 9x4 )
,
x2 = 6 (5x3 − 11x4 ) + 2 (−4x3 + 9x4 )

ovvero le equazioni (
x1 − 28x3 + 61x4 = 0
.
x2 − 22x3 + 48x4 = 0

La correttezza del procedimento visto si spiega facilmente: lo spazio W è lo spazio di


quei vettori di R4 di coordinate x1 , x2 , x3 , x4 che soddisfano le relazioni (⋆), essendo t1
62

e t2 parametri liberi. Il sistema di equazioni (⋆) è equivalente al sistema costituito dalle 4


equazioni 

 x1 − 28x3 + 61x4 = 0


 x2 − 22x3 + 48x4 = 0
(⋆′ ) .

 5x3 −11x4 = t1



−4x3 +9x4 = t2
Questo significa che W è lo spazio di quei vettori di R4 di coordinate x1 , x2 , x3 , x4 che
soddisfano le equazioni (⋆′ ), essendo t1 e t2 parametri liberi. Ma a questo punto è chiaro
che le equazioni 5x3 − 11x4 = t1 e −4x3 + 9x4 = t2 le possiamo semplicemente
cassare perché non aggiungono nulla: ci stanno dicendo che le espressioni 5x3 − 11x4 e
−4x3 + 9x4 possono assumere qualsiasi valore (chiaramente è fondamentale il fatto che t1
e t2 non compaiano in nessuna altra equazione).

Nell’esempio precedente abbiamo illustrato un procedimento che ci permette di passare


da equazioni parametriche a equazioni cartesiane. A condizione di giustificare il fatto che è
sempre possibile isolare i parametri, il caso generale è assolutamente identico.

Esercizio 10.20. Dimostrare che nel sistema di equazioni (10.15) è sempre possibile
isolare i parametri.

Suggerimento: alla luce della Definizione 10.16, qual è il rango della matrice incompleta
associata al sistema lineare (10.15), inteso come sistema lineare nelle incognite t1 , ..., tr ?
...quindi dedurre che è possibile trovare r equazioni indipendenti. Infine provare che da
queste è sicuramente possibile isolare t1 , ..., tr .

Osservazione. ( Sistemi diversi possono rappresentare


( lo stesso spazio, ad esempio il
2x − 3y = 0 9x − 6y + z = 0
sistema ed il sistema definiscono
5x + z = 0 − x + 9y + z = 0
la stessa retta dello spazio R3 .

Esercizio 10.21. Provare che i due sistemi dell’osservazione precedente sono equivalenti,
quindi dedurre che definiscono la stessa retta. Risolvere i due sistemi, quindi trovare delle
equazioni parametriche della retta che definiscono.

Esercizio 10.22. Determinare equazioni parametriche per i seguenti sottospazi di R3 .


(
x1 − 2x3 = 0 
U = ; V = x1 − 2x3 = 0 ;
x1 + 2x2 + 3x3 = 0
(
 −x1 + x2 + x3 = 0
W = 2x1 + x2 + x3 = 0 ; H = .
2x1 − 2x2 − 2x3 = 0

Esercizio 10.23. Determinare equazioni parametriche per i seguenti sottospazi di R4 .



(
x1 − 2x4 = 0  x1 − x4 =
 0
U = ; V = x1 − x3 = 0 ;
x1 + 2x3 + 3x4 = 0 

( x2 − x3 = 0
−3x1 + 7x2 + x3 = 0 
W = ; H = x1 − 2x3 = 0.
2x1 − x2 − x3 = 0

Esercizio 10.24. Determinare equazioni cartesiane per i seguenti sottospazi di R3 e R4 .


     
 2 4   1 
U = Span  3  ,  2  ; V = Span  5  ;
1 1 1
63


      
 2 4 
2 −3  
2 4
W = Span  3  ,  2  ; H = Span  ,   ;
3 2
−5 1
1 1
     
 2 4 1 
 2   4   4 
K = Span  ,  ,
   .
3 1 1
−7 −9 −6

n o
Abbiamo visto che la dimensione dello spazio W = Span ~b1 , ..., ~br è uguale al rango
della matrice B associata ai vettori ~b1 , ..., ~br (Teorema 10.13). Anche quando uno spazio è
definito da equazioni cartesiane sappiamo calcolarne la dimensione. Se U ⊆ Rn è definito
da s equazioni cartesiane, ci si aspetta che la sua dimensione sia dim U = n − s ; questo
perché ogni equazione “dovrebbe far scendere di uno la sua dimensione”. Poiché potremmo
avere delle equazioni ripetute più volte o che comunque non aggiungono nulla al sistema
perché possono essere dedotte dalle altre, a priori possiamo solamente affermare che risulta
dim U ≥ n − s . Vale il teorema che segue.

Teorema 10.25. Sia U ⊆ Rn lo spazio vettoriale definito dalle equazioni cartesiane



 λ1,1 x1 + ... + λ1,n xn = 0

~
Λ · ~x = 0 , ovvero ...


λs,1 x1 + ... + λs,n xn = 0
Si ha
(10.25′ ) dim U = n − rg Λ ,

dove Λ = λi,j ∈ Ms,n (R) è la matrice associata al sistema di equazioni.

Dimostrazione. Assodato che la dimensione di U è uguale al numero dei parametri liberi che
compaiono in una risoluzione del sistema, il teorema segue da quello che sappiamo sui sistemi
lineari e dal fatto che il rango di Λ è uguale al numero massimo di equazioni indipendenti
(Teorema 9.6). 

Osservazione 10.26. Il prodotto Λ · ~x è la combinazione lineare di coefficienti x1 , ..., xn


delle colonne della matrice Λ . Ne segue che le soluzioni del sistema lineare Λ · ~x = ~0
sono5 esattamente le relazioni tra le colonne di Λ . La (10.25′) ci dice che dati n vettori (le
colonne di una matrice), la dimensione del loro span sommato alla dimensione dello spazio
delle relazioni dà n. Sottolineiamo che poiché la riduzione a scala non muta la classe di
equivalenza di un sistema lineare, le relazioni tra le colonne di una matrice coincidono con
le relazioni tra le colonne di una sua riduzione a scala.

Esercizio. Verificare che le dimensioni degli spazi degli esercizi 10.22, 10.23 e 10.24 sono
quelle previste dal Teorema 10.25.

Esercizio 10.27. Siano U e W due sottospazi di R19 . Supponiamo che U sia definito
da 4 equazioni cartesiane e che dim W = 10 . Provare le disuguaglianze che seguono:

6 ≤ dim (U ∩ W ) ≤ 10 , 15 ≤ dim (U + W ) ≤ 19 .

Esercizio 10.28. Siano U e W due sottospazi di R15 . Supponiamo che U sia definito
da k equazioni cartesiane indipendenti, che dim(U ∩ W ) = 6 e dim (U + W ) = 11 .
Determinare i possibili valori di k e le possibili dimensioni di W in funzione di k .
5 Nel senso che, ad esempio, se 2, 3, 5 è una soluzione del sistema lineare in questione allora il doppia della
prima colonna più tre volte la seconda più cinque volte la terza dà il vettore nullo.
64

§11. Sottospazi Affini di Rn .

Abbiamo visto che i sottospazi vettoriali di Rn sono le soluzioni dei sistemi lineari omo-
genei. Ci domandiamo, cosa accade se consideriamo sistemi lineari non omogenei? Qual è
la “struttura” dell’insieme delle soluzioni di un sistema lineare arbitrario? Una risposta alla
prima domanda l’abbiamo data nel paragrafo § 2 studiando i sistemi lineari: l’insieme delle
soluzioni di un sistema lineare (arbitrario) è un insieme del tipo

(11.1) S = ~x ∈ Rn ~x = t1~v1 + ... + tk ~vk + ~c

dove ~v1 , ..., ~vk , ~c ∈ Rn (si veda l’inciso 2.10).

Definizione 11.2. Un insieme come quello descritto dalla (11.1) si chiama sottospazio
affine di Rn e le equazioni ivi indicate (se i parametri non sono sovrabbondanti, ovvero se
i vettori ~v1 , ..., ~vk sono indipendenti) si chiamano equazioni parametriche.

Come si può intuire dalla terminologia usata esistono degli oggetti matematici che si
chiamano spazi affini, oggetti che volendo mantenere la trattazione a un livello elementare
non tratteremo (non abbiamo una reale necessità di introdurli, li introduciamo solo alla fine
paragrafo §16, approfondimenti, e solo per ragioni di completezza). Naturalmente,
i) i sottospazi affini di Rn appena introdotti risultano essere spazi affini;
ii) ai fini dello studio dei sottospazi affini di Rn è sufficiente conoscere la Definizione 11.2.
Dunque, torniamo a quello che stavamo facendo.

Osservazione 11.3. I sottospazi vettoriali di Rn sono, in particolare, sottospazi affini


di Rn .

Esercizio 11.4. Usando esclusivamente la (11.1), provare che un sottospazio affine di Rn


è un sottospazio vettoriale se e solo se contiene l’origine.

Notazione 11.5. Dati un sottospazio vettoriale V di Rn e un vettore ~c ∈ Rn , poniamo



V + ~c := ~v + ~c ∈ Rn ~v ∈ V

cioè V + ~c è l’insieme di tutti gli elementi in Rn che sono somma di ~c e un vettore in V .

Avvertenza 11.6. L’oggetto V + ~c è un insieme, quel “+” che vi compare non è una
normale somma tra due elementi bensı̀ parte integrante di una notazione:
V + ~c è l’insieme {~v + ~c ∈ Rn | ~v ∈ V } e va trattato esattamente come tale.
Giusto per ribadire il concetto, ad esempio, sarebbe folle scrivere “ V + ~c = V + ~c ′ implica
~c = ~c ′ ” (semplificando V !). Tuttavia, quanto segue ha senso (ed è corretto):

V + ~c = V + ~c ′ ⇐⇒ V = V + ~c ′ − ~c ⇐⇒ ~c ′ − ~c ∈ V

Infatti, applicando la definizione (Notazione 11.4), stiamo dicendo quanto segue


 
~v + ~c ∈ Rn ~v ∈ V = ~v + ~c ′ ∈ Rn ~v ∈ V

⇐⇒ V = ~v + ~c ′ − ~c ∈ Rn ~v ∈ V ⇐⇒ ~c ′ − ~c ∈ V
(♠) (♣)

Analizziamo nel dettaglio (♠) e (♣). Nella prima riga abbiamo due insiemi, agendo su di
essi con la stessa operazione, l’operazione di sommare −~c ad ogni elemento, otteniamo i
due insiemi a sinistra nella seconda riga, grazie all’invertibilità dell’operazione in questione
otteniamo (♠). L’equivalenza (♣) segue dal fatto che V è uno spazio vettoriale, infatti,
se vale l’uguaglianza a sinistra, scrivendo ~v +~c ′ −~c ∈ V per ~v = ~0 si ottiene ~c ′ −~c ∈ V ;
viceversa se ~c ′ − ~c ∈ V l’uguaglianza al centro è immediata).
65

Gli oggetti introdotti con la Notazione 11.5 sono i sottospazi affini di Rn . Infatti, tor-
nando alla (11.1) ed indicando con V l’insieme dei vettori del tipo t1~v1 + ... + tk ~vk (insieme
che è un sottospazio vettoriale di Rn , come sappiamo è lo spazio generato dai vettori
~v1 , ..., ~vk ), la (11.1) può essere riscritta nella forma
(11.7) S = V + ~c
e può essere letta dicendo che S (sottospazio affine), si ottiene traslando V (sottospazio
vettoriale), dove “ traslando” significa proprio “ ad ogni vettore di V sommo ~c ”.

Abbiamo definito i sottospazi affini di Rn come gli insiemi del tipo (11.1). Esattamente
come già visto nel § 10, dato un insieme di tale tipo è possibile eliminare i parametri e scriverlo
come spazio delle soluzioni di un sistema lineare. Questo significa che abbiamo la seguente
caratterizzazione dei sottospazi affini di Rn (ovvero un secondo modo per introdurli):

Caratterizzazione 11.8. Un sottoinsieme S di Rn è un sottospazio affine di Rn se e


solo se è l’insieme delle soluzioni di un sistema lineare.

La (11.7) non è altro che la formula già vista col Teorema di Struttura 3.11. Infatti, dato
S = V + ~c (con V sottospazio vettoriale di Rn ), denotando con
(⋆) A · ~x = ~b
un sistema lineare del quale S ne è l’insieme delle soluzioni, otteniamo che
i) ~c è una soluzione del sistema (⋆);
ii) V è lo spazio delle soluzioni del sistema omogeneo associato al sistema (⋆);
iii) se ~c ′ è un’altra soluzione del sistema (⋆), allora risulta anche S = V + ~c ′ .

Dimostrazione. La i) è una tautologia: dire che ~c soddisfa (⋆) è come dire che ~c ∈ S,
d’altro canto ~c = ~0 + ~c ∈ V + ~c = S . Gli elementi in V si ottengono sottraendo ~c a
quelli di S, pertanto la ii) segue dal fatto che la differenza di due soluzioni del sistema (⋆)
è una soluzione del sistema omogeneo associato (Inciso 3.10). Quanto alla iii) è sufficiente
osservare che risulta S = V + ~c = V + ~c ′ (essendo ~c ′ − ~c ∈ S − ~c = V ). 

In effetti non c’è nulla di veramente nuovo, il risultato enunciato non è altro che una
rivisitazione del Teorema di Struttura 3.11.

Abbiamo visto che un sottospazio affine di Rn è lo spazio delle soluzioni di un sistema


lineare e che lo spazio V introdotto con la (11.7) è il sottospazio (vettoriale) di Rn delle
soluzioni del sistema omogeneo associato. Questo ci dice che V dipende esclusivamente
da S . Naturalmente non era necessario scomodare i sistemi lineari, che V dipendesse
esclusivamente da S lo potevamo dedurre direttamente dall’implicazione che segue:
(11.9) V + ~c = V ′ + ~c ′ =⇒ V = V′
(dove a sinistra dell’uguaglianza abbiamo due scritture di S nella forma (11.7), in particolare
V e V ′ sono due sottospazi vettoriali di Rn ).

Esercizio 11.10. Scrivere una dimostrazione diretta (che eviti i sistemi lineari) della (11.9).

Definizione 11.11. Sia S un sottospazio affine di Rn . Le equazioni di un sistema lineare


di cui S ne è l’insieme delle soluzioni si chiamano equazioni cartesiane di S .

Esercizio 11.12. Scrivere equazioni cartesiane per i sottospazi affini r e π di R3


rispettivamente di equazioni parametriche
             
 x 1 −1  x 5 3 1
r :  y  = t1  2  +  3  , π :  y  = t1  2  + t2  2  +  6  .
 
z −1 2 z 2 1 3
66

Tornando alla (11.9), quanto osservato sopra, e cioè che lo spazio vettoriale V definito
dalla (11.7) sia univocamente individuato da S (e che per questa ragione chiameremo spazio
associato ad S ), suggerisce la definizione che segue:

Definizione 11.13. Sia S un sottospazio affine di Rn . La dimensione di S è la


dimensione dello spazio vettoriale V ad esso associato:
dim S := dim V
(dim S = k = “ numero dei parametri delle sue equazioni parametriche”, cfr. 11.1 e 11.2).

Sia S = V + ~c un sottospazio affine di Rn . Mentre, come già osservato, V è univo-


camente individuato da S , l’elemento ~c non lo è, anzi, può essere sostituito con qualsiasi
elemento in S , in formule:

(11.14) S = V + ~s , ∀s ∈ S .

Infatti, la catena di equivalenze nell’avvertenza 11.6 può essere prolungata come segue:
V + ~c = V + ~s ⇐⇒ ~s − ~c ∈ V ⇐⇒ ~s ∈ V + ~c .

Riepilogando gli ultimi risultati provati sopra, abbiamo la proposizione che segue.

Proposizione 11.15. Sia S = V + ~c un sottospazio affine di Rn . Allora


i) lo spazio vettoriale V è univocamente determinato da S ;

ii) risulta V = ~s − ~s ′ ~s , ~s ′ ∈ S
iii) S = V + ~s , ∀s ∈ S .

Dimostrazione. La i) e la iii) sono la (11.9) e la (11.14) provate sopra. Anche la ii) di


fatto l’abbiamo già provata: per ~s ′ arbitrariamente fissato sappiamo che V = S − ~s ′ . 

Sottolineiamo che la ii) ci dice che gli elementi di V si ottengono come differenze di
elementi di S (questa osservazione è alla base della definizione astratta di spazio affine che
daremo nel paragrafo degli approfondimenti, cfr. Definizione 16.22).

Corollario 11.16. Se due sottospazi affini di Rn hanno la stessa dimensione ed uno dei
due è contenuto nell’altro, allora coincidono. In formule,
S ⊇ S′ , dimS = dim S ′ =⇒ S = S′
(S e S ′ denotano i due sottospazi).

Dimostrazione. Siano S = V + ~c e S ′ = V ′ + ~c ′ . Poiché ~c ′ ∈ S ′ ⊆ S, per la


Proposizione 11.15, proprietà iii), possiamo scrivere S = V + ~c ′ . D’altro canto abbiamo
che V + ~c ′ ⊇ V ′ + ~c ′ =⇒ V ⊇ V ′ . Infine, sappiamo che due spazi vettoriali della stessa
dimensione, uno contenuto nell’altro, devono coincidere. Nel nostro caso ciò ci dice che si
deve avere V = V ′ . In definitiva si ha S = S ′ . 

Definizione 11.17. I sottospazi affini di Rn vengono chiamati:


punti, se hanno dimensione 0 ;
rette, se hanno dimensione 1;
piani, se hanno dimensione 2.

Esempio. Nella terminologia appena introdotta, i sottospazi affini di R3 sono i seguenti:


i) i punti (dimensione 0);
ii) le rette (dimensione 1);
iii) i piani (dimensione 2);
iv) tutto R3 (dimensione 3).
67

Inciso 11.18. Sottolineiamo un piccolo cambiamento di linguaggio: non parliamo più


di vettori, gli elementi di uno spazio affine li chiamiamo punti (sebbene si tratti sempre
di elementi di Rn ). Questo cambio di linguaggio è la conseguenza naturale del vedere
R, R2 e R3 come modelli naturali di retta, piano e spazio “fisico”. Questo punto di vista
lo prenderemo nel capito II, quando, seguendo un approccio molto classico e vicino a quello
adottato nei corsi di fisica, introduciamo gli spazi Euclidei in dimensione minore o uguale a 3,
che sono spazi affini con della struttura in più che consente di misurare angoli e distanze. Lo
stesso oggetto, ad esempio il piano R2 visto come piano affine bidimensionale ed R2 visto
come spazio vettoriale di dimensione 2, assume due significati diversi. L’immagine mentale
più consona a questi due oggetti viene rappresentata nella figura qui sotto.
   
3 3
P = ~v =
1 • 1 1 1

3 3
piano affine piano vettoriale

Genericamente, in un sottospazio affine di Rn la somma di due punti non è definita (nono-


n
stante lo spazio ambiente
2
 10
R sia anche uno spazio vettoriale). A riguardo notiamo che, ad
esempio, i punti 3 e 2 appartengono alla retta (affine) r di equazione x+8y −26 = 0 .

Ma la loro “somma”, le cui coordinate “sarebbero” 125 , non vi appartiene (vedi figura).

(12
5)

(23)
(fig. 11.18 ′ )
retta
(10
2) r

D’altro canto, sappiamo che gli elementi dello spazio vettoriale V si ottengono come dif-
ferenza di elementi di S , cfr. Proposizione 11.15, ii). Questo suggerisce l’idea che la dif-
ferenza di due punti è comunque un vettore. In effetti esiste una costruzione astratta, che
vedremo nel capitolo II, secondo la quale i vettori appaiono come oggetti rappresentati da
segmenti orientati, ovvero “differenze di punti”. Ma a riguardo per ora non diciamo nulla.
Comunque, per quel che riguarda quello che stiamo facendo ora, ricordiamoci che lavoriamo
con Rn , dove somme e differenze hanno sempre senso.

Consideriamo lo spazio affine Rn . Abbiamo quanto segue:


• per due punti distinti passa una (ed una sola) retta;
• per tre punti non allineati passa un unico piano;
• per quattro punti non contenuti in un piano passa un unico spazio affine di
dimensione 3.

Queste “ affermazioni famose”, per quanto intuitivamente ovvie, nel contesto della nos-
tra trattazione6 seguono dalla prossima Proposizione 11.17 e dall’osservazione 11.18 che la
segue. Precisamente, la Proposizione 11.19 ci dà una descrizione della retta per due punti
(caso k = 2), ovvero del piano per tre punti non allineati (caso k = 3) eccetera (in parti-
colare garantendo “ l’esistenza” di questi oggetti), l’osservazione 11.20 ci assicura l’unicità
di questi oggetti.

6 Dove, lo ribadiamo, punti, rette, piani eccetera sono quanto introdotto con le Definizioni 11.2, 11.13 e 11.17.
68

Proposizione 11.19. Siano p0 , ..., pk ∈ Rn dei punti. Lo spazio affine


S = V + p0 , essendo V := Span{~v1 , ..., ~vk } , ~vi := pi − p0 ,
è il più piccolo sottospazio affine di Rn contenente i pi (cioè è contenuto in ogni altro
sottospazio affine contenente tutti i pi ). Risulta
dim S ≤ k
(dim S = k se i punti non sono contenuti in alcun sottospazio affine di dimensione k − 1).

Osservazione 11.20. La minimalità di S asserita nella Proposizione 11.19, cioè il fatto


che S è contenuto in ogni altro sottospazio affine di Rn contenente i nostri punti, alla luce
del Corollario 11.16 ci dice che se S ′ è un altro sottospazio affine di Rn contenente i nostri
punti e dim S ′ = dim S, allora
S′ = S .
Il ragionamento appena fatto lo possiamo sintetizzare come segue:
S ′ ∋ p0 , ..., pk =⇒ S′ ⊇ S =⇒ S′ = S
(minimalità di S) (corollario 11.16 )


(le ipotesi sono che S è un sottospazio affine della stessa dimensione di quella di S ).

Dimostrazione (della Proposizione 11.19). Lo spazio affine V + p~0 contiene p0 e tutti i pi


(si ottengono ri-sommando p0 ai ~vi ). D’altro canto, se uno spazio affine V ′ + ~c contiene
tutti i pi , allora V ′ deve contenere tutti i ~vi e pertanto risulta
V ′ + ~c = V ′ + p0 ⊇ V + p0
dove l’uguaglianza segue dalla (11.14) e l’inclusione segue dal fatto che V ′ contiene dei
generatori di V . Ciò prova la prima parte della proposizione.
Secondo la Definizione 11.13 risulta dim S = dim V . Essendo V generato da k vettori,
si ha dim V ≤ k . Quindi dim S ≤ k . Infine, l’affermazione tra parentesi segue dal fatto
che escludendo per iptesi che i punti non siano contenuti in un sottospazio di dimensione
strettamente minore di k ed essendo S un sottospazio, non si può avere dim S < k . 

Esercizio 11.21. Scrivere equazioni parametriche per i sottospazi affini indicati


   
2 3 1
• r ⊆ R passante per i punti p0 = , p1 =
2 5
     
1 3 3
• π ⊆ R3 passante per i punti p0 =  4  , p1 =  5  , p2 =  2 .
2 1 2

Definizione 11.22. Due sottospazi affini S e T di Rn si dicono paralleli, ed in questo


caso scriviamo S // T , se uno dei due spazi vettoriali associati è contenuto nell’altro:

S // T ⇐⇒ V ⊆ W oppure W ⊆ V ,

dove S = V + ~c e T = W + d~ .

Proposizione 11.23. Siano S e T sottospazi affini di Rn . Se sono paralleli, la loro


intersezione insiemistica è l’insieme vuoto oppure uno dei due è contenuto nell’altro.

Dimostrazione. Se S∩T è l’insieme vuoto non cè nulla da dimostrare. Se S e T contengono


entrambi un elemento ~e , per la (11.14) possiamo scrivere S = V + ~e e T = W + ~e . Ma a
questo punto è evidente che l’inclusione V ⊆ W implica l’inclusione S ⊆ T (lo stesso vale
per l’inclusione opposta). 
69

Attenzione! La nozione introdotta consente di parlare di parallelismo anche tra spazi


affini di dimensione diversa (naturalmente, contenuti nello stesso ambiente Rn ): ha senso
domandarsi se una retta e un piano sono paralleli. Tuttavia, la nozione di parallelismo è
transitiva solo a condizione di restringersi al caso di spazi affini della stessa dimensione. A
riguardo, i due esempi che seguono dimostrano la non transitività (il secondo non coinvolge
spazi di dimensione zero, cioè punti):
i) due spazi affini (anche) non paralleli, sono entrambi paralleli a ogni punto!
ii) in R3 , il piano di equazione cartesiana x = 0 non è parallelo al piano di equazione
cartesiana y = 0 , eppure sono entrambi paralleli all’asse z (:= retta di equazioni
parametriche x = 0, y = 0, z = t).

Esercizio 11.24. Siano S = V + ~c e T = W + d~ due spazi affini. Provare che sono


entrambi paralleli allo spazio affine V ∩W (sottolineiamo che V ∩W , come ogni sottospazio
vettoriale di Rn , è anche uno spazio affine, ed è non vuoto).

Esercizio 11.25. Provare che se ci si restringe a spazi della stessa dimensione, la nozione
di parallelismo è transitiva. Cioè che se S, S ′ , S ′′ sono spazi affini della stessa dimensione
e se S//S ′ nonché S ′ //S ′′ , allora S//S ′′ .

Esercizio 11.26. Si considerino lo spazio affine R3 , la retta r dell’esercizio (11.12) ed il


piano τ , dipendente dal parametro k , di equazione cartesiana x + y + kz = 1 . Determinare
i valori del parametro k per i quali risulta r//τ .

Esercizio 11.27. Scrivere l’equazione del piano affine in R3 passante per il punto di
coordinate 2, −1, 5 e parallelo al piano di equazione x + y + z = 1 .

Lo studio dell’algebra lineare, l’approccio algebrico alla geometria, l’approccio centrato


su Rn , ovvero sulle coordinate, la volontà di mantenere basso il livello di astrazione, ha
il vantaggio, come dire, della concretezza (sicuramente utile in un corso di geometria ele-
mentare). D’altro canto tutto questo ci ha portato a introdurre solo una classe di esempi
di spazi affini (i sottospazi di Rn appunto) e a non dare una definizione astratta di spazio
affine, con tutte le limitazioni che ciò comporta. Cerchiamo di rimediare un po’ a questa
carenza negli approfondimenti (cfr. §16, sezione “spazi affini”). Per il momento ci limitiamo
a dire che un piano affine7 si identifica con R2 mediante la scelta di un sistema di riferi-
mento, in questo senso la geometria del piano affine è lo studio di quelle proprietà di R2
che sono invarianti per i cosiddetti cambiamenti di riferimento affine, cioè le funzioni
      
x  a b x λ
F : R2 −→ R2 , F = +
y c d y µ
     
a b 0 λ
con matrice invertibile. Poiché F = , cioè F non conserva le coordinate
c d 0 µ
dell’origine, il piano affine di fatto non ha un’origine, cosı̀ come non ce l’ha la retta r della
figura (11.18′ ) o, ad esempio, non ce l’ha il piano in R3 di equazione 3x + y − 2z + 7 = 0.
Non avere un’origine di fatto è la ragione per la quale non possiamo sommare i punti e,
sostanzialmente, ciò che rende gli spazi affini differenti dagli spazi vettoriali.

7 Ci concentriamo sul piano solo per fissare le idee, in realtà quello che stiamo dicendo vale in dimensione
arbitraria.
70

§12. Applicazioni lineari.

Una funzione definita su un insieme A, che assume valori in un insieme B , è una legge
f che ad ogni elemento di A associa un elemento di B (nel cap. 0, §2 vengono richiamati
i concetti di dominio, codominio, grafico, fibra, funzione iniettiva, suriettiva, biunivoca).
Le applicazioni lineari sono funzioni dove dominio e codominio sono spazi vettoriali, che
soddisfano la proprietà di essere lineari:

Definizione 12.1. Siano V e W due spazi vettoriali. Una applicazione lineare


L : V −→ W
~v 7−→ w~
è una funzione, che soddisfa le due proprietà:
L(~v + ~u) = L(~v ) + L(~u) , ∀ ~v , ~u ∈ V ;
(12.1′ )
L(λ · ~v ) = λ · L(~v ) , ∀ ~v ∈ V , λ ∈ R .

Vedremo che le funzioni che soddisfano la (12.1′ ), in termini di sistemi di coordinate su


V e W , sono descritte da polinomi omogenei di primo grado. In termini geometrici, il loro
grafico è una retta se V ha dimensione 1, un piano se V ha dimensione 2, eccetera (riguardo
questo punto mi limiterò a dire qualcosa negli approfondimenti, § 16). Questo è il motivo
per il quale le funzioni che soddisfano la (12.1′ ) si chiamano “lineari”. Osserviamo che la
(12.1′ ) può essere scritta in un’unica relazione:
(12.2) L(α~v + β ~u ) = α L(~v ) + β L(~u) , ∀ ~v , ~u ∈ V , α, β ∈ R .

Esercizio 12.3. Dimostrare che la (12.1′ ) e la (12.2) sono equivalenti.

Torniamo alla definizione. Questa ci dice che una applicazione lineare è una funzione che
“rispetta” le operazioni su V e W : dati due vettori in V , l’immagine della loro somma
(operazione in V ) è uguale alla somma (operazione in W ) delle loro immagini, l’immagine
di un multiplo di un vettore è quel multiplo dell’immagine del vettore.
Ora, diamo brutalmente un’altra definizione generale, subito dopo studiamo l’esempio
delle applicazioni lineari da Rn a Rm .

Definizione 12.4. Sia L : V → W una applicazione lineare. Si definiscono nucleo


e immagine di L , che si indicano rispettivamente scrivendo kerL (dall’inglese “kernel” =
“nucleo”) ed ImL (dall’inglese “image” = “immagine”), ponendo

ker L := ~v ∈ V L(~v ) = ~0 ;

Im L := w~ ∈ W w ~ = L(~v ) per qualche ~v ∈ V .

Sottolineiamo che i vettori del nucleo di L sono quei vettori in V che vengono mandati
nel vettore nullo, quindi ker L = L−1 ~0 è la fibra del vettore nullo di W . I vettori
nell’immagine di L , come la parola stessa suggerisce (e coerentemente con la definizione
~ ∈ W che soddisfano la condizione che
data nei richiami, cfr. cap. 0), sono quei vettori w
segue: esiste almeno un vettore ~v ∈ V al quale L associa w ~.
n m
 vettoriali R ed R . Si definisce l’applicazione
Definizione 12.5. Consideriamo gli spazi
LA associata ad una matrice A = ai,j ∈ Mm,n (R) ponendo
LA : Rn −→ Rm
     
λ1 a1,1 ... a1,n λ1
 ...  7−→   .
.. .. ..  ·  .. 
. .  .
λn am,1 ... am,n λn
dove, come sempre, “·” denota il prodotto righe per colonne tra matrici.
71

Proposizione 12.6. La funzione LA appena introdotta è lineare.

Dimostrazione. Infatti, per la proprietà distributiva del prodotto righe per colonne,

LA (~v + w)
~ = A · (~v + w)
~ = A · ~v + A · w
~ = LA (~v ) + LA (w)
~ ,

LA (λ~v ) = A · (λ~v ) = λ A · ~v = λLA (~v ) .

~ ∈ Rn e λ ∈ R .
per ogni ~v , w 

Esempio. Consideriamo l’applicazione lineare

LA : R2 −→ R3
   
  3 7   3α + 7β
α α
7−→  2 4 · =  2α + 4β 
β β
5 1 5α + β

Osserviamo che svolgendo il prodotto righe per colonne si ottiene


       
  3 7   3   3 7   7
1 1 0 0
LA = 2 4· =  2  nonché LA = 2 4· = 4 ,
0 0 1 1
5 1 5 5 1 1
ovvero nelle colonne della matrice A ci sono scritte le coordinate delle immagini dei vettori
della base canonica di R2 .
 
2
Esercizio. Sia LA l’applicazione lineare dell’esempio. Calcolare LA .
−3
Esempio. Determiniamo ora nucleo e immagine dell’applicazione lineare LA dell’esempio
precedente. Per definizione,
    
    3α + 7β 0 
α α
kerLA = ∈ R2 L A ( ) =  2α + 4β  =  0  .
 β β 
5α + β 0

 3α + 7β 0=
Risolvendo il sistema lineare 2α + 4β =
0 , troviamo α = β = 0 , quindi il

5α + β 0 =  
0
nucleo di LA è costituito esclusivamente dal vettore nullo: ker LA = .
0
 
3α + 7β
I vettori dell’immagine di LA sono tutti i vettori in R3 del tipo  2α + 4β  , dove α
5α + β
e β sono “parametri liberi”; pertanto, ricordando la definizione di “Span”, si ha
  
 3α + 7β 
ImLA =  2α + 4β  α, β ∈ R
 
5α + β
         
 3 7   3 7 

= α  2  + β  4  α, β ∈ R = Span  2  ,  4  .
   
5 1 5 1

I risultati trovati nell’esempio si generalizzano. Innanzi tutto, vista la Definizione 12.5 è


del tutto evidente che vale l’osservazione che segue.
72

Osservazione 12.7. Si consideri LA : Rn → Rm , A ∈ Mm,n (R) . Le coordinate


-esimo
dell’immagine dello i vettore ~ei della base canonica di Rn sono scritte nella i-esima
colonna di A .

Osservazione 12.8. Anche i conti visti nell’esempio precedente si generalizzano: data


LA : Rn → Rm , A ∈ Mm,n (R) , si ha
 Pn  

 j=1 λj a1,j 


  

 .. 
ImLA =  .  λ
1 , ..., λn ∈ R

  

 Pn
 

j=1 λj am,j

     
 a1,1 a1,n 
 
 ..  + ... + λ  .. 
= λ1  .  n .  λ1 , ..., λn ∈ R

 

am,1 am,n

    

 a1,1 a1,n 

 ..  , ...,  .. 
= Span  .   .  .

 

am,1 am,n

Questo prova che l’immagine di LA è lo “Span delle colonne della matrice A”. In particolare,
per il Teorema 10.13 si ha
(12.9) dim ImLA = rg A
Per quel che riguarda l’iniettività e la suriettività di LA vale la proposizione che segue.

Proposizione 12.10. Si consideri LA : Rn → Rm , A ∈ Mm,n (R) . Si ha che


i) LA è iniettiva se e solo se ker LA = {~0} ;
ii) LA è suriettiva se e solo se rg A = m (che è la massima possibile).

Dimostrazione. Poiché LA (~0) = ~0 , l’iniettività di LA implica kerLA = {~0} .


Viceversa, se ci sono due vettori distinti ~v1 e ~v2 che hanno la stessa immagine w~ , si
ha LA (~v1 − ~v2 ) = LA (~v1 ) − LA (~v2 ) = w ~ = ~0 , ovvero kerLA 6= {~0} .
~ −w
Ora proviamo l’affermazione ii) . Per l’osservazione precedente, l’immagine di LA è lo
“Span” dei vettori costituiti dalle colonne di A e la dimensione di tale “Span” uguaglia il
rango di A per la formula (12.9). Infine, ImLA = Rm se e solo se dimIm LA = m . 

Abbiamo visto che ImLA è uno “Span”, in particolare è un sottospazio di Rm . Questo


risultato si generalizza all’affermazione che l’immagine di una applicazione lineare tra spazi
vettoriali (qualsiasi) è un sottospazio vettoriale del codominio. L’affermazione analoga vale
anche per il nucleo di una applicazione lineare. In definitiva, vale la proposizione che segue.

Proposizione 12.11. Sia L : V −→ W una applicazione lineare. Si ha che


i) kerL è un sottospazio di V ;
ii) ImL è un sottospazio di W .

Dimostrazione. È sufficiente verificare che sussiste la condizione (8.9′′ ): le c.l. di vettori nel
nucleo hanno anch’esse immagine nulla, quindi appartengono al nucleo; analogamente, le c.l.
di vettori nell’immagine, in quanto immagini di c.l. di vettori nel dominio, appartengono
anch’esse all’immagine. 
73

Definizione 12.12. Il rango di un’applicazione lineare L : V −→ W è la dimensione


della sua immagine:
rangoL = dimIm L

Osserviamo che questa definizione è coerente con la formula (12.9): il rango dell’applicazione
LA (def. 12.12) coincide col rango della matrice A (def. 9.1).

Proposizione 12.13. Sia L : V −→ W una applicazione lineare. Si ha che



(12.13 ) dimV = dimIm L + dim kerL

Questa Proposizione segue dalla Proposizione 12.14 enunciata più avanti.

Osservazione. Nel caso di una applicazione lineare LA : Rn −→ Rm questa identità è


una rilettura dell’identità del Teorema 10.25. Infatti, in questo caso risulta dim V = n ,
ImL = “Span colonne di A”, kerL = “Spazio delle soluzioni del sistema lineare A~x = ~0 ”.

Proposizione 12.14. Sia L : V −→ W una applicazione lineare. Se completiamo una


base {~b1 , ..., ~bs } di kerL ad una base {~b1 , ..., ~bs , ~c1 , ..., ~cr } di V , l’insieme di vettori
{L(~c1 ), ..., L(~cr )} è una base di Im L .

Dimostrazione. Chiaramente, Span{L(~c1 ), ..., L(~cr )} = Span{~0, ..., ~0, L(~c1 ), ..., L(~cr )}
= Span {L(~b1 ), ..., L(~bs ), L(~c1 ), ..., L(~cr )} = Im V , questo perché {~b1 , ..., ~bs , ~c1 , ..., ~cr }
è una base di V . D’altro canto, se i vettori L(~c1 ), ..., L(~cr ) fossero linearmente dipendenti,
P
ovvero se esistessero dei coefficienti (non tutti nulli) λ1 , ..., λr tali che λ L(~c1 ) = ~0 , per
P Pi
la linearità di L si avrebbe anche L λi~c1 = ~0 , quindi si avrebbe λi~c1 ∈ kerL =
Span{b1 , ..., bs } . Questo non è possibile perché, per ipotesi, i vettori b1 , ..., ~bs , ~c1 , ..., ~cr
~ ~ ~
sono indipendenti. 

Esercizio. Si consideri l’applicazione lineare


L : R4 −→ R3
     z1 
z1
1 −2 −1 3
 z2  z 
  7−→  −1 1 2 −1  ·  2 
z3 z3
−1 −1 4 3
z4 z4
Si determini una base di kerL , si completi la base trovata ad una base di R4 , si veri-
fichi che le immagini dei vettori che sono stati aggiunti per effettuare tale completamento
costituiscono una base dell’immagine di L .

Esercizio. Per ognuna delle matrici che seguono, si consideri l’applicazione lineare asso-
ciata e se ne determini una base del nucleo ed una base dell’immagine.
       
1 3
4 3 1 1 2 3 1 1 0 0 4
1 1 0 0
2 ,  4 8 12 4  ,  3 0 1 0 ,  
3 9
5 4 3 −2 −4 −6 −2 −1 2 0 0
2 6
     
0 2 3 −1 −1 3 3 1   2 1
0 0 0 2   3 4 9 4 0 0 0 0 0
  ,   , ,
0 0 0 1 1 2 0 4 0 0 0
4 2
1 0 0 0 0 −1 1 7
 
0 1 1 1 1 1
    0 0 1 1 1 1
 
0 0 1 1 3 9 1 −3 4 0 0 0 1 1 1
, ,   .
1 0 1 1 3 9 −2 6 −8 0 0 0 0 1 1
 
0 0 0 0 0 1
0 0 0 0 0 0
74

Osservazione. Dall’uguaglianza (12.13′ ) segue che dim ImL = dim V se e solo


se dim kerL = 0 (ovvero se e solo se L è iniettiva). Quindi, nell’ipotesi che si abbia
dim V = dim W , l’applicazione lineare L : V → W è suriettiva se e solo se è iniettiva.

Proposizione 12.15. Consideriamo l’applicazione lineare di Rn in se stesso associata


alla matrice A, LA : R → Rn . Le affermazioni che seguono sono equivalenti tra loro:
n

i) LA è suriettiva;
ii) LA è iniettiva;
iii) rg A = n .

Ad una matrice A ∈ Mm,n abbiamo associato una applicazione lineare LA : Rn → Rm .


Viceversa, data una applicazione lineare L : Rn → Rm è possibile trovare una matrice che
la rappresenta (detta matrice associata ad L):

Proposizione 12.16. Sia L : Rn → Rm una applicazione lineare. Denotando con A


la matrice le cui colonne sono le immagini dei vettori della base canonica di Rn risulta
(12.16′ ) L = LA .
In definitiva c’è una corrispondenza biunivoca
   
matrici in Mm,n (R) ←−−−−−→ applicazioni lineari L : Rn → Rm .

P P
Dimostrazione.PDato ~v ∈ Rn scriviamo
P P ~v = αi~ei . Si ha L(~v ) = L( αi~ei ) =
αi L(~ei ) = αi LA (~ei ) = LA ( αi~ei ) = LA (~v ) (si osservi che le tre uguagliane al
centro seguono dalla linearità di L, dalla definizione di A e dalla linearità di LA ). Quanto
appena provato, cioè che risulta L(~v ) = LA (~v ) per ogni ~v ∈ Rn dimostra la (12.16′).
La seconda parte della proposizione segue dalla prima: per l’osservazione 12.7, a matrici
distinte associamo applicazioni lineari distinte, ovvero la legge che alla matrice A associa
la trasformazione LA (Def. 12.5) è iniettiva, l’uguaglianza L = LA ci dice che la legge
che ad L associa la matrice A costruita come nell’enunciato della proposizione inverte tale
legge. 
3
Esempio 12.17.  Lamatrice  associata all’applicazione
 lineare
 L : R −→ R3 definita
x x − y + 7z 1 −1 7
dalla relazione L( y ) =  2x + y + z  è la matrice  2 1 1  . Per scriverla è
z 3x − 4y + 5z 3 4 5
stato sufficiente considerare le immagini dei vettori della base canonica (cfr. Proposizione 16),
ovvero prendere i coefficienti di x, y, z nella descrizione di L.

Già osservammo (osservazione 3.4) che il prodotto righe per colonne tra matrici “codifica
l’operazione di sostituzione”, pertanto, modulo l’identificazione qui sopra, il prodotto righe
per colonne tra matrici corrisponde alla composizione8 di applicazioni lineari. Lo ripetiamo:

Proposizione. Siano LA : Rn → Rm ed LB : Rm → Rk due applicazioni lineari.


Ha senso considerare la composizione

L B ◦ L A : Rn → Rm → Rk .
Si ha

(12.18) LB ◦ LA = LB·A .
8 La composizione di funzione si effettua sostituendo: siano A, B e C tre insiemi, f : A → B e g : B → C
due funzioni, sia quindi b = f (a) e c = g(b) , la composizione g ◦ f : A → C viene definita ponendo
g ◦ f (a) = g(f (a)) = g(b) , cioè sostituendo!
75

Da notare che, in particolare, la (12.18) dimostra che la composizione LB ◦LA è anch’essa


un’applicazione lineare. Questo risultato si generalizza:

Proposizione. Siano L : V → W ed M : W → U due applicazioni lineari. La


composizione
M ◦L : V −−−−→ U

~v 7→ M L(~v )
è lineare.

Dimostrazione. Si deve verificare che M ◦ L soddisfa


 la (12.2). Essendo L ed M lineari si
ha M L(λ1~v1 + λ2~v2 ) = M λ1 L(~v1 ) + λ2 L(~v2 ) = λ1 M L(~v1 )) + λ2 L(~v2 ) . 

Esempio. Consideriamo le due applicazioni lineari (si veda l’esempio 17 del paragrafo §4:
le matrici sono le stesse)
L : R4 −→ R3
       z1 
z1
y1 1 2 0 3
 z2  z 
  7→  y2  :=  0 7 2 1 · 2
z3 z3
y3 3 0 −1 −1
z4 z4
M :  R3 −→ R2  
y1     y1
 y2  7→ x1 :=
4 0 1
·  y2 
x2 2 −5 0
y3 y3

La composizione M ◦ L è l’applicazione (verificarlo)


T : R4 −→ R2
   
z1     z1
 z2  x1 7 8 −1 11  z2 
  7→ := · 
z3 x2 2 −31 −10 1 z3
z4 z4
La matrice di questa composizione coincide con il prodotto della matrice associata ad M
per la matrice associata ad L (verificarlo).
 
2 0
Esercizio. Sia A = . Si calcoli, e si descriva esplicitamente (secondo le notazioni
0 3
della Definizione 12.5),
k
LA , LA ◦ LA , LA ◦ LA ◦ LA , LA = LA ◦ ... ◦ LA (ripetuto k volte).

     
1 2 3 1 0 0 2 1 0
Esercizio. Sia A =  0 1 2  , B = 0 2 0 , C = 1 1 1  . Si
0 0 1 0 0 3 0 1 3
calcoli, e si descriva esplicitamente,
LA ◦LB , LB ◦LA , LA ◦LB ◦LC , LA ◦LA ◦LA , LB ◦LC ◦LC , LC ◦L(C −1 ) , L(A3 ) .

Esercizio. Per ognuna delle applicazioni dell’esercizio precedente si determini l’immagine


del vettore di coordinate 2, −1, 3 .

Osservazione. L’identità I : Rn −→ Rn , definita ponendo I(~x) = ~x , ∀ ~x , è


chiaramente una applicazione lineare nonché è rappresentata dalla matrice identica In .

Osservazione. Supponiamo di avere una applicazione lineare LA : Rn −→ Rn e sup-


poniamo che LA sia una funzione biunivoca. Allora, l’inversa (insiemistica) della funzione
76

LA è una applicazione lineare nonché è l’applicazione lineare associata alla matrice A−1
(inversa di A). Infatti, per la (12.18),
LA ◦ LA−1 = LA·A−1 = LIn = I .

Osservazione 12.19. Consideriamo ora il sistema lineare A~x = ~b e l’applicazione


lineare LA : Rn → Rm , ~x 7→ ~y = A~x . Chiaramente, le soluzioni del sistema lineare
sono i vettori della fibra (i.e. immagine inversa) di ~b . In particolare, la compatibilità del
sistema equivale alla proprietà ~b ∈ ImLA . Alla luce di questa considerazione, del fatto
che l’immagine di LA è lo “Span delle colonne della matrice A” (osservazione 12.8) e del
Teorema 9.2, abbiamo il teorema che segue.

Teorema 12.20 (di Rouché-Capelli). Sia A~x = ~b un sistema lineare di m equazioni


in n incognite. Indichiamo con A e la matrice completa associata a questo sistema lineare.
Le affermazioni che seguono sono equivalenti.
i) A~x = ~b è compatibile;
ii) ~b ∈ ImLA ;
iii) ~b ∈ Span{“colonne di A”};
iv) rg A = rg A e.

Notazione 12.21. Sia A ∈ Mn, m una matrice. In seguito, scriveremo anche:


i) kerA , intendendo kerLA ;
ii) ImA , intendendo ImLA .

   
2 −1 −7
Esercizio 12.22. Sia A = . Calcolare LA ◦ LA .
3 5 4

Esercizio 12.23. Sia L : R7 → R11 una applicazione lineare rappresentata da una


matrice A ∈ M11,7 (R) di rango 5. Calcolare dimker L e dim ImL .

Esercizio 12.24. Sia L : R8 → R5 una applicazione


 lineare e sia W ⊆ R8 un sottospazio
di dimensione 6. Provare che dim kerL ∩ W ≥ 1 .

C’è una applicazione lineare che merita di essere menzionata. Sia V uno spazio vettoriale
e sia BV = {~v1 , ..., ~vn } una base di V . Le coordinate di un vettore in V sono una n−pla
di numeri, quindi possiamo considerare la seguente funzione
CBV : V −−−−→ Rn
(12.25)
~v 7→ “coordinate di ~v ”

Osservazione 12.26 La funzione CBV è lineare. Infatti, banalmente si ha


 X
X X  ~v + ~u = (λi + µi )~vi
~v = αi~vi , ~u = βi~vi , λ ∈ R =⇒ X
 λ~v = (λαi )~vi

(dove le somme sono tutte somme per i che va da 1 a n), ovvero le coordinate di una somma
di vettori sono la somma delle coordinate dei singoli vettori e le coordinate del prodotto di un
vettore per una costante sono le coordinate di quel vettore moltiplicate per quella costante.
77

§13. Trasformazioni lineari di uno spazio vettoriale: autovalori e autovettori.

Concentriamo la nostra attenzione sulle applicazioni di Rn in se stesso dette anche trasfor-


mazioni di Rn .

Per cominciare con un esempio, consideriamo la seguente dilatazione

L : R2 −→ R2
       
x 3 0 x 3x
7→ · =
y 0 1 y y

È abbastanza chiaro cosa fa questa applicazione:  prende il piano e lo dilata 


nella
 direzione
1 3
dell’asse delle ascisse. Si osservi che il punto ha per immagine il punto , mentre
  0 0
0
il punto viene mandato in se stesso. Ma ora consideriamo l’applicazione
1

M : R2 −→ R2
       
x 2 1 x 2x + y
7→ · =
y 1 2 y x + 2y

Non è affatto chiaro a  priori


 come si comporta questa applicazione,
  ma basta accorgersi
 
1 3 1
del fatto che il punto ha per immagine il punto , mentre il punto
1 3 −1
viene mandato in se stesso, per rendersi conto che questa applicazione è molto simile alla
precedente. Infatti, esattamente come la precedente applicazione, anche M dilata il piano
in una direzione e lascia fissati i punti della retta ortogonale a tale direzione, solo che questa
volta la direzione lungo la quale stiamo dilatando il piano non è quella dell’asse delle ascisse
bensı̀ è quella della retta x = y .

Queste considerazioni suggeriscono che per comprendere la geometria di una trasfor-


mazione lineare L : Rn → Rn è importante vedere se ci sono delle direzioni privilegiate,
ovvero dei sottospazi di Rn che vengono mandati in se stessi, più precisamente è importante
domandarsi se esistono dei sottospazi sui quali L agisce in un modo particolarmente sem-
plice: è la moltiplicazione per una costante λ . In Fisica, Chimica e Ingegneria le “direzioni
privilegiate” hanno un ruolo fondamentale, ad esempio possono rappresentare assi di ro-
tazione, direzioni privilegiate all’interno di un materiale e molto altro. Noi non discuteremo
le applicazioni, per mancanza di tempo e perché in questo corso vogliamo concentrarci su
questioni algebriche.

Definizione 13.1. Sia L : Rn −→ Rn una trasformazione lineare e supponiamo che


~ 0 6= ~0 , tali che
~ 0 ∈ Rn , con w
esistono λ ∈ R e w

(13.1′ ) L(w
~ 0) = λw
~0 .

In questo caso diciamo che λ è un autovalore della trasformazione L e che lo spazio



Wλ := ~ ∈ Rn L(w)
w ~ = λw
~

~ che soddisfano la (13.1′ ) si chiamano


ne è il relativo autospazio. I vettori (non nulli) w
autovettori (di L e di autovalore λ ).

Esercizio 13.2. Verificare che l’insieme Wλ definito sopra soddisfa le condizioni (8.9′ ),
e pertanto è un sottospazio vettoriale di Rn .
78

Le definizioni di autovalore, autovettore e autospazio possono riferirsi anche ad una ma-


trice quadrata A: se λ è un autovalore della trasformazione LA (cfr. Def. 12.5), è lecito
dire (per definizione) che λ è un autovalore della matrice A, eccetera.

In questo paragrafo discutiamo il problema della determinazione degli autovalori e dei


corrispondenti autospazi di una trasformazione di Rn . Prima di procedere però osserviamo
che la definizione si può dare più in generale:

Definizione 13.3. Sia V uno spazio vettoriale e sia

T : V −→ V

una trasformazione lineare. Se esistono ~v 6= ~0 e λ ∈ R tali che

(13.3′ ) T (~v ) = λ~v ,

diciamo che ~v e λ sono rispettivamente un autovettore e un autovalore di T .

Anche la tesi dell’esercizio 13.2 si generalizza: l’insieme dei vettori che soddisfano la
(13.3′ ) è un sottospazio vettoriale di V .

Esercizio 13.4. Verificare che l’insieme Vλ dei vettori che soddisfano la (13.3′ ) è un
sottospazio vettoriale di V .

Definizione 13.5. Lo spazio dei vettori che soddisfano la (13.3′ ) si chiama autospazio
associato all’autovalore λ e si denota con Vλ .

Osservazione
 13.6. Scrivendo la (13.3′ ) nella forma T (~v) − λ~v = 0 , ovvero nella forma
T − λI (~v ) = 0 , dove I : V → V denota l’identità (trasformazione che manda ogni
vettore in se stesso), si evince che l’autospazio Vλ è il nucleo della trasformazione T − λI :

(13.6′ ) Vλ = ker(T − λI) .

Vogliamo sottolineare che, in particolare, se ~v è un autovettore, allora tutti i suoi multipli


(non nulli) sono anch’essi autovettori, relativamente allo stesso autovalore.

...vi sarete accorti che Vλ , in quanto nucleo di una applicazione lineare, è sicuramente un
sottospazio V . Questo risolve l’esercizio 13.4 e, a maggior ragione, l’esercizio 13.2!

Definizione 13.7. L’insieme degli autovalori di T si chiama spettro di T .

Osservazione 13.8. Alla luce della Definizione 13.3 e di quanto appena osservato, il
valore λ è un autovalore di T se e solo se il nucleo ker (T − λI) contiene almeno un vettore
non nullo, ovvero se e solo se tale nucleo ha dimensione strettamente positiva:

λ è un autovalore di T ⇐⇒ dim ker T − λI > 0 .

Abbiamo visto che un autovettore rappresenta una direzione privilegiata, ovvero una
direzione lungo la quale T è una dilatazione. Il relativo autovalore λ è il coefficiente di tale
dilatazione. E’ del tutto evidente che lo stesso vettore ~v non può essere autovettore per
due autovalori distinti (l’esercizio 13.11 vi chiede di dimostrare questa affermazione!). Un
po’ meno evidente è la proprietà secondo la quale autovettori corrispondenti a autovalori
distinti sono sicuramente indipendenti:

Teorema 13.9. Autospazi corrispondenti ad autovalori distinti sono indipendenti.

Inciso 13.10. Stiamo utilizzando l’aggettivo “indipendente” relativamente a dei sottospazi


di uno spazio vettoriale piuttosto che relativamente a dei vettori di uno spazio vettoriale.
79

Si tratta solo di una questione di linguaggio, la definizione è quella ovvia: diciamo che i
sottospazi W1 , ..., Wk di uno spazio vettoriale V sono indipendenti se presi comunque dei
vettori non nulli w ~ ir ∈ Wir si ha che w
~ i1 ∈ Wi1 , ..., w ~ ir sono vettori indipendenti.
~ i1 , ..., w
Negli approfondimenti, paragrafo § 16, proponiamo un esercizio utile (esercizio 16.9).

Come già accennato, il Teorema 13.9 generalizza il risultato dell’esercizio che segue.
Può essere dimostrato per induzione sul numero degli autospazi che si considerano, la di-
mostrazione la svolgiamo negli approfondimenti (§ 16).

Esercizio 13.11. Provare che due autospazi corrispondenti a due autovalori distinti sono
indipendenti (i.e. la loro intersezione è il vettore nullo).

Torniamo a considerare LA : Rn → Rn (in realtà, tutto quello che stiamo per dire ha
perfettamente senso anche per le trasformazioni lineari di uno spazio vettoriale astratto).

Definizione 13.12. Il polinomio caratteristico di LA è il polinomio



PLA (λ) := det A − λI
dove I denota la matrice identica.

Naturalmente, per definizione, ci si può riferire direttamente alla matrice A: si può dire
“il polinomio caratteristico di A” e si può scrivere PA (λ), intendendo sempre det (A − λI).
 
2 1 0
Esempio. Se A =  4 5 1  , si ha
−1 7 3
     
2 1 0 1 0 0 2−λ 1 0
PA (λ) = det  4 5 1  − λ 0 1 0  = det  4 5−λ 1 
−1 7 3 0 0 1 −1 7 3−λ

= −λ3 + 10 λ2 − 19 λ + 3 .

Esercizio. Calcolare il polinomio caratteristico delle seguenti matrici


 
        1 −1 0
1 2 3 2 1 −1 1 0 1 1 1
3 4 −3 1 3 −3 0 1
2 0 2
   
1 −1 0 0 0 0    
 0 −2 5 7 2 −1
1 0 0 0
−3 4 1 −2
0 0 2 0 0 0

Vedremo (Lemma 15.14 e oss. 15.16) che il polinomio caratteristico è un invariante delle
trasformazioni lineari, questo significa che anche i suoi coefficienti lo sono e che in particolare
devono avere un significato geometrico. Ora cerchiamo di capire cosa si può dire a priori,
almeno algebricamente, sui coefficienti di PA (λ). Innanzi tutto osserviamo che λ compare
n volte e che compare sulla diagonale, questo significa che sicuramente PA (λ) comincia con
(−λ)n . Inoltre, il termine noto di un qualsiasi polinomio si ottiene valutando il polinomio
in zero. Nel nostro caso, sostituendo λ = 0 nella (13.12) si ottiene detA, quindi il termine
noto di PA (λ) è det A. Un altro coefficiente interessante è quello di (−λ)n−1 : sebbene la
formula del determinante di una matrice sia complessa, domandandoci quali sono i termini
di grado n−1 in λ, ci accorgiamo che questi si ottengono facendo scontrare i vari ai, i con
i restanti −λ sulla diagonale e quindi che il coefficiente di (−λ)n−1 vale a1, 1 + ... + an, n ,
espressione che denotiamo con tr A (traccia di A, def. 13.14). In definitiva risulta
(13.13) PA (λ) = (−λ)n + tr A · (−λ)n−1 + ... + det A ,
80

Definizione 13.14. Sia A ∈ Mn, n (R) una matrice, la somma degli elementi sulla
diagonale principale si definisce la traccia di A:

tr A := a1,1 + a2,2 + ... + an,n .

Osservazione 13.15. Consideriamo sempre LA : Rn → Rn . L’osservazione 13.8 ci dice


che il valore λ è un autovalore di LA se e solo se il nucleo della trasformazione LA−λI ha
dimensione strettamente positiva. D’altro canto, poiché la matrice associata all’applicazione
lineare LA −λI è la matrice A−λIn (questo è ovvio, se non vi sembra ovvio dimostratelo!
...e scrivete qualche esempio), il valore λ è un autovalore di LA se e solo se il determinante
della matrice A − λIn vale zero. In altri termini, lo spettro di LA (Definizione 13.7) è
l’insieme delle radici del polinomio caratteristico:

spettro LA = “insieme delle radici del polinomio caratteristico”.

Questo significa che abbiamo uno strumento per determinare gli autovalori di una trasfor-
mazione lineare: scriviamo il polinomio caratteristico e ne troviamo le radici. Una volta
trovati gli autovalori la strada è in discesa: i relativi autospazi si determinano utilizzando
la (13.6′ ).

Nell’esempio che segue determiniamo autovalori e autospazi di una trasformazione di R2 .


 
1 2
Esempio. Consideriamo la trasformazione lineare, associata alla matrice A = ,
−1 4

L : R2 −→ R2
       
x 1 2 x x + 2y
7→ · =
y −1 4 y −x + 4y

e calcoliamone gli autovalori ed i relativi autospazi. Per prima cosa scriviamo il polinomio
caratteristico:
     
1 2 1 0 1−λ 2
PL (λ) := det −λ = det = λ2 − 5λ + 6 ;
−1 4 0 1 −1 4−λ

poi ne calcoliamo le radici, che sono λ1 = 2 e λ2 = 3 . A questo punto determiniamo 


−1 2
il nucleo della matrice (ovvero della corrispondente trasformazione) A − 2I =
     −1 2
−2 2 −1 2 2
e della matrice A − 3I = . Si ha ker = Span nonché
    −1 1 −1 2 1
−2 2 1
ker = Span . Quindi, ci sono due autovalori: 2 e 3; i relativi autospazi
−1 1 1    
2 1
sono l’autospazio V2 = Span e l’autospazio V3 = Span .
1 1

Ora introduciamo due numeri associati a un autovalore.

Definizione 13.16. Sia LA : Rn → Rn una trasformazione lineare e sia λ un autovalore


di LA . Si pone
µg (λ) := dim ker(LA − λId ) = dimVλ ;
µa (λ) := “molteplicità di λ come soluzione di PA (λ) = 0 ”.

Queste due quantità si chiamano, per definizione, rispettivamente molteplicità geometrica


e molteplicità algebrica dell’autovalore λ .
81

Nell’esempio che precede la Definizione 13.16, entrambi gli autovalori hanno molteplicità
algebrica e geometrica uguale a uno.

Vale il seguente risultato fondamentale.

Teorema 13.17. Le molteplicità geometrica µg (λ) e algebrica µa (λ) di un autovalore λ


di una trasformazione lineare soddisfano la relazione

µg (λ) ≤ µa (λ) .

Questo teorema lo dimostriamo nel paragrafo §16.

Esercizio. Calcolare autovalori e autospazi delle matrici che seguono (calcolare anche le
molteplicità algebrica e geometrica di ogni autovalore)
 
        4 −3 0
1 1 3 2 1 −1 4 0  −3 2 0 
−2 −2 2 1 −1 2 0 7
0 0 5
     
4 0 5 2 0 0 2 1 0    
 0 −2 0  0 2 0 0 1 1
0 0 2 0
1 0 1 1
5 0 3 0 0 7 0 0 7

Osservazione 13.18. Supponiamo che ~v sia un autovettore di A e che λ ne sia il relativo


autovalore. Per ogni intero k ≥ 0 si ha

Ak ~v = |A · {z
... · A} ~v = | · {z
A ... · A} λ~v = ... = λk ~v
k volte k−1 volte

   
3 0 −3
Esercizio 13.19. Verificare che ~v = è un autovettore della matrice A = .
−2 −2 −1
2 3 5 14
Calcolarne il relativo autovalore e determinare A ~v , A ~v , A ~v , A ~v .
82

§14. Matrice rappresentativa di una applicazione lineare.

Abbiamo visto che se L : Rn → Rm è una applicazione lineare, allora esiste una matrice
A tale che L(~x) = A · ~x , ∀ x ∈ Rn (cfr. Prop. 12.16). Tale matrice “descrive numerica-
mente” la nostra funzione L e la possiamo utilizzare per rispondere a molte domande che
la riguardano.

Data una applicazione lineare tra spazi vettoriali astratti L : V → W vorremmo


ugualmente poterla “descrivere numericamente”. Questo è possibile, vediamo in che modo
si realizza una tale descrizione. Se fissiamo una base BV = {~v1 , ..., ~vn } di V e una base
BW = {w ~ m } di W , abbiamo un sistema di coordinate su V ed uno su W , quindi
~ 1 , ..., w
possiamo considerare la funzione che alle coordinate di un vettore associa le coordinate della
sua immagine, funzione che per sottolineare questo aspetto denotiamo con Lcoord . D’altro
canto le coordinate di un vettore in V sono una n−pla di numeri, cosı̀ come le le coordinate
di un vettore in W sono una m−pla di numeri, quindi Lcoord è una funzione definita su
Rn , che assume valori in Rm . Schematizzando, fissate delle basi per V e W ,

L : V −→ W Lcoord : Rn −→ Rm
ad associamo “coordinate del
~v 7→ L(~v ) ~λ 7→ P
vettore L( λi~vi )”

Notiamo che essendoPi ~vi i vettori della base di V , il vettore numerico ~λ è il vettore delle
coordinate di ~v := λi~vi . Ciò significa che abbiamo la seguente chiave di lettura per la
funzione Lcoord :
“alle coordinate di un vettore associa le coordinate della sua immagine”.

Esercizio 14.1. Dimostrare che la funzione Lcoord : Rn → Rm è una funzione lineare.

Questo esercizio, è sostanzialmente una tautologia... ma va ugualmente svolto! (Si veda


il capitolo dedicato alle soluzioni degli esercizi).

La funzione Lcoord , come ogni funzione lineare da Rn a Rm e come ricordato nell’incipit


di questo paragrafo, è la moltiplicazione per una matrice. Si pone:

Definizione 14.2. La matrice associata all’applicazione lineare Lcoord : Rn → Rm si


chiama matrice rappresentativa di L rispetto alle basi fissate.

Esempio 14.3. Sia V lo spazio dei polinomi di grado minore o uguale a 2. Consideriamo
la funzione D : V −→ V che ad un polinomio associa la sua derivata. Cerchiamo la
matrice rappresentativa di D rispetto alla base BV = {1, x, x2 } . Le coordinate del
polinomio p(x) = a + bx + cx2 sono la terna a, b, c. Quanto alla sua derivata abbiamo
Dp(x) = b + 2cx , di coordinate b, 2c, 0 (attenzione all’ordine). Ne segue che

Dcoord : R3 −→  R3 
D : V −→ V a b
a associamo  b  7→  2c 
p(x) 7→ Dp(x)
c 0
     
b 0 1 0 a 0 1 0
Poiché  2c  =  0 0 2 · b  (cfr. esempio 12.17), la matrice  0 0 2  è la
0 0 0 0 c 0 0 0
matrice rappresentativa di D rispetto alla base BV = {1, x, x2 } .
83

Data un’applicazione lineare L : V → W e fissate basi BV = {~v1 , ..., ~vn } di V e


BW = {w ~ m } di W , corrispondentemente abbiamo la matrice rappresentativa M di
~ 1 , ..., w
L . Poiché il vettore delle coordinate di ~vi rispetto alla base BV è il vettore ~ei della base
canonica di Rn (convincersene) e poiché il prodotto M · ~ei restituisce la i−esima colonna
di M , alla luce del fatto che per definizione stessa di matrice rappresentativa si deve avere

(14.4) M · “ CoordBV ~v ” = “CoordBW L(~v ) ” , ∀ ~v ∈ V ,

e pertanto, in particolare, ciò dovrà valere per il vettore ~vi , si deduce quanto segue:

Osservazione 14.5. La i−esima colonna di M è il vettore delle coordinate di L(~vi )


rispetto alla base BW .

Ribadiamo l’osservazione 14.5 e quanto spiegato sopra in altri termini: vale la catena di
uguaglianze

i−esima colonna di M = M · ~ei = M · “ CoordBV ~vi ” = “CoordBW L(~vi ) ”

(essendo ~ei ∈ Rn il vettore della base canonica di posto i).

Naturalmente, la matrice rappresentativa, rispetto alle basi canoniche BCan(Rn ) e BCan(Rm )


(cfr. § 8), dell’applicazione lineare

LA : Rn −−−−→ Rm
~x 7→ A · ~x
coincide con la matrice A. Questo semplicemente perché le coordinate di un vettore rispetto
BCan(Rn ) di un vettore di Rn coincidono col vettore stesso (stessa cosa per Rm ).

Osservazione 14.6. Sia L : V −→ W un’applicazione lineare, BV una base di V e


BW una base di W . Sia inoltre A la matrice rappresentativa di L rispetto tali basi. Si ha

rango L = dim ImL = dim Im Lcoord = rango A .


(def. 12.12) (12.9)

dove l’uguaglianza al centro è immediata: un vettore appartiene all’immagine di L se e solo


se il vettore delle sue coordinate appartiene all’immagine di Lcoord nonché ad una base di
ImL corrisponde (tramite il passaggio a coordinate) una base di ImLcoord .

Da notare che, in particolare, matrici rappresentative (rispetto a basi diverse) della stessa
applicazione lineare L : V −→ W hanno necessariamente lo stesso rango. Infatti, la
nozione “rango di L” (cfr. Definizione 12.12) è intrinseca: non ha nulla a che vedere con la
scelta di basi di V e W .
84

§15. Problema della diagonalizzazione.

Consideriamo uno spazio vettoriale V ed una trasformazione lineare T : V → V .


Abbiamo visto che se fissiamo una base B = {~b1 , ..., ~bn } di V , corrispondentemente
abbiamo delle coordinate su V (cfr. Osservazione 8.18 e Definizione 8.19). Dal paragrafo
precedente sappiamo che T è rappresentata dalla matrice A (rispetto alla base B) se
 
n
! n µ1
X X  
T λi ~bi = µi ~bi , dove  ...  := A · ~λ ,
i=1 i=1 µn

cioè se A · ~λ è il vettore delle coordinate di T (~v) , essendo ~λ è il vettore delle coordinate


di ~v . In altre parole, premesso che una base B di V determina un sistema di coordinate
su V , ovvero una identificazione di V con Rn , si ha che T è rappresentata dalla matrice
A se accade che T , vista come trasformazione di Rn , è la moltiplicazione per la matrice
A . Di nuovo, in altre parole: visto che Rn è lo spazio delle coordinate di V , si ha che
T è rappresentata dalla matrice A se la legge che alle coordinate di un vettore associa le
coordinate dell’immagine di quel vettore è data dalla moltiplicazione per la matrice A .

Nota. Quando V = Rn e {~b1 , ..., ~bn } è la base canonica di Rn , la trasformazione T è


rappresentata dalla matrice A se e solo se T = LA (cfr. Definizione 12.5).

Inciso. Nel paragrafo precedente abbiamo introdotto la matrice rappresentativa, di una


applicazione lineare T : V → W , associata ad una base del dominio V ed una base del
codominio W . Nel caso delle trasformazioni lineari, essendo V = W si sceglie sempre la
stessa base per dominio e codominio (questo non tanto perché sceglierle diverse e peraltro
cambiarle significherebbe gestire quattro basi per lo stesso spazio vettoriale, ma perché
altrimenti si arriverebbe a matrici geometricamente poco significative).

Il problema della diagonalizzazione è il seguente: dati V e T come sopra, trovare (se


possibile) una base di V rispetto alla quale la matrice che rappresenta T è una matrice
diagonale. Prima di procedere caratterizziamo le trasformazioni rappresentate da una ma-
trice diagonale.

Osservazione 15.1. Siano V e T come sopra e sia B = {~b1 , ..., ~bn } una base di V .
Si ha che T è rappresentata dalla matrice diagonale
 
α1 0 ... 0
 0 α2 ... 0 
∆(α1 , ..., αn ) :=  . .. .. ..  .
 .. . . . 
0 0 ... αn

se e solo se
T (~bi ) = αi~bi , ∀i.

Si noti che, nella situazione indicata, in particolare i vettori ~b1 , ..., ~bn sono autovettori
della trasformazione T (di autovalori α1 , ..., αn ).

Quanto appena osservato dimostra la proposizione che segue.

Proposizione 15.2. Siano V e T come sopra. La trasformazione T è diagonalizzabile


se e solo se esiste una base di autovettori.

Questa proposizione e l’osservazione che la precede riducono il problema della diagona-


lizzazione al problema della ricerca di una base di autovettori, problema che sappiamo
85

affrontare con gli strumenti visti nel paragrafo § 13. A questo punto è naturale porsi le
domande che seguono:
Cosa hanno in comune due matrici che rappresentano la stessa trasformazione (rispetto
a basi diverse)? È possibile scrivere una formula che le lega?
La Proposizione 15.6 e le osservazioni che seguono rispondono alle nostre domande. In
inciso, negli approfondimenti (paragrafo § 16) vedremo, in generale, come cambia la matrice
rappresentativa di una applicazione lineare L : V → W quando si cambia la base del
dominio e/o del codominio.

Consideriamo una trasformazione lineare L di uno spazio vettoriale V . Siano date due
basi di V che chiamiamo “vecchia” e “nuova” (e chiamiamo “vecchio” e “nuovo” i rispettivi
sistemi di coordinate). Premettiamo che alla luce di quanto visto nel paragrafo precedente
ed in particolare della caratterizzazione (14.4), scrivere la matrice rappresentativa di L
rispetto ad una base fissata equivale a conoscere la funzione che alle coordinate di un vettore
~v associa le coordinate della sua immagine L(~v ) . Ora, assumendo di conoscere la matrice
rappresentativa di L rispetto alla vecchia base, ovvero la legge che alle vecchie coordinate
di un vettore ~v associa le vecchie coordinate della sua immagine L(~v ), siamo in grado di
scrivere un mero algoritmo che consente di passare dalle nuove coordinate di un vettore ~v
alle nuove coordinate della sua immagine L(~v ):
siano date le nuove coordinate di un vettore ~v ,
i) determiniamo le vecchie coordinate di ~v ;
(15.3)
ii) determiniamo le vecchie coordinate di L(~v ) ;
iii) determiniamo le nuove coordinate di L(~v ) .
Il passaggio ii) lo sappiamo già eseguire: consiste nella moltiplicazione per la matrice rap-
presentativa rispetto alla vecchia base. Ci domandiamo come eseguire i passaggi i) e iii),
ovvero come effettuare i cambi di coordinate. La risposta è nelle Proposizioni 15.4 e 15.7
che seguono. Per rendere un po’ meno astratta la trattazione e per semplificare il discorso
iniziamo considerando il caso dove V = Rn e dove la vecchia base in questione è la base
canonica di Rn . Dunque, vale il risultato che segue.

Proposizione 15.4. Si considerino Rn , la sua base canonica Can = {~e1 , ..., ~en } e
la base B = {b1 , ..., bn } . Sia B la matrice associata ai vettori ~b1 , ..., ~bn . Allora, la
~ ~
moltiplicazione per B fa passare da coordinate rispetto a B a coordinate canoniche. In
altri termini, se ~λ è il vettore delle coordinate di ~v rispetto a B , allora B · ~λ è il vettore
delle coordinate canoniche di ~v (cioè ~v stesso).

Dimostrazione. Dire che ~λ è il vettore delle coordinate di ~v rispetto a B significa dire che
P ~ P ~
~v = λi bi . Vista la definizione di B e di prodotto righe per colonne si ha λi bi = B·~λ.


Osservazione 15.5. Naturalmente il passaggio inverso, ovvero il passaggio da coordinate


canoniche a coordinate rispetto a B si effettua moltiplicando per la matrice B −1 .

A questo punto abbiamo una prima risposta alle domande che ci siamo posti.

Proposizione 15.6. Sia L = LA : Rn → Rn una trasformazione lineare (quindi A è


la matrice rappresentativa di L rispetto alla base canonica di Rn ). Sia B = {~b1 , ..., ~bn }
un’altra base di Rn . Sia B la matrice associata ai vettori ~b1 , ..., ~bn . La matrice che
rappresenta L rispetto alla base B è la matrice

(15.6′ ) X = B −1 · A · B

Dimostrazione. Per definizione di matrice rappresentativa trovare X significa descrivere la


legge che alle coordinate λ1 , ..., λn di un vettore ~v rispetto alla base B associa le coordinate
86

di L(~v ), sempre rispetto a B . Questa legge è descritta dall’algoritmo (15.3). Denotato con
~λ il vettore delle coordinate di ~v rispetto a B , per la Proposizione 15.4 il passaggio i) è
la moltiplicazione per B e pertanto restituisce B · ~λ, come già osservato il passaggio ii) è
la moltiplicazione per A, che quindi restituisce A · (B · ~λ), infine per l’osservazione 15.5 il
passaggio iii) è la moltiplicazione per B −1 , che quindi restituisce B −1 · (A · (B · ~λ)).
In definitiva, poiché la legge che al vettore ~λ delle coordinate di ~v rispetto alla base B
associa le coordinate di L(~v ) (sempre rispetto alla base B ) è la funzione che a ~λ associa
B −1 · (A · (B · ~λ )), si ha che B −1 · A · B è la matrice cercata. 

Abbiamo considerato Rn ed abbiamo assunto che una delle due basi era quella canonica.
In effetti anche nel caso generale di una trasformazione di uno spazio vettoriale astratto V
la formula che lega le matrici rappresentative rispetto a basi diverse è identica alla (15.6′ ).
Infatti, possiamo ripetere i risultati visti nel caso generale:

Proposizione 15.7. Siano V uno spazio vettoriale, C = {~c1 , ..., ~cn } e D =


{d~1 , ..., d~n } due sue basi (che chiamiamo “vecchia” e “nuova”), B la matrice delle coordi-
nate dei vettori della nuova base rispetto alla vecchia base (la iesima colonna di B è il
vettore delle coordinate di d~i rispetto alla base C ). Allora, la moltiplicazione per B fa
passare da coordinate nuove a coordinate vecchie.

Proposizione 15.8. Siano V , C , D , B come nella Proposizione precedente. Sia


T : V −→ V una trasformazione lineare e siano A ed X la matrice rappresentativa di T
rispetto a C e quella rispetto a D . Allora

(15.8′ ) X = B −1 · A · B

Dimostrazione (della Proposizione 15.7). Se ~λ è il vettore delle coordinate di un vettore ~v


rispetto a D , allora
Xn Xn Xn  Xn X n 
~v = λi d~i = λi bh, i~ch = bh, i λi ~ch .
i=1 i=1 h=1 h=1 i=1
| {z }
(⋆)

Visto che il coefficiente (⋆) è esattamente il prodotto tra la h−esima riga di B ed il vettore
~λ si ha che B · ~λ è il vettore delle coordinate di ~v rispetto alla base C .


Dimostrazione (della Proposizione 15.8). Come nella dimostrazione della Proposizione 15.6,
vista la Proposizione 15.7, i tre passi dell’algoritmo (15.3) corrispondono, nell’ordine, alla
moltiplicazione per B , la moltiplicazione per A, la moltiplicazione per B −1 . 

Quanto visto si può riassumere nello schemino che segue (“nu”, “ve” e “co” stanno rispet-
tivamente per “nuove”, “vecchie” e “coordinate”, la freccia “ ” indica il passaggio):
nu.co.(~
v) nu.co.(~
v)
z}|{ z}|{
X · ~ B −1 · A · |B · {z ~λ }
| {z λ } =
nu.co.(T (~
v)) ve.co.(~
v)
| {z }
ve.co.(T (~
v ))
| {z }
nu.co.(T (~
v ))

Attenzione: La formula X = B −1·A·B può anche essere scritta nella forma A = B·X·B −1 ,
come pure nella forma A = C −1 ·X ·C, ovvero X = C ·A·C −1 , essendo ora C la matrice di
87

passaggio da vecchie a nuove coordinate, cioè essendo C = B −1 . Tutto questo può creare
molta confusione, ma non ci si deve spaventare: una volta compresa l’essenza della formula,
l’unico dubbio che può venire riguarda i ruoli giocati dai due sistemi di coordinate. Bene,
le possibilità sono due e c’è un trucco per non sbagliarsi mai. Vedendo il prodotto per una
matrice come funzione che ad un vettore numerico associa un altro vettore numerico, l’input
della stessa sono coefficienti da dare alle colonne mentre l’output sono c.l. delle colonne,
quindi se nelle colonne della matrice di un cambiamento di base ci sono le coordinate dei
vettori di una base B (rispetto un’altra base), allora l’input “naturale” sono coordinate
rispetto a B (e l’output saranno coordinate rispetto l’altra base). Scrivendo la formula del
cambiamento di base coerentemente con questo principio è impossibile confondersi.

Osservazione 15.9. Siamo partiti da una trasformazione lineare T : V → V ed abbiamo


visto che la formula che lega le due matrici rappresentative A ed X (rispetto a due basi
diverse) è la formula X = B −1 ·A·B . Naturalmente la stessa formula ha un’altra chiave
di lettura: data T : V → V , di matrice rappresentativa A rispetto a una base fissata, si
ha che X = B −1 ·A·B è la matrice rappresentativa di T rispetto a un’altra base (la base
corrispondente al cambio di coordinate associato alla moltiplicazione per B ).

Di conseguenza, possiamo affermare che due matrici rappresentano la stessa trasfor-


mazione lineare rispetto a basi diverse se e solo se sono coniugate (Proposizione 15.10 e
Definizione 15.11 seguenti):

Proposizione 15.10. Due matrici A, A′ ∈ Mn,n (R) rappresentano la stessa trasfor-


mazione lineare rispetto a basi diverse se e solo se esiste una matrice invertibile C tale
che

(15.10′ ) A′ = C −1 · A · C

Definizione 15.11. Due matrici A e A′ come nella (15.10′ ) si dicono coniugate.

Torniamo al problema della diagonalizzazione. Alla luce di quanto abbiamo visto, e in


particolare della Proposizione 15.10, abbiamo la seguente osservazione

Osservazione 15.12. La trasformazione lineare L = LA : Rn → Rn è diagonalizzabile


se e solo se la matrice A è coniugata a una matrice diagonale, cioè se e solo se esiste una
matrice invertibile C tale che C −1 · A · C è una matrice diagonale.

Il problema della diagonalizzazione di una matrice A è il problema di trovare una matrice


invertibile C tale che A′ = C −1 ·A·C è diagonale. Risolviamo il seguente problema:

Problema 15.13. Trovare una matrice invertibile B che diagonalizza la matrice


 
3 −3
A = .
−1 5
Soluzione. Scriviamo il polinomio caratteristico di A
 
 3−λ −3
PA (λ) = det A − λI = det = λ2 − 8λ + 12 ,
−1 5 − λ

ne calcoliamo le due radici λ1 = 2 , λ2 = 6 , quindi determiniamo i due autospazi V2 e V6 :


  ( )
 1 −3 3
V2 = ker A − 2I = ker = Span ;
−1 3 1
  ( )
 −3 −3 1
V6 = ker A − 6I = ker = Span .
−1 −1 −1
88

La matrice B , associata agli autovettori trovati, è la matrice che diagonalizza A : si ha


 
λ1 0
B −1 · A · B = ,
0 λ2
o meglio,
 −1      
′ 3 1 3 −3 3 1 2 0
(15.13 ) · · = .
1 −1 −1 5 1 −1 0 6


Osservazione. Sia T la trasformazione lineare di R2 associata  alla matrice A , e sia


∆ la matrice che rappresenta T rispetto alla base di autovettori ~v2 ,~v6 . La spiegazione
2 0
geometrica del risultato ottenuto è la seguente: si ha ∆ = (infatti T (~v2 ) =
0 6
2~v2 + 0~v6 e T (~v6 ) = 0~v2 + 6~v6 ), d’altro canto, per la Proposizione 15.6 si ha anche
∆ = B −1 AB .

Avvertenza. Nel risolvere il problema posto abbiamo effettuato delle scelte: abbiamo
scelto di considerare λ = 2 come primo autovalore e λ = 6 come secondo autovalore;
relativamente ai due autovalori trovati, abbiamo scelto gli autovettori
   
3 1
~v2 = , ~v6 = .
1 −1
Naturalmente avremmo potuto considerare λ = 6 come  primo autovalore e λ = 2 come
secondo autovalore, nonché, ad esempio, v~6 ′ = −4 4 , v~2 ′ = 31 . Seguendo queste scelte
avremmo trovato
 −1      
′′ −4 3 3 −3 −4 3 6 0
(15.13 ) · · = .
4 1 −1 5 4 1 0 2

Esercizio. Verificare le uguaglianze (15.13′ ) e (15.13′′ ).

Ora enunciamo un lemma molto importante.

Lemma 15.14. Se A ed A′ sono due matrici coniugate (e.g. A′ = B −1 · A · B ), hanno


lo stesso polinomio caratteristico.
 
Dimostrazione. Si ha PA′ (λ) = det A′ − λI  = det B −1 · A · B − λI =
det B −1 ·A·B − B −1 ·λI ·B = det B −1 ·(A − λI)·B = detB −1 ·det A − λI) ·det B =
det A − λI) = PA (λ) . 

In particolare, tutti i coefficienti del polinomio caratteristico sono invarianti per coniugio.
Poiché il termine noto ed ilcoefficiente di (−λ)n−1 sono rispettivamente determinante e
traccia, infatti det A − λI = (−λ)n + (−λ)n−1 tr (A) + ... + det (A) , si ha il seguente
corollario.

Corollario 15.15. Se A ed A′ sono due matrici coniugate, si ha

detA = det A′ ; tr A = tr A′

(ricordiamo che la traccia di una matrice è la somma degli elementi sulla diagonale).

Nel paragrafo § 13 sostanzialmente abbiamo introdotto il polinomio caratteristico come


oggetto associato a una matrice (cfr. Definizione 13.12). Il Lemma 15.14 è importante perché
ci consente di vedere il polinomio caratteristico come oggetto associato a una trasformazione
lineare. Vediamo meglio:
89

Osservazione 15.16. Data una trasformazione lineare T di uno spazio vettoriale V ,


possiamo scegliere una base di V . Corrispondentemente possiamo considerare la matrice
A rappresentativa di T rispetto alla base scelta, quindi possiamo considerare il polinomio
caratteristico di A . Se effettuiamo una scelta diversa, o, se preferite, se cambiamo la nostra
scelta, otteniamo una matrice A′ coniugata alla matrice A . Ora, il Lemma 15.14 ci dice che
matrici coniugate hanno lo stesso polinomio caratteristico. Questo significa che il polinomio
caratteristico non dipende dalla base di V che abbiamo scelto:
Data una trasformazione lineare T di uno spazio vettoriale V , ha perfettamente
senso parlare di polinomio caratteristico di T , quindi scrivere PT (λ) , pur senza
avere in mente la scelta di una base.
Il fatto che PT (λ) ha senso e dipende solo dalla geometria di T (lo ripetiamo, non dipende
dalla base di V che scegliamo per calcolarlo) ci dice che tutti i coefficienti di PT (λ) devono
avere una interpretazione geometrica. In particolare, determinante e traccia devono avere
una interpretazione geometrica (cfr. Corollario 15.15, cfr. anche § 16):
ha senso scrivere detT , come pure ha senso scrivere tr T , pur senza avere in
mente la scelta di una base.

Torniamo al problema della diagonalizzazione. Facciamo una premessa. Se


 
δ1 . . . 0
∆(δ1 , ..., δn ) :=  . .. 
0 . . . δn
è una matrice diagonale, i δi sono gli autovalori di ∆ e determinante e traccia di ∆ sono
rispettivamente uguali a prodotto e somma degli autovalori δi :

det ∆ = δ1 · ... · δn , tr ∆ = δ1 + ... + δn .

Inoltre, le molteplicità algebrica e geometrica di ogni autovalore δ coincidono, e sono uguali


al numero di volte che il valore δ compare tra i valori δ1 , ..., δn (questo è evidente, se non
vi sembra evidente dimostratelo per esercizio).

Corollario 15.17. Se A è una matrice diagonalizzabile,


i) il determinante detA è uguale al prodotto degli autovalori di A;
ii) la traccia tr A è uguale alla somma degli autovalori di A;
iii) le molteplicità algebrica e geometrica di ogni autovalore coincidono.

E’ bene ripeterlo: quando si calcola la somma degli autovalori (cosı̀ come quando se ne
calcola il prodotto), se un autovalore ha molteplicità µ, deve essere ripetuto µ volte.

Avvertenza 15.18. Il Corollario 15.17 non deve essere frainteso/usato male:


• inizia con un ”se”, la diagonalizzabiltà di una matrice non è affatto equivalente alle
proprietà i), ii) e iii). Si veda l’esempio (15.18′ ).
• al fine di provare che una data matrice è diagonalizzabile mi devo solo preoccupare di
stabilire l’esistenza di una base di autovettori (cfr. Prop. 15.2). In un certo senso,
delle proprietà i), ii) e iii) non me ne importa nulla! ...si veda l’esempio (15.18′′ ).

Esempio 15.18′ . Le matrici


     
0 1 0 0
0 −1 0 6 −3 2
1  −1 0 0 0
0 0 ,  11 −5 3 ,  
0 0 3 0
0 0 0 3 −1 1
0 0 0 5
90

soddisfano le proprietà i), ii) e iii) del Corollario 15.17. Ciò nonostante nessuna di esse è
diagonalizzabile. Lo studente verifichi quanto affermato. Il motivo per il quale le matrici
indicate non sono diagonalizzabili è che “non possiedono abbastanza autovalori”9.

Esempio 15.18′′ . Dovendo stabilire se le matrici


     
2 1 1 2 0 0 4 9 −3
A = 0 3 2 , B = 1 3 0 , Ck = 0 1 1 ,
0 0 2 3 3 2 0 0 k

sono diagonalizzabili (e per quali valori del parametro k) procediamo come segue:
risulta PA (λ) = PB (λ) = (2 − λ)2·(3 − λ) , sapendo che ad autovalori distinti corrispondono
autospazi indipendenti, di sicuro troviamo due autovettori indipendenti (uno per l’autovalore
2 ed uno per l’autovalore 3) e ci domandiamo se è possibile trovarne 3; la risposta dipen-
derà dalla molteplicità geometrica dell’autovalore 2 (che può valere 1 o 2, da notare che
l’autovalore 3 non può esserci d’aiuto, avendo molteplicità algebrica 1 avrà necessariamente
anche molteplicità geometrica 1, Teorema 13.17). Scrivendo A−2I e B−2I vediamo che la
prima non ha righe proporzionali (ha rango 2, quindi nucleo di dimensione 3-2=1), mentre
la seconda ha rango 1 (nucleo di dimensione 3-1=2). Ne segue che A non è diagonalizzabile
e che B invece lo è.
Riguardo alla matrice Ck il discorso è simile. Risulta PC (λ) = (4 − λ)·(1 − λ)·(k − λ) ,
ne segue che per k diverso da 4 e 1 abbiamo tre autovalori distinti (4, 1 e k), quindi
tre autovettori indipendenti, e Ck , è diagonalizzabile. Per k = 4 e per k = 1 scriviamo
Ck quindi procediamo esattamente come abbiamo fatto per le matrici A e B (troveremo
rg (C4 − 4I) = 1 e rg (C1 − I) = 2 , ovvero che C4 è diagonalizzabile e C1 non lo è). In
definitiva: “ Ck è diagonalizzabile” ⇐⇒ k 6= 1 .

Dimostrazione (del Corollario 15.17). Per ipotesi, la matrice A è coniugata ad una ma-
trice diagonale ∆ . Per la premessa, la matrice ∆ soddisfa i), ii) e iii). D’altro canto
A e ∆ hanno lo stesso polinomio caratteristico, in particolare, hanno stessi autovalori e
relative molteplicità algebriche e geometriche (queste ultime coincidono per ragioni geomet-
riche: perché A e ∆ rappresentano la stessa trasformazione lineare), stessa traccia e stesso
determinante. Ne segue che anche A soddisfa i), ii) e iii). 

Il polinomio caratteristico di una matrice A è un polinomio di grado uguale all’ordine


di A, trovarne le radici può essere difficile (e spesso è anche faticoso il solo scrivere il
polinomio caratteristico). Quindi, trovare gli autovalori di A, può essere un problema.
Nelle applicazioni pratiche questo problema viene spesso aggirato usando il Corollario 15.17.
Vediamo un esempio:
   
−7 3 1 4
Esercizio. Sia A =  4 −11 −2  e sia ~vt =  2  .
2 −3 −6 t

a) trovare un valore τ per il quale il vettore ~vτ è un autovettore di A ; b) determinare


il corrispondente autovalore λ nonché le molteplicità algebrica e geometrica di λ ;

9 Va detto che se si lavora sul campo C dei numeri complessi (si veda l’appendice), già la proprietà iii) da sola
è equivalente alla diagonalizzabiltà, questo segue dal Teorema Fondamentale dell’algebra: sui complessi, il
polinomio caratteristico si decompone in fattori di primo grado, quindi il suo grado (che è uguale all’ordine
della matrice) è uguale alla somma delle molteplicità delle sue radici (ricordiamo che tali radici sono gli
autovalori della matrice). Questo vale per le molteplicità algebriche, assumendo l’ipotesi che molteplicità
algebriche e geometriche coincidano, anche la somma delle molteplicità geometriche uguaglia l’ordine della
matrice e, alla luce del fatto che autospazi corrispondenti ad autovalori distinti sono indipendenti, ciò
garantisce l’esistenza di una base di autovettori. Da notare che lo stesso discorso non si può fare quando si
lavora sul campo R dei numeri reali perché un polinomio a coefficienti reali può contenere fattori di secondo
grado che non si decompongono.
91

c) trovare, se esistono, una matrice C ∈ M3, 3 (R) ed una matrice diagonale ∆ ∈ M3, 3 (R)
tali che C −1 · A · C = ∆ .
    
−7 3 1 4 t − 22
Soluzione. Calcoliamo il prodotto A · ~vt :  4 −11 −2  2  =  −2t − 6  .
2 −3 −6 t 2 − 6t
Il vettore ~vt è un autovettore di A se esiste un valore λ per il quale risulti
   
t − 22 4
 −2t − 6  = λ 2  .
2 − 6t t
Risolvendo il sistema indicato troviamo λ = −5 , τ = 2 .
L’autospazio associato all’autovalore λ = −5 è il nucleo della matrice
 
−2 3 1
A + 5I =  4 −6 −2  ,
2 −3 −1
ovvero è lo spazio delle soluzioni dell’equazione 2x − 3y − z = 0 (le tre righe della
matrice indicata sono chiaramente proporzionali tra loro, quindi il sistema omogeneo as-
sociato si riduce ad una sola equazione).  Risolvendo
  questa equazione troviamo una base
 3 1 
dell’autospazio V−5 : si ha BV−5 =  2 ,  0  .
 
0 2
Questo significa che V−5 ha dimensione 2 (quindi, per definizione di molteplicità geometrica,
la molteplicità geometrica dell’autovalore λ = −5 vale 2.
Se la matrice A è diagonalizzabile, anche la molteplicità algebrica dell’autovalore λ = −5
deve essere uguale a 2 nonché la somma degli autovalori deve essere uguale a -24 (che è
la traccia della matrice A) . In questo caso c’è un altro autovalore, che indicheremo con
µ , ed è dato dall’equazione −24 = −5 − 5 + µ , dalla quale troviamo µ = −14 , quindi
-14 avrà molteplicità algebrica e geometrica uguale a 1 e -5 avrà effettivamente molteplicità
algebrica uguale a 2 (la somma delle molteplicità, di quelle algebriche come pure di quelle
geometriche, non può superare 3). In questo caso l’autospazio V−14 associato all’autovalore
µ = −14 è lo spazio delle soluzioni del sistema lineare (A + 14I)~x = ~0 , ovvero è lo spazio
delle soluzioni del sistema lineare
    
7 3 1 x 0
 4 3 −2   y  =  0  .
2 −3 8 z 0

Tale sistema lineare ammette infinite soluzioni, questo conferma che -14 è effettivamente un
autovalore e che la situazione è quella descritta.
 
1
Risolvendo tale sistema troviamo che { −2 } è una base dell’autospazio V−14 .
−1
Infine, C e ∆ sono rispettivamente la matrice  di una base
 di autovettori
 e la matrice

3 1 1 −5 0 0
diagonale dei corrispondenti autovalori: C =  2 0 −2  , ∆ =  0 −5 0 .
0 2 −1 0 0 −14


Esercizio. Per ognuna delle matrici che seguono, determinare gli autovalori e calcolarne le
relative molteplicità algebriche e geometriche. Osservare che nessuna soddisfa la proprietà
iii) del Corollario 15.17, quindi dedurre che sono tutte matrici non diagonalizzabili.
     
      3 1 0 −2 1 0 11 0 8
1 1 2 1 3 4
, , ,  0 3 1  ,  0 −2 0  ,  0 7 0  ,
0 1 0 2 −1 7
0 0 3 0 0 3 −2 0 3
92
     
2 6 −2 0 0 1 1 5 3
 −2 −5 1  (sapendo che − 2 è un autovalore), 0 0 0 , 0 1 4 .
2 3 −3 0 0 0 0 0 1
Esercizio. Sia V lo spazio dei polinomi di grado minore o uguale a 93 e sia D : V −→ V
la funzione derivata. Determinare tutti gli autovalori di D e, per ognuno di essi, una base
del corrispondente autospazio (cfr. esempio 14.3).

Soluzione. Lavorare con un sistema di coordinate (cfr. esempio 14.3) vorrebbe dire cercare
autovalori ed autospazi di una matrice 94 × 94 !
...percorriamo una strada diversa: usiamo direttamente le definizioni.
Il polinomio p(x) è un autovettore se e solo se risulta Dp(x) = λp(x) per qualche λ ∈ R.
Sappiamo che il grado di Dp(x) è minore del grado di p(x), quindi non potrà esserne un
multiplo non nullo. In altri termini, nessun valore diverso da 0 può essere un autovalore.
L’equazione Dp(x) = 0 è soddisfatta solamente dai polinomi costanti. In definitiva: λ = 0
è l’unico autovalore e l’insieme {1} è una base del corrispondente autospazio.


Concludiamo il paragrafo vedendo come la “geometria” può essere utilizzata per risolvere
un problema algebrico: quello di calcolare la potenza n-esima An di una matrice A.

Sia A ∈ Mk, k (R) una matrice. Vista la natura del prodotto righe per colonne il calcolo
di An risulta difficile per n grande o arbitrario. Esiste però un metodo che sostanzialmente
riduce il problema a quello di trovare una matrice “semplice” coniugata ad A. L’idea
è quella di considerare A come trasformazione lineare di Rk , scriverla rispetto ad una
base conveniente quindi passare alla composizione con se stessa n-volte ed infine passare
alla matrice che rappresenta quest’ultima rispetto alla base canonica di Rk . Nell’esercizio
svolto 15.20 vediamo come calcolare la potenza An di una matrice diagonalizzabile A.
Prima di procedere deve essere ben chiaro quanto segue:
i) non esistono formule generali per la potenza n-esima An ;
ii) se ∆ è una matrice diagonale il calcolo di ∆n è immediato (esercizio 15.19).

Esercizio 15.19. Verificare che la potenza ∆n di una matrice diagonale ∆ è la la matrice


(sempre diagonale) delle potenze n-esime degli elementi di ∆ .

Si osservi alla luce dell’osservazione 13.18 non potrebbe essere diversamente: indicando
con m l’ordine di ∆ ed interpretandola come trasformazione di Rm , cioè considerando
L∆ come nella Def. 12.5), la formula (12.18) ci dice che la potenza ∆n corrisponde
(cfr. Prop. 12.16) alla composizione L∆ ◦ ... ◦ L∆ (n-volte). D’altro canto, sempre per
l’osservazione 13.18, la base canonica di Rm è una base di autovettori della composizione in
questione (come lo è per la trasformazione L∆ stessa) ed i corrispondenti autovalori sono
le potenze n-esime di quelli di L∆ .
 
11 6
Esercizio 15.20. Sia A = . Calcolare A80 .
−18 −10
Soluzione. Naturalmente potremmo armarci di pazienza e svolgere semplicemente il prodotto
di A per se stessa 80 volte. No, percorriamo un’altra strada: consideriamo la trasformazione
lineare LA : R2 → R2 e ne troviamo le direzioni privilegiate, utilizzando queste calcoliamo
la composizione LA ◦ ... ◦ LA (80-volte), infine scriviamo la matrice rappresentativa di
questa composizione.
Il polinomio caratteristico della trasformazione LA è il polinomio
 
11 − λ 6
det = λ2 − λ − 2 = (λ − 2)(λ + 1) ,
−18 −10 − λ
quindi gli autovalori di LA sono i valori λ = 2 e λ = −1 . I corrispondenti autospazi
93

sono    
9 6 2
V2 = ker(A − 2I) = ker = Span{ };
−18 −12 −3
   
12 6 −1
V−1 = ker(A + I) = ker = Span{ }.
−18 −9 2
   
2 −1
Rispetto alla base di autovettori B = { , } la trasformazione LA è rappre-
−3 2  
2 0
sentata dalla matrice diagonale degli autovalori ∆ = , quindi la composizione
0 −1
LA ◦ ... ◦ LA (80-volte)
 80 è rappresentata
 (sempre rispetto alla base di autovettori) dalla
80 2 0
matrice ∆ = (vedi esercizio 15.19).
0 (−1)80
A questo punto, effettuando un cambiamento di base troviamo la matrice che rappresenta
LA ◦ ... ◦ LA (80-volte) rispetto alla base canonica di R2 (tale matrice è A80 ):
   80   −1  
2 −1 2 0 2 −1 282 −3 281 −2
A80 = · · =
−3 2 0 (−1)80 −3 2 −3·2 +6 −3·280 +4
81

Non abbiamo voluto dirlo prima... ma da un punto di vista algebrico quello che abbiamo
fatto èassolutamente
 elementare: diagonalizzando A si trova ∆ = B −1· A · B , dove
2 −1 2 0
B = è la matrice di una base di autovettori, ∆ = è la matrice
−3 2 0 −1
diagonale dei corrispondenti autovalori. Quindi,

A = B · ∆ · B −1 ,

i.e.        −1
11 6 2 −1 2 0 2 −1
= · · .
−18 −10 −3 2 0 −1 −3 2

Dall’equazione A = B · ∆ · B −1 ricaviamo A80 :


80      
A80 = B · ∆ · B −1 = B · ∆ ·B −1 · B · ∆ ·B −1 · B · ∆ ·B −1 · ... · B · ∆ · B −1
= B · ∆80 · B −1

(il vantaggio è che, essendo ∆ una matrice diagonale, la potenza ∆80 la sappiamo calcolare:
basta elevare alla 80 gli elementi sulla diagonale).
94

§16. Approfondimenti.

Sostanzialmente, questo paragrafo completa i paragrafi precedenti. Qui raccogliamo al-


cune generalizzazioni e alcune osservazioni riguardanti gli argomenti trattati finora che per
una qualche ragione non abbiamo voluto inserire prima. I motivi di una tale scelta possono
essere diversi, i risultati che abbiamo scelto di rimandare a questo paragrafo possono essere
di diverso tipo: più avanzati; che collegano e mettono insieme argomenti diversi; marginali
sebbene interessanti; strumentali sebbene non indispensabili; piuttosto tecnici, il cui inseri-
mento avrebbe inutilmente appesantito il discorso o semplicemente distolto l’attenzione da
quello che si stava facendo; risultati che sebbene comprensibili anche a uno stadio prece-
dente della trattazione non sarebbero stati apprezzati nella misura adeguata. Naturalmente
la lettura di questo paragrafo richiede da parte dello studente uno sforzo maggiore!

Iniziamo col discutere alcuni risultati sulle permutazioni, risultati strumentali ad una
trattazione più approfondita di quelli che sono gli aspetti algebrici del determinante.

Sulle permutazioni.

Definizione 16.1. Sia I un insieme. Una permutazione di I è una funzione biunivoca


σ : I −→ I

Il nome “permutazione” viene dal fatto che posso pensare che gli elementi del mio insieme
abbiano una posizione e che io li stia spostando, o meglio, permutando (porto l’elemento i
nel posto che era occupato da σ(i), la biunivocità mi garantisce “un posto a disposizione”
per ogni elemento).

Fissati a, b ∈ I , la permutazione di I definita da σ(a) = b , σ(b) = a e che lascia


invariati tutti gli altri elementi di I si chiama scambio. Tale scambio lo denoto con σa, b .

Ogni permutazione di un insieme finito può essere ottenuta effettuando un certo numero
di scambi, ovvero può essere scritta come composizione di scambi. Il numero di scambi che
intervengono in una tale scrittura non è ben definito, ma il suo essere pari o dispari lo è.
Questo fatto, che dimostro tra poco, permette di dare la definizione che segue.

Definizione 16.2. Data una permutazione σ di un insieme finito I si definisce il suo


segno ǫ(σ) ponendo ǫ(σ) = 1 se σ è ottenibile come composizione di scambi in numero
pari, ǫ(σ) = −1 se σ è ottenibile come composizione di scambi in numero dispari.

Ad esempio, dati a, b, c ∈ I , abbiamo σa, b = σb, c ◦ σa, b ◦ σa, c , dove “◦” denota la
composizione di funzioni. Notiamo che abbiamo scritto uno scambio come composizione di
tre scambi.

Un corollario interessante, e che ci servirà, del fatto che il segno di una permutazione è
ben definito è il seguente:

Corollario 16.4 Dato un insieme, ogni scambio può essere scritto esclusivamente come
composizione di un numero dispari di scambi.

Faccio notare che, tornando a considerare insiemi i cui elementi occupano una posizione
e assumendo di numerare queste posizioni, si ha che la permutazione che scambia due ele-
menti scelti in modo arbitrario può essere scritta utilizzando un solo scambio e, essendo 1
dispari, esclusivamente come composizione di un numero dispari di scambi, e quindi, a mag-
gior ragione, esclusivamente come composizione di un numero dispari di scambi di elementi
adiacenti. ...tanto per fissare le idee e passare a quello che ci interessa:

Esercizio 16.5. Data una matrice, scrivete lo scambio della prima riga con la quarta come
95

composizione di 5 scambi di righe adiacenti (con meno è impossibile); scrivete lo scambio


della prima riga con la quinta come composizione di 7 scambi di righe adiacenti (con meno
è impossibile).

Dimostrazione (del fatto che il segno di una permutazione è ben definito). L’inversa di
σa, b è sempre σa, b , quindi l’inversa di una composizione di scambi è la composizione degli
stessi scambi ordinati a partire dall’ultimo. Quindi, se due composizioni di scambi s1 ◦...◦sk
e r1 ◦...◦rh producono la stessa permutazione σ, possiamo scrivere la permutazione identica
nella forma σ ◦σ −1 = s1 ◦...◦sk ◦rh ◦...◦r1 . Di conseguenza, sarà sufficiente dimostrare che
la trasformazione identica può essere scritta esclusivamente come composizione di un numero
pari di scambi (infatti, k + h è pari se e solo se k ed h sono entrambi pari oppure entrambi
dispari). Ora, ragioniamo per induzione sul numero di elementi dell’insieme I . Sia dunque
I = {a, 1, 2, ..., n} e sia t1 ◦ ... ◦ tm una composizione di scambi uguale alla permutazione
identica di I . Dobbiamo provare che m è pari. Definiamo J = {1, 2, ..., n} e fissiamo
un ordine per il posto occupato dagli elementi di I . Ad ogni ti associamo la permutazione
pi di J indotta sull’ordine dei suoi elementi, ad esempio se ti = (3, 4, 2, a, 1, 5) 7→
(a, 4, 2, 3, 1, 5) allora pi = (3, 4, 2, 1, 5) 7→ (4, 2, 3, 1, 5) . Osserviamo che pi non è
necessariamente uno scambio. Posto ℓi = “lunghezza del salto di posizione di a”, pi è uno
scambio se ℓi = 0 , i.e. ti non coinvolge l’elemento a, e si può scrivere come composizione di
ℓi −1 scambi se ℓi ≥ 1 (ti coinvolge a). Poiché ogni P elemento di I dopo la sua passeggiata
torna nella sua posizione iniziale abbiamo che ℓi è pari nonché la composizione delle
pi è l’identità. A questo punto abbiamo concluso:Pm posto αi = 1 se P ℓi = 0 e posto
m
αi = ℓi − 1 se ℓi 6= 0 , abbiamo che m = i=1 1 è pari se e solo se i=1 αi è pari.
D’altro canto, quest’ultimo numero è uguale al numero di scambi di una scrittura della
permutazione identica di J , numero che, essendo J un insieme che ha meno elementi di I ,
è necessariamente pari per l’ipotesi induttiva. 

Sugli aspetti algebrici del determinante.

Sia A = (ai,j ) ∈ Mn,n (R) una matrice quadrata di ordine n. Dalla (5.2′ ) si evince
che detA è un polinomio negli ai,j . Affermo che i monomi che lo costituiscono sono,
a meno del segno, tutti i prodotti di n elementi della matrice che stanno sia su righe
che su colonne distinte. Questa affermazione segue di nuovo dalla (5.2′ ). Ragioniamo per
induzione: premesso che quanto affermato è banalmente vero per le matrici 1 × 1 , visto che
nella (5.2′ ) il termine a1,j si scontra con det C1,j (per ogni i, j), essendo C1,j la matrice
ottenuta cancellando proprio la riga e la colonna corrispondente a a1,j , questo termine
non può scontrarsi con termini che stanno sulla sua stessa riga o colonna. D’altro canto
anche nei monomi di detC1,j non possono esserci due termini che stanno sulla stessa riga
o colonna (questa volta per l’ipotesi induttiva). Quindi, di fatto, in ogni a1,j ·detC1,j non
ci sono prodotti con due elementi sulla stessa riga o colonna. Inoltre, come già osservato,
det A è un polinomio costituito da n! monomi (di grado n) ed i monomi di grado n che
si possono scrivere considerando prodotti di elementi che stanno su righe e colonne distinte
sono esattamente10 in numero uguale ad n! (n fattoriale). Di conseguenza, necessariamente,
det A deve contenerli tutti.

Con un pizzico di lavoro in più, che a questo punto però ce lo risparmiamo per non
appesantire il discorso, non è difficile comprendere anche quali sono i segni davanti a tali
monomi e in definitiva provare la prossima proposizione.
10 Questa affermazione segue dalla teoria delle permutazioni. Infatti, le scelte di n elementi su righe e colonne
distinte si ottengono scegliendo un elemento da ogni colonna, ovvero una riga per ogni colonna, senza però
poter scegliere due volte la stessa riga. Considerando la prima colonna abbiamo n scelte a disposizione,
considerando la seconda colonna ne abbiamo n − 1 , considerando la terza colonna ne abbiamo n − 2 e cosı̀
via. In definitiva abbiamo n · (n − 1) · (n − 2) · ... · 3 · 2 · 1 = n! scelte a disposizione. Notiamo che tali
scelte sono sequenze {i1 , ..., in } (essendo ij la riga scelta per la colonna j ), trattandosi di sequenze senza
ripetizioni corrispondono alle permutazioni dell’insieme {1, ..., n} .
96

Proposizione 16.6. Si abbia A = (ai,j ) ∈ Mn,n (R) . Si ha


X
(16.6′ ) det (A) = ǫ(σ) · a1,σ(1) · a2,σ(2) · ... · an,σ(n) ,
σ∈Sn

dove Sn è l’insieme delle permutazioni dei primi n interi {1, ..., n} , e dove ǫ(σ) è il
segno della permutazione σ .

Lo studente non si deve spaventare perché non dovrà mai impelagarsi con il formalismo di
questa formula. Il motivo per cui abbiamo voluto enunciarla è per ribadire lo straordinario
“ordine” della funzione determinante. In particolare, per ribadire, usando il linguaggio di
una formula, la (16.6′ ) appunto, il fatto già menzionato che il determinante è il polinomio
(omogeneo, di grado n) nelle variabili ai,j i cui monomi che lo costituiscono sono (a meno
del segno) i prodotti di n elementi della matrice che stanno sia su righe che su colonne
distinte.

Un altro vantaggio della (16.6′ ) è che è possibile ricondurvi entrambe le formule nella
(5.4′ ). Infatti, fissato un valore di k entrambe le espressioni nella (5.4′ ), cosı̀ come la
(5.2′ ) e per gli stessi motivi, si vedano le considerazioni che precedono la Proposizione 16.6,
coincidono con la (16.6′ ) a meno dei segni davanti i vari monomi. Ragionando per induzione
non è difficile verificare che anche i segni sono gli stessi.

Quanto detto dimostra la Proposizione 5.4: il determinante di una matrice può essere
calcolato mediante lo sviluppo di Laplace rispetto a una qualsiasi riga o colonna.

Ora passiamo ad un altro aspetto della funzione determinante. L’antisimmetria e la multi-


linearità (Lemmi 5.7 e 5.8), insieme al fatto che il determinante della matrice identica vale 1,
oltre ad essere proprietà importanti ed utili hanno il pregio di caratterizzare il determinante,
più precisamente vale la proposizione che segue.

Proposizione 16.7. Esiste una unica funzione F definita su Mn,n (R) tale che
i) F è multilineare rispetto alle righe di Mn,n (R) ;
ii) F è antisimmetrica rispetto alle righe di Mn,n (R) ;
iii) F (In ) = 1 , dove In è la matrice identica.

Tale funzione è la funzione determinante.

Dimostrazione. Per quel che riguarda l’esistenza di una tale F è stato già detto tutto: la
funzione determinante soddisfa i), ii) e iii).
L’unicità segue dal fatto che è possibile calcolare il determinante di una matrice qualsiasi
utilizzando unicamente le proprietà i), ii) e iii). Vediamo come: sia dunque A una matrice e
sia F una funzione che soddisfa le proprietà i), ii) e iii). In particolare, le varie proprietà
che sono soddisfatte dalla funzione F ci dicono come cambia F (A) quando effettuiamo
uno dei passi dell’eliminazione di Gauss (2.1). A questo punto l’osservazione che conclude
la dimostrazione è il fatto che tramite i passi dell’eliminazione di Gauss (2.1) è possibile
trasformare qualsiasi matrice in una matrice che ha una riga di zeri oppure nella matrice
identica. Nel primo caso si ha F (A) = 0 (segue dalla multilinearità, il ragionamento è quello
fatto quando abbiamo dimostrato la 5.11.d). Nel secondo caso siamo ugualmente in grado
di dire quanto vale F (A) : basta che ci ricordiamo delle costanti (non nulle) che avremo
fatto intervenire nell’applicare l’E.G. che trasforma A nella matrice identica e del numero
degli eventuali scambi di righe effettuati. Si osservi che usiamo l’ipotesi F (In ) = 1 . Poiché
in entrambi (tutti) i casi siamo stati capaci di calcolare F (A) utilizzando solo le proprietà
che avevamo a disposizione, F è unica. 

Come applicazione dei risultati visti, vediamo due dimostrazioni del teorema di Binet.
Una premessa: alla fine del paragrafo § 5 abbiamo osservato che come conseguenza del
97

teorema di Binet il determinante di una matrice invertibile non può annullarsi. Tuttavia
questo risultato non lo abbiamo utilizzato. Dunque, siano A, B ∈ Mn, n (R) due matrici.
Si vuole dimostrare che det (A · B) = detA · detB .

Dimostrazione #1 (del teorema di Binet). Distinguiamo due possibilità:


Caso i): det A = 0 . Per l’osservazione (5.12), le righe di A sono dipendenti. Lo stesso
accade per il prodotto A · B , che avrà anch’esso determinante nullo di nuovo per la (5.12).
Caso ii): det A 6= 0 . Nel paragrafo § 3 abbiamo introdotto le matrici elementari ed abbiamo
osservato che le moltiplicazioni a sinistra per le matrici elementari sono equivalenti ai passi
dell’E.G.. D’altro canto sappiamo che tramite l’E.G. possiamo trasformare A nella matrice
identica, questo significa che è possibile scrivere A = E1 ·...·Eh , dove le Ei sono matrici ele-
mentari. Quindi per ragioni induttive è sufficiente dimostrare che det(E ·B) = det E ·det B ,
essendo E una matrice elementare. L’espressione det E · det B è facile da calcolare: i deter-
minanti delle matrici elementari di tipo i), ii) e iii) (cfr. def. 3.16) valgono rispettivamente
λ, 1 e −1 . D’altro canto la moltiplicazione per una matrice elementare E , ora vista come
operazione su B , è un passo dell’E.G., e le affermazioni (5.11 a), (5.11 b) e (5.11 c) ci dicono
che il termine det (E · B) vale quanto desiderato. Questo conclude la dimostrazione. 

Nota: non abbiamo voluto appesantire la dimostrazione ma, ad essere precisi, scrivere
A = E1 · ... · Eh richiede un minimo di lavoro: la Proposizione 2.1 ci dice che possiamo
scrivere A = E1 · ... · Ej · T , dove le Ei sono matrici elementari e T è una matrice a scala,
quindi (trattandosi di una matrice quadrata) triangolare. D’altro canto, poiché det A 6= 0
per ipotesi, T è una matrice triangolare senza zeri sulla diagonale e, sempre con i passi
dell’E.G., può essere trasformata nell’identità cosı̀ come abbiamo fatto nell’esempio 6.3.

Dimostrazione #2 (del teorema di Binet). Il caso in cui det B = 0 lo trattiamo come nella
dimostrazione precedente (una colonna di A·B sarà c.l. delle altre, quindi il determinante
del prodotto A·B sarà nullo). Assumendo det B 6= 0 , consideriamo la funzione
det (M · B)
F (M ) := .
det B
Per la Proposizione 16.7 è sufficiente provare che questa funzione soddisfa le proprietà i), ii)
e iii) ivi indicate. La iii) è ovvia; la ii) segue dal fatto che scambiare due righe di M
equivale a scambiare due righe del prodotto M · B ; la i) vale per un motivo analogo: se
fissiamo tutti gli elementi di M eccetto quelli sulla j −esima riga, che indicherò con ~r , la
funzione ~r 7→ “j −esima riga di M ·B ” è lineare. 

Sull’inversa di una matrice.

Nel paragrafo §4 abbiamo enunciato la seguente proposizione (Proposizione 4.3).

Proposizione. Siano A e B due matrici quadrate di ordine n . Si ha che A · B = In


se e solo se B · A = In . L’inversa di una matrice, se esiste, è unica.

Ora la dimostriamo utilizzando solamente gli strumenti che avevamo a disposizione a quel
punto della trattazione.

Dimostrazione. Innanzi tutto osserviamo che, potendo scambiare i ruoli di A e B ,


è sufficiente dimostrare che se A · B = In allora B · A = In . Questo segue da tre
affermazioni:
i) se A · B = In , allora B · A · w
~ = w ~ per ogni w ~ = B · ~x ;
~ del tipo w
~ ∈ Mn,1 (R) è del tipo indicato;
ii) ogni elemento w
iii) se X · w
~ = w
~ per ogni w~ allora X è la matrice identica In .
La i) è facile: si ha B · A · (B · ~x) = B · (A · B) · ~x = B · In · ~x = B · ~x .
98

La ii) è più sottile: si deve dimostrare che, per ogni w ~ ∈ Mn,1 (R) , il sistema lineare
B · ~x = w ~ è necessariamente compatibile. Ora, immaginiamo di effettuare la riduzione a
scala di B . Se per assurdo il sistema in questione è incompatibile, la riduzione a scala di B
(matrice incompleta associata al sistema) deve produrre una riga di zeri. D’altro canto B è
quadrata, quindi avendo una riga di zeri ha meno di n pivot, quindi le soluzioni del sistema
omogeneo B · ~x = ~0 dipendono da almeno un parametro libero. Ma questo è assurdo
perché il sistema B · ~x = ~0 ammette al più una sola soluzione, infatti B · ~x = ~0 implica
~x = A · ~0 = ~0 (abbiamo moltiplicato a sinistra per A e usato l’ipotesi A · B = In ).
Infine, la iii) è ovvia. 

Ora rileggiamo il tutto in termini di applicazioni lineari. Interpretiamo A e B come


trasformazioni lineari di Rn , dunque consideriamo

LA : Rn −→ Rn , LB : Rn −→ Rn ,

(cfr. Definizione 12.5). La condizione A · B = In si traduce nella condizione che la


composizione LA ◦ LB è l’applicazione identica. La proposizione, oltre a valere per Rn ,
continua a valere per spazi vettoriali dei quali Rn ne è un modello (cioè per gli spazi vettoriali
finitamente generati, che sono gli unici che abbiamo studiato):

Proposizione 16.8. Siano T ed S due trasformazioni lineari di uno spazio vettoriale V


finitamente generato. Indichiamo con I : V → V l’identità. Si ha che

T ◦S = I se e solo se S◦T = I.

Anche la dimostrazione di questa proposizione è una rilettura della dimostrazione vista


sopra. Si osservi che i′ ), ii′ ) e iii′ ) sono la traduzione di i), ii) e iii).

Dimostrazione. Potendo scambiare i ruoli di T ed S , è sufficiente dimostrare che se


T ◦ S = I allora S ◦ T = I . Questo segue da tre affermazioni:
i′ ) se T ◦ S = I allora la restrizione di S ◦ T all’immagine di S è l’identità;
ii′ ) S è suriettiva;

iii′ ) se S ◦ T (~v ) = ~v per ogni ~v ∈ V , allora S ◦ T = I .

La i′ ) è facile: se ~u appartiene all’immagine di S , e.g. ~u = S(~v ) , si ha


  
(S ◦ T )(~u) = S ◦ T (S(~v )) = S (T ◦ S)(~v ) = S I(~v ) = S(~v ) = ~u .

La ii′ ) è più sottile: essendo T ◦ S l’identità, abbiamo che S è iniettiva (se per assurdo
esistesse ~v 6= ~0 tale che S(~v ) = ~0 si avrebbe anche ~v = I(~v ) = T (S(~v )) = ~0 ). Poiché S
è iniettiva, deve essere necessariamente anche suriettiva (vedi l’osservazione a pagina 48).
La iii′ ) è una tautologia. 

Abbiamo sempre lavorato con spazi vettoriali di dimensione finita (ovvero finitamente
generati). Enunciando la Proposizione 16.8 abbiamo voluto sottolineare questa ipotesi
perché nel caso degli spazi vettoriali di dimensione infinita la tesi della proposizione è falsa.
In effetti, in dimensione infinita i′ ) e iii′ ) continuano a valere (e le dimostrazioni non cam-
biano). Ma la ii′ ) non vale più, si può solamente dire che S è iniettiva e T è suriettiva. In
dimensione infinita “l’invertibilità a destra” non implica “l’invertibilità a sinistra”. E non è
difficile fornire un controesempio: sia V lo spazio vettoriale di tutti i polinomi, T : V → V
la trasformazione che al polinomio p(x) associa la sua derivata,
Rx sia inoltre S : V → V la
trasformazione che al polinomio p(x) associa l’integrale 0 p(·) (che è anch’esso un poli-
nomio). Le trasformazioni T ed S sono entrambe lineari (per esercizio, lo si verifichi). Si
99

ha T ◦ S = I (se prima integro e poi derivo ritrovo il polinomio dal quale ero partito), ma
la composizione S ◦ T fa fuori le costanti, infatti S ◦ T è l’applicazione che al polinomio
p(x) associa il polinomio p(x) − p(0) (questo è facile, verificatelo!).

Vale la pena osservare che questo discorso appartiene a un contesto più ampio, quello
dell’insiemistica: siamo A e B due insiemi e siamo f : A → B e g : B → A due funzioni.
Supponiamo che la composizione g ◦ f sia l’identità su A. Allora:
• f è iniettiva;
• g è suriettiva;
• la restrizione della composizione f ◦ g all’immagine di f è l’identità.

Se inoltre B è un insieme finito11 di cardinalità non superiore a quella di A , allora f e


g sono entrambe biunivoche nonché sono l’una l’inversa dell’altra, in particolare f ◦ g è
l’identità su B.

Esercizio. Dimostrare le affermazioni precedenti (un po’ di insiemistica non fa mai male).

Nel § 6 abbiamo visto che (Teorema 6.1) una matrice A ∈ Mn,n (R) è invertibile se e
solo se det A 6= 0 e che, se A è invertibile, si ha

 det Cj,i
(⋆) A−1 i,j
= (−1)i+j · ,
det A

dove Cj,i è la matrice ottenuta da A sopprimendo la j -esima riga e la i-esima colonna. Ora
dimostriamo quanto affermato.

Dimostrazione. Come già osservato nel §6, il non annullarsi del determinante è una con-
dizione necessaria per l’invertibilità di A . Quindi, sarà sufficiente dimostrare che il prodotto
di A per la matrice indicata in (⋆) è la matrice identica. Verifichiamo quindi che A · X =
det C
In , essendo X la matrice Xi, j = (−1)i+j · det Aj,i . L’elemento di posto i, j della matrice
in questione è
n
X n
X  
 t+j detCj,t
A·X i, j
= Ai, t · Xt, j = Ai, t · (−1) ·
t=1 t=1
det A
n
1 X 
= Ai, t · (−1)t+j · det Cj,t
detA t=1

Ora, guardando meglio l’espressione trovata ci accorgiamo che questa ha la faccia uno svi-
luppo di Laplace, più precisamente, sotto il segno di sommatoria c’è lo sviluppo di Laplace
del determinante della matrice ottenuta sostituendo la j esima riga di A con la iesima riga
di A !!! Quindi,
det A 0
se j = i si ottiene det A = 1 ; se j 6= i si ottiene12 det A = 0.
...questa non è altro che la definizione della matrice identica! 

11 L’ipotesi di finitezza è necessaria, non basterebbe neanche supporre B = A . Riflettete sull’esempio


A = B = Z (l’insieme dei numeri interi), f (x) = 2x , g(x) = x/2 se x è pari, g(x) = 0 se x è dispari.
12 Viene 0 perché si tratta dello sviluppo del determinante di una matrice che ha due righe uguali.
100

Sull’indipendenza lineare degli autospazi.

Nel paragrafo §13 abbiamo affermato che


“autospazi corrispondenti ad autovalori distinti sono indipendenti”
(cfr. Teorema 13.9). Ora dimostriamo quanto affermato.

Dimostrazione. Effettuiamo una dimostrazione per induzione sul numero degli autospazi
in questione. Siano dunque ~v1 , ..., ~vk autovettori corrispondenti ad autovalori λ1 , ..., λk
distinti. Assumiamo k ≥ 2 (per k = 1 la tesi è banale) e che ogni insieme costituito da k −1
autovettori è un insieme indipendente di vettori (ipotesi induttiva). Si vuole dimostrare che
~v1 , ..., ~vk sono indipendenti. Ragioniamo per assurdo, supponiamo che esista una relazione
non banale di coefficienti tutti non nulli (altrimenti abbiamo anche una relazione non banale
tra meno di k autovettori e questo contraddice l’ipotesi induttiva)

(⋆) c1~v1 + ... + ck~vk = ~0

Poiché T (c1~v1 + ... + ck ~vk ) = λ1 c1~v1 + ... + λk ck~vk , si ha anche

(⋆′ ) λ1 c1~v1 + ... + λk ck ~vk = ~0

Sottraendo alla relazione (⋆′ ) la relazione (⋆) moltiplicata per λk troviamo

(λ1 − λk )c1 ~v1 + ... + (λk−1 − λk )ck−1 ~vk−1 = ~0

Essendo i λi distinti ed essendo i ci non nulli, anche i prodotti (λi −λk )ci (per i < k) sono
non nulli. In particolare si ha una relazione non banale tra i vettori ~v1 , ..., ~vk−1 . Questo
contraddice il fatto che per ipotesi induttiva tali vettori sono indipendenti. 

Esercizio 16.9. Sia V uno spazio vettoriale e siano W1 , ..., Wk sottospazi di V .


Dimostrare che i sottospazi W1 , ..., Wk sono indipendenti (secondo la definizione data
nell’inciso 13.10) se e solo se vale l’uguaglianza che segue

dim W1 + ... + Wk = dim W1 + ... + dim Wk ,

dove W1 + ... + Wk è lo spazio somma (cfr. Definizione 10.1):



W1 + ... + Wk := w ~k w
~ 1 + ... + w ~ i ∈ Wi ⊆ V .

Si noti che alcuni dei sottospazi Wi possono anche essere di dimensione zero, cioè costituiti
solamente dal vettore nullo (rileggete con attenzione la definizione citata).
101

Sulla disuguaglianza µg (α) ≤ µa (α) .

Come promesso nel § 13, dimostriamo il Teorema 13.17. Stabiliamo una premessa.

La definizione di molteplicità algebrica di un autovalore (cfr. Definizione 13.16), è stata


data per le trasformazioni di Rn , ma alla luce dell’osservazione 15.16 è chiaro che si es-
tende alle trasformazioni di uno spazio vettoriale astratto: data una trasformazione lineare
T di uno spazio vettoriale astratto V , scriviamo la matrice rappresentativa di T rispetto
a una base qualsiasi di V , quindi definiamo la molteplicità algebrica di un autovalore po-
nendola uguale alla sua molteplicità come radice del polinomio caratteristico. Come dicevo,
per l’osservazione 15.16, il polinomio caratteristico, e a maggior ragione la molteplicità in
questione, non dipende dalla base di V che abbiamo scelto per scrivere la matrice rappre-
sentativa di T . Naturalmente, anche la definizione di molteplicità geometrica si estende al
caso di una trasformazione di uno spazio vettoriale astratto: la molteplicità geometrica di
un autovalore è la dimensione del corrispondente autospazio.

Sia dunque V uno spazio vettoriale di dimensione n , sia T : V → V una trasfor-


mazione lineare e sia α un autovalore. Si vuole dimostrare la disuguaglianza che segue
(Teorema 13.17):
µg (α) ≤ µa (α) .

Dimostrazione. Posto d = µg (α) , sia {~v1 , ..., ~vd } una base dell’autospazio Vα e sia

B = {~v1 , ..., ~vd , ~bd+1 , ..., ~bn }

un completamento di tale base a una base di V . Affermiamo che, rispetto alla base B , la
trasformazione T è rappresentata da una matrice del tipo
 
α 0 0 ... 0 ⋆ ... ⋆
0 α 0 ... 0 ⋆ ... ⋆
 
0 0 α ... 0 ⋆ ... ⋆
. .. .. .. 
. . 
. . .
 
A = 0 0 0 ... α ⋆ ... ⋆ ,
 
 
 
0 0 0 ... 0 ⋆ ... ⋆
. .. .. .. 
 .. . . .
0 0 0 ... 0 ⋆ ... ⋆

dove gli asterischi indicano numeri che non conosciamo e dove il blocco in alto a sinis-
tra, quello dove appare α lungo la diagonale principale, è una matrice quadrata d × d
(sotto questo blocco ci sono tutti zeri, le ultime n − d colonne di A non le conosciamo).
L’affermazione fatta si giustifica facilmente ricordando che nelle colonne di A troviamo
le coordinate delle immagini dei vettori della base: nella prima colonna di A ci sono le
coordinate di T (~v1 ) = α~v1 , eccetera.
A questo punto è chiaro che il polinomio caratteristico di A , è un polinomio del tipo
indicato nella formula che segue:

det A − λI = (α − λ) · ... · (α − λ) · q(λ) ,
| {z }
d volte

dove q(λ) è un polinomio di grado n − d (del quale non sappiamo dire nulla). Questo ci
garantisce che la molteplicità algebrica dell’autovalore α è maggiore o uguale a d . 
102

Sulle applicazioni lineari e sull’uso delle matrici.

Siano V e W spazi vettoriali e sia T : V → W una applicazione lineare. Sia inoltre


A la matrice rappresentativa di T relativa alle basi {~v1 , ..., ~vn } di V e {w ~m}
~ 1 , ..., w
di W . In termini delle coordinate associate a tali basi, il fatto che A rappresenta T , per
definizione, significa che T è caratterizzata dalla proprietà che segue
La legge che alle coordinate di un vettore ~v associa le coordinate della sua immagine
T (~v ) è la moltiplicazione per la matrice A
(si osservi che, conseguentemente, le coordinate dell’immagine del vettore vi sono scritte
nella i-esima colonna di A).

Apriamo una breve parentesi per introdurre una nuova notazione. Il vettore ~v ∈ V di
~ ∈ W di coordinate β1 , ..., βm , per definizione, sono
coordinate λ1 , ..., λn e il vettore w
rispettivamente i vettori
n
X m
X
(16.10) ~v = λi ~vi , w
~ = βi w
~i
i=1 i=1

Queste espressioni la scriviamo utilizzando il formalismo del prodotto “righe per colonne”
(capisco che possa dare fastidio scrivere una matrice i cui elementi sono vettori... ma qual è
il problema! si tratta semplicemente di una notazione che mi consente di evitare di scrivere
fastidiose sommatorie):

(16.11) ~v = v · ~λ , ~,
~ = w·β
w

dove abbiamo posto  


 
λ1 β1
~λ :=  ..  ,  
v := (~v1 , ..., ~vn ) , . w := (w~ 1 , ..., w
~ m) , β~ :=  ...  ,
λn βm
e dove tutti i prodotti sono prodotti “righe per colonne”. Lo ripetiamo: v = (~v1 , ..., ~vn )
e w = (w ~ m ) sono matrici vettoriali (risp. 1 × n ed 1 × m), mentre ~λ e β
~ 1 , ..., w ~ sono
matrici numeriche (risp. n × 1 ed m × 1).

Ora, per definizione di matrice rappresentativa, il fatto che A rappresenta T si traduce


dicendo che le coordinate del vettore T (~v ) sono date dal prodotto A · ~λ. Posto w
~ := T (~v ) ,
mantenendo la notazione precedente abbiamo

β~ = A · ~λ

Quindi, usando la notazione (16.11), l’identità T (~v) = w


~ la possiamo riscrivere come segue:

(16.12) T v · ~λ = w · A · ~λ , .

Ora che abbiamo scritto in termini più intrinseci chi è l’applicazione T , il problema
di trovare la matrice rappresentativa A′ di T rispetto a delle basi {~ v ′1 , ..., v~ ′m } di V e
′ ′
{w ~ m } di W è ridotto ad un semplice conto formale che coinvolge il prodotto tra
~ 1 , ..., w
matrici. Ricaveremo A′ confrontando le due equazioni
 
(16.13) T v · ~λ = w · A · ~λ , T v ′ · λ~′ = w′ · A′ · λ~′ .

Siano B = (bi,j ) e C = (ci,j ) le matrici che Pnrispettivamente rappresentano


Pn il cambiamento
di base su V e quello su W , i.e. v~ ′j = i=1 bi,j ~vi , w~ ′j = i=1 ci,j w
~ i . Questo significa
v ′1 , ..., v~ ′m ) , e posto w′ = (w
che posto v ′ = (~ ~ ′1 , ..., w
~ ′m ) , abbiamo

v′ = v · B , w′ = w · C .
103

Si noti che nella i-esima colonna di B ci sono le coordinate di vi′ rispetto alla vecchia base
{~v1 , ..., ~vm } ; in particolare la moltiplicazione “B·” trasforma le nuove coordinate di un
vettore nelle vecchie. L’affermazione analoga vale per C .
Tramite queste uguaglianze e la 1a delle equazioni (16.13) otteniamo
 
T v ′ · λ~′ = T (v · B) · λ~′

= T v · (B · λ~′ )
= w · A · (B · λ~′ )

= (w′ · C −1 ) · A · (B · λ~′ ) = w′ · C −1 · A · B · λ~′ .
Pertanto, confrontando l’equazione ottenuta con la 2a delle equazioni (16.13) otteniamo
(16.14) A′ = C −1 · A · B .
In effetti la (16.14) può essere dedotta anche da un semplice ragionamento (confronta con
la dimostrazione della Proposizione 15.6). Innanzi tutto ricordiamo che la moltiplicazione
per A′ è l’operazione che associa alle nuove coordinate di un vettore ~v ∈ V , le nuove
coordinate di T (~v ) ∈ W . Ora, analogamente a quanto visto nel §15, l’operazione appena
descritta può essere effettuata nel modo che segue: consideriamo nuove coordinate di ~v e
i) le trasformiamo nelle vecchie coordinate di ~v (moltiplicazione per B ),
ii) moltiplichiamo quanto ottenuto per A (ottenendo le vecchie coordinate di T (~v )),
iii) moltiplichiamo quanto ottenuto per C −1 (ottenendo le nuove coordinate di T (~v)).
Dal fatto che l’esecuzione di i), ii) e iii) è la moltiplicazione per la matrice C −1 · A · B
otteniamo la (16.14).
Naturalmente, se W = V , si sceglie la stessa base su dominio e codominio di T (i.e.
si sceglie w = v nonché w′ = v ′ ). Pertanto si ha C = B e l’uguaglianza (16.14) diventa
l’uguaglianza già nota
(16.15) A′ = B −1 · A · B .

Inciso 16.16. Abbiamo visto (Osservazione 15.16 e Proposizione 15.10) che matrici
coniugate rappresentano la stessa applicazione lineare rispetto a basi diverse e viceversa.
Di conseguenza, gli invarianti per coniugio dello spazio delle matrici corrispondono alle
proprietà geometriche intrinseche delle trasformazioni lineari di uno spazio vettoriale.
In particolare questo vale per il determinante di una trasformazione lineare (osservazione
15.16). Una discussione dell’interpretazione geometrica del determinante non è oggetto
di questo corso, comunque due parole le vogliamo dire. L’interpretazione geometrica del
determinante è la seguente:
il determinante misura di quanto la trasformazione in questione dilata “i volumi”.
Ciò, addirittura, indipendentemente da come misuriamo distanze e volumi.
Spieghiamo. Dato uno spazio vettoriale V è possibile misurare distanze e angoli, e di
conseguenza volumi, introducendo un prodotto scalare definito positivo. Con le nozioni a
disposizione in questo testo, è possibile introdurre un modo di misurare distanze e angoli
come segue: si scelga una base BV di V , si identifichi V con lo spazio delle coordinate Rn ,
quindi si consideri il prodotto scalare introdotto nel cap. II, § 7 (si vedano anche le definizioni
II.7.3 e II.7.7). Ora, sia T : V → V una trasformazione lineare e sia V il volume di una
regione misurabile (ad esempio, un qualsiasi parallelepipedo), allora il volume dell’immagine
di tale regione è uguale al prodotto V · det T . Questo indipendentemente dal prodotto
scalare a disposizione (ovvero dalla base BV scelta), cioè da come misuriamo distanze e
angoli. Quindi possiamo dire che det T è il coefficiente di dilatazione dei volumi pur senza
avere in mente un modo di misurare distanze e angoli, quindi volumi. Attenzione, quanto
detto vale solamente per i volumi, ad esempio non vale per la misura delle lunghezze: se ~v
è un vettore, la lunghezza di T (~v) , dipende anche dal prodotto scalare in questione (ovvero
dalla base BV scelta), cioè da come misuriamo le distanze, oltre che dalla lunghezza di ~v e
dalla trasformazione T .
104

Sulla nozione di spazio proiettivo, una definizione alternativa.

In questa sezione facciamo delle considerazioni che ci portano a una definizione di spazio
vettoriale alternativa a quella vista (la Definizione 8.8), cfr. Definizione 16.18. Ribadiamo
la nostra convenzione stabilita subito dopo la Definizione 8.16:
Convenzione. Con la locuzione “ spazio vettoriale” intendiamo sempre “ spazio vettoriale
finitamente generato” (cfr. Definizioni 8.8 e 8.16).

Nel §8 abbiamo introdotto gli spazi vettoriali come insiemi V sui quali sono definite due
funzioni, una da V × V in V ed una da R × V in V , che soddisfano una lista di proprietà.
Più avanti abbiamo dimostrato che ogni spazio vettoriale è isomorfo ad un qualche Rn ,
cioè che può essere identificato con un qualche Rn (cfr. Oss. 8.20 e Oss. 12.26). Una tale
identificazione, chiamiamola φ, è una applicazione lineare biunivoca
φ : V −→ Rn .
Questa definisce un sistema di coordiante su V , è la funzione “ coordinate” (8.20) (ci preme
ribadirlo). Un altro aspetto che vogliamo sottolineare è il seguente:
una tale funzione φ consente di ricostruire la struttura di V (come spazio vettoriale)
a partire dalla struttura di Rn :
~ e λ · ~v
~v + w sono i vettori di coordinate ~ e λ · φ(~v ) .
φ(~v ) + φ(w)
(operazioni in V ) (operazioni in Rn )

Pertanto, non abbiamo bisogno della struttura vettoriale di V , la struttura di Rn di spazio


vettoriale induce una struttura di spazio vettoriale su V . Detto in termini meno criptici,
possiamo partire da un insieme V privo di struttura e una qualsiasi funzione biunivoca
φ : V −→ Rn , quindi definire sul nostro insieme V le operazioni date da
   
(16.17) ~ := φ−1 φ(~v ) + φ(w)
~v + w ~ e λ · ~v := φ−1 λ · φ(~v )
(sottolineiamo che le operazioni tra parentesi quadre sono operazioni in Rn ). Ciò suggerisce
due considerazioni:
i) possiamo dire che Rn è un modello di spazio vettoriale di dimensione n;
ii) in prima approssimazione potremmo definire gli spazi vettoriali come insiemi, a priori
privi di struttura, identificati con Rn tramite una funzione biunivoca.
La definizione suggerita in ii) è semplicemente sbagliata, nel senso che non definisce gli spazi
vettoriali. Infatti, uno spazio vettoriale astratto, cosı̀ com’è stato definito nel paragrafo §8,
non si porta dietro una identificazione con Rn , ovvero un sistema di coordinate, ovvero una
base. Detto in termini equivalenti ai precedenti, la definizione suggerita in ii) ha il difetto
di privilegiare una base di V rispetto alle altre: alla base canonica di Rn corrisponde una
base privilegiata di V . D’altro canto usare Rn come modello per definire gli spazi vettoriali
può avere dei vantaggi, si deve solamente correggere il difetto di cui sopra. In inciso, questo
difetto è un problema molto serio, ma andare a fondo su questo aspetto ci porterebbe
lontano e non lo facciamo. Vediamo come ovviare a questo problema. L’idea è semplice:
dare, invece
 di una sola identificazione φ : V −→ Rn , una famiglia di identificazioni
F = φi : V −→ Rn , cosı̀ da non avere più una base privilegiata, l’idea è che “se
ogni base è privilegiata, di fatto, nessuna lo è”. Naturalmente si dovrà richiedere che le
identificazioni della nostra famiglia F siano tra loro compatibili, nel senso che devono
indurre tutte la stessa struttura di spazio vettoriale. Ciò, detto in termini forse più concreti,
significa richiedere quanto segue: quando si usano le formule (16.17) per definire la somma
ed il prodotto per gli scalari, cioè per definire le operazioni in V , deve essere indifferente
usare φi piuttosto che φj . Tenendo presente che, a posteriori, ognuna delle nostre φ sarà
un sistema di coordinate su V , la compatibilità di cui sopra si traduce nella richiesta che
la composizione φi ◦ φj−1 , funzione di Rn in se, sia un cambio di coordinate su V , ovvero
sia la moltiplicazione per una matrice invertibile (cfr. Proposizione 15.7).
105

Finalmente, enunciamo la definizione di spazio vettoriale suggerita dalle considerazioni


precedenti.

Definizione 16.18 (definizione alternativa di spazio vettoriale). Uno spazio vettoriale è


un insieme V sul quale sia definita una famiglia non vuota di funzioni biunivoche

F = φ : V −→ Rn
che soddisfi
(16.18′ ) φ ◦ ψ −1 (x) = Mx, ∀ φ, ψ ∈ F , x ∈ Rn ,
dove M è una matrice invertibile n × n (che dipende da φ e ψ).

Il fatto che la Definizione 16.18 sia equivalente alla Definizione 8.8 + (quel “ +” ha il
significato di ricordarci che alla Definizione 8.8 abbiamo aggiunto la nostra convenzione)
sostanzialmente si riduce alle considerazioni viste nell’inciso. Preferiamo comunque scrivere
una dimostrazione più pulita e diretta dell’equivalenza delle due definizioni.

Dimostrazione (dell’equivalenza della Definizione 8.8 + e la Definizione 16.8).


Dato uno spazio vettoriale V (secondo la Definizione 8.8 +), possiamo considerare come
famiglia F la famiglia di tutte le possibili funzioni coordinate (cfr. oss. 8.20). Se φ e ψ sono
due sistemi di coordiante, come sappiamo il passaggio dalle une alle altre è la moltiplicazione
per una matrice invertibile (Proposizione 15.7).
Viceversa, una coppia (V, F ) come nella Definizione 16.18, in particolare che soddisfi la
condizione ivi considerata, è uno spazio vettoriale secondo la Definizione 8.8 +. Infatti,
usando una qualsiasi delle identificazioni φ : V −→ Rn della nostra famiglia dotiamo
l’insieme V di una somma e di un prodotto per gli scalari utilizzando le formule (16.17). Le
operazioni su V appena introdotte non dipendono dalla identificazione scelta, in formule
       
φ−1 φ(~v ) + φ(w)
~ = ψ −1 ψ(~v ) + ψ(w)
~ e φ−1 λ · φ(~v ) = ψ −1 λ · ψ(~v ) , ∀ φ, ψ ∈ F .
Proviamo la prima uguaglianza (la seconda è analoga). Risulta
   
φ−1 φ(~v ) + φ(w)
~ = φ−1 φ ψ −1 ψ(~v ) + φ ψ −1 ψ(w) ~
 
= φ−1 M ψ(~v ) + M ψ(w) ~
 
= φ−1 M ψ(~v ) + ψ(w) ~
 
= φ−1 φ ψ −1 ψ(~v ) + ψ(w) ~ = ψ −1 ψ(~v ) + ψ(w)~ 

Naturalmente non abbiamo alcun bisogno di una nuova definizione di spazio vettoriale,
la definizione data nel §8 è perfetta cosı̀ com’è. Con le considerazioni precedenti si vuole
semplicemente suggerire la strada per una definizione alternativa. Ci sembrava interessante
illustrarla perché l’idea che c’è sotto è un’idea che può essere, e viene, utilizzata spesso e
in contesti diversi per definire oggetti matematici. La ritroviamo nella sezione successiva,
sezione dove definiamo gli spazi affini (per i quali è scomodo seguire la via assiomatica).
106

Spazi Affini 13 .

In questa sezione diamo due definizioni (equivalenti) di spazio affine.


La prima delle due è formulata in perfetta analogia con la Definizione “ alternativa” di
spazio vettoriale 16.18. Come nel caso degli spazi vettoriali, lo spazio Rn è il nostro
“ modello”, solo che nel caso degli spazi affini tra i cambi di coordinate ammessi, diver-
samente dal caso degli spazi vettoriali, si includono anche le traslazioni. Precisamente, la
condizione (16.18′ ) viene sostituita con la condizione
φ ◦ ψ −1 (x) = M x + b , ∀ φ, ψ ∈ F , x ∈ Rn ,
(l’elemento b è la nostra traslazione: è un elemento in Rn fissato, dipendente da φ e ψ,
naturalmente M è sempre una matrice invertibile n × n).

Definizione 16.19. Uno spazio affine di dimensione n è un insieme A sul quale sia
definita una famiglia14 non vuota di funzioni biunivoche

F = φ : A −→ Rn
che soddisfi
(♣) φ ◦ ψ −1 (x) = M x + b , ∀ φ, ψ ∈ F , x ∈ Rn ,
dove b ed M sono rispettivamente un elemento in Rn ed una matrice invertibile n × n
(entrambi dipendenti da φ e ψ).
Inoltre, uno spazio affine è uno spazio affine di dimensione n per un qualche n.

Nel paragrafo §11 abbiamo introdotto i sottospazi affini di Rn come gli spazi delle
soluzioni dei sistemi lineari (arbitrari, cioè anche non omogenei). Naturalmente, i sottospazi
affini di Rn introdotti nel paragrafo §11 sono spazi affini secondo la Definizione 16.19 .

Proposizione 16.20. I sottospazi affini di Rn (Definizione 11.2) sono spazi affini.

Dimostrazione. Sia S un sottospazio affine di Rn . Possiamo scrivere



S = ~x ∈ Rn ~x = t1~v1 + ... + tk ~vk + ~c = V + ~c
dove V è un sottospazio vettoriale di Rn dipendente esclusivamente da S , {~v1 , ..., ~vk } è
una base di V (che denotiamo con Bv ) e ~c è un punto di S (cfr. Definizione 11.2 e
Proposizione 11.7). I valori t1 , ..., tk parametrizzano S, questo significa che la funzione
p: Rk −−−−→ S
(t1 , ..., tk ) 7→ p(t1 , ..., tk ) := t1~v1 + ... + tk ~vk + ~c
è biunivoca, ovvero è invertibile. Consideriamo la corrispondente funzione inversa
φp : S −−−−→ Rk
~s 7→ (t1 , ..., tk ) := p−1 (~s)
(a un punto di S associa le corrispondenti coordinate). Definiamo la nostra famiglia F
ponendo
F = { “ tutte le possibili φp : S −→ Rk ” }
(cosa che ci dirà che il nostro S è uno spazio affine di dimensione k ...non ci si confonda,
qui n è la dimensione dell’ambiente Rn ).
Resta da capire cosa accade se cambiamo le nostre scelte, ovvero verificare la condizione (♣)
della Definizione 16.19. A tal fine, sia
13In queste note la locuzione “spazio affine” significa “spazio affine reale di dimensione finita”.
14Alcuni autori richiedono che la famiglia F sia massimale , cioè che se F ′ è un’altra famiglia di corrispon-
denze biunivoche, con F ′ contenente F e soddisfacente la proprietà (♣), allora F ′ = F . Comunque
questa richiesta è più che altro un’ossessione logica, ignoriamola.
107

S = ~x ∈ Rn ~x = s1 ~u1 + ... + sk ~uk + d~
dove Bu = {~u1 , ..., ~uk } è un’altra base di V e d~ è un altro punto di S . Sia quindi
q: Rk −−−−→ S
(s1 , ..., sk ) 7→ q (s1 , ..., sk ) := s1 ~u1 + ... + sk ~uk + d~
la corrispondente parametrizzazione di S e
φq : S −−−−→ Rk
l’inversa di q.
Poniamo, per comodità di notazione t = t(t1 , ..., tk ) e s = t(s1 , ..., sk ) (sono vettori
colonna). Affermiamo che risulta
(16.20′ ) φp ◦ φq−1 (s) = Ms + b
dove M è la matrice del cambiamento di base da Bu a Bv (nella colonna i di M ci sono
le coordinate di ~ui rispetto alla base Bv ) e b è il vettore delle coordinate rispetto alla
base Bv del vettore d~ − ~c ∈ V . Infatti, da un lato risulta

p φp ◦ φ−1
q (s) = φ−1 q (s) = s1 ~u1 + ... + sk ~uk + d~
d’altro canto, ricordando la formula del cambiamento di base di uno spazio vettoriale che
nel caso del nostro V (e le nostre Bu e Bv ) è la formula
(~v1 , ..., ~vk ) · M s = (~u1 , ..., ~uk ) · s , ∀ s ∈ Rk ,
e tenendo presente che per come è definito b si ha (~v1 , ..., ~vk ) · b = d~ − ~c , risulta
 
p Ms + b = (~v1 , ..., ~vk ) · M s + b + ~c

= (~u1 , ..., ~uk ) · s + d~ − ~c + ~c = s1 ~u1 + ... + sk ~uk + d~
(il puntino “ ·” è un normale prodotto formale righe per colonne, ha perfettamente senso
nonostante, in ognuna delle 5 volte che lo abbiamo scritto, alla sua sinistra ci sia una
matrice riga i cui elemeti sono vettori ed alla sua destra una matrice colonna i cui elemeti
sono numeri). Essendo p invertibile abbiamo l’uguaglianza (16.20′ ) e, in definitiva, vale la
condizione (♣) della Definizione 16.19. 

Esempio 16.21. Il piano H ⊆ R3 di equazione


(⋆) 2 x + 3 y − 5 z + 18 = 0
3
(che non è un sottospazio vettoriale di R in quanto non passa per l’origine) è in modo
naturale uno spazio affine secondo la Definizione 16.19 : si considera la collezione di tutte le
possibili soluzioni parametriche del sistema lineare (⋆)
p: R2 −−−−→ H
(t1 , t2 ) 7→ p(t1 , t2 ) := p0 + t1 ~v + t2 w
~
e, come famiglia F , si prende la collezione delle corrispondenti funzioni inverse
φp : H −−−−→ R2
p 7→ p−1 (t1 , t2 )
(n.b. la funzione che a (t1 , t2 ) ∈ R2 associa p(t1 , t2 ) ∈ H è biunivoca, quindi invertibile).

Esercizio. Si verifichi che se


p(t1 , t2 ) = p0 + t1 ~v + t2 w
~ e q (s1 , s2 ) = q0 + s1 ~u + s2 ~z
sono due soluzioni generali del sistema (⋆) allora il legame “tra le s e le t”, precisamente la
funzione φp ◦ φ−1
q = p−1 ◦ q , è una funzione di primo grado, cioè del tipo
108
      
t1 a c s1 b1
= + .
t2 b d s2 b2
Questo ci dice che vale la condizione (♣) della Definizione 16.19.

Naturalmente l’esempio 16.21 non ha nulla di speciale: come abbiamo avuto già modo
di dire, le soluzioni di sistemi non omogenei, che nel paragrafo §11 abbiamo chiamato
“ sottospazi affini di Rn ”, sono spazi affini secondo la Definizione 16.19.

I sottospazi affini di Rn non hanno un’origine, come il nostro H di equazione (⋆).


Detto in termini molto vaghi, uno spazio affine è uno spazio vettoriale dove sono ammesse le
traslazioni (che non sono applicazioni lineari, spostano il vettore nullo). Ciò suggerisce l’idea
di vedere gli spazi affini come “spazi vettoriali sui quali ci si è dimenticati dov’è l’origine”,
ovvero suggerisce l’idea di dare la definizione alternativa (questa non più vaga ma rigorosa)
che segue:

Definizione 16.22 (alternativa alla 16.19). Uno spazio affine è una terna (A, W, Ψ),
dove A è un insieme, W è uno spazio vettoriale di dimensione finita e Ψ è una funzione
Ψ : A × A −−−−→ W
tale che
i) per ogni a ∈ A fissato, si ha che la funzione
ψa : A −→ W , ψa (x) := Ψ(a, x),
è biunivoca;
ii) vale la regola di Chasles Ψ(a, b) + Ψ(b, c) = Ψ(a, c) , ∀ a, b, c ∈ A .

Dalla regola di Chasles seguono rapidamente altre due proprietà:


iii) Ψ(a, a) = ~0 , ∀ a ∈ A (~0 ∈ W denota il vettore nullo di W );
iv) Ψ è antisimmetrica, cioè Ψ(a, b) = −Ψ(b, a) , ∀ a, b ∈ A .

Esercizio 16.23. Si dimostrino le proprietà iii) e iv).


Suggerimento: Si scriva la ii) con a = b = c , quindi si deduca la iii). A questo punto,
si scriva la ii) con c = a e, tenendo presente la iii) appena provata, si deduca la la iv).

Facciamo alcune osservazioni che ci sembrano interessanti.

Oss. 16.24. La scelta di un punto a ∈ A individua l’identificazione di A con W data da


ψa : A −→ W
pertanto una coppia (“spazio affine”, “punto”) ha una naturale struttura di spazio vettoriale:
una tale coppia (A, a) è uno spazio vettoriale.

Oss. 16.25. I “ sottospazi affini di Rn ” introdotti nel paragrafo § 11 (che sono i traslati
dei sottospazi vettoriali di Rn ), cioè i sottoinsiemi del tipo
(♠) ~v0 + W ,

dove ~v0 ∈ Rn è un punto (fissato) e W è un sottospazio vettoriale di Rn (cfr. 11.2, 11.5, 11.7),
sono in modo naturale spazi affini secondo la Definizione 16.22, infatti basta porre
W = “ spazio V della (11.7)”, Ψ(a, b) := b − a
(per esercizio, si verifichi che questa funzione soddisfa la regola di Chasles).

Naturalmente, possiamo sostituire Rn con uno spazio vettoriale astratto: i sottospazi


109

affini di un qualsiasi spazio vettoriale (che chiameremo “spazio ambiente”) sono i traslati
dei suoi sottospazi vettoriali, cioè i sottoinsiemi del tipo (♠), dove ~v0 è un punto fissato
dello spazio ambiente e W un sottospazio vettoriale dello spazio ambiente.

A questo punto, per chiarezza e completezza, enunciamo e dimostriamo quanto segue:

Proposizione 16.26. Le Definizioni 16.19 e 16.22 sono equivalenti.

Dimostrazione. Se sono dati A ed F come nella Definizione 16.18, definiamo


W = Rn e Ψ(~v , w) ~ = φ(~v ) − φ(w)~ per una qualche φ ∈ F
(espressione che non dipende dalla particolare funzione φ ∈ F scelta). A questo punto si
verifica che valgono le condizioni i) e ii) della Definizione 16.22 (questa verifica la lasciamo
per esercizio).
Viceversa se sono dati A e Ψ come nella Definizione 16.22, per ogni base B di W ed
a ∈ A definiamo ψ C
φ = φB, a come la composizione A −−−a−→ W −−−B−→ Rn ,
dove CB denota la funzione che ad un vettore associa le sue coordinate rispetto alla base
B, quindi defininiamo F come la collezione di tali funzioni. Infine si verifica che questa
famiglia soddisfa la proprietà (♣) della Definizione 16.19 (di nuovo, lasciamo la verifica
per esercizio). 

Per concludere, non possiamo non menzionare il fatto che classicamente gli spazi affini
vengono introdotti per via assiomatica, fissando classi di sottoinsiemi e vari tipi di assiomi,
come assiomi di ordinamento per i punti di una retta, come pure assiomi del tipo “per due
punti passa una sola retta” o “data una retta r e un punto p esiste un’unica retta s parallela
ad r passante per p”. Invitiamo il lettore a documentarsi per scoprire bellezza, vantaggi, ma
anche svantaggi, di questo approccio.
110

§17. Soluzione degli esercizi.

1.20. I sistemi a) e b) sono sistemi lineari.


Nel sistema di equazioni c) non vengono indicate le incognite. Presumendo che queste
siano x, y, z, t , il sistema non è lineare. Volendo dare una risposta che comprenda tutte le
possibilità, abbiamo che il sistema è lineare se e solo se è un sistema di equazioni in uno dei
seguenti insiemi di incognite: , {x} (solo per t = 0), {y}, {z}, {x, z} (solo per t = 0),
ogni insieme la cui intersezione con l’insieme {x, y, z, t} è uno dei precedenti (ad esempio,
è lineare come sistema nelle incognite z, r, w).
2.5. Ragionando per induzione, essendo nulli gli elementi sotto ai, i , sono nulli anche gli
elementi sotto ai+1, i+1 (altrimenti la matrice non è a scala).
2.6. Le matrici A, C, F, G, H sono le uniche matrici a scala.
2.7. L’affermazione è sostanzialmente ovvia! ...l’esercizio, che non aggiunge molto alla
comprensione di come è fatta una matrice a scala, vi è stato chiesto come allenamento a
fare qualcosa alla quale non siete abituati: scrivere una dimostrazione rigorosa. Comunque,
ecco una possibile dimostrazione:
Per ogni indice i , indichiamo con Mi la matrice ottenuta cancellando le prime i − 1 righe
e tutte le colonne che seguono il primo elemento non nullo della i−esima riga (se questa è
nulla non cancelliamo nessuna colonna). La proprietà che ν(i) è strettamente crescente (cfr.
Definizione 2.4), con l’eccezione indicata nella (2.4), è equivalente al fatto che ogni matrice
Mi è nulla ovunque eccetto, eventualmente, che nell’elemento che si trova nell’angolo in alto
a destra. D’altro canto questa proprietà è chiaramente equivalente alla proprietà enunciata
nell’esercizio.
2.12. I sistemi di matrice completa B, D, E, F non sono compatibili. Per quel che
riguarda gli altri risulta: A : ∃ ! soluzione x = − 21 , y = 1; C : ∃ ∞1 soluzioni x = 0,
y = t, z = 0; G : ∃ ∞2 soluzioni (x, y parametri liberi); H : ∃ ! soluzione x = 21 .
4.10 e 4.11. L’errore viene dal fatto che nella Definizione 1.8 di sistema lineare “non
abbiamo un’equazione ma un’accozzaglia di simboli”! È la Definizione 1.9 che dà un senso
matematico a tali simboli. Questo significa che non possiamo trattare un sistema lineare
come se fosse un’equazione: ad esempio se partissi dall’equazione 1 = 0 potrei dimostrare
qualsiasi cosa! La deduzione “ A·~x = ~b ⇒ ~x = B·~b ” avrebbe senso qualora A ·~x = ~b fosse
un’equazione. Naturalmente, nel caso in cui si lavora con un sistema lineare compatibile, è
lecito assumere che ~x ne sia una soluzione e tutto quello che si riesce a dedurre dall’identità
A · ~x = ~b è necessariamente vero. Quindi, il ragionamento esposto nell’esercizio (4.8) non
è completamente da buttare, dimostra quanto segue:
Sia A · ~x = ~b un sistema lineare compatibile, con A ∈ Mm, n (R) . Assumiamo che esista
una matrice B ∈ Mn, m (R) tale che B · A = In . Allora il sistema ammette una unica
soluzione, la soluzione ~x = B · ~b .
Ribadisco il punto: nell’esercizio, l’ipotesi mancante era quella di compatibilità del sistema
(lo studente verifichi che questa ipotesi non è soddisfatta dall’esempio indicato nell’esercizio).
5.15. I determinanti delle matrici indicate valgono (nell’ordine): 62, 6, 10, 6 .
5.16. Valgono (nell’ordine): 4k 2 − 6k − 2, 30k, 30k, (2 − k)·(k 2 − 11)·(k − 8) .
8.26. Una possibile base è B = {~b1 , ~b2 , ~e1 , ~e3 } (non possiamo scegliere ~e2 perché è
combinazione lineare di ~b1 , ~b2 , ~e1 ).
8.29. B = {~b1 , ~b3 } è una base di V (che ha dimensione 2).
8.30. Conviene utilizzare il concetto di dimensione: gli spazi di basi B e B ′ hanno
entrambi dimensione 2 (sono due piani). Lo spazio generato dai vettori di B e B ′ li
contiene entrambi, d’altro canto è anch’esso un piano (applicando l’algoritmo di estrazione
di una base ai 4 vettori in questione si ottengono 2 vettori; questo è l’unico conto da fare).
Avendo 2 piani contenuti in uno stesso piano questi devono necessariamente coincidere.
111

8.31. È sufficiente considerare due vettori indipendenti (sempre in W naturalmente), ad


esempio B ′ = {~b1 , ~b1 +~b2 }.
8.32. Rispettivamente 1, 2, 2 ; 1, 0, 0 ; 0, −3, 2 .
8.33. a) Base: {~b1 , ~b2 , ~b3 } , coordinate di ~v : 1, 1, 2 ; b) base: {~b1 , ~b2 } , coordinate
di ~v : −1, −2 ; c) base: {~b1 , ~b2 } , coordinate di ~v : 0, 1 .
8.34. Rispettivamente 2, 3.
8.38. a) Se A ∈ Mn, n e B ∈ Mn, n sono matrici simmetriche, cioè tA = A e tB = B ,
allora t(αA + βB) = αtA + β tB = αA + βB ∈ Mn, n . Questo dimostra quanto affermato
(cfr. def. 8.9′′ ).    
a c a b
b) Una matrice è simmetrica se e solo se b = c, ovvero è del tipo .
b d b d
Una
 tale  matrice  si scrive
 in
 modo unico  comesegue:
a b 1 0 0 1 0 0
= a +b +c .
b d 0 0  1 0
  0 1 
 1 0 0 1 0 0
Ne segue che l’insieme , , costituisce una base dello spazio in
0 0 1 0 0 1
questione, che quindi, in particolare, ha dimensione 3.
9.9. Nell’ordine: 3, 2, 3, 1; 2, 4, 0, 1; 2, 1, 5.
9.10. Nell’ordine: 3 per k 6= 43 , 2 per k = 34 ; 3 ∀ k; 3 per k 6= 7, 2 per k = 7; 1 ∀ k; 3
per k 6= 0, 1, 2 per k √ = 0, 1 per k = 1; √1 per k 6= 0, 0 per k = 0; 3 per k 6= 7, 2 per k = 7;
2 ∀ k; 2 per k 6= ± 13, 1 per k = ± 13; 5 per k 6= 0, 0 per k = 0; 3 per k 6= 1, 1 per
k = 1; 2 per k 6= 0, 1 per k = 0; 1 per k 6= 0, −1, 1 per k = 0 2 per k = −1; 1 per k 6= 0, 1
per k = 0.
 
9.12. a) La matrice indicata a lato ha le prime due righe indipendenti, 1 0 0
le prime due colonne indipendenti, il minore costituito dalle prime due 0 0 1
righe e colonne (in neretto) non è invertibile. 0 1 0
b) (Questa parte dell’esercizio è più difficile, lo studente che non fosse riuscito a rispondere
non deve preoccuparsi).
 
Sia A una matrice come prescritto nell’esercizio (naturalmente, a meno ⋆ ⋆ ?
di permutare righe e/o colonne possiamo assumere che le righe e colonne A =  ⋆ ⋆ ? 
in questione siano le prime due). ? ? ?
Il Minore M (indicato dagli asterischi) non può avere rango 0 (gli asterischi non possono
essere 4 zeri perché le prime due righe di A sono indipendenti) e non può avere rango 2
(per ipotesi non è invertibile), quindi ha rango 1. Se per assurdo A avesse rango 2, la terza
riga di A dovrebbe necessariamente essere c.l. delle prime due (che sono indipendenti per
ipotesi). A maggior ragione ciò sarebbe vero per la sottomatrice A′ costituita dalle prime
due colonne di A, ma questo forzerebbe A′ ad avere rango 1 (in quanto M ha rango 1), il
che contraddice l’ipotesi di indipendenza delle prime due colonne di A.
10.3. Dato ~v = ~u + w ~ ∈ U + W , questo appartiene a Span{U ∪ W } per definizione di
“Span”. Viceversa, sappiamo che Span{U ∪ W } è lo spazio delle combinazioni lineari (c.l.)
di vettori in U ∪ W . Una tale c.l. ~σ la possiamo spezzare come somma di una c.l. di vettori
in U e una c.l. di vettori in W . Essendo U e W spazi vettoriali, queste due c.l. sono a
loro volta vettori in U e W . Quindi ~σ appartiene allo spazio somma U + W .
10.5. Scriviamo la relazione indicata nell’esercizio nella forma
α1~b1 + ... + αr~br + αr+1 ~u1 + ... + αr+s ~us = −αr+s+1 w ~ 1 − ... − αr+s+t w~t
ed osserviamo che l’espressione a sinistra è in U mentre quella a destra è in W . Quindi,
indicando con ~z il vettore in uno dei due lati dell’uguaglianza, abbiamo che ~z ∈ U ∩ W .
D’altro canto, i vettori w ~ i sono i vettori del completamento di una base di U ∩ W a una
base di W , quindi, nessuna loro c.l. non nulla può appartenere a U ∩ W . Questo dimostra
che tutti i coefficienti αr+s+1 , ..., αr+s+t sono nulli (in particolare, ~z = ~0). Infine, essendo
112

{~b1 , ..., ~br , ~u1 , ..., ~us } una base di U ed essendo ~z = ~0, anche i coefficienti α1 , ..., αr+s
sono nulli (si noti che usiamo tutti i dettagli della costruzione dei vari vettori in questione).
10.9. Considerando che 14 ≤ dim (U + W ) ≤ 19 (la dimensione dello spazio ambiente),
dalla formula di Grassmann otteniamo 4 ≤ dim (U ∩ W ) ≤ 9 .
10.10. Per la formula di Grassmann abbiamo dimW = dim (U + W ) + dim (U ∩ W ) −
dim U = dim (U +W ) + 3 − 6 = dim (U +W ) − 3 . Poiché 6 = dim U ≤ dim (U +W ) ≤ 8 ,
si deve avere 3 ≤ dim W ≤ 5 .
10.11. a) Indichiamo con ~u1 , ~u2 , ~u3 i tre generatori di Uk e con w ~ 1, w
~ 2 i due generatori
di W . Di sicuro ~u3 non è c.l. di ~u1 ed ~u2 (solo ~u3 ha prima coordinata non nulla),
inoltre ~u1 ed ~u2 sono proporzionali se e solo se k = 1 . Quindi, dim Uk = 3 per k 6= 1 ,
dim Uk = 2 per k = 1 . I due generatori di W non sono proporzionali, pertanto dim W = 2 .
Per k = 1 i quattro vettori ~u2 , ~u3 , w ~1 , w
~ 2 sono indipendenti, quindi generano l’ambiente
R4 (pertanto, in questo caso, l’intersezione è costituita solamente dal vettore nulla). Inoltre,
~ 1 non è c.l. dei generatori di Uk eccetto quando 2 = 7 − k, cioè k = 5. Ne segue che
w
dim Uk ∩ W ≤ 1 per k 6= 1, 5 , d’altro canto per la formula di Grassmann e quanto stabilito
sopra dim Uk ∩ W 6= 0 (sempre per k 6= 1, 5). Infine w ~ 2 ∈ U5 , quindi W ⊆ U5 .
~ 1, w
Mettendo insieme i risultati trovati abbiamo
dim U1 = 2 , dimW = 2 , dim U1 ∩ W = 0 , dim U + W = 4
dim U5 = 3 , dimW = 2 , dim U5 ∩ W = 2 , dim U + W = 3
dim Uk = 3 , dim W = 2 , dimU5 ∩ W = 1 , dim U + W = 4 per k 6= 1, 5 .
b) Scegliendo k̄ = 0 troviamo U0 ∩ W = Span{w ~2 − w
~ 1 } ; {w~2 − w
~ 1 } ne è una base.
c) {w ~2 − w ~ 1 , ~u2 , ~u3 } è una base di U0 soddisfacente le richieste.
Nota. Abbiamo “guardato” i vettori in questione per capire se c’erano o meno relazioni di
dipendenza, naturalmente avremmo potuto effettuare la solita riduzione a scala...
10.20. Come indicato nel suggerimento, il rango in questione vale r . Le equazioni
individuate da un minore invertibile di ordine r costituiscono un sistema quadrato di r
equazioni nelle r incognite t1 , ..., tr , la cui matrice incompleta è invertibile. Risolverlo,
cosa che sappiamo essere possibile, significa isolare t1 , ..., tr .
10.21. Prendiamo la strada più rapida: risolvendo il primo sistema troviamo x = 3 t,
y = 2 t, z = −15 t. D’altro canto queste equazioni soddisfano anche le equazioni del secondo
sistema, che pertanto per ragioni di dimensione (ovvero di numero di parametri liberi) deve
essere necessariamente equivalente al primo.
10.27. La prima stima da effettuare riguarda la dimensione di U che deve essere compresa
tra 15 e 19, infatti U è definito da 4 equazioni (che a priori potrebbero essere tutte banali).
La stessa stima vale per la dimensione dello spazio somma U + W . A questo punto la
stima 6 ≤ dim (U ∩ W ) ≤ 10 segue dalla formula di Grassmann. Un altro modo di
ottenere quest’ultima stima è il seguente: U ∩ W si ottiene considerando i vettori di W le
cui coordinate soddisfano le equazioni che definiscono U ; i.e. è un sottospazio di uno spazio
di dimensione 10, definito da 4 equazioni. Quindi la sua dimensione deve essere compresa
tra 6 = 10 − 4 e 10 .
10.28. Si deve avere dim (U ∩ W ) ≤ dim U ≤ dim (U + W ), cioè 6 ≤ 15 − k ≤ 11 .
Da queste disuguaglianze si ottiene 4 ≤ k ≤ 9 . Dalla formula di Grassmann si ottiene
dim W = 11 + 6 − (15 − k) = k + 2 .
11.4. Un’implicazione è immediata: uno spazio vettoriale deve contenere l’origine. Vice-
versa, se l’insieme S della (11.1) contiene l’origine, possiamo scrivere ~0 = t1~v1+...+ tk~vk +~c.
Questo dimostra che ~c è c.l. dei ~vi e pertanto che S = Span{~v1 , ..., ~vk } .
11.10. Usando la notazione (11.5) e la successiva osservazione abbiamo:
(∗)
V +~c = V ′ +~c ′ =⇒ V = V ′ +~c ′ −~c =⇒ V ′ + ~c ′ − ~c = V ′ =⇒ V = V ′
dove l’uguaglianza (∗) segue dalla precedente (più precisamente, dal fatto che, come con-
seguenza dell’uguaglianza precedente, lo spazio affine V ′ +~c ′ −~c è uno spazio vettoriale).
11.24. Non c’è praticamente nulla da dimostrare (cfr. Definizione 11.22)! ...lo spazio
113

vettoriale associato allo spazio affine V ∩ W è lo stesso V ∩ W , spazio contenuto sia in V


che in W (che sono gli spazi vettoriali associati rispettivamente ad S e T ).
11.25. Tenendo presente la Definizione 11.22, quanto affermato segue dal fatto che
per spazi vettoriali della stessa dimensione l’inclusione equivale all’uguaglianza (che è una
nozione transitiva).
Attenzione: anche l’inclusione è transitiva ma nella (11.22) c’è quell’“oppure” che frega!
11.26. Alla luce della Definizione 11.22, ci chiediamo quali sono i valori di k per i quali lo
spazio vettoriali associato alla retta r è contenuto nello spazio vettoriale associato al piano
τ . Il primo è lo spazio Span{~v } , essendo ~v il vettore di coordinate 1, 2, −1 . Mentre lo
spazio vettoriale associato al piano τ è lo spazio delle soluzioni del sistema lineare omogeneo
x + y + kz = 0 (sistema omogeneo associato al sistema che definisce τ ). Sostituendo le
coordinate di ~v nell’equazione appena scritta troviamo 1 + 2 − k = 0 , quindi k = 3.
11.27. I due piani, quello cercato e quello dato nel testo, in quanto paralleli hanno stesso
spazio vettoriale associato (Definizione 11.13), quindi, in forma cartesiana, stessa parte
omogenea: l’equazione del piano cercato è del tipo x + y + z = c. Imponendo il passaggio
per il punto di coordinate 2, −1, 5 troviamo 2 − 1 + 5 = c, quindi c = 6 .
12.3. Le due uguaglianze nella (12.1′ ) sono casi particolari della (12.2), infatti si ottengono
rispettivamente ponendo α = β = 1 e α = λ, β = 0 . Viceversa, assumendo la (12.1′ ),
abbiamo L(α~v + β~u) = L(α~v ) + L(β~u) = αL(~v ) + βL(~u).
12.23. Si ha dim ImL = rg A = 5 , dimker L = dim (“dominio”) − rg A = 7 − 5 = 2 .
12.24. Per l’uguaglianza (12.13′ ) abbiamo dimker L = dim R8 − dim ImL ≥ 8 − 5 = 3 .
Per la formula di Grassmann abbiamo
 
dim kerL ∩ W = dimker L + dim W − dim kerL + W ≥ 3 + 6 − 8 = 1 .
13.2, 13.4. Vengono risolti entrambi nell’osservazione (13.6).
13.11. Un vettore ~v che appartenesse a due autospazi Vλ e Vµ dovrebbe soddisfare
L(~v ) = λ~v e L(~v ) = µ~v . Ma questo implicherebbe (λ − µ)~v = ~0 !
13.19. Risulta A·~v = 2~v , quindi, per l’osservazione (13.18), A2 ·~v = 4~v , A3 ·~v = 8~v ,
A5 ·~v = 32~v , A14 ·~v = 16384~v .
14.1. La funzione CV : V −→ Rn che a un vettore associa le sue coordinate è lineare (le
coordinate di una c.l. di vettori sono la c.l. delle coordinate dei vettori). Naturalmente, an-
che la funzione inversa CV−1 è lineare. Ne segue che Lcoord è lineare in quanto composizione
di tre applicazioni (tutte lineari):
C −1 C
Lcoord : Rn V
−−−−→ V −−−−→ W −−−W−→ Rm
P 
~λ 7→ ~v = λi~vi 7→ L(~v ) 7→ CW L(~v )
16.9. Consideriamo delle basi degli spazi in questione e denotiamo con B l’insieme
di tutti i vettori di tali basi. Dire che esiste un insieme dipendente di vettori non nulli
I = {w ~ ir } tale che w
~ i1 , ..., w ~ i1 ∈ Wi1 , ..., w ~ ir ∈ Wir equivale a dire B è un insieme
dipendente. Infatti tali vettori si scrivono come c.l. di vettori in B e, viceversa, raccogliendo
opportunamente i vettori di una c.l. di vettori in B possiamo produrre I . Ridiciamolo
nei termini della definizione data nell’inciso 13.10: presi comunque dei vettori non nulli
w~ i1 ∈ Wi1 , ..., w ~ ir ∈ Wir si ha che w ~ ir sono vettori indipendenti se e solo se B
~ i1 , ..., w
è un insieme indipendente. D’altro canto B genera lo spazio somma W1 + ... + Wk , quindi
è un insieme indipendente se e solo se la sua cardinalità (che è uguale alla somma delle
dimensioni dei Wi ) è uguale alla dimensione di tale spazio somma.
114

II

GEOMETRIA EUCLIDEA

Nei primi 6 paragrafi di questo capitolo studiamo il piano Euclideo R2 e lo spazio Euclideo
3
R . Non introduciamo in modo rigoroso le nozioni di piano e spazio Euclideo astratto,
questo perché ci costerebbe del lavoro tutto sommato inutile alle luce di quelli che sono i
nostri obiettivi e del fatto che si tratta di nozioni per certi versi familiari. Pertanto, gli
oggetti del nostro studio saranno
• R2 , i cui elementi li consideriamo come “punti” (cfr. anche inciso cap. I, §11.16),
ed il cui soggiacente spazio vettoriale dei vettori geometrici (def. 1.2 e 1.5) è dotato
del prodotto scalare (1.7′ );
• R3 , dotato di analoga struttura (cfr. §4).

Questo significa che limiteremo il nostro studio ai modelli15 R2 di piano Euclideo ed R3


di spazio Euclideo. Inoltre, per mantenere l’intuizione geometrica spesso ci riferiremo alle
nozioni naı̈ves di piano e spazio Euclideo viste alle superiori, anzi queste nozioni ci faranno
sostanzialmente da guida.

Nel § 7 studiamo la geometria Euclidea di Rn dotato del prodotto scalare canonico


(l’approccio algebrico consentirà una trattazione rigorosa).

§1. Geometria Euclidea del piano.

Consideriamo un piano H (quello che avete conosciuto alle scuole superiori e del quale
né allora né mai vedrete una definizione formale), fissiamo un sistema di riferimento ed
una unità dimisura
 (vedi figura 1.1). Ad ogni punto P ∈ H possiamo associare le sue
x
coordinate ∈ R2 e viceversa. In questo modo i punti del piano vengono messi in
y
corrispondenza biunivoca con gli elementi di R2 .

asse (y)
 
3 u
(fig. 1.1) P =
2 • 2

asse (x)

Un oggetto di questo tipo lo chiameremo piano Euclideo.


Per ragioni che saranno più chiare in seguito conviene introdurre la nozione di vettore
geometrico, oggetto che in un certo senso rappresenta uno spostamento e che viene definito
nel modo che segue.
15L’uso di questo termine sottintende il fatto che, ad esempio, un piano Euclideo astratto è un oggetto mate-
matico che (qualunque cosa sia!) è isomorfo (letteralmente, “stessa forma”), cioè è identificabile, all’“oggetto
R2 ” del nostro studio. Una piccola precisazione per chi avesse incontrato il concetto di isomorfismo in altri
ambiti: qui “isomorfo” significa “isomorfo come piano Euclideo”.
115

Definizione 1.2. Un segmento orientato Q P è un segmento che ha un estremo iniziale


Q ed un estremo finale P . Dichiariamo equivalenti due segmenti orientati Q P e Q′ P ′ se
coincidono a meno di una traslazione del piano (cioè se sono due lati opposti di un paralle-
logramma). Per definizione, un vettore geometrico del piano è una classe di equivalenza di
segmenti orientati.
Si osservi che, per definizione, i due segmenti orientati indicati nella figura (1.4) rappre-
sentano lo stesso vettore geometrico.
   
qx px
Definizione 1.3. Siano e le coordinate di due punti Q e P . Per defini-
qy py  
px − qx
zione, le coordinate del vettore rappresentato dal segmento orientato Q P sono .
py − qy
Osserviamo che la definizione è ben posta: le coordinate di un vettore geometrico non
dipendono dal segmento orientato scelto per rappresentarlo (vedi figura 1.4).

P

•P ′
(fig. 1.4) chiaramente,
   ′ 
px − qx px − qx′
Q• = .
py − qy p′y − qy′

Q′

Osservazione/Definizione 1.5. L’insieme dei vettori geometrici è in corrispondenza


biunivoca con R2 . Definiamo la somma di due vettori geometrici ed il prodotto di un
vettore geometrico per uno scalare utilizzando le corrispondenti operazioni definite per lo
spazio vettoriale R2 . Chiaramente, queste operazioni arricchiscono l’insieme dei vettori
geometrici di una struttura di spazio vettoriale (cap. I, §8 def. 8.8). Graficamente, la somma
di due vettori geometrici è l’operazione rappresentata nella figura (1.6).

~v + w
~ w
~
(fig. 1.6)



~v

Osserviamo che gli elementi di R2 possono essere interpretati sia come punti del piano
H che come vettori geometrici di H . Ci stiamo complicando inutilmente la vita? Forse ce
la stiamo complicando, ma non inutilmente: è estremamente utile mantenere le due nozioni
“punti” e “vettori geometrici” distinte. D’ora in poi dirò semplicemente “vettore” invece di
“vettore geometrico”.
   
vx wx
Definizione 1.7. Siano ~v = e w~ = due vettori. Si definisce il loro
vy wy
prodotto scalare mediante la formula
(1.7′ ) ~v · w
~ := vx wx + vy wy .

Definizione 1.8. Si definisce inoltre la norma, o lunghezza, di un vettore ponendo


√ q
|| ~v || := ~v · ~v = (vx )2 + (vy )2
116

Osservazione. Per il teorema di Pitagora, la norma del vettore ~v coincide con la lunghezza
di un segmento orientato che lo rappresenta:

~v vy

vx

Osservazione 1.9. Sia c ∈ R una costante e sia ~v un vettore. Si ha

|| c~v || = |c| · || ~v ||

dove |c| denota il valore assoluto di c .

Osservazione 1.10. È facilissimo verificare che valgono le proprietà che seguono:


i) ~v · w~ = w ~ · ~v (proprietà commutativa);
ii) ~v · (w
~ + ~u) = ~v · w
~ + ~v · ~u (proprietà distributiva);
iii) λ(~v · w)
~ = (λ~v ) · w
~ = ~v · (λw)
~ (omogeneità).

Proposizione 1.11 (disuguaglianza di Cauchy-Schwarz). Si ha

|~v · w|
~ ≤ ||~v || · ||w||
~

Dimostrazione. Si deve verificare che


q q
|vx wx + vy wy | ≤ (vx )2 + (vy )2 · (wx )2 + (wy )2 .

Questa verifica la lasciamo per esercizio. 

Nel paragrafo § 7 verrà dimostrata la disuguaglianza di Cauchy-Schwarz per lo spazio Rn


(con n arbitrario).

Proposizione 1.12. ~ due vettori del piano. Si ha 16


Siano ~v e w

~v · w
~ = ||~v || · ||w||
~ · cosθ

dove θ è l’angolo compreso tra ~v e w


~.

Dimostrazione. Alle scuole superiori abbiamo visto che se a, b, c sono le misure dei lati di
un triangolo e θ è l’angolo indicato nella figura, allora

1

a · b · cosθ = 2 a2 + b 2 − c2 c
b

θ
a
16Non abbiamo mai definito l’angolo compreso tra due vettori; rispetto al nostro modo di procedere,  sarebbe
più corretto definire l’angolo θ compreso tra due vettori non nulli ~v e w
~ come l’arco-coseno di ~v · w
~ ||~v||·||w||
~
(numero che per la disuguaglianza di Cauchy-Schwarz ha valore assoluto minore o uguale ad uno). Cfr. § 7.
117

Applicando questa regola al triangolo individuato da ~v e w~ (per rappresentare i vettori ~v


e w~ usiamo dei segmenti orientati che hanno origine nello stesso punto, non importa quale
esso sia)

~v − w
~ a = ||~v ||
w
~
b = ||w||
~
c = ||~v − w||
~
θ
~v
troviamo
1 
||~v || · ||w||
~ · cosθ ||~v ||2 + ||w||
= ~ 2 − ||~v − w||
~ 2 = ~v · w
~
2
(la verifica dell’ultima uguaglianza è un facile esercizio: basta scrivere per esteso le espres-
sioni ivi coinvolte). 

Osservazione 1.13. In particolare, due vettori sono ortogonali se e solo se il loro prodotto
scalare è nullo (per definizione, il vettore nullo si considera ortogonale ad ogni vettore).

Proposizione 1.14 (disuguaglianza triangolare). Si ha ||~v + w|| ~ ≤ ||~v || + ||w||


~ .
 
Dimostrazione. Infatti, ||~v + w|| ~ 2 = ~v + w ~ = ||~v ||2 + ||w||
~ · ~v + w ~ 2 + ~v · w
~ +w ~ · ~v ≤
2
||~v ||2 + ||w||
~ 2 + 2|~v · w|
~ ≤ ||~v ||2 + ||w||
~ 2 + 2 ||~v|| · ||w||
~ = ||~v || + ||w||
~ (la seconda disuguaglianza
segue dalla disuguaglianza di Cauchy-Schwarz). 

Osserviamo che la disuguaglianza triangolare ci dice che la lunghezza di un lato di un


triangolo non può superare la somma delle lunghezze degli altri due lati:

~v + w
~
w
~ ||~v + w||
~ ≤ ||~v || + ||w||
~



~v

La Proposizione 1.12, o meglio, l’osservazione 1.13, ci consente di calcolare le proiezioni


ortogonali (figura 1.16). Siano ~v e w ~ due vettori del piano ed assumiamo w ~ 6= 0 . La
proiezione del vettore ~v lungo la direzione individuata da w ~ , che denoteremo con Πhwi
~ (~
v) ,
è il vettore
 
~v · w
~
(1.15) Πhwi
~ (~
v) = w
~
~ 2
||w||
(si osservi che tra le parentesi c’è un numero reale).

~v ~u
(fig. 1.16)

Πhwi
~ (~
v)

w
~
118
 
~
v ·w
~
Dimostrazione. Il vettore w
~ è un multiplo del vettore w
~ 2
||w|| ~ , quindi è sufficiente
 
verificare che il vettore differenza ~u := ~v − ||~vw||
·w
~
~ 2 w ~ è effettivamente perpendicolare al
vettore
h w
~ . Effettuiamo
 i tale verifica
 (calcoliamo il prodotto
 scalare
 ~ · ~u): si ha w
w ~ · ~u =
~
v ·w
~ ~
v ·w
~ ~
v ·w
~
~ · ~v −
w ~ 2
||w|| w
~ = ~v · w
~ − ~ 2
||w|| ~ · w)
(w ~ = ~v · w
~ − ~ 2
||w|| ~ 2 = ~v · w
||w|| ~ − ~v · w
~ = 0.

   
4 1
Esercizio. Siano ~v = e w~ = due vettori del piano Euclideo. Determinare
3 2
la proiezione di ~v lungo la direzione individuata da w ~.
   
~
v ·w
~ 10 1 2
Soluzione. Applicando la formula (1.15) si ha: Πhwi ~ (~ ~ 2 ·w
v ) = ||w|| ~ = 5 ·
2
=
4
.
    
4 −5
Esercizio 1.17. Siano ~v = e w~ = . Determinare la proiezione Πhwi
~ (~
v) .
7 3
       
−2 6 −6 10
Esercizio 1.18. Siano ~v = , ~u1 = , ~u2 = , w
~= . Determinare
5 −15 15 4
a) la proiezione del vettore ~v lungo la direzione individuata dal vettore w~;
b) la proiezione del vettore ~v lungo la direzione individuata dal vettore ~u1 ;
c) la proiezione del vettore ~v lungo la direzione individuata dal vettore ~u2 .

Un altro corollario della Proposizione 1.12 è la proposizione che segue.

Proposizione 1.19. Siano ~v e w ~ due vettori del piano e sia A l’area del parallelogramma
che individuano (vedi figura). Si ha
 
vx wx
A = | det |,
vy wy
dove le barre verticali denotano la funzione modulo (valore assoluto).

w
~
θ
~v

Dimostrazione. Dalle scuole superiori sappiamo che A = ||~v ||·||w||·sen


~ θ (essendo θ l’angolo
individuato dai vettori ~v e w),
~ quindi è sufficiente
 provare
 che 2
2 2 2 vx wx
||~v || · ||w||
~ · sen θ = det .
vy wy
Si ha ||~v ||2 · ||w||
~ 2 · sen 2 θ = ||~v ||2 · ||w||
~ 2 · (1 − cos 2 θ) = ||~v ||2 · ||w||
~ 2 − ||~v ||2 · ||w||
~ 2 · cos 2 θ =
 2
||~v ||2 · ||w||
~ 2 − ~v · w~ , dove quest’ultima uguaglianza segue dalla Proposizione 1.12. A
questo punto resta da provare che    2
2 v wx
||~v ||2 · ||w||
~ 2 − ~v · w~ = det x .
vy wy
Per verificare quest’ultima formula è sufficiente calcolare esplicitamente ambo i membri
dell’uguaglianza (il conto algebrico non ha nulla di interessante quindi lo omettiamo; lo
studente lo svolga per esercizio). 
119

Gli esercizi che seguono sono parte integrante della teoria (=lo studente si risolva).

Esercizio 1.20. Determinare le coordinate


 del vettore rappresentato
  dal segmento orien-
5 6
tato di estremo iniziale P = ed estremo finale Q = .
11 7
Disegnare i due punti ed il vettore.

Esercizio 1.21. Dire quali sonole  coordinate dell’estremo finale di un segmento orientato
 
4 −3
che rappresenta il vettore ~v = ed il cui estremo iniziale è il punto P = .
5 2
Disegnare i due punti ed il vettore.

Esercizio 1.22.
 Determinare l’estremo iniziale del segmento orientato
   che rappresenta il
−7 5
vettore ~v = e che ha per estremo finale il punto P = .
18 −2
   
2 8
Esercizio. Determinare la distanza tra i punti P = , Q= .
1 5
 
6
Soluzione. Tale distanza è la lunghezza del vettore ~v = P Q = . Si ha
4
 
6 √ √
dist {P, Q} = ||~v || = || || = 62 + 42 = 52 .
4 

Esercizio
 1.23. Determinare
   le misure
  dei lati del triangolo di vertici
2 5 4
P = , Q = , R = .
−3 1 9
   
3 −5
Esercizio 1.24. Trovare il coseno dell’angolo compreso tra i vettori ~v = e w
~= .
4 12
Esercizio
  1.25. Determinare
  i
coseni
 degli angoli interni del triangolo di vertici
2 7 4
A = , B = , C = .
1 3 11
Suggerimento: si considerino i vettori rappresentati da AB, AC eccetera.

Esercizio 1.26. Trovare:


a) un vettore di norma uno;  
1
b) un vettore di norma uno parallelo al vettore ~v = ;
  2
2
c) un vettore ortogonale al vettore ~v = ;
5  
12
d) un vettore di norma 52 ortogonale al vettore ~v = .
−5
Suggerimento: si utilizzi l’osservazione (1.9).

Esercizio 1.27. Calcolare l’area del parallelogramma individuato dai vettori


   
3 −5
~v = e w
~= .
7 8
Esercizio 1.28. Calcolare l’area del parallelogramma individuato dai vettori
   
23 13
~v = e w
~= . Disegnare i vettori ed il parallelogramma.
7 4

Esercizio 1.29. Determinare le aree dei triangoli degli esercizi (1.23) e (1.25).
120

§2. Rette nel piano.

Secondo la definizione data nel cap. I, §11, una retta nel piano è un sottospazio affine di R2
di dimensione 1. Considerando R2 come piano Euclideo manteniamo la stessa definizione.
Naturalmente, considerando R2 come piano Euclideo17 , anche sulle rette che vi giacciono
sarà possibile misurare le distanze; in questo caso parleremo di rette Euclidee.

Per agevolare la lettura ricordiamo la definizione vista (adattandola al “nostro” piano


Euclideo H = R2 ).
 
x
Definizione. Una retta r del piano H è il luogo dei punti P = ∈ H che
y
soddisfano un’equazione di primo grado, i.e. un’equazione del tipo
(2.1) ax + b y + c = 0,
con a e b non entrambi nulli. Tale equazione si chiama equazione cartesiana della retta r .

Esiste un modo equivalente di introdurre la nozione di retta:


 
x
Definizione. Una retta r del piano H è il luogo dei punti P = ∈ H del tipo
y
(    
x = x0 + α t α 0
(2.2) , 6= ,
y = y0 + β t β 0
   
x0 α
dove P0 = è un punto fissato, ~v = è un vettore fissato e t ∈ R è un
y0 β
parametro (ad ogni valore di t corrisponde un punto di r ). Si noti che la (2.2) può essere
scritta nella forma compatta
(2.2′ ) P (t) = P0 + t~v , ~v 6= ~0 .
Le equazioni (2.2) prendono il nome di equazioni parametriche della retta r .

Nota. Può apparire bislacco sommare un vettore a un punto! ...a parte il fatto che
nulla vieta di definire algebricamente una tale somma (come somma delle coordinate), la
cosa ha geometricamente senso: la somma nella (2.2) P0 +t~v ha il significato geometrico di
considerare l’estremo finale del segmento orientato rappresentato dal vettore t~v , di estremo
iniziale P0 .

L’equivalenza delle due definizioni enunciate segue immediatamente dalla possibilità di


passare da un’equazione cartesiana a equazioni parametriche e viceversa. Risolvendo il
“sistema lineare” costituito dall’equazione (2.1) con i metodi visti nel capitolo I otteniamo,
in particolare, equazioni del tipo (2.2) (dove t è un parametro libero, vedi cap. I, §2). Il
passaggio da equazioni parametriche a cartesiane si effettua semplicemente eliminando il
parametro libero t , i.e. ricavando t da una delle due equazioni e sostituendo l’espressione
trovata nell’altra.

Esempio 2.3. Se r è la retta di equazioni parametriche


(
x = 2 + 5t
,
y = 3 − 2t
dalla prima equazione troviamo t = (x−2)/5 , sostituendo questa espressione nella seconda
equazione troviamo y = 3 − 2(x − 2)/5 = (19 − 2x)/5 , ovvero 2x + 5y − 19 = 0 ;
quest’ultima è un’equazione cartesiana di r .
17 Ricordo che come visto nel paragrafo precedente questo significa avere la possibilità di misurare distanze
e angoli.
121

Esercizio. Determinare un’equazione cartesiana della retta di equazioni parametriche



x = −18 − 15 t
.
y = 11 + 6 t
Se avete svolto correttamente l’esercizio avete ritrovato la retta dell’esempio precedente,
chiaramente equazioni diverse possono rappresentare la stessa retta.

I coefficienti delle equazioni che descrivono una retta hanno una importante interpre-
tazione geometrica. Cominciamo col caso parametrico (equazioni 2.2).

Proposizione 2.4. Si consideri


 la retta descritta dalle equazioni parametriche
 (2.2).
 Si
x0 α
ha che il punto P0 = appartiene alla retta, mentre il vettore ~v = è un
y0 β
vettore parallelo alla retta (cfr. fig. 2.5).

Dimostrazione. Il punto P0 appartiene alle retta in quanto lo otteniamo sostituendo il valore


t = 0 nelle equazioni (2.2), mentre ~v è il vettore rappresentato dal segmento orientato
P0 P1 , (essendo P1 il punto della retta ottenuto sostituendo il valore t = 1).
 
x0
P0 =
y0
(y) •

(fig. 2.5) ~v  
x0 + α
P1 =
• y0 + β

(x) r

   
2 5
Esempio. Il punto P0 = appartiene alla retta dell’esempio (2.3), il vettore ~v =
3 −2
è parallelo a tale retta.

Esercizio
 2.6.
 Determinare delle equazioni
 parametriche della retta passante per il punto
−1 5
P = e parallela al vettore ~v = .
4 9
Naturalmente la proposizione precedente può essere sfruttata per scrivere le equazioni
parametriche della retta passante per due punti.
   
px qx
Osservazione 2.7. La retta passante per i punti P = e Q = è descritta
py qy
dalle equazioni parametriche
(    
x = px + α t α qx − px
, dove = PQ =
y = py + β t β qy − py

   
4 7
Esempio. La retta passante per i punti P = e Q = è descritta dalle
2 4
equazioni parametriche (
x = 4 + 3t
y = 2 + 2t
 
3
Si noti che è il vettore rappresentato dal segmento orientato P Q .
2
122

Esercizio 2.8. Determinare


  delleequazioni
 parametriche che descrivono la retta passante
1 2
per i punti P = e Q = .
−4 3
 
a
Proposizione 2.9. Si ha la seguente interpretazione geometrica: il vettore ~v =
b
è ortogonale alla retta r di equazione cartesiana ax + b y + c = 0 (equaz. 2.1).

Dimostrazione. La retta r è parallela alla retta r′ di equazione ax  + b y = 0 (dimostratelo


a
per esercizio!), quindi è sufficiente verificare che il vettore è ortogonale alla retta
  b
x
r′ . Poiché la retta r′ passa per l’origine, i punti che ne soddisfano l’equazione
y
rappresentano anche vettori paralleli ad essa. D’altro
 canto, poiché
 l’espressione
 ax + b y
a x x
coincide con quella del prodotto scalare · , i punti di r′ sono i punti
b y y
del piano le cui coordinate annullano tale prodotto scalare. Infine, per l’osservazione (1.13)
l’annullarsi del prodotto scalare è la condizione di ortogonalità, pertanto
  l’equazione di r′
a
definisce la retta passante per l’origine ed ortogonale al vettore . 
b

La proposizione precedente può essere utilizzata per scrivere un’equazione cartesiana per
la retta ortogonale
  ad un vettore e passante per un  punto
 dati: la retta r passante per il
px a
punto P = ed ortogonale al vettore ~v = ha equazione cartesiana
py b

ax + b y − apx − b py = 0.

Infatti, il fatto che r debba avere un’equazione del tipo ax + by + c = 0 segue dalla
proposizione precedente, il passaggio per P impone la condizione apx + bpy + c = 0 , ovvero
fornisce c = −apx −bpy .
   
2 8
Esempio. La retta r ortogonale al vettore ~v = e passante per il punto P =
5 1
ha equazione cartesiana
2 x + 5 y − 21 = 0 .

Esercizio
  2.10. Determinare un’equazione cartesiana della retta r passante per il punto
6
P = e parallela alla retta s di equazione 2x − 3y + 1 = 0 .
7
Esercizio.
  Determinare un’equazione cartesiana della retta r passante per il punto
8 x = 4 + 2t
P = e parallela alla retta s di equazioni parametriche .
5 y = −3 + 7 t
Soluzione #1. Si trova un’equazione cartesiana di s e si procede come per l’esercizio
precedente.

   
2 7
Soluzione #2. Il vettore è parallelo ad s, ovvero ad r . Quindi è un vettore
7 −2
ortogonale ad r . Per la Proposizione 2.9, r ha un’equazione del tipo 7x − 2y + c = 0 .
Imponendo il passaggio per il punto P troviamo c = −46 .


x = 8 + 2t
Soluzione #3. La retta r è descritta dalle equazioni parametriche .
y = 5 + 7t
Un’equazione cartesiana la troviamo eliminando il parametro t .

123

Esercizio
  2.11. Determinare
 un’equazione cartesiana per la retta r passante per i punti
2 8
P = , Q = .
1 5
Esercizio
  2.12. Determinare un’equazione cartesiana della retta s passante per il punto
1
P = ed ortogonale alla retta r di equazione 2x − 3y − 4 = 0 .
5
L’intersezione di due rette si determina mettendo a sistema le rispettive equazioni carte-
siane. Si avrà un’unica soluzione quando le rette non sono parallele, si avranno infinite
soluzioni se le rette coincidono, mentre il sistema sarà incompatibile nel caso in cui le rette
sono parallele e distinte.

Esempio. Se r ed s sono lerette di equazioni cartesiane 2x−y+5 = 0 e 3x+y−10= 0 ,


2x − y + 5 = 0 1
risolvendo il sistema lineare si trova che si intersecano nel punto .
3x + y − 10 = 0 7
Esercizio. Determinare l’intersezione della
 retta r di equazione cartesiana 4x−3y+8 = 0
x = 3−t
con la retta s di equazione parametrica .
y = 8 − 2t
Soluzione. Naturalmente potremmo trovare un’equazione cartesiana di  s e procedere
 come
3−t
nell’esempio. Un altro modo di procedere è il seguente: P (t) = è il punto
8 − 2t
generico di s , sostituendone le coordinate nell’equazione di r troviamo
4(3 − t) − 3(8 − 2t) + 8 = 0 , quindi t = 2 .
Questo significa che il punto di s che corrisponde
  al valore del parametro t = 2 appartiene
1
anche ad r . In definitiva r ∩ s = P (2) = .
4 

Il caso in cui entrambe le rette sono data in forma parametrica si tratta in modo analogo (o
si confronta il punto generico dell’una con quello dell’altra, oppure si determina l’equazione
cartesiana di una o entrambe le rette e si procede come sopra).

Esercizio 2.13. Determinare equazioni cartesiane per le rette che seguono.


   
x = 3 + 2t x = 7 − 4t x = t x = t
r1 : ; r2 : ; r3 : ; r4 : .
y = 4 + 5t y = 14 − 10 t y = 5 y = t
Esercizio 2.14. Determinare equazioni parametriche per le rette che seguono.
r1 : 5x − 2y − 7 = 0 ; r2 : x − 2 = 0 ; r3 : y = 0 ; r4 : x − y = 0 .

Esercizio
  2.15. Determinare un’equazione cartesiana della retta s passante per il punto
6
P = ed ortogonale alla retta r di equazione 2x − 3y − 4 = 0 .
7
Esercizio 2.16. Determinare
  delle equazioni parametriche
 chedescrivono la retta passante
−1 −1
per il punto P = ed ortogonale al vettore ~v = .
3 3
Esercizio
 2.17. Determinare un’equazione
  cartesiana della retta s passante per il punto
−1 1
P = e parallela al vettore ~v = .
−1 2
Esercizio
  2.18. Determinare equazioni parametriche
  della retta s passante per il punto
4 3
P = ed ortogonale al vettore ~v = .
5 3
124
 
px
Proposizione. Sia r la retta di equazione ax + b y + c = 0 e sia P = un
py
punto del piano. La distanza di P da r , che per definizione è la “distanza minima”, cioè
il minimo tra le distanze di P dai punti di r , è data dalla formula
 | apx + bpy + c |
(2.19) dist P, r = √ ,
a2 + b 2

dove le barre verticali denotano la funzione modulo (valore assoluto).

•P

dist{P, r}
r

Q

Naturalmente va osservato che tale distanza minima esiste e viene realizzata dal punto
Q (vedi figura) di intersezione della retta r con la retta ortogonale ad essa passante per P .
Per questa ragione Q viene detto anche
proiezione ortogonale del punto P sulla retta r .

Dimostrazione. Effettuiamo il calcolo esplicito: la retta s passante per P ed ortogonale


ad r ha equazioni parametriche (cfr prop. 2.6)
(
x = px + at
y = py + b t

sostituendo queste equazioni nell’equazione cartesiana di r si ottiene l’equazione

a(px + at) + b (py + bt) + c = 0,


 
px + at0
quindi si trova che l’intersezione r ∩ s è data dal punto Q = , dove
py + bt0
t0 = (−apx − bpy − c)/(a2 + b2 ) . Infine, calcolando la distanza tra i punti P e Q (che
è anche la distanza del punto P dalla retta r) si ottiene il risultato annunciato:
   
at0 a | − apx − bpy − c|
dist{P, r} = ||P Q || = || || = |t0 | · || || = √ .
bt0 b a2 + b 2


La formula della distanza punto-retta è per un certo verso molto naturale. Infatti,
l’espressione apx + bpy + c si annulla sui punti di r , quindi definisce una funzione che si
annulla proprio sui punti che hanno distanza nulla dalla retta, ed è una funzione di primo
grado in x ed y . Ora, restringendo la nostra attenzione ad uno dei due semipiani in cui r
divide il piano, anche la nostra funzione distanza deve essere rappresentata da una funzione
di primo grado in x ed y e poiché anch’essa si annulla su r , deve essere proporzionale alla
funzione apx + bpy + c . Pertanto la distanza cercata deve soddisfare un’equazione del tipo

(⋆) dist P, r = γ · | apx + b py + c | ,

dove γ è una costante (= non dipende dal punto P ) opportuna. Quanto al fatto che
risulta γ = √a21+b2 voglio far notare che tale valore rende l’espressione (⋆) invariante per
cambiamenti dell’equazione cartesiana scelta per rappresentare r ...ed una formula che si
rispetti deve soddisfare tale condizione di invarianza!
125
 
4
Esercizio. Determinare la distanza del punto P = dalla retta r di equazione
7
cartesiana x + 2y − 3 = 0 .

Soluzione. Applicando la formula della distanza si trova


 √
dist P, r = | 4√+12·7 −3 |
2 +22
= √ 15
5
= 3 5.

 
0
Esercizio 2.20. Determinare la distanza del punto P = dalla retta r di equazione
4
5x − 2y − 7 = 0 .

§3. Geometria Euclidea del piano: applicazioni ed esercizi.

In questo paragrafo illustriamo come si risolvono alcuni problemi elementari.


     
2 8 7
Esercizio 3.1. Calcolare l’area A del triangolo di vertici P = ,Q= ,K= .
1 5 2
     
Qx − Px 8−2 6
Soluzione. Consideriamo i vettori ~v := P Q = = = e
      Q y − P y 5 − 1 4
Kx − Px 7−2 5
w
~ := P K = = = (vedi figura).
Ky − Py 2−1 1
 
•Q = 8
5
(y)

~v
 
•K = 7
2
w
~
• 2
P =
1
(x)
Si ha    
1 vx wx 1 6 5
A = |det | = |det | = 7.
2 vy wy 2 4 1 

   
3 3
Esercizio 3.2. Calcolare le aree dei triangoli T1 di vertici A = , B = ,
        7 −5
−4 −1 13 −7
C= ; T2 di vertici P = , Q= , K= .
9 −4 8 11

Esercizio
 3.3. Calcolare
  l’area A  del quadrilatero
  irregolare (disegnatelo) di vertici
−3 6 1 −4
P = , Q= , K= , W = .
1 5 −3 −5
Suggerimento: dividetelo in due triangoli, quindi procedete come nell’esercizio precedente.
126

Esercizio
 3.4. Calcolare
   l’area  A del pentagono
  irregolare
 divertici
−3 6 6 1 −4
P = ,Q= , E = , K = , W = .
1 5 1 −3 −5
Suggerimento: dividetelo in tre triangoli.

Esercizio
  3.5. Determinare il punto K ottenuto proiettando ortogonalmente il punto
0
P = sulla retta r di equazione x + 2y − 3 = 0 .
4

Soluzione #1. La retta r è descritta dalle equazioni parametriche (verificare!)



x = 3 − 2t
.
y = t
   
3 −2
In particolare, il punto Q = appartiene ad r nonché il vettore w ~ = è
0   1
−3
un vettore parallelo ad r . Proiettando il vettore ~v = Q P = sulla direzione
4
individuata da w ~ otteniamo
   
~v · w
~ 10 −2 −4
~u = Πhwi ~ (~
v ) = · w
~ = · = .
~ 2
||w|| 5 1 2

Poiché il punto K è l’estremo finale di un segmento orientato rappresentante il vettore ~u


e che ha origine nel punto Q (vedi figura), abbiamo
     
3 −4 −1
K = + =
0 2 2

(è opportuno verificare che le coordinate del punto K soddisfano l’equazione che definisce
  
la retta r e che il vettore K P = 0−(−1)
4−2 = 12 è perpendicolare al vettore w ~ = −2 1 , i.e.
il loro prodotto scalare è nullo. Queste due verifiche garantiscono la correttezza del risultato
trovato).

(y)  
0
•P = 4

 
−1 • ~v
K =
2  
~u 3
Q =
0

• (x)

r


Soluzione #2. Il punto K è il punto di intersezione della retta r con la retta ortogonale
ad r passante per P . Quest’ultima ha equazioni parametriche
(
x = t
(⋆)
y = 4 + 2t
127

Sostituendo queste equazioni nell’equazione di r troviamo t + 2(4 + 2t) − 3= 0 , quindi


−1
t = −1 . Sostituendo il valore t = −1 nelle equazioni (⋆) troviamo K = .
2


Si osservi che essendo K la proiezione ortogonale di P su r , si ha


     √
dist P, r = dist P, K = || −1 0 −1
2 − 4 || = || −2 || = 5

(questo è in accordo col valore |8−3|

5
= 5 previsto dalla formula (2.19)).

 
−1
Esercizio 3.6. Determinare la proiezione K del punto P = sulla retta r di
8
equazione 3x + 2y − 13 = 0 .
 
15
Esercizio 3.7. Determinare la proiezione K del punto P = sulla retta r di
5
equazione 4x − y − 4 = 0 .
   
−1 5
Esercizio 3.8. Determinare il punto medio M tra i punti P = , Q = .
7 3
Soluzione. Il punto M è l’estremo
 finale del segmento
 5 orientato
 di 2estremo
 iniziale P
rappresentato dal vettore 12 P Q : M = −1 7 + 1
2 3 − −1
7 = 5 (notiamo che si
ottiene la semi-somma delle coordinate di P e Q).


Esercizio
 3.9. Determinare
  un’equazione cartesiana dell’asse del segmento di vertici
−1 5
P = , Q = .
7 3  
6
Soluzione. Tale asse è ortogonale al vettore P Q = , quindi è descritto da
−4
un’equazione del tipo 6x − 4y + c = 0 . La costante c si può determinare in due
modi: i) si impone che la retta indicata sia equidistante da P e Q (dall’equazione
|6·(−1) − 4·7 + c| = |6·5 − 4·3 + c| si trova c = 8);  
2
ii) si impone il passaggio per il punto medio M = tra P e Q .
5 
     
15 1 2
Esercizio 3.10. Siano A = , O= , B = . Determinare la bisettrice
4 2 9
dell’angolo \AOB .
       
14 ′ 1 dist{O, B} 14 8
Soluzione. Risulta O A = , poniamo A = + dist{O, A} = (è il
2 2 2 3
punto sulla semiretta di origine O, contenente A, avente distanza da O pari alla distanza
dist{O, B} , convincersene!). Notiamo che gli angoli AOB \ e A \ ′ OB sono uguali, ma il

triangolo di vertici A′ , O, B ha il vantaggio di essere isoscele


  (di vertice O).

1 5
La bisettrice cercata è la retta passante per i punti O = ed M = (punto medio
2 6

tra A e B). Ha equazione x − y + 1 = 0 .

128

§4. Geometria Euclidea dello spazio.

Molte definizioni e risultati che vedremo in questo paragrafo generalizzano quelli visti
studiando il piano. Consideriamo lo spazio S (cfr. introduzione al capitolo) e fissiamo un
 di misura (figura 4.1). Ad ogni punto P ∈ S possiamo
sistema di riferimento ed unaunità
x
associare le sue coordinate  y  ∈ R3 e viceversa (figura 4.1). In questo modo i punti
z
dello spazio vengono messi in corrispondenza biunivoca con gli elementi di R3 .
asse (z)

z

 
x
(fig. 4.1) • P = y
z

x•

y

asse (x) asse (y)

Definizione 4.2. Un segmento orientato è un segmento che ha un estremo iniziale Q ed un


estremo finale P . Dichiariamo equivalenti due segmenti orientati Q P e Q′ P ′ se coincidono
a meno di una traslazione dello spazio (cioè se sono due lati opposti di un parallelogramma).
Per definizione, un vettore geometrico dello spazio è una classe di equivalenza di segmenti
orientati.
   
qx px
Definizione 4.3. Siano  qy  e  py  le coordinate di due punti Q e P . Per defini-
qz pz  
px − qx
zione, le coordinate del vettore rappresentato dal segmento orientato Q P sono  py − qy  .
pz − qz
Osserviamo che la definizione è ben posta: le coordinate di un vettore geometrico non
dipendono dal segmento orientato scelto per rappresentarlo (cfr. §1).

Osservazione/Definizione. L’insieme dei vettori geometrici dello spazio è in corrispon-


denza biunivoca con R3 . Definiamo la somma di due vettori geometrici ed il prodotto di
un vettore geometrico per uno scalare utilizzando le corrispondenti operazioni definite per
lo spazio vettoriale R3 . Chiaramente, queste operazioni arricchiscono l’insieme dei vettori
129

geometrici dello spazio S di una struttura di spazio vettoriale (cfr. cap. I, §8 def. 8.8). La
somma di due vettori geometrici è l’operazione analoga a quella vista studiando il piano
(cfr. §1).

   
vx wx
Definizione 4.3. Siano ~v =  vy  e w ~ =  wy  due vettori. Si definisce il loro
vz wz
prodotto scalare mediante la formula

~v · w
~ := vx wx + vy wy + vz wz .

Si definisce inoltre la norma, o lunghezza, di un vettore ponendo


√ q
||~v || := ~v · ~v = (vx )2 + (vy )2 + (vz )2

Osservazione. Analogamente a quanto accadeva per i vettori del piano, la norma del
vettore ~v coincide con la lunghezza di un segmento orientato che lo rappresenta. Inoltre,
se c ∈ R è una costante e ~v è un vettore si ha

|| c~v || = |c| · || ~v ||

(cfr. oss. 1.9). Continuano a valere anche le proprietà (1.10), la disuguaglianza di Cauchy-
Schwarz (1.11), la disuguaglianza triangolare e la Proposizione 1.12. Quest’ultima la ricor-
diamo:

(4.4) ~v · w
~ = ||~v || · ||w||
~ · cosθ

dove θ è l’angolo compreso tra ~v e w


~.

Osservazione. Di nuovo, due vettori sono ortogonali se e solo se il loro prodotto scalare
è nullo (cfr. oss. 1.13).

L’osservazione precedente ci consente di calcolare le proiezioni ortogonali: se ~v e w


~ sono
due vettori dello spazio (assumiamo w ~ 6= ~0), la proiezione del vettore ~v lungo la direzione
individuata da w ~ , che denoteremo con Πhwi ~ (~
v ) , è il vettore
 
~v · w
~
(4.5) Πhwi
~ (~
v) = ·w
~
~ 2
||w||

(la dimostrazione è identica a quella vista nel §1).

Passando dal piano allo spazio, la Proposizione 1.14 diventa più complicata:

Proposizione 4.6. ~ tre vettori dello spazio e sia V il volume del


Siano ~u , ~v e w
parallelepipedo (sghembo) che individuano. Si ha
 
ux uy uz
V = | det  vx vy vz  | ,
wx wy wz

dove, come al solito, le barre verticali denotano il valore assoluto.

La dimostrazione di questa proposizione la vedremo più avanti.


130

Nello spazio, esiste una nuova operazione tra vettori.


   
vx wx
Definizione 4.7. Dati due vettori ~v =  vy  e w ~ =  wy  , il prodotto vettoriale di
vz wz
~v con w~ , che si denota scrivendo ~v ∧ w
~ , è il vettore
 
vy wz − vz wy
~v ∧ w
~ :=  −vx wz + vz wx  .
vx wy − vy wx

C’è un modo per ricordarsi questa definizione. Infatti si ha


 
~e1 ~e2 ~e3
(4.7′ ) ~v ∧ w
~ = det  vx vy vz 
wx wy wz
     
1 0 0
dove ~e1 =  0  , ~e2 =  1  , ~e3 =  0  sono i vettori della base canonica di R3 .
0 0 1
Si noti che nella matrice indicata ci sono dei vettori nella prima riga e dei numeri nelle
altre righe, questo non è un problema: “il determinante è una formula” e per come sono
disposti vettori e numeri dentro la matrice in questione tale formula può essere applicata.
Ma vediamo cosa si ottiene. Sviluppando il determinante rispetto alla prima riga si ottiene
     
vy vz vx vz vx vy
~v ∧ w
~ = ~e1 · det − ~e2 · det + ~e3 · det
wy wz wx wz wx wy
(4.7′′ )

= (vy wz − vz wy ) ~e1 + (−vx wz + vz wx ) ~e2 + (vx wy − vy wx ) ~e3 ,

che è proprio l’espressione della Definizione 4.7. Osserviamo che le coordinatedi ~v ∧ w


~ sono

vx vy vz
(a meno del segno) i determinanti dei tre minori di ordine 2 della matrice ,
wx wy wz
in particolare sono tutte nulle se e solo se tale matrice ha rango strettamente minore di due,
ovvero se e solo i vettori ~v e w~ sono dipendenti. Ribadiamo il risultato trovato:

(4.8) ~ = ~0
~v ∧ w ⇐==⇒ ~v e w
~ sono dipendenti.

La (4.7′ ), o se preferite la (4.7′′ ), ha altre conseguenze importanti:

Proposizione 4.9. Il prodotto vettoriale è bi-lineare (= lineare come funzione di ognuno


dei suoi due argomenti) e antisimmetrico. Cioè:

~v ∧ (λ w
~1 + µw
~ 2) = λ~v ∧ w
~ 1 + µ~v ∧ w
~2 ,
(λ~v1 + µ~v2 ) ∧ w
~ = λ~v1 ∧ w
~ + µ~v2 ∧ w
~ ,
~v ∧ w
~ = −w
~ ∧ ~v

per ogni scelta delle costanti e dei vettori indicati.

Si osservi che il prodotto vettoriale non è commutativo (tant’è che ~v ∧ w


~ = −w
~ ∧ ~v ).

Dimostrazione. Segue dalla (4.7′ ) e dalle analoghe proprietà del determinante. 


131

Lemma 4.10. Siano ~u, ~v , w ~ tre vettori. Risulta


 
ux uy uz
(4.10′ ) ~u · (~v ∧ w)
~ = det  vx vy vz  .
wx wy wz

Dimostrazione. L’espressione (vy wz − vz wy )ux + (−vx wz + vz wx )uy + (vx wy − vy wx )uz è


esattamente ciò che si ottiene sia scrivendo il prodotto scalare a sinistra dell’uguaglianza che
scrivendo lo sviluppo di Laplace rispetto alla prima riga del determinante a destra. 

Il prodotto della (4.10′ ) è molto importante, tant’è che gli è stato dato un nome:

Definizione 4.11. Il prodotto ~u · (~v ∧ w)


~ si chiama prodotto misto (dei vettori ~u, ~v , w).
~

Ora ci poniamo l’obiettivo di caratterizzare geometricamente il prodotto vettoriale ~v ∧ w


~.
Già sappiamo che questo si annulla quando ~v e w~ sono dipendenti (osservazione 4.8), quindi
assumiamo che ciò non accada, cioè che ~v e w~ individuino un piano. In questo caso:

(4.12) ~v ∧ w
~ è ortogonale al piano individuato da ~v e w
~
Dimostrazione. È sufficiente verificare che ogni vettore di tale piano è ortogonale a ~v ∧ w
~.
Se ~u è un vettore appartenente a tale piano, cioè se è una combinazione lineare dei vettori
~v e w~ , allora il determinante che compare nella (4.10′ ) si annulla, quindi il prodotto misto
si annulla, quindi ~u e ~v ∧ w
~ sono ortogonali. 

Resta da capire qual è la norma (lunghezza) e qual è il verso di ~v ∧ w ~ . Questi sono


rispettivamente l’area del parallelogramma individuato da ~v e w ~ ed il verso che rende
positiva l’orientazione della terna {~v, w,
~ ~v ∧ w}
~ (cioè, in termini algebrici, si richiede che
il determinante della matrice associata ai tre vettori sia positivo; è opportuno notare che
noti due vettori, direzione e modulo del terzo, ad ognuno dei due possibili versi del terzo
corrisponde uno dei due segni del determinante della matrice associata ai tre vettori, si
veda anche l’inciso 4.14. In termini “fisici”, si richiede che la posizione nello spazio dei tre
vettori, nell’ordine indicato, appaia come quella di pollice indice e medio della mano destra).
Ricapitolando:

Proprietà 4.13. Da un punto di visto geometrico il prodotto vettoriale è caratterizzato


dalle proprietà che seguono.
i) ~ = ~0 se e solo se ~v e w
~v ∧ w ~ sono dipendenti;
ii) ~v ∧ w~ ⊥ Span{~v , w} ~ (il simbolo ⊥ denota l’ortogonalità);
iii) la norma di ~v ∧ w ~ è uguale all’area del parallelogramma individuato da ~v e w ~;
~ 6= ~0 , la terna {~v, w,
iv) se ~v ∧ w ~ ~v ∧ w}
~ è positivamente orientata.

Dimostrazione. Le proprietà i) e ii) sono la (4.8) e la (4.12) (ricordiamo la convenzione


secondo la quale il vettore nullo è ortogonale a qualsiasi vettore). Proviamo la iii). In-
dichiamo con A e θ l’area del parallelogramma e l’angolo individuati da ~v e w ~ . Risulta

A2 = ||~v ||2 · ||w||


~ 2 · sen 2 θ = ||~v ||2 · ||w||
~ 2 (1 − cos 2 θ) = ||~v ||2 · ||w||
~ 2 − (~v · w)
~ 2

(si noti che l’espressione che appare a destra è un polinomio18 che sappiamo scrivere).
~ 2 è un polinomio che sappiamo scrivere (def. 4.7
D’altro canto anche l’espressione ||~v ∧ w||
e 4.3). Queste due espressioni coincidono (lo studente le scriva entrambe).
La proprietà iv) merita un approfondimento sul concetto di orientazione, la dimostriamo
nell’inciso che segue (cfr. inciso 4.14). 
18 Nelle coordinate di ~v e w
~.
132

Inciso 4.14. Consideriamo una base ordinata19 B = {~v1 , ~v2 , ~v3 } di R3 . Ci sono due
possibilità: il determinante della matrice associata ai vettori può essere positivo o negativo.
Nel primo caso diremo che B è positivamente orientata, nel secondo caso diremo che è
negativamente orientata. Utilizzando questa definizione la dimostrazione della proprietà
(4.13, iv )) è immediata: posto ~u = ~v ∧ w ~ , il determinante della matrice associata alla
terna {~v, w,~ ~v ∧ w}
~ soddisfa
    Lemma (4.10)
| | | ux uy uz ւ
det  ~v ~  = det  vx
~ ~v ∧ w
w vy vz  = ~u · (~v ∧ w) ~ 2 > 0
~ = ||~v ∧ w||
| | | wx wy wz

Appena prima della (4.13) abbiamo introdotto anche una nozione a priori differente: ab-
biamo detto che una terna (ordinata, indipendente) di vettori è positivamente orientata se
“la posizione nello spazio dei tre vettori, nell’ordine indicato, appare come quella di pollice
indice e medio della mano destra”. Dietro l’equivalenza delle due definizioni ci sono alcuni
fatti e una convenzione:
I fatti. Dato uno spazio vettoriale20 astratto (cap. I, def. 8.8), l’insieme di tutte le sue
possibili basi (ordinate) è dotato di una naturale relazione di equivalenza che lo divide in due
sottoinsiemi: due basi appartengono allo stesso sottoinsieme se e solo se il determinante della
matrice del cambiamento di base è positivo; equivalentemente, è possibile passare dall’una
all’altra con continuità. Per “l’esempio spazio fisico” i due sottoinsiemi di cui sopra sono
rispettivamente quelli costituiti dalle basi identificabili con pollice, medio e indice della mano
destra e quelli costituiti dalle basi identificabili con la mano sinistra. Questa affermazione
vale per ragioni di continuità (mi rendo conto che ciò possa sembrare un po’ “scivoloso”, visto
che lo spazio fisico matematicamente non esiste; naturalmente esiste -matematicamente- il
modello R3 che lo rappresenta ...ma per esso non ha alcun senso parlare di mano destra o
sinistra!). Per definizione, un’orientazione di uno spazio vettoriale è la scelta di uno dei due
possibili insiemi ed una base si dirà positivamente orientata se appartiene all’insieme scelto.
Non esiste una scelta universale, per l’esempio R3 si sceglie l’insieme contenente la base
canonica, per lo spazio fisico si sceglie l’insieme individuato (vedi sopra) dalla mano destra.
La convenzione. Lo spazio fisico si rappresenta orientando i tre assi coordinati in modo che
siano sovrapponibili a pollice, medio e indice della mano destra (cioè come nella figura 4.1).

Studiando la geometria Euclidea del piano abbiamo visto che l’area del parallelogramma
individuato da due vettori è il modulo del determinante associato (Proposizione 1.19). Nello
spazio abbiamo che l’area del parallelogramma individuato da due vettori è la norma del
loro prodotto vettoriale. Faccio notare che questi due risultati sono molto meno distanti di
quanto possa sembrare, o meglio che il secondo generalizza il primo: due vettori nel piano
li possiamo considerare come vettori nello spazio introducendo una terza coordinata nulla,
d’altro canto risulta      
vx wx 0
 vy  ∧  wy  =  0 
0 0 vx wy − vy wx

e la norma di questo vettore è il modulo della sua terzacoordinata (l’unica non nulla), che
vx vy
a sua volta è il modulo del determinante della matrice .
wx wy

Finalmente, come promesso, dimostriamo la Proposizione 4.6.

Dimostrazione (della Proposizione 4.6). Assumiamo che i tre vettori siano indipendenti

19 Questo significa che fissiamo l’ordine in cui scriviamo i vettori.


20 Finitamente generato.
133

(altrimenti il volume ed il determinante in questione sono nulli e non c’è nulla da dimostrare).
Sia P il parallelogramma individuato da ~v e w ~ , sia A la sua area e sia θ l’angolo
compreso tra il vettore ~u ed il piano del parallelogramma P . Si osservi che l’angolo
compreso tra ~u e la retta ortogonale al parallelogramma P è pari a π/2 − θ e che questa
retta rappresenta la direzione individuata dal vettore ~v ∧ w~ (proprietà 4.13, ii)). Si ha

V = A · ||~u|| · |senθ| = A · ||~u|| · |cos π/2 − θ |

= ||~v ∧ w||
~ · ||~u|| · |cos π/2 − θ |
= |~u · (~v ∧ w)|
~
 
ux uy uz
= |det  vx vy vz  |
wx wy wz

dove la 1a uguaglianza segue dal fatto che l’altezza relativa alla base P del nostro paralle-
lepipedo vale ||~u|| · |sen θ|, la 2a è ovvia, la 3a segue dalla proprietà (4.13, iii)) del prodotto
vettoriale, la 4a dalla formula (4.4), la 5a dalla (4.10′ ). 

Concludiamo il paragrafo con alcuni esercizi che lo studente dovrebbe essere in grado
di risolvere senza problemi (le tecniche di risoluzione viste nei paragrafi relativi al piano
Euclideo si adattano mutatis mutandis anche allo spazio Euclideo).

Esercizio 4.15. Si considerino i seguenti punti e vettori geometrici dello spazio Euclideo:
             
5 −1 1 3 −7 1 3
P =  −2 , Q =  7 , R = −1, ~u = −6, ~v =  18 , w ~ =  2 , ~z =  1 .
1 2 3 2 5 1 2
a) Calcolare le coordinate del vettore geometrico rappresentato dal segmento orientato QR;
b) determinare l’estremo iniziale del segmento orientato che rappresenta il vettore ~v , di
estremo finale il punto P ;
c) calcolare la distanza tra i punti P e Q ;
d) calcolare il coseno dell’angolo compreso tra i vettori ~v e w ~;
e) trovare un vettore di norma 35 parallelo al vettore ~u ;
f ) trovare un vettore ortogonale al vettore ~v ;
g) trovare due vettori indipendenti ortogonali al vettore ~v ;
h) calcolare i prodotti vettoriali ~u ∧ ~v , ~u ∧ w ~ , ~u ∧ ~z , w
~ ∧ ~z
(in tutti i casi, verificare che il risultato ottenuto è ortogonale a entrambi gli argomenti);
i) trovare due vettori ~a e ~b ortogonali tra loro ed ortogonali al vettore ~u ;
l) calcolare l’area del parallelogramma individuato dai vettori ~v e w ~;
m) calcolare l’area del triangolo di vertici P, Q, R ;
n) calcolare i coseni degli angoli interni del triangolo di vertici P, Q, R ;
o) calcolare il volume del parallelepipedo sghembo di spigoli ~v , w, ~ ~z .
p) calcolare il volume Ω del parallelepipedo di spigoli ~a, b, ~u (dove ~a e ~b sono i vettori
~
del punto di domanda i)), verificare che risulta Ω = ||~u|| · ||~a|| · ||~b|| = 7 · ||~a|| · ||~b|| , interpretare
geometricamente questo risultato;
q) supponiamo di occupare la posizione del punto R e di guardare un topolino che cammina
lungo il triangolo di vertici O, P, Q (essendo O l’origine di R3 ) seguendo il percorso
O P Q O . In quale verso lo vedrò girare (orario o antiorario)?
134

§5. Rette e piani nello spazio.

Per definizione, rette e piani nello spazio S = R3 sono rispettivamente i sottospazi affini
di dimensione 1 ed i sottospazi affini di dimensione 2. Dalla teoria svolta sui sistemi lineari
questi possono essere definiti sia per via cartesiana che parametrica. Per fissare le notazioni
ed agevolare la lettura ricordiamo le definizioni.
 
x
Definizione. Un piano π dello spazio S è il luogo dei punti P =  y  che soddisfano
z
un’equazione di primo grado (detta equazione cartesiana), cioè un’equazione del tipo

(5.1) ax + b y + cz + d = 0 , rango a b c = 1

(i.e. a, b, c non sono tutti nulli). Equivalentemente, è il luogo dei punti P descritto
parametricamente dalle equazioni
  
 x = x0 + λ1 t
 + µ1 s λ1 µ1
(5.2) y = y0 + λ2 t + µ2 s , rango  λ2 µ2  = 2


z = z0 + λ3 t + µ3 s λ3 µ3

dove x0 , y0 , z0 , λ1 , λ2 , λ3 , µ1 , µ2 , µ3 sono coefficienti fissati (soddisfacenti la condizione


indicata) e dove t ed s sono parametri liberi.

Come sappiamo, l’equivalenza delle due formulazioni segue dal fatto che è possibile passare
dalla (5.1) alla (5.2) risolvendo il sistema lineare (che essendo di rango 1 produrrà 2 parametri
liberi) e, viceversa, è possibile passare dalla (5.2) alla (5.1) eliminando i parametri.
 
x
Definizione. Una retta r dello spazio S è il luogo dei punti P =  y  che soddisfano
z
un sistema lineare (le cui equazioni sono dette equazioni cartesiane) del tipo
(  
ax + b y + cz + d = 0 a b c
(5.3) , rango = 2.
a′ x + b′ y + c′ z + d′ = 0 a′ b ′ c′

Equivalentemente, è il luogo dei punti P descritto parametricamente dalle equazioni


  
x =
 x0 + α1 t α1
(5.4) y = y0 + α2 t , rango  α2  = 1


z = z0 + α3 t α3

dove x0 , y0 , z0 , α1 , α2 , α3 sono coefficienti fissati (soddisfacenti la condizione indicata)


e dove, come al solito, t è un parametro libero.

Di nuovo, la condizione sul rango della matrice incompleta associata al sistema (5.3) ne as-
sicura la compatibilità ed il fatto che questo ha soluzioni dipendenti da un parametro libero,
ovvero soluzioni come descritto dalla (5.4). Naturalmente, l’eliminazione del parametro
consente il passaggio inverso, quello dalla (5.4) alla (5.3).

Va osservato che ognuna delle due equazioni che compaiono nella (5.3) descrive un piano,
metterle a sistema significa considerare l’intersezione dei piani che (prese singolarmente)
descrivono. La già citata condizione sul rango della matrice incompleta associata al sistema
(5.3) è, da un punto di vista geometrico, la condizione di non parallelismo tra i piani che
stiamo intersecando.
135

Ora vogliamo fornire un’interpretazione geometrica dei coefficienti x0 , y0 , z0 , λ1 , λ2 , λ3 ,


µ1 , µ2 , µ3 , α1 , α2 , α3 che compaiono nelle equazioni parametriche (5.2) e (5.4). A tal
fine introduciamo il punto P0 ed i vettori geometrici ~λ, ~µ, α
~ ponendo
       
x0 λ1 µ1 α1
P0 =  y0  , ~λ =  λ2 , µ
~ =  µ2  , α
~ =  α2  .
z0 λ3 µ3 α3

Usando la notazione introdotta possiamo riscrivere la (5.2) e la (5.4) come segue

(5.2′ ) P (t, s) = P0 + t ~λ + s ~µ , dim Span {~λ, µ


~} = 2

(5.4′ ) P (t) = P0 + t α
~ , ~ 6= ~0
α

Come già osservato nel paragrafo § 2, notiamo che sommare un vettore a un punto ha il
significato geometrico di considerare l’estremo finale del segmento orientato rappresentato
dal vettore di estremo iniziale il punto. Il motivo per il quale si sceglie di interpretare la
terna x0 , y0 , z0 come punto e le terne λ1 , λ2 , λ3 , µ1 , µ2 , µ3 , α1 , α2 , α3 come vettori
geometrici (che è la domanda che probabilmente vi state ponendo!) sta nei seguenti fatti:
i) Il punto P0 è effettivamente un punto del piano π si ottiene per t = s = 0
(ovvero è un punto della retta r , si ottiene per t = 0);
ii) i vettori ~λ e ~ µ sono vettori21 paralleli al piano π (ovvero α
~ è un vettore parallelo
alla retta r );
iii) P (t, s), che è un punto in quanto elemento del piano π, è l’estremo finale del seg-
mento orientato di estremo iniziale P0 , rappresentato dal vettore t ~λ + s~µ (ovvero
è l’estremo finale del segmento orientato di estremo iniziale P0 , rappresentato dal
vettore t α~ ).

Osserviamo che come conseguenza della proprietà ii) e della (4.13, i) e ii)) risulta

(5.5) ~λ ∧ µ
~ ⊥ π (nonché ~λ ∧ µ
~ 6= ~0 ) .

Anche i coefficienti delle equazioni cartesiane (5.1) e (5.3) hanno una interpretazione
geometrica:
Il vettore di coordinate a, b, c è un vettore (non nullo per ipotesi) ortogonale al
(5.6) piano π ;
il piano generato dai vettori di coordinate a, b, c ed a′ , b′ , c′ indipendenti per
(5.7)  
l’ipotesi rango aa′ bb′ cc′ = 2 nella 5.3 è ortogonale alla retta r .

Dimostrazione. La dimostrazione della (5.6) è identica a quella della Proposizione (2.9):


l’espressione ax+by+cz coincide col prodotto scalare dei vettori ~n e ~v rispettivamente di
coordinate a, b, c e x, y, z , ne segue che i punti del piano π ′ di equazione ax+by+cz = 0
sono gli estremi finali dei vettori ~v ortogonali ad ~n , di estremo iniziale l’origine, ovvero che
π ′ è ortogonale ad ~n . Essendo π ′ e π ′ paralleli, anche π è ortogonale ad ~n .
La (5.7) segue dalla (5.6): il vettore ~n di coordinate a, b, c è ortogonale ad un piano
contenente r (il piano descritto dalla prima equazione), quindi è ortogonale ad r , stesso
discorso per il vettore ~n′ di coordinate a′ , b′ , c′ . Abbiamo due vettori (~n ed ~n′ ) entrambi
ortogonali ad r , anche il piano che generano è ortogonale ad r . 

21 Mentre interpretarli come punti non avrebbe alcun significato geometrico.


136

Alla luce del fatto che il prodotto vettoriale di due vettori indipendenti è ortogonale (e
non nullo) al piano che essi generano (proprietà 4.13, i) e ii)), la (5.7) può essere riscritta
nella forma
   ′
a a
(5.7′ ) il prodotto vettoriale  b  ∧  b′  è parallelo alla retta r .
c c′
(
2 x − y + 3 z − 11 = 0
Esempio. Sia r la retta di equazioni cartesiane . Il
3 x + 5 y − 8 z + 19 = 0
     
2 3 −23
vettore  −1  ∧  5  =  −7  è parallelo ad essa.
3 8 13

Naturalmente le interpretazioni geometriche dei coefficienti delle equazioni di rette e piani


possono essere utilizzate per scrivere le equazioni di rette e piani dei quali ne conosciamo una
descrizione geometrica. Per intenderci, ad esempio, dovendo scrivere equazioni parametriche
per il piano passante per un dato punto P0 nonché parallelo ai vettori ~λ e µ ~ scriveremo
l’equazione (5.2). Vediamo un altro esempio: dovendo scrivere un’equazione cartesiana per
il piano passante per il punto P0 di coordinate 5, 1, 3 , ortogonale al vettore di coordinate
2, 7, 4 , scriveremo l’equazione (5.1) 2x + 7y + 4z − 29 = 0 (avendo ricavato d = −29
imponendo il passaggio per P0 ).

Esercizio 5.8. Si considerino i punti e vettori geometrici che seguono


         
1 5 7 2 6
P =  2 , Q =  2 , ~v =  0 , w ~ =  1 , ~r =  2 
3 1 −1 4 9
a) Scrivere equazioni parametriche per il piano passante per P , parallelo ai vettori ~v , w
~;
b) scrivere un’equazione cartesiana per il piano passante per Q , ortogonale al vettore ~r ;
c) scrivere equazioni parametriche per la retta passante per P , parallela al vettore ~v ;
d) scrivere equazioni cartesiane per la retta passante per Q , ortogonale ai vettori w,
~ ~r .

Nell’esercizio precedente le informazioni delle quali abbiamo bisogno sono “immediata-


mente disponibili”, quando ciò non accade... le cerchiamo! Ad esempio, qualora ci venga
chiesto di scrivere un’equazione cartesiana per il piano di cui all’esercizio (5.8, a)), calcole-
remo il prodotto vettoriale ~v ∧ w~ (in modo da ottenere un vettore ortogonale al piano in
questione, ovvero i coefficienti a, b, c di una sua equazione cartesiana), quindi imporremo
il passaggio per il punto P per determinare il coefficiente d.

Tornando un momento alla (5.2), poiché i vettori λ e µ sono paralleli al piano ivi descritto
ed il punto P0 di coordinate x0 , y0 , z0 vi appartiene, abbiamo la seguente interessante
rilettura di quanto appena osservato:

Osservazione 5.9. Il piano π definito dal sistema (5.2) ha equazione cartesiana

(5.9′ ) ax + by + cz + d = 0

dove a, b, c sono le coordinate del prodotto vettoriale ~λ ∧ ~µ e dove d = −ax0 − by0 − cz0
(si noti che la condizione su d garantisce il passaggio per il punto P0 ).

Naturalmente, per trovare un’equazione cartesiana del piano definito dal sistema (5.2) si
può procedere anche eliminando i parametri.

Esercizio. Scrivere, sia equazioni cartesiane che parametriche per ognuno dei piani e rette
dell’esercizio (5.8).
137

Abbiamo introdotto rette e piani in R3 come oggetti descritti da equazioni cartesiane,


ovvero parametriche. Le equazioni parametriche di rette e piani le abbiamo scritte nelle
forme (5.4′ ) e (5.2′ ) osservando quale fosse il significato del punto e dei vettori che vi
appaiono. Ci proponiamo di andare un minimo più a fondo su queste equazioni.

Cominciamo col caso della retta descritta dalla (5.4′ ). Il punto P1 := P (1) è l’estremo
finale del segmento orientato di estremo iniziale P0 rappresentato da dal vettore α (ed è
distinto da P0 in quanto α~ è non-nullo). Visto che la coppia P0 , P1 determina la coppia
P0 , α
~ e viceversa, abbiamo la seguente conseguenza:
per due punti distinti passa una ed una sola retta
(il risultato è ben noto, quello che stiamo dicendo è che lo abbiamo dedotto dalla nostra
definizione di retta). Un’altra conseguenza è la seguente:

Osservazione 5.10. Siano A, B, C tre punti dello spazio. Questi risultano allineati
(cioè esiste una retta che li contiene) se e solo se i due vettori rappresentati da AB ed AC
sono dipendenti.

Dimostrazione. Assumendo A e B distinti (altrimenti il risultato è banale), il punto C


appartiene alla retta di equazione P (t) = A + tAB se e solo se si ottiene per un qualche
valore t̃, cioè se e solo se possiamo scrivere C = A + t̃ AB , se e solo se AC = t̃AB . 

Passiamo ora al caso del piano descritto dalla (5.2′ ), posto Q := P (1, 0) = P0 + ~λ
ed R := P (0, 1) = P0 + ~ µ , essendo ~λ e µ~ indipendenti abbiamo tre punti non-allineati
(oss. 5.10) appartenenti al piano in questione. La terna P0 , Q, R determina la terna
P0 , ~λ, ~µ e viceversa, i vettori che si ottengono partendo da una terna di punti non allineati
sono indipendenti (di nuovo, oss. 5.10). Pertanto
per tre punti non allineati passa uno ed un solo piano
Di nuovo, da notare che (al di là dell’evidenza “fisica”) abbiamo dedotto questo risultato
dalla nostra definizione di piano.

Le considerazioni viste ci dicono anche come scrivere le equazioni della retta passante
per due punti, ovvero del piano passante per tre punti non allineati: si tratta di scegliere
un punto e calcolare il vettore rappresentato dal segmento orientato che lo congiunge con
l’altro punto, ovvero di scegliere un punto e calcolare i vettori rappresentati dai segmenti
orientati che lo congiungono con gli altri due punti. Ovviamente scelte diverse porteranno a
equazioni diverse (ma sappiamo bene che lo stesso oggetto può essere rappresentato in modi
differenti).

È opportuno osservare che quanto abbiamo detto già lo sapevamo: si tratta di casi par-
ticolari della Proposizione (11.17). Ad esempio, per n = 3 e k = 2 la proposizione citata
ci dice che per tre punti non allineati22 passa uno ed un solo piano (ivi descritto sia come
“ V + P0 ” che come “più piccolo piano affine contenente i tre punti”).

Esercizio 5.11. Scrivere equazioni parametriche per il piano passante per i punti
     
2 6 4
P = 0, Q = 5 K = 9.
1 7 8
Suggerimento: calcolare ~λ = P Q e ~
µ = PK.

22Essendo k = 2 , il termine “generici” che appare nella Proposizione (11.14) significa, come definito poco
prima “non contenuti in nessuno spazio affine di dimensione 1”
138

Le intersezioni tra piani, tra rette, tra rette e piani, si determinano mettendo a sistema
le equazioni cartesiane degli oggetti geometrici in questione.

Infatti, molto più in generale “intersecare” corrisponde a “mettere a sistema equazioni”:


ad esempio, se A e B sono due sottoinsiemi di Rn ognuno dei quali è definito come il
luogo comune degli zeri di un certo insieme di equazioni, un punto P appartiene alla loro
intersezione se e solo se soddisfa il sistema costituito da tutte le equazioni in questione.

Naturalmente questo discorso vale per le equazioni cartesiane, equazioni che sono “con-
dizioni”. Se gli oggetti in questione sono definiti tramite equazioni parametriche, equazioni
che di fatto sono un modo di “elencarne gli elementi”, si procede in modo del tutto analogo
a quanto visto nel § 10 per l’intersezione di spazi vettoriali. Vediamo qualche esempio.

Esercizio.
 Determinare il punto P di intersezione della retta r di equazioni parametriche
 x = 2 + 7t
y = 5 + 2t con il piano H di equazione cartesiana x − 3y + 5z − 43 = 0 .

z = 8 + 3t
Soluzione. Sostituendo x = 2 + 7t, y = 5 + 2t, z = 8 + 3t nell’equazione di H troviamo
(2 + 7t) − 3(5 + 2t) + 5(8 + 3t) − 43 = 0 , quindi t = 1 . Sostituendo il valore t = 1 nelle
equazioni parametriche di r troviamo le coordinate 9, 7, 11 (del punto P = H ∩ r ).


Esercizio. Determinare
 un’equazione parametrica della retta r ottenuta intersecando i
 x = 2 + 7t + 2s 
piani H := y = 4 + 2t − 6s ed H′ := 8x − 3y − 7z − 4 = 0 .

z = 8 + 3t + 5s

Soluzione #1. Innanzi tutto si trova un’equazione cartesiana anche per il piano H (uti-
lizzando la (5.9) oppure eliminando i parametri). Quindi, si risolve il sistema costituito
dall’equazione trovata e l’equazione di H′ .


Soluzione #2. Imponendo che le espressioni 2 + 7t + 2s, 4 + 2t − 6s, 8 + 3t + 5s soddisfino


l’equazione di H′ si trovano le coordinate dei punti di H che appartengono anche ad
H′ (= punti della retta r ). Operativamente, questo significa che si procede come segue:
sostituendo le espressioni di cui sopra nell’equazione di H′ si trova 8(2 + 7t + 2s) − 3(4 +
2t − 6s) − 7(8 + 3t + 5s) − 4 = 0 , quindi s = 29t − 56 . Ne segue che il sistema

 x = 2 + 7 t + 2 (29t − 56) = −110 + 65 t
y = 4 + 2 t − 6 (29t − 56) = 340 − 172 t

z = 8 + 3 t + 5 (29t − 56) = −272 + 148 t
descrive parametricamente la retta r .


Per quel che riguarda la distanza di un punto da un piano, vale una formula analoga alla
(2.19). Si ha infatti quanto segue.

Proposizione 5.12. Sia π il piano di equazione ax + b y + cz + d = 0 e sia


P un punto dello spazio (di coordinate px , py , pz ). La distanza di P da π , che per
definizione è la “distanza minima”, cioè il minimo tra le distanze di P dai punti di π , è
data dalla formula
 | apx + bpy + cpz + d |
(5.12′ ) dist P, π = √ ,
a2 + b 2 + c2
dove le barre verticali denotano la funzione modulo (valore assoluto).

Vale un commento analogo a quello relativo alla (2.19): tale “distanza minima” esiste e
139

viene realizzata dal punto K di intersezione del piano π con la retta r passante per P ed
ortogonale a π . Di nuovo, per questo motivo tale punto K viene anche chiamato
proiezione ortogonale del punto P sul piano π .

La dimostrazione della formula (5.12′ ) è del tutto identica alla dimostrazione della (2.19).

Alla luce di quanto visto all’inizio del paragrafo la retta r ortogonale a π passante per
P ha equazioni parametriche 
x = px + at
y = py + b t

z = pz + ct
dove a, b, c sono proprio i coefficienti che appaiono nell’equazione del piano π ! Questa
osservazione ci consente di risolvere l’esercizio che segue.

Esercizio 5.14. Sia P il punto di coordinate 1, −4, 8 e sia π il piano di equazione


3x+ y + 7z + 4 = 0 . Determinare il punto K ottenuto proiettando ortogonalmente il punto
P sul piano π . Verificare che la distanza dist{P, K} coincide con la distanza dist{P, π}
prevista dalla formula (5.12′ ).

Soluzione. Il vettore di coordinate 3, 1, 7 è ortogonale al piano π . Ne segue che la retta


r di equazioni parametriche 
x = 1 + 3t
y = −4 + t

z = 8 + 7t
è la retta ortogonale a π passante per P . Le coordinate del punto K = r ∩ π le
troviamo sostituendo le equazioni parametriche di r nell’equazione cartesiana di π (si
ottiene t = −1), quindi sostituendo il valore t = −1 nelle equazioni di r si trovano le
coordinate −2, −5, 1 del punto K . Infine,
√ √
dist{P, K} = ||P K|| = 59 , dist{P, π} = | 3·1+1+7·7+4

32 +12 +72
|
= √5959 = 59 .


Quanto alla distanza punto-retta nello spazio non c’è una formula diretta. Naturalmente
le definizioni sono le stesse: dati un punto P ed una retta r si definisce lo loro distanza
dist{ P, r} come il minimo delle distanze di P dai punti di r . Tale minimo viene realizzato
dal punto K che si ottiene intersecando r con il piano ortogonale ad r passante per P .
Va osservato che K è anche caratterizzato dall’essere l’unico punto di r soddisfacente la
condizione K P ⊥ r (esattamente come nel caso discusso nel § 2 di un punto e una retta
nel piano). Le coordinate del punto K possono essere determinate con metodi analoghi a
quelli visti nell’esercizio (3.5) del §3:
i) si sceglie un punto Q di r , si proietta il vettore QP su un vettore parallelo
ad r , si determina K come estremo finale di un segmento orientato che ha Q
come estremo iniziale e che rappresenta il vettore proiezione trovato;
ii) si interseca r con il piano passante per P ortogonale a r .
Naturalmente, per calcolare la distanza di P da r dovremo prima determinare il punto di
proiezione K quindi la distanza dist{P, K} .

Esercizio 5.15. Determinare


 la proiezione K del punto P di coordinate 3, 3, 10 sulla
x = 5 + 3t
retta r di equazioni y = 3 + t . Calcolare inoltre la distanza dist{P, r} .

z = 7 − 2t
140
   
5 3
Soluzione #1. Il punto Q :=  3  appartiene ad r nonché il vettore w ~ =  1 
7 −2
è un vettore parallelo ad r . Proiettando il vettore ~v = Q P (di coordinate −2, 0, 3 )
sulla direzione individuata da w
~ otteniamo    
3 −18/7
v ) = ||~vw||
·w
~
~ = −12  1  =  −6/7  .
~u = Πhwi ~ (~ ~ 2 ·w 14 ·
−2 12/7
Poiché il punto K è l’estremo finale di un segmento
  orientato
 rappresentante
  il vettore
 ~u
5 −18/7 17/7
e che ha origine nel punto Q , abbiamo K =  3  +  −6/7  =  15/7  .
7 12/7 61/7
   
17/7 3 √
Infine risulta dist{P, r} = dist{P, K} = ||P K|| = || 15/7  −  3 || = 133 7 .
61/7 10


Soluzione #2. Il punto K è il punto di intersezione della retta r con il piano ortogonale
ad r passante per P . Quest’ultimo ha equazione cartesiana (qui usiamo l’interpretazione
5.6, quindi imponiamo il passaggio per P )
(⋆) 3x + y − 2z + 8 = 0
Sostituendo le equazioni di r nell’equazione (⋆) troviamo 3(5+3t) + (3+t) − 2(7−2t) + 8 =
0 , quindi 12 + 14t = 0 . Sostituendo infine il valore t = −6/7 nelle equazioni di r
troviamo 17/7, 15/7, 61/7 (coordinate del punto K ).
La distanza dist{P, r} si calcola come nella soluzione #1.

 
3 x = −11 + 5 t
Esercizio 5.16. Sia P =  −4  e sia r la retta di equazioni y = 3 − 12 t .

6 z = −2 + 3 t
Determinare la proiezione ortogonale di P su r e la distanza dist{P, r} .
 
5 
  x − 3y + z = 0
Esercizio 5.17. Sia P = −2 e sia r la retta di equazioni .
2x + z − 5 = 0
3
Determinare la proiezione ortogonale di P su r e la distanza dist{P, r} .
141

§6. Geometria Euclidea dello spazio: applicazioni ed esercizi.

In questo paragrafo vediamo come si calcola la distanza tra due rette nello spazio.

Definizione 6.1. Siano r ed s due rette nello spazio, si pone



dist{r, s} = min dist(P, Q) P ∈r, Q∈s .

Supponiamo che r ed s non siano parallele (se lo sono, la distanza cercata è uguale
alla distanza di un punto qualsiasi di r da s e si calcola con i metodi visti nel paragrafo
precedente). Supponiamo inoltre che r ed s siano date in forma parametrica, e.g. che
nella notazione introdotta con la (5.4′ ) siano

r : P (t) = P0 + ~v t , s : Q(t) = Q0 + w
~t.

Sia H il piano contenente r parallelo ad s, sia H′ il piano contenente s parallelo ad r .


Chiaramente (convincersene),

(6.2) dist {r, s} = dist {H, H′ } = dist {Q, H} ,

dove Q è un punto qualsiasi di H′ (si può scegliere il punto Q0 , che è un punto di s ).


Queste uguaglianze ci consentono di risolvere il nostro problema: sappiamo calcolare la
distanza di un punto da un piano.

Nota bene: non stiamo dicendo che Q0 è il punto di s che realizza il minimo della
Definizione 6.1, in generale possiamo solamente dire che dist{Q0 , r} ≥ dist {r, s} .

Per trovare i punti che realizzano il minimo della Definizione 6.1, si deve lavorare un po’
di più: continuando ad assumere che r ed s non siano parallele, la proiezione della retta
s sul piano H (:= luogo dei punti ottenuti proiettando su H i punti di s) è una retta se
che incontra r . Sia A = se ∩ r e sia B il punto di s la cui proiezione è il punto A . Si ha

(6.3) dist{r, s} = dist{H, H′ } = dist {A, B} ,

La prima uguaglianza è la stessa che appare nelle (6.2), la seconda uguaglianza segue dal
fatto che AB è ortogonale ad H come pure ad H′ (è opportuno ricordare che i due piani
sono paralleli per costruzione). Infine, poiché A e B sono rispettivamente punti di r ed
s, abbiamo che sono proprio i punti che realizzano il minimo della Definizione 6.1.

H′
s

A
H

142

Esercizio 6.4. Calcolare la distanza tra le rette (si osservi che non sono parallele)
 
 x = 2 + 3t  x = −1 + t
r : y = −1 + 4 t , s : y = 1 + 3t .
 
z = 3 + −2 t z = −7 + t
Soluzione. Il piano H contenente r e parallelo ad s ha equazioni parametriche

 x = 2 + 3 t + t′
y = −1 + 4 t + 3 t′ .

z = 3 − 2 t + t′
Passando da equazioni parametriche a cartesiane troviamo che

(6.4′ ) 2x − y + z − 8 = 0 
−1
è un’equazione cartesiana di H . Per le osservazioni viste, posto Q0 =  1  si ha
−7
|2 · (−1) − 1 · 1 + 1 · (−7) − 8| √
dist {r, s} = dist { Q0 , H } = √ = 3 6
4+1+1


Esercizio 6.5. Trovare i due punti A ∈ r e B ∈ s tali che


dist{r, s} = dist{A, B} ,
dove r ed s sono le rette dell’esercizio precedente.

Soluzione. Una volta determinato il piano H contenente r e parallelo ad s (equazione


6.4′ ), calcoliamo la proiezione se di s su H : la retta se si ottiene intersecando il piano H
con il piano H fs contenente s ed ortogonale ad H . Questo è il piano

 x = −1 + t + 2 t′
f
Hs : y = 1 + 3 t − t′

z = −7 + t + t′
(che contenga s è ovvio: per t′ = 0 si ottengono proprio le equazioni di s; che sia ortogonale
ad H segue dal fatto che contiene una retta, la retta che si ottiene per t = 0 , ortogonale
ad H ). Usando l’osservazione (5.9), o eliminando i parametri, troviamo un’equazione
fs :
cartesiana di H
fs :
H 4 x + y − 7 z − 46 = 0
   
8 2
Risulta A = se ∩ r = H fs ∩ r =  7  nonché B =  10  .
−1 −4
Le coordinate di A, le abbiamo trovate sostituendo 2+3t, −1+4t, 3−2t nella equazione di
Hfs (si ottiene t = 2 , valore al quale corrisponde il punto indicato).
Quanto a B , questo può essere determinato in modo analogo a come abbiamo determinato
A, cioè intersecando la retta s con il piano contenente r ed ortogonale ad H , ma può
anche essere determinato in modo più rapido: B è il punto di s la cui proiezione su H
dà il punto A, ovvero AB ⊥ H , quindi cercare B significa cercare il punto di coordinate
−1 + t, 1 + 3t, −7 + t (cioè in s) per il quale AB (di coordinate −9+t, −6+3t, −6+t)
è un multiplo del vettore ~n (⊥ H) di coordinate 2, −1, 1 (coefficienti dell’equazione di
H ), si trova t = 3 (che dà il punto indicato).
 
−6 √
Naturalmente, ||AB|| = || 3 || = 3 6 (in accordo con quanto già trovato).
−3

143

§7. Geometria Euclidea di Rn .

Nei paragrafi precedenti abbiamo studiato la geometria del piano Euclideo R2 e dello
spazio Euclideo R3 . In questo paragrafo studiamo lo spazio vettoriale Euclideo Rn , riper-
corriamo i risultati già visti concernenti R2 ed R3 , quindi trattiamo l’ortonormalizzazione,
le trasformazioni lineari nel caso Euclideo ed infine introduciamo la nozione di spazio vetto-
riale Euclideo astratto. La vera differenza rispetto ai paragrafi precedenti non è tanto quella
di considerare spazi di dimensione arbitraria (anzi la maggior parte di esercizi e problemi
sono posti per R2 ed R3 !) quanto piuttosto nel metodo adottato e nella natura dei risultati
che si stabiliscono.

Fissiamo una volta per tutte alcune notazioni.

Notazione 7.1. Consideriamo lo spazio vettoriale Rn dotato del prodotto scalare

n
X
(7.1) h~v , wi
~ := ~v · w
~ := vi wi
i=1

essendo v1 , ..., vn e w1 , ..., wn rispettivamente le coordinate di ~v e w


~.

Il prodotto scalare su Rn viene anche detto metrica.

Lemma 7.2. Osserviamo che il prodotto scalare è commutativo e bi-lineare (=lineare in


ognuno dei suoi due argomenti). Quest’ultima proprietà significa che le due funzioni

Rn −−−−→ Rn Rn −−−−→ Rn
~x 7→ h~x, ~ui ~x 7→ h~u, ~xi

sono lineari per ogni vettore ~u fissato (naturalmente, per la commutatività del prodotto
scalare queste due funzioni coincidono).

Definizione 7.3. Si definisce la norma di ~v ponendo:


p
(7.3′ ) || ~v || = h~v , ~v i .

La norma di ogni vettore ~v , in quanto radice della somma dei quadrati delle sue coordinate,
è positiva e si annulla esclusivamente se ~v è il vettore nullo. Questa proprietà si esprime
dicendo che il prodotto scalare è definito-positivo.

Una prima conseguenza della bilinearità del prodotto scalare è la formula seguente:

1 
(7.4) h~v , wi
~ = ~ 2 − ||~v − w||
||~v + w|| ~ 2 .
4

Questa identità si dimostra immediatamente usando esclusivamente la Definizione 7.3′ ,


la commutatività e la bilinearità del prodotto scalare (Lemma 7.2), scrivendo per esteso
l’espressione che compare alla sua destra (esercizio 7.5). Da notare che a destra della (7.4)
non compaiono prodotti scalari ma solo norme di vettori; pertanto, in particolare, questa
formula ci dice che “la norma determina il prodotto scalare”.

Esercizio 7.5. Dimostrare la formula (7.4).

Proposizione 7.6 (disuguaglianza di Cauchy-Schwarz). Si ha

(7.6′ ) |h~v , wi|


~ ≤ ||~v || · ||w||
~ .
144

Dimostrazione. Se uno dei due vettori è il vettore nullo la disuguaglianza è verificata.


Consideriamo ora il caso dove ~v e w ~ sono entrambi non nulli. Date due costanti non nulle
λ e µ, la coppia di vettori ~v , w ~ soddisfa la disuguaglianza di Cauchy-Schwarz se e solo
se la coppia di vettori λ~v , µw ~ la soddisfa. Questo accade perché sia nell’espressione a
destra che in quella a sinistra della (7.6′ ) possiamo portare fuori le costanti (Lemma 7.2):
|hλ~v , µwi|
~ = |λ| · |µ| · |h~v , wi|
~ , ||λ~v || · ||µw||
~ = |λ| · |µ| · ||~v || · ||w||.
~ Di conseguenza, a meno
di sostituire ~v e w ~ con dei loro multipli opportuni, possiamo assumere (ed assumiamo)
~ = 1 . Sotto questa ipotesi la disuguaglianza (7.6′ ) si riduce alla disuguaglianza
||~v || = ||w||
|h~v , wi|
~ ≤ 1 . Usando la bi-linearità (Lemma 7.2) si ottiene
0 ≤ ||w~ − ~v ||2 = h w
~ − ~v , w
~ − ~v i = hw, ~ wi~ + h~v , ~v i − hw,
~ ~v i − h~v , wi
~ = 2 − 2h~v , wi
~
Questo prova la disuguaglianza h~v , wi ~ ≤ 1 per ogni coppia di vettori ~v e w ~ di norma 1
ed implica la tesi: avendo h−~v , wi ~ ≤ 1 , si deve anche avere h~v , wi ~ = −h−~v , wi
~ ≥ −1 .

La disuguaglianza di Cauchy-Schwarz consente di definire l’angolo tra due vettori non


nulli. Si pone la seguente definizione.

Definizione 7.7. Dati due vettori ~v e w


~ non nulli si definisce l’angolo ϑ compreso tra
0 e π associato ad essi ponendo
 
h~v , wi~
ϑ = arccos
||~v || · ||w||
~
(si noti che grazie alla disuguaglianza di Cauchy-Schwarz il numero tra parentesi ha modulo
minore o uguale ad uno).

Un’altra conseguenza importante della disuguaglianza di Cauchy-Schwarz è la disugua-


glianza triangolare:

Proposizione 7.8 (disuguaglianza triangolare). Si ha


||~v + w
~ || ≤ ||~v || + || w
~ || .

La dimostrazione di questa proposizione è stata già vista: cfr. Proposizione 1.14 (con-
siderando Rn invece di R2 non cambia una virgola).

La metrica su Rn consente di introdurre il concetto di ortogonalità e di definire il com-


plemento ortogonale di un sottoinsieme.

Definizione 7.9. Due vettori ~v e w ~ si dicono ortogonali se h~v , wi


~ = 0 . L’ortogonalita si
denota col simbolo “⊥”. Più in generale un vettore ~v e un sottoinsieme W ⊆ Rn , ovvero
due sottoinsiemi U, W ⊆ Rn , si dicono ortogonali se ~v ⊥ w ~ per ogni w ~ ∈ W , ovvero
~u ⊥ w ~ ∈ W . Infine, dato un sottoinsieme W ⊆ Rn si definisce il suo
~ per ogni ~u ∈ U e w
complemento ortogonale

W ⊥ := ~v ∈ Rn ~v ⊥ W .

 ⊥ ⊥
Da notare che ~0 = Rn , Rn = {~0} .

Proposizione 7.10. Dato un sottoinsieme W ⊆ Rn risulta

W ∩ W⊥ = {~0 }

Dimostrazione. Un vettore appartenente a tale intersezione sarebbe di conseguenza ortogo-


nale a se stesso, d’altro canto sappiamo che il prodotto scalare è definito-positivo (cfr. def. 7.3):
l’unico vettore ortogonale a se stesso è il vettore nullo. 
145

Da notare che l’insieme W ⊥ è un sottospazio vettoriale di Rn , anche quando W non


lo è (è un sottoinsieme arbitrario). Infatti, per la bi-linearità del prodotto scalare, se dei
vettori sono ortogonali a tutti i vettori di W anche ogni loro combinazione lineare lo è.

Definizione 7.11. Sia W un sottospazio di Rn . Diciamo che B = {~b1 , ..., ~bm } è una
base ortonormale di W se

|| ~bi || = 1 , ∀ i , h~bi , ~bj i = 0 , ∀ i 6= j ,

cioè se i vettori in B hanno tutti norma 1 e sono mutuamente ortogonali.

Osserviamo che la base canonica di Rn è una base ortonormale (di Rn stesso).

Ora enunciamo una proposizione che consente di definire la nozione di proiezione ortogo-
nale su un sottospazio. Questa proposizione ci dice che dati un sottospazio W di Rn ed
un vettore ~v ∈ Rn esiste un unico vettore w~ ∈ W che soddisfa la proprietà che si richiede
ad una “proiezione ortogonale” che si rispetti: differisce da ~v di un vettore ortogonale allo
spazio W .

Proposizione 7.12. Sia W un sottospazio di Rn e sia ~v ∈ Rn un vettore. Si ha che

esistono unici ~ ∈ W , ~u ∈ W ⊥
w tali che ~v = w
~ + ~u .

Inoltre, se B = {~b1 , ..., ~bm } è una base ortonormale di W , il vettore w


~ di cui sopra è il
vettore

(7.12′ ) πW (~v ) := h~v , ~b1 i · ~b1 + ... + h~v , ~bm i · ~bm .

Dimostrazione. Innanzi tutto, se potessimo scrivere ~v = w ~ + ~u = w ~ ′ + ~u′ , w, ~′ ∈ W ,


~ w
′ ⊥ ′ ′ ⊥
~u, ~u ∈ W , avremmo w ~ −w~ = ~u − ~u ∈ W ∩ W . Grazie alla Proposizione 7.10 ciò
dimostra l’unicità della decomposizione di ~v .
Chiaramente πW (~v ) ∈ W , proviamo che ~v − πW (~v ) ∈ W ⊥ . Per ogni vettore ~bj risulta


X

~v − π (~v ) , ~bj = ~v −
W h~v , ~bi i · ~bi , ~bj = ~v − h~v , ~bj i · ~bj , ~bj
= h~v , ~bj i − h~v , ~bj ih~bj , ~bj i = 0
(si noti che usiamo le proprietà che caratterizzano le basi ortonormali, def. 7.11). Pertanto
~v − πW (~v ) è ortogonale a tutti i vettori di B , quindi a ogni loro combinazione lineare, quindi
allo spazio W . 

Definizione 7.13. Dato un sottospazio W ⊆ Rn , il vettore πW (~v ) introdotto nella


proposizione precedente si definisce “proiezione ortogonale di ~v sul sottospazio W ”.

Osserviamo che se {d~1 , ..., d~m } è una base ortogonale di W (non si richiede che i d~i
  
abbiano norma uno ma solo che siano ortogonali tra loro), visto che d~1 ||d~1 ||, ..., d~m ||d~1 ||
è una base ortonormale di W , l’uguaglianza (7.12′ ) diventa

h~v , d~1 i ~ h~v , d~m i ~


(7.12′′ ) πW (~v ) = · d1 + ... + · dm .
~
||d1 || 2 ||d~m ||2

Osservate che i singoli termini della somma qui sopra li abbiamo già incontrati: sono
le proiezioni di ~v lungo le direzioni individuate dai d~i (cfr. formula (1.15) e (4.5)). La
condizione che i d~i siano ortogonali tra loro è una condizione necessaria: in generale, la
proiezione su uno “Span” di vettori indipendenti non è uguale alla somma delle proiezioni
sulle direzioni individuate dai singoli vettori (cfr. esercizio 7.17).
146

Risulta πW (α~v1 + β~v2 ) = απW (~v1 ) + βπW (~v2 ) , cioè la funzione “proiezione su W ”

πW : Rn −−−−→ Rn

~v 7→ πW (~v )
è lineare.

Dimostrazione #1. Segue dalla (7.12′ ) e dalla linearità del prodotto scalare rispetto al
primo argomento (Lemma 7.2). 

Dimostrazione #2. Usiamo la proposizione che definisce la proiezione (Proposizione 7.12):


se ~v1 = w ~ 1 ∈ W, ~u1 ∈ W ⊥ e ~v2 = w
~ 1 + ~u1 , w ~ 2 ∈ W, ~u2 ∈ W ⊥ , allora:
~ 2 + ~u2 , w
α~v1 + β~v2 = (αw ~ 1 +β w
~ 2 ) + (α~u1 +β~u2 ) , αw ~ 1 +β w~ 2 ∈ W , α~u1 +β~u2 ∈ W ⊥ . 

Dato un sottospazio W ⊆ Rn , il fatto che ogni vettore in Rn si scrive in modo unico come
somma di un vettore in W ed uno in W ⊥ si esprime dicendo che W ⊥ è un complemento
di W . Da notare che per la formula di Grassmann risulta

(7.14) dimW ⊥ = n − dim W .

Osservazione 7.15. Se B = {~b1 , ..., ~bn } è una base ortonormale di Rn , applicando la


Proposizione 7.12 al caso dove W = Rn si ottiene

~v = πRn (~v ) = h~v , ~b1 i ~b1 + ... + h~v , ~bn i~bn , ∀ ~v ∈ Rn

(la proiezione su tutto Rn è l’identità), cioè:

(7.15′ ) i coefficienti h~v , ~bi i sono le coordinate di ~v rispetto a B .

Esercizio 7.16. Si consideri R3 ed il piano H di equazione 2x − y + 3z = 0 .


a) Determinare una base ortogonale di H (suggerimento: cfr. esercizio 4.15, i));
b) determinare la proiezione del vettore ~v di coordinate 6, 5, 7 sul piano H .

Esercizio 7.17. Si consideri la base {~h, ~k} del piano H dell’esercizio precedente, con ~h
e ~k rispettivamente di coordinate 1, 2, 0 e 0, 3, 1 .
a) Determinare le proiezioni di ~v lungo le direzioni individuate da ~h e ~k ;
b) verificate che la proiezione su H di ~v non è la somma delle proiezioni al punto a).

A questo punto è chiara l’importanza in geometria Euclidea dell’utilizzo di basi ortogonali


o meglio ancora ortonormali. Vista tale importanza esiste un modo standard di produrre
vettori ortonormali a partire da un insieme arbitrario di vettori indipendenti, il procedi-
mento di ortonormalizzazione di Gram-Schmidt : dati dei vettori indipendenti {w ~m}
~ 1 , ..., w
~ ~
produciamo un insieme di vettori ortonormali {b1 , ..., bm } che costituisce una base ortonor-
w~
male dello spazio W = Span {w ~ m } . Poniamo ~b1 := || w~ 1 || quindi definiamo
~ 1 , ..., w
1
induttivamente
~ i − πSpan {~b
w ~ (w
~ i) ~ i , ~b1 i~b1 − ... − hw
~ i − hw
w ~ i , ~bi−1 i~bi−1
~b 1 , ..., bi−1 }
i := =
|| . . . || || . . . ||

dove il denominatore è la norma del vettore al numeratore (il che significa normalizzarlo,
w~
ovvero renderlo di norma 1). Cioè: ~b1 = || w~ 1 || , il vettore ~b2 si ottiene normalizzando il
1
147

vettore ottenuto sottraendo a w ~ 2 la sua proiezione su Span{~b1 } = Span{w ~ 1 } , si noti che


cosı̀ facendo risulterà Span {b1 , ~b2 } = Span {w
~ ~ 2 } , il vettore ~b3 si ottiene normalizzando
~ 1, w
il vettore ottenuto sottraendo a w ~ 3 la sua proiezione su Span{~b1 , ~b2 } = Span{w ~ 2} e
~ 1, w
cosı̀ via. La costruzione effettuata conduce al seguente teorema di ortonormalizzazione.

Teorema 7.18 (di ortonormalizzazione). Sia W un sottospazio vettoriale di Rn e


sia {w ~ m } una base di W . Esiste una base B = {~b1 , ..., ~bm } di W tale che
~ 1 , ..., w
i) Si := Span{~b1 , ..., ~bi } = Span{w ~ i } per ogni indice i ;
~ 1 , ..., w
ii) B = {~b1 , ..., ~bm } è una base ortonormale di W .
La base ottenuta col procedimento di ortonormalizzazione di Gram-Schmidt indicato sopra
soddisfa le proprietà i) e ii) ed è “quasi” l’unica base di W che le soddisfa se {~b1 , ..., ~bm }

e {~b′1 , ..., ~b′m } sono due basi che le soddisfano allora ~b′i = ±~bi , ∀ i .

Dimostrazione. La i) vale perché ad ogni passo sommiamo a w ~ i una c.l. dei precedenti e
lo moltiplichiamo per una costante non nulla. Quanto alla ii), che i vettori abbiano norma
1 è ovvio, sono mutuamente ortogonali perché ogni ~bi è ortogonale ai “precedenti” (~bi lo
otteniamo normalizzando ciò che si ottiene sottraendo a un vettore non appartenente a Si−1
la sua proiezione su Si−1 ). L’affermazione tra parentesi è evidente per ragioni geometriche.


Come corollario si deduce che ogni sottospazio di Rn ammette basi ortonormali.

Esercizio 7.19. Si consideri lo spazio vettoriale Euclideo R4 ed il sottospazio


     
 3 5 4 
 1   1   −1 
W = Span  ,  ,   .
5 7 1
1 2 2
Determinare una base ortonormale di W .

A questo punto torniamo alle trasformazioni lineari (dette anche endomorfismi). Nel
primo capitolo abbiamo visto qual è la matrice rappresentativa di una trasformazione lineare.
In analogia con la diagonalizzabilità diciamo che la trasformazione lineare T : Rn −→ Rn
è triangolarizzabile se esiste una base di Rn rispetto alla quale T è rappresentata da
una matrice triangolare superiore (cfr. cap. I, def. 1.23). Diremo che T è triangolarizzabile
tramite una base ortonormale se ciò accade rispetto ad una base ortonormale di Rn .

Proposizione 7.20. Sia T : Rn −→ Rn una trasformazione lineare. Allora le


affermazioni che seguono sono equivalenti tra loro
a) T è triangolarizzabile tramite una base ortonormale;
b) T è triangolarizzabile;
c) il polinomio caratteristico PT (λ) ha n radici reali.

Precisazione 7.21. Chiedere che il polinomio caratteristico abbia n radici reali significa
chiedere che si fattorizzi come prodotto di polinomi di primo grado, cioè che si possa scrivere
nella forma
PT (λ) = (λ1 − λ) · ... · (λn − λ)
(con i λi ∈ R non necessariamente distinti).

Dimostrazione (della Proposizione 7.20). Naturalmente a) ⇒ b). Inoltre, b) ⇒ c)


perché il polinomio caratteristico di una matrice triangolare A = (ai, j ) è uguale al prodotto
(a1, 1 − λ) · ... · (an, n − λ). Per provare che c) ⇒ a) mostriamo che siamo in grado di
trovare una base ortonormale {~b1 , ..., ~bn } rispetto alla quale T è rappresentata da una
148

matrice triangolare. Trovare una tale base significa trovare dei vettori ~b1 , ..., ~bn di norma
1 nonché mutuamente ortogonali soddisfacenti T (~bi ) ∈ Span{~b1 , ..., ~bi } per ogni indice i .
Concentriamoci su questa formulazione del problema da risolvere e ragioniamo per induzione
sul numero k dei vettori di un insieme ortonormale {~b1 , ..., ~bk } soddisfacente
(⋆) T (~bi ) ∈ Span{~b1 , ..., ~bi } per ogni i ≤ k .
Il primo passo dell’induzione è immediato: si trova un primo autovettore (ciò è possi-
bile per l’ipotesi sul polinomio caratteristico) e lo si normalizza. Supponiamo quindi di
aver trovato un insieme {~b1 , ..., ~bk } soddisfacente (⋆) e mostriamo che possiamo trovare
{~b1 , ..., ~bk+1 } anch’esso soddisfacente (⋆). A tal fine consideriamo un completamento ar-
bitrario di {~b1 , ..., ~bk } ad una base di Rn ed osserviamo che rispetto a tale base T è
rappresentato da una matrice A = (ai, j ) con ai, j = 0 , ∀ i > j, j ≤ k . Osserviamo
inoltre che se denotiamo con B il minore delle ultime n − k righe e colonne della matrice
A risulta
(⋆⋆) PT (λ) = (a1, 1 − λ) · ... · (ak, k − λ) · det(B − λI) .
Consideriamo U = {~b1 , ..., ~bk }⊥ e la restrizione ad U della composizione πU ◦ T (dove
πU denota la proiezione ortogonale su U ), che denoteremo con S . Si ha l’uguaglianza
(⋆ ⋆ ⋆) PS (λ) = det(B − λI) .
Infatti, gli ultimi n − k vettori della base di Rn si proiettano su U ad una base di U
e la trasformazione S , rispetto a tale base, è rappresentata dalla matrice B . Infine, alla
luce di (⋆⋆) e (⋆ ⋆ ⋆), poiché il polinomio PT (λ) si decompone nel prodotto di polinomi di
primo grado, lo stesso deve valere per il polinomio PS (λ), in particolare S ammette un
autovalore e quindi un autovettore, chiamiamolo ~vk+1 . Poiché S(~vk+1 ) ∈ Span {~vk+1 } , si
ha T (~vk+1 ) ∈ Span{~b1 , ..., ~bk , ~vk+1 } (attenzione, c’è di mezzo una proiezione, non è detto
~vk+1 sia un autovettore per T ). Infine, applicando l’ortonormalizzazione di Gram-Schmidt
all’insieme {~b1 , ..., ~bk , ~vk+1 } si ottiene un insieme {~b1 , ..., ~bk+1 } come richiesto. 
 
2 0 −1
Esercizio 7.22. Provare che la trasformazione lineare di R associata alla matrice
1 0
non è affatto triangolarizzabile.
   
4 3 1 3 0 0
Esercizio 7.23. Si considerino le matrici A =  −2 −1 −1  , C =  1 2 5  .
4 6 4 2 0 2
a) Si verifichi che (3 − λ) · (2 − λ)2 è il polinomio caratteristico di entrambe;
b) diagonalizzare A ;
c) triangolarizzare A tramite una base ortonormale;
d) provare che C non è diagonalizzabile;
e) triangolarizzare C tramite una base ortonormale.

Ora vogliamo introdurre il concetto di trasformazione aggiunta. Di fatto, l’aggiunta della


trasformazione lineare T : Rn −→ Rn associata alla matrice A (cfr. cap. I, def. 12.5) è la
trasformazione associata alla matrice tA (trasposta di A, cfr. cap. I, def. 3.18). Preferiamo
però introdurla mediante la proprietà che la caratterizza.

Teorema 7.24. Data T : Rn −→ Rn si ha che esiste un’unica trasformazione



T : R −→ Rn
n
tale che ~ = h~v , T ⋆ (w)i
hT (~v ), wi ~ , ~ ∈ Rn .
∀ ~v , w

Dimostrazione. Per l’osservazione (7.15′ ), le coordinate di T ⋆ (w) ~ devono essere i prodotti


scalari h~ei , T ⋆ (w)i ~ essendo {~e1 , ..., ~en } la base canonica di Rn . Ciò garan-
~ = hT (~ei ), wi,
tisce l’unicità di T ⋆ e, per ragioni di bi-linearità del prodotto scalare (Lemma 7.2), anche
l’esistenza. 
149

Definizione 7.25. La trasformazione T ⋆ la cui esistenza e unicità è garantita dal teorema


precedente si chiama aggiunta di T (l’apice “⋆” fa parte della notazione standard con cui
si denota l’aggiunta di una trasformazione lineare).

Come preannunciato, se T è la moltiplicazione per la matrice A (equivalentemente, se


rispetto alla base canonica di Rn la trasformazione T è rappresentata dalla matrice A),
allora T ⋆ è la moltiplicazione per la matrice tA (si noti che ciò porta ad una seconda
dimostrazione dell’esistenza di T ⋆ ). Infatti la funzione w ~ 7→ tA · w ~ che al vettore w
~
t
associa il vettore A · w
~ soddisfa la proprietà che definisce l’aggiunta:

hT (~v ), wi ~ = t(A · ~v ) · w
~ = hA · ~v , wi ~ = t~v · tA · w
~ = t~v · ( tA · w)
~ = h~v , tA · wi
~

dove i vettori sono considerati come matrici di n righe ed una colonna e tutti i prodotti
sono prodotti tra matrici (la quarta uguaglianza segue dalla proprietà t(A · B) = t B · tA;
cfr. cap. I, 3.19).

Esercizio 7.26. Siano T ed S due trasformazioni di Rn e sia I l’identità. Provare che


⋆
(7.26′ ) T +S = T ⋆ + S⋆ ; (λ T )⋆ = λ T ⋆ ; I⋆ = I .

Suggerimento. Usate le matrici rappresentative.

Definizione 7.27. Se T ⋆ = T diciamo che T è autoaggiunta (ovvero simmetrica).

Abbiamo due aggettivi diversi per indicare la stessa caratteristica perché le matrici23
autoaggiunte sono le matrici simmetriche (nell’ambito della generalizzazione agli spazi metrici
astratti della teoria che stiamo sviluppando si preferisce riferirsi alle trasformazioni che co-
incidono con la propria aggiunta dicendo che sono “autoaggiunte”).

Una classe importante di trasformazioni lineari è quella delle trasformazioni che conser-
vano le lunghezze dei vettori e la misura degli angoli tra vettori. In virtù di questa carat-
teristica tali trasformazioni sono dette anche movimenti rigidi. I movimenti rigidi del piano
vettoriale R2 sono le rotazioni intorno l’origine e le riflessioni rispetto ad una retta passante
per l’origine. I movimenti rigidi dello spazio vettoriale R3 sono le rotazioni intorno ad un
asse passante per l’origine e le composizioni di queste con la riflessione rispetto al piano
ortogonale all’asse. Da notare che a priori non è affatto ovvio che quelli indicati siano gli
unici movimenti rigidi del piano e dello spazio vettoriale Euclideo. Da un punto di vista
algebrico conservare lunghezze e angoli equivale a conservare il prodotto scalare. In effetti
grazie alle identità (7.3′ ) e (7.4) conservare le lunghezze equivale a conservare il prodotto
scalare, in particolare implica conservare gli angoli. Il teorema che segue caratterizza le
trasformazioni lineari che conservano il prodotto scalare.

Inciso. Naturalmente nel momento in cui consideriamo il piano e lo spazio Euclideo24


cosı̀ come li abbiamo introdotti nei paragrafi § 1 e § 4 (si noti che, parlando piano e spazio
Euclideo, non avendo un struttura vettoriale non ha senso parlare di trasformazioni lineari) i
movimenti rigidi, intesi semplicemente come trasformazioni che conservano distanze e angoli
(si ha che inducono trasformazioni lineari sul soggiacente spazio vettoriale dei vettori geo-
metrici) sono quelli indicati e le loro composizione con le traslazioni. Comunque, in questo
paragrafo ci concentriamo sugli aspetti vettoriali: qualsiasi trasformazione, in quanto ap-
plicazione lineare tra spazi vettoriali, deve fissare l’origine.

23Viste come trasformazioni lineari di Rn .


24Non fissiamo un’origine, gli elementi li chiamiamo “punti” e la struttura vettoriale è definita per il soggia-
cente spazio vettoriale dei vettori geometrici, ovvero delle classi di equivalenza dei segmenti orientati.
150

Teorema 7.28. Sia T : Rn −→ Rn una trasformazione lineare e sia A la matrice che


la rappresenta (rispetto alla base canonica di Rn ). Le seguenti affermazioni sono equivalenti
i) T conserva il prodotto scalare: h~v , wi
~ = hT (~v), T (w)i ~ ∈ Rn ;
~ , ∀ ~v , w
ii) T ⋆ ◦ T = Identità (T è invertibile e la sua inversa coincide con l’aggiunta);
t
iii) A · A = In (A è invertibile e la sua inversa coincide con la trasposta);
iv) le colonne di A formano una base ortonormale di Rn ;
v) le righe di A formano una base ortonormale di Rn ;

Dimostrazione. L’equivalenza delle ultime quattro proprietà è essenzialmente ovvia: con-


siderando che la matrice tA rappresenta T ⋆ , la iii) è la traduzione della ii) in termini di
matrici; in quanto l’elemento di posto i, j del prodotto tA · A coincide col prodotto scalare
della i−esima colonna di A con la i−esima colonna (sempre di A) anche iii) e iv) sono
equivalenti, inoltre in virtù di questa equivalenza e del fatto che A soddisfa la iii) se e solo
se tA la soddisfa (cfr. cap. I, Proposizione 4.3), anche la v) è equivalente a queste proprietà.
Ora proviamo che la i) è equivalente alle altre. Per la proprietà che caratterizza l’aggiunta
~ = h~v , T ⋆ (T (w))i
risulta hT (~v ), T (w)i ~ , quindi la i) è equivalente alla seguente proprietà:
(⋆) h~v , wi
~ = h~v , T ⋆ (T (w))i ~ ∈ Rn .
~ , ∀ ~v , w
Questo dimostra che la i) segue dalla ii). Viceversa, scrivendo la (⋆) con ~v = ~ei (per
i = 1, ..., n), dall’osservazione (7.15′ ) deduciamo che le coordinate di T ⋆ (T (w))
~ coincidono
con quelle di w ~ quindi che T ⋆ ◦ T è l’identità.
~ (per ogni w), 

Definizione 7.29. Se T conserva il prodotto scalare (equivalentemente, soddisfa una


delle condizioni del teorema precedente), diciamo che T è ortogonale. Una matrice A si
dice ortogonale se la moltiplicazione per A è una trasformazione ortogonale di Rn , equiva-
lentemente, se risulta
t
A · A = In .

Dal lavoro fatto nel cap. I, § 15 sappiamo che le trasformazioni diagonalizzabili sono carat-
terizzate dall’esistenza di una base di autovettori. Sia dunque T una trasformazione diago-
nalizzabile, ci domandiamo quali proprietà debbano soddisfare i suoi autovalori e autovettori
affinché risulti autoaggiunta, e quali affinché essa risulti ortogonale. Partiamo proprio dal
dato degli “autovalori e autovettori”: consideriamo dei vettori indipendenti ~v1 , ..., ~vn ∈ Rn
e dei numeri reali λ1 , ..., λn quindi consideriamo la trasformazione T avente questi dati
come autovettori e relativi autovalori. Dalla formula del cambiamento di base (cap. I, 15.6′ )
sappiamo che T è rappresentata (rispetto alla base canonica di Rn ) dalla matrice

A = B · ∆ · B −1

dove B è la matrice associata ai vettori ~v1 , ..., ~vn e ∆ è la matrice diagonale associata
ai valori λ1 , ..., λn . Nell’ambito delle trasformazioni diagonalizzabili abbiamo la seguente
caratterizzazione di quelle che sono ortogonali e di quelle che sono autoaggiunte.

Proposizione 7.30. Sia T : Rn → Rn la trasformazione lineare di autovettori


(indipendenti) ~v1 , ..., ~vn e relativi autovalori λ1 , ..., λn . Allora
i) T è ortogonale se e solo se gli autovalori hanno modulo 1 e gli autospazi sono
ortogonali tra loro:
|λi | = 1 , ∀i; h~vi , ~vj i = 0 , ∀ i, j | λi 6= λj

ii) T è autoaggiunta se e solo se gli autospazi sono ortogonali tra loro:

h~vi , ~vj i = 0 , ∀ i, j | λi 6= λj .
151

Dimostrazione. Sia A la matrice rappresentativa di T rispetto alla base canonica. Essendo


T diagonalizzabile per ipotesi, se gli autospazi sono ortogonali tra loro esiste una base
ortonormale di autovettori e risulta A = B·∆·B −1 , con B ortonormale (quindi B −1 = t B)
e ∆ diagonale. Di conseguenza si ha tA = t B · ∆ · B −1 = B · ∆ · B −1 = A, pertanto
A è simmetrica, ovvero T è autoaggiunta. Se inoltre assumiamo che gli autovalori abbiano
modulo 1 otteniamo
t
2
A · A = B · ∆ · B −1 = B · ∆2 · B −1 = B · In · B −1 = In (In = identità)
ovvero A è ortogonale (nonché simmetrica), quindi T è ortogonale (nonché autoaggiunta).
D’altro canto T è ortogonale deve conservare il prodotto scalare, quindi la norma. Pertanto
se ~v è un autovettore di autovalore λ si ha quanto segue
||~v || = ||T (~v )|| = ||λ~v || = |λ| · ||~v || =⇒ |λ| = 1 .
Resta da dimostrare che se T è ortogonale oppure autoaggiunta allora gli autospazi sono
mutuamente ortogonali. Questi due risultati sono entrambi casi particolari di un risultato
più forte (che enunciamo e dimostriamo più avanti): le trasformazioni che commutano con
la propria aggiunta hanno autospazi ortogonali tra loro (cfr. Proposizione 7.36). 

Definizione 7.31. Diciamo che T : Rn −→ Rn è una trasformazione normale se


commuta con la sua aggiunta:
T ◦ T⋆ = T⋆ ◦ T .

Osserviamo che se T è una trasformazione normale allora risulta

~ = h~v , T ⋆ ◦ T (w)i
hT (~v ), T (w)i ~
(7.32)
= h~v , T ◦ T ⋆ (w)i
~ = hT ⋆ (~v ), T ⋆ (w)i
~ ~ ∈ Rn .
∀ ~v , w

In particolare si ha

(7.32′ ) ||T (~v )|| = ||T ⋆ (~v )|| , ∀ ~v ∈ Rn .

In effetti la (7.32′ ), e a maggior ragione la (7.32), caratterizza le trasformazioni normali. Ma


questo fatto non ci servirà e lo lasciamo per esercizio:

Esercizio 7.33. Provare che la (7.32′ ) caratterizza le trasformazioni normali.

Osservazione 7.34. Finora abbiamo sostanzialmente lavorato con la base canonica


di Rn , in particolare abbiamo visto che, rispetto a tale base, T ⋆ è rappresentata dalla
matrice tA (essendo A la matrice che rappresenta T ). Di conseguenza abbiamo la seguente
caratterizzazione delle trasformazioni normali
t
T è normale se e solo se A · A = A · tA .

Questa proprietà continua a valere se si considera la matrice rappresentativa di T rispetto


ad una qualsiasi base ortonormale di Rn . Infatti, se B è una base ortonormale di Rn e
B è la matrice associata a tale base allora risulta B −1 = t B (Teorema 7.28, equivalenza
“iii) ⇔ iv)”). Di conseguenza, per la formula del cambiamento di base (cap. I, 15.6′), le matrici
rappresentative di T e T ⋆ rispetto a B sono rispettivamente le matrici X = t B · A · B e
t
B · tA · B = t t B · A · B = t X . Sottolineiamo questo risultato:

(7.34′ ) se X rappresenta T , allora t


X rappresenta T ⋆

(tutto rispetto alla base ortonormale B ). Ne segue che

(7.34′′ ) T è normale se e solo se t


X · X = X · tX .

Vediamo ora una importante conseguenza della (7.32′ ).


152

Osservazione 7.35. Sia T : Rn −→ Rn una trasformazione normale. Le trasformazioni


T e T ⋆ hanno stessi autovalori e stessi autospazi.

Dimostrazione. È sufficiente provare che ||T ⋆ (~v ) − λ~v || = ||T (~v ) − λ~v || (avendo la stessa
norma, il primo vettore è nullo se e solo se il secondo vettore è nullo). Si ha:
||T ⋆ (~v ) − λ~v || = ||(T − λI)⋆ (~v )|| = ||(T − λI)(~v )|| = ||T (~v ) − λ~v ||
dove I denota l’identità (la prima uguaglianza segue dalle uguaglianze (7.26′ ), la seconda
segue dall’osservazione (7.32′ ) perché naturalmente anche T + λI è normale, la terza è una
tautologia). 

Proposizione 7.36. Se T : Rn −→ Rn è normale allora autovettori corrispondenti


ad autovalori distinti sono ortogonali.

Dimostrazione. Sia T (~v ) = λ~v e T (w)


~ = µw
~.
(oss. 7.35)
~ = hλ~v , wi
λh~v , wi ~ = h~v , T ⋆ (w)i
~ = hT (~v ), wi ~ = h~v , µwi
~ = µh~v , wi
~ .
Essendo λ 6= µ si deve avere h~v , wi
~ = 0. 

Il prossimo teorema caratterizza le trasformazioni diagonalizzabili tramite una base ortonor-


male. Premettiamo un facile lemma algebrico.

Lemma 7.37. Una matrice triangolare che commuta con la sua trasposta è necessaria-
mente diagonale:
“X triangolare, tX · X = X · t X =⇒ X diagonale”.

Dimostrazione. È sufficiente svolgere i prodotti: scriviamo (nello stesso ordine!) gli elementi
sulla diagonale delle due matrici in questione:
X · tX : x21,1 + x21,2 + x21,3 + ... ; x22,2 + x22,3 + ... ; ... ; x2n,n
t
X ·X : x21,1 ; ; ... ; x21,n + x22,n + ... + x2n,n
x21,2 + x22,2
 
Dal confronto di questi elementi si deduce che X è diagonale: X · t X 1,1 = tX ·X 1,1 ⇒
 
x1,2 = x1,3 = x1,4 = ... = 0 ; X · t X 2,2 = tX · X 2,2 ⇒ x2,3 = x2,4 = ... = 0 , e cosı̀
via. 

Teorema 7.38. Sia T : Rn −→ Rn una trasformazione lineare. Le affermazioni che


seguono sono equivalenti
i) esiste una base ortonormale di autovettori per T ;
ii) T è autoaggiunta ed ha n autovalori in R;
iii) T è normale ed ha n autovalori in R.

(Cfr. precisazione 7.21).

Dimostrazione. Il fatto che la i) implichi la ii) l’abbiamo già dimostrato (cfr. Proposizione
7.30): se esiste una base ortonormale di autovettori T ha n autovalori reali ed è autoag-
giunta. Naturalmente se T è autoaggiunta (= coincide con l’aggiunta) a maggior ragione è
normale (= commuta con l’aggiunta). Quindi “ii) implica iii)”.
Infine, se vale la proprietà iii), sappiamo che T è triangolarizzabile rispetto ad una base
ortonormale (Proposizione 7.20). D’altro canto la matrice X rappresentativa di T rispetto
ad una tale base è una che commuta con la sua trasposta (cfr. 7.34′ ). Per il Lemma 7.37
la matrice X deve essere diagonale. 
153

Questo risultato è uno dei pochi Teoremi di questo testo (quelli veri si contano sulle
dita di una mano!). Riferendoci all’implicazione “iii) ⇒ i)”, l’ipotesi sugli autovalori
ci dice che (cfr. precisazione 7.21) la somma delle molteplicità algebriche degli autovalori
vale n. Quest’ipotesi, presa da sola non dà la diagonalizzabilità (non possiamo dire che le
molteplicità geometriche siano uguali a quelle algebriche): affinché una trasformazione di
Rn sia diagonalizzabile abbiamo bisogno di n autovettori indipendenti, equivalentemente
che la somma delle molteplicità geometriche sia uguale ad n. Assumendo anche l’ipotesi
di normalità otteniamo che T è diagonalizzabile, in particolare che molteplicità algebriche
e geometriche coincidono.
 
1 1
Esempio. La matrice A = non è diagonalizzabile (non è normale: A· tA 6= tA·A).
0 1

Un altro aspetto del Teorema (7.38) riguarda il modo in cui è possibile diagonalizzare T :
assumendo che sia normale ed abbia n autovalori reali è possibile diagonalizzarla tramite
una matrice ortonormale. Evidentemente nell’ipotesi di normalità la costruzione nella di-
mostrazione della Proposizione 7.20 conduce a una base ortonormale di autovettori, ovvero
ad una diagonalizzazione tramite una base ortonormale. Ciò è importante di per se, riper-
corriamo la dimostrazione citata e stabiliamolo in maniera diretta: trovati k autovettori
ortonormali, indicato con S lo spazio che essi generano e definito U := S ⊥ , vogliamo
provare che T (U ) ⊆ U . Si ha
T (U ) ⊆ U ⇐⇒ hT (~u), ~v i = 0 , ∀ ~u ∈ U , ~v ∈ S
d’altro canto, grazie alla normalità, T e T ⋆ coincidono su S (oss. 7.35), quindi
hT (~u), ~v i = h~u, T ⋆ (~v )i = h~u, ~v ′ i = 0 (essendo ~u ∈ U , ~v ′ ∈ S)
Questo dimostra che T (U ) ⊆ U e quindi che quella fastidiosa proiezione nella dimostrazione
della Proposizione 7.20 che ci costringeva a scrivere “ T (~vk+1 ) ∈ Span{~b1 , ..., ~bk , ~vk+1 } ”
invece di “ T (~vk+1 ) ∈ Span{~vk+1 } ” non è necessaria (proiettare su U vettori che già
appartengono ad U è come non fare nulla). Voglio sottolineare che la dimostrazione della
Proposizione 7.20, con l’aggiunta di quanto appena osservato diventa una dimostrazione
diretta del Teorema 7.38 (che peraltro evita il Lemma 7.37).

Visto che in generale non si sanno decomporre i polinomi di grado alto il Teorema 7.38
ha un difetto: l’ipotesi sulle radici del polinomio caratteristico è difficilmente controllabile!
Ebbene, nel punto ii) tale ipotesi può essere cassata: le affermazioni del Teorema 7.38 sono
equivalenti alla seguente affermazione:
ii ′ ) T è autoaggiunta.

Questo risultato è noto come teorema Spettrale (che ora enunciamo di nuovo in termini di
matrici). Prima però osserviamo che la stessa ipotesi non può essere cassata al punto iii):
 
0 −1
Esempio. La matrice è normale, è addirittura ortogonale, ma non è diagona-
1 0
lizzabile: non ha affatto autovalori reali, rappresenta una rotazione di π2 radianti, il suo
polinomio caratteristico è il polinomio λ2 + 1 .

Teorema 7.39 (teorema Spettrale). Sia A ∈ Mn,n (R) una matrice.

A è diagonalizzabile tramite una matrice ortonormale ⇐⇒ A è simmetrica.

L’implicazione “=⇒” è l’implicazione “i) ⇒ ii)” del Teorema 7.38. L’altra impli-
cazione si dimostra facilmente a condizione di usare i numeri complessi: sostanzialmente
154

segue immediatamente dalla versione sui complessi del Teorema 7.38. Naturalmente ciò
significa che si deve ripetere la teoria svolta in ambito complesso. Gli enunciati come pure
le dimostrazioni sono di fatto identici, con qualche piccola differenza. Ripercorriamone le
tappe
1. Il prodotto scalare viene sostituito dal prodotto Hermitiano: su Cn la (7.1) viene
sostituita dalla n
X
h~v , wi
~ = vi · wi
i=1
in questo modo la norma di un vettore complesso ~v vale
p pP
||~v || = h~v , ~v i = |vi |2 (cfr. appendice, A.14);

2. il Lemma 7.2 cambia: il prodotto Hermitiano è C-lineare rispetto al primo argo-


mento, R-lineare rispetto al secondo ma per portare fuori una costante complessa
dal secondo membro bisogna coniugarla:

hλ~v , wi
~ = λh~v , wi
~ ; h~v , λwi
~ = λh~v , wi
~ ;
inoltre risulta
h~v , wi
~ = hw,
~ ~v i ,
questo significa che si deve fare molta attenzione all’ordine in cui si scrivono i
prodotti Hermitiani.

3. per il teorema fondamentale dell’algebra (cfr. appendice) l’ipotesi c) della Propo-


sizione 7.20 diventa vuota e la proposizione diventa: ogni trasformazione di Cn
si triangolarizza tramite una base unitaria (=“ortonormale” nel caso complesso);

4. la matrice rappresentativa dell’aggiunta di T diventa tA ;

5. il Teorema 7.28 continua a valere (con Cn al posto di Rn , “Hermitiano” al posto


di “scalare”, “unitaria” al posto di “ortogonale” e t A al posto della semplice tA);

6. la (7.35) cambia di poco: nel caso complesso se T è normale le trasformazioni T


e T ⋆ hanno autovalori coniugati e “stessi” autospazi:
ker(T − λI) = ker(T ⋆ − λI) , ∀ λ ∈ C;

7. vale l’analogo del Teorema 7.38, solo che in ambito complesso l’ipotesi sugli auto-
valori diventa vuota grazie al teorema fondamentale dell’algebra.

A questo punto la dimostrazione del teorema Spettrale si riduce a poche righe:

Dimostrazione. Se T è una trasformazione reale autoaggiunta (ovvero se A è una trasfor-


mazione reale simmetrica), considerandola come trasformazione complessa, accanto ad ogni
autovalore λ deve avere l’autovalore λ (Lemma A.24), d’altro canto deve risultare
(⋆) Vλ, T = Vλ, T ⋆ = Vλ, T
dove con Vλ, T si intende l’autospazio di T relativo all’autovalore λ, eccetera. La prima
uguaglianza segue dalla (7.35) nel caso complesso (cfr. punto 6 di cui sopra), mentre la
seconda uguaglianza segue dall’uguaglianza T = T ⋆ (essendo T reale simmetrica, coincide
con la sua trasposta coniugata). Ma l’uguaglianza Vλ, T = Vλ, T (primo e terzo termine
di (⋆)) è un assurdo a meno che non risulti λ = λ, cioè a meno che λ non sia reale,
perché autovalori distinti non possono avere lo stesso autospazio (ovviamente, anche nel
caso complesso). 
155

§8. Spazi vettoriali Euclidei e Spazi Euclidei.

Sebbene un po’ ostinatamente abbiamo insistito nel lavorare con Rn , i risultati visti sono
più generali e sarebbe uno spreco non fare quel piccolo passo in più che consente di enunciarli
svincolati dall’ambiente che è stato il contesto del nostro lavoro, per l’appunto Rn .

In questo paragrafo introduciamo gli Spazi vettoriali Euclidei e gli Spazi Euclidei, sempre
reali e di dimensione finita, in un contesto astratto, generale, quindi rivisitiamo in questo
nuovo contesto i risultati visti finora. Iniziamo col definire gli oggetti del nostro studio.

Definizione 8.1. Sia V uno spazio vettoriale. Un prodotto scalare su V è una funzione

h , i : V × V −−−−→ R

simmetrica, bilineare, definita-positiva, cioè soddisfacente le tre proprietà che seguono:


i) h~v , w
~ i = hw,
~ ~v i , ∀ ~v , w
~ ∈ V;
ii) hλ~u +µ~v , w
~ i = λh~u, w
~ i + µh~v , w
~i e hw,
~ λ~u +µ~v i = λhw, ~ ~u i + µhw,
~ ~v i,
~ ∈ V, λ, µ ∈ R;
∀ ~u, ~v , w
iii) h~v , ~v i ≥ 0, ∀ ~v ∈ V ed inoltre h~v , ~v i = 0 ⇐⇒ ~v = ~0 .

La proprietà i) ci dice che il prodotto scalare è simmetrico. La proprietà ii) ci dice che il prodotto scalare
è bilineare , cioè lineare rispetto a ciascuno dei due argomenti. La proprietà iii) si esprime dicendo che il
prodotto scalare è definito-positivo . Osserviamo che la simmetria e la linearità rispetto al primo argomento,
insieme, implicano la linearità rispetto al secondo argomento, ovvero: in quanto ridondante, potevamo
evitare di scrivere la seconda metà della proprietà ii).

Definizione 8.2. Uno spazio vettoriale Euclideo è uno spazio vettoriale25 sul quale sia
stato fissato un prodotto scalare.

Naturalmente, continuiamo a usare la stessa terminologia usata nei paragrafi precedenti:


p
• Il valore ||~v || := h~v , ~v i si chiama norma del vettore ~v ;
• due vettori si dicono ortogonali se il loro prodotto scalare è nullo;
• una base B = {~b1 , ..., ~bn } di V si dice ortogonale se i ~bi sono ortogonali tra loro,
se inoltre hanno norma 1 allora B si dice ortonormale.

Continuano a valere la disuguaglianza di Cauchy-Schwarz e la disuguaglianza triangolare:

|h~v , w
~ i| ≤ ||~v || · ||w||
~ ||~v + w||
~ ≤ ||~v || + ||w||
~

In entrambi i casi la dimostrazione è quella già vista nel caso di Rn , dove non usiamo mai il fatto di avere
a che fare con Rn dotato del prodotto scalare standard (7.1), ma solo le proprietà i), ii) e iii) enunciate
sopra (cfr. dimostrazioni delle disuguaglianze 7.6 e 7.8).

Continuando a valere la disuguaglianza di Cauchy-Schwarz, anche la Definizione 7.7 si


generalizza al contesto attuale. La formula è la stessa:
 
h~v , wi~
ϑ := arccos
||~v || · ||w||
~

(come nella (7.7), i vettori ~ ~ sono vettori non nulli, l’angolo ϑ si assume compreso tra 0 e π ).
v e w

25 Come sempre, reale e di dimensione finita.


156

Per la bilinearità, la conoscenza del prodotto scalare di certi vettori implica la conoscenza
del prodotto scalare delle loro combinazioni lineari, infatti si deve avere
DX X E X D E
(8.3) λi ~vi , µi ~vi = λi µj ~vi , ~vj .
i i i, j

In particolare, fissata una base B = {~b1 , ..., ~bn } di V , il prodotto scalare è univocamente
determinato dalla matrice dei prodotti scalari dei vettori di B, la matrice
 
M = Mh , i ; B := h ~bi , ~bj i ,

matrice che chiameremo matrice del prodotto scalare rispetto alla base B . Precisamente,
dati due vettori ~v e w,
~ risulta
 
D E µ1
X  
(8.4) h~v , w
~i = λi µj ~bi , ~bj = (λ1 , ..., λn ) · M ·  ... 
(8.3) i, j µn

dove t (λ1 , ..., λn ) e t (µ1 , ..., µn ) sono i vettori numerici delle coordinate dei vettori ~v e
~ rispetto alla base B .
w

Osservazione 8.5. Se B è una base ortonormale di V allora Mh , i; B è la matrice


identica26 . In questo caso, applicando la (8.4) troviamo
X
(8.5′ ) h ~v , w
~i = λi µi
i

Questo risultato, considerato che a destra dell’uguaglianza (8.5′ ) abbiamo il prodotto


scalare standard (7.1) dei vettori numerici ~λ = t (λ1 , ..., λn ) e ~µ = t (µ1 , ..., µn ), ed
assodata l’esistenza di basi ortonormali (cosa che verifichiamo subito sotto, cfr. prop. 8.6),
ci consente di generalizzare tutti gli altri risultati dei paragrafi precedenti al contesto attuale.
Infatti, consente un’identificazione naturale
“ V , h , i , base ortonormale” ←→ “ Rn , prodotto standard (7.1), base canonica ”.
Ribadiamo qual è il punto:

per l’identificazione qui sopra, ogni teorema visto per la terna a destra si traduce

in un teorema valido per la terna a sinistra.


Proposizione 8.6. Uno spazio vettoriale Euclideo V, h , i ha una base ortonormale.
Dimostrazione. Il Teorema (7.18) ed il procedimento di ortonormalizzazione di Gram-Schmidt illustrato
subito prima valgono, senza bisogno di cambiare una virgola, anche nel contesto attuale: dati dei vettori
w
~1
indipendenti {w
~ 1 , ..., w ~ 1 , ovvero si pone ~b1 =
~ m }, si normalizza w (cosı̀ da avere ||~b1 || = 1), quindi
||w
~ 1 ||
~ 2 −h~
w ~2 i ~
b1 , w b1
si pone ~b2 = (cosı̀ da avere ~b2 ortogonale a ~b1 e anch’esso di norma 1). Il passo generale
|| ... ||
consisterà nel porre
~ k − c1 ~
w b1 − ... −ck−1 ~
bk−1
~b := , dove ci = h~bi , w
~ ii .
k || ... ||
In questo modo si ottiene una base ortonormale. 

In effetti, il risultato provato è più forte: ogni base può essere ortonormalizzata (fissata una base arbitraria,
si trova una base ortonormale dove lo Span dei primi k vettori coincide con lo Span dei primi k vettori
della base di partenza, per ogni k ). Cfr. Teorema (7.18).

26 Questo perché h~bi , ~bj i = 0 per i 6= j e h~bi , ~bi i = 1 per ogni i .


157

Come dicevamo, i risultati e le definizioni dei paragrafi precedenti si generalizzano, in


particolare la def. (7.9), la Prop. (7.10), la Prop. (7.12), la def. (7.13), l’oss. (7.15) e la
Prop. (7.20) continuano a valere qualora si sostituisca, ovunque, “ Rn ” con “ V ” (spazio
vettoriale Euclideo).

Esercizio 8.7. Riscrivere i risultati e le definizioni appena citati.

Naturalmente, si generalizzano anche i risultati dal Teorema (7.24) in poi. Vediamoli in


dettaglio (in quello che segue V denota sempre uno spazio vettoriale Euclideo):

Teorema 8.8. Data T : V −→ V si ha che esiste un’unica trasformazione


T ⋆ : V −→ V tale che ~ = h~v , T ⋆ (w)i
hT (~v ), wi ~ , ∀ ~v , w
~ ∈ V .

Definizione 8.9. La trasformazione T ⋆ la cui esistenza e unicità è garantita dal teorema


precedente si chiama aggiunta di T .

Esercizio 8.10. Verificare che se T è rappresentata dalla matrice A rispetto ad una base
ortonormale B, allora T ⋆ è rappresentata dalla matrice tA (sempre rispetto alla base B).

Definizione 8.11. Se T ⋆ = T diciamo che T è autoaggiunta (ovvero simmetrica).

Esercizio 8.12. Siano T ed S due trasformazioni di V e sia I l’identità di V in se.


Provare che
⋆
T +S = T ⋆ + S⋆ ; (λ T )⋆ = λ T ⋆ ; I⋆ = I .

Naturalmente, per l’esercizio (8.10), il suggerimento dato per l’esercizio (7.26) si applica anche in questo
caso. Cionondimeno questa volta riteniamo istruttiva una verifica diretta, ovvero che usi la caratterizzazione
dell’aggiunta data dalla formula hT (~
v ), wi
~ = h~ v , T ⋆ (w)i
~ , ∀ ~v, w
~ ∈ V.

Teorema 8.13. Sia T : V −→ V una trasformazione lineare e sia A la matrice che la


rappresenta rispetto ad una base ortonormale B . Le seguenti affermazioni sono equivalenti
i) T conserva il prodotto scalare: h~v , wi
~ = hT (~v), T (w)i
~ , ∀ ~v , w
~ ∈ V;
ii) T ⋆ ◦ T = Identità (T è invertibile e la sua inversa coincide con l’aggiunta);
t
iii) A · A = In (A è invertibile e la sua inversa coincide con la trasposta);
iv) le colonne di A formano una base ortonormale di Rn ;
v) le righe di A formano una base ortonormale di Rn ;

(nelle ultime due affermazioni Rn si intende dotato del prodotto scalare standard 7.1).

Questo teorema è la rivisitazione del Teorema 7.28 e, alla luce di quanto visto, in particolare dell’esercizio
8.10, la dimostrazione data allora si applica anche in questo nuovo contesto.

Definizione 8.14. Se T conserva il prodotto scalare (equivalentemente, soddisfa una


delle condizioni del teorema precedente), diciamo che T è ortogonale.
Naturalmente, risultati e definizioni visti in passato continuano a valere: una matrice A è ortogonale se la
moltiplicazione per A è una trasformazione ortogonale di Rn , equivalentemente, se risulta tA · A = In .
Con la Definizione 8.14 diciamo che una trasformazione di uno spazio vettoriale Euclideo astratto si dice
ortogonale se conserva il prodotto scalare; alla luce del Teorema 8.13, ciò accade se, rispetto ad una base
ortonormale, è rappresentata da una matrice ortogonale.

Definizione 8.15. Diciamo che T : V −→ V è una trasformazione normale se commuta


con la sua aggiunta:
T ◦ T⋆ = T⋆ ◦ T .
158

Osservazione 8.16. Sia T : V −→ V è una trasformazione di V in se. Si ha che

T è normale se e solo se ||T (~v )|| = ||T ⋆ (~v )|| , ∀ ~v ∈ V .

Cfr. (7.32′ ) e esercizio (7.33).

Osservazione 8.17. Sia T : V −→ V una trasformazione normale. Le trasformazioni


T e T ⋆ hanno stessi autovalori e stessi autospazi.

Di nuovo, non cambia nulla rispetto al lavoro già fatto:


Dimostrazione. È sufficiente provare che ||T ⋆ (~ v ) − λ~
v || = ||T (~
v ) − λ~
v || (avendo la stessa norma, il primo
vettore è nullo se e solo se il secondo vettore è nullo). Si ha:
||T ⋆ (~
v ) − λ~
v || = ||(T − λI)⋆ (~
v )|| = ||(T − λI)(~
v )|| = ||T (~
v) − λ~
v ||
(8.12) (8.16)

dove I denota l’identità. 

Proposizione 8.18. Se T : V −→ V è normale allora autovettori corrispondenti ad


autovalori distinti sono ortogonali.

Riscriviamo la dimostrazione data nel §7:


Dimostrazione. Sia T (~
v ) = λ~
v e T (w)
~ = µw
~.
λh~
v , wi
~ = hλ~
v , wi
~ = hT (~
v ), wi v , T ⋆ (w)i
~ = h~ ~ = h~
v , µwi
~ = µh~
v , wi
~ .
(oss. 8.17)
Essendo λ 6= µ si deve avere h~
v , wi
~ = 0. 

Teorema 8.19. Sia T : V −→ V una trasformazione lineare. Le affermazioni che


seguono sono equivalenti
i) esiste una base ortonormale di autovettori per T ;
ii) T è autoaggiunta ed ha n autovalori in R;
iii) T è normale ed ha n autovalori in R.

Tornando alla (8.4), abbandoniamo le basi ortonormali. La proposizione che segue ci dice
come cambia la matrice del prodotto scalare quando si cambia la base di V .

Proposizione 8.20. Sia V uno spazio vettoriale Euclideo, h , i il prodotto scalare.


Siano B e B ′ due basi di V , sia C la matrice del cambiamento di base da B e B ′ , siano
M e M ′ le matrici del prodotto scalare rispetto a B e B ′ . Si ha
M′ = t
C ·M ·C

Si osservi che se B e B ′ sono basi ortonormali, allora C è una matrice ortogonale


(convincersene) e l’uguaglianza è banalmente verificata: si ha M = M ′ = I (oss. 8.5), ma
anche t C · M · C = t C · C = C −1 · C = I .

Dimostrazione. Siano ~λ e ~λ′ i vettori numerici delle coordinate di un vettore ~v rispetto


a B e B ′ , siano µ
~ e µ ~ (quindi ~λ = C ·~λ′ e ~µ = C ·~µ′ ). Risulta
~ ′ quelli di un vettore w
t~ ′
λ · M ′ · ~µ′ = h~v , wi
~ = t~λ · M · ~µ = t (C ·~λ′ ) · M · (C ·~µ′ ) = t~λ′ ·(t C ·M ·C)·~µ′ .
(8.4) (8.4)

t~ ′
µ′ = t~λ′ ·(t C·M ·C)·~µ′ deve valere per ogni coppia di vettori
Poiché l’uguaglianza λ · M ′ · ~
~ , di conseguenza per ogni coppia ~λ′ e ~µ′ , segue la tesi.
~v e w 
159

Concludiamo dando la definizione di spazio Euclideo, diamo la definizione in totale analo-


gia a quanto visto nel cap. I, §16, sezione “Spazi Affini” (tra le due definizioni ivi considerate
preferiamo la seconda perché non nomina mai Rn ):

Definizione 8.21. Uno Spazio Euclideo è una terna (E, W, Ψ), dove E è un insieme,
W è uno spazio vettoriale Euclideo (def. 8.2) e Ψ è una funzione
Ψ : E × E −−−−→ W
tale che
i) per ogni a ∈ E fissato, si ha che la funzione
ψa : E −→ W , ψa (a) := Ψ(a, a),
è biunivoca;
ii) vale la regola di Chasles Ψ(a, b) + Ψ(b, c) = Ψ(a, c) , ∀ a, b, c ∈ E .

Come già osservato nel citato (cap. I, §16, sezione “Spazi Affini”), dalla regola di Chasles seguono rapida-
mente le due proprietà :
iii) Ψ(a, a) = ~0 , ∀ a ∈ E (~0 ∈ W denota il vettore nullo di W );
iv) Ψ è antisimmetrica, cioè Ψ(a, b) = −Ψ(b, a) , ∀ a, b ∈ E .

Naturalmente la definizione di Spazio Euclideo può essere anche data in analogia alla
Definizione I.16.18 del capitolo I:

Definizione 8.21 ′ . Uno Spazio Euclideo è un insieme E sul quale sia definita una famiglia
non vuota di funzioni biunivoche

F = φ : E −→ Rn tale che φ ◦ ψ −1 (x) = M x + b , ∀ φ, ψ ∈ F
dove x, b ∈ Rn ed M è una matrice ortogonale n × n.
160

§9. Soluzione degli esercizi.


  
1.17. πhwi v ) = −20+21
~ (~ 34
−5
3 = −5/34
3/34
. 1.18. πhwi~ (~ v ) = −20+20
116
10
4 = ~0 ;
−12−75 6
 −522/261 −2 −2

πh~u1 i (~v ) = 261 −15 = 1305/261 = 5 ; πh~u2 i (~v ) = πh~u1 i (~v ) = 5 (poiché h~u2 i = h~u1 i).
1
   √ √
1.20. −4 . 1.21. 17 . 12
1.22. −20 . 1.23. 5 , 148 , 65 .
30 74 1
1.24. 33/65 . 1.25. √3016 , √7592 , − √2117 (attenzione ai segni!).
 √   
1/ 5
1.26. 10 , 2/√5 , −2 5
, 20
48 . 1.27. 59. 1.28. 1. 1.29. 14, 23.
 
x = −1 + 5t x = −1 + t
2.6. . 2.8. .
y = 4 + 9t y = 4 + 7t
2.10. Le rette parallele alla retta s sono descritte da equazioni del tipo 2x − 3y + c = 0
(convincersene). Imponendo il passaggio per il punto P troviamo c = 9 . In definitiva,
2x − 3y + 9 = 0 è un’equazione cartesiana di r .
 
6
2.11. Essendo ~v = P Q = un vettore parallelo alla retta passante per i punti
4 
x = 2 + 6t
dati, quest’ultima è descritta dalle equazioni parametriche . Eliminando
y = 1 + 4t
il parametro t troviamo l’equazione cartesiana 2 x − 3 y − 1 = 0 .
2.12. 3x + 2y − 13 = 0 . 2.13. 5x − 2y − 7 = 0 ; (stessa retta); y = 5 ; x − y = 0 .
   
x = 1 + 2t x = 2 x = t x = t
2.14. + 5t ; ; ; .
y = −1 y = y = 0 y = t

x = −1 + 3t
2.15. 3x + 2y − 32 = 0 . 2.16. . 2.17. 2x − y + 1 = 0 .
 y = 3+t
x = 4 + 3t √
2.18. . 2.20. 15/ 29 .
y = 5 − 3t
   
−1 3
3.2. 42 ; 141 . 3.3. 40 . 3.4. 50 . 3.6. (p ∈ r) . 3.7. .
8 8
       
2 12 √ √ 15 18
4.15. a)  −8 ; b)  −20 ; c) 118; d) 34/ 2388; e)  −30 ; f )  7 ;
   1  −4
        10 0 
18 5 −66 −10 −14 3 2 −2
g)  7  e  0 ; h) −29,  −1 ,  0 ,  1 ; i) ~a =  1 , ~b = ~u ∧~a =  4 ;
0 7 12 12 21 −5 0 15
√ √ √
1 1 c
~ = 4 77; m) 2 ||P Q ∧ P R|| = 2 1253; n) cosP QR = 83/ 8142, cosQRP =
l) ||~v ∧ w|| c
√ √ √ √
−14/ 1449, cosRc P Q = 35/ 2478; o) 28; p) 7 5 · 245 = 245 (coincide col modulo
del determinante della matrice associata ai vettori), essendo i vettori ortogonali tra loro, il
parallelepipedo è retto ed il suo volume è uguale al prodotto delle lunghezze degli spigoli;
q) Si tratta di capire se visti da R i segmenti orientati OP ed OQ appaiono come nella
figura 1 o come nella figura 2:
Q P
• •
OQ OP
fig. 1 • fig. 2 •
P Q
O• OP O• OQ

Vista la convenzione adottata27 (inciso 4.15), siamo nel primo caso se e solo se i vettori
OP , OQ, OR definiscono la stessa orientazione della terna canonica ~e1 , ~e2 , ~e3 , ovvero se
27Si noti che questa determina la corrispondenza “orientazione di R3 ” ←−−→ “orientazione dello spazio fisico”,
senza la quale non avrebbe neanche senso porre la domanda (i dati dell’esercizio sono coordinate, concernono
R3 , mentre la domanda concerne lo spazio fisico).
161

e solo se il determinante della matrice associata ad essi è positivo. Questo accade (tale
determinante vale 99), quindi vedremo girare il topolino in senso antiorario.

 x = 2 + 4t + 2s
5.11. y = 5 t + 9 s (i coefficienti di t ed s sono le coordinate di P Q e P K ).

z = 1 + 6t + 7s
   
−6 √ 2 √
5.16. πr (P ) = −9, dist{P, r} = 131. 5.17. πr (P ) =  1 , dist{P, r} = 22 .
1 1
7.5. ||~v + w|| ~ 2 − ||~v − w||
~ 2 = h~v + w, ~ ~v + wi ~ − h~v − w, ~ ~v − wi
~ = h~v , ~v i + 2h~v , wi ~ + hw, ~ −
~ wi
h~v , ~v i + 2h~v , wi ~ − hw,~ wi~ = 4h~v , wi ~ .
7.16. Si vogliono   due soluzioni dell’equazione  2x − y + 3z = 0 che siano ortogonali.  Ad
1 6 2
esempio ~h1 =  2  ed ~h2 = ~h1 ∧ ~n =  −3 . Si ha πH (~v ) = π~h1 (~v ) + π~h2 (~v ) =  7 
0 −5 1
(formula 7.12′′ ).    
16/5 0
7.17. Si ha π~h (~v ) =  32/5  , π~k (~v ) =  33/5  . La somma non dà il vettore πH (~v )
0 11/5
trovato nell’esercizio precedente.
7.19. Denotiamo con w ~ 1, w~ 2, w ~ 3 i tre vettori indicati nel testo.
Eseguendo l’ortonormalizzazione di Gram-Schmidt si trova
     
3 2 1
~b1 = w~ 1 = 1  , ~b2 =  1  w~ 2 −π ~b
( w
~ 2 ) 1  0  ~ w
~ 3 −π ~
b
( w
~ 3 )−π~b
( w
~ 3 )  0
|| “numeratore ” || = 3  2 , b3 = =  .
1 1 2
||w
~ 1 || 6 5 || “numeratore ” || 0
1 1 0
Una verifica utile è la seguente: Span {w ~ 1, w~ 2, w ~ 3 } è lo spazio di equazione cartesiana
−3y+z−2w = 0, anche i vettori ~b1 , ~b2 , ~b3 soddisfano questa equazione e sono indipendenti.
7.22. Se lo fosse, il polinomio caratteristico P (λ) avrebbe 2 radici reali, ma questo non
accade perché P (λ) = λ2 + 1 .
     
1 2 3
7.23. I vettori ~v1 =  −1 , ~v2 =  −1 , ~v3 =  −1  costituiscono una base di
2 −1 −3
autovettori per A, indicando con B la matrice associata a questi vettori e con ∆ la matrice
diagonale associata ai corrispondenti autovalori (nell’ordine) 3, 2, 2 risulta ∆ = B −1 ·A·B
(questa è la diagonalizzazione di A). Per triangolarizzare A tramite una base ortonormale
è sufficiente ortogonalizzare la base ~v1 , ~v2 , ~v3 : si ottengono i vettori d~1 , d~2 , d~3 e la
triangolarizzazione
  indicati:
     
1 √ 11 3 3 ∗ ∗
d~1 = 16  −1 , d~2 = 202  −5 , d~3 = √135  5  ;  0 2 ∗  = D−1 · A · D , essendo
2 −8 1 0 0 2
D la matrice associata ai vettori d1 , d2 , d3 . ~ ~ ~
La matrice C non è diagonalizzabile perché l’autospazio relativo all’autovalore 2 ha dimen-
sione 1 (mentre la molteplicità algebrica di tale autovalore è 2).
Indichiamo con ~r1 ed ~r2 due autovettori (indipendenti) di C . Per triangolarizzare C si
devono trovare tre vettori ortonormali w ~ 1, w ~ 2, w~ 3 tali che C · w ~ 1 ∈ Span{w ~ 1 }, C · w~2 ∈
Span{w ~ 1, w ~ 2 }, C · w~ 3 ∈ Span {w ~ 1, w ~ 2, w ~ 3 } . Quanto al primo vettore siamo costretti a
scegliere un autovettore e normalizzarlo (scegliamo ~r1 ), quanto al secondo vettore possiamo
sia procedere come nella dimostrazione del Teorema 7.20 che prendere il secondo autovettore
(visto che c’è, perché non usarlo) ed ortonormalizzare la coppia {w ~ 1 , ~r2 } . Quanto al terzo
vettore, visto che la condizione sullo “Span” è vuota, è sufficiente prendere un qualsiasi
vettore di norma 1 ortogonale ai primi due, ad esempio il loro vettoriale w ~1 ∧ w ~ 2 (che ha
automaticamente norma 1: l’area di un quadrato di lato 1 vale 1!).
162

7.26. Indicate con A e B le matrici associate a T ed S si deve verificare che t (A + B) =


t
A +t B, t (λA) = λtA, t (λI) = λI . Queste proprietà sono tutte ovvie.
7.33. Scrivendo la formula (7.4) per i vettori T (~v ) e T (w) ~ troviamo
1
 
~ = 4 ||T (~v ) + T (w)||
hT (~v ), T (w)i ~ 2
− ||T (~v ) − T (w)||
~ 2
= 14 ||T (~v + w)||
~ 2 − ||T (~v − w)||
~ 2 .
Naturalmente questa formula vale anche con T ⋆ al posto di T . Ciò dimostra che la (7.32′ )
implica la (7.32). D’altro canto la (7.32) ci dice che h~v , T ⋆ ◦ T (w)i ~ = h~v , T ◦ T ⋆ (w)i
~ per
n ′ ⋆
ogni ~v , w~ ∈ R . Per la (7.15 ) e l’arbitrarietà di ~v , si ha che T ◦ T (w) ~ e T ⋆ ◦ T (w)
~ hanno
le stesse coordinate per ogni w ~ . Ciò dimostra l’uguaglianza T ⋆ ◦ T = T ⋆ ◦ T .
163

Appendice

I NUMERI COMPLESSI

I numeri complessi sono un campo che estende il campo dei numeri reali. Ciò che ne
giustifica l’introduzione e ne rende assolutamente irrinunciabile l’utilizzo risiede nel teo-
rema Fondamentale dell’Algebra, Teorema secondo il quale ogni polinomio si fattorizza nel
prodotto di polinomi di primo grado, ovvero ogni polinomio di grado n ha esattamente n
radici (contate con molteplicità). I numeri complessi sono spesso di fatto indispensabili,
persino molti problemi concernenti esclusivamente i numeri reali vengono risolti mediante il
loro utilizzo. Giusto a titolo d’esempio: i) il fatto che ogni polinomio reale (a coefficienti
reali) si fattorizza nel prodotto di polinomi anch’essi reali di grado 1 e 2 segue immediata-
mente dal teorema Fondamentale dell’Algebra; ii) il metodo di Cardano per determinare
le soluzioni dei polinomi di terzo grado coinvolge i numeri complessi anche se si conside-
rano esclusivamente polinomi reali che hanno tre radici reali; iii) per dimostrare il Teorema
Spettrale (7.39) si utilizzano i numeri complessi.

Prima di introdurre i numeri complessi li collochiamo in una lista di “insiemi numerici”


ordinata per ricchezza di struttura; tra parentesi indichiamo qual è la proprietà in più che
ha l’insieme numerico in questione rispetto al precedente.
N = “numeri naturali”: sono definite somma e prodotto;
Z = “numeri interi” (è possibile invertire la somma: c’è la sottrazione);
Q = “numeri razionali” (è possibile invertire il prodotto per un numero non nullo:
c’è la divisione);
R = “numeri reali” (è completo: ogni successione di Cauchy ha un limite);
C = “numeri complessi” (vale il teorema Fondamentale del’Algebra).

Naturalmente: N ⊆ Z ⊆ Q ⊆ R ⊆ C.

Introduciamo i numeri complessi.

Definizione A.1. L’insieme dei numeri complessi C è l’insieme delle espressioni formali
del tipo a + ib , dove a e b sono numeri reali (mentre “+” ed “i” sono semplicemente dei
simboli): 
C := a + i b a, b ∈ R
Dato un numero complesso z = a + i b , i numeri reali a e b vengono chiamati rispettiva-
mente parte reale e parte immaginaria di z .

Si osservi che, in sostanza, un numero complesso non è altro che una coppia di numeri
reali, la ragione per cui si utilizza questa notazione
√ sarà chiara molto presto. Esempi di
numeri complessi sono 2 + i 3, −1 + i (− 73 ), 0 + i 2, −19 + i 0 eccetera.

L’insieme dei numeri reali viene visto come sottoinsieme di quello dei numeri complessi
tramite l’inclusione naturale seguente:
R ֒→ C
(A.2)
a 7→ a + i 0
Inoltre si fa uso della seguente notazione: per ogni a ∈ R, b ∈ R r {0} i numeri complessi
a+i 0, b+i 1, 0+i b vengono denotati rispettivamente con a, b+i, i b (con i se b = 1). Da
notare che la notazione è compatibile con l’inclusione R ⊆ C appena introdotta.
164

Per ora abbiamo solo introdotto un insieme. Ora vogliamo arricchire il nostro insieme
introducendovi due operazioni.

Definizione A.3. Sull’insieme C dei numeri complessi si definiscono due operazioni,


dette rispettivamente somma e prodotto nonché denotate con i simboli “+” e “ · ”, ponendo:

(a1 + ib1 ) + (a2 + ib2 ) := (a1 + a2 ) + i(b1 + b2 )


(a1 + ib1 ) · (a2 + ib2 ) := (a1 a2 − b1 b2 ) + i(a2 b1 + a1 b2 )

Si osservi che c’è un notevole abuso di notazioni: i simboli “+” e “ · ” sono gli stessi che
si usano per indicare la somma e il prodotto di numeri reali, e addirittura il simbolo “+” lo
abbiamo anche usato nell’espressione formale (def. A.1) che denota un numero complesso.
Nonostante questo abuso di notazioni è impossibile avere ambiguità: il numero complesso
a + i b (def. A.1) risulta uguale alla somma (secondo la def. A.3) dei numeri complessi a ed
i b ; (inoltre, il numero complesso i b è uguale al prodotto i · b dei numeri complessi i e b ,
ciò permette che il simbolo “ · ” venga omesso senza che per questo ci sia ambiguità); somma
e prodotto di numeri reali coincidono con somma e prodotto dei corrispondenti numeri
complessi. Quest’ultima proprietà è ben più della legittimazione di un abuso di notazione,
per questo motivo la ripetiamo:

Proposizione A.4. L’inclusione R ⊆ C rispetta le operazioni di somma e prodotto.

Osservazione A.5. Si ha
i2 = −1

nella notazione della def. A.1: (0 + i 1) · (0 + i 1) = −1 + i 0 .

Il numero complesso i viene chiamato unità immaginaria (sebbene di “immaginario”


non vi sia nulla di più di quello che c’è in qualsiasi altra costruzione astratta, compresa la
costruzione dei numeri reali!).

Osservazione A.6. La definizione del prodotto può sembrare poco naturale ma non lo
è affatto: il prodotto tra numeri complessi (a1 + ib1 ) · (a2 + ib2 ) non è altro è altro che il
risultato che si ottiene semplificando il prodotto tra polinomi
(a1 + i b1 ) · (a2 + i b2 ) = a1 a2 + i (b1 + b2 ) + i2 (b1 b2 )
mediante la sostituzione di i2 con −1 . Questa prerogativa ha una conseguenza importante:
possiamo considerare i numeri complessi, nonché svolgere le operazioni tra questi, come se
fossero polinomi. In particolare valgono tutte quelle proprietà alle quali siamo abituati: as-
sociativa, commutativa, distributiva, esistenza dello zero e dell’opposto, esistenza dell’unità.
In altri termini, vale la proposizione che segue.

Proposizione A.7. Somma e prodotto di numeri complessi soddisfano le proprietà


associativa, commutativa, distributiva, dell’esistenza dello zero, dell’opposto e dell’unità. In
simboli, dati comunque dei numeri complessi u = a+ i b, v e z si ha

u + (v + z) = (u + v) + z , u+v = v +u,
u · (v · z) = (u · v) · z , u· v = v ·u,

(A.7 ) (u + v) · z = u · z + v · z ,
0+u = u , ∃ − u | u + (−u) = 0
1·u = u , 0·u = 0 .
(Naturalmente, −u = −a − i b , dove, per abuso di notazione, con −a − i b intendiamo l’espressione formale
c + i d , essendo c = −a e d = −b , della Definizione A.1 ).

Esercizio A.8. Verificare le proprietà (A.7′ ) utilizzando direttamente la Definizione A.3.


165

La Proposizione (A.7) ci dice che C è un anello commutativo unitario (questo è il nome


che si dà ad un insieme sul quale sono definite due operazioni che soddisfano le proprietà28
(A.7′ )). In effetti C è un campo: oltre alle proprietà indicate, ogni elemento non nullo
ammette un inverso (che risulta essere unico). Possiamo essere più precisi:
 
(A.10) dato u = a + i b 6= 0 e posto ρ := a2 + b2 , risulta u · aρ − i ρb = 1

(si osservi che essendo u non nullo per ipotesi risulta anche ρ 6= 0). Tale numero, che viene
denotato con u−1 , è l’unico numero che gode di questa proprietà (si ha esistenza e unicità29
del reciproco di un numero complesso non nullo).
2 5
Esempio. L’inverso di 2 + 5 i è il numero 29 − 29 i (lo studente svolga il prodotto e
verifichi che dà 1).
−1 −1 −1 −1 −1
Esercizio A.11. Calcolare 1 + 7 i , 19 i , 14 , 3 + 4i , 8− i .

A questo punto vogliamo fornire una rappresentazione grafica dei numeri complessi ed
introdurre un po’ di terminologia. La rappresentazione grafica di z = a + ib è quella
indicata in figura.

Im

(fig. A.12) z = a + i b = ρ·(cosθ+i senθ)


b •

θ
Re
a

dove Re ed Im denotano parte reale e parte immaginaria. La lunghezza ρ del segmento


che unisce l’origine degli assi con ”z”, o meglio, se preferite, con il punto di coordinate (a, b) ,
si chiama modulo di z e si indica con |z| . Ora assumiamo z 6= 0 , l’angolo θ rappresentato
in figura si chiama argomento di z . Chiaramente risulta a = ρ·cosθ , b = ρ·sen θ . La
rappresentazione

(A.13) z = ρ · (cosθ + i senθ)

si chiama rappresentazione polare di z , modulo e argomento di z (cioè i valori ρ e θ )


si chiamano anche coordinate polari di z . Il numero complesso z := a − ib si chiama
coniugato di z (la notazione usuale è quella che abbiamo appena adottato: per indicare il
coniugato di un numero complesso ci si mette una barra sopra, ad esempio 3 + 7i = 3 − 7i ).
La funzione coniugio è, per definizione, la funzione che associa ad un numero complesso il
suo coniugato. Si osservi che z := a − ib = ρ·(cosθ−i senθ) = ρ· cos(−θ)+i sen(−θ) ,
pertanto z ha stesso modulo ed argomento opposto di z . Si osservi quanto segue:

z · z = ρ2 = |z|2 (in particolare è un numero reale)


(A.14) 1 a b z
= −i 2 =
z ρ2 ρ |z|2

(di fatto abbiamo riscritto la (A.10)).


28 In inciso, la proprietà 0 · u = 0 può essere dedotta dalle altre. Dalle proprietà (A.7′ ) si ottiene anche
−1 · u = −u = 1 · (−u) .
29 L’unicità segue dalle proprietà (A.7′ ):

a·u = b·u = 1 =⇒ a = a · 1 = a · (b · u) = a · (u · b) = (a · u) · b = 1 · b = b .
166

In termini di coordinate polari, il prodotto di numeri complessi si effettua moltiplicando


i moduli e sommando gli argomenti. Infatti:
     
(A.15) ρ(cosθ + i senθ) · ℓ (cosψ + i senψ) = ρ ℓ cos(θ + ψ) + i sen(θ + ψ)

Pertanto, si ha anche
 n  
(A.16) ρ(cosθ + i senθ) = ρn cos(nθ) + i sen(nθ) .

Questa formula consente di estrarre senza difficoltà le radici di un numero complesso: con-
sideriamo z = ρ(cosθ + isenθ), i numeri complessi x che soddisfano l’equazione xn = z

sono i numeri complessi di modulo n ρ e di argomento ϕ che soddisfa l’equazione

(A.17) nϕ = θ (modulo 2 π) ,

dove la postilla tra parentesi sottintende il fatto che si tratta di un’identità di angoli, alge-
bricamente ha il significato che segue: consideriamo nϕ uguale a θ se la loro differenza è
un multiplo intero di 2π (che è l’angolo nullo). Ogni angolo del tipo ϕk := 2kπ+θ n (con k
intero) è una soluzione dell’equazione (A.17), d’altro canto ϕk = ϕk+n ed è quindi chiaro
che per ottenere tutte le soluzioni senza ripetizioni l’indice k deve variare da 0 ad n − 1 :

2π + θ 4π + θ 2 (k−1)π + θ
(A.18) le soluzioni dell’equazione (A.17) sono : , , ... , .
n n n
In definitiva, l’equazione xn = z ha esattamente n radici distinte:
    

n 2kπ + θ 2kπ + θ
(A.19) ρ · cos + i sen , k = 0, 1, ..., n − 1 .
n n

Esercizio A.20. Calcolare le radici cubiche del numero 2 + 2 i .



Soluzione. Scriviamo 2 + 2 i in forma polare: |2 + 2 i | = 2 2, quindi
√ h i √  
2 + 2 i = 2 2 √12 + √12 i = 2 2 cos π4 + i sen π4 .

Gli angoli ϕ che soddisfano l’equazione 3 ϕ = π4 sono 12


π
, 9π 17π
12 , 12 , quindi le radici cubiche
cercate sono
√  π π
 √  
2 cos 12 + i sen 12 , −1 + i , 2 cos 17π 17π
12 + i sen 12 .


Esercizio A.21. Calcolare:



a) le radici quadrate dei numeri 1 + 3 i , i , −i , 1 , −1 .
b) le radici cubiche dei numeri 27 i , −1 .

c) le radici quarte dei numeri −4 , 1 , −1 , −2 + 2 3 i .

d) le radici seste dei numeri 2 + 2 i , −27 i , 4 + 4 3 i .

Prima di procedere ricordiamo un fatto generale concernente la divisione tra polinomi:


dati due polinomi p(x) di grado n e d(x) di grado m si ha che esistono (e sono unici) due
polinomi q(x) ed r(x), quest’ultimo di grado strettamente minore di m, tali che

p(x) = d(x) · q(x) + r(x) , grador(x) ≤ m − 1

Il calcolo di q(x) ed r(x) si chiama divisione con resto. Sicuramente avrete visto l’algoritmo
della divisione tra polinomi reali (che peraltro è assolutamente identico a quello della divi-
sione tra numeri interi). Qualora p(x) e d(x) siano polinomi complessi non cambia una
167

virgola. Ad esempio, la divisione 5x4 + (2 − i)x3 + (−3 + 2i)x2 + 2x + 5 − i : (2 − i)x2 − 1


si effettuerà scrivendo

5 x4 + (2−i)x3 + (−3+2i)x2 + 2 x + 5−i (2−i)x2 − 1

5 x4 − (2+i) x2 (2+i)x2 + x − 1 + i

(2−i)x3 + (−1 + 3 i)x2 + 2 x + 5−i


(2−i)x3 −x

(−1 + 3 i)x2 + 3 x + 5−i


(−1 + 3 i)x2 + 1−i

3x + 4

In definitiva risulta quoziente


  z }| { z resto
}| {
4 3 2 2 2
5x + (2−i)x + (−3+2i)x + 2x + 5−i = (2−i)x −1 · (2+i)x + x − 1+i + 3 x + 4 .

Abbiamo visto che l’equazione xn = z ha esattamente n radici. Più in generale, ciò


vale per ogni polinomio.

Teorema Fondamentale dell’Algebra. Ogni polinomio P (x) a coefficienti complessi


si può fattorizzare nel prodotto di polinomi di primo grado:

p(x) = a · (x − λ1 ) · ... · (x − λn )

dove λ1 , ..., λn ∈ C.

Da notare che risulta p(λi ) = 0 per ogni i . D’altro canto, fissato un valore λ è possibile
scrivere p(x) = (x− λ) · q(x) + r , dove q(x) ed r sono quoziente e resto della divisione
p(x) : (x − λ) (il resto di questa divisione deve avere grado zero, ovvero deve essere una
costante). Di conseguenza, se risulta p(λ) = 0 si ha anche r = 0 e pertanto x−λ è un
fattore di p(x). Naturalmente la stessa radice potrà comparire più volte. Ricapitolando:
i) i λi sono esattamente le radici del polinomio;
ii) i λi non sono necessariamente distinti.

Come conseguenza del risultato sulla divisione tra polinomi abbiamo che il Teorema Fon-
damentale dell’Algebra è equivalente all’affermazione che segue:

(A.22) ogni polinomio complesso ammette almeno una radice

Dimostrazione. Se ogni polinomio ha una radice, dato un polinomio p(x) lo possiamo


scrivere nella forma p(x) = (x − λ) · q(x), quindi iterando il discorso o se preferite per
ragioni induttive sul grado dei polinomi da decomporre, lo possiamo decomporre in fattori
di primo grado. 

Il Teorema Fondamentale dell’Algebra può essere dimostrato sia con metodi algebrici che
analitici che topologici. Noi non lo dimostriamo.

Concludiamo questa appendice con due importanti conseguenze del Teorema Fondamen-
tale dell’Algebra. Premettiamo due osservazioni.
168

Osservazione A.23. Siano z e w due numeri complessi, si ha


(A.23′ ) z+w = z+w , z·w = z·w .
Ne segue che se p(x) è un polinomio reale (cioè i suoi coefficienti sono numeri reali) allora
(A.23′′ ) p(z ) = p(z) , ∀z ∈ C.

Dimostrazione. La (A.23′ ) è immediata: per dimostrarla basta porre z = a+i b , w = c+i d


e scrivere per esteso le espressioni ivi indicate (lo studente è invitato a scriverle).
La (A.23′′ ) segue dalla (A.23′ ): un polinomio è fatto di somme e prodotti (i coefficienti non
cambiano perché essendo per ipotesi reali coincidono con i propri coniugati). 

Come conseguenza della (A.23′′ ) si ottiene il seguente lemma.

Lemma A.24. Sia p(x) un polinomi reale. Allora



p(λ) = 0 =⇒ p λ = 0
cioè se λ è una radice di p(x) allora anche λ lo è.

Dimostrazione. Si ha p λ = p(λ) = 0 = 0 . 

Corollario A.25. Ogni polinomio reale si fattorizza nel prodotto di polinomi reali di
primo e secondo grado.

Dimostrazione. Sia p(x) un polinomio reale. Fattorizziamolo sui complessi. Per il Lemma
A.24, per ogni radice λ = a + ib non reale (cioè con b 6= 0) troviamo anche la radice
λ = a − i b (distinta da λ). D’altro canto
(x−λ) · (x−λ) = (x−a−i b) · (x−a+i b) = x2 − 2ax + a2 + b2
è un polinomio reale nonché un fattore di p(x). Quanto visto permette di raccogliere in
ogni polinomio almeno un polinomio di grado uno o due. Per ragioni induttive otteniamo
la tesi. 

Da notare che questo risultato concerne esclusivamente l’ambito reale ma che lo abbiamo
dedotto dal Teorema Fondamentale dell’Algebra, in particolare usando i numeri complessi.

Soluzione degli esercizi.


−1 1
−1 −1 −1
A.11. 1+7 i = 50 − √750 i ; 19 i = − 191
i ; 14 1
= 14 ; 3+4 i 3
= 25 − √425 i ;
−1 8 1
8− i = 65 + 65 i.
√ h √ i2 h  i2 h  i2
A.21. a) 1+ 3 i = ± √32 + √i2 ; i = ± √12 + i √12 ; −i = ± √12 − i √12 ;
h √ i3 h √ i3
2 2 3
1 = [ ± 1] ; −1 = [± i] ; b) 27 i = 3 2 3 + 23 i = − 3 2 3 + 23 i = [−3 i] ;
h √ i3 h √ i3
−1 = [−1]3 = 12 + 23 i = 21 − 23 i ; c) −4 = [± (1 + i)]4 = [± (1 − i)]4 ;
h  i4 h  i4
4 4
1 = [± 1] = [ ± i] ; −1 = ± √12 + i √12 = ± √12 − i √12 ;
√ h √ √ i4 h √ √ i4
−2 + 2 3 i = ± 22 + 26 i = ± 26 − 22 i ;
h√  i6
d) 2 + 2 i = 2 cos (1+8k)π
24 + isen (1+8k)π
24 , k = 0, 1, 2, 3, 4, 5 ;
h√  i6
−27 i = 3 cos (3+4k)π
12 + isen (3+4k)π
12 , k = 0, 1, 2, 3, 4, 5 ;
√ h √  i6
4 + 4 3i = 2 cos (1+6k)π
18 + isen (1+6k)π
18 , k = 0, 1, 2, 3, 4, 5 ;
169

III

ESERCIZI DI RIEPILOGO E TESTI D’ESAME

Gli esercizi contrassegnati con un asterisco appartengono a testi d’esame. È importante


che lo studenti impari a motivare in forma scritta (e si richiede un lavoro in tal senso), con
spiegazioni chiare ed essenziali, le risposte date ai quesiti proposti.

Gli esercizi sono catalogati per argomenti. Naturalmente, per quel che riguarda i testi
d’esami questa catalogazione è meno rigorosa: può accadere che un esercizio catalogato sotto
una certa etichetta richieda in parte la conoscenza di nozioni successive.

§1. Matrici.

Esercizio 1.1. Calcolare i seguenti prodotti tra matrici


   
    5 1     −3 1
4 −1 3  3 −2  · −3 1 1 −1 6
· ·  1 −2 
3 −2 −7 1 −2 3 −1 −3
2 −5 2 1
     
    −4 −4 4
k −1 3 4   
·  7 · 3 3 − 5 11 ·  7   1  · −2 7
−k −2 2k −3k
−11 −3 6
   
    3 5     2 2
2 −7 2 3 4  · 3 −1 −1 2 6
· ·  4 −1 
2 −2 3 −1 −1 −1 1 4
2 −7 −3 2
Esercizio
 1.2. Date le matrici    
1 1   0 1 2 2 −1
1 0 0
A = 1 1, B= , C = 1 2 3, D= 3 5 ,
0 1 0
1 1 2 3 4 −1 7
calcolare i seguenti prodotti: i) (AB)C , A(BC) ; ii) C(AB) , (CA)B ;
iii) (AB)(CD) , A(B(CD)) , A((BC)D) , ((AB)C)D , (A(BC))D .
Esercizio 1.3. Calcolare il determinante (sia usando l’E.G. che lo sviluppo di Laplace)
delle seguenti matrici      
    2 −3 8 3 0 2 1 7 −4
2 3 4 1  1 5 −2   0 4 −6  9 0 0 
−1 7 7 0
4 6 0 −5 8 3 2 −6 5
       
1 2 3 4 1 1 1 1
−1 1 1 0 2 7
 2 2 1 0 5  2 2 2 3
1 −1  0 0 π    
3 0 1 −1 3 3 4 4
1 −1 1 3 0 0
2 1 0 2 5 6 7 8
       
7 19 342 109 329 7 0 0 5 −3 0 0
 0 2 119   214 2 0   0 2 437   943 2 0
0 0 5 5 0 0 7 259 372 234 −698 5
Esercizio 1.4. Calcolare il determinante (in funzione del parametro k) delle matrici che
seguono ed indicare per quali valori di k non sono invertibili.
     
k+2 k−4 k+2 k−4 −k+3 k+2
A = , B = , C =
1 2−3k −3k−16 2−3k k −1+k
   
  k+1 0 −1 −k 2 −1
2−k k+1
D = E =  −1 k 1  F =  −1 2 −1 
k 2+3k
2k−1 1−k 1−2k k k+1 −1
170
   
    2k+3 −k 1−k k+1 71k−328 k−3
2 −k k+1 k−3
, ,  −3 3 1 ,  0 k−1 0 ,
3k −1 5 1+3k
−1 0 2 5 34k−519 1+3k
   2
  
k+5 k+1 −11−k 0 0 16+k 0 3k−4 −11k−81
 0 3k−4 −11k−81 ,  0 3k−4 −11k−81 ,  k+5 k+1 −11−k .
0 0 16+k 2 k+5 k+1 −11−k 0 0 16+k 2
Esercizio 1.5. Sia A ∈ Mn,n e λ ∈ R. Esprimere det(λA) in funzione di det A e di λ.
Esercizio 1.6. Si considerino le matrici che seguono
       
2 0 5 0 3 −1 0 3 1 1 0 0
A =  0 −2 0 , B =  0 1 1 , C = −2 0 0 , D =  3 2 0 ,
1 0 1 5 0 0 0 −8 −4 −1 1 −2
       
0 −3 1 1 0 1 1 1 2 1 2 3
E =  1 0 2 , F =  1 −1 1 , G =  −1 1 0 , H =  1 1 1 ,
2 5 0 −4 1 −3 2 0 4 3 1 2
       
k 19 −8 k−1 3 1 3 5 k+6 2 3 k+1
J = 1 3 −1, K = 0 k−8 0 , M = −1 −3 1 , N = 2 0 2 .
1 k 1 0 7 1 k+6 2 0 2−k −1 3
a) Verificare l’invertibilità e calcolare l’inversa delle matrici A, B, C, D, E, F, G, H ,
effettuare inoltre la controprova (ricordiamo che due matrici sono l’una l’inversa dell’altra
se e solo se il loro prodotto dà la matrice identica);
  2  
b) calcolare i determinanti: det A·A·A−1 ·A·A , det 2· B −1 , det 6·C −1 ,
    
det 3 (F −1 )2 ·M 2 , det 2H −N , det  3(H −1 )2 N 3 , det 3A
−2 3
B , det G−M  ,
det A·G − A·M , det G2 ·M − G·M 2 , det 2A − A·N ·H −1 , det H −3 −H −4 .
c) determinare i valori del parametro k per i quali le matrici che seguono sono invertibili:
E −1 ·J 2 ·K, 3 G−2 ·M 2 , 2 B ·D−3 ·H ·J 2 ·N ; 19 A·B −5 ·C ·D3 ·E ·F 11 ·G·H 7 .
d) trovare delle matrici Q, R, S, T, U, ∈ M3, 3 (R), X ∈ M3, 4 (R), Y ∈ M4, 3 (R) che
soddisfano le proprietà indicate: det(A − Q) = 1, det (A · R) = 1, rango(B · S) = 2,
rango(C ·T ) = 1, ker(A · U ) = Span{~e1 } . dim ker(A · X) = 2, dimker (Y · A) = 2.
Esercizio 1.7. Determinare il rango (in funzione del parametro k) delle matrici che
seguono:
   
k+4 k−1 0 k+4 2k+3
k−3 0 0 0 0
 1 k−1 2k−2 2k−1 k 
M = 5 11 k−7 7−k 0 ; N =  .
k+3 0 2−2k 5−k k+3
7 4 k −k 2k+8
3 2k−2 2k−2 2k+1 2k+1
Esercizio 1.8. Per ognuna delle matrici che seguono, determinare i valori del parametro
t per i quali è invertibile e, per tali valori, calcolarne l’inversa in funzione di t.
 
    2 t+1 0 0
2 t+1 t t+1  4−t 3 0 0 
A= , B= , C= ,
4−t 3 4−t 3 0 0 t t+1
0 0 4−t 3
   
  t+1 0 t+1 t 1 0
3t 15−6t
D= , E= 0 3−t 0 , F = 1 t 1
−2t 4t−10
2t−4 0 t 0 t 2
       
0 0 1 t 1 t 0 0
G= , H= , J = , L = ,
0 t−7 t2 t3 t3 t2 0 0
171

   
1 4 t−3 −3 1 1 4 t−3 −3 1
 t+2 5 2 2 1   t t t t t 
   
M =  3t−1 5 2 2 t+5  , N =  3t−1 5 2 2 t+5  .
   
0 0 0 0 0 t t t t t
t−13 0 t2 3 1 t−13 0 t 2
3 1
Esercizio 1.9. Trovare quattro matrici A, B, C, D ∈ M2,2 tali che:
a) det (A + B) 6= det A + detB ; b) det(C + D) = det C + detD .
Esercizio 1.10. Trovare due matrici quadrate invertibili la cui somma non è invertibile.
Esercizio 1.11. Si considerino le matrici che seguono (dove a, b, c ∈ R).
       
1 1 1 1 1 1 1 1 1 1 a b
A =  a b c , B =  a b c , C =  2 2 2 , D =  0 1 c .
a2 b 2 c2 a3 b 3 c3 0 0 0 0 0 1
a) Dimostrare che detA = (b − a)(c − a)(c − b) ; b) calcolare detB ; c) calcolare
la potenza n-esima C n della matrice C (cioè il prodotto di C con se stessa n volte) per
ogni n ∈ N; d) calcolare la potenza n-esima Dn per ogni n ∈ N.
 
1 2
Esercizio 1.12. Data A = , trovare tutte le matrici B ∈ M2,2 tali che AB = BA.
2 1
Esercizio 1.13. Trovare tutte le matrici P ∈ M2,2 tali che P 2 = P .
Esercizio 1.14. Trovare tutte le matrici A ∈ M2,2 tali che A2 = 0 (matrice nulla 2 × 2).
∗ Esercizio 1.15. Determinare tutti i valori di k per i quali la matrice
 
k−6 3 −k − 2 3 −k − 2
A =  2k + 1 3 5 3 5 
5k + 9 6 k + 17 6 k + 17
a) ha rango 0; b) ha rango 1; c) ha rango 2; d) ha rango 3.
     
4 0 1 0 x
∗ Esercizio 1.16. Siano A =  0 −1 0  , ~b =  1  , ~x =  y  .
6 0 1 0 z
a) Calcolare l’inversa della matrice A ;
b) Determinare le soluzioni del sistema lineare A−1 · ~x = ~b .
   
3 −1 5 2 0 3
∗ Esercizio 1.17. Siano A =  0 2 2  e B =  k 5 4  due matrici.
0 2 3 0 6 0
a) Calcolare l’inversa della matrice A ;
b) determinare i valori del parametro k per i quali il prodotto A2 · B 3 è invertibile;
c) posto k = 0 , calcolare A2 · B 3 · ~e1 , dove ~e1 è il primo vettore della base canonica di R3 .
   
1 −3 1 2 −5 2
∗ Esercizio 1.18. Siano A =  2 −9 2  , B =  0 4 0 .
2 5 1 −2 0 −1

a) calcolare: l’inversa di A, det (2AB 2 ) , det(2A + B) , det 2(A−1 )2 B 2 ;
b) trovare una matrice C in modo tale che A + C abbia rango 1;
c) trovare una matrice D in modo tale che A · D abbia rango 1.
     
1 −3 1 2 6 2 1
∗ Esercizio 1.19. Siano A =  2 −9 2  , B =  1 9 −1  , ~v =  −2  .
2 5 1 −2 −8 −1 1
2 −1 2 2

a) calcolare: l’inversa di A , det (2AB ) , det (2A + B) , det 2(A ) B , AB(~v ) ;
b) trovare una matrice D in modo tale che il nucleo del prodotto A · D sia uguale allo
spazio Span{~v } .
172
 
1 1 −2
∗ Esercizio 1.20. Sia A =  1 0 −1  . Calcolare:
0 1 0

a) A ; b) i determinanti det An e det n·A) (al variare di n ∈ N).
−2

   
3 −1 0 2 1 −3
∗ Esercizio 1.21. Sia A =  −1 2 0  una matrice, sia B =  −1 3 2 
2 −1 −3 0 k−1 1
una matrice che dipende da un parametro k , sia {~e1 , ~e2 , ~e3 } la base canonica di R3 .
a) Calcolare l’inversa della matrice A ; b) posto k = 0 , calcolare B · A3 · ~e3 ;
c) determinare i valori del parametro k per i quali il prodotto A3 · B 2 è invertibile;
d) posto k = 0 , determinare una soluzione ~x dell’equazione A·~x = B ·~e3 .
   
2 0 −1 t−1 8 0
∗ Esercizio 1.22. Si considerino le matrici A =  0 1 −1  e Bt =  1 −2 0 .
1 0 1 −1 0 2
a) Verificare che A è invertibile
 e determinare i valori di t per i quali Bt è invertibile;
b) calcolare det 4 · A−3 · B 2 e det (A + B) ; c) calcolare C = A−1 ·(A + A·B)
(suggerimento: usate la proprietà distributiva, evitate calcoli inutili!)
∗ Esercizio 1.23. a) Determinare tutte le matrici invertibili A ∈ Mn, n (R) (con n arbi-
trario) soddisfacenti la condizione A3 = A2 ; b) (facoltativo) siano A, B ∈ Mn, n (R)
due matrici e sia a = det A , b = det B , c = det (A + B) . Calcolare il determinante
della matrice λ A2 BA + A2 B 2 (suggerimento: usate la proprietà distributiva).
   
3 1 2 k −1 −2
∗ Esercizio 1.24. Si considerino le matrici A =  1 0 1  , Bk =  4 1 −1  .
2 −5 1 −1 −5 2
a) determinare l’inversa della matrice A ;
b) calcolare i determinanti det (A−1 ·Bκ ·A2 ), det (2Bκ ), det(A+Bκ ) in funzione di k ;
c) (facoltativo)
 Dimostrare le uguaglianze che seguono (dove
 I denota la matrice
 identica):
rango Bk · A2 = rango Bk , rango A−1 · Bk · A2 + A = rango Bk + I .
∗ Esercizio 1.25. Siano A , B ∈ Mn, n , C ∈ Mn, k tre matrici dipendenti da un
parametro t . Supponiamo che det A = t2 − 1 , det B = t + 1 , det (A − B) = t2 + 3 ,
rangoC = 2 .
a) Studiare l’invertibilità delle matrice B · A3 · B 2 al variare di t ;
b) calcolare il rango della matrice A · C − B · C (giustificare la risposta).
Rispondere ad almeno una delle seguenti domande (l’altra verrà considerata facoltativa):

c) per i valoridi t per i quali B è invertibile, calcolare det A4 · B −2 − A3 · B −1 ;
1 2 1
d) sia D =  0 0 3  , trovare due matrici E , F ∈ M3, 3 (R) , entrambe di rango 2,
0 0 1
tali che risulti rango (D · E) = 1 , rango (D · F ) = 2 .
173

§2. Sistemi Lineari.

Esercizio 2.1. Risolvere i sistemi lineari che seguono utilizzando:


i) il metodo di Gauss; ii) il calcolo dell’inversa della matrice incompleta;
iii) il teorema di Cramer (spiegando cos’è che ne garantisce l’applicabilità).
 
  x + 7y + 3z = 2  x + 2y + 3z = −1
4x − 3y = −1
, −x + 2z = −1 , y + 2z = −2 .
5x − 2y = 11  
3x + y + z =1 2x + 3y + 4z = 0
 
 4x − 3y − z = 1  3x + 5y + 3z = −1
9x − 7y + 2z = 2 ; 6x + 9y + 5z = −2
 
−17x + 13y + 2z = 3 3x + 4y + 3z = 1
(...metodi differenti devono dare lo stesso risultato!).
Esercizio 2.2. Risolvere, utilizzando l’E.G., i sistemi lineari (nelle incognite indicate)
 
 x + 3y − z + 2w = 5
 x + y − z + 2w = 3 
3x + y − 5z + w = 0
x − y − z − w = −2

x + 2y − 2z + 3w = 4  2x − 4z − 5w = −7

x + 7y − 2z + 8w = 14
 
 x3 − x4 − x5 − 2x6 − x7 = 0  x2 − x3 + x4 + x5 − x6 + x7 = 3
−x1 + x2 + 2x5 + x6 + x7 = 2 x1 − x2 + x5 + x6 + x7 = 1
 
x1 + 3x4 − x5 + 2x6 + 2x7 = 1 x1 + x2 + 2x3 + x4 + 2x5 + x6 + x7 = 5
 
 x3 − x4 + x5 + x6 − x7 = 3
 −x3 + x5 − 3x6 − x7 = 0 
x1 − x2 + 3x5 + 4x6 + x7 = 4
x1 + 2x2 + x5 + x6 − x7 = 2
 
 x1 + 3x2 + 2x5 + x6 + x7 = 1
x1 + 3x4 − x5 − 5x6 + 3x7 = 1
x1 + 4x2 + 7x3 + x4 + 2x5 − x6 − x7 = 2
e, per ognuno di essi, indicare esplicitamente i parametri liberi delle soluzioni trovate.
Esercizio 2.3. Stabilire per quali k ∈ R i seguenti sistemi lineari hanno soluzione unica,
infinite soluzioni o sono incompatibili:
  
 2x + ky = 2  3x + 2y + kz = 11  y+z =k
kx + 2y = k , 2x − 6y − 3z = 0 , 2x + 3y + 7z =5
  
ky + kz = k kx + 4y + 2x = 7 x − 3y − z = −2
Esercizio 2.4. Si considerino i sistemi lineari che seguono. Studiarne la compatibilità e
indicarne la dimensione dello spazio delle soluzioni in funzione del parametro k.
  x        
1 4 −3 2 2 2k−8 2k−5 3k−4 x 4
 y 
S1 :  2 8 t−2 4 ·  =  t ; S2 :  0 k+2 2k+8 · y  = k+4;
z
3 4 −2 6 1 0 0 3k−9 z 0
w
  x     
 x   
1 2 −t 2 3 1 4 −3 2 2
y
  y
 
S3 :  1 t+3 1 2 ·  = t+4; S4 :  1 t+6 t−1 3 ·  =  5 ;
z z
1 2 −t t+2 4 2 t+10 t−4 t+4 t+6
w w
    x   
  x   1 3 1 2 1
k 0 −3   3 y
S5 : · y = ; S6 :  −1 −1−k −1 −2 ·  =  −1 ;
−1 0 k+2 1 z
z 2 6 7+k 9+k 6
w
  x        
1 −1 4 −4 1 2 3 1 x 1
 y 
S7 :  2 1−k 8 −8 ·  =  2 ; S8 :  1 k−6 1 · y  =  1 .
z
1 −1 9+k 1+k 5 k k+1 k−1 z 6
w
174

Esercizio 2.5. Abbiamo visto che possiamo risolvere un sistema lineare nel modo seguente:
1) scriviamo la matrice completa associata A; e
e
2) riduciamo A ad una matrice a scala tramite l’eliminazione di Gauss (le operazioni
consentite sono: cambiare l’ordine delle righe, moltiplicare una riga per una costante non
nulla, sommare ad una riga una combinazione lineare delle altre);
3) scriviamo il sistema associato alla matrice ottenuta (che è un sistema a scala, equivalente
a quello di partenza) e lo risolviamo per sostituzione (partendo dall’ultima equazione).
Sarebbe corretto, quando riduciamo A e ad una matrice a scala,
a) cambiare l’ordine delle colonne? Perché?
b) effettuare due passaggi contemporaneamente (ad esempio: sommare ad una riga una
combinazione lineare delle altre e, allo stesso tempo, sommare ad un’altra riga una combi-
nazione lineare delle altre)?
Esempio. Nel passaggio da A a B che segue sommiamo alla prima riga la combinazione
lineare di coefficienti 2 e 1 di seconda e terza riga e sommiamo alla terza riga la prima riga:
   
1 4 7 −3 1 2 2 2 20 16 4 13 7 14
A =  2 5 2 2 5 2 5 B = 2 5 2 2 5 2 5 .
−3 6 5 3 2 1 2 −2 10 12 0 3 3 4
E’ vero che i sistemi lineari associati alle matrici A e B sono equivalenti? Perché?
c) dividere una riga per due? Perché?
d) eliminare una riga costituita da tutti zeri? Perché?
e) eliminare una colonna costituita da tutti zeri? Perché?
f ) sommare ad una colonna una combinazione lineare delle altre? Perché?
g) moltiplicare una colonna per una costante non nulla? Perché?
Esercizio 2.6. Siano SA , SB , SC , SD , SE , SF , SG , SH , SL , SM , SN i sistemi lineari
aventi come matrici complete associate rispettivamente
   
1 4 7 −3 1 2 2 1 4 7 −3 1 2 2
A = 0 0 0 2 5 2 5 , B = 0 0 0 2 5 2 5 ,
0 0 0 0 0 0 2 0 0 0 0 0 −1 2
 
    1 4 7 −3 1
1 4 7 −3 1 1 4 0 7 −3 1
0 5 2 2 1
0 5 2 2 1 0 5 0 2 2 1  
C=  , D =  , E =  0 5 2 2 1 ,
0 0 5 3 1 0 0 0 5 3 1  
0 0 5 3 1
0 0 0 3 1 0 0 0 0 3 1
0 0 0 3 1
   
1 4 0 7 −3 0 1
1 4 7 −3 1 2 2
0 5 0 2 2 0 1
F =  0 0 0 4 10 4 10 , G =  ,
0 0 0 5 3 0 1
0 0 0 0 0 −1 2
0 0 0 0 3 0 1
   
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
H = , L = ( 0 0 0 ), M = ( 0 0 ), N =  .
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
a) Indicare quali sistemi lineari sono compatibili, hanno un’unica soluzione, hanno infinite
soluzioni (per essi, dire quanti sono i parametri liberi);
b) dire se ci sono sistemi lineari equivalenti tra loro ed indicare quali.
Esercizio 2.7. Discutere, al variare del parametro k , la compatibilità dei sistemi lineari
A · ~x = ~b nei seguenti casi:    
    1 k 1
k+1 k+2 −1+k
a) A = , ~b = ; b) A =  k 4  , ~b =  k ;
−2k−3 4k−6 3−k
    1 4−k 3−k
k+1 5 −1    
  ~   k 2k 1 ~ k
c) A = −2k+2 k , b= 1 ; d) A = , b= .
−2k −4k k−3 −2
4 10+k −1
175

∗ Esercizio 2.8. Trovare i valori di k per i quali il sistema lineare nelle incognite x ed y ,

(6k − 4) x + (5k − 2) y = −8
(7k − 7) x + (6k − 5) y = −7
a) è incompatibile; b) ammette una unica soluzione; c) ammette infinite soluzioni.
     
k+3 0 2−k 2k−8 x1
∗ Esercizio 2.9. Siano A =  0 k+6 k+3 , ~b =  3 , ~x =  x2  .
0 0 k−2 8 x3
Determinare i valori di k per i quali il sistema lineare A~x = ~b (nelle incognite x1 , x2 , x3 )
a) è incompatibile; b) ammette un’unica soluzione; c) ammette infinite soluzioni.
  x   
4 3 4 2 5
  y
∗ Esercizio 2.10. Si consideri il sistema lineare  8 2t 5+t 4 ·  =  11+t .
z
4 9−2t 7−t 5+t 10+t
w
Determinare i valori di t per i quali il sistema
a) è incompatibile; b) ammette infinite soluzioni, dipendenti da un solo parametro
libero; c) ammette infinite soluzioni, dipendenti da 2 parametri liberi.
∗ Esercizio 2.11. Si consideri il sistema lineare omogeneo
     
t + 30 t + 45 15 t + 10 5 x1 0
 t−5 .
2t − 10 t−5 0 0  ·  ..  =  0  .
−2 − t −5 − t −3 −3 4−t x5 0
a) Determinare, al variare del parametro t , la dimensione dello spazio Wt delle soluzioni
del sistema dato; b) scegliere (a proprio piacere) un valore t̃ del parametro e, per tale
valore, trovare una base di Wt̃ .
 
t + 12 t −2 t + 9 5
∗ Esercizio 2.12. Data la matrice A =  t + 1 2t + 2 t + 1 0 0  , sia Wt
10 − t t −2 8 4−t
lo spazio delle soluzioni del sistema lineare omogeneo A · ~x = ~0 .
a) Determinare, al variare del parametro t , la dimensione di Wt ;
b) per i valori del parametro t per i quali Wt ha dimensione 3, trovare una base di Wt .
     
t 0 t+3 1
x
6 t + 2 1    1
∗ Esercizio 2.13. Si consideri il sistema lineare  · y =  .
1 0 t+2 0
z
2 0 1 1
Determinare i valori del parametro t per i quali il sistema
a) è incompatibile; b) ammette un’unica soluzione; c) ammette infinite soluzioni.
∗ Esercizio 2.14. Determinare i valori della costante k per i quali il sistema lineare, nelle
incognite x, y, z , 
 3x − 2y + z = 1
3x + (k − 3)y + 7z = 4

−9x + (k + 5)y + (k + 6)z = 2
a) ammette una unica soluzione; b) ammette infinite soluzioni; c) è incompatibile.
    
t+3 0 2 −1 2t − 1 x1 1
.
∗ Esercizio 2.15. Dato il sistema lineare 2t+9 0 t+9 −2 t−11 · ..  =  1  .
t+1 0 2 −3 2t−7 x5 1
Determinare i valori del parametro t per i quali il sistema
a) è incompatibile; b) ammette un’unica soluzione; c) ammette infinite soluzioni e,
per ciascuno di tali valori di t, indicare da quanti parametri liberi dipendono le soluzioni.
176
     
1 −1 1 x 1
∗ Esercizio 2.16. Si consideri il sistema lineare  λ 1 −1  ·  y  =  0  , nelle
1 −1 λ z λ
incognite x, y, z . Determinare i valori del parametro λ per i quali il sistema è compatibile
e per tali valori scrivere esplicitamente le soluzioni del sistema, indicando chiaramente gli
eventuali parametri liberi dai quali dipendono le soluzioni.
   
k−1 1   2k − 7
x
∗ Esercizio 2.17. Si consideri il sistema lineare  −1 k − 3 · =  k + 1  nelle
y
1 1 2k − 7
incognite x, y . Determinare i valori della costante k per i quali il sistema è incompatibile,
ammette una unica soluzione, ammette infinite soluzioni. Scrivere (per i valori di k per i
quali il sistema è compatibile) le soluzioni del sistema al variare di k .

(7−2k) x + (4−k) y = 1
∗ Esercizio 2.18. Si consideri il sistema lineare nelle
3 k x + (k+2) y = 2
incognite x, y , dipendente del parametro k .
Studiarne la compatibilità al variare di k nonché determinarne esplicitamente le soluzioni
per k = 0 e per gli eventuali valori di k per i quali ammette infinite soluzioni.
∗ Esercizio 2.19. Si consideri lo spazio R3 (con coordinate x, y, z) e l’insieme St delle
soluzioni del sistema lineare  
  x  
t+3 0 5 8+t
·y =
3 0 t+1 t+4
z
nelle incognite x, y, z, dipendente dal parametro t.
a) Per i valori della costante t per i quali il sistema è compatibile, si indichi, in funzione
di t , il numero dei parametri liberi dai quali dipende St ; b) Per il valore t = 0 ,
determinare esplicitamente le soluzioni del sistema lineare dato; c) Indicare per quali
valori di t l’insieme St è un sottospazio vettoriale di R3 ;
d) (facoltativo) sia r la retta passante per i punti P di coordinate 1, −2, 1, Q di
coordinate 1, 0, 1 . Determinare, in funzione del parametro t , quali relazioni tra quelle che
seguono sono vere: St ⊆ r , r ⊆ St , r = St , r 6= St . (Spiegare le risposte date).
∗ Esercizio
 2.20.
 Si considerino
  il 
sistema lineare  
t 3 2 x 4 t+3
 2 t − 1 2  ·  y  =  t + 1  nelle incognite x, y, z, ed il vettore ~c =  2  .
1 1 1 z 5+t 0
a) Studiarne la compatibilità e determinare il numero dei parametri liberi dai quali dipende
l’insieme delle eventuali soluzioni, in funzione del parametro t ;
b) determinare i valori del parametro t per i quali ~c è una soluzione del sistema dato;
c) (facoltativo) dimostrare che se ~c e d~ sono due soluzioni di un sistema lineare, allora
anche λ~c + (1 − λ) d~ ne è una soluzione per ogni λ ∈ R .
 
3 4 9
∗ Esercizio 2.21. Si consideri la matrice At =  0 t + 1 5  .
0 4 7
a) Stabilire i valori di t per i quali At è invertibile;
b) per i valori di t per i quali At è invertibile calcolare il determinante della matrice 5·(At )−2 ;
c) posto t = 2 calcolare l’inversa di At nonché determinare le soluzioni del sistema lineare
−1
A2 · ~x = ~e3 (essendo ~e3 il terzo vettore della base canonica di R3 ).
177

§3. Spazi Vettoriali.


3
Esercizio 3.1. Siconsiderino
  di R : 
i vettori   
1 1 1 5
~v1 =  1  , ~v2 =  1  , ~v3 =  −1  , ~ =  −4 .
w
−1 1 1 3
a) Verificare che {~v1 , ~v2 , ~v3 } è un insieme indipendente; b) dedurre che {~v1 , ~v2 , ~v3 } è
una base di R3 ; c) determinare le coordinate del vettore w ~ rispetto alla base {~v1 , ~v2 , ~v3 } .
Esercizio 3.2. Rispondere alle stesse domande dell’esercizio precedente utilizzando i
vettori        
0 3 −1 5
a) ~v1 =  1  , ~v2 =  2  , ~v3 =  3  , ~ = 8;
w
−2 1 1 1
       
2 0 1 7
b) ~v1 =  0  , ~v2 =  1  , ~v3 =  −2  , ~ =  −7  ;
w
−1 2 0 −3
       
2 3 5 −1
c) ~v1 =  −1  , ~v2 =  −2  , ~v3 =  1  , ~ =  −7  .
w
3 5 5 4
Esercizio 3.3. Sia w ~ la c.l. di coefficienti 2 , 3 , 5 dei seguenti vettori di R3 :
     
2 0 −1
~v1 =  0  , ~v2 =  1  , ~v3 =  2  . Sia V = Span{~v1 , ~v2 , ~v3 } .
−1 2 0
a) Calcolare w ~ ; b) verificare che w ~ ∈ V !!! c) dopo aver verificato che {~v1 , ~v2 , ~v3 }
è una base di V , determinare le coordinate di w ~ rispetto a tale base!
Esercizio 3.4. Verificare le seguenti identità:
         
2 −1 1 0 1
a) Span{ 1 ,  1 ,  2 } = Span{ 1 ,  1 } ;
−1 −1 −2 −1 −1
         
 6 6 3  3 3
b) Span  5 ,  3 ,  0  = Span  4 ,  3  .
5 −1 −5 7 4
Esercizio 3.5. Si determini la dimensione dei seguenti sottospazi di R4 :
               
 1 −1 1 −1   2 2 1 1 
−4 4
        −4 4 −3 −4
        4 −4
V = Span  ,  ,  ,   ; W = Span  ,  ,  ,   .
1 1 −1 −1 −4 1 −7 1
−2 2 2 −2 5 1 2 2
Esercizio 3.6. Determinare delle equazioni parametriche dei seguenti sottospazi di R4
(con coordinate x1 , x2 , x3 , x4 ): 
  x1 − x4 = 0
x1 + x4 = 0
U = ; V = x1 + x3 = 0 ;
x1 + x3 + 3x4 = 0 
x3 − x4 = 0

7x1 + 2x2 + 2x3 = 0 
W = ; H = x1 + x3 = 0.
2x1 − 5x2 − 3x3 = 0
Esercizio 3.7. Determinare delle equazioni cartesiane dei seguenti sottospazi di R3 :
         
 2 4   −1   −2 −3 
A = Span  1 ,  2  ; B = Span  8  ; C = Span  3 ,  1  .
     
1 1 1 −5 −1
178

Esercizio 3.8. Determinare delle equazioni cartesiane dei seguenti sottospazi di R4 :


         
 4 8   1 3 −1 
   
2 4  2   4   4 
A = Span   ,   ; B = Span  ,  ,   .
 1
 1   
 3 11 5 

1 1 −3 −7 −3
Esercizio 3.9. Siano U = Span {~u1 , ~u2 } , W = Span {w ~ 1, w ~ 3 } ⊆ R4 . Determi-
~ 2, w
nate una base dello spazio somma U + W ed una base dell’intersezione U ∩ W quando
         
1 2 4 3 1
2 2 6 4  7 
a) ~u1 =   , ~u2 =   , w
~1 =   , w ~2 =   , w ~3 =  ;
1 1 3 2 −3
1 1 3 2 1
         
4 −7 5 4 13
 2   2  2  −2   −2 
b) ~u1 =   , ~u2 =  , w~1 =   , w ~2 =  , w ~3 =  ;
5 1 1 1 3
−1 1 3 −4 −5
Verificate che le dimensioni degli spazi trovati soddisfano la formula di Grassmann.
Esercizio 3.10. Nei casi indicati sotto, determinare equazioni cartesiane per lo spazio
W , trovare i valori del parametro t per i quali il vettore ~vt appartiene a W e, per tali
valori di t, scrivere le coordinate di ~vt rispetto ad una base di W (indicare la base scelta).
       
 1 3 4  7
 0  3 3 t + 4
a) W = Span  ,  ,   , ~vt =  ;
−1 1 0 1
0 1 1 t
       
 1 −1 0  t−3
 0   1   1  7 − t
a) W = Span  ,  ,   , ~vt =  .
−1 1 0 −3
0 0 −1 −3
Esercizio 3.11. Nei casi che seguono, determinare basi e dimensioni di U , W , U ∩ W ,
U + W in funzione del parametro t, determinare gli eventuali valori di t per i quali accade
qualcosa di geometricamente significativo (uno dei due spazi è contenuto nell’altro, lo spazio
somma è uguale allo spazio ambiente eccetera), completare una base dell’intersezione ad
una base di U , completare una base di W ad una base di U + W nonché ad una base
dello spazio ambiente. Nei casi a), d), f ), g), l) scrivere equazioni cartesiane per lo
spazio U .        
 3 5  3 −5
a) U = Span  −3 ,  3  , W = Span  5 ,  4  ⊆ R3 ;
3 4 2 −4
         
 1 1 −3   2 1 
 3   1   −3  7 9
b) U = Span  ,  ,   , W = Span  ,   ⊆ R4 ;
−1 −1 3 1 3
2 2 −6 4 2
         
 1 3 −2   4 −8
0 t − 9  0  0  0 
c) U = Span  ,  ,   , W = Span  ,   ⊆ R4 ;
1 3 t−5 4 −2−2t
2 6 t−7 8 −10−2t
         
 2 1 3   3 5 
 −1   0   −1  2  0 
d) U = Span  ,  ,   , W = Span  ,   ⊆ R4 ;
3 −1 2 3 11
1 0 1 2 4
   
   2 k − 2 
1 4 0 −9  −1   1 
e) U = ker , W = Span  ,   ⊆ R4 ;
−1 0 5 4 2 2
2 4
179

       
1 0 1 −1
  0   1   1   −1 
f) U = Span  ,   , Wk = Span  ,   ⊆ R4 ;
1 0 2 5−k
0 1 k−3 3−k
   
 1 −1 0  (
 0   −2   1  x1 + x2 = 0
g) U = Span  ,  ,   , W : ⊆ R4 ;
1 1 −1 x1 −x3 −x4 = 0
−1 1 0
   
(  1−t 2 
3y + w = 0  
 1   −1 
h) U : , Wt := Span  ,
   ⊆ R4 ;
x+z = 0 
 0 0 

1 t−4
   
  3 3
3 2 −3 5  1   5 
i) U = ker , W = Span { ,  } ⊆ R4 ;
0 7 0 7 5 4
−1 −5
         
 0

0 1 
 

0 0 

1 0 0  k   1 
l) U = Span  ,  ,   , Wk = Span  ,   ⊆ R4 ;
 0
 1 0    k+4
 −1 

1 0 0 6−k k−2
         
 1 3 1   4 2 
   
0  8   4   8   1+t 
m) U = Span  ,  ,   , W = Span  ,   ⊆ R4 .
 3
 −7 −5    2+2t
 7−t  
2 14 6 16 5+t
Esercizio 3.12. Siano U e W due sottospazi di R37 . Determinate le possibili dimensioni
della loro intersezione sapendo che dim U = 19 , dim W = 21 .
Suggerimento: usare la formula di Grassmann e la stima 21 ≤ dim (U + W ) ≤ 37 .
Esercizio 3.13. Siano U e W due sottospazi di R49 . Supponiamo che dim(U ∩W ) = 3
e che dimU = 30 . Provare che 3 ≤ dimW ≤ 22 .
Esercizio 3.14. Siano U e W due sottospazi di R50 . Supponiamo che U sia definito
da 8 equazioni cartesiane e che dim W = 36 . Provare le seguenti disuguaglianze:
28 ≤ dim (U ∩ W ) ≤ 36 ; 42 ≤ dim (U + W ) ≤ 50 .
Suggerimento: innanzi tutto stimate la dimensione di U .

Esercizio 3.15. Sia B = ~v1 , ~v2 , ~v3 , ~v4 un insieme di vettori in R4 . Provare che le
tre affermazioni che seguono sono equivalenti:
i) B è una base di R4 ; ii) B è una base di Span B ; iii) SpanB = R4 .
Esercizio 3.16. Si consideri lo spazio R4 ed i suoi sottospazi U = Span{~u1 , ~u2 } e
       
3 7 3 11
4 0 5  0 
W = Span{w ~ 2 } , essendo ~u1 =  , ~u2 =  , w
~ 1, w ~ 1 =  , w ~2 =   .
−5 −1 −7 −4
0 0 0 0
a) scrivere equazioni parametriche e cartesiane per gli spazi U e W ;
b) determinare una base dell’intersezione U ∩ W e una base dello spazio somma U + W ;
c) trovare delle equazioni cartesiane per U ∩ W e U + W ;
d) trovare un vettore ~v tale che ~v ∈ U , ~v 6∈ W ;
e) verificare che Span{~v , w ~ 2} = U + W ;
~ 1, w
f ) trovare un vettore ~z che non appartiene allo spazio somma U + W ;
g) verificare che l’insieme di vettori B = {~z, ~v , w
~ 1, w~ 2 } è una base di R4 ;
h) dimostrare che per ogni scelta di ~v e ~z che soddisfano le condizioni ~v ′ ∈ U , ~v ′ 6∈ W ,
′ ′

~z′ 6∈ U+W (come ai punti “d” e “f”), l’insieme {~z′ , ~v ′ , w ~ 2 } costituisce una base di R4 .
~ 1, w
180

         
1 0 3 1 1
 1   1   5   2   2 
         
Esercizio 3.17. Siano U = Span  1 ,  1  , W = Span  6 ,  3 ,  3 
         
1 1 5 3 4
1 1 5 2 2
due sottospazi di R5 .
a) Determinare una base degli spazi U, W, U ∩ W, U + W (indicare le dimensioni di tali
spazi e verificare che soddisfano la formula di Grassmann);
b) completare: la base di U ad una base di U + W , la base di U ad una base di R5 ,
la base di U ∩ W ad una base di U + W , la base di W ad una base di U + W ;
c) trovare dei vettori w,~ ~u, ~s, ~r tali che: w ~ ∈ W, w ~ 6∈ U , ~u ∈ U , ~u 6∈ W , ~s ∈ U + W ,
~s 6∈ U ∪ W (unione insiemistica) ~r ∈ U + W , ~r 6∈ U ∪ W , ~r 6∈ Span {~s};
d) siano ~u1 e ~u2 due vettori indipendenti appartenenti allo spazio U , dimostrare che
l’insieme di vettori ~s, ~r, ~u1 , ~u2 costituisce una base dello spazio somma U + W ;
e) trovare delle equazioni cartesiane per gli spazi U , W , U ∩ W , U + W .
Esercizio 3.18. Sia W l’insieme dei polinomi p(x) di grado minore o uguale a 4 che
soddisfano la relazione p(1) = 0 .
a) Dimostrare che W è uno spazio vettoriale; b) trovare una base di W ;
c) trovare le coordinate del polinomio q(x) = x − x2 + x3 − x4 rispetto alla base trovata;
d) completare la base di W trovata ad una base dello spazio vettoriale V di tutti i polinomi
di grado minore o uguale a 5.
       
2 −5 −5 2
∗ Esercizio 3.19. Siano U = Span { 5 ,  7 } e W = Span{ −7 ,  5 }
−7 −41 9 −8
due sottospazi di R3 .
a) Trovare un vettore ~v non appartenente né ad U né a W (cioè ~v 6∈ U , ~v 6∈ W );
b) è vero che esiste un vettore ~k ∈ R3 non appartenente allo spazio somma U + W ?
c) Determinare una base dell’intersezione U ∩ W ed una base dello spazio somma U + W .
∗ Esercizio 3.20. Si consideri il seguente sottospazio di R4 :
           
 0 0 1 −2 1  7
 
 0   0   −5   10   −5   −35 
W := Span  ,  ,  ,  ,   . Sia inoltre ~v =  .

 3 1 0 0 1 
 −2
3 1 0 0 1 −2
a) Trovare una base e la dimensione di W ; b) stabilire se ~v ∈ W e, in caso
affermativo, determinare le coordinate di ~v rispetto alla base trovata.
∗ Esercizio 3.21. Si considerino i seguenti sottospazi di R4 :
         
 1 3 3   5 −8 
0 t − 5  0   0   0 
U = Span  ,  ,
   , W = Span    , 
1 3 t−4 5 6 − 2t
2 6 t−1 10 −2 − 2t
a) Determinare i valori del parametro t per i quali si ha l’uguaglianza U = W ;
b) determinare i valori del parametro t per i quali l’intersezione U ∩ W ha dimensione 1
e, per tali valori di t , determinare una base dello spazio somma U + W ;
c) determinare i valori del parametro t per i quali lo spazio somma U + W ha dimensione
2 e, per tali valori di t , determinare una base dello spazio somma U + W ;
d) per il valore t = 0 , trovare, se esiste, un vettore ~v appartenete allo spazio somma
U + W ma non appartenente all’unione insiemistica U ∪ W , cioè ~v ∈ U + W , ~v 6∈ U ∪ W .
181

∗ Esercizio 3.22. Si considerino i vettori


         
2 4 3 1 2
4  3  0 2  −1 
~u1 =   , ~u2 =  , w ~1 =   , w ~2 =   , w
~3 =   ∈ R4 .
5 5 3 3 1
7 k+4 6 4 3
Sia U = Span{~u1 , ~u2 } , W = Span{w ~ 1, w ~ 3} .
~ 2, w
a) determinare i valori del parametro k per i quali l’intersezione U ∩ W ha dimensione 1;
b) per uno dei valori di k trovati al punto a), determinare una base dell’intersezione U ∩W ;
c) per uno dei valori di k trovati al punto a), dire se esiste un vettore ~v ∈ R4 che
non appartiene allo spazio somma U + W e, in caso di risposta affermativa, determinare
esplicitamente un tale vettore.
∗ Esercizio 3.23. Si consideri lo spazio vettoriale R4 con coordinate x, y, z, w .
Sia U il sottospazio spazio delle soluzioni del sistema lineare
     
(  0 0 −2 
x−y−z = 0  
4 8  7 
, sia inoltre W := Span  ,  ,   .
x − 2y + z + w = 0  1
 2 1  
1 2 3
a) Trovare una base e la dimensione degli spazi U e W ; b) determinare una base dello
spazio somma U + W ; c) determinare una base dell’intersezione U ∩ W .
         
3  1 t 2 1 
 1   1   t+2   5   8 
∗ Esercizio 3.24. Sia ~v =  , Wt = Span  ,  ,  ,   .
−5 −2 −2t −4 1
−10 −1 −t+4 4 t+11

a) Trovare un valore t per il quale ~v ∈ Wt ; ′ b) trovare una base B di Wt′ ;
c) determinare le coordinate di ~v rispetto a B .
         
 0 0 1   0 1 
 0   0  t+11 0 4
∗ Esercizio 3.25. Sia Ut = Span  ,  ,   , W = Span  ,   .
1 1 0 0 0
t−2 2 0 1 1
a) Calcolare i valori del parametro t per i quali l’intersezione Ut ∩ W ha dimensione 0,
ovvero 1, ovvero 2; b) scegliere un valore τ per il quale Uτ ∩ W ha dimensione 1 e
scrivere esplicitamente una base di Uτ ∩ W ;
c) completare la base di Uτ ∩ W trovata al punto b) a una base di Uτ .
∗ Esercizio 3.26. Siano U il sottospazio di R4 di equazione cartesiana x+y −2z +w = 0 ,
    
 1 t 
 
 t   −2 
Wt = Span w ~1 =  , w
~
 2  =  .

 0 1  
−4 1
a) determinare una base dello spazio U ; b) determinare i valori del parametro t per
i quali si ha l’inclusione Wt ⊆ U ; c) scegliere un valore τ in modo tale che risulti
dim U ∩ Wτ = 1 e scrivere un vettore che genera U ∩ Wτ ;
d) completare la base di U ∩ Wτ trovata al punto c) a una base di U .

7x + y − 2z + w = 0
∗ Esercizio 3.27. Sia U il sottospazio di R4 di equazioni e sia
x−y−z+w = 0
~ t il vettore di coordinate 1, t, 0, −4 .
w
a) determinare una base dello spazio U ; b) determinare un valore τ per il quale
risulti w~τ ∈ U ; c) trovare una base di U contenente il vettore w
~τ .
∗ Esercizio 3.28. Si considerino i sottospazi U e W di R4 , il vettore ~vt ∈ R4 (dipendente
dal parametro t) definiti come segue:
182
     
 1 5    2
 
 −1   5  1 −6 1 −2  t 
U = Span  ,   , W = ker , ~vt =  .

 2 −2 
 −3 3 −3 1 −2
9 −9 −3t
a) determinare una base BU ∩W dell’intersezione U ∩ W ;
b) determinare i valori del parametro t per i quali ~vt appartiene allo spazio W nonché i
valori per i quali ~vt appartiene all’intersezione U ∩ W ;
c) completare la base di U ∩ W trovata al punto a) a una base di U + W .
∗ Esercizio 3.29. Si consideri lo spazio R4 con coordinate x, y, z, w . Siano W lo spazio
   
(  2 2−λ 
x−y+z = 0 λ+1  2 
delle soluzioni del sistema lineare , Vλ = Span  ,   .
2x + y − 2w = 0 0 3
λ λ−3
Determinare, al variare di λ ∈ R , la dimensione di Vλ . Determinare equazioni parame-
triche per lo spazio somma Vλ + W . Dedurre, utilizzando la formula di Grassmann, per
quali valori del parametro λ si ha Vλ ∩ W = {~0} .
∗ Esercizio 3.30. Si considerino i seguenti sottospazi di R4 :   
   t −1 
3 1 −1 0 1  −1 
U = ker , Wt = Span w ~ 1 =  , w ~2 =   .
−3 0 1 1 0 3
0 0
a) Determinare una base dello spazio U ; b) determinare i valori del parametro t per i
quali lo spazio somma Wt + U ha dimensione 3; c) scegliere un valore t′ in modo tale
che risulti dim U ∩ Wt′ = 1 e scrivere una base di U ∩ Wt′ ; d) completare la base
di U ∩ Wt′ trovata al punto c) a una base di U .
      
 1 3  1 1 1
∗ Esercizio 3.31. Siano U = Span  3 ,  1  , Wk = Span k+2, 2k+5,  k+2  .
2 −6 −1 2 2k−5
a) Determinare la dimensione dell’intersezione U ∩ Wk in funzione del parametro k ;
b) scegliere un valore di k per il quale l’intersezione U ∩ Wk ha dimensione 1 e, per tale
valore, scrivere una base di tale intersezione.
     
 5 1  k+4
∗ Esercizio 3.32. Sia U = Span ~u1 :=  −1  , ~u2 :=  1  e sia ~vk =  −3  .
1 1 k−4
a) Determinare equazioni cartesiane per lo spazio U ; b) trovare il valore k0 del parametro

k per il quale ~vk0 ∈ U ; c) scrivere le coordinate di ~vk0 rispetto alla base ~u1 , ~u2 .
   
2 3
 −1   0 
∗ Esercizio 3.33. Si consideri lo spazio R4 . Sia U = Span{ ,  } e sia
1 1
 −1 −2
Wk = ker 1 2 k 3 (il nucleo dell’applicazione lineare L : R4 −→ R associata alla
matrice indicata, dipendente dal parametro k).
a) Determinare una base di Wk=0 e una base dell’intersezione U ∩Wk=0 (si sceglie k = 0);
b) determinare la dimensione dell’intersezione U ∩ Wk in funzione del parametro k .
∗ Esercizio 3.34. Consideriamo R4 con coordinate x, y, z, w . Siano
       
1 0 k 0  1 0 1 
 0   0   0
Wk = ker  0 0 0 1 , U = Span  ,  ,   .
1 0 1
1 0 k 1
0 1 2
a) Determinare equazioni cartesiane per lo spazio U ;
b) determinare la dimensione dell’intersezione U ∩ Wk al variare del parametro k ;
c) determinare una base dell’intersezione U ∩ W0 (poniamo k = 0).
183

∗ Esercizio 3.35. Sia V uno spazio vettoriale e B = {~v1 , ~v2 , ~v3 , ~v4 , ~v5 } una sua base.
Siano inoltre w~ 1 = 3~v1 − 2~v2 , w
~ 2 = ~v1 + ~v2 , W = Span{w ~ 2} .
~ 1, w
a) Provare la seguente affermazione: {w ~ 2 } è una base di W ;
~ 1, w
b) determinare se ~v1 ∈ W e, in caso di risposta affermativa, determinare le sue coordinate
rispetto alla base {w ~ 2 } di W .
~ 1, w
∗ Esercizio 3.36. Stabilire, nei casi indicati sotto, per quali valori della costante c il
sottoinsieme W di V è un sottospazio vettoriale di V .

a) V = R≤3 [x] (spazio dei polinomi di grado minore o uguale a 3), W = p(x) p(0) = c ;
 
3
 c
b) V = R , W = soluzioni del sistema lineare A · ~x = , dove A ∈ M2, 3 (R);
1
∗ Esercizio 3.37. Stabilire, nei casi indicati sotto, per quali valori della costante c il
sottoinsieme W di V è un sottospazio vettoriale di V .

a) V = R≤3 [x] (spazio dei polinomi di grado minore o uguale a 3), W = p(x) p(c) = 0 ;
 
3
 0
b) V = R , W = soluzioni del sistema lineare A · ~x = , dove A ∈ M2, 3 (R).
c
∗ Esercizio 3.38. Sia V uno spazio vettoriale e B1 = {~v1 , ~v2 , ~v3 , ~v4 } una sua base. Si
consideri inoltre il sottospazio W = Span{w ~ 2 } , dove w
~ 1, w ~ 1 = −2~v1 + 3~v2 e w ~2 =
−2~v1 + 5~v3 .
a) Dimostrare che i vettori w ~ 2 sono indipendenti e completare l’insieme {w
~ 1, w ~ 2}
~ 1, w
ad una base B2 di V ; b) determinare le coordinate del vettore 2~v1 − 5~v3 + ~v4 ∈ V
rispetto alla base B2 di V trovata al punto a).
∗ Esercizio 3.39. Sia V uno spazio vettoriale reale e B = {~v1 , ~v2 , ~v3 , ~v4 , ~v5 } una sua
base. Siano inoltre w ~ 1 = 3~v1 − 2~v2 , w
~ 2 = ~v1 + ~v2 , W = Span{w ~ 2} .
~ 1, w
a) Provare la seguente affermazione: {w ~ 2 } è una base di W ;
~ 1, w
b) determinare se ~v1 ∈ W e, in caso di risposta affermativa, determinare le sue coordinate
rispetto alla base {w ~ 2 } di W .
~ 1, w
∗ Esercizio 3.40. Sia V lo spazio vettoriale dei polinomi p(x) di grado minore o uguale a
3. Denotiamo con p′ (x) la derivata del polinomio
 p(x) . Si consideri l’applicazione lineare
L : V −→ R3 definita come segue: L p(x) = “vettore di coordinate p(0), p(1), p′ (0)”.
a) Trovare una base di V e determinare la sua dimensione;
b) trovare la matrice rappresentativa di L rispetto alla base di V trovata nel punto a) ed
alla base canonica di R3 ;
c) determinare la dimensione ed una base del nucleo kerL .
∗ Esercizio 3.41. Sia V lo spazio vettoriale dei polinomi p(x) di grado minore o uguale
a 2. Siano inoltre U il sottospazio di V dei polinomi soddisfacenti p(−1) = 0 e W il
sottospazio di V dei polinomi soddisfacenti p(3) = 0 .
a) Trovare una base e la dimensione degli spazi U e W ; b) determinare una base dello
spazio somma U + W ; c) determinare una base dell’intersezione U ∩ W ; d) stabilire se
U + W è somma diretta di U e W (=stabilire se gli spazi U e W sono indipendenti).
 
1 0
∗ Esercizio 3.42. Sia V lo spazio vettoriale delle matrici 2 × 2 , sia B = . Si
0 2
consideri la funzione F : V −→ V definita ponendo F (A) = B · A − A · B (essendo “·”
il prodotto righe per colonne di matrici).
a) Dimostrare che F è lineare; b) scrivere una base BV dello spazio vettoriale V ;
c) scrivere la matrice rappresentativa M della trasformazione lineare F , rispetto alla base
BV scelta precedentemente; d) determinare una base del nucleo di F .
184

∗ Esercizio 3.43.  2 × 2. Sia W


Sia V = M2, 2 (R) lo spazio vettoriale delle matrici
a b
il sottoinsieme delle matrici simmetriche, sia U l’insieme delle matrici tali che
c d
3a + b = −c .
a) dimostrare che W è un sottospazio di V ; b) trovare basi di U e W ;
c) determinare le dimensioni dello spazio somma U + W e dell’intersezione U ∩ W ;
d) stabilire se il sottoinsieme di V delle matrici A soddisfacenti A2 = 0 è un sottospazio
di V (giustificare la risposta).

§4. Applicazioni Lineari.

Esercizio 4.1. Si considerino le applicazioni lineari associate alle matrici


       
  4 −8
3 2 2 1 1 1 0 4 3
 8 11 3  ,  4 1 −3 4  2 −4 
2  ,  0 0 0 0 , ,   ,
−2 6 −8 3 −6
5 9 1 −2 −4 −1 0 2 3
  1 −2
0 1 2 3 4 5
    0 0 1 2 3 4
0 0 0 0 0 0 0 0  
0 0 0 0 , 0 0 0 0 , 0 0 0 1 2 3
 .
0 0 0 0 1 2
0 0 0 0 0 0 0 1  
0 0 0 0 0 1
0 0 0 0 0 0
Per ognuna di esse,
a) indicare chiaramente dominio e codominio; b) determinarne nucleo e immagine;
c) discutere suriettività e iniettività; d) verificare la formula
(⋆) dim “dominio” = dim “nucleo” + dim “immagine” .

Esercizio 4.2. Spiegare la formula (⋆) dell’esercizio (1) in termini della teoria dei sistemi
lineari: il nucleo kerL è lo spazio delle soluzioni del sistema lineare di n equazioni in m
incognite ..., le dimensioni di dominio e immagine di L sono rispettivamente ... .
Esercizio 4.3. Siano  
    2 1 0  
1 2 3 1 0   2
 1 1 1  −5
A = 0 1 2 , B =  0 2 , C =  , ~v = , w~ =  −1 .
0 0 3 4
0 0 1 0 0 3
1 −2 1
Si calcoli, e si descriva esplicitamente,
a) LA ◦LB , LC ◦LA ◦LB , LA ◦LA ◦LB , LC ◦LA−1 ◦LB , LC ◦LA−1 ◦LA−1 ◦LB ,
b) LC ◦ LA , LC ◦ LA ◦ LA , LA ◦ L(A−1 ) , L(A3 ) , LC ◦ LA−1 ,
dove LA è l’applicazione lineare associata alla matrice A eccetera. Si determini l’immagine
del vettore ~v per ognuna delle applicazioni in (a) e l’immagine del vettore w~ per ognuna
delle applicazioni in (b).
Esercizio 4.4. Sia L : R8 → R14 una applicazione lineare rappresentata da una matrice
A ∈ M14,8 (R) di rango 3. Calcolare dimker L e dim ImL .
Esercizio 4.5. Sia L : R9 → R4 una applicazione
 lineare e sia W ⊆ R9 un sottospazio
di dimensione 7. Provare che dim ker L ∩ W ≥ 3 .
Suggerimento: stimate la dimensione di kerL usando ilfatto che dim ImL ≤ 4 , osservate
che dim (ker L + W ) ≤ 9 , infine stimate dim kerL ∩ W usando la formula di Grassmann.
185

4 3
Esercizio 4.6. Si considerino
 le applicazioni
 lineari L A : R −→ R  , LB : R4 −→ R3
0 1 0 0 0 1 0 2
associate alle matrici A =  0 0 0 0 , B =  3 3 −1 4 .
0 0 −1 0 3 1 −1 0
a) Trovare delle basi, equazioni cartesiane ed equazioni parametriche, di kerLA , kerLB ,
ImLA , Im LB ; b) discutere iniettività e suriettività di LA ed LB .
Esercizio 4.7. Trovare una matrice B ∈ M3,4 (R) in modo tale che l’applicazione lineare
ad essa associata LB : R4 −→ R3 soddisfi le seguenti proprietà:

il primo vettore della base canonica di R4 appartiene al nucleo di LB ,
(⋆)
LB è suriettiva.
a) dimostrare che le condizioni (⋆) determinano univocamente nucleo e immagine di LB ;
b) scrivere (senza fare calcoli!) una base del nucleo ed una base dell’immagine di LB ;
c) trovare matrici Ck ∈ M3,4 (R) tali che il nucleo di LCk : R4 → R3 ha dimensione k
(con k = 1, 2, 3, 4; d) scrivere una base del nucleo ed una base dell’immagine delle LCk .
Esercizio 4.8. Si considerino l’applicazione  lineare LA : R7 −→ R3 rappresentata
  dalla
1 3 7 3 1 0 1 8
matrice A =  3 9 2 2 5 2 1  nonché il vettore w ~ =  7 .
−2 −6 5 1 −4 −2 0 1
a) Determinare una base del nucleo ed una base dell’immagine di LA ;
b) trovare delle equazioni cartesiane per il nucleo e per l’immagine di LA ;
c) trovare, se esiste, un vettore ~v ∈ R7 la cui immagine è il vettore w
~;
d) trovare, se esistono, 5 vettori indipendenti (in R7 ) che hanno come immagine w~;
e) trovare, se esistono, 6 vettori indipendenti (in R7 ) che hanno come immagine w~;
f ) trovare, se esistono, 7 vettori indipendenti (in R7 ) che hanno come immagine w
~.
Esercizio 4.9. Sia A ∈ M3, 5 una matrice e sia LA : R5 −→ R3 l’applicazione lineare
associata ad A .
a) Dimostrare che il nucleo di LA contiene almeno due vettori indipendenti;
b) dimostrare che LA è un’applicazione suriettiva se e solo se il nucleo di LA non contiene
tre vettori indipendenti;
Esercizio 4.10. Sia L : R3 −→ R4 una applicazione lineare che soddisfa le condizioni
       
1
2 −1 1
 1
L( −2 ) = L( 1 ) = L( 1 ) ,   ∈ Im L
1
1 1 1
1
Determinare (esplicitamente) una base del nucleo di L ed una base dell’immagine di L .
Esercizio 4.11. Si considerino le applicazioni lineari
L : R3−→ R2   M : R3−→ R3  
x   x x 1 7 3t x
 y  7→ 1 1 3t ·  y   y  7→  t 5 1  ·  y 
t 5 1
z z z 0 1 1 z
Determinare i valori del parametro t per i quali
a) il nucleo di L ha dimensione 0, 1, 2, 3; b) l’immagine di L ha dimensione 0, 1, 2.
c) M non è suriettiva; d) M non è iniettiva! e) dim kerM = 1.
         
7 2 1 −1 1
Esercizio 4.12. Si considerino i vettori ~u = , ~v = ,w~= , ~y = , ~z = ,
5 3 3 3 −1
               
1 1 1
1 4 0 1 0
 1   0   2
~a = −3, ~b =  0 , ~c =  1 , d~ =  1 , ~e = −2, f~ =  , ~g =  , ~h =  .
1 1 3
4 1 0 1 5
1 0 4
Trovare, se esistono, delle applicazioni lineari A, B, C, D, E, F, G, H, I, L, M, N che
186

soddisfano le proprietà indicate (giustificare la risposta).


 
A : R2 −→ R2 tale che ImA = Span w ~ , kerA = Span ~z ;
B : R2 −→ R2 tale che ImB = Span w ~ , kerB = Span w ~ ;

C : R3 −→ R4 tale che ImC = Span ~g, ~h ;

D : R3 −→ R4 tale che kerD = Span ~c, d~ ;
 
E : R3 −→ R4 tale che ImE = Span ~g , ~h , ker E = Span ~c, d~ ;
 
F : R3 −→ R3 tale che Im E = Span ~c + d, ~ ~c − d~ , kerE = Span ~c, d~ ;
H : R3 −→ R4 tale che H(~c) = f~ , H(d) ~ = f~ ;
3 4 ~ ~
I : R −→ R tale che I(~e − 2d) = f , I(~e) = ~g ;
L : R3 −→ R4 tale che L( 31 ~e) = f~ − ~g , L(~e) = ~g ;
M : R2 −→ R3 tale che M (~u) = M (~v ) e ~a ∈ ImM ;
N : R2 −→ R3 tale che N (~u) = N (~v ) e ~a, ~b ∈ Im N .
O : R2 −→ R3 tale che O non è iniettiva e ImO = Span{~a, ~c} ;
P : R2 −→ R3 tale che Im P = Span{~e} e ker P = Span{~y} ;
Q : R3 −→ R2 tale che kerQ = Span{~c, ~e} e Im C = Span {~y} .
R : R3 −→ R2 tale che R è iniettiva e w ~ ∈ Im R ;
2 3
S : R −→ R tale che ~
ImS = Span {b} e kerS = Span {~v} ;
T : R3 −→ R2 tale che ker T = Span{~b, ~c} e ImC = Span{w} ~ .
Esercizio 4.13. Sia L : R3 −→ R4 una applicazione lineare soddisfacente le condizioni
     
2 −1 −1
L( −2 ) = L( 1 ) = 5 L( 3 ) .
1 1 1
a) Stimare la dimensione e trovare 5 vettori del nucleo di L ; b) trovare due sottospazi A
e B di R3 in modo che necessariamente risulti verificata una delle due seguenti condizioni:
kerL = A oppure kerL = B .
∗ Esercizio4.14. Si considerinol’applicazione lineare At : R4 −→ R2 rappresentata dalla
−2 4 t −5
matrice ed il vettore ~vt di coordinate t, 1, t+1, 2 .
t + 4 −5 −5 2
a) Determinare i valori di t per i quali ~vt appartiene al nucleo di At ;
b) scegliere uno di tali valori di t e, per tale valore, trovare una base del nucleo e una base
dell’immagine di At .
   
1 1    
0 1 3 1
   
Esercizio 4.15. Si considerino ~u =  1 , ~v =  1  ∈ R5 , ~z =  1 , w ~ = −1 ∈
   
0 1 3 1
1 1
R3 . Trovare delle matrici A, B, C, D, E, F ∈ M3, 5 (indichiamo con LA , LB , LC , LD , LE
le corrispondenti applicazioni lineari, definite su R5 e a valori in R3 ) tali che
a) il nucleo di LA ha dimensione 2;
b) il nucleo di LB ha dimensione 2 e contiene il vettore ~u ;
c) il nucleo di LC non contiene il vettore ~v ;
d) l’immagine di LD ha dimensione 2 e contiene sia il vettore ~z che il vettore w ~;
e) l’immagine di LE ha dimensione 1 e contiene il vettore w ~;
f ) l’immagine di LF ha dimensione 2, contiene il vettore ~z ma non contiene il vettore w ~.
g) Determinare delle equazioni cartesiane e delle equazioni parametriche di ImLA , Im LB ,
ImLC , ImLD , Im LE , Im LF nonché di kerLA , kerLB , kerLC , kerLD , kerLE , kerLF
187

Esercizio 4.16. Per ognuna delle funzioni che seguono, trovare i valori del parametro t
per i quali è una applicazione lineare
f : R2 −→ R2 g : R2 −→ R2 h : R2 −→ R2
           
x x·cos(t) + y ·sen(t) x x − ty x x+y
7→ 7→ 7 →
y −x·sen(t) + y ·cos(t) y t−1 y txy

φ: R3 −→ R2 ψ : R2 −→ R3 ω :R−→ R2
   
x     0  2
 y  7→ x + y x
7→  0  x 7→
x
1 y x
z 0
Esercizio 4.17. Sia V lo spazio vettoriale dei polinomi p(x) di grado minore o uguale 4.
a) Verificare che la “derivata” D : V → V è lineare;
b) Trovare una base di V e la matrice rappresentativa di D rispetto a tale base.
Esercizio 4.18. Sia V lo spazio vettoriale dei polinomi p(x) di grado minore o uguale
4 che soddisfano la relazione p(2) = 0 . Denotiamo con p′ (x) la derivata del polinomio
p(x) .
a) Trovare una base di V e determinare la sua dimensione;
b) trovare la matrice rappresentativa dell’applicazione lineare

L : V −→ R3 , L p(x) = “vettore di coordinate p(0), p(1), p′ (0)”
rispetto alla base di V trovata e alla base canonica di R3 .
∗ Esercizio 4.19. Sia L : R3 −→ R2 una applicazione lineare, assumiamo che
     
−2 4 −1  
4
L( 2 ) = L( −3 ) = −3L( 4 ) = .
5
−1 2 −3
a) Determinare, se possibile, una base del nucleo di L ; b) calcolare L(~e1 ) , dove
~e1 è il primo vettore della base canonica di R3 ; c) è possibile determinare la matrice
A ∈ M2,3 (R) per la quale si ha L = LA ? Se la risposta è “si”, spiegare come.
∗ Esercizio 4.20. Si considerino le applicazioni lineari
 R3 −→ R2 e LB : R3−→ R
LA :  
3
  7 −1 9 2
6 6 −9
associate alle matrici A = , B =  3 −6 2  ed il vettore ~v =  −2 .
−4 −4 6
5 −8 4 3
Si consideri inoltre la composizione LA ◦ LB .
a) Determinare una base del nucleo di LB ; b) calcolare LA ◦ LB (~v ) ;
c) determinare una base del nucleo ed una base dell’immagine di LA ◦ LB .
 
12 −4 16
∗ Esercizio 4.21. Siano A = ed LA : R3 → R2 l’applicazione lineare
−6 2 −8
associata.
a) Determinare una base del nucleo ed una base dell’immagine di LA ;
b) scegliere un vettore non nullo ~k nell’immagine di LA e trovare due vettori distinti ~u
e ~v appartenenti ad R3 la cui immagine è ~k (cioè LA (~u) = LA (~v ) = ~k ).
∗ Esercizio 4.22. Sia L : R4 −→ R3 l’applicazione lineare rappresentata dalla matrice
   
1 4 5 6 5
A =  3 5 3 2  e sia ~v =  1  un vettore in R3 .
−7 −7 1 6 t+3
a) Trovare, se esistono, i valori del parametro t per i quali il vettore ~v appartiene
all’immagine di L ; b) per i valori di t trovati al punto precedente, determinare un
~ ∈ R4 tale che L(w)
vettore w ~ = ~v .
188

∗ Esercizio 4.23. Sia Lt : R3 −→ R2 l’applicazione lineare rappresentata dalla matrice


 
  6
15 20 18 + t
At = e sia w ~ =  −7  un vettore in R3 .
9 12 15
4+m
a) Trovare i valori del parametro t per i quali il nucleo di Lt ha dimensione 2;
b) scegliere uno dei valori di t trovati al punto a) e, per tale valore, trovare i valori del
parametro m per i quali il vettore w~ appartiene al nucleo di Lt .
∗ Esercizio 4.24. Si consideri l’applicazione lineare LA : R4 −→ R3 associata alla matrice
 
1 2 −1 −3
A =  2 3 4 −1 
1 0 11 7
a) Determinare una base del nucleo e una base dell’immagine di LA ;
b) scrivere delle equazioni cartesiane per il nucleo kerLA e per l’immagine ImLA .
     
1 0 1
∗ Esercizio 4.25. Dati i vettori ~u =  −1  , ~v =  1  e w~ =  0  , stabilire se esistono
1 1 2
applicazioni lineari L, M, T soddisfacenti le proprietà seguenti e, in caso affermativo,
scriverne esplicitamente almeno una.
a) L : R4 −→ R3 tale che dimkerL = 1 e ImL = Span{~u, ~v , w} ~ ;
b) M : R3 −→ R3 tale che dim kerM = 1 e ImM = Span{~u, ~v , w} ~ ; 
1
c) T : R3 −→ R2 tale che kerT = Span {~u, ~v , w} ~ e ImT = Span{ }.
−2
   
1 0
∗ Esercizio 4.26. Siano ~v =  −2 , w ~ =  −1  . Trovare, se esistono, delle applicazioni
3 2
lineari A, B, C, D che soddisfano le proprietà indicate:
a) A : R3 −→ R3 tale che Im A = Span {~v, w} ~ ;
b) B : R3 −→ R3 tale che B è iniettiva e ImB = Span{~v , w} ~ ;
c) C : R3 −→ R2 tale che C è suriettiva e kerC = Span {~v} ;
d) D : R3 −→ R3 tale che kerD = Span {~v, w} ~ e ImD = Span{~v } .
∗ Esercizio 4.27. Si consideri l’applicazione lineare  
3 1 0 0 0
6 2 0 0 0
LA : R5 −→ R4 associata alla matrice A =  .
0 0 8 0 3
0 0 −1 0 5
a) Determinare una base del nucleo e una base dell’immagine di LA ; b) trovare
un’applicazione lineare LB : R4 −→ R2 tale che kerLB = ImLA nonché indicare qual
è la matrice che rappresenta la composizione LB ◦ LA ; c) trovare un’applicazione
lineare iniettiva LC : R4 −→ R5 ; d) è vero che il nucleo di LA è uguale al nucleo
della composizione LC ◦ LA ? (giustificare la risposta).
∗ Esercizio
 4.28. Sia  A : R5 −→ R2 l’applicazione lineare associata alla matrice
−1 4 0 −5 2
e sia ~vt ∈ R5 il vettore di coordinate t, 2, 3, 0, −1 .
2 −8 0 6 −4
a) Determinare una base B del nucleo di A ; b) determinare i valori di t per i quali
~vt appartiene al nucleo di A ; c) per i valori di t per i quali ~vt ∈ kerA , determinare
le coordinate di ~vt rispetto alla base trovata al punto a).
   
  −1 1 1
k+4
2 1 −1 1  1 0 1
∗ Esercizio 4.29. Posto A = ,B =   , ~vk =  2  ,
0 2 0 −1 −2 1 0
−1
1 0 1
si considerino le applicazioni lineari LA : R4 −→ R2 e LB : R3 −→ R4 associate alle
189

matrici A e B .
a) Calcolare LA ◦ LB (~vk ) (“◦” denota la composizione); b) determinare i valori di k
per i quali ~vk appartiene al nucleo di LA ◦ LB ; c) trovare un vettore che appartiene
all’immagine di LB ma che non appartiene al nucleo di LA .
∗ Esercizio 4.30. Sia F : R3 −→ R3 un’applicazione lineare.  Assumiamo che il nucleo
kerF sia lo spazio delle soluzioni del sistema lineare omogeneo x+y −z = 0 , che 8 sia un
autovalore di F avente autospazio V8 generato dal vettore di coordinate 1, 2, 1 . a) Dire
se F è diagonalizzabile (in questo caso indicare una base di autovettori ed i corrispondenti
autovalori); b) scrivere il polinomio caratteristico dell’endomorfismo F ; c) calcolare la
matrice rappresentativa di F rispetto alla base canonica di R3 ; d) scegliere due autovettori
indipendenti ~u e ~v e calcolare F ◦ F (3~u − 5~v ) (dove “◦” denota la composizione).
∗ Esercizio 4.31. Sia V lo spazio vettoriale dei polinomi di grado minore o uguale a 2.

Si consideri l’applicazione lineare L : V −→ V definita ponendo L p(x) = 2p′ (x)+p(x)
a) stabilire se la trasformazione lineare L è iniettiva; b) fissare una base B di V e
determinare la matrice rappresentativa di L rispetto a tale base.  
Si consideri ora la funzione Ft : V −→ V definita ponendo Ft p(x) = t−2+p (t+1)·x .
c) Determinare i valori del parametro t per i quali Ft è lineare.
∗ Esercizio 4.32. Sia V lo spazio vettoriale dei polinomi di grado minore o uguale a 3. Sia
L : V → V l’applicazione lineare definita ponendo L p(x) = p(x) + p(−x) .
a) determinare dimensioni e basi del nucleo e dell’immagine di L ; b) determinare la
3 2
25 3 2
 alla base BV = {x + x, x + 1, x + 1, x − 1 } ;
matrice rappresentativa di L rispetto
c) calcolare L 5x − x + 3x + 2 .

§5. Diagonalizzazione.
   
1 4 1
Esercizio 5.1. Verificare che ~v = è un autovettore della matrice A = .
−2 2 3
Calcolarne il relativo autovalore e determinare A~v , A2~v , A3~v , A4~v , A38~v .
Esercizio 5.2. Calcolare il polinomio caratteristico, autovalori e basi dei relativi autospazi
delle
 trasformazioni
  lineari
 associate
 alle  matrici
      
2 0 2 0 2 0 2 0 1 −1 3 4 1 2
, , , , , , ,
1 2 0 2 1 3 0 3 2 −2 4 3 −1 −2
   
        −1 0 4 0 0 0
1 −1 5 3 2 5 3 8  0 7 0 ,  0 0 0 ,
, , , ,
6 −4 2 4 12 −2 4 −1
1 0 2 0 0 0
         
7 0 0 3 8 0 5 2 2 −4 2 2 4 2 6
 0 2 1 ,  4 −1 0 ,  1 4 1 ,  1 −5 1 ,  0 0 0 .
0 0 3 0 0 3 7 −8 1 3 3 −3 2 1 3
   
7 −3 2 −5 2
 −1 9 −2 5  1
Esercizio 5.3. Sia A =   e sia ~v =  .
1 −3 8 −5 3
2 −6 4 −4 1
Denotiamo con LA la trasformazione lineare associata alla matrice A.
a) Verificare che ~v è un autovettore di LA e calcolarne il relativo autovalore λ;
b) calcolare la dimensione dell’autospazio associato all’autovalore λ;
c) calcolare LA ◦LA ◦LA ◦LA ◦LA ◦LA ◦LA ◦LA ◦LA (~v ), dove ”◦” denota la composizione di
applicazioni lineari; d) verificare che µ = 2 è anch’esso un autovalore di LA e determinare
190

una base del relativo autospazio; e) provare che λ e µ sono gli unici due autovalori di LA .
e) scrivere il polinomio caratteristico di LA (senza fare inutili calcoli).
   
1 1
∗ Esercizio 5.4. Si considerino ~u = , ~v = ∈ R2 e la trasformazione lineare
1 2
T : R2 −→ R2 definita dalle relazioni T (~u) = T (~v) = ~u + ~v .
a) Determinare nucleo e immagine di T ;
b) scrivere la matrice A che rappresenta T nella base canonica di R2 .
Esercizio 5.5. Nei casi indicati sotto,
a) stabilire quali vettori sono autovettori (e per quali valori dell’eventuale parametro t);
b) per ognuno di tali autovettori determinare il corrispondente autovalore e una base
dell’autospazio cui appartiene; c) calcolare A19 (w); ~ d) determinare tutti gli autovalori
e calcolarne le molteplicità algebrica e geometrica, quindi stabilire se esistono una matrice
invertibile B ed una matrice diagonale ∆ tali che B −1 · A · B = ∆ nonché una matrice
invertibile C ed una matrice diagonale Λ tali che C −1 · Λ · C = A (se esistono, indicare
tali matrici); e) stabilire se esiste una base di autovettori e, se esiste, scrivere tale base
e scrivere la matrice rappresentativa di T rispetto a tale base.
     
−3 −3 −2 3 2
i) A =  −12 2 6 , ~v =  2 , w ~ =  −3  ;
8 −6 −11 3 4
     
1 1 4 1 2
ii) A =  2 2 −4 , ~v =  −2 , w ~ =  1 ;
4 −2 −5 1 −2
       
2 4 −3 −1 1 7
iii) A =  4 −4 6 , ~u =  1 , ~v =  2 , w ~ =  1 ;
2 −4 7 2 4 −1
       
−3 2 6 1 4 3
iv) A =  2 0 −3 , ~v =  −7 , w ~ =  3 , ~ut =  0  ;
−2 1 4 3 1 t−3
       
3 2 −1 −1 0 t−4
v) A =  −1 0 1 , ~v =  1 , w ~ =  1 , ~ut =  −1  .
2 4 0 1 −1 t−3
     
1 1 3
∗ Esercizio 5.6. Siano ~v =  1  , w ~ =  0  , ~z =  1  ∈ R3 . Sia T : R3 → R3
2 1 −1
la trasformazione lineare soddisfacente le condizioni che seguono:
T (~z) = 2~v ; ~v e w~ sono autovettori rispettivamente di autovalori λ = 2 , µ = −5 .
a) Determinare una base del nucleo e una base dell’immagine di T ; b) determinare una
matrice diagonale ∆ e una base di R3 rispetto alla quale T è rappresentata da ∆ ;
c) determinare la matrice rappresentativa di T rispetto alla base canonica.
Esercizio 5.7. Per le matrici dell’esercizio (2) che risultano diagonalizzabili, scriverne la
formula di diagonalizzazione e calcolarne esplicitamente la potenza n-esima per ogni n ∈ N .
∗ Esercizio 5.8. Sia LA la trasformazione dello spazio R3 rappresentata dalla matrice
 
−5 −6 4
A =  −3 2 −6  .
5 −15 3
a) Calcolare il polinomio caratteristico PA (λ) della matrice A ; b) Verificare che λ = −7
è un autovalore di LA e determinare una base del relativo autospazio; c) trovare un
autovalore della trasformazione lineare LA ◦ LA ◦ LA (dove ”◦” denota la composizione di
applicazioni lineari) e determinare una base del relativo autospazio.
191

∗ Esercizio
 5.9. Si considerino
 la matrice      
−2 −8 6 −2 −1 5
A :=  2 6 −3  ed i vettori ~u =  1  , ~v =  2  , w ~ =  −1  .
−6 −12 11 −3 3 2
a) Individuare i vettori, tra quelli indicati, che sono autovettori di A (spiegare quale
metodo è stato utilizzato); b) determinare gli autovalori corrispondenti agli autovettori
individuati e determinare le basi dei relativi autospazi.
       
3 −2 1 0 1
∗ Esercizio 5.10. Siano A = e B due matrici, ~e = , ~v = ,w
~=
21 −10 0 3 8
tre vettori in R2 .
a) determinare tutti gli autovalori e delle basi dei rispettivi autospazi
 della trasformazione
di R2 associata ad A ; b) calcolare il prodotto A · A · 3~e ;
c) determinare B sapendo che ~v e w ~ sono due autovettori di B , entrambi relativi
all’autovalore λ = 2 . Motivare la risposta. Suggerimento: non dovete fare calcoli!
∗ Esercizio 5.11. Si consideri la trasformazione lineare L dello spazio R3 avente i seguenti
autovettori erelativi
 autovalori:    
1 1 4
~v1 =  1  , λ1 = −7 ; ~v2 =  2  , λ2 = 2 ; ~v3 =  5  , λ3 = 3 .
3 1 5
a) scrivere esplicitamente le immagini dei vettori ~v1 , ~v2 , ~v3 e determinare il polinomio
caratteristico PL (λ) ;
b) determinare una base del nucleo ker L e una base dell’immagine ImL ;
c) calcolare l’immagine L(~e1 ) del primo vettore della base canonica di R3 .
       
1 5 2 1
∗ Esercizio 5.12. Siano ~v1 =  3  , ~v2 =  0  , ~u =  2  , w ~ =  2  . Si
1 −1 6 1
consideri la trasformazione lineare L dello spazio R3 che soddisfa le condizioni che seguono:
L(~u) = L(w)
~ ; ~v1 è un autovettore di L di autovalore λ1 = −6 ; ~v2 è un autovettore
di L di autovalore λ2 = 2 .
a) determinare una base del nucleo kerL e una base dell’immagine Im L ;
b) determinare il polinomio caratteristico PL (λ) ;
c) calcolare l’immagine L3 (~v1 ) dove L3 denota la composizione L ◦ L ◦ L .
 
5 0 0
∗ Esercizio 5.13. Si consideri la matrice A :=  0 1 5  .
0 6 −6
a) Determinare il polinomio caratteristico pA (λ) ;
b) determinare gli autovalori, e delle basi dei corrispondenti autospazi, della trasformazione
lineare di R3 associata alla matrice A ; c) indicare esplicitamente una matrice M ed
una matrice diagonale ∆ tali che A = M −1 · ∆ · M .
     
3 3 1
∗ Esercizio 5.14. Si considerino i vettori ~v =  0 , w ~ =  1 , ~z =  0  ∈ R3 . Sia
5 2 2
L : R3 −→ R3 l’applicazione lineare definita dalle relazioni L(~v ) = L(w)~ = −3~z , L(~z) =
2~v + w
~.
a) si determini una base del nucleo ker L e una base dell’immagine ImL ;
b) determinare un autovettore e un autovalore della trasformazione L ;
c) determinare il polinomio caratteristico della trasformazione L ;
d) determinare le immagini dei vettori della base canonica di R3 ;
e) scrivere esplicitamente la matrice rappresentativa di L rispetto alla base canonica di R3 .
192
   
4 −3
∗ Esercizio 5.15. Siano ~u = , ~v = ∈ R2 e sia L : R2 −→ R2 l’applicazione
−3 2
lineare individuata dalle relazioni L(~u) = −4~u − 6~v , L(~v ) = 3~u + 5~v .
a) determinare la matrice rappresentativa di L rispetto alla base {~u, ~v } ;
b) determinare il polinomio caratteristico e gli autovalori di L ;
c) determinare la matrice rappresentativa di L rispetto alla base canonica di R2 ;
∗ Esercizio 5.16. Si consideri la trasformazione lineare
 
9 1 0 0
0 9 0 0 
LA : R4 −→ R4 associata alla matrice A =  .
0 0 8 3
0 0 −18 −7
a) calcolare il polinomio caratteristico P (λ) ; b) determinare tutti gli autovalori, le loro
molteplicità algebriche e geometriche e delle basi dei rispettivi autospazi; c) è vero che
esistono due matrici C e ∆ tali che C è invertibile, ∆ è diagonale nonché C −1 ·A·C = ∆ ?
(giustificare la risposta e, in caso di risposta affermativa, trovare tali matrici).
   
−2 −3 3 −9 1
 6 7 −3 9  2
∗ Esercizio 5.17. Sia At =   e sia ~v =   .
2 1 3 3 7
−2 −1 1 t + 3 1
a) trovare un valore t per il quale il vettore ~v è un autovettore di At ; b) determinare
il corrispondente autovalore λ nonché le molteplicità algebrica e geometrica di λ ;
c) trovare, se esistono, una matrice C ∈ M4, 4 (R) ed una matrice diagonale ∆ ∈ M4, 4 (R)
tali che C −1 · At · C = ∆ (dove t è il valore trovato al punto a).
   
−7 3 1 4
∗ Esercizio 5.18. Sia A =  4 −11 −2  e sia ~vt =  2  .
2 −3 −6 t
a) trovare un valore τ per il quale il vettore ~vτ è un autovettore di A;
b) determinare il corrispondente autovalore λ e le molteplicità algebrica e geometrica di λ;
c) trovare, se esistono, una matrice C ∈ M3, 3 (R) ed una matrice diagonale ∆ ∈ M3, 3 (R)
tali che C −1 · A · C = ∆ .
   
1 −1 −2 k −1 4
∗ Esercizio 5.19. Si considerino le matrici A =  1 0 0  , Bk =  0 2 0.
2 −1 −3 −6 0 5
a) determinare l’inversa della matrice A ; b) trovare un valore del parametro κ per
il quale il prodotto A−1 · Bκ · A è una matrice diagonale; c) sia κ il valore trovato
precedentemente, determinare il polinomio caratteristico nonché gli autovalori e delle basi
dei rispettivi autospazi della trasformazione lineare di R3 associata alla matrice Bκ .
     
−1 2 0
∗ Esercizio 5.20. Siano ~v =  0  , w ~ =  1  , ~z =  −2  ∈ R3 .
1 0 1
Si consideri la trasformazione lineare L : R3 −→ R3 definita dalle relazioni
~ = ~0 , L(w)
L(~v ) − 2L(w) ~ = w ~ − ~z , L(~z) = 6w ~ − 4~z .
a) determinare una base del nucleo e una base dell’immagine della trasformazione L ;
b) determinare il polinomio caratteristico, gli autovalori e le basi dei rispettivi autospazi
di L ; c) determinare la matrice rappresentativa A di L rispetto alla base {~v , w, ~ ~z } di
R3 nonché la matrice rappresentativa B di L rispetto alla base canonica di R3 .
193

∗ Esercizio 5.21. Si consideri la trasformazione lineare T : R3 → R3 definita dalla


relazione    
x x+y−z
T ( y ) =  −2x + y − 2z  .
z −2x − y
a) Verificare che λ = 2 è un autovalore per T ; b) Determinare autovalori e basi dei
corrispondenti autospazi di T ; c) Dire se T è diagonalizzabile e, in caso di risposta
affermativa, scrivere la matrice rappresentativa di T rispetto ad una base di autovettori.
3
∗ Esercizio 5.22. Sia T : R → R3 la trasformazione
 lineare
  di R3 associata
 (nella
 base
1 7 −2 1 7 − 2t
canonica) alla matrice A =  2 6 −2  . Siano w ~ =  1 , ~vt =  4 − t .
1 11 −2 3 11 − 3t
a) Verificare che w ~ è un autovettore per T ; b) determinare tutti gli autovalori di T ;
c) determinare i due valori t1 e t2 del parametro t per i quali ~vt è un autovettore per T ;
d) scrivere la matrice rappresentativa di T rispetto alla base B = {~vt1 , ~vt2 , w} ~ di R3 .
   
3 4
∗ Esercizio 5.23. Siano ~v = −1, w ~ = −1 e sia T : R3 → R3 la trasformazione
−2 3
lineare che soddisfa le seguenti condizioni: il cui nucleo di T contiene il terzo vettore della
base canonica ~e3 ; ~v e w ~ sono autovettori, rispettivamente di autovalori λ = 5 e µ = −2.
a) Determinare la matrice A che rappresenta T rispetto alla base canonica di R3 .
b) Trovare una matrice diagonale ∆ e una matrice invertibile B tali che ∆ = B −1 · A · B .
     
2 1 0
∗ Esercizio 5.24. Siano ~v =  1 , w ~ =  1 , ~z =  1  tre vettori in R3 e sia L la
4 1 0
3
trasformazione di R individuata dalle condizioni
L(~v ) = 5~v − 4w~ , L(w)~ = 2~v − w ~ , L(~z) = 2~v − 2w ~ + ~z .
a) Determinare la matrice rappresentativa di L rispetto alla base {~v , w, ~ ~z } e la matrice
rappresentativa di L rispetto alla base canonica di R3 ; b) determinare il polinomio
caratteristico di L ; c) determinare, se esiste, una base di autovettori per L .
   
3 0 0 0 0
 0 −1 −2 0  k−5
∗ Esercizio 5.25. Si consideri la matrice A =   ed il vettore ~vk =  .
0 −6 0 0 3
0 0 0 −4 −2
4
a) Determinare gli autovalori della trasformazione lineare di R associata ad A e, per
ognuno di essi, indicarne le molteplicità algebrica e geometrica e scrivere una base del cor-
rispondente autospazio; b) determinare i valori di k per i quali ~vk è un autovettore per
A ; c) per i valori di k trovati al punto “b)”, calcolare A15 (~vk ) .
3
∗ Esercizio 5.26. Sia T : R −→ R3 la trasformazione
  lineare
 diautovettori
1 1 1
~a =  1  , ~b =  0  , ~c =  −1  ,
−2 1 3
rispettivamente di autovalori λ = 2 , µ = 1 , ν = 3 .
a) Determinare la matrice A che rappresenta la trasformazione T rispetto alla base cano-
nica di R3 ; b) determinare il polinomio caratteristico della trasformazione T ;
c) calcolare ~v := 3~a + ~b e determinare T 15 (~v ) .
 
−5 4
∗ Esercizio 5.27. Sia A = .
−8 7
−2 n
a) Calcolare A ; b) calcolare A per ogni n ∈ N ;
c) determinare un autovettore e il corrispondente autovalore della matrice A3 .
194

3
∗ Esercizio
  5.28. Si considerino
 la trasformazione   L di R definita dalla relazione
lineare
x x+2y 1
L( y ) =  2x+y  ed il vettore ~vk =  1  ∈ R3 .
z 8x−7y +4z k
a) Scrivere la matrice A rappresentativa di L rispetto alla base canonica di R3 ;
b) determinare i valori del parametro k per i quali il vettore ~vk è un autovettore per L ;
c) determinare il polinomio caratteristico di L , tutti gli autovalori e delle basi dei cor-
rispondenti autospazi; d) dire se L è diagonalizzabile e, in caso di risposta affermativa,
scrivere esplicitamente una matrice B e una matrice diagonale ∆ tali che ∆ = B −1 ·A·B .
3
∗ Esercizio 5.29. Sia L : R −→ R3 l’applicazione
 lineare rappresentata (nella base
0 4 0
canonica) dalla matrice A =  0 −4 0.
7 −8 1
a) Determinare equazioni parametriche e cartesiane per i sottospazi kerL e Im L, di R3 ;
b) stabilire se L è diagonalizzabile e, in caso di risposta affermativa, determinare una base
B di autovettori per L nonché la matrice ∆ rappresentativa di L rispetto alla base di
autovettori trovata ∆ = MB, B (L) .
∗ Esercizio 5.30. Si considerino lo spazio vettoriale R4 con coordinate x, y, z, w ed il
sottospazio W di equazione cartesiana x − y + 2w = 0 . Sia inoltre T : W −→ R4
   
a a+d
b a + d
l’applicazione lineare definita dalla relazione T ( ) =  .
c c
a) Trovare una base B dello spazio W ; d 0
b) verificare che l’immagine di T è contenuta nello spazio W ;
c) considerare T come trasformazione dello spazio W (cioè T : W −→ W ) e determinarne
la matrice rappresentativa rispetto alla base B trovata precedentemente;
d) stabilire se tale T : W −→ W è diagonalizzabile (giustificando la risposta).
∗ Esercizio 5.31. Si considerino
 le trasformazioni
 lineari
 di R3 associate
 alle matrici

3 0 0 3 0 2 1 0 1
A = 0 2 2 , B = 0 2 2 , C =  0 5 0 .
0 0 3 0 0 3 −1 0 1
a) Stabilire quali trasformazioni sono diagonalizzabili (enunciare in modo chiaro i risultati
teorici utilizzati); b) scegliere una trasformazione diagonalizzabile tra quelle date e deter-
minare una base di autovettori; c) stabilire quali tra queste trasformazioni hanno almeno
2 autovettori indipendenti.
∗ Esercizio 5.32. Sia V uno spazio vettoriale e B = {~v1 , ~v2 , ~v3 } una sua base. Sia
Lt : V −→ V la trasformazione lineare (dipendente dal parametro t) definita dalle relazioni
L(~v1 ) = ~v1 + ~v2 , L(~v2 ) = 2~v2 , L(~v3 ) = ~v1 − ~v2 + t~v3 .
a) Determinare i valori del parametro t per i quali Lt è diagonalizzabile;
b) determinare tutti gli autovalori e basi dei corrispondenti autospazi di L0 (t = 0).
   
4 2 2 1 2
∗ Esercizio 5.33. Si considerino le matrici At =  t 1 , Bt =  
2 1 2+t 2 4
dipendenti dal parametro t.
a) determinare le dimensioni di nucleo e immagine di At e Bt in funzione del parametro t;
b) determinare i valori di t per i quali il prodotto At · Bt è invertibile;
c) determinare i valori di t per i quali il prodotto Bt · At è invertibile.;
d) determinare un autovettore del prodotto A4 · B4 (t = 4).
∗ Esercizio 5.34. Sia B = { ~v , w ~ , ~u} una base dello spazio vettoriale R3 . Si consideri
3
la trasformazione lineare T di R soddisfacente le condizioni seguenti: ~v è un autovettore
195

~ = −~v + 3w
di autovalore λ = 2 , risulta T (w) ~ − 2~u , T (~u) = −2~v + 2w
~ − 2~u .
a) Stabilire se T è diagonalizzabile; b) determinare il polinomio caratteristico di T ;
c) calcolare T 5 (~v − w
~ + 2~u) .
3
∗ Esercizio 5.35. Si consideri lo spazio vettoriale R ela trasformazione
  lineare
x y
T : R3 −→ R3 definita da T ( y ) =  z  .
z −27 x
a) Calcolare il polinomio caratteristico e stabilire l’eventuale diagonalizzabilità della trasfor-
mazione T ; b) stabilire se esiste un autovettore di T 3 che non è un autovettore per T ;
c) stabilire se esiste un autovettore di T −1 che non è un autovettore per T ; d) deter-
minare una base dell’immagine della trasformazione T 19 .
∗ Esercizio 5.36. Sia V uno spazio vettoriale e sia BV = {~v , w, ~ ~z } una sua base. Sia T :
V → V la trasformazione lineare definita dalle condizioni che seguono: ~v è un autovettore
di autovalore λ = 5 , w~ +~z è un autovettore di autovalore λ = 3 , T (2~v + 2w)
~ = 6~v + 2w ~.
a) determinare la matrice rappresentativa di T rispetto alla base BV ; b) determinare
autovalori e basi dei corrispondenti autospazi della trasformazione T ; c) determinare il
polinomio caratteristico di T ; d) stabilire se T è diagonalizzabile (giustificare la risposta).
Esercizio 5.37. a) Dimostrare che le matrici P ∈ Mn,n soddisfacenti P 2 = P sono
caratterizzate dalla proprietà P · w ~ ∀w
~ = w, ~ ∈ ImP (per questo motivo sono chiamate
“matrici di proiezione”); b) determinare gli autovalori e descrivere gli autospazi delle matrici
di proiezione;
c) verificare che se P ∈ Mn,n è una matrice di proiezione allora si ha una decomposizione
in somma diretta Rn = kerP ⊕ ImP .

§6. Geometria Euclidea.

Esercizio 6.1. Si considerino, nel piano Euclideo R2 , i punti


         
5 7 −5 2 −7
P = , Q= , H= , K= ed il vettore ~v = . Determinare
−2 6 −6 4 18
a) le coordinate del vettore che è rappresentato dal segmento orientato il cui estremo iniziale
è il punto P ed il cui estremo finale è il punto Q ; disegnare i due punti ed il vettore;
b) l’estremo finale del segmento orientato che rappresenta il vettore ~v ed il cui estremo
iniziale è il punto P ; c) l’estremo iniziale del segmento orientato che rappresenta il
vettore ~v ed il cui estremo finale è il punto P ; d) la distanza tra i punti H e K .
       
3 12 −8 4
Esercizio 6.2. Siano ~u = , ~v = ,w~ = , ~z = vettori geometrici del
4 −5 −6 3
piano Euclideo R2 . Trovare
a) un vettore di norma 39 parallelo al vettore ~v ; b) un vettore di norma 30 ortogonale
al vettore ~u ; c) i coseni degli angoli ~uc~v , ~vcw,
~ ~vc~z (per quale motivo geometrico gli
ultimi due sono uguali in modulo e di segno opposto?); d) l’area del parallelogramma
individuato da ~u e ~v ; e) la proiezione del vettore ~u lungo la direzione individuata dal
vettore w ~ ; f ) la proiezione del vettore ~u lungo la direzione individuata dal vettore ~z (il
risultato deve essere uguale a quello trovato al punto precedente, spiegare il perché).
2
Esercizio 6.3.  Si
 considerino,  R , la retta
  nel piano Euclideo  r di equazione
  x+2y−3  = 0,

2 8 2 8 7 −3
i vettori ~v = , w
~= , i punti P = , Q= , K= , T = .
1 5 1 5 2 4
Determinare: a) la distanza del punto T dalla retta r ; b) un’equazione cartesiana
che descrive la retta s passante per i punti P e Q ; c) la distanza del punto K dalla
196

retta s; d) la proiezione H del punto K sulla retta s di cui al punto “b” e verificare
che la distanza tra i punti H e K è uguale alla distanza calcolata al punto “c”;
e) equazioni parametriche della retta passante per i punti P e K ;
f ) equazioni parametriche della retta passante per il punto P ed ortogonale al vettore ~v ;
g) un’equazione cartesiana della retta passante per il punto P e parallela al vettore w ~.
     
2 8 7
Esercizio 6.4. Si considerino i punti B = ,C= ,D= ed il triangolo T
1 5 2
di vertici B, C, D.
Calcolare: l’area A, le misure degli angoli interni β, γ e δ di vertici B, C e D, la misura
dell’altezza relativa alla base BC, la proiezione del punto D sulla base BC, del triangolo T.
Esercizio 6.5. Consideriamo i seguenti punti e vettori geometrici dello spazio Euclideo
R3 .            
4 −1 2 4 5 7
Punti: P =−2, Q = 7 . Vettori: ~v =−1, w ~ = 12 , ~z = 2 , ~u = 8 .
1 2 −2 −3 −3 −3
Trovare: a) l’estremo iniziale del segmento orientato di estremo finale P che rappresenta ~v ;
b) la distanza tra i punti P e Q ; c) il coseno dell’angolo compreso tra i vettori ~v e w ~;
d) due vettori paralleli al vettore ~v rispettivamente di norma uno e norma 15 ;
e) due vettori indipendenti, entrambi ortogonali al vettore ~v ; f ) due vettori indipendenti,
entrambi di norma 8 ed ortogonali al vettore ~v ; g) due vettori (non nulli) ~h e ~k ortogonali
tra loro ed ortogonali al vettore ~v (verificare che B = {~v , ~h, ~k} è una base di R3 ).
Calcolare: h) i prodotti vettoriali ed i prodotti misti che seguono:
~v ∧ w
~ , ~v ∧ ~v , ~u ∧ ~v , ~v ∧ (4~z) , ~z ∧ ~v , ~z ∧ ~u , ~v ∧ (~v + ~u) , ~v ∧ ~u
(verificare, in tutti i casi, che il vettore ottenuto è ortogonale ad entrambi gli argomenti);
(~v ∧ w)~ · ~z , (~v ∧ ~z) · w
~ , (~v ∧ w) ~ ∧ ~z , ~v ∧ (w ~ ∧ ~z) (“·” denota il prodotto scalare);
i) l’area A del parallelogramma individuato dai vettori ~v e w ~;
l) le coordinate della proiezione ~π di ~v lungo la direzione individuata da w ~.
     
5 3 6
∗ Esercizio 6.6. Si considerino i punti P = , Q= , K = ∈ R2 ed il
6 4 0
triangolo T di vertici P, Q, K . Determinare
a) l’area del triangolo T ; b) il coseno cosθ dell’angolo di T di vertice Q ;
c) un’equazione cartesiana della retta r passante per i punti P e Q .
     
3 1 5
∗ Esercizio 6.7. Sia P =  −2  un punto di R3 e siano ~u =  −3  , ~v =  −9  due
5 0 −4
vettori geometrici.
a) Trovare un vettore ~k di norma 7 ortogonale ad entrambi i vettori ~u e ~v ;
b) determinare l’area A del parallelogramma individuato da ~u e ~v ;
c) determinare il coseno cos(θ) dell’angolo compreso tra i vettori ~u e ~v ;
d) determinare le coordinate dell’estremo iniziale I del segmento orientato che rappresenta
il vettore ~v ed il cui estremo finale è il punto P .
   
−7 1
∗ Esercizio 6.8. Siano ~v =  −6 , w ~ =  1  vettori geometrici dello spazio Euclideo
−3 3
R3 . Determinare: a) il coseno cos(θ) dell’angolo compreso tra i vettori ~v e w ~;
b) l’area A del parallelogramma individuato dai vettori ~v e w ~;
c) le coordinate della proiezione ~π di ~v lungo la direzione individuata da w ~.
d) (facoltativo) verificare che il prodotto scalare ~π · w ~ è uguale al prodotto scalare ~v · w~ e
spiegare perché ~v ′ · w~ ′ = ~π ′ · w
~ ′ per ogni coppia di vettori ~v ′ e w~ ′ (essendo ~π ′ la proiezione
di ~v ′ lungo la direzione individuata da w ~ ′ ).
197
   
13 3
∗ Esercizio 6.9. Si consideri il piano R2 , i punti P = , K = e la retta r di
15 4
equazione cartesiana 5x + 12y − 76 = 0 .
a) Trovare un vettore ~v di norma 26 parallelo ad r ; b) calcolare la distanza
d = dist{P, r} e trovare le coordinate del punto Q ∈ r tale che dist{P, Q} = d ;
c) calcolare l’area del triangolo T di vertici P, Q, K ; d) determinare il coseno cosθ
dell’angolo di T di vertice Q .
3
∗ Esercizio 6.10.   nello spazio Euclideo R , 
 Si considerino,   
7 4 8 2
i punti P =  3 , Q =  2  ed i vettori geometrici ~v =  −1  , w ~ =  0 .
5 1 −3 −1
a) determinare le coordinate dell’estremo iniziale I del segmento orientato che rappresenta
il vettore ~v ed il cui estremo finale è il punto P ;
b) determinare l’area A del triangolo di vertici i punti P , Q , I ;
c) trovare un vettore ~h di norma 3 ortogonale ad entrambi i vettori ~v e w ~;
d) determinare il coseno cos(θ) dell’angolo compreso tra i vettori ~v e w ~;
e) determinare le coordinate della proiezione ~π di ~v lungo la direzione individuata da w ~.
   
2 6
∗ Esercizio 6.11. Siano ~v =  2  e ~k =  7  due vettori dello spazio euclideo R3 .
−1 8
a) Trovare due vettori ~u e w ~ ortogonali tra loro, entrambi ortogonali al vettore ~v nonché
entrambi di norma 3; b) calcolare il prodotto vettoriale ~z = ~u ∧ w ~ ; c) determinare
il coseno cos(θ) dell’angolo compreso tra i vettori ~v e ~k ; d) determinare le coordinate
della proiezione ~π di ~k lungo la direzione individuata dal vettore ~z .
∗ Esercizio
  6.12. Si consideri, nel piano Euclideo R2 , la retta r passante
 per i punti
2 5 11
P = e Q= . Si consideri inoltre il vettore geometrico ~k = .
3 −1 0
a) Determinare equazioni parametriche e cartesiane di r ; b) trovare un vettore ~v
di norma 7 parallelo alla retta r ; c) trovare una equazione cartesiana di una retta s
parallela ad r e tale che la distanza di s da r vale 5; d) determinare le coordinate della
proiezione ~π del vettore ~k lungo la direzione individuata dalla retta r .
     
2 5 2
∗ Esercizio 6.13. Si consideri il punto P =  3  ed i vettori ~k =  1  , w ~ = 1.
−1 7 3
a) Determinare le coordinate dell’estremo iniziale Q del segmento orientato che ha P
come estremo finale e che rappresenta il vettore ~k ; b) trovare un vettore ~v di norma 5
nonché ortogonale ai vettori ~k e w ~ ; c) determinare le coordinate delle proiezioni ~π~k (w)
~ ,
~π~k (w+7~
~ v ) , e ~π~k (2w+11~
~ v) , dei vettori w
~ , w+7~
~ v e 2w+11~
~ v lungo la direzione individuata
dal vettore ~k . d) (facoltativo) Scrivere una base del nucleo e una base dell’immagine
dell’applicazione lineare L : R3 −→ R3 definita ponendo L(~x) = ~π~k (~x) .
     
2 −2 5
∗ Esercizio 6.14. Siano P = , Q = , R = tre punti del piano
3 3 −1
Euclideo, sia T il triangolo di vertici P, Q, R e sia θ l’angolo di vertice P (del triangolo
T). Determinare:
a) l’area A del triangolo T ; b) il coseno cosθ dell’angolo θ ; c) equazioni para-
metriche e cartesiane della retta r passante per il punto P e parallela a QR ; d) le
coordinate del punto K ottenuto proiettando P sulla retta s passante per Q ed R .
198
     
2 2 5
∗ Esercizio 6.15. Si considerino i punti P =  3  , Q =  1  ed il vettore ~k =  1  .
−1 3 7
a) Determinare le coordinate del vettore w ~ rappresentato dal segmento orientato che ha Q
come estremo finale ed ha P come estremo iniziale; b) trovare un vettore ~v di norma 2
nonché ortogonale ai vettori ~k e w
~ ; c) determinare le coordinate della proiezione π~k (w)
~ ,
del vettore w ~
~ lungo la direzione individuata dal vettore k ; d) determinare le coordinate
di un vettore ~r che soddisfa le condizioni ~r 6= w
~ e π~k (~r) = π~k (w)
~ .
     
1 2 1
∗ Esercizio 6.16. Siano ~v =  4 , P =  −1  e Q =  −12  rispettivamente
−2 3 12
3
un vettore geometrico e due punti dello spazio Euclideo R . Sia r la retta di equazione
parametrica ~x = P + t · ~v . Determinare:
a) la proiezione ortogonale π del punto Q sulla retta r ; b) l’area del triangolo T
di vertici π, P, Q ; c) il coseno dell’angolo θ individuato dal vettore rappresentato dal
segmento orientato P Q e dal vettore ~v .
2
∗ Esercizio 6.17.  R (con coordinate x, y), la retta r di
Si consideri il piano Euclideo
1
equazione x + 3y − 2 = 0 ed il punto A = .
−1
Determinare equazioni parametriche per r , trovare un vettore di norma 2 parallelo ad r ,
trovare un punto P la cui distanza da r vale 5. Scrivere una equazione cartesiana per la
retta s ortogonale ad r e passante per il punto A .
     
2 −1 5
∗ Esercizio 6.18. Siano P = , Q= , ~v = rispettivamente due punti e
3 3 −4
un vettore geometrico del piano Euclideo. Sia R l’estremo iniziale del segmento orientato di
estremo finale Q e che rappresenta il vettore ~v . Determinare l’area A del triangolo T di
vertici P, Q, R , equazioni parametriche e cartesiane della retta r passante per il punto
P e ortogonale a ~v , le coordinate del punto K ottenuto proiettando Q sulla retta r .
   
4 −2
∗ Esercizio 6.19. Nel piano Euclideo R2 , siano P = un punto e α~ = , β~ =
  6 3
5
due vettori geometrici. Siano A e B gli estremi finali dei segmenti orientati di
−1
estremo iniziale P e che rappresentano rispettivamente i vettori α ~ e β~ . Determinare
a) equazioni parametriche e cartesiane per la retta r passante per i punti A, B ;
b) il coseno cosθ dell’angolo θ di vertice P del triangolo T di vertici P, A, B ;
c) le coordinate del punto K ottenuto proiettando A sulla retta passante per i punti P e B.
2
∗ Esercizio 6.20. Si considerino,
 nel piano Euclideo R,  
2 5 3
il vettore geometrico ~v = ed i punti P = , Q= .
−3 2 −8
a) Determinare equazioni parametriche e cartesiane della r, parallela a ~v e passante per P ;
b) calcolare la distanza dist{Q, r} ; c) determinare le coordinate del punto K , ottenuto
proiettando ortogonalmente il punto Q sulla retta r ; d) calcolare l’area del triangolo T
di vertici P, Q, K .
2
∗ Esercizio 6.21.
 Nel  piano Euclideo R , si consideri    
2 2 5
il punto Q = e la retta r passante per i punti A = , B= .
−1 3 −1
a) Determinare equazioni parametriche e cartesiane di r ; b) trovare la distanza di Q da
r ; c) determinare le coordinate della proiezione ~π del vettore geometrico rappresentato
dal segmento orientato AQ lungo la direzione di r .
199

2
∗ Esercizio
  6.22. Si consideri, nel piano
 Euclideo R , la r retta ortogonale al vettore
1 4 11
~v = passante per il punto P = . Sia Q = un altro punto.
2 −3 1
a) Determinare equazioni parametriche e cartesiane per r ; b) calcolare le coordinate
della proiezione K ortogonale del punto Q su r ; c) calcolare la distanza del punto Q
da r ; d) determinare le coordinate di un vettore di norma 5 parallelo ad r .
∗ Esercizio 6.23. Si considerino
( lo spazio Euclideo R3(
, con coordinate (x, y, z), e le rette
x − 2y = 1 x+y−z = 0
r : , s :
2x + z = 0 y = 1
a) stabilire se le due rette date hanno un punto in comune; b) scrivere equazioni parame-
triche per la retta r. c) determinare l’equazione cartesiana del piano passante per l’origine
ortogonale ad r ; d) determinare la distanza dell’origine dalla retta r .
∗ Esercizio 6.24. Si consideri lo spazio vettoriale R3 , il piano H di equazione x+y−2z = 0
ed il vettore ~vt di coordinate 1, t, 3 .
a) trovare il valore t0 per il quale ~vt0 appartiene ad H ;
b) trovare i valori t1 per i quali risulta Span{~vt1 } + H = R3 ;
c) trovare una base di H contenente il vettore ~vt0 ;
d) si consideri R3 dotato della naturale struttura di spazio Euclideo. Sia π : R3 → R3
la proiezione ortogonale su H , determinarne la matrice rappresentativa (rispetto alla base
canonica di R3 ).
     
1 2 1
∗ Esercizio 6.25. Si considerino lo spazio R3 i punti P =  0 , Q = −2, R =  6 .
−1 −1 1
a) determinare un’equazione cartesiana per il piano H passante per i tre punti dati.
b) Considerando su R3 la struttura naturale di spazio Euclideo, calcolare l’area del trian-
golo T di vertici P, Q, R e la la distanza dell’origine dal piano H
   
−t 2
∗ Esercizio 6.26. Si considerino lo spazio Euclideo R3 ed i punti Pt =  0 , Q = −2.
t−1 −1
a) determinare un’equazione cartesiana per il piano H passante per il punto Q e contenente
Pt per ogni valore di t; b) Calcolare l’area del triangolo T di vertici Q, P0 , P1 ;
c) determinare la distanza dell’origine dal piano H .
200

§7. Soluzione degli esercizi.

1.4. detA = −3k 2 − 5k + 8, det B = −60, det C = −2k 2 + 2k − 3, det D = −4k 2 + 3k + 4,


det E = −2k 3 − k, det F = −k 2 + 2k − 1.
1.5. det(λA) = λn det A.
     
−1/3 0 5/3 0 0 1/5 0 −1/2 0
1.6. A−1 =  0 −1/2 0 , B −1 =  1/4 1/4 0 , C −1 =  1 0 1/4 ,
 1/3 0 −2/3
  −1/4 3/4 0  −2
 0 −3/4
1 0 0 10/7 −5/7 6/7 −2 −1 −1
D−1 =  −3/2 1/2 0 , E −1 =  −4/7 2/7 −1/7 , F −1 =  1 −1 0 ,
 −5/4 1/4 −1/2  −5/7 6/7 −3/7 3 1 1
1 −1 −1/2 −1/3 1/3 1/3
G−1 =  1 0 −1/2 , H −1 =  −1/3 7/3 −2/3 ;
−1/2 1/2 1/2 2/3 −5/3 1/3
b) 216; 1/50; −27; 243(t+5)2(t+8)2 ; 2k 2 −2k−40; −3(8k+4)3 ; 10125/4; −4t2 −36t−108;
−24t2 − 216t − 648; −48(t2 + 9t + 27)(t2 + 13t + 24); −4(k 2 − k − 20); 2/27.
Nota. Gli ultimi quattro sono stati calcolati usando le uguaglianze che seguono (cosı̀
da evitare lunghi calcoli): A·G− A·M = A·(G− M ); G2 ·M − G·M 2 = G·(G− M )·M ;
2A−A·N ·H −1 = A·(2H −N )·H −1; H −3 −H −4 = H −4 (H −I).
c) Il prodotto E −1 ·J 2 ·K è invertibile se e solo se J e K sono entrambe invertibili (E −1
è invertibile). Si ha det J = k 2 − 5k − 14 = (k + 2)(k − 7) e det K = (k − 1)(k − 8), quindi
E −1 ·H 2 ·J è invertibile per ogni k diverso da -2, 7, 1, 8 (e non è invertibile se k è uno dei
valori indicati). I √prodotti 3 G−2 ·M 2 e 2 B·D−3 ·H·J 2 ·N sono invertibili rispettivamente
per k 6= −13/2 ± 73/2 e per k 6= −2, 7, −1/2.
d) Si ha ampia possibilità di scelta, basta scrivere delle matrici “del tipo/soddisfacenti”:
Q = A+J, dove det J = 1; detR = detA−1 ; rangoS = 2; rangoT = 1; U = A−1 ·W , dove
W ha rango 2 e prima colonna nulla (cosı̀ W ·~e1 = ~0); rangoX = 2; rangoY = 1.
1.7. La matrice M è sostanzialmente già a scala (anche se si tratta di una scala capovolta),
ha rango 3 per k diverso da 3, 7, −4 . Sostituendo questi valori troviamo che per k = 3 e
per k = −4 ha rango 2, mentre per k = 7 ha comunque rango 3. In definitiva: rg (M ) = 2
per k = 3, −4 ; rg (M ) = 3 per k 6= 3, −4 .
Risulta: rg (N ) = 1 per k = 1; rg (N ) = 2 per k = −2; rg (N ) = 3 per k 6= 1, −2.
1.8. Le matrici D, G, H, L, M, N hanno determinante nullo, quindi non sono invertibili
per nessun valore di t; A è invertibile per t 6= 1, 2; √B lo √è per t 6= 2, −2; C lo è per
t 6= 1, 2, −2; E lo è per t 6= 3, 4, −1; F lo è per t 6= 2, − 2; J lo è per t 6= 0, 1, −1.
1.11. a) basta scriverlo! b)  detB = a3 (c−b) 3 3
+ b (a−c) + cn(n−1)
(b−a) ; 
n n n
3 3 3 1 na nb+ 2 ac
c) C n =  2 · 3n 2 · 3n 2 · 3n ; d) Dn =  0 1 nc .
0 0 0 0 0 0
 
a b
1.12. Le matrici del tipo .
b a
 
a b
1.13. Posto P = , l’identità P 2 = P si traduce nelle relazioni a2 + bc = a,
c d
b(a+d) = b, c(a+d) = c, bc+d2 = d. Queste relazioni consentono di elencare le matrici
in questione: b c 6= 0 ⇒ c = (a − a2 )/b, d = 1 − a 6∈ {0, 1}; b c = 0 ⇒ a, d ∈ {0, 1}
(con d = 1 − a se bc 6= 0
 0 ). In definitiva, le matriciP soddisfacenti
 P = 
2
P sono
a x δ 0 δ x δ 0
le matrici che seguono: , , , dove
(a−a2 )/x 1−a x 1−δ 0 1−δ 0 δ′

a 6∈ {0, 1}; x 6= 0; δ, δ ∈ {0, 1}. Esiste un modo geometrico di affrontare il problema che
201

fornisce una risposta soddisfacente anche nel caso delle matrici n × n (cfr. esercizio 5.37).
 
−αγ α2
1.14. Sono le matrici del tipo ± .
−γ 2 αγ
1.15. Innanzi tutto osserviamo che la quarta e la quinta colonna di A sono uguali
rispettivamente alla seconda e terza colonna. Di conseguenza possiamo ignorarle: rango(A)
= rango(A′ ) per ogni valore di k, dove A′ è la sottomatrice costituita dalle prime tre colonne
di A . Si ha det(A′ ) = 0 ,ne segue che rango(A′ ) ≤ 2, per ogni k . Ora consideriamo
k−6 3
il minore M = . Poiché det (M ) = −3k − 21 , per k 6= −7 la matrice A′
2k+1 3
(quindi la matrice A) ha rango maggiore o uguale a 2. Studiando separatamente il caso in
cui k = −7 si ottiene che A′ , quindi A, ha rango 1. Riassumendo: A ha rango 1 per
k = −7; A ha rango 2 per k 6= −7; A non ha mai rango 3.
   
−1/2 0 1/2 0
1.16. A−1 =  0 −1 0 , ~x = A · ~b =  −1  . Nota: per determinare le
3 0 −2 0
soluzioni del sistema lineare A−1·~x = ~b non si devono fare calcoli: A−1·~x = ~b ⇒ ~x = A·~b .
 
1/3 13/6 −2
1.17. Si ha A−1 =  0 3/2 −1 . Visto che A è invertibile, l’invertibilità del
0 −1 1
prodotto A2·B 3 è equivalente all’invertibilità di B . Poiché det B = −6(8 − 3k), la matrice
A2 · B 3 è invertibile per k diverso da 38 .
Posto k = 0 , si ha B~e1 = 2e1 nonché A~e1 = 3e1 . Quindi, A2 ·B 3 ·~e1 = 32 ·23 ·~e1 = 72~e1 .
 
−19/3 8/3 1
1.18. a) A−1 =  2/3 −1/3 0 . Si ha det A = 3, detB = 8 , quindi,
28/3 −11/3 −1 
det (2AB 2 ) = 23 · 3 · 82 = 1536 , det 2(A−1 )2 B 2 = 23 · 3−2 · 82 = 512 9 .
Invece, per calcolare det(2A+B) non ci sono scorciatoie. Si trova det(2A + B) = 12.
b) abbiamo ampia possibilità di scelta. Infatti, possiamo fare in modo che la somma A+C
sia quello che ci pare: presa una qualsiasi matrice D di rango 1 definiamo C = D−A.
c) abbiamo di nuovo ampia possibilità di scelta: basta scegliere una matrice D di rango
1 (anche il prodotto A · D, essendo A invertibile, avrà rango 1).
   
−19/3 8/3 1 59
1.19. Risulta: det A = 3 , A−1 =  2/3 −1/3 0 ; AB(~v ) =  172  ;
28/3 −11/3 −1 −93
2 3 2
det B = 4 ; det(2AB
 ) = 2 · det A · (det B) = 8 · 3 · 16 = 384; det (2A + B) = 52;
det 2(A−1 )2 B 2 = 23 · (det A)−2 · (det B)2 = 8·16 9 = 128
9 .
Poiché A è invertibile, si ha che A·D ·~k = ~0 se e solo se D ·~k = ~0 , quindi il nucleo di
A · D è uguale al nucleo di D . La matrice D deve avere rango 2 e si deve avere D · ~v = ~0 ,
cioè si deve avere d~1 − 2d~2 + d~3 = ~0 (essendo d~1 , d~2 , d~3 le tre  colonne di D). Abbiamo
1 0 −1
ampia possibilità di scelta, ad esempio possiamo prendere D =  0 1 2  .
0 0 0
   
−1 2 1 0 −1 2
(Binet)
1.20. A−1 =  0 0 1 ; A−2 =  −1 1 1 ; det An = (det A)n = (−1)n .
−1 1 1 0 −1 1
 3 3
Inoltre, det n · A = n ·detA = −n (questo perché A è una matrice di ordine 3).
   
2/5 1/5 0 81
1.21. A−1 =  1/5 3/5 0 ; B ·A3 ·~e3 =  −54 ; A3 ·B 2 è invertibile se e
1/5 −1/15 −1/3 −27
202
 
−4/5
solo se B è invertibile, questo accade per k 6= 8; ~x = A−1 ·B ·~e3 =  3/5 .
−16/15
1.22. Risulta: det A = 3 , quindi A è invertibile;
det Bt = 2 · (−2t+2 − 8) = −4t − 12 , quindi Bt è invertibile per t 6= −3 ;
 −3 2 2
det 4·A−3 ·B 2 = 43 · detA · det Bt = 64
27 4t + 12 (si usa il teorema di Binet);
det (A + B) = −3t − 27 (si deve prima calcolare A + B);  
t 8 0
C = A−1 ·(A + A·B) = A−1 ·A + A−1 ·A·B = I + B =  1 −1 0 .
−1 0 3
1.23. Moltiplicando per A−2 si trova A = In (matrice identica di ordine
 n).
Si ha A2 BA + A2 B 2 = A2 B(A + B), quindi det λ(A2 BA + A2 B 2 ) = λn a2 bc.
 
5/6 −11/6 1/6 
1.24. a) A−1 =  1/6 −1/6 −1/6 . b) det A−1 Bk A2 = detBk · det A =
−5/6 17/6 −1/6
−18 k + 270; det (2Bk ) = −24 k + 360; det (A + Bk ) = 3k + 9. c) Il “rango di una
matrice” corrisponde alla “dimensione dell’immagine” (nella corrispondenza tra matrici e
applicazioni lineari). D’altro canto questa dimensione non varia quando si compone una
applicazione lineare con una applicazione lineare biunivoca (cfr § 12). Questo principio si
applica anche alla seconda uguaglianza perché risulta A−1 Bk A2 + A = A−1 ·(Bk + I)·A2 .
1.25. a) B ·A3 ·B 2 è invertibile per t 6= 1, −1. b) Poiché A·C −B ·C = (A−B)·C e
A−B è invertibile (t2 +3 non si annulla mai), si ha rango(A·C −B ·C) = rango(C) = 2 .
c) B è invertibile per t 6= −1 . Assumendo t 6= −1 risulta A4 · B −2 − A3 · B −1 =
A3 · (A − B) · B −2 . Il determinante di questo prodotto vale (t2 − 1)3 · (t2 + 3) · (t + 1)−2 .
c) E = “matrice di colonne ~e1 , ~e2 , ~0 ” (in questo modo il prodotto D ·E dà le prime due
colonne di D e la colonna nulla); F = “matrice di colonne ~e1 , ~e3 , ~0 ”.
2.4. S1 . k 6= −4 : ∃∞1 soluzioni; k = −4 : incompatibile.
S2 . k 6= 4, −2, 3 : ∃! soluzione; k = 4, 3 : ∃∞1 soluzioni; k = −2 : incompatibile.
S3 . k 6= 0, −1 : ∃∞1 soluzioni; k = 0 : incompatibile; k = −1 : ∃∞2 soluzioni.
S4 . k 6= 1, −2 : ∃∞1 soluzioni; k = 1 : ∃∞2 soluzioni; k = −2 : incompatibile.
S5 . k 6= 1, −3 : ∃∞1 soluzioni; k = 1 : incompatibile; k = −3 : ∃∞2 soluzioni.
S6 . k 6= 2, −5 : ∃∞1 soluzioni; k = 2 : ∃∞2 soluzioni; k = −5 : incompatibile.
S7 . k 6= 3, −5 : ∃∞1 soluzioni; k = 3 : ∃∞2 soluzioni; k = −5 : incompatibile.
S8 . k 6= 2, 7 : ∃! soluzione; k = 2 : incompatibile; k = 7 : ∃∞1 soluzioni.
2.5. a) cambiare l’ordine delle colonne equivale a cambiare l’ordine delle incognite ...basta
ricordarsene! b) No, i sistemi associati alle matrici A e B non sono equivalenti; c) si; d)
si; e) no (a meno che non si tenga traccia dell’incognita fatta fuori); f ) e g) no (a meno
che non si tenga traccia della corrispondente trasformazione delle incognite).
2.6. SB ∼ SF ; SC ∼ SE ; SL ∼ SN (“∼” denota l’equivalenza di sistemi lineari).
SA è incompatibile; ∃! soluzione per SC , SE ; ∃ ∞1 soluzioni per SD , SM ;
∃ ∞2 soluzioni per SG , SL , SN ; ∃ ∞3 soluzioni per SB , SF ; ∃ ∞4 soluzioni per SH .
2.8. Poiché il sistema è quadrato (numero equazioni = numero incognite), ammette una
unica soluzione se e solo se il determinante ∆ della matrice incompleta è diverso da zero.
Si ha ∆ = k 2 − 5k + 6 . Pertanto esiste una unica soluzione per k diverso da 2 e 3 .
Per k = 3 il sistema è incompatibile (14x + 13y = −8, 14x + 13y = −7). Si osservi che
il rango della matrice completa è maggiore di quello della matrice incompleta).
Per k = 2 il sistema (che diventa 8x + 8y = −8, 7x + 7y = −7) ammette infinite soluzioni
che dipendono da un parametro libero (“n. incognite − rango” = 1).
2.9. La matrice incompleta associata al sistema è una matrice triangolare, il suo determi-
nante vale (k+3)(k+6)(k−2) , che è non-nullo per k diverso da −3, −6, 2 . Di conseguenza,
203

poiché il nostro sistema è un sistema quadrato (num. equazioni = num. incognite) per k di-
verso da −3, −6, 2 il sistema lineare A~x = ~b ammette una unica soluzione. Sostituendo i
valori −3, −6, 2 nel sistema si trova che per k = −3 e per k = 2 il sistema è incompatibile;
per k = −6 il sistema ammette infinite soluzioni.
2.10. Innanzi tutto, riduciamo a scala la matrice completa associata al sistema lineare:
     
4 3 4 2 5 4 3 4 2 5 4 3 4 2 5
8 2t 5+t 4 11+t∼0 2t−6 t−3 0 1+t∼0 2t−6 t−3 0 1+t 
4 9−2t 7−t 5+t 10+t 0 6−2t 3−t 3+t 5+t 0 0 0 3+t 6+2t
Per t diverso da −3 e 3 la matrice incompleta, nonché quella completa, associata al sistema
ha rango 3. Per tali valori di t quindi il sistema ammette infinite soluzioni, dipendenti da
un solo parametro libero. Per t = 3 , il sistema è incompatibile. Per t = −3 , le matrici
completa e incompleta hanno entrambe rango 2, quindi il sistema ammette infinite soluzioni,
dipendenti da 2 parametri liberi.
2.11. Si ha dim Wt = 5 − rg (A), quindi calcoliamo il rango della matrice A. A tal
fine consideriamo il determinante del minore costituito dalle ultime 3 colonne (cosı̀ i conti
risultano più semplici), questo vale (t − 5)2 · (t + 11). Segue che per t diverso da 5 e -11
la matrice A ha rango 3, ovvero Wt ha dimensione 2 (=5-3). Sostituendo i valori t = 5
e t = −11 troviamo matrici rispettivamente di rango 1 e rango 2. Quindi, le dimensioni
dei corrispondenti spazi W5 e W−11 valgono dim W5 = 5 − rango(A5 ) = 5 − 1 = 4 ,
dim W−11 = 5 − rango(A−11 ) = 5 − 2 = 3 .
Scegliamo t̃ = 5 . Con questa scelta abbiamo una matrice di rango 1, ovvero un sistema
lineare omogeneo costituito da una sola equazione: il sistema A5 · ~x = ~0 è costituito dalla
sola equazione
 7x1 + 10x2 + 3x3 + 3x4 + x5 = 0 . Risolvendola, troviamo una base di W5 :
      
 −1/7 0 0 0 

 
 0   −1/10   0   0  
       
BW5 =  0  ,  0  ,  −1/3  ,  0  .

        

 0 0 0 −1/3  

1 1 1 1
2.12. Questo esercizio è molto simile al (4.4). Si ha dim Wt = 5 − rg (A) . Calcolando
il determinante del minore di A costituito dalle ultime 3 colonne si trova (t + 1)2 (t + 4) .
Segue che per t diverso da −1 e −4 la matrice A ha rango 3, ovvero Wt ha dimensione 2
(=5-3). Per t = −1 e t = −4 troviamo rispettivamente matrici di rango 1 e rango 2. Quindi
dim W−1 = 5 − rango(A−1 ) = 5 − 1 = 4 , dim W−4 = 5 − rango(A−4 ) = 5 − 2 = 3 .
Una base di W−4 si trova risolvendo il sistema lineare omogeneo (A−4 ) · ~x = ~0 : BW−4 =
{t (0 0 0 −1 1) , t (0 −1 2 0 0) , t (−1 0 1 1 1)} .
2.13. Le soluzioni del sistema corrispondono ai coefficienti delle combinazioni lineari che
esprimono il vettore dei termini noti come combinazione lineare delle colonne della matrice
incompleta, infatti il sistema può essere scritto nella forma
       
t 0 t+3 1
6 t+2  1  1
x· +y· +z·  =  .
1 0 t+2 0
2 0 1 1
D’altro canto il non annullarsi del determinante della matrice completa associata al sistema
(matrice che indicheremo con Ã), esprime l’indipendenza lineare dei quattro vettori cor-
rispondenti alle colonne di Ã, ovvero implica l’incompatibilità del sistema stesso. Calcolando
tale determinante (consiglio lo sviluppo di Laplace rispetto alle seconda colonna) troviamo:
det à = (t + 2) · (t + 2) · (t − 3) . Quindi, per t diverso da −2 e 3 il sistema è incom-
patibile. Studiando separatamente cosa accade per t = −2 e per t = 3 troviamo quanto
segue. Per t = −2 il sistema ammette infinite soluzioni. Per t = 3 il sistema ammette
un’unica soluzione (non servono calcoli: le colonne della matrice incompleta sono chiara-
mente indipendenti, quindi non può esserci più d’una soluzione, d’altro canto già sappiamo
204

che le colonne della matrice completa sono dipendenti).


2.14. Indichiamo con à la matrice completa associata al sistema e indichiamo con A la
matrice incompleta. Effettuando l’E.G. su à si trova
     
3 −2 1 1 3 −2 1 1 3 −2 1 1
à =  3 k − 3 7 4 ∼ 0 k −1 6 3 ∼ 0 k − 1 6 3 .
−9 k + 5 k + 6 2 0 k−1 k+9 5 0 0 k+3 2
Ne segue che per k diverso da 1 e -3 il sistema ammette un’unica soluzione. Sostituendo
i valori k = −3 e k = 1 nella riduzione effettuata, per k = −3 troviamo che il sistema è
incompatibile; per k = 1 (terminando la riduzione a scala di à ) troviamo che il sistema
ammette infinite soluzioni, dipendenti da un parametro libero.
2.15. Si devono calcolare i ranghi delle matrici incompleta à e completa A associate
al sistema. A tal fine consideriamo la sottomatrice M costituita da prima, terza e quarta
colonna. Si ha det M = −2(t + 2)(t + 7) . Ne segue che per t 6= −2, −7 la matrice
incompleta associata al sistema ha rango 3. Anche la matrice completa deve avere rango 3,
quindi il sistema è compatibile e le soluzioni dipendono da 5-3 = 2 parametri liberi.
I casi in cui t = −2 e t = −7 li studiamo separatamente. In entrambi i casi consideriamo
la matrice completa associata al sistema ed effettuiamo una riduzione a scala (che essendoci
sbarazzati di t è immediata).
Per t = −2 troviamo che il rango della matrice incompleta vale 2 mentre il rango della
matrice completa vale 3, quindi il sistema è incompatibile.
Per t = −7 troviamo che il rango della matrice incompleta vale 2, anche il rango della
matrice completa vale 2, quindi il sistema è compatibile e le soluzioni dipendono da 5−2 = 3
parametri liberi.
Nota: un altro approccio possibile è quello di ridurre a scala la matrice completa associata
al sistema. Visto che l’obiettivo è quello di calcolare i ranghi di à ed A è lecito riscrivere
le colonne in un ordine più conveniente (se scambiamo la quarta colonna con la prima tale
riduzione a scala si effettua rapidamente). Naturalmente non dobbiamo dimenticarci che
il sistema associato alla nuova matrice non è equivalente a quello di partenza (a meno di
scambiare anche x1 con x4 ), ma visto che l’esercizio non ci chiede di risolvere il sistema...!
2.16. Riduciamo a scala la matrice completa associata al sistema:
   
1 −1 1 1 1 −1 1 1
 λ 1 −1 0  ∼  0 λ+1 −λ − 1 −λ  .
1 −1 λ λ 0 0 λ−1 λ−1
Da questa riduzione si evince che ci sono tre possibilità:
per λ diverso da 1 e −1 il sistema è compatibile e ammette una unica soluzione. Si ha
  
 x−y+z = 1  x = 1(λ+1)
(λ+1)y − (λ+1)z = −λ , quindi y = 1 (λ+1) ;
 
(λ−1)z = λ−1 z = 1
per λ = 1 il sistema è compatibile, ammette infinite soluzioni dipendenti da un parametro
libero, si ha x = 21 , y = t − 21 , z = t (parametro libero).
Per λ = −1 il sistema è incompatibile (la seconda equazione è l’equazione 0 = 1 ).
2.17. Un sistema lineare è compatibile se e solo se il rango della matrice incompleta è
uguale al rango della matrice completa. Nel nostro caso abbiamo un sistema di 3 equazioni in
2 incognite. I valori per i quali la matrice completa ha rango 3 sono i valori per i quali il suo
determinante non si annulla. Tale determinante vale 2k 3 −18k 2 +48k−40 = 2(k−2)2 ·(k−5).
Quindi, per k 6= 2, 5 , la matrice completa ha rango 3 ed il sistema è incompatibile (il
rango della matrice incompleta non può superare 2).
Per k = 2 il sistema si riduce alla sola equazione x + y = −3 e pertanto si hanno infinite
soluzioni (dipendenti da un parametro libero): x = −3−t, y = t (parametro libero).
Per k = 5 il sistema è compatibile ed ha un’unica soluzione: x = 0, y = 3 .
205

Nota: potremmo non essere in grado di risolvere l’equazione di terzo grado in k data
dall’annullarsi del determinante della matrice completa. Un modo per ovviare a questo
inconveniente consiste nel trovare, in qualche modo, almeno una radice di tale equazione
(cosa che consente di abbassarne il grado): ad esempio potremmo lavorare con l’E.G., oppure
osservare che per k = 2 le prime due colonne sono proporzionali (la matrice incompleta ha
rango 1 e, necessariamente, la matrice completa non può avere rango 3).
2.18. Calcoliamo il determinante della matrice incompleta associata al sistema:
 
7−2k 4−k
det = (7−2k)(k+2) − 3k(4−k) = k 2 − 9k + 14 = (k − 2)(k − 7) .
3k k+2
Quindi, per k diverso da 2 e 7 il sistema ammette un’unica soluzione. Studiamo i casi in cui
k = 2 e k = 7 . Per k = 2 il sistema è compatibile, ammette infinite soluzioni, dipendenti
da un parametro libero (le due equazioni sono proporzionali): x = −2t + 1/3 , y = 3t .
Per k = 7 il sistema è incompatibile.
Infine, per k = 0 la soluzione (che come già sappiamo è unica) è la coppia x = − 73 , y = 1 .
2.19. La matrice incompleta ha rango 2 per t 6= 2, −6 , per tali valori il sistema è
compatibile e le soluzioni dipendono da un parametro libero (anche la matrice completa ha
rango 2). Sia per t = 2 che per t = −6 il sistema è compatibile e le soluzioni dipendono
da due parametri liberi. Per t = 0 si trova x = 1, y = t (parametro libero), z = 1 . Non
esistono valori di t per i quali St è uno spazio vettoriale (il sistema non è omogeneo per
nessun t). L’insieme St , in quanto spazio affine, contiene la retta r se e solo se contiene
i due punti P e Q . Questo accade per ogni t, quindi St ⊇ r , ∀ t. Inoltre, per ragioni
dimensione, l’uguaglianza St = r si ha solo per t 6= 2, −6 .
2.20. La matrice incompleta ha rango 3 per t 6= 2, 3 , per tali valori il sistema è compatibile
ed ammette un’unica soluzione (anche la matrice completa ha rango 3). Sia per t = 2 che
per t = −6 il sistema è incompatibile (la matrice incompleta ha rango 2, quella completa
ha rango 3). Sostituendo ~c al vettore delle incognite si trova che questo risolve il sistema
solo per t = −1. Sia A~x = ~b un sistema lineare del quale ~c e d~ ne sono soluzioni. Risulta
A· λ~c + (1−λ)d) ~ = λA~c + (1−λ)Ad~ = λ~b + (1−λ)~b = ~b . Questo dimostra quanto affermato.
In inciso, il motivo geometrico per il quale le espressioni del tipo λ~c + (1−λ)d~ risolvono
il sistema è il seguente: tali espressioni individuano la retta affine passante per i punti ~c e
d~, d’altro canto essendo lo spazio delle soluzioni di un sistema lineare uno spazio affine, se
contiene due punti contiene anche la retta che li unisce.
3.1 e 3.2. Il determinante della matrice associata ai vettori indicati è diverso da zero
(in tutti i casi), quindi {~v1 , ~v2 , ~v3 } è un insieme indipendente e, per ragioni di dimensione,
costituisce una base di R3 . Le coordinate di w ~ sono, per definizione, i coefficienti α, β, γ
che soddisfano la relazione α~v1 +β~v2 +γ~v3 = w ~ . Risulta: 5.1) α = 1, β = −1/2, γ = 9/2 ;
5.2 a) α = 1, β = 2, γ = 1 ; 5.2 b) α = 17 −5 29
9 , β = 9 , γ = 9 ; 5.2 c) α = 3, β = 1, γ = −2 .

3.4. In entrambi i casi, lo spazio V generato dai 5 vettori indicati ha dimensione 2


(riducendo a scala la matrice associata si trovano 2 pivot), cioè è un piano. D’altro canto
gli spazi in questione hanno almeno dimensione 2 (i vettori che li generano non sono pro-
porzionali), quindi sono uguali a V (in quanto contenuti in esso), in particolare sono uguali.
3.10. In entrambi i casi denotiamo con w ~ 1, w
~ 2, w
~ 3 i tre generatori di W .
a) Riducendo a scala la matrice associata ai vettori indicati si trova che lo spazio W
ha dimensione 2. Le equazioni cartesiane si determinano “eliminando  i parametri” dalle
x + z − 4w = 0
equazioni parametriche (deducibili dai generatori), si trova: .
y − 3w = 0
Il vettore ~vt appartiene a W se soddisfa tali equazioni, cioè accade se e solo se t = 2 .
Scegliendo l’insieme B = {~vt=2 , w ~ 1 } come base di W , le coordinate di ~vt=2 rispetto alla
base B sono 1, 0 (non ci sono conti da fare). Nota. Sarebbe stato ugualmente corretto
scegliere la base B = {w ~ 2 } , ma in questo caso per trovare le coordinate di ~vt=2
~ 1, w
avremmo dovuto risolvere il sistema lineare α w ~1 + β w~ 2 = ~vt=2 (ottenendo α = 1, β = 2).
206

b) dim W = 3; equazioni cartesiane: x + z = 0 ; ~vt ∈ U se e solo se t = 6 ; coordinate di


~v6 rispetto B = {~vt=6 , w ~ 2 }: 1, 0, 0 (mentre le coordinate di ~v6 rispetto alla base
~ 1, w
costituita dai tre generatori indicati nel testo sono 1, −2, 3 ).
3.11. Nei casi e), g), h), i) uno dei due spazi viene dato in forma cartesiana, risolvendo le
corrispondenti equazioni si trovano rispettivamente le basi indicate:
           
20 16 1 1 0 1 1 −1
−5  5  −1 −1 −1  0   0  −1
BU = { ,  }, BW = { ,  }, BU = { ,  }, BU = { ,  }.
4 0 1 0 0 −1 1 0
0 4 0 1 3 0 0 1
Nella tabella che segue i vettori ~u1 , ~u2 , ..., w
~ 1, w
~ 2 , ... denotano i generatori di U e W
indicati nel testo ovvero i generatori indicati sopra (sempre nell’ordine in cui compaiono).
dimensioni di basi
z }| { z }| {
U W (U +W ) (U ∩ W ) BU∩W BU+W “relazioni”

a) 2 2 3 1 {w
~ 1} ogni base di R3 U +W = R3

b) 2 2 3 1 {−2~u1 +7~u2 } {~u1 , ~u2 , w


~ 1}

 t 6= 3, 9 3 2 3 2 W ⊆U
c) t=3 2 1 2 1 W ⊆U

t=9 2 2 2 2 U =W
d) 2 2 3 1 {~u1 −~u2 } {~u1 , ~u2 , w
~ 1}

k 6= 4 2 2 4 0 ogni base di R4 U +W = R4
e)
k=4 2 2 3 1 {3w
~ 1 −2w
~ 2 } {~u1 , ~u2 , w
~ 1} .

 k 6= 4, 7 2 2 4 0 . ogni base di R4 U +W = R4
f) k=4 2 2 3 1 {2w~1 −w ~ 2} {~u1 , ~u2 , w
~ 1} .

k=7 2 1 3 0 . {~u1 , ~u2 , w
~ 1} .
g) 2 2 3 1 {2w~1 −w ~ 2} {~u1 , ~u2 , w
~ 1}

 t 6= 3, 5 2 2 4 0 . ogni base di R4 U +W = R4
h) t=3 2 1 3 0 . {~u1 , ~u2 , w
~ 1} .

t=5 2 2 3 1 {w~ 1 +2w~ 2} {~u1 , ~u2 , w
~ 1} .
i) 2 2 3 1 {~2u1 +~u2 } {~u1 , ~u2 , w
~ 1}

 k 6= 3, −2 3 2 4 1 {w~ 1 +2w~ 2 } ogni base di R4 U +W = R4
l) k=3 3 2 3 2 . . W ⊆U

k = −2 3 1 4 0 . ogni base di R4 .

 t 6= 3, −3 2 2 3 1 {w~ 1 −2w~ 2} . .
m) t=3 2 1 3 0 . . .

t = −3 2 2 2 2 . . U =W
         
2 −5 −5 2 1
3.19. Poniamo ~u1 =  5 , ~u2 =  7 , w ~ 1 =  −7 , w ~ 2 =  5 , ~e1 =  0 .
−7 −41 9 −8 0
Il vettore ~e1 non appartiene né a U né a W , infatti i vettori ~e1 , ~u1 , ~u2 sono indipendenti,
come pure i vettori ~e1 , w
~ 1, w
~ 2 . Risolvendo il sistema x1 ~u1 + x2 ~u2 = y1 w ~ 1 + y2 w
~ 2 si trova
y1 = 8t , y2 = t (t parametro libero).  
 8 w~ 1  1
Ne segue che BU∩W = 11 ( 8 + w2 ) =  3  è una base dell’intersezione U ∩ W .
−5
Poiché U ∩ W ha dimensione 1, lo spazio somma U + W ha dimensione 3, quindi è uguale
ad R3 . Ne segue che ogni terna di vettori indipendenti è una base di U + W (in particolare,
la base canonica di R3 è una base di U + W ).
Infine, poiché U + W = R3 , non esiste nessun vettore ~k che soddisfa le proprietà richieste.
3.20. Indichiamo con ~v1 , ~v2 , ~v3 , ~v4 , ~v5 i cinque vettori che definiscono lo spazio W .
207

I primi due sono proporzionali tra loro (infatti ~v2 = 3~v1 ), il terzo e il quarto sono anch’essi

proporzionali tra loro (~v4 = −2~v3 ) e ~v5 = ~v2 + ~v3 . Ne segue che l’insieme ~v1 , ~v3
costituisce una base di W (i vettori ~v1 , ~v3 non sono proporzionali, quindi sono indipen-
denti), in particolare W ha dimensione 2. Questo risultato si può ottenere anche tramite
l’eliminazione di Gauss: effettuando la riduzione a scala sulla matrice associata ai vettori
dati troviamo i pivot su prima e terza colonna.
Risolvendo il sistema λ~v1 + µ~v3 = ~v si trova λ = 7 , µ = −2 . Questi valori sono le
coordinate di ~v rispetto alla base indicata.
3.21. Indichiamo i vettori dati (nell’ordine) con ~u1 , ~u2 , ~u3 , w
~ 1, w
~ 1 ed effettuiamo la
riduzione a scala della matrice associata:
     
1 3 3 5 −8 1 3 3 5 −8 1 3 3 5 −8
 0 t−5 0 0 0   0 t−5 0 0 0   0 t−5 0 0 0 
 ∼ ∼ 
1 3 t−4 5 6−2t 0 0 t−7 0 14−2t 0 0 t−7 0 14−2t
2 6 t−1 10 −2−2t 0 0 t−7 0 14−2t 0 0 0 0 0
Tenendo presente che le prime tre colonne corrispondono ai generatori di U e le ultime
due ai generatori di W troviamo che per t diverso da 5 e 7, U ha dimensione 3, W ha
dimensione 2 ed è contenuto in U , quindi dimU + W = 3 , dim U ∩ W = 2 (in particolare,
per t 6= 5, 7, non rientriamo nei casi a, b, c).
Per t = 5 , si ha U = W , quindi U = W = U + W = U ∩ W , (e la dimensione è 2, siamo
nei casi a e c); una base di U + W è BU+W = {~u1 , ~u3 } .
Per t = 7 , U ha dimensione 2, W ha dimensione 1. Inoltre, W ⊆ U , quindi U ∩W = W
ha dimensione 1 e U + W = U ha dimensione 2 (siamo nei casi b e c). Una base di
U + W è BU+W = {~u1 , ~u2 } .
Per t = 0 si ha W ⊆ U , quindi non esistono vettori ~v che soddisfano le condizioni
~v ∈ U + W e ~v 6∈ U ∪ W .
3.22. Lo spazio U ha dimensione 2 (indipendentemente da k). Effettuando l’eliminazione
di Gauss sulla matrice associata ai vettori w ~1 , w
~2 , w
~ 3 si trova che lo spazio W ha dimen-
sione 2 ed è generato dai vettori w ~1 e w~ 2 (d’ora in poi possiamo ignorare completamente
w~ 3 ).
Vista la formula di Grassmann, si ha dim (U ∩ W ) = 2 + 2 − dim(U + W ) = 4 − rango(A),
dove A denota la matrice associata ai vettori w ~ 1, w
~ 2 , ~u1 , ~u2 . Effettuando l’eliminazione
di Gauss sulla matrice A si trova
       
3 1 2 4 3 1 2 4 3 1 2 4 3 1 2 4
0 2 4 3  0 2 4 3  0 2 4 3  0 2 4 3 
 ∼ ∼ ∼ 
3 3 5 5 0 2 3 1 0 0 −1 −2 0 0 −1 −2
6 4 7 k+4 0 2 3 k−4 0 0 −1 k−7 0 0 0 k−5
Quindi: dim (U ∩ W ) = 0, per k 6= 5 ; dim (U ∩ W ) = 1, per k = 5 (infatti, in questo
caso, A ha rango 3).
Per k = 5 , si deve determinare una base dell’intersezione, a tal fine si deve risolvere il sistema
x1 w ~ 1 + x2 w
~ 2 = y1 ~u1 + y2 ~u2 . Questo sistema lo abbiamo già risolto: dall’eliminazione di
Gauss appena effettuata si ottiene l’equazione −y1 − 2y2 = 0 (corrispondente alla 3a riga
dell’ultima matrice dell’E.G.). Ne segue y2 = t, y1 = −2t , quindi che il vettore 2u1 − u2
(di coordinate 0, 5, 5, 5) costituisce una base dell’intersezione U ∩ W .
Certamente, sempre per k = 5 , esiste un vettore che non appartiene allo spazio somma
(che avendo dimensione 3 non esaurisce tutto R4 ). Un vettore ~v 6∈ U + W è il vettore
~v = ~e4 (quarto vettore della base canonica). La scelta è caduta su ~e4 perché, aggiungendo
~e1 come 5a colonna nell’E.G. effettuata sulla matrice A, è evidente che questo vettore non
è combinazione lineare dei generatori di U + W (tutto questo sempre per k = 5); volendo
scegliere un vettore diverso dovremmo verificare che non appartiene allo spazio somma.

x−y−z = 0
3.23. Risolvendo il sistema troviamo una rappresentazione
x − 2y + z + w = 0
208

parametrica dello spazio U (quindi una sua base BU ):


         
 3z + w 3 1
 3 1
 2z + w    2 1
     1 
2
U =   = z   + w  z, w parametri liberi ; BU =  ,   .
z 1 0 1 0

w 0 1 0 1
I due vettori indicati li chiamiamo ~u1 e ~u2 .
Indichiamo con w ~ 1, w~ 2, w~ 3 i tre generatori di W . Applicando l’algoritmo di estrazione di
una base, il secondo vettore è il doppio del primo e pertanto lo eliminiamo, mentre il terzo
lo teniamo perché non è un multiplo del primo. Quindi, una base di W è BW = {w ~ 3} .
~ 1, w
Lo spazio U + W è generato dai vettori ~u1 , ~u2 , w ~ 1, w
~ 3 , Una base di U + W si trova
applicando a questi vettori l’algoritmo di estrazione di una base, l’intersezione U ∩ W si
determina risolvendo il sistema lineare x1 ~u1 + x2 ~u2 = y1 w ~ 1 + y2 w~2 .
Effettuando la riduzione a scala della matrice M associata ai vettori in questione si trova
che i pivot cadono sulla prima seconda e terza colonna, i primi tre vettori sono indipendenti
e il quarto è una loro combinazione lineare. Inoltre, per quel che riguarda il sistema lineare
x1 ~u1 + x2 ~u2 = y1 w ~ 1 + y2 w ~ 3 , dall’ultima equazione associata alla riduzione a scala di M
si trova 0 = y1 + 2y2 , ovvero y1 = −2y2 , con y2 parametro libero (le altre equazioni ci
danno le “x” e non ci interessano: non serve risolvere completamente il sistema considerato,
basta determinare le “y”. Ne segue che per quel che riguarda U ∩ W e U + W abbiamo:
 
U ∩ W = − 2y2 w ~ 1 + y2 w ~ 2 y2 ∈ R = y2 (−2w ~1 + w~ 2 ) y2 ∈ R ,
       
 −2  

3 1 0 

  −1  2
    4 1
BU∩W = − 2w ~1 + w ~2 =   ; BU+W =  ,  ,   .
−1  1
 0 1  
1 0 1 1
3.24. Raccogliamo i vettori che definiscono Wt e il vettore ~v in una matrice che indichiamo
con M . Effettuando l’eliminazione di Gauss su questa matrice si trova
     
1 t 2 1 3 1 t 2 1 3 1 t 2 1 3
 1 t+2 5 8 1  0 2 3 7 −2   0 2 3 7 −2 
 ∼ ∼ 
−2 −2t −4 1 −5 0 0 0 3 1 0 0 0 3 1
−1 −t+4 4 t+11 −10 0 4 6 t+12 −7 0 0 0 0 t+7
Quindi, ~v ∈ Wt0 se e solo se t = −7 . Posto t0 = −7 , i pivot della riduzione di M si
trovano su prima, seconda e quarta colonna, i corrispondenti vettori costituiscono una base
     
1 −7 1
 1   −5   8 
di Wt0 : BWt0 =  ,  ,   .
−2 14 1
−1 11 4
Le coordinate di ~v rispetto a B si ottengono risolvendo il sistema lineare α~b1 +β~b2 +γ~b3 = ~v
(che risolviamo utilizzando la riduzione a scala effettuata, ovviamente ignorando la terza
colonna e sostituendo t con -7). Si trova α = − 25 13
2 , β = − 6 , γ = 3.
1

Nota. Per t = −7 , dalla matrice trovata effettuando la riduzione a scala si evince che
lo spazio Wt0 =−7 ha dimensione 3 e che i vettori corrispondenti a prima, seconda e quinta
colonna sono indipendenti, quindi formano una base di Wt0 =−7 . Le coordinate di ~v rispetto
a tale base sono 0, 0, 1 (questo proprio in virtù del fatto che tra i vettori di tale base c’è
~v ) ...scegliendo questa base si evita qualsiasi calcolo!
3.25. Innanzi tutto osserviamo che lo spazio Ut ha dimensione 3 per t 6= 4 ed ha
dimensione 2 per t = 4 . Infatti, i primi due vettori sono proporzionali se e solo se t − 2 =
2 (cioè t = 4), il terzo vettore non è mai combinazione lineare dei primi due. Inoltre,
chiaramente W ha dimensione 2.
La dimensione dello spazio somma Ut + W è uguale al rango della matrice A associata ai
vettori forniti nel testo (che denoteremo con ~u1 , ~u2 , ~u3 , w
~ 1, w
~ 2 ):
209

 
0 0 1 0 1
 0 0 t + 11 0 4 
dim (Ut + W ) = rango   . Il determinante della sottomatrice
1 1 0 0 0
t−2 2 0 1 1 
costituita dalle ultime 4 colonne vale −1 · 1 · 4 − (t + 11) e si annulla se e solo se t = −7 .
Quindi, per t 6= −7 la matrice A ha rango 4. Inoltre, per t = −7 la matrice A ha
rango 3 (le prime due righe sono uguali). Inserendo le informazioni trovate nella formula
di Grassmann otteniamo 
  2+2−4 = 0 per t = 4
dim Ut ∩ W = 3+2−3 = 2 per t = −7

3+2−4 = 1 per t 6= 4, −7
Scegliamo un valore τ per il quale Uτ ∩W ha dimensione 1, ad esempio τ = 0 (un qualsiasi
valore diverso da 4 e -7 va bene). Non serve fare calcoli: il vettore w ~ 1 è chiaramente
combinazione lineare dei vettori ~u1 , ~u2 . Quindi, B = {w ~ 1 } è una base di Uτ =0 ∩ W .
Per completare la base di Uτ ∩W trovata precedentemente a una base di Uτ si deve scegliere
una base di Uτ =0 contenente il vettore w ~ 1 . Ad esempio, BUτ =0 = {w ~ 1 , ~u1 , ~u3 } (scartiamo
~u2 perché w~ 1 , ~u1 , ~u2 sono chiaramente dipendenti).
3.26. Per trovare una base di U si deve risolvere l’equazione x + y − 2z + w = 0 . Si
trova:      
−1 2 −1
 0  0  1 
BU = { ,  ,  } .
0 1 0
1 0 0
Per avere l’inclusione Wt ⊆ U è sufficiente che i vettori w ~1 e w
~ 2 appartengano a U , ovvero
che soddisfino l’equazione x + y − 2z + w = 0. Sostituendo le coordinate di w ~1 e w ~2
nell’equazione indicata troviamo 1 + t − 2 · 0 − 4 = 0 e t − 2 − 2 · 1 + 1 = 0 , quindi t = 3 .
L’intersezione non può avere dimensione 0 (questa affermazione può essere giustificata in vari
modi: per la formula di Grassmann, se l’intersezione avesse dimensione 0, lo spazio somma
avrebbe dimensione 3+2=5, cosa che è impossibile perché l’ambiente è R4 ; lo spazio Wt
ha dimensione 2, imponendo una sola condizione, l’equazione che definisce U , la dimensione
non può scendere più di uno). D’altro canto, l’intersezione ha dimensione 2 se e solo se vale
l’inclusione Wt ⊆ U . Per quanto osservato, ciò accade se e solo se t = 3 . Ne segue che
dim U ∩ Wt = 1 per ogni t 6= 3 .
Scegliamo un valore t (diverso da 3), ad esempio t = 0 , e determiniamo una base dell’intersezione
     
1 0 α
 0   −2   −2β 
U ∩W0 . I vettori di W0 sono i vettori del tipo α  + β  =  , dove
0 1 β
−4 1 −4α + β
α e β sono parametri liberi. Sostituendo le coordinate trovate nell’equazione che definisce
U troviamo α − 2β − 2β + (−4α + β) = 0 , quindi β = −α . Pertanto,
   
α 1
 2α   2 
U ∩ W0 =   α parametro libero , una base di U ∩ W0 è BU∩W0 =  .
−α −1
−5α −5
Per completare la base di U ∩ W0 appena trovata a una base di U si deve prendere il
vettore trovato e altri due vettori di U (in modo tale da avere comunque una terna in-
     
1 −1 2
 2   0  0
dipendente di vettori): BU = { ,  ,  } (l’indipendenza di questi tre
−1 0 1
−5 1 0
vettori è evidente: il primo è l’unico ad avere la seconda coordinata non nulla, quindi non è
combinazione lineare di secondo e terzo, inoltre il secondo e terzo non sono proporzionali).
3.27. Risolvendo il sistema che definisce U troviamo: w = 5x + 3y, z = 6x + 2y (con
210
    
 1 0 
 
0 1
x, y parametri liberi); BU = ~u1 =  , ~u2 =   (una base di U ). Sostituendo

 6 2  
5 3
le coordinate di w
~ t nelle equazioni che definiscono U troviamo che queste sono soddisfatte

per t = −3 . Una base di U contenente il vettore w ~ τ =−3 è la base BU = {w~ τ =−3 , ~u1 }
(naturalmente abbiamo ampia possibilità di scelta).
3.28. Lo spazio U è costituito dai vettori del tipo r~u1 + s~u2 , dove r ed s sono parametri
liberi. Lo spazio W è il nucleo
 della matrice indicata nel testo, ovvero è lo spazio definito
x − 6y + z − 2w = 0
dalle equazioni cartesiane .
−3x + 3y − 3z + w = 0
L’intersezione U ∩ W è costituita dai vettori di U che soddisfano le equazioni cartesiane di
W . Sostituendo l’espressione r~u1 + s~u2 nelle equazioni cartesiane di W troviamo
 
(r + 5s) − 6(−r + 5s) + (2r − 2s) − 2(9r − 9s) = 0 −9r − 9s = 0
, ovvero ,
−3(r + 5s) + 3(−r + 5s) − 3(2r − 2s) + (9r − 9s) = 0 −3r − 3s = 0
quindi, s = −r . Ne segue che i vettori dell’intersezione sono i vettori del tipo r~u1 − r~u2 .
Pertanto, il vettore ~b := ~u1 − ~u2 costituisce una base dell’intersezione U ∩ W .
Sostituendo le coordinate del vettore ~vt nelle equazioni cartesiane di W troviamo “0 = 0”,
un’identità verificata per ogni valore di t . Ne segue che ~vt ∈ W per ogni t .
Inoltre, ~vt ∈ U ∩ W se e solo se è proporzionale a ~b, questo accade se e solo se t = 3 .
Gli spazi vettoriali U e W sono due piani che si incontrano lungo una retta, in particolare
lo spazio somma ha dimensione 3 (formula di Grassmann). Ne segue che per completare la
base di U ∩ W trovata precedentemente a una base di U + W dobbiamo considerare ~b
e altri due vettori, uno in U e uno in W , non proporzionali a ~b . Ad esempio possiamo
considerare BU+W = {~b, ~u1 , ~vt=0 } (naturalmente sono possibili molte altre scelte).
3.29. La dimensione di Vλ vale 2 per ogni λ . Infatti, ad esempio, il minore costituito da
prima e terza riga della matrice associata ai generatori di Vλ indicati nel testo è invertibile
per ogni λ (se preferite, basta osservare che il primo vettore è sempre non nullo e che il
secondo vettore non può mai essere un multiplo del primo). Visto che le due equazioni che
definiscono W sono indipendenti, lo spazio W ha dimensione 2 (= 4 − 2). Troviamo due
generatori di W risolvendo il sistema lineare che lo definisce, mettendo insieme i generatori
di Vλ e quelli di W abbiamo un insieme di generatori per lo spazio somma:
           
2 −1 2 −1 2 2−λ
2  2   2   2  λ+1  2 
W = Span { ,  }, Vλ + W = Span{ ,  ,  ,  }.
0 3 0 3 0 3
3 0 3 0 λ λ−3
Il determinante della matrice A associata ai quattro generatori dello spazio somma vale
det A = −9λ2 + 24λ + 9 = −9(λ + 13 )(λ − 3) . Ne segue che per λ diverso da − 13 e
3 tali generatori sono indipendenti, quindi lo spazio somma ha dimensione 4, e pertanto
coincide con R4 . Le equazioni x = t1 , y = t2 , z = t3 , w = t4 sono equazioni parametriche
per lo spazio Vλ + W = R4 .
Per λ = − 31 e per λ = 3 risulta dim(Vλ + W ) = 3 (ha dimensione minore o uguale
a 3 per l’annullarsi del determinante calcolato precedentemente, d’altro canto è evidente
che i primi tre generatori sono indipendenti: primo e terzo non sono proporzionali ed il
secondo non può essere una loro combinazione lineare perché è l’unico ad avere la terza
coordinata non nulla). In entrambi i casi le equazioni parametriche sono (le scriviamo in
forma compatta): ~x = t1~g1 + t2~g2 + t3~g3 , essendo g1 , g2 , g3 i tre generatori in questione.
Infine, per la formula di Grassmann, si ha

2 + 2 − 4 = 0 se λ 6= − 1/3 , 3
dim(Vλ ∩ W ) = .
2 + 2 − 3 = 1 se λ = − 1/3 oppure λ = 3
In definitiva, risulta Vλ ∩ W = {~0} per λ 6= − 1 , 3 .
3
211

3.30. Risolvendo il sistema lineare che definisce U troviamo le relazioni x = r, y = s,


z = 3r+s, w = −s. Da queste otteniamo la base di U che segue:
     
 1 0  1 0 t −1
0  1   0 1 1 −1 
BU = ~u1 =  , ~u2 =   . Consideriamo la matrice A =  
3 1 3 1 0 3
0 −1 0 −1 0 0
associata ai vettori ~u1 , ~u2 , w
~ 1, w
~ 1 . Le prime tre colonne sono palesemente indipendenti
(per ogni valore di t), quindi rangoA ≥ 3 , d’altro canto risulta detA = 3t − 6 (non nullo
per t 6= 2), quindi si ha rangoA = 4 per t 6= 2 e rangoA = 3 per t = 2 . In definitiva:
per t 6= 2 si ha dim (U + Wt ) = 4 ; per t = 2 si ha dim(U + Wt ) = 3 .
Per la formula di Grassmann, poiché dimWt = 2 per ogni t, risulta:
 
dim U ∩ Wt = 1 ⇐⇒ dim U + Wt = 3 ⇐⇒ t = 2.
Quindi, per rispondere alla domanda “c)” si deve scegliere t′ = 2 . I vettori dell’intersezione
si trovano imponendo la relazione α1 ~u1 + α2 ~u2 = β1 w ~ 1 + β2 w
~ 2 . Questo sistema si risolve
facilmente, comunque non c’è bisogno di risolverlo: l’ultima equazione è l’equazione α2 = 0
e pertanto α1 può essere usato come parametro libero (sappiamo a priori che l’intersezione
ha dimensione 1, quindi che la coppia α1 , α2 non può essere nulla). Ne segue che il vettore
~u1 genera l’intersezione, quindi BU∩Wt = {~u1 } . La base BU = ~u1 , ~u2 è già un
completamento della base BU∩Wt = {~u1 } trovata precedentemente.
3.31. Per studiare la dimensione di Wk calcoliamo il determinante d della matrice associata
ai generatori di Wk . Si ha d = (k + 3) · (2k − 4) , quindi dim Wk = 3 per k 6= −3, 2 .
Questo significa che per k diverso da −3 e 2 risulta Wk = R3 nonché U ∩ Wk = U , in
particolare dim U ∩ Wk = 2 .
Per k = −3 e per k = 2 si ha dimWk ≤ 2 . D’altro canto i generatori indicati nel testo non
sono proporzionali (ad uno stesso vettore), quindi, in entrambi i casi Wk è un piano (ha
dimensione 2). Anche U è un piano (diverso sia da W−3 che da W2 , in entrambi i casi lo
spazio somma è tutto R3 ), quindi l’intersezione ha dimensione 1.
Scegliamo k = −3. L’intersezione U ∩ W−3 si determina tramite sistema lineare x1 ~u1 +
x2 ~u1 = y1 w ~ 1 + y2 w
~ 2 (essendo gli ~ui ed i w
~ 1 i generatori di U e W−3 ) Riducendo a scala la
matrice associata a questo sistema troviamo x1 = 21 t , x2 = − 21 t , y1 = −2t , y2 = t (con t
parametro libero). Pertanto, U ∩ W−3 = {−2tw ~ 2 }t∈R è quindi generato dal vettore
~ 1 + tw
−2w ~ 2 , di coordinate −1, 1, 4 (che ne costituisce una base dell’intersezione).
~1 +w
3.32. In forma parametrica, U è lo spazio di equazioni ~u = s1 ~u1 + s2 ~u2 . Eliminando i
parametri s1 e s2 si trova l’equazione cartesiana x+2 y−3 z = 0. Sostituendo le coordinate
di ~vk nell’equazione cartesiana di U si trova (k + 4) + 2 · (−3) − 3 (k − 4) = 0, quindi

~vk0 ∈ U per k0 = 5 . Per determinare le coordinate di ~vk0 rispetto alla base ~u1 , ~u2 si
deve risolvere il sistema α~u1 + β~u2 = ~vk0 . Risolvendolo si trova α = 2, β = −1 .
3.33. Lo spazio Wk è lo spazio di equazione x1 + 2x2 + kx3 + 3x4 = 0 (dove
x1 , x2 , x3 , x4 denotano le coordinate di R4 ). Una base di Wk=0 la troviamo risolvendo
     
−2 0 −3
  1   0   0 
l’equazione x1 + 2x2 + 3x4 = 0 : si ha BWk=0 =  ,  ,   .
0 1 0
0 0 1
Indichiamo con ~u1 , ~u2 i vettori forniti nel testo (costituiscono una base di U ) e indichiamo
con w ~ 1, w
~ 2, w~ 3 i vettori della base di Wk=0 appena trovata. Un modo per determinare
l’intersezione U ∩ Wk=0 consiste nel risolvere il sistema lineare α1 ~u1 + α2 ~u2 = β1 w ~1 +
β2 w~ 2 + β3 w~ 3 . Un altro metodo, quello che ora utilizzeremo, consiste nel cercare i vettori
di U , cioè i vettori del tipo α1 ~u1 + α2~u2 , che soddisfano l’equazione x1 + 2x2 + 3x4 = 0 .
Sostituendo si ottiene (2α1 +3α2 )+2·(−α1)+3·(−α1 −2α2 ) = 0 , ovvero −3α1 −3α2 = 0 ,
quindi α1 = −t , α2 = t (essendo t un parametro libero). Questo significa che l’intersezione
U ∩ Wk=0 è l’insieme dei vettori del tipo −t~u1 + t~u2 = t(−~u1 +~u2 ), quindi che il vettore
212

−~u1 +~u2 , vettore di coordinate 1, 1, 0, −1, ne costituisce una base.


Per rispondere alla domanda b) possiamo procedere in molti modi, credo che il più rapido
sia quello che segue. Visto che dim U = 2 e dim Wk = 3 (e l’ambiente è R4 ), per la formula
di Grassmann ci sono solo due possibilità: o si intersecano in una retta oppure Wk contiene
U . Sostituendo le coordinate di ~u1 e ~u2 nell’equazione x1 + 2x2 + kx3 + 3x4 = 0 si trova
rispettivamente 2 + 2 · (−1) + k · 1 + 3 · (−1) = 0 e 3 + k + 3 · (−2) = 0 . Da entrambe le
equazioni si trova k = 3 . Quindi Wk ⊇ U per k = 3 (è un ”se e solo se”), in questo caso
l’intersezione ha dimensione 2. Per k 6= 3 l’intersezione è una retta (ha dimensione 1).
Si poteva procedere anche nel seguente modo: sostituendo le coordinate di α~u1 + β~u2
(generico vettore di U ) nell’equazione x1 + 2x2 + kx3 + 3x4 = 0 si trova k · (α + β) =
3 · (α + β). Le soluzioni di questo sistema (sistema in α e β), per k 6= 3 dipendono da
un parametro libero (⇒ dim U ∩ Wk = 1) e, per k = 3 dipendono da 2 parametri liberi
(⇒ dim U ∩ Wk = 2).
3.34. Riducendo a scala la matrice associata ai generatori dello spazio U dati nel testo
(che, nell’ordine, indichiamo con ~u1 , ~u2 , ~u3 si trova la relazione ~u3 = ~u1 + 2~u2 (mentre
~u1 e ~u2 sono indipendenti). Quindi, le relazioni
      
x 1 0  x = α

y 0 0 y = 0
  = α  + β   , ovvero le relazioni ,
z 1 0 z = α

w 0 1 w = β
sono equazioni parametriche
 per lo spazio U . Eliminando i parametri α e β si trovano le
x−z = 0 x+kz = 0
equazioni cartesiane . Lo spazio Wk ha equazioni cartesiane
y = 0 w = 0
(la terza riga della matrice indicata nel testo è la somma delle due righe che la precedono,
per questo motivo abbiamo omesso di scrivere la corrispondente equazione).

Un sistema di equazioni cartesiane per l’intersezione U ∩Wk (indi-  x−z = 0

cato a lato) lo troviamo mettendo a sistema le equazioni cartesiane y = 0
di U con quelle di Wk . 
 x + kz = 0
w = 0
Si evince chiaramente che ci sono due possibilità:
k = −1 . In questo caso il sistema si riduce a tre equazioni indipendenti (prima e terza
equazione coincidono), pertanto dimU ∩ Wk = 4 − 3 = 1 .
k 6= −1 . In questo caso abbiamo 4 equazioni indipendenti, quindi dim U ∩ Wk = 0 .
Il caso in cui k = 0 rientra nell’ultimo considerato, l’unico vettore appartenente all’intersezione
U ∩ Wk è il vettore nullo (non c’è nessuna base da scrivere).
3.35. Poiché, per definizione, W = Span{w ~ 2 } , l’insieme {w
~ 1, w ~ 2 } genera W . Resta
~ 1, w
da verificare che questo è un insieme indipendente di vettori. Sostituendo le espressioni che
definiscono w ~1 e w~ 2 nella relazione αw ~ 2 = ~0 si ottiene α(3~v1 −2~v2 )+β(~v1 +~v2 ) = ~0 ,
~ 1 +β w
ossia si ottiene (3α + β)~v1 + (−2α + β)~v2 = ~0 . D’altro canto i vettori ~v1 e ~v2 sono
indipendenti, quindi si deve avere 3α + β = 0, −2α + β = 0 , ossia α = β = 0 . Questo
dimostra che l’unica combinazione lineare di w ~1 e w~ 2 che dà i vettore nullo è la combinazione
di coefficienti nulli, quindi che w ~1 e w
~ 2 sono indipendenti.
Per rispondere alla domanda b) risolviamo il sistema αw ~ 1 + βw
~ 2 = ~v1:
3α + β = 1
α(3~v1 −2~v2 )+β(~v1 +~v2 ) = ~v1 ⇒ (3α+β)~v1 + (−2α+β)~v2 = ~v1 ⇒ ⇒
−2α + β = 0
α = 51 , β = 25 . Questi valori sono le coordinate di ~v1 rispetto alla base {w ~ 2 } di W .
~ 1, w
Inciso. È possibile rispondere alla domanda a) osservando che sia ~v1 che ~v2 è combi-
nazione lineare dei vettori w
~1 e w
~ 2 , quindi W ha almeno dimensione 2, quindi w
~1 e w~2
non possono essere dipendenti.
3.36. a) Per c 6= 0 , l’insieme W non contiene il polinomio nullo, quindi non può essere
un sottospazio vettoriale di V .
213

Per c = 0 , dati due polinomi p(x), q(x) e due costanti α, β , si ha (αp + βq)(0) =
αp(0) + βq(0) = 0 , pertanto, in questo caso, W è un sottospazio vettoriale di V .
b) Il sistema lineare che definisce W non è un sistema lineare omogeneo (il secondo termine
noto è 1), quindi, W non è un sottospazio vettoriale di V (∀ c).
3.37. a) Poiché una combinazione lineare di polinomi che si annullano in c si annulla
anch’essa in c, W è un sottospazio vettoriale di V per ogni c.
b) W è un sottospazio vettoriale di V se e solo se il sistema (lineare) che lo definisce è
omogeneo, ciò accade se e solo se c = 0 .
3.38. a) I vettori w~ 1, w
~ 2 generano il loro Span, proviamo che sono indipendenti:
λw ~ 2 = 0 =⇒ (−2λ − 2µ)~v1 + 3λ~v2 + 5µ~v3 = 0 =⇒ λ = µ = 0 (essendo i ~vi
~ 1 + µw
indipendenti). L’insieme B2 = {w ~ 2 , ~v1 , ~v4 } è un possibile completamento.
~ 1, w
b) Coordinate: 0, −1, 0, 1 .
4.2. C’è una corrispondenza biunivoca tra matrici A ∈ Mn, m (R) e applicazioni lineari
L : Rn → Rm (cfr § 12). Data un’applicazione lineare L , se consideriamo la matrice
associata A nonché il sistema lineare A·~x = ~0 abbiamo:
dim“dominio” = “# incognite”; dimker LA = # p.l. ; dim ImLA = rangoA
Queste uguaglianze riducono la formula (⋆) alla formula concernete i sistemi lineari (10.25′ ).
4.4. Risulta: dim Im L = 3, dimker L = 8−3 = 5.
4.5. Risulta dimker L ≥ 9−4 = 5 . Quindi: dim (kerL∩W ) = dim kerL+7−9 ≥ 5−2 = 3 .
 2 
~ t −t−6
4.14. Cerchiamo i valori di t per i quali risulta At ·~vt = 0 . Si ha At ·~vt = ,
t2 − t − 6
quindi ~vt ∈ ker At se e solo se t = −2 oppure t = 3 .
Scegliamo uno dei due valori, ad esempio t = −2 . Il nucleo di A−2 è lo spazio delle soluzioni
del sistema lineare At · ~x = ~0 (dove per abuso di notazione, denotiamo con At anche la
matrice che rappresenta “l’applicazione lineare At ”), risolvendolo si trova
       
x 15r + 17s 15 17
 y   7r + 6s   7   6 
 =  (r, s sono parametri liberi), quindi Bker A−2 = { ,  }.
z −r −1 0
w −2s 0 −2
L’immagine di A−2 ha dimensione 2 (= 4−2), ovvero A−2 è suriettiva. Quindi, qualsiasi
base di R2 (ad esempio, anche la base canonica) è una base di ImA−2 .
     
−2 4 −1
4.19. Poniamo ~u =  2  , ~v =  −3  , w ~ =  4  . Poiché L(~u) = L(~v ) , si
−1 2 −3
ha L(~u − ~v ) = L(~u) − L(~v ) = ~0 . Ne segue che ~u − ~v ∈ kerL . Analogamente, poiché
L(~v ) = −3L(w) ~ , si ha ~v + 3w ~ ∈ kerL .    
 −6 1 
Quindi, ker L ⊇ Span{~u − ~v , ~v + 3w} ~ = Span  5 ,  9  . D’altro canto il
 
−3 −7
nucleo di L non può avere dimensione 3 (se kerL avesse dimensione 3, si avrebbe kerL = R3
ed L sarebbe l’applicazione nulla), pertanto è uguale a tale “Span” ed i due vettori indicati
ne costituiscono una base.
Conosciamo L(~u), L(~v ) e L(w), ~ quindi siamo in grado di calcolare  l’immagine di qualsiasi
combinazione
    lineare di
  questi tre vettori: L
  λ~
u + µ~v + ν w
~ = λL(~
u) + µL(~v ) + νL(w) ~ =
4 4 4  4
λ +µ − ν3 = λ + µ − 31 ν .
5 5 5 5
Poiché ~e1 = 51 ~u + 25 ~v + 51 w
~ (i coefficienti 15 , 52 e 15 si determinano
  risolvendo
  il sistema

1 2 1
 4 8 4 32/15
~ si ha L(~e1 ) = 5 + 5 − 15
lineare ~e1 = λ~u + µ~v + ν w), = 15 = .
5 5 8/3
214

Per determinare la matrice A che rappresenta L è sufficiente calcolare L(~e1 ), L(~e2 ) ed


L(~e2 ) (il primo lo abbiamo già calcolato, gli altri due si determinano in modo analogo),
infatti sappiamo che le colonne di A sono costituite dalle immagini dei vettori della base
canonica.
4.20. Il nucleo di LB è lo spazio delle soluzioni del sistema lineare B · ~x = ~0. La
composizione LA ◦ LB (che indicherò con ϑ) è rappresentata dalla matrice A · B . Una
base del nucleo di LB , l’immagine LA ◦ LB (~v ), una base del nucleo e una dell’immagine di
LA ◦ LB sono rispettivamente:
     
   
 4 60  −2 −2  3
Bker B =  1  , ϑ(~v ) = , Bker ϑ =  
1 ,  0  , BIm ϑ = .
−40 −2
−3 0 1
4.21. Il nucleo kerLA è l’insieme dei vettori ~x ∈ R3 tali che A · ~x = ~0 . Le righe
di A sono proporzionali e questo sistema si riduce alla sola     3x−y + 4z = 0 ,
equazione
 1 0 
risolvendola troviamo una base del nucleo di LA : Bker LA =  3 ,  4  .
 
0 1
L’immagine di LA è generata dalle colonne di A (che corrispondono alle immagini dei
vettori della base canonica di R3 ), estraendo dall’insieme di tali colonne un sottoinsieme

2
massimale di vettori indipendenti si trova una base di ImLA : BImLA = .
−1
Scelto ~k ∈ Im LA , basta trovare due soluzioni del sistema A~x = ~k (o trovarne una e
sommarci un vettore non nullo del nucleo di LA ). In realtà non si deve risolvere nessun
sistema! Piuttosto che scegliere un vettore nell’immagine, scegliamo un vettore nel dominio
(avente immagine non nulla), ad esempio ~e1 (primo vettore della base canonica), quindi
poniamo ~k = L(~e1 ) . Preso un vettore ~b ∈ kerLA si avrà LA (~e1 ) = LA (~e1 + ~b) = ~k :
       
1  2   1 2
12
LA  0  = LA ( 3 ) = (il nostro ~k), essendo ~b =  3 ,  3  = ~e1 + ~b.
−6
0 0 0 0
4.22. Riducendo a scala la matrice completa associata al sistema lineare A · ~x = ~v si
trova
     
1 4 5 6 5 1 4 5 6 5 1 4 5 6 5
3 5 3 2 1  ∼  0 −7 −12 −16 −14  ∼  0 −7 −12 −16 −14 .
−7 −7 1 6 t+3 0 21 36 48 t+38 0 0 0 0 t−4
Ne segue che il sistema è compatibile, equivalentemente ~v ∈ Im L , se e solo se t = 4 .
Per t = 4 , dobbiamo trovare un vettore w ~ che soddisfa la relazione L(w) ~ = ~v , ovvero
dobbiamo trovare una soluzione w ~ del sistema A· w ~ = ~v . Dalla riduzione a scala effettuata
(sostituendo t = 4) troviamo il vettore w ~ di coordinate −3, 2, 0, 0 . Nota: ci viene chiesta
una soluzione, non di trovarle tutte, quindi i parametri liberi incontrati nel risolvere il sistema
li scegliamo nulli (come più ci piacciono, cioè in modo da non dover fare conti).
4.23. Il nucleo kerLt ha dimensione 2 se la matrice At ha rango 1 (=3-2), ovvero se le
sue righe (equivalentemente, colonne) sono proporzionali. Questo chiaramente accade solo
per t = 7.
~ ∈ kerL7 se e solo se A7 · w
Per definizione, w ~ = ~0 . Imponendo l’equazione A7 · w
~ = ~0
si trova 10 + 5m = 0 , quindi m = −2 .
4.24. Effettuiamo
 la riduzione
 ascala della matriceA:  
1 2 −1 −3 1 2 −1 −3 1 2 −1 −3
 2 3 4 −1  ∼  0 −1 6 5  ∼  0 −1 6 5 .
1 0 11 7 0 −2 12 10 0 0 0 0
Il nucleo ker LA è descritto dall’equazione A · ~x = ~0 . La riduzione a scala effettuata
215

ci permette di scrivere un sistema (minimale) di equazioni cartesiane per il nucleo di LA


nonché una base per tale nucleo:    
( −7 −11
x1 + 2x2 − x3 − 3x4 = 0  5   6 
equaz. cart. di kerLA : ; Bker LA = { ,  } .
− x2 + 6x3 + 5x4 = 0 0 1
1 0
L’immagine di LA è generata dalle colonne di A, una base la troviamo considerando le
colonne corrispondenti ai pivot della riduzione a scala effettuata:
   
1 2
BIm L = { 2 ,  3 } (i due vettori li indicheremo con ~b1 , ~b2 ).
1 0
Eliminando il parametro t dalle equazioni parametriche ~y = t1~b1 + t2~b2 si trova che
l’immagine di LA è descritta dall’equazione cartesiana 3y1 − 2y2 + y3 = 0 .
4.25. I tre vettori sono dipendenti (il determinante della matrice associata è nullo, si ha
w
~ = ~u + ~v ) , il loro Span ha dimensione 2.
a) Il dominio di L è R4 (ha dimensione 4), ma dimkerL + dimImL = 1 + 2 = 3 . Ne
segue che una tale L non esiste.  
1 0 0
b) Una possibile applicazione M è quella rappresentata dalla matrice  −1 1 0 
1 1 0
(un’altra soluzione è data dalla matrice associata ai tre vettori ~u, ~v , w
~ ).
   
a b c 1
c) Poniamo T = . Le colonne devono essere proporzionali a , quindi si
α β γ −2
deve avere α = −2a, β = −2b, γ = −2c . La condizione kerT = Span {~u, ~v , w} ~ si traduce
nelle condizioni a − b + c = 0, b + c = 0, dimker T = 2. Una applicazione T che soddisfa
le condizioni date (corrispondente
 alla soluzione
 a = −2, b = −1, c = 1) è l’applicazione
−2 −1 1
rappresentata dalla matrice .
4 2 −2
4.26. Ricordiamo che “l’immagine è lo Span delle colonne”.
 
1 0 0
a) Basta prendere A =  −2 −1 0  ;
3 2 0
b) una tale B non esiste: ImB ha dimensione 2, ker B ha dimensione 0 (perché B è
iniettiva) e la somma di queste dimensioni dovrebbe essere uguale a 3 (la dimensione del
dominio);
c) devo trovare una matrice C ∈ M2, 3 (R) di rango 2 (la dimensione del codominio) tale
che la combinazione lineare di coefficienti 1, -2, 3 delle colonne è il vettore nullo (a tale fine
basta prendere la prima
 colonna uguale al doppio della seconda meno il triplo della terza).
2 1 0
Ad esempio C = ;
−3 0 1
d) visto che ImD = Span {~v} (ha dimensione 1), le colonne della matrice D de-
vono
 essere tutte proporzionali
 a ~v . Quindi D deve essere una matrice  del tipo D  =
a b c 1 2 1
 −2a −2b −2c  (con a, b, c non tutti nulli). La matrice, D =  −2 −4 −2 
3a 3b 3c 3 6 3
soddisfa le condizioni richieste. Infatti, affinché sia soddisfatta la condizione kerD =
~ si deve avere D·~v = ~0 nonché D· w
Span{~v , w} ~ = ~0 , ovvero a−2b+3c = 0 e −b+2c = 0.
Risolvendo il sistema costituito da queste due equazioni troviamo b = 2c, a = c (c parametro
libero). Una soluzione non nulla, che otteniamo ponendo c = 1 , è la soluzione a = 1, b = 2,
c = 1 . A questi valori corrisponde la matrice D indicata.
4.27. Il nucleo di LA è lo spazio delle soluzioni del sistema lineare A · ~x = ~0 , nelle
216

incognite x1 , x2 , x3 , x4 , x5 . Questo sistema è particolarmente semplice (nelle prime due


equazioni compaiono solamente x1 e x2 , nella terza e quarta equazione compaiono solamente
x3 e x5 ). Si trova x3 = x5 = 0 e x2 = −3x1 (x1 e x4 sono parametri liberi). L’immagine
di LA è lo “span” delle colonne di A (visto il lavoro fatto sul sistema, una base di Im LA
è data dalla seconda colonna di A, terzo e quarto vettore della base canonica di R4 ). In
definitiva, le basi richieste
 sono rispettivamente
  
 1 0       

  1 0 0 
 −3   0   
 
    2 0 0
Bker A =  0  ,  0  e BIm A =  ,  ,   .

 0   1 
 
  0
 1 0  
  0 0 1
0 0  
a b c d
Cerchiamo una matrice (2 righe e 4 colonne) B = il cui nucleo sia uguale
α β γ δ
all’immagine di A . Questo significa che B deve soddisfare le condizioni a + 2b = 0, c = 0,
d = 0(come pure α+ 2β = 0, γ = 0, δ = 0 ) e deve avere rango 4−3 = 1 . Ad esempio,
2 −1 0 0
B = (in effetti abbiamo ampia possibilità di scelta).
0 0 0 0
La composizione LB ◦ LA è rappresentata dalla matrice nulla (2 righe, 5 colonne). Non
serve svolgere il prodotto: avendo kerLB = ImLA , tutti i vettori dell’immagine di A vanno
a 0 in quanto vettori del nucleo di B.  
Quanto a LC abbiamo di nuovo ampia possibilità di scelta (cerchiamo 1 0 0 0
una matrice 5 × 4 di rango 4). Ad esempio, la matrice indicata qui a lato.  0 1 0 0
 
0 0 1 0
La risposta all’ultima domanda è “si”. Infatti, essendo LC iniettiva,  
0 0 0 1
un vettore che non appartiene al nucleo di LA non può andare a zero 0 0 0 0
tramite LC ◦ LA (questo dimostra l’inclusione kerLA ⊇ ker LC ◦ LA ,
l’altra inclusione è ovvia).
     
4.28.
 Riducendo a scala la matrice
 associata ad A troviamo
 2 0 4
−1 4 0 −5 2 −1 4 0 −5 2  0 0 1
∼ .      
2 −8 0 6 −4 0 0 0 −4 0 B = { 0 ,  1 ,  0 }
Risolvendo il sistema associato troviamo x1 = 4t3 + 2t1 ,      
0 0 0
x2 = t3 , x3 = t2 , x4 = 0, x5 = t1 , quindi troviamo la base 1 0 0
B indicata a lato.
   
−1 4 0 −5 2 −t + 6
Si ha · ~vt = , quindi ~vt ∈ kerA per t = 6 (questo
2 −8 0 6 −4 2t − 12
risultato lo si può trovare anche usando la base B ma si fanno più calcoli).
Le coordinate α, β, γ di ~v6 rispetto alla base B sono date dalla soluzione del sistema
α~b1 + β~b2 + γ~b3 = ~v6 (dove ~b1 , ~b2 , ~b3 sono i tre vettori di B ). Risolvendo questo sistema
si trova α = −1, β = 3, γ = 2 .
 
2 1 4
4.29. La matrice associata alla composizione LA ◦ LB è il prodotto A · B = .
1 0 1

Risulta, LA ◦LB (~vk ) = A·B ·~vk = 2k+6 k+3 . Il vettore trovato si annulla (solo) per k = −3 .

Pertanto, il valore −3 è l’unico valore di k per il quale ~vk ∈ ker LA ◦ LB .
L’immagine di LB è lo “Span” delle colonne della matrice B , per trovare un vettore
che appartiene all’immagine di LB ma che non appartiene al nucleo di LA è sufficiente
scegliere una colonna di B e osservare che non appartiene al nucleo di LA (è evidente che
una qualsiasi di tali colonne soddisfa le condizioni richieste).
5.4. Poiché T (~u) = T (~v ) , si ha T (~u − ~v ) = ~0 , quindi il vettore ~u − ~v appartiene
al nucleo di T . Inoltre, ~u + ~v appartiene all’immagine di T (ce lo dice il testo). Per
ragioni di dimensione, i vettori indicati generano
 rispettivamente nucleo e immagine di T .
0
In definitiva: kerT = Span {~u − ~v = −1 } , ImT = Span{~u + ~v = 23 } .
La matrice rappresentativa di T rispetto alla base canonica può essere trovata effettuando
217

un cambiamento di base. Denotando con C la matrice rappresentativa di T rispetto alla


base B = {~u, ~v } (nelle colonne di C troviamo le coordinate di T (~u) e T (~v ) rispetto alla
base B) abbiamo:
       −1  
1 1 1 1 1 1 1 1 2 0
C = , A = · · = .
1 1 1 2 1 1 1 2 3 0
5.5. Le matrici dell’esercizio sono tutte diagonalizzabili. Di seguito riportiamo le matrici
della diagonalizzazione A = B ·∆·B −1 (naturalmente si ha Λ = ∆, C = B −1 ). Una base
di autovettori è data dalle colonne di B, gli autovalori sono i valori della diagonale di ∆, le
molteplicità algebrica e geometrica di un autovalore sono uguali al numero delle volte che
esso compare in tale diagonale. I vettori (tra quelli del testo) che sono autovettori sono
indicati a destra, dove viene indicato anche il calcolo di A19 · w ~.
    (
3 1 1 −7 0 0 A·~v = −7~v
i) B =  4 0 −3, ∆ =  0 −7 0 , ;
0 2 2 0 0 2 ~ = A19 ·(~b2 +~b3 ) = −719~b2 +219~b3
A19 · w
    (
1 0 1 3 0 0 A·~v = 3~v
ii) B =  2 −4 −1 , ∆ =  0 3 0 , ;
0 1 −2 0 0 −8 ~ = A19 ·(~b1 +~b3 ) = 319~b1 −819~b3
A19 · w
    (
3 2 1 4 0 0 A·~u = 4~u
iii) B =  0 1 −2, ∆ =  0 4 0 , ;
−2 0 −1 0 0 −3 ~ = A19 ·(3~b2 +~b3 ) = 3·419~b2 −319~b3
A19 · w
    (
1 0 2 1 0 0 A·~v = ~v , A·~u5 = ~u5
iv) B =  2 −3 −1 , ∆ =  0 1 0  ;
0 1 1 0 0 −1 ~ = A19 ·(2~b1 +~b3 ) = 2~b1 −~b3
A19 · w
    (
−2 1 1 2 0 0 A·~v = 2~v , A·~u5 = −~u5
v) B =  1 0 −1 , ∆ =  0 2 0  ;
0 1 2 0 0 −1 ~ = A19 ·(~b2 −~b3 ) = 219~b2 +~b3
A19 · w

5.6. Il testo ci fornisce le relazioni T (~z) = 2~v , T (~v) = 2~v , T (w)~ = −5w ~ . In particolare,
poiché T (~z) = T (~v ) , si ha T (~z−~v ) = ~0 , ovvero ~z−~v ∈ kerT (pertanto, dim kerT ≥ 1 ).
L’immagine di T contiene gli autovettori ~v e w ~ (quindi, dim Im T ≥ 2 ). Per ragioni di
dimensione (dim kerT+dimIm
  T = 3) si deve avere dimker
 T=1 edimIm T = 2 . Pertanto:
2 1 1
Bker T = {~z −~v } = { 0 } e BIm T = {~v , w} ~ = { 1 ,  0 } sono rispettivamente
−3 2 1
una base del nucleo e una base dell’immagine di T .
Osserviamo che anche il vettore ~z−~v è un autovettore (relativamente all’autovalore α = 0).
Quindil’insieme {~ z −~v, ~v , w}
~ è una base di autovettori
    per T . In definitiva:
0 0 0  2 1 1 
∆ =  0 2 0  e Bautovettori =  0 ,  1 ,  0  sono rispettivamente una
0 0 −5 −3 2 1
matrice diagonale e una base di R3 come richiesto al punto “b)”.
La matrice rappresentativa di T rispetto alla base canonica è la matrice fornita dalla formula
del cambiamento di base:
   −1  
2 1 1 0 0 0 2 1 1 −3 9 −2
 0 1 0  0 2 0  0 1 0  =  0 2 0 .
−3 2 1 0 0 −5 −3 2 1 −3 11 −2
Nota. Si può procedere anche in altri modi. Ad esempio, dalle relazioni T (~z) = 2~v ,
~ = −5w
T (~v ) = 2~v, T (w) ~ si deduce qual è la matrice rappresentativa di T rispetto alla base
B ′ = {~z, ~v , w}.
~ Il cambiamento di base che fa passare dalla base B ′ alla base canonica
fornisce anch’esso la matrice rappresentativa di T rispetto alla base canonica (com’è giusto
che sia, il risultato coincide con quello trovato sopra).
218
 
−5−λ −6 4
5.8. PA (λ) = det (A − λI) = det  −3 2−λ −6  = −λ3 + 147 λ + 686 .
−5 −15 3−λ
Per rispondere alla domanda “b)” determiniamo il nucleo della matrice
 
2 −6 4
M = A − (−7)I =  −3 9 −6  .
5 −15 10

3

Si ha kerM = ~v ∈ R M~v = 0 , le tre equazioni del sistema lineare M~v = ~0 si
~
riducono ad una sola (sono tutte proporzionali tra loro), l’equazione x − 3y + 2z = 0 (dove
x, y, z denotano lecoordinate
   di~v ). Risolvendo questa equazione troviamo che una base
 3 −2 
di ker M è B =  1 ,  0  . Poiché kerM “è non banale” (cioè contiene vettori
 
0 1
non nulli), abbiamo dimostrato che λ = −7 è un autovalore di LA e che B è una base
dell’autospazio relativo all’autovalore −7 (naturalmente si può rispondere alla prima parte
della domanda osservando che −7 annulla il polinomio caratteristico, ma visto che una base
del corrispondente autospazio dovevamo calcolarla comunque...).
... ◦ L}~v = λk ~v . Ne segue che λ = (−7)3 = −343 è
In generale, se L(~v ) = λ~v , si ha |L ◦ {z
k−volte
un autovalore di LA ◦LA ◦LA e che il corrispondente autospazio W contiene i due vettori in
B , nonché tali vettori costituiscono una base di W . Per dimostrare quanto abbiamo appena
affermato è sufficiente osservare che W non può essere tutto R3 : la trasformazione LA ,
quindi anche la composizione LA ◦ LA ◦ LA , ha un altro autovalore: non serve determinarlo,
basta osservare che PA (λ) 6= −(λ + 7)3 , comunque PA (λ) = −(λ + 7)2 (λ − 14) .
5.9. Cerchiamo i vettori ~x , tra quelli indicati, per i quali il prodotto A~x è un multiplo di
~x .
Si ha A~u = 11~u e Aw ~ = 2w ~ . Mentre A~v non è un multiplo di ~v . I valori 11 e 2 sono
rispettivamente gli autovalori corrispondenti agli autovettori ~u e w ~.  
−13 −8 6
L’autospazio relativo all’autovalore 11 è il nucleo della matrice A−11I =  2 −5 −3.
−6 −12 0
Questa matrice, non avendo le righe proporzionali tra loro, ha rango 2 (non può avere rango
3, se avesse rango 3, il valore 11 non sarebbe un autovalore). Pertanto, visto che ~u appartiene
all’autospazio V11 associato all’autovalore 11, l’insieme {~u} è una base di V11 .
Quanto all’autospazio V2  risulta:     
−4 −8 6  2 3
V2 = ker(A − 2I) = ker  2 4 −3  = Span  −1 ,  0  ed i due vettori
−6 −12 9 0 2
indicati costituiscono una base di V2 (si noti che le righe della matrice indicata sono pro-
porzionali, quindi V2 è descritto dall’equazione cartesiana 2x1 + 4x2 − 3x3 = 0 .
 
3−λ −2
5.10. Il polinomio caratteristico di A è P (λ) = det(A−λI) = det =
21 −10 − λ
λ2 + 7λ + 12 . Gli autovalori di A sono i valori che annullano il polinomio caratteristico,
quindi si trovano risolvendo l’equazione λ2 + 7λ + 12 = 0 . Le soluzioni di questa equazione
sono λ1 = −3 e λ2 = −4 . Quanto ai relativi autospazi e loro basi abbiamo:
     
6 −2 1 1
V−3 = ker(A + 3I) = ker = Span ; BV−3 = ;
21 −7 3 3
     
7 −2 2 2
V−4 = ker(A + 4I) = ker = Span ; BV−4 = .
 21  −6    7   7   
3 −2 3 −2 3 3 −2 9 −99
Si ha A · A · (3~e) = · · = · = .
21 −10 21 −10 0 21 −10 63 −441
Sappiamo che B ~v = 2~v nonché B w
~ = 2w ~ generano R2 , per ogni vettore
~ . Poiché ~v e w
219
 
2 0
~x si ha B~x = 2~x . Ne segue che B è il doppio della matrice identica, i.e. B = .
0 2
     
−7 2 12
5.11. Si ha, L(~v1 ) = −7~v1 =  −7 , L(~v2 ) = 2~v2 =  4 , L(~v3 ) = 3~v3 =  15 .
−21 2 15
Inoltre, PL (λ) = (−7 − λ) · (2 − λ) · (3 − λ) = −λ3 − 2λ2 + 29λ − 42 .
I vettori ~v1 , ~v2 e ~v3 sono indipendenti (non potrebbe essere altrimenti, visto che sono
autovettori relativi ad autovalori distinti) e la trasformazione L è invertibile (il determinante
della matrice associata, rispetto ad una qualsiasi base, è il prodotto degli autovalori −42).
Ne segue che il nucleo kerL è costituito solamente dal vettore nullo, mentre l’immagine di
L è tutto R3 (una qualsiasi base di R3 , ad esempio la base canonica, è una base di ImL).
Per calcolare L(~e1 ) conviene scrivere ~e1 come combinazione lineare di ~v1 , ~v2 e ~v3 , questo
perché conosciamo L(~v1 ), L(~v2 ) e L(~v3 ). Risolvendo il sistema lineare x1~v1+x2~v2+x3~v3 = ~e1
troviamo x1 = −1, x2 = −2, x3 = 1 , quindi:  
15
L(~e1 ) = L(−~v1 − 2~v2 + ~v3 ) = −L(~v1 ) − 2L(~v2 ) + L(~v3 ) =  14  .
32
5.12. Poiché L(~u) = L(w)~ , il vettore ~u − w
~ appartiene al nucleo di L (pertanto kerL ha
almeno dimensione 1). I vettori L(~v1 ) = −6~v1 e L(~v2 ) = 2~v2 appartengono all’immagine di
L (che pertanto ha almeno dimensione 2). Ne segue che le dimensioni di nucleo e immagine
di L sono rispettivamente 1 e 2 (infatti, oltre alle relazioni dim kerL ≥ 1 e dim ImL ≥ 2 ,
vale la relazione dim kerL + dim ImL = 3). In definitiva, una base del nucleo e una base
dell’immagine di L sono
  rispettivamente:    
1 1 5
~ = { 0 } e BIm L = { 3 ,  0 } .
Bker L = {~u − w}
5 1 −1
I valori 0, −6, 2 sono le 3 radici del polinomio caratteristico di L , quindi PL (λ) =
−λ(−6 − λ)(2 − λ) = −λ3 − 4λ2 + 12λ . Infine, L3 (~v1 ) = (λ1 )3~v1 = −216 ~v1 .
5.13. Si ha PA (λ) = det (A − λI) = (5 − λ)(λ2 + 5λ − 36) = (5 − λ)(λ + 9)(λ − 4) .
Ne segue che gli autovalori cercati sono 5, −9 e 4. Per quel che riguarda i corrispondenti
autospaziabbiamo       
0 0 0 1 14 0 0 0
V5 = ker  0 −4 5 , BV5 = { 0 }; V−9 = ker  0 10 5 , BV−9 = { 1 };
 0 6 −11  0 0 6 3 −2
1 0 0 0
V4 = ker  0 −3 5 , BV4 = { 5 } (si osservi che i sistemi lineari che definiscono
0 6 −10 3
questi nuclei sono veramente banali, si risolvono “a occhio”!).
Infine, indicata con C la matrice associata a una base di autovettori, la matrice C −1 · A · C
è la matrice diagonale dei corrispondenti autovalori. Pertanto, posto
     
1 0 0 5 0 0 1 0 0
C =  0 1 5 , si ha ∆ =  0 −9 0 , quindi M = C −1 =  0 3/13 −5/13 .
0 −2 3 0 0 4 0 2/13 1/13
5.14. L’immagine ha dimensione maggiore o uguale a 2, infatti contiene i vettori −3~z e
2~v + w
~.
~ , il nucleo contiene il vettore ~v − w
Poiché L(~v ) = L(w) ~ , in particolare ha dimensione
maggiore o uguale a 1. In quanto il dominio di L ha dimensione 3, ne segue che immagine
e nucleo di L hanno rispettivamente
   dimensione  2 e1 ed i vettori indicati
 ne costituiscono
 
 1 9   0 
delle basi: BIm L = ~z =  0 , 2~v + w ~ =  1  ; Bker L = ~v − w ~ =  −1  .
   
2 12 3
220

In quanto il nucleo di L è non banale, già abbiamo un autovalore e un autovettore:


l’autovalore è 0 e l’autovettore è ~v − w~.
I vettori ~v , w ~ , ~z costituiscono una base di R3 . Dalle relazioni L(~v ) = −3~z, L(w) ~ =
−3~z, L(~ z
 ) = 2~
v + w,
~ abbiamo
 che L , rispetto alla base
 {~
v , w,
~ ~
z } , è rappresentata
 dalla
0 0 2 −λ 0 2
matrice  0 0 1  e pertanto si ha PL (λ) = det  0 −λ 1  = −λ3 − 9λ (il
−3 −3 0 −3 −3 −λ
polinomio caratteristico di una trasformazione lineare può essere calcolato usando la matrice
rappresentativa relativa ad una base arbitraria: non dipende dalla base scelta).
Per determinare le immagini della base canonica di R3 , ovvero per determinare la matrice
A che rappresenta L rispetto alla base canonica, si deve effettuare un cambiamento di base:
     −1  
3 3 1 0 0 2 3 3 1 −51 90 30
A = 0 1 0 ·  0 0 1 · 0 1 0 =  −5 9 3 .
5 2 2 −3 −3 0 5 2 2 −72 126 42
     
−51 90 30
In definitiva, L(~e1 ) =  −5  , L(~e2 ) =  9  , L(~e3 ) =  3  .
−72 126 42
Nota. Un altro metodo (ma che in effetti è equivalente a quello usato) consiste nello
scrivere ~e1 (stessa cosa per ~e2 e ~e3 ) come combinazione lineare di ~v , w ~ , ~z , quindi di usare
l’espressione trovata per determinare l’immagine di ~e1 :
~e1 = 2~v + 0w ~ − 5~z =⇒ L(~e1 ) = L(2~v + 0w ~ − 5~z) = 2L(~v ) − 5L(~z) .
5.15. La matrice rappresentativa di L rispetto alla base {~u, ~v } è la matrice le cui colonne
sono costituite dalle coordinate
  L(~u) e L(~u) rispetto alla base {~u, ~v
di } . Quindi, talema-
−4 3  −4−λ 3
trice è la matrice A = . Si ha PA (λ) = det A− λI = det =
−6 5 −6 5−λ
λ2 − λ − 2 (il polinomio caratteristico di L può essere determinato utilizzando la matrice
rappresentativa rispetto ad una base arbitraria, non dipende dalla base scelta della base).
Poiché PA (λ) = λ2 − λ − 2 = (λ − 2)(λ + 1) , i valori 2 e −1 sono autovalori  della
4 −3
trasformazione L . Ora, si deve effettuare un cambio di base: posto C = −3 2 (matrice
delle coordinate di ~u e ~v rispetto alla base canonica di R2 ), la matrice rappresentativa di L
rispetto alla base canonica di R2 è la matrice
   −1  
−1 4 −3 −4 3 4 −3 5 6
B = C ·A·C = = .
−3 2 −6 5 −3 2 −3 −4
 
9−λ 1 0 0
  0 9−λ 0 0 
5.16. Si ha P (λ) = det A − λI = det   =
0 0 8−λ 3
  0 0 −18 −7 − λ
2 8−λ 3
(9 − λ) · det = (9 − λ) (λ − λ − 2) = (9 − λ)2 (λ − 2)(λ + 1) .
2 2
−18 −7−λ
Ne segue che i valori 9, 2, -1 sono autovalori di A , rispettivamente di molteplicità algebrica
2, 1, 1. I corrispondenti autospazi sono  
 
0 1 0 0  1 
  
0 0 0 0  0
V9 = ker A − 9I = ker   = Span   ;
0 0 −1 3  0 
 
0 0 −18 −16 0
   
7 1 0 0  0 
  
0 7 0 0   0 
V2 = ker A − 2I = ker   = Span   ;
0 0 6 3  1 
 
0 0 −18 −9 −2
221

   
10 1 0 0  0 
  
 0 10 0 0   0 
V−1 = ker A + I = ker   = Span   .
0 0 9 3  1 
 
0 0 −18 −6 −3
Le molteplicità geometriche dei tre autovalori di LA , che per definizione sono le dimen-
sioni dei corrispondenti autospazi, sono tutte uguali a 1 (si osservi che l’autovalore 9 ha
molteplicità algebrica uguale a 2 e molteplicità geometrica uguale a 1). Poiché la somma
delle dimensioni degli autospazi è uguale a 3, non esiste una base di R4 costituita da auto-
vettori di LA , cioè LA non è diagonalizzabile. Quindi, non esistono due matrici C e ∆
che soddisfano le condizioni richieste.
5.17. Cerchiamo un valore t che soddisfa la seguente condizione: ∃ λ | At ·~v = λ~v .
Questa condizione dà t = −2 (nonché λ = 4) Quindi ~v è un autovettore di At per t = −2
ed il corrispondente autovalore è λ = 4 . Poniamo A = At=−2 . L’autospazio associato
all’autovalore λ = 4 è il nucleo della matrice A − 4I . Si ha
       
−6 −3 3 −9 1 1 3
 6 3 −3 9   −2   0   0 
ker(A − 4I) = ker   = Span{ ,  ,  }
2 1 −1 3 0 2 0
−2 −1 1 −3 0 0 −2
(si osservi che le righe della matrice indicata sono tutte proporzionali tra loro, quindi il
sistema associato alla matrice si riduce a una sola equazione, l’equazione 2x+y−z +3w = 0).
A questo punto abbiamo trovato un autovalore (λ = 4) di molteplicità geometrica 3 e di
molteplicità algebrica maggiore o uguale a 3. Se la matrice è diagonalizzabile esiste un
altro autovalore, che indichiamo con µ, e la traccia della matrice è uguale alla somma degli
autovalori (quindi 4 + 4 + 4 + µ = tr A = −2 + 7 + 3 + 1 = 9 , ovvero µ = −3).
Segue che µ = −3 è effettivamente un autovalore e che le molteplicità algebriche (e
geometriche) di λ = 4 e µ = −3 sono rispettivamente 3 e 1 (questo perché la somma di
tali molteplicità non può essere maggiore di 4).
   
1 −3 3 −9 3
 6 10 −3 9   −3 
Si ha ker(A − µI) = ker(A + 3I) = ker   = Span{ }
2 1 6 3 −1
−2 −1 1 4 1
(l’autovettore lo troviamo risolvendo il sistema omogeneo associato alla matrice indicata).
In definitiva, A è diagonalizzabile nonché le matrici C e ∆ richieste sono rispettivamente
la matrice di una base di autovettori e la matrice diagonale associata ai corrispondenti
autovalori:    
1 1 3 3 4 0 0 0
 −2 0 0 −3  0 4 0 0 
C =   , ∆ =  .
0 2 0 −1 0 0 4 0
0 0 −2 1 0 0 0 −3
5.18. Calcolando il prodotto A~vt si trova che questo è un multiplo di ~vt per t = 2
(nonché si trova λ = −5): ~v2 è un autovettore di A, di autovalore λ = −5.
L’autospazio associato all’autovalore λ = −5 è il nucleo della matrice A + 5I , ovvero è
lo spazio delle soluzioni dell’equazione 2x − 3y − z = 0 (le righe della matrice A + 5I
sono tutte proporzionali alla riga (2 − 3 − 1). Risolvendo
  questa equazione troviamo una
 3 1 
base dell’autospazio V−5 : BV−5 =  2 ,  0  . Questo significa che V−5 ha
 
0 2
dimensione 2, ovvero µg (−5) = 2 (molteplicità geometrica).
Se la matrice A è diagonalizzabile, anche la molteplicità algebrica dell’autovalore λ = −5
deve essere uguale a 2 nonché la somma degli autovalori deve essere uguale a −24 (che è
la traccia della matrice A). In questo caso c’è un altro autovalore, che indicheremo con
ν , ed è dato dall’equazione −24 = −5 − 5 + ν , dalla quale troviamo ν = −14 , quindi
l’autovalore −14 avrà molteplicità algebrica e geometrica uguale a 1 e −5 avrà effettivamente
222

molteplicità algebrica uguale a 2 (la somma delle molteplicità, di quelle algebriche come
pure di quelle geometriche, non può superare 3). L’autospazio V−14 associato all’autovalore
ν = −14 è lo spazio delle soluzioni del sistema lineare (A + 14I)~x = ~0. Tale sistema lineare
ammette infinite soluzioni, questo conferma che il valore −14 è effettivamente un autovalore
(e che la situazione
  è quella descritta);
 risolvendolo,
 troviamo
 una base dell’autospazio
 V−14 :
1 3 1 1 −5 0 0
BV−14 = { −2 } . Infine, C =  2 0 −2 , ∆ =  0 −5 0  (C e ∆ sono
−1 0 2 −1 0 0 −14
le matrici della diagonalizzazione di A , ovvero sono rispettivamente la matrice di una base
di autovettori e la matrice diagonale dei corrispondenti autovalori).
   
0 1 0 2 0 0
5.19. Risulta A−1 =  −3 −1 2 , A−1·Bκ·A =  −3k−15 3k+14 6k+30 .
1 1 −1 k+5 −k − 5 −2k−9
Annullando tutti gli elementi di questa matrice che non stanno sulla diagonale troviamo il
sistema −3k−15 = 0 , k+5 = 0 , −k−5 = 0 , 6k+30 = 0, che ha come (unica) soluzione
il valore k = −5 . Sostituendo questovalore nelle matrici B e A−1 · Bκ · A troviamo
−5 −1 4 2 0 0
rispettivamente B−5 =  0 2 0  , A−1 ·B−5 ·A =  0 −1 0 .
−6 0 5 0 0 1
L’ultima equazione rappresenta la diagonalizzazione della matrice B−5 , questo significa che
i valori sulla diagonale 2, −1, 1 sono gli autovalori di B−5 e che i rispettivi autospazi sono
     
1 −1 −2
V2 = Span{ 1 } , V−1 = Span{ 0 } , V1 = Span{ 0 }
2 −1 −3
(non serve fare conti: i vettori indicati corrispondono alle colonne della matrice A).
Anche per scrivere il polinomio caratteristico di B−5 possiamo utilizzare la diagonalizzazione
a disposizione, si ha PB−5 (λ) = (2 − λ)(−1 − λ)(1 − λ) = −λ3 + 2λ2 + λ − 2.
Nota: gli unici calcoli da fare sono quelli di A−1 e di A−1 ·Bκ ·A fatti all’inizio. Visto
che A−1 viene utilizzata per rispondere alle domande successive ...vietato sbagliarla! (è
opportuno che lo studente verifichi la correttezza del calcolo dell’inversa).
5.20. Conosciamo le immagini dei vettori ~v , w, ~ ~z : L(w)~ = w−~
~ z , L(~z) = 6w−4~~ z e, dalla
relazione L(~v )−2L(w)~ = ~0, abbiamo L(~v ) = 2L(w) ~ = 2w ~ − 2~z . Ne segue
 che la matrice

0 0 0
rappresentativa di L rispetto alla base {~v , w,~ ~z } è la matrice A =  2 1 6 
−2 −1 −4
(ricordiamo che nelle colonne della matrice rappresentativa di una applicazione lineare ci sono
le coordinate, rispetto alla base considerata, delle immagini dei vettori della base stessa).
Poiché A ha rango 2, dim ImL = 2 e dim kerL = 3 − 2 = 1 . Il testo stesso ci fornisce un
vettore nel nucleo, infatti dalla relazione L(~v ) − 2L(w)~ = ~0 segue che ~v − 2w ~ ∈ ker L , e
ci fornisce due vettori (indipendenti) nell’immagine: w ~ − ~z e 6w ~ − 4~z . Pertanto:
     
−5 2 12
~ = { −2 } , BIm L = {w
Bker L = {~v − 2w} ~ − ~z, 6w~ − 4~z} = { 3 ,  14 } .
1 −1 −4
Per determinare il polinomio caratteristico, gli autovalori e le basi dei rispettivi autospazi
di L possiamo utilizzare la matrice A. Si ha PL λ = det (A − λI) = −λ · (λ + 1) · (λ + 2),
quindi gli autovalori di L sono 0, -1, -2 (essendo il nucleo di L non nullo, che il valore 0
fosse un autovalore già lo sapevamo).
Indichiamo con V0 , V−1 , V−2 , i rispettivi autospazi. Abbiamo V0 = kerL (ne abbiamo
già indicata una base). Il nucleo della matrice A + I è generato dal vettore numerico
di coordinate 0, 3, −1 , questo significa che V−1 = Span {0~v + 3w ~ − ~z} (non bisogna
confondersi: poiché A è la matrice rappresentativa di L rispetto alla base costituita dai
223

vettori ~v , w,
~ ~z , i valori numerici che si ottengono calcolando il nucleo di A+I rappresentano
le coordinate dei vettori del nostro autospazio rispetto a tale base). Analogamente troviamo
V−2 = Span{2w ~ − ~z} . In definitiva abbiamo:
   
6 4
V−1 = Span{3w ~ − ~z} = Span{ 5 } , V−2 = Span {2w ~ − ~z} = Span{ 4 } .
−1 −1
I vettori indicati formano delle basi degli autospazi indicati (evito di ricopiarli).
Per determinare la matrice rappresentativa di L rispetto alla base canonica di R3 possiamo
effettuare un “cambiamento di base”. Abbiamo a disposizione due possibilità, quella di
utilizzare la matrice rappresentativa rispetto alla base {~v , w, ~ ~z } e quella di utilizzare la
matrice rappresentativa di L rispetto alla base costituita dagli autovettori trovati (cioè la
matrice diagonale degli autovalori). Percorriamo entrambe le strade:
   −1  
−1 2 0 0 0 0 −1 2 0 12/5 −14/5 32/5
B =  0 1 −2  2 1 6  0 1 −2  =  14/5 −13/5 44/5 ,
1 0 1 −2 −1 −4 1 0 1 −4/5 3/5 −14/5
   −1  
−5 6 4 0 0 0 −5 6 4 12/5 −14/5 32/5
B =  −2 5 4  0 −1 0  −2 5 4  =  14/5 −13/5 44/5 .
1 −1 −1 0 0 −2 1 −1 −1 −4/5 3/5 −14/5
Naturalmente si ottiene sempre lo stesso risultato!
 
5.21. La matrice rappresentativa di T rispetto alla base 1 1 −1
3
canonica di R è la matrice A indicata a lato (questo perché le A =  −2 1 −2 
colonne di A sono le immagini dei vettori della base canonica). −2 −1 0
Per determinare gli autovalori si deve calcolare il polinomio caratteristico. Si ha:
PA (λ) = det (A − λI) = −λ3 + 2λ2 + λ − 2 = −(λ − 1)(λ + 1)(λ − 2)
(per decomporre il polinomio usiamo il fatto che ne conosciamo la radice λ = 2). Quindi, gli
autovalori della trasformazione T sono 1, -1, 2. I corrispondenti autospazi, che indicheremo
rispettivamente con V1 , V−1 , V2 , sono i nuclei delle matrici A−I, A+I, A−2I. Risolvendo
i sistemi lineari omogenei associati alle matrici indicate troviamo le basi degli autospazi:
     
−1 0 −1
BV1 = { 1 } , BV−1 = { 1 } , BV2 = { 0 } .
1 1 1
I tre vettori indicati, che denotiamo con ~u, ~v , w ~ , sono indipendenti (in quanto corrispon-
denti ad autovalori distinti), quindi costituiscono una base di autovettori. La trasformazione
T è pertanto diagonalizzabile. La matrice rappresentativa di T rispetto alla base di auto-
vettori {~u, ~v , w}
~ è la matrice diagonale dei corrispondenti autovalori.
   
1 7 −2 2
5.22. Si ha Aw ~ =  2 6 −2  · w ~ =  2  = 2w ~ . Questo dimostra che w ~ è un
1 11 −2 6
autovettore per T e che il corrispondente autovalore è λ = 2 . Il polinomio caratteristico
della matrice A è il polinomio −λ3 +5λ2 −2λ−8 = −(λ−2)(λ+1)(λ−4) , quindi i tre valori
2, -1 e 4 sono (tutti) gli autovalori di T (in effetti non è necessario calcolare il polinomio
caratteristico: sapendo che “somma degli autovalori”= tracciaA = 5 e che “prodotto degli
autovalori”= detA = −8 i due valori mancanti -1 e 4 si trovano immediatamente).
Risolvendo i sistemi A·~vt = −~vt e A·~vt = 4~vt , si trovano i due valori t1 = 4 e t2 = 3 .
 
La matrice rappresentativa di T rispetto alla base di autovettori −1 0 0
B = {~vt1 , ~vt2 , w}
~ è la matrice diagonale ∆ dei corrispondenti ∆ =  0 4 0
autovalori nell’ordine considerato (indicata qui a lato). 0 0 2

5.23. Sappiamo che T (~e3 ) = ~0 , T (~v) = 5~v , T (w)


~ = −2w ~ . In particolare, la matrice
rappresentativa di T rispetto alla base B = {~e3 , ~v , w}
~ è la matrice diagonale ∆ avente
224

i valori 0, 5, -2 sulla diagonale. Per determinare la matrice A è sufficiente effettuare un


cambiamento di base: indicata con B la matrice del cambiamento di base (matrice associata
~ e posto ∆ come sopra, si ha A = B · ∆ · B −1 , ovvero
ai vettori ~e3 , ~v , w)
     −1  
0 3 4 0 0 0 0 3 4 −23 −84 0
A =  0 1 −1  ·  0 5 0  ·  0 1 −1  =  7 26 0 
1 −2 3 0 0 −2 1 −2 3 4 22 0
Le matrici B e ∆ sono le matrici della domanda b): si ha ∆ = B −1 · A · B .
5.24. Innanzi tutto osserviamo che la matrice dei  
5 2 2
coefficienti delle relazioni date è la matrice rappresenta-  −4 −1 −2  .
M{~v, w, z} =
~ ~
tiva della trasformazione L rispetto alla base {~v , w, ~ ~z }
0 0 1
(indicata a lato).
A questo punto abbiamo a disposizione (almeno) tre metodi:
I metodo. Effettuando un cambiamento di base troviamo la matrice rappresentativa di L
rispetto alla base canonica di R3 : posto B = “matrice delle coordinate dei vettori ~v , w, ~ ~z
rispetto alla base canonica” si ha
   −1  
2 1 0 5 2 2 2 1 0 0 2 1
MCan = B ·M{~v, w, ~ ~ z } ·B
−1
=  1 1 1 ·−4 −1 −2· 1 1 1  =  0 1 0 .
4 1 0 0 0 1 4 1 0 −3 6 4
Usiamo questa matrice per determinare il polinomio caratteristico e gli (eventuali) autovalori
e autovettori: P (λ) = det (MCan − λI) = (1 − λ)(λ2 − 4λ + 3) = −(λ − 1)2 (λ − 3) ; gli
autovalori sono 1 e 3 (rispettivamente di molteplicità algebrica 2 e 1) ed i corrispondenti
autospazi sono:      
0 1 1
V1 = ker (MCan − I) = Span{ 1 ,  0 } ; V3 = ker (MCan − 3I) = Span{ 0 } .
−2 1 3
L’insieme B dei tre vettori indicati costituisce una base di autovettori.
II metodo. Usiamo la matrice rappresentativa M{~v, w, z } per calcolare il polinomio
~ ~
caratteristico, quindi troviamo gli autovalori e corrispondentemente gli autovettori ~b1 , ~b2 , ~b3
(li troviamo espressi come combinazioni lineari dei vettori ~v , w, ~ ~z : si trova ~b1 = −~v +2w, ~
~b2 = w−~~ z , ~b3 = ~v − w).
~ La matrice MCan la troviamo effettuando il cambiamento di base
dalla base degli autovettori alla base canonica.
III metodo. Scriviamo i vettori della base canonica ~e1 , ~e2 , ~e3 come combinazione
lineare dei vettori ~v , w, ~ ~z quindi calcoliamo L(~e1 ), L(~e2 ), L(~e3 ) utilizzando le  relazioni
1 3 1 3 1
date:
 L(~e 1 ) = L(− 2 ~
v + 2 w
~ − 2 ~
z ) = − 2 L(~
v ) + 2L( w)
~ − 2 L(~z ) = − 2 5~
v − 4 w
~ + 2 2~v −
w~ − 23 2~v − 2w ~ + ~z = − 23 ~v + 3w ~ − 32 ~z eccetera.

5.25. Gli autovalori di A sono le radici del polinomio caratteristico P (λ) = det A − λI
= (3 − λ) · (−4 − λ) · (λ2 + λ − 12) = (3 − λ)2 · (−4 − λ)2 . Ne segue che gli autovalori
sono 3 e −4 , entrambi di molteplicità algebrica 2. Gli autospazi V3 e V−4 sono:
       
 1 0   0 0 
0  1  2 0
V3 = ker (A − 3I) = Span  ,   , V−4 = ker(a + 4I) = Span  ,  
0 −2 3 0
0 0 0 1
(le due coppie di vettori indicati costituiscono rispettivamente una base di V3 e una base
di V−4 ). In particolare, anche le molteplicità geometriche dei due autovalori sono entrambe
uguali a 2. Dall’equazione A ·~vk = λ~vk si trova λ = −4 e k = 7 , in particolare ~vk
è un autovettore se e solo se k = 7. Si osservi che avrei potuto anche usare i risultati
precedenti: confrontando le coordinate di ~vk con quelle degli autovettori trovati si vede che
~vk 6∈ V3 , ∀ k , nonché ~vk ∈ V−4 per k = 7 . Infine, A15 (~v7 ) = (−4)15 ~v7 = −415 ~v7 .
5.26. Rispetto alla base degli autovettori, la trasformazione T è rappresentata dalla
matrice diagonale degli autovalori. Il polinomio caratteristico (che non dipende dalla base
scelta per rappresentare T ) è il polinomio PT (λ) = (2 − λ)(1 − λ)(3 − λ) = −λ3 + 6λ2 −
225

11λ + 6 .
Essendo ~a e ~b autovettori di autovalori λ = 2 e µ = 1 ed essendo ~v = 3~a + ~b , risulta
T 15 (~v ) = T 15 (3~a + ~b) = 3 T 15 (~a) + T 15 (~b) =      
1 1 3 · 215 + 1
3 λ15 ~a + µ15 ~b = 3 · 215  1  + 115  0  =  3 · 215  .
−2 1 −3 · 216 + 1
Infine, la matrice rappresentativa di T rispetto alla base canonica di R3 la troviamo effet-
tuando un cambiamento di base. Si ha:
     −1  
1 1 1 2 0 0 1 1 1 4 −8 −3
A =  1 0 −1  ·  0 1 0  ·  1 0 −1  =  −1 5 1 .
−2 1 3 0 0 3 −2 1 3 4 −14 −3
5.27. Per calcolare An dobbiamo diagonalizzare A. Il polinomio caratteristico  di A è il
polinomio PA (λ) = det (A − λI) = λ2 − 2λ − 3 = (λ − 3)(λ + 1) . I vettori 12 e 11 sono
rispettivamente autovettori relativi agli autovalori λ1 = 3 e λ2 = −1 . Da ciò otteniamo
   −1
1 1 3 0 1 1
la formula A = · · , quindi troviamo
2 1 0 −1 2 1
  n  −1  
n 1 1 3 0 1 1 −3n+2(−1)n 3n−(−1)n
A = · · = .
2 1 0 −1 2 1 −2·3n+2(−1)n 2·3n−(−1)n
 
17/9 −8/9
In particolare, A−2 = (che si poteva calcolare anche direttamente).
16/9 −7/9
1
 1

I vettori 2 e 1 sono anche autovettori per la matrice An (per ogni n), di autovalori

λ′1 = 3n e λ′2 = (−1)n (rispettivamente). In particolare, 12 è un autovettore per A3 di
autovalore 33 = 27.
5.28. La matrice  A la possiamo
 leggere
 nel testo:   
⋆ ⋆ ⋆ x x+2y 1 2 0
dovendo risultare  ⋆ ⋆ ⋆  y  =  2x+y  si ha A =  2 1 0 .
⋆ ⋆ ⋆ z 8x−7y +4z 8 −7 4
Il vettore ~vk (che è un vettore non-nullo per ogni k), è un autovettore per L se esiste un
valore λ tale che A · ~vk = λ~vk . Da questa relazione si ottiene λ = 3 e k = −1 , dunque
~vk è un autovettore per L se e solo se k = −1 e l’autovalore corrispondente a ~v−1 è λ = 3 .
 
Il polinomio caratteristico di L è il polinomio PL (λ) = det A−λI = (4−λ)· λ2 −2λ−3 =
(4−λ)(−1−λ)(3−λ), quindi abbiamo 3 autovalori distinti: 3, 4 e −1 (il calcolo del polinomio
caratteristico potevamo anche risparmiarcelo: conoscendo già due autovalori, gli autovalori
3 e 4, quest’ultimo risulta evidente guardando la terza colonna di A, il terzo autovalore, che
chiameremo µ,, lo troviamo sapendo che la somma degli autovalori, nel nostro caso 3+4+µ
è uguale alla traccia di A, che vale 1+1+4 = 6 ).
Le molteplicità algebriche degli autovalori sono tutte uguali a 1, pertanto sono uguali a
1 anche le corrispondenti molteplicità geometriche. Quanto agli autospazi V3 , V4 , V−1 ,
ricordando che Vλ = ker (A − λI), otteniamo:
     
1 0 1
BV3 = {~v−1 =  1 }, BV4 = { 0 } , BV−1 = { −1 }.
−1 1 −3
Poiché abbiamo tre autovettori indipendenti (si ricordi che autospazi corrispondenti ad auto-
valori distinti sono sicuramente
 indipendenti),
  L risulta diagonalizzabile. Infine, posto
1 0 1 3 0 0
B =  1 0 −1  e ∆ =  0 4 0  (sono rispettivamente la matrice di una
−1 1 −3 0 0 −1
base di autovettori = “matrice del cambiamento di base” e la matrice diagonale associata
ai corrispondenti autovalori), si ha ∆ = B −1 · A · B come richiesto.
5.29. Indichiamo con x, y, z le coordinate canoniche di R3 . Per definizione, lo spazio
226

kerL è lo spazio dei vettori ~v ∈ R3 che soddisfano l’equazione A · ~v = ~0 . Risolvendo


questo sistema si trovano le equazioni parametriche x = t, y = 0, z = −7t .
3
L’immagine di L è lo spazio dei vettori del tipo A · ~v ∈ R . Ègenerato
  dai vettori
 1 0 
corrispondenti alle colonne della matrice A , quindi BIm L =  −1 ,  0  è una sua
−2 1
base. Di conseguenza, le equazioni x = t, y = −t, z = −2t+s sono equazioni parametriche
per ImL . Eliminando i parametri, nello specifico ricavando s e t dalle ultime due equazioni
e sostituendoli nella prima, si trova l’equazione cartesiana x + y = 0 .
Per stabilire se L è diagonalizzabile ne calcoliamo gli autovalori
 e i corrispondenti autospazi.
Calcoliamo il polinomio caratteristico: PL (λ) = det A − λI = λ · (1 − λ) · (4 + λ) . Poiché
abbiamo 3 autovalori distinti, L è sicuramente  diagonalizzabile. Quanto
 ai corrispondenti
autospazi
 si ha V0 = ker (A),
  V1 = ker A −
  I , V−4 = ker A + 4I , quindi
    
1 0 −1  1 0 −1 
BV0 = { 0 }, BV1 = { 0 }, BV−4 = { 1 } e B =  0 ,  0 ,  1  è
−7 1 3 −7 1 3
una base B di autovettori per L . La matrice  ∆ rappresentativa
 di L rispetto alla base
0 0 0
di autovettori trovati è la matrice ∆ =  0 1 0  (matrice diagonale associata agli
0 0 −4
autovalori).
5.37. a) Approccio “geometrico” (distinguiamo i tre casi rangoP = 2, 0, 1): se P è
invertibile, P 2 = P ⇒ P = I (identità); se P ha rango zero allora è la matrice nulla;
 
se rangoP = 1 allora esistono due vettori non-nulli ~v = α ~ γ
β ∈ ImP e k = δ ∈ kerP ,
poiché P 2 = P ⇒ P (~v ) = ~v , il vettore ~v è un autovettore (relativo all’autovalore λ = 1).
Poiché ~v e ~k sono autovettori relativi ad autovalori distinti (rispettivamente 0 e 1), l’insieme

{~v , ~k} è una base di R2 nonché la matrice αβ γδ è invertibile. Rispetto alla base {~v , ~k}
la trasformazione LP : R2 → R2 è rappresentata dalla matrice “diagonale associata agli
   −1 
autovalori” 10 00 , quindi risulta P = αβ γδ · 10 00 · αβ γδ 1
= αδ−βγ αδ −αβ
γδ −βγ .
a) Se w ~ = P (~v ) e P 2 = P , allora P (w)
~ = P P (~v )) = P 2 (~v ) = P (~v ) = w ~ . Questo
2
dimostra che l’identità P = P implica la proprietà P (w) ~ ∀w
~ = w, ~ ∈ ImP . Viceversa, se
P (w)
~ =w ~ per ogni vettore w ~ nell’immagine di P , poiché P (~v ) appartiene all’immagine
di P per ogni ~v , si deve necessariamente avere P P (~v )) = P (~v ) per ogni ~v , cioè P 2 = P .
Osserviamo che l’unica matrice “di proiezione” invertibile è la matrice identità In .
b) e c) Il nucleo kerP è l’autospazio relativo all’autovalore 0 e, alla luce della caratteriz-
zazione vista, ImP è l’autospazio relativo all’autovalore 1. D’altro canto dall’uguaglianza
dim ImP + dim kerP = n deduciamo che questi due autospazi generano Rn (cfr. Teorema
13.9), quindi che P è diagonalizzabile: la trasformazione LP : Rn → Rn è rappresentata
dalla matrice diagonale ∆ = diag (1, ..., 1, 0, ... 0) , ovvero P = B ·∆·B −1 (essendo B la
matrice del cambiamento di base).
6.6. I vettorigeometrici
  rappresentati
  dai segmenti  orientati
  QP e QK  sono rispettiva-
5 3 2 6 3 3
mente ~v = − = e w ~ = − = .
6 4 2 0 4 −4
  √
2 3
Pertanto, Area(T) = 12 |det | = 7 ; cosθ = ||~v~v||·||
·w~
w||
~
√ = − 2 .
= 5−2 10
2 −4 8

La retta r è parallela al vettore ~v , quindi è descritta da un’equazione del tipo 2x−2y+c = 0 .


Imponendo il passaggio per P troviamo c = 2 . L’equazione 2x−2y+2 = 0 è un’equazione
cartesiana di r .
     
12 12 6
6.7. Il vettore ~u ∧ ~v =  4  è ortogonale a ~u e ~v , quindi ~k = 7 ||~u~u∧~
v
∧~
v || = 1 
2 4 =  2 .
6 6 3
227

u
~ ·~
v 32
Inoltre: A = ||~u ∧ ~v || = 14 ; cos(θ) = ||~
u||·||~
v|| = √ √ (circa 0,916) ;
      10· 122
3 5 −2
I =  −2  −  −9  =  7  .
5 −4 9
~
v·~ w −22
6.8. cos(θ) = ||~ = √94
v ||·||w||
~
√ ;
  · 11  
−15 √ −2
~ = || 18 || = 550 ; π = ||~vw||
A = ||~v ∧ w|| ·~
w
~ 2w ~ = −22 ~ =  −2 .
11 w
−1 −6
′ ′ ′
La differenza ~v − ~π è un vettore ortogonale a w ~ (per definizione di proiezione), ne segue
che il prodotto scalare (~v ′ −~π ′ ) · w
~ ′ è nullo.
     
5 12 24
6.9. Risulta ⊥ r, quindi ~v ′ = è parallelo ad r . Si ha ~v = ||~26
v ′ || ~
v ′
= .
12 −5 −10
|5·13+12·15−76|
Si ha d = √
52 +122
= 13 .
Il punto Q può essere determinato intersecando la retta r con la retta s ortogonale ad r
x = 13 + 5t
e passante per P . La retta s ha equazioni parametriche . Sostituendole
  y = 15 + 12t
8
nell’equazione di r si trova t = −1 , quindi Q = .
3
     
5 −5 1 5 −5
Si ha QP = , QK = . Quindi Area(T) = 2 |det | = 65
2 .
12 1 12 1
QP ·QK
Infine, cos(θ) = ||QP ||·||QK||
= −0.19612 (circa).
   
−1 3
6.10. Si ha ~v = P − I , quindi I =  4 . Posto ~z = QP =  1 , i vettori ~v e ~z
8 4
“sono” due lati del triangolo in questione. La norma del prodotto vettoriale ~v ∧ ~z è uguale
al valore dell’area del  parallelogramma
   individuato da ~v e ~z . In definitiva abbiamo:
8 3 −1 √
A = 21 ||~v ∧ ~z|| = 21 || −1  ∧  1 || = 12 || −41 || = 12 1803.
−3 4 11
     
8 2 1
Il prodotto vettoriale ~v ∧ w ~ =  −1  ∧  0  =  2  è ortogonale ad entrambi i vettori
−3 −1 2
~v e w ~ (ed in effetti ha già norma 3, se avesse avuto norma n lo avremmo moltiplicato per
il coefficiente n3 ). Quindi, questo vettore, è il vettore richiesto ~h.  
38/5
Infine: cos(θ) = ~v · w ~ = √ 19√ ≃ 0.98776 ; π = ~v · w ~ w ~ = 195 w~ =  0 .
||~v || · ||w||
~ 74 5 ~ 2
(||w||)
−19/5
   
0 5
6.11. Il vettore ~u′ =  1  è ortogonale a ~v , il prodotto vettoriale w ~ ′ = ~v ∧ ~u =  −4 
2 2
è ortogonale sia al vettore ~v che al vettore ~u . Moltiplicando questi vettori per una costante
opportuna si ottengono dei vettori di norma 3:
   √ 
0√ 5/ √5
~u = ||~u3′ || ~u′ = √35 ~u′ =  3/√5  , w ~ = ||w~3′ || w ~ ′ =  −4/√ 5  .
~ ′ = √345 w
6/ 5 2/ 5
   √   
0√ 5/ √5 6
Si ha ~z = ~u ∧ w ~ =  3/√5  ∧  −4/√ 5  =  6  (non è un caso: vista
6/ 5 2/ 5 −3
l’interpretazione geometrica del prodotto vettoriale, ~z è parallelo a ~v ed ha norma 3·3 = 9).
228
 
√ 4
v ·~ ~
Si ha cosθ = ~ k
v||·||~
||~ k||
= 12+14−8

3· 36+49+64
= 18

3· 149
= 6 149
149 ; k·~
π = ||~ z
z||2 ~
54
z = 81 ~z =  4 .
−2
~ k·~v
Note: si ha anche π = ||~ v ||2 ~
v , questo segue dal fatto che ~z e ~v (in quanto paralleli)
individuano la stessa direzione; dopo aver svolto un prodotto vettoriale, un’utile verifica
consiste nel controllare che il vettore trovato è ortogonale a entrambi i vettori dati; leggete
criticamente i risultati ottenuti (sono troppi i compiti dove cosθ ha modulo maggiore di
uno! ...come pure quelli dove il risultato di una proiezione non è parallelo alla direzione
lungo la quale si proietta!).
3

6.12. La retta r è parallela al vettore w ~ = P Q = −4 . Equazioni parametriche e

x = 2 + 3t
cartesiane di r sono rispettivamente e 4x + 3y − 17 = 0 (il termine noto
y = 3 − 4t
-17 si trova imponendo il passaggio per P , o per Q).
 
21/5
Si ha ||P Q|| = 5 , quindi ~v = 75 P Q = ha norma 7.
−28/5
La generica retta parallela ad r ha equazione 4x + 3y + c = 0 . Imporre che la sua distanza
dalla retta r sia 5 equivale a imporre che la sua distanza da un qualsiasi punto di r sia 5.
Imponendo che la sua distanza da P sia 5 si trova |4·2+3·3+c| 5 = 5 , quindi c = 8 (un’altra
soluzione è c = −42 ):
un’equazione cartesiana di una retta s che soddisfa le condizioni indicate è 4x+3y +8 = 0 .
   
~k · w
~ 33 3 99/25
Si ha ~π = ||w||~ 2 w ~ = 25 = .
−4 −132/25
   
2−5 −3
6.13. Poiché ~k = QP , si ha Q =  3 − 1  =  2  . Il prodotto vettoriale
  −1 − 7 −8    √ 
−4 −4 −20/√ 26
~k ∧ w~ =  −1  è ortogonale a ~k e w ~ . Quindi ~v = ||~k∧5w||  −1  =  −5/ 26 
~ √
3 3 15/ 26
soddisfa le condizioni richieste.  
160/75
~k · w ~ ~k = 32 ~k =  32/75  .
Si ha ~π~k (w)
~ =
||~k||2 75
224/75
Non è necessario calcolare  le altreproiezioni: poiché ~v è ortogonale a ~k si ha 
160/75 320/75
~π~k (w ~ =  32/75 , ~π~k (2w
~ + 7~v) = ~π~k (w) ~ + 11~v ) = ~π~k (2w) ~ =  64/75 .
~ = 2·~π~k (w)
224/75 448/75
Nel nucleo di L troviamo i vettori ortogonali al vettore ~k (ovvero i vettori che soddisfano
l’equazione 5x + y +  7z = 0) 
e nell’immagine di L troviamo ~
   i vettori proporzionali a k .
 1 0  5
Quindi: Bker L =  −5 ,  −7  ; BIm L =  1  .
0 1 7
     
−4 3 1 −4 3
6.14. Si ha P Q = e PR = , quindi A = 2 |det | = 8.
0 −4 0 −4
P Q·P R −12 −12
Si ha cosθ = ||P Q||·||P R||
= = −3
4·5 =
5 . 20
  
7 x = 2 + 7t
Essendo QR = , le equazioni e 4x + 7y − 29 = 0 (il coefficiente
−4 y = 3 − 4t
29 lo troviamo imponendo il passaggio per P ) sono rispettivamente equazioni parametriche
e cartesiane della retta r .
Per trovare le coordinate di K abbiamo a disposizione due metodi:
229

i) considerando l’estremo finale del segmento orientato che rappresenta il vettore ~h ottenuto
proiettando il vettore QP lungo la direzione
  QR e che ha Q come estremo iniziale
 troviamo

 28
~h = QP ·QR QR = (0)(−4) 7 = 28 7 , quindi K = −2 + 65 · 7 = 66/65 ;
4 7

||QR||2 2 −4 65 −4 28 83/65
||(−4
7
)|| 3 − 65 ·4
ii) intersecando la retta s (che ha equazione 4x + 7y − 13 = 0) con la retta ortogonale a
s passante per P (che ha equazione 7x − 4y − 2 = 0) troviamo x = 66/65 , y = 83/65 .
6.15. Le coordinate del vettore w ~ si ottengono come differenza delle coordinate dei due
punti (estremo finale meno estremo iniziale); il prodotto vettoriale ~k ∧ w ~ è ortogonale a ~k
e w, ~
~ per renderlo di norma 2 è sufficiente moltiplicarlo per 2/||k ∧ w||; ~ per calcolare π~k (w)~
usiamo la formula di proiezione. In definitiva:
     
0 18 26/15
~k ∧ w ~
~ = P Q =  −2 , ~v = ||~k∧2w||
w ~
2 
~ = √824 ~ = ||k·~k||w~2 ~k = 26
−20 , π~k (w) ~  26/75 .
75 k =
4 −10 182/75
Per trovare un vettore ~r che soddisfa le condizioni indicate basta sommare a w ~ un qualsiasi
vettore (non nullo) ortogonale a ~k . Ad esempio possiamo prendere ~r = w ~ + ~k ∧ w
~ . Un’altra
possibilità è quella di prendere il vettore trovato prima π~k (w)
~ .
6.16. Indichiamo con ~z il vettore rappresentato dal segmento orientato P Q . Il punto π
è l’estremo finale del segmento orientato di estremo iniziale P , che rappresenta il vettore ~k
ottenuto proiettando ~z lungo la direzione individuata da ~v . Si ha:
         
1 2 −1 −3 −1
~z =  −12  −  −1  =  −11 ; ~k = ||~ ~
v ·~
z
v =  −12 ; π = “p + ~k ” =  −13  .
v ||2 ~
12 3 9 6 9
Per calcolare l’area A del triangolo T possiamo utilizzare il fatto che la norma del prodotto
vettoriale di due vettori in √ R3 è uguale all’area del parallelogramma individuato dai due
1 ~
vettori: A = 2 ||k ∧ ~z|| = 2 2646 (~k e w
1
~ sono rappresentati dai lati P π e P Q di T).
~
z ·~
v
Infine, cosθ = ||~z||·||~v|| = √ √−63 = √ −63 ≃ −0, 9649 .
21 203 4263
√ √
Nota. Avremmo potuto anche usare la formula A = 12 ||πP || · ||πQ|| = 21 189 14 =
1

2 2646 (questo perché l’angolo di vertice π di T è retto per costruzione di π ).

x = 2 − 3t
6.17. Equazioni parametriche delle retta r : (trovate usando y come
y = t
parametro nell’equazione cartesiana).
  √
−6/ 10
Abbiamo: ~v ′ = −3 1 // r, quindi ~ v = ||~v2′ || −3
1 = 2/√10 soddisfa le condizioni richieste.
 √ 
Posto P = xy si deve avere |x+3y−2| √
10
= 5 . Una possibile soluzione è P = 2+5 10
0 .
Il vettore ~v ′ è un vettore ortogonale ad s, quindi un’equazione cartesiana di s si ottiene
imponendo che le coordinate del punto A soddisfino l’equazione −3x + y + c = 0 (si trova
−3·1−1+c = 0, quindi c = 4): l’equazione −3x + y + 4 = 0 è un’equazione cartesiana di s.
5
   
6.18. Essendo RQ = −4 , si ha R = −6 7 . Inoltre: QP = 30 e QR = −~v = −5 4 .
L’area del triangolo Tè la metà dell’area del parallelogramma
 individuato dai due vettori
3 −5 x = 4t + 2
indicati: A = 12 det = 6 . Le equazioni , 5x − 4y + 2 = 0
0 4 y = 5t + 3
sono
 rispettivamente equazioni parametriche e cartesiane della retta r (infatti, il vettore
4
5 è ortogonale al vettore ~ v , quindi è parallelo alla retta r). Le coordinate del punto K si
trovano intersecando la retta r con la retta s ortogonale ad r passante per Q . La retta
s ha equazione 4x + 5y − 11 = 0 .  
34/41
Mettendo a sistema le equazioni di r ed s si trova K = .
63/41
      
6.19. Risulta A = 46 + −2 3 = 29 , B = 46 + −1 5
= 95 . Il vettore AB = −4 7

230

x = 2 + 7t
un vettore parallelo alla retta r . Quindi le equazioni , 4x + 7y − 71 = 0
y = 9 − 4t
sono rispettivamente equazioni parametriche e cartesiane di r .
~ √
L’angolo θ è l’angolo tra i vettori α ~ e β~ . Si ha cosθ = ||~αα~||·|| ·β
~ =
β||
√ −13√
13· 26
= − 2/2 .
 −13 5  3/2 
Infine, K = P + α·β ~ 2β =
4
6 + 26 −1 = 13/2 .
||β||

x = 5 + 2t
6.20. In forma parametrica r è definita dal sistema . Da questo sistema
y = 2 − 3t
(oppure imponendo il passaggio per P alla generica retta parallela a ~v ), si trova l’equazione

cartesiana 3x + 2y − 19 = 0 . Si ha dist{Q, r} = |3·3+2·(−8)−19| √
32 +22
= √2613 = 2 13 .
−2

Proiettando il vettore w ~ := P Q = −10 lungo la direzione della retta r si ottiene il vettore

~π rappresentato dal segmento orientato P K . Si ha ~π = ||~ w·~
~ v
v = −2·2−10·(−3)
v ||2 ~ 13
2
−3 =
4
 5
 4
 9

−6 , quindi K = 2 + −6 = −4 . In alternativa, avremmo potuto intersecare
la retta r con la retta √ √ ad essa ortogonale passante per Q . Infine risulta Area(T) =
1 1
2 ||P K|| · ||QK|| = 2 52 52 = 26 (P K e QK sono ortogonali
 tra
 loro). Si poteva usare
−2 4
anche la formula del determinante: Area(T) = 12 det = 26.
−10 −6
3

6.21. Il vettore, rappresentato da AB, ~v = −4 è un vettore parallelo ad r . Il

0
 x = 2 + 3t
vettore rappresentato da AQ è il vettore w ~ = −4 . Le equazioni e
y = 3 − 4t
4x + 3y − 17 = 0 sono rispettivamente equazioni parametriche e cartesiane di r . Si ha: 
dist{Q, r} = |4·2+3·(−1)−17|

16+9
= 12/5 , ~π = πh~v i (w) ~ = ||~ w·~
~ v
v ||2 ·~ v = 2516 3
· −4 48/25
= −64/25 .
6.22. Ricordando l’interpretazione geometrica dei coefficienti delle generiche equazioni
parametriche,
( ovvero cartesiane, di una retta, abbiamo quanto segue. Equazioni parame-
x = 4 + 2t  
triche: (essendo 12 ortogonale ad r, il vettore −1 2
è parallelo ad r).
y = −3 − t
Equazione cartesiana: x + 2y + 2 = 0 (il termine noto lo troviamo imponendo il passaggio
per P ).
Per determinare le coordinate di K abbiamo a disposizione due metodi (almeno):
I metodo. Intersechiamo r con la retta s ortogonale ad r nonché passante per Q , siha
8
K = “soluzione del sistema lineare di equazioni x+2y +2 = 0, 2x−y −21 = 0” = −5 .
II metodo. Proiettiamo il vettore P Q lungo la direzione di r quindi determiniamo K come
estremo finale del segmento orientato di estremo iniziale P che rappresenta tale proiezione:
 
4
 (74)·(−1
2
) 2 4
 2
 8   
K = −3 + 5 −1 = −3 + 2 −1 = (osservazione: P Q = 74 , −1 2
r ).
−5

Si ha dist{Q, r} = |11+2·1+2|

5
= √15
5
= 3 5.
       √ 
2 5 2 √5
2 2√ 5
Il vettore è parallelo ad r, quindi 2 || −1 = = è un
−1 ||(−1) 5 −1 5
vettore di norma 5 parallelo ad r.
231

INDICE ANALITICO

angolo 102, 116, 131, 144 partizione 4


applicazione lineare 64 permutazioni 86
immagine 64 piano (nello spazio) 123
nucleo 64 piano Euclideo 103
autospazio 72 pivot 14, 15, 49
autovalore 72 polinomio caratteristico 73
molteplicità algebrica 74 prodotto cartesiano di insiemi 3
molteplicità geometrica 74 prodotto misto 120
autovettore 72 prodotto scalare 104, 117, 132
classe d’equivalenza 4 prodotto vettoriale 119
combinazione lineare 12, 41 quantificatore 2
complemento algebrico 27 relazione d’equivalenza 4
coordinate 42, 43 retta 109, 123
determinante 25 ricoprimento 4
sviluppo di Laplace 25 segmento orientato 104, 117
diagonale principale 10 sistema lineare 8
differenza insiemistica 3 coefficienti, incognite, soluzioni 8, 9
dipendenza lineare 41 parametro libero 12
disuguaglianza di Cauchy-Schwarz span 42
105, 132, 144 spazio affine 59, 98
disuguaglianza triangolare 106, 133, 144 spazio intersezione 52
equazioni parametriche 55, 59 spazio somma 52
equazioni cartesiane 56, 60 spazio vettoriale 38
estrazione di una base 44 base 42
formula di Grassmann 52 dimensione 45
funzione 4 finitamente generato 42
dominio, codominio, immagine 4 spettro 72
fibra, grafico 5 traccia 74
iniettiva, suriettiva, biunivoca 4 teorema
inversa 5 di Binet 31
generatori 42 di Cramer 36
intersezione 5 fondamentale dell’Algebra 156
matrice 10, 17 degli orlati 51
diagonale 10 di Rouché Capelli 70
identica 10 Spettrale 142
invertibile 22, 32 trasformazione lineare 71
rango 49 trasformazione
a scala 14 aggiunta 138, 146
traccia 74 autoaggiunta 138, 146
trasposta 21 diagonalizzabile 76
triangolare superiore 10 normale 140, 146
matrice rappresentativa 77 ortogonale 139, 146
matrici coniugate 81 unione 3
minore 49 vettore 19, 38
norma 104, 118, 132, 144 vettore geometrico 104, 117
ortonormalizzazione 135, 136
232

INDICE DEI SIMBOLI E DELLE ABBREVIAZIONI

∃ = “esiste”; ∃ ! = “esiste un unico”;


∀ = “per ogni”; | = “tale che”;
∞ = “infinito”; ∅ = “insieme vuoto”;
=⇒ = “implica”; ⇐⇒ = “se e solo se”;
c.l. = “combinazione lineare”.
E.G. = “algoritmo di eliminazione di Gauss”.
∈ = “appartiene”; ⊆ = “è incluso”;
∋ = “contiene”; ⊇ = “contiene”;
CAPITOLO I

SPAZI TOPOLOGICI

§1 Topologie su un insieme
Sia X un insieme. Una topologia su X è una famiglia τ di sottoinsiemi di X,
che si dicono aperti. Gli aperti di una topologia su X devono soddisfare i seguenti
assiomi:
(O1 ) ∅, X sono aperti;
(O2 ) l’unione di una qualsiasi famiglia di aperti è un aperto;
(O3 ) l’intersezione di una qualsiasi famiglia finita di aperti è un aperto.
L’assioma (O3 ) è equivalente a
(O3′ ) A ∩ B ∈ τ ∀A, B ∈ τ .
Uno spazio topologico è la coppia X = (X, τ ) formata da un insieme X e da una
topologia τ su X.
Se Y è un sottoinsieme di uno spazio topologico X, la famigliaS A degli aperti
A di X contenuti in Y è non vuota, perché ∅ ∈ A. L’unione A è, per l’assioma

(O2 ), il più grande aperto contenuto in Y . Esso si indica con Y e si dice parte
interna di Y . Gli aperti di X sono i sottoinsiemi di X che coincidono con la loro
parte interna.
Lemma 1.1 Sia X uno spazio topologico e siano A, B due sottoinsiemi di X.
Allora:
◦ ◦
(i) Se A ⊂ B, anche A ⊂ B.

z }| { ◦ ◦
(ii) A ∩ B = A ∩ B.

◦ ◦ ◦ ◦
Dim. (i): abbiamo A ⊂ A ⊂ B e quindi A ⊂ B perché A è un aperto contenuto
in B.

◦ ◦ ◦ ◦ z }| {
(ii) Poiché A ∩ B è un aperto contenuto in A ∩ B, vale l’inclusione A ∩ B ⊂ A ∩ B.

z }| {
D’altra parte A ∩ B è un aperto contenuto sia in A che in B e quindi in A ∩ B.

z }| { ◦ ◦
Dunque vale anche l’inclusione opposta A ∩ B ⊂ A ∩ B e quindi l’uguaglianza.
Esempio 1.1 Sia X un insieme qualsiasi. Si dice topologia discreta su X quella
per cui tutti i sottoinsiemi di X sono aperti e topologia indiscreta su X quella in
cui soltanto ∅ e X sono aperti.
Se X contiene almeno due punti, la topologia discreta e quella indiscreta sono
distinte e si possono definire su X topologie diverse da quella discreta e da quella
1
2 CAPITOLO I. SPAZI TOPOLOGICI

indiscreta. Ad esempio, se a ∈ X 6= {a}, allora τ = {∅, {a}, X} è una topologia su


X diversa sia da quella discreta che da quella indiscreta.
Siano τ1 e τ2 due topologie sullo stesso insieme X. Se τ1 ⊂ τ2 diciamo che τ2 è
più fine di τ1 , oppure che τ1 è meno fine di τ2 .
Osserviamo che la topologia discreta è la più fine e quella indiscreta la meno fine
tra le topologie su X.
La relazione di ”essere più fine di” è una relazione di ordinamento parziale tra
le topologie su un insieme X fissato. Se non vale né la relazione τ1 ⊂ τ2 , né la
relazione τ1 ⊃ τ2 , diciamo che le due topologie non sono confrontabili. Si verifica
facilmente che vale la:
Proposizione 1.2 Sia X T un insieme e sia {τi | i ∈ I} una famiglia di topologie
su X. Allora L’intersezione i∈I τi è una topologia su X.

Abbiamo poi:
Proposizione 1.3 Sia X un insieme e sia Γ una qualsiasi famiglia di sottoinsiemi
di X. Vi è un’unica topologia τ su X caratterizzata dalla proprietà di essere la
meno fine tra le topologie su X per cui gli elementi di Γ sono aperti. Ogni aperto
di τ è unione di intersezioni finite di aperti di Γ̃ = Γ ∪ {∅, X}.

Dim. La famiglia T delle topologie su X per cui gli elementi di T Γ sono aperti
contiene la topologia discreta e quindi è non vuota. Chiaramente T è meno fine
tra tutte le topologie su X per cui gli elementi di Γ sono aperti. Indichiamo con τ la
famiglia di sottoinsiemi
T di X formata dalle unioni di intersezioni finite di elementi di
Γ̃. Abbiamo τ ⊂ T e quindi per completare la dimostrazione basterà mostrare che
τ è una topologia. Gli assiomi (O1 ) e (O2 ) sono di verifica
S immediata.S Mostriamo
che vale anche (O3′ ). Siano A e B due elementi di τ : A = i∈I Ai , B = j∈J Bj , ove
gli Ai e i Bj sono intersezioni finite di elementi di Γ̃. Per laSproprietà distributiva
dell’unione rispetto all’intersezione otteniamo: A ∩ B = (i,j)∈I×J Ai ∩ Bj ; per
ogni (i, j) ∈ I × J l’insieme Ai ∩ Bj è ancora un’intersezione finita di elementi di Γ̃
e quindi A ∩ B ∈ τ .
Se τ è la meno fine tra le topologie su X per cui gli elementi di Γ ⊂ 2X sono
aperti, diciamo che Γ è una prebase di τ . Se ogni aperto non vuoto di τ è unione
di aperti di Γ ⊂ τ , diciamo che Γ è una base di τ .
Abbiamo:
Proposizione 1.4 Sia X un insieme, τ una topologia su X e Γ una prebase di
τ . Allora le intersezioni finite di aperti di Γ̃ = Γ ∪ {∅, X} formano una base di τ .

Proposizione 1.5 Sia X un insieme, τ una topologia su X e B una famiglia di


aperti. Condizione necessaria e sufficiente affinché B sia una base di τ è che per ogni
aperto non vuoto A di X ed ogni p ∈ A vi sia un aperto B ∈ B tale che p ∈ B ⊂ A.

Proposizione 1.6 Sia X un insieme e B una famiglia di sottoinsiemi di X.


Condizione necessaria e sufficiente affinché B sia una base degli aperti di una topo-
logia su X è che
S
(B1 ) B = X;
CAPITOLO I. SPAZI TOPOLOGICI 3

(B2 ) Le intersezioni finite di elementi di B sono unioni di elementi di B.

Dim. Si definisca τ come la famiglia formata dall’insieme vuoto e dalle unioni di


elementi di B. Si verifica allora che τ soddisfa gli assiomi di una topologia.
Esempio 1.2 (Topologia Euclidea su R.) Sia B la famiglia degli intervalli aperti
]a, b[= {x ∈ R | a < x < b} di R, al variare di a, b tra le coppie di numeri reali con
a < b. Poiché ogni intersezione finita di intervalli aperti è o l’insime vuoto o un
intervallo aperto, per la proposizione precedente la B è una base di una topologia
su R, che chiamiamo la topologia Euclidea su R.
Si verifica che gli intervalli aperti con estremi razionali sono ancora una base della
topologia Euclidea. Esempi di prebasi che S non sono basi sono dati dalla famiglia
delle semirette aperte {]a, +∞[ |a ∈ R} {] − ∞, a[ |a ∈ R} e dalla sottofamiglia
costituita dalle semirette aperte con origine razionale.
Esempio 1.3 (Topologia dell’ordine) Più in generale, sia X un insieme totalmente
ordinato, mediante una relazione ≺. Allora le semirette aperte Sa− {x ∈ X | x ≺ a}
e Sa+ {x ∈ X | a ≺ x}, al variare di a in X, formano una prebase di una topologia
su X in cui gli intervalli aperti {x ∈ X |a ≺ x ≺ b} sono aperti per ogni a, b in X.
Esempio 1.4 (Topologia dell’ordine a destra) Sia X un insieme totalmente or-
dinato mediante ≺. Allora la famiglia delle semirette aperte {Sa+ | a ∈ X} è una
prebase di una topologia su X, che si dice dell’ordine a destra.
In modo analogo si definisce la topologia dell’ordine a sinistra.
Sull’insieme N dei numeri naturali, con l’ordinamento usuale, la topologia dell’or -
dine e dell’ordine a sinistra coincidono con la topologia discreta, mentre quella
dell’ordine a destra è strettamente meno fine della topologia discreta.
Esempio 1.5 Su R la famiglia B degli intervalli [a, b[= {x ∈ R | a ≤ x < b} chiusi
a sinistra e aperti a destra è la base di una topologia strettamente più fine della
topologia Euclidea.

§2 Sottoinsiemi chiusi
Sia X = (X, τ ) uno spazio topologico. I complementari in X degli aperti si
dicono chiusi di X. La famiglia dei chiusi di X soddisfa gli assiomi:
(C1 ) ∅, X sono insiemi chiusi;
(C2 ) l’intersezione di una qualsiasi famiglia di chiusi è un chiuso;
(C3 ) l’unione di una famiglia finita di chiusi è un chiuso.
Viceversa, se chiamiamo ”chiusi” gli elementi di una famiglia C di sottoinsiemi
di X che soddisfi gli assiomi (C1 ), (C2 ) e (C3 ), allora la τ = {X \ A | A ∈ C} è la
famiglia degli aperti dell’unica topologia su X per cui la C sia la famiglia dei chiusi.
Osserviamo che la proprietà (C3 ) è equivalente a:
(C3′ ) Se A, B sono chiusi anche A ∪ B è chiuso.

Lemma 2.1 Se A è un aperto e B un chiuso dello spazio topologico X, allora A\B


è un aperto e B \ A un chiuso di X.

Dim. Abbiamo infatti:

A \ B = A ∩ (X \ B), B \ A = B ∩ (X \ A)
4 CAPITOLO I. SPAZI TOPOLOGICI

e quindi A \ B è aperto perché intersezione di due aperti e B \ A è chiuso perché


intersezione di due chiusi.
Sia Y un sottoinsieme di uno spazio topologico X. La famiglia K dei chiusi di X
che contengono Y è non vuota, in quanto X ∈ K. Per l’assioma (C2 ), l’intersezione
T
K è un chiuso, ed è il più piccolo chiuso di X che contiene Y . Esso si indica con
Y e si dice la chiusura di Y . I punti di Y si dicono aderenti ad Y . Tutti i punti
di Y sono aderenti ad Y . Un punto x aderente ad Y \ {x} si dice di accumulazione
per Y .
Un sottoinsieme Y di X è chiuso in X se e soltanto se è uguale alla propria
chiusura.

Sia Y un sottoinsieme dello spazio topologico X. Osserviamo che Y ⊂ Y ⊂ Y .

Chiamiamo frontiera di Y in X, e indichiamo con bY , la differenza Y \ Y .
Lemma 2.2 Sia X uno spazio topologico e siano A, B due sottoinsiemi di X.
Allora
(i) Se A ⊂ B, allora A ⊂ B;
(ii) A ∪ B = A ∪ B.

Dim. (i): Supponiamo sia A ⊂ B. Poiché B ⊃ B, B è un chiuso che contiene A


e quindi contiene la sua chiusura A.
(ii): Abbiamo A ∪ B ⊂ A ∪ B perché A ∪ B è un chiuso che contiene A ∪ B; poiché
A ∪ B è un chiuso che contiene sia A che B, esso contiene sia A che B e peciò vale
l’inclusione opposta A ∪ B ⊂ A ∪ B e quindi l’uguaglianza.

Lemma 2.3 Sia X uno spazio topologico e sia A un sottoinsieme di X. Allora:



z }| { ◦
(2.1) A = X \ X \ A, A = X \ X \ A.

Dim. Osserviamo che X \X \ A è un aperto contenuto in A e vale quindi l’inclusio -


◦ ◦ ◦
ne X \X \ A ⊂ A. È poi X \ A ⊂ X \ A perché X \ A è un chiuso che contiene
 X \A.
  ◦ ◦
Tra i complementari vale l’inclusione opposta: X \ X \ A ⊃ X \ X \ A = A
e perciò vale la seconda uguaglianza in (2.1).
La seconda uguaglianza in (2.1), applicata all’insieme X \ A, ci dà:

z }| {
X \ A = X \ X \ (X \ A) = X \ A .

z }| {
Quindi X \ X \ A = X \ (X \ A) = A ed otteniamo la prima delle (2.1).
Esempio 2.1 (Topologia di Zariski) Sia V uno spazio vettoriale di dimensione
finita su un campo K. Sia A(V ) la K-algebra delle funzioni polinomiali su V a
valori in K. Indichiamo con C la famiglia degli insiemi

C(F ) = {v ∈ V | f (v) = 0, ∀f ∈ F }
CAPITOLO I. SPAZI TOPOLOGICI 5

al variare di F tra i sottoinsiemi di A(V). Gli elementi di C sono i chiusi di una


topologia su V, che si dice la topologia di Zariski di V.
Verifichiamo che valgono gli assiomi (C1 ), (C2 ) e (C3 ).
Infatti ∅ = C(A(F )) e V = C({0}) appartengono entrambi a C, e quindi vale la
(C1 ).
Sia {Fi }i∈I una qualsiasi famiglia di sottoinsiemi di A(V). Allora ∩i∈I C(Fi ) =
C(∪i∈I Fi ) e quindi anche (C2 ) è verificata.
Per dimostrare che vale la (C3 ), osserviamo che se F ⊂ A(V) e indichiamo con
(F ) l’ideale di A(V) generato da F , allora C ((F )) = C(F ). Si verifica quindi
che, se {Fi }i∈I è una famiglia finita di sottoinsiemi di A(V), allora ∪i∈I C(Fi ) =
C (∩i∈I (Fi )).

§3 Intorni, frontiera
Sia X = (X, τ ) uno spazio topologico e sia x ∈ X. Si dice intorno di x un
qualsiasi sottoinsieme U di X che contenga x nella sua parte interna.
Una famiglia V di intorni di x si dice fondamentale se ogni intorno U di x contiene
un elemento V di V.
Gli aperti di X sono tutti e soli i sottoinsiemi A di X che sono intorni di ogni loro
punto. La topologia di X è quindi completamente determinata quando si conosca,
per ogni x ∈ X, un sistema fondamentale Vx di intorni di x.
Indichiamo con Ux la famiglia degli intorni di x ∈ X per una topologia τ su X.
Si verifica che {Ux | x ∈ X} gode delle seguenti proprietà:
(U1 ) Per ogni x ∈ X, Ux 6= ∅ e x ∈ U per ogni U ∈ Ux .
(U2 ) Per ogni x ∈ X ed U ∈ Ux esiste V ⊂ U tale che x ∈ V e V ∈ Uy per ogni
y ∈V.
(U3 ) Se U ⊂ V e U ∈ Ux , allora anche V ∈ Ux .
(U4 ) Se U1 , U2 ∈ Ux , allora anche U1 ∩ U2 ∈ Ux .
Viceversa, sia X un insieme e X ∋ x − → Ux ⊂ 2X un’applicazione che faccia
corrispondere ad ogni punto x di X una famiglia Ux di sottoinsiemi di X, in modo
che siano verificati gli assiomi (U1 ), (U2 ), (U3 ), (U4 ). Allora gli insiemi A ⊂ X tali
che A ∈ Uy per ogni y ∈ A formano gli aperti di una topologia su X, per cui le Ux
sono le famiglie degli intorni dei punti x ∈ X.
Possiamo caratterizzare la chiusura e la parte interna di un sottoinsieme di X
utilizzando il concetto di intorno. Abbiamo infatti:
Lemma 3.1 Sia X uno spazio topologico, A un sottoinsieme e x un punto di X.
Allora:

(i) x ∈ A se e soltanto se A è un intorno di x;
(ii) x ∈ A se e soltanto se ogni intorno di x ha con A intersezione non vuota.

Siano x un punto e A un sottoinsieme di uno spazio topologico X. Diciamo che:



x è interno ad A se x ∈ A ;
x è aderente ad A se x ∈ A ;
x è esterno ad A se x ∈
/ A;

x è di frontiera per A se x ∈ A \ A = bA ;
x è di accumulazione per A se x ∈ A \ {x}
6 CAPITOLO I. SPAZI TOPOLOGICI

L’insieme dei punti di accumulazione di A si dice il derivato di A. Un insieme chiuso


che coincida con l’insieme dei suoi punti di accumulazione si dice perfetto.

Un sottoinsieme A di X si dice denso se A = X e raro se A = ∅.

§4 Spazi metrici
Una distanza su un insieme X è una funzione

→R
d:X ×X −

che gode delle proprietà seguenti:

1) d(x, y) > 0 se x 6= y ∈ X e d(x, x) = 0 per ogni x ∈ X;


2) d(x, y) = d(y, x) per ogni x, y ∈ X;
3) d(x, y) ≤ d(x, z) + d(z, y) per ogni x, y, z ∈ X.

Chiamiamo spazio metrico la coppia (X, d) formata da un insieme X e da una


distanza d su X.
Esempio 4.1 Nello spazio Euclideo Rn , dati x = (x1 , ..., xn ) e y = (y1 , .., yn ) ∈
Rn , poniamo:
v
u n
uX
(4.1) d(x, y) = |x − y| = t (xi − yi )2 .
i=1

La d è una distanza, che si dice distanza Euclidea su Rn .


Esempio 4.2 In Cn , dati z = (z1 , ..., zn ) e w = (w1 , ..., wn ) poniamo
v
u n
uX
(4.2) d(z, w) = |z − w| = t |zi − wi |2 .
i=1

La d è una distanza su Cn , che si dice distanza Euclidea. Osserviamo che essa


coincide con la distanza Euclidea di R2n quando si identifichi z = (z1 , ..., zn ) ∈ Cn
ad x = (ℜz1 , . . . , ℜzn , ℑz1 , . . . , ℑzn ) ∈ R2n .
Esempio 4.3 (Lo spazio P∞metrico ℓ2 ) Sia ℓ2 l’insieme delle successioni {an }n≥1
di numeri reali tali che n=1 a2n < ∞. Se a = {an }, b = {bn } ∈ ℓ2 , poniamo
v
u∞
uX
(4.3) d(a, b) = ka − bk = t (an − bn )2 .
n=1

Questa funzione è ben definita su ℓ2 in quanto


∞ ∞
!
X X
(d(a, b))2 ≤ 2 a2n + b2n < ∞.
n=1 n=1

La verifica che questa sia una distanza su ℓ2 è analoga a quella per gli spazi Euclidei.
CAPITOLO I. SPAZI TOPOLOGICI 7

Sia (X, d) uno spazio metrico. Se x ∈ X e r è un numero reale positivo, l’insieme

(4.4) B(x, r) = {y ∈ X | d(x, y) < r}

si dice palla aperta di centro x e raggio r; l’iniseme

(4.5) B̄(x, r) = {y ∈ X | d(x, y) ≤ r}

si dice palla chiusa di centro x e raggio r; l’insieme

(4.6) S(x, r) = {y ∈ X | d(x, y) = r}

si dice sfera di centro x e raggio r.


Siano (X, d) uno spazio metrico e A, B due sottoinsiemi di X. Poniamo

(4.7) d(A, B) = inf{d(x, y) | x ∈ A, y ∈ B} .

Se x ∈ X scriveremo d(x, A) invece di d({x}, A).


Definiamo inoltre diametro dell’insieme A l’elemento di R ∪ {+∞}:

(4.8) diam(A) = sup{d(x, y) | x, y ∈ A} .

Quando diam(A) < ∞ diciamo che l’insieme A è limitato.


Teorema 4.1 Le palle aperte di uno spazio metrico (X, d) formano una base di
una topologia su X.

Dim. Siano x1 , ..., xn ∈ X e siano r1 , ..., rn numeri reali positivi. Per ogni x ∈
∩ni=1 B(xi , ri ) poniamo r(x) = inf 1≤i≤n ri − d(x, xi ). Il numero reale r è positivo e,
se y ∈ B(x, r(x)), allora per ogni 1 ≤ i ≤ n abbiamo

d(y, xi ) ≤ d(y, x) + d(x, xi ) < ri .


Tn
Ciò dimostra T
che B(x, r(x))S⊂ i=1 B(xi , ri )
n
e quindi i=1 B(xi , ri ) = x∈∩n B(xi ,ri ) B(x, r(x)). Quindi vale la proprietà
i=1
(B2 ) della Proposizione 1.6. La proprietà (B1 ) è senz’altro vera e quindi la tesi è
dimostrata.
La topologia su X che ha come base le palle aperte di una distanza d si dice
topologia metrica.
Osservazione Sia (X, d) uno spazio metrico. Per ogni punto x di X le palle
aperte di centro x e raggio 2−n (per n ∈ N) formano un sistema fondamentale
numerabile di intorni di x per la topologia indotta dalla metrica d.
Uno spazio topologico X = (X, τ ) che abbia come base le palle aperte di una
distanza d su X si dice metrizzabile.
Come vedremo nel seguito, non tutte le topologie sono metrizzabili e, nel caso
di topologie metrizzabili, diverse funzioni di distanza possono definire la stessa
topologia. Due distanze che inducano sull’insieme X la stessa topologia si dicono
topologicamente equivalenti.
8 CAPITOLO I. SPAZI TOPOLOGICI

Esempio 4.4 Sia X un insieme qualsiasi. La funzione:



0 se x = y
X × X ∋ (x, y) −
→ d(x, y) =
1 se x 6= y

è una distanza che induce su X la topologia discreta.


Se X = Z questa distanza è topologicamente equivalente alla

Z × Z ∋ (x, y) −
→ |x − y| ∈ R.

Esempio 4.5 La topologia indotta su Rn dalla distanza Euclidea si dice topologia


Euclidea di Rn .
Analogamente supporremo assegnata su ℓ2 la topologia indotta dalla metrica che
abbiamo definito sopra.
Osservazione → R definita da
Sia (X, d) uno spazio metrico e sia d1 : X × X −

d1 (x, y) = min{d(x, y), 1} ∀x, y ∈ X.

La d1 è una distanza su X, topologicamente equivalente a d. In particolare: ogni


distanza su un insieme X è topologicamente eqivalente ad una distanza in cui X è
limitato.

§5 Sottospazi e topologia indotta


Si verifica facilmente, utilizzando gli assiomi (O1 ), (O2 ), ((O3 ) che definiscono
una topologia, che vale la seguente
Proposizione 5.1 Sia τ una topologia su un insieme X e sia Y un sottoinsieme
di X. Allora
τ |Y = {A ∩ Y | A ∈ τ }
è una topologia su Y .
La topologia τ |Y si dice la topologia indotta da X = (X, τ ) su Y e Y = (Y, τ |Y ) si
dice sottospazio topologico di X. Se Y è un aperto di X, allora gli aperti di Y sono
anche aperti di X. Se Y è un chiuso di X, allora i chiusi di Y sono anche chiusi di
X.
Lemma 5.2 Sia X = (X, τ ) uno spazio topologico e A ⊂ Y ⊂ X due sottoinsiemi
di X. Allora la chiusura di A in Y è data da
Y X
A = A ∩ Y.

La topologia indotta da X su A coincide con la topologia indotta su A da Y.


Se la topologia τ su X è indotta da una distanza d : X × X −→ R su X, allora la
topologia indotta su Y coincide con la topologia indotta dalla restrizione a Y della
distanza su X.

Esempio 5.1 Indicheremo con


In = {(x1 , ..., xn ) ∈ Rn | 0 ≤ xi ≤ 1, i = 1, ..., n}
Dn = {(x1 , ..., xn ) ∈ Rn | x21 + ... + x2n ≤ 1}
Sn = {(x0 , x1 , ..., xn ) ∈ Rn | x20 + x21 + ... + x2n = 1}
CAPITOLO I. SPAZI TOPOLOGICI 9

(per n ≥ 1) rispettivamente il cubo e la palla unitari di dimensione n con la topologia


di sottospazio di Rn e la sfera di dimensione n (con n ≥ 0) con la topologia di
sottospazio di Rn+1 . Per n = 0, identifichiamo I0 e D0 all’insieme formato da
un solo punto, con la topologia discreta. Se n = 1, scriviamo I invece di I1 .
Osserviamo che S0 è l’insieme formato da una coppia di punti, con la topologia
discreta. Converremo che In = Dn = Sn = ∅ se n < 0.

§6 Ricoprimenti
Sia A un sottoinsieme di X. SSi dice ricoprimento di A una famiglia Γ di
sottoinsiemi di X tale che A ⊂ Γ. Un secondo ricoprimento ∆ di A si dice
inscritto in Γ o un raffinamento di Γ se si può definire un’applicazione ι : ∆ −→Γ
tale che A ⊂ ι(A) per ogni A ∈ ∆. La ι si dice funzione di raffinamento. Se ∆ ⊂ Γ
e la funzione di raffinamento è l’inclusione, diciamo che ∆ è un sottoricoprimento
di Γ.
Se X = (X, τ ) è uno spazio topologico, un ricoprimento Γ di un suo sottoinsieme
A si dice aperto (risp. chiuso) se ogni suo elemento è un aperto (risp. un chiuso)
di X.
Esso si dice localmente finito se ogni punto di X possiede un intorno Ux che ha
intersezione non vuota con al più un numero finito di elementi di Γ.
È ovvio che in ogni ricoprimento aperto se ne può inscrivere uno i cui insiemi
appartengano tutti a una base di aperti assegnata.
Un ricoprimento Γ di uno spazio topologico X si dice fondamentale se condizione
necessaria e sufficiente affinché un sottoinsieme A di X sia aperto è che A ∩ B sia
un aperto di B (per la topologia di sottospazio) per ogni B ∈ Γ.
Si ottiene una caratterizzazione equivalente dei ricoprimenti fondamentali sosti-
tuendo alla parola aperto la parola chiuso nella definizione precedente.
Teorema 6.1 Ogni ricoprimento aperto e ogni ricoprimento chiuso localmente
finito di uno spazio topologico X = (X, τ ) sono fondamentali.

Dim. È evidente che ogni ricoprimento aperto e ogni ricoprimento chiuso finito
sono fondamentali.
Supponiamo ora che Γ sia un ricoprimento chiuso localmente finito. La famiglia
∆ degli aperti di X che intersecano solo un numero finito di elementi di Γ è un
ricoprimento aperto di X e dunque fondamentale. Sia A un sottoinsieme di X tale
che A ∩ B sia aperto in B per ogni B ∈ Γ. Allora A ∩ B ∩ C è un aperto di B ∩ C
per ogni B ∈ Γ e C ∈ ∆. Poiché {B ∩ C | B ∈ Γ} è un ricoprimento chiuso finito di
C ∈ ∆, ne segue che A ∩ C è aperto in C per ogni C ∈ ∆ e quindi che A è aperto
in X in quanto ∆ è fondamentale.

Esempio 6.1 Se A, B sono due sottoinsiemi di uno spazio topologico X tali che
◦ ◦
A ∪ B = X, allora {A, B} è un ricoprimento fondamentale di X.
Se Γ è un ricoprimento fondamentale inscritto in un ricoprimento ∆, allora ∆ è
anch’esso fondamentale.
Proposizione 6.2 Sia Γ un qualsiasi ricoprimento di un insieme X e sia asse-
gnata, per ogni A ∈ Γ, una topologia τA su A. Allora

τ = {Y ⊂ X | Y ∩ A ∈ τA ∀A ∈ Γ}
10 CAPITOLO I. SPAZI TOPOLOGICI

è una topologia su X, rispetto alla quale Γ è un ricoprimento fondamentale. La


topologia indotta dalla τ su ciascun sottoinsieme A ∈ Γ è meno fine della τA .

Dim. Si verifica facilmente che τ è una topologia su X. Gli aperti di τ |A sono


tutti e soli i sottoinsiemi della forma B ∩ A con B ∈ τ . Essi appartengono quindi a
τA per la definizione di τ , onde τ |A ⊂ τA . Da questo segue che Γ è un ricoprimento
fondamentale per X = (X, τ ). Infatti un sottoinsieme B di X che intersechi ogni
A ∈ Γ in un aperto di τ |A ⊂ τA è aperto in X per la definizione della topologia τ
e viceversa ogni aperto B di X interseca ogni A di Γ in un aperto della topologia
relativa.
Sia Γ un ricoprimento qualsiasi di uno spazio topologico X = (X, τ ). Per la
proposizione precedente, la

τΓ = {B ⊂ X | B ∩ A ∈ τ |A }

è una topologia su X. Essa coincide con la τ se Γ è un ricoprimento fondamentale,


mentre è strettamente più fine della τ se Γ non è fondamentale. La τΓ si dice la
topologia debole associata al ricoprimento Γ.
Esempio 6.2 Sia X uno spazio topologico e sia Γ = {{x} |x ∈ X}. La topologia
debole del ricoprimento Γ è la topologia discreta su X.
Esempio 6.3 Su R2 con la topologia Euclidea consideriamo il ricoprimento Γ
formato da tutte le rette passanti per l’origine. La topologia debole del ricoprimento
Γ è strettamente più fine della topologia Euclidea. Infatti l’insieme A descritto in
coordinate polari (x = r cos θ, y = r sin θ) da:

A = {r < | sin θ|} ∪ {(x, 0) | x ∈ R}

è un aperto di τΓ ma non è un intorno di (0, 0) nella topologia Euclidea, in quanto


non contiene nessuna palla aperta di raggio positivo con centro in (0, 0).

§7 Applicazioni continue
Siano X = (X, τX ) e Y = (Y, τY ) due spazi topologici.
Un’applicazione f : X −→ Y si dice continua se l’immagine inversa mediante f
di un qualsiasi aperto di Y è un aperto di X:

(7.1) f :X−
→Y è continua ⇐⇒ f −1 (A) ∈ τX ∀A ∈ τY .

Poiché per ogni A ⊂ Y risulta f −1 (Y \A) = X\f −1 (A), un’applicazione f : X − →Y


è continua se e soltanto se l’immagine inversa di un qualsiasi chiuso di Y è un chiuso
di X.
Teorema 7.1 Sia Y = (Y, τY ) uno spazio topologico, X un insieme e f : X −
→Y
un’applicazione. Allora la famiglia di sottoinsiemi di X

f ∗ (τY ) = {f −1 (A) | A ∈ τY }

è una topologia su X.
Se Γ è una base (risp. prebase) di τY , allora

f ∗ (Γ) = {f −1 (A) | A ∈ Γ}
CAPITOLO I. SPAZI TOPOLOGICI 11

è una base (risp. prebase) della topologia f ∗ (τY ).

Dim. Abbiamo f −1 (∅) = ∅ e f −1 (Y ) = X. Inoltre, per ogni famiglia {Ai | i ∈ I}


di sottoinsiemi di Y risulta:
! !
[ [ \ \
f −1 (Ai ) = f −1 Ai , f −1 (Ai ) = f −1 Ai .
i∈I i∈I i∈I i∈I

Da queste considerazioni segue immediatamente la tesi.


La topologia f ∗ (τY ) costruita nel teorema precedente si dice il pull-back o im-
magine inversa su X della topologia τY su Y mediante l’applicazione f : X − →Y.
Un’applicazione f : X − → Y tra due spazi topologici X = (X, τX ) e Y = (Y, τY )
è continua se e soltanto se f ∗ (τY ) ⊂ τX , cioè se e soltanto se la topologia di X è
più fine del pull-back su X, mediante f , della topologia di Y.
Da questa osservazione ricaviamo il criterio:
Teorema 7.2 Siano X = (X, τX ), Y = (Y, τY ) due spazi topologici e Γ ⊂
τY una prebase degli aperti di Y. Condizione necessaria e sufficiente affinché
un’applicazione f : X −
→ Y sia continua è che, per ogni aperto A della prebase
−1
Γ, f (A) sia un aperto di τX .

Teorema 7.3 La composizione di applicazioni continue è un’applicazione conti-


nua.

Dim. Siano X, Y e Z tre spazi topologici e siano f : X − →Y eg:Y − → Z due


−1
applicazioni continue. Se A è un aperto di Z, allora g (A) è un aperto di Y e
quindi f −1 (g −1 (A)) = (g ◦ f )−1 (A) è un aperto di X. Dunque g ◦ f : X −
→ Z è
un’applicazione continua.

Lemma 7.4 Sia f : X −→ Y un’applicazione continua tra due spazi topologici X,


Y. Siano A ⊂ X e B ⊂ Y tali che f (A) ⊂ B. Allora l’applicazione

f |B
A :A∋x−
→ f (x) ∈ B

è continua per le topologie di sottospazio su A e B.

Dim. Sia U un aperto di B. Possiamo allora trovare un aperto Ũ di Y tale che


U = B ∩ Ũ . Allora

f −1 (U ) = f −1 (B ∩ Ũ ) = f −1 (B) ∩ f −1 (Ũ )

e quindi
(f |B
A)
−1
(U ) = A ∩ f −1 (B) ∩ f −1 (Ũ ) = A ∩ f −1 (Ũ )
è un aperto della topologia indotta su A da X.
L’applicazione f |B
A introdotta sopra si dice abbreviazione di f al dominio A
e al codominio B. Se B = Y , scriviamo semplicemente f |A e chiamiamo tale
applicazione restrizione di f ad A.
12 CAPITOLO I. SPAZI TOPOLOGICI

f (X)
Osserviamo che f : X − → Y è continua se e soltanto se f |X è continua.
B
Per semplicità, indicheremo a volte l’abbreviazione f |A di f mediante f : A −
→ B.
Osservazione Sia f : X − → Y un’applicazione tra due insiemi X e Y e siano
τ1 ⊂ τ2 due topologie su X e σ1 ⊂ σ2 due topologie su Y . Se f è continua per la
topologia τ1 su X e la topologia σ2 su Y , allora è continua anche per le topologie
τ2 su X e σ1 su Y : un’applicazione continua rimane cioè continua quando si passi
a una topologia meno fine nel codominio e a una più fine sul dominio.
Lemma 7.5 La topologia di sottospazio su un sottoinsieme A ⊂ X di uno spazio
topologico X è la meno fine tra quelle che rendono l’applicazione di inclusione

ι:A∋x−
→x∈X

continua.

Teorema 7.6 Sia Γ un ricoprimento fondamentale di uno spazio topologico X.


Supponiamo che per ogni A ∈ Γ sia assegnata un’applicazione

fA : A −
→Y

di A in uno spazio topologico Y che sia continua per la topologia di sottospazio su


A. Se

(7.2) fA |A∩B = fB |A∩B ∀A, B ∈ Γ

risulta definita un’unica applicazione continua f : X −


→ Y tale che f |A = fA per
ogni A ∈ Γ.

Dim. Osserviamo che la (7.2) ci consente di definire un’unica applicazione f :


X− → Y tale che f |A = fA per ogni A ∈ Γ. Se U è un aperto di Y, allora f −1 (U )
è un aperto di X perché
f −1 (U ) ∩ A = fA−1 (U )
è un aperto di A per ogni elemento A del ricoprimento fondamentale Γ. Osserviamo
che viceversa, per il Lemma 7.4, se f è continua, tutte le fA = f |A sono continue.

Esempio 7.1 Siano R+ = {x ∈ R | x ≥ 0} e R− {x ∈ R | x ≤ 0}. Sia X uno


spazio topologico e f+ : R+ − → X, f− : R− − → X due applicazioni continue. Se
f+ (0) = f− (0), allora l’applicazione f : R −
→ X definita da:

f− (x) se x ≤ 0
f (x) =
f+ (x) se x ≥ 0

è continua. Infatti {{x ≤ 0}, {x ≥ 0}} è un ricoprimento chiuso finito e quindi


fondamentale di R.
Sia f : X −
→ Y un’applicazione tra due spazi topologici X, Y. Diciamo che f è
continua nel punto x ∈ X se per ogni intorno V di f (x) in Y, f −1 (V ) è un intorno
di x in X. Chiaramente è sufficiente verificare questa proprietà al variare di V in
CAPITOLO I. SPAZI TOPOLOGICI 13

un sistema fondamentale di intorni di f (x) in Y. In particolare, nel caso in cui uno


o entrambi gli spazi X, Y siano metrici, otteniamo il:
Teorema 7.7 Sia (Y, d) uno spazio metrico, X uno spazio topologico. Condizione
necessaria e sufficiente affinché un’applicazione f : X −→ Y sia continua in x0 ∈ X
per la topologia su Y indotta dalla metrica d è che per ogni ǫ > 0 esista un intorno
Uǫ di x0 in X tale che
d (f (x), f (x0 )) < ǫ ∀x ∈ Uǫ .

Sia (X, d) uno spazio metrico, Y uno spazio topologico. Condizione necessaria
e sufficiente affinché un’applicazione f : X −
→ Y sia continua in un punto x0 ∈ X
è che, fissato un sistema fondamentale di intorni Γ di f (x0 ) in Y, per ogni V ∈ Γ
esista un numero reale δ > 0 tale che

f (x) ∈ V ∀x ∈ X con d(x, x0 ) < δ .

Siano (X, d), (Y, d′ ) spazi metrici. Un’applicazione f : X −


→ Y è continua in
x0 ∈ X se e soltanto se per ogni ǫ > 0 esiste δ > 0 tale che

d(x, x0 ) < δ =⇒ d′ (f (x), f (x0 )) < ǫ .

Teorema 7.8 Sia f : X − → Y un’applicazione tra due spazi topologici X, Y.


Condizione necessaria e sufficiente affinché f sia continua è che essa sia continua in
ogni punto.

Dim. Supponiamo f continua e sia x ∈ X. Un intorno V di f (x) contiene un


aperto A con f (x) ∈ A ⊂ V . Allora f −1 (V ) ⊃ f −1 (A) ∋ x è un intorno di x perché
f −1 (A) è aperto in quanto abbiamo supposto f continua.
Viceversa, se f è continua in ogni punto di X, l’immagine inversa di un aperto
di Y è un aperto di X perché intorno di ogni suo punto.
Un’applicazione f : X − → Y tra due spazi topologici X, Y si dice un omeomor-
fismo se è bigettiva e sia f che f −1 sono continue.
Un’applicazione f : X − → Y tra due spazi topologici X e Y si dice un omeomor-
fismo locale se per ogni punto x0 ∈ X possiamo trovare un intorno aperto U di x0
in X tale che
(i) f (U ) sia un aperto di Y ,
f (U )
(ii) f |U : U − → f (U ) sia un omeomorfismo.

Osservazione Se F è una famiglia di spazi topologici, l’esistenza di un omeo-


morfismo tra due elementi di F è una relazione di equivalenza in F.
Infatti l’applicazione identica è un omeomorfismo di uno spazio topologico in se
stesso, l’inversa di un omeomorfismo è ancora un omeomorfismo e la composizione
di omeomorfismi è ancora un omeomorfismo.

Esempio 7.2 Dn = {x ∈ Rn | |x| < 1} è omeomorfo a Rn . Un omeomorfismo è
descritto da:
◦ x
Dn ∋ x −
→ ∈ Rn ,
1 − |x|
14 CAPITOLO I. SPAZI TOPOLOGICI

che ha come inversa


y ◦
Rn ∋ y −
→ ∈ Dn .
1 + |y|

Esempio 7.3 Il cubo In è omeomorfo a Dn .


La frontiera bIn = {x = (x1 , ..., xn ) ∈ Rn | sup1≤i≤n |xi − 1/2| = 1/2} di In in
Rn è omeomorfa a Sn−1 .

La parte interna I n = {x = (x1 , ..., xn ) ∈ Rn | 0 < xi < 1, i = 1, ..., n} di In in

Rn è omeomorfa alla parte interna Dn di Dn in Rn .
Sia e1 , ... en la base canonica di Rn . Poniamo poi, per x = (x1 , ..., xn ) ∈ Rn ,
kxk = supi=1,...,n |xi |. Consideriamo l’applicazione f : Rn −
→ Rn definita da
(  
|x|
1/2 kxk x + e1 + ... + en se x 6= 0
f (x) = .
1/2(e1 + ... + en ) se x = 0

◦ ◦
La sua abbreviazione a Dn , I n , a S n−1 , bI n , a Dn , I n dà gli omeomorfismi cercati.
Esempio 7.4 (Proiezione stereografica) Indichiamo con e0 , e1 , ..., en la base
canonica di Rn+1 . Sn −{e0 } è omeomorfo a Rn . Un omeomorfismo è descritto dalla
proiezione stereografica:
 
n 2x1 2xn
S − {e0 } ∋ x = (x0 , x1 , ..., xn ) −
→ , ..., ∈ Rn .
1 − x0 1 − x0

La sua inversa è data dalla:


 
n |y|2 − 4 4y
R ∋y−
→ 2
, 2 ∈ Sn .
|y| + 4 |y| + 4

Identificando Rny all’iperpiano affine Σ = {x0 = −1} ⊂ Rn+1


x , la proiezione stereo-
n
grafica associa ad ogni punto x di S \ {e0 } l’intersezione di Σ con la retta affine
passante per i punti e0 e x.
Si possono ottenere altri omeomorfismi sostituendo a Σ, in questa costruzione,
un qualsiasi altro iperpiano affine che non contenga il punto e0 . In particolare,
se scegliamo l’iperpiano equatoriale Σ′ = {x0 = 0}, otteniamo l’omeomorfismo
(proiezione di Tolomeo)
 
n x1 xn
S \ {e0 } ∋ x −
→ ,..., ∈ Rn
1 − x0 1 − x0

con inversa
 
n |y|2 − 1 2y1 2yn
R ∋y−
→ 2
, 2
,... ∈ Sn \ {e0 }.
1 + |y| 1 + |y| 1 + |y|2

La proiezione di Tolomeo ha il vantaggio di essere conforme: essa trasforma cerchi


di Sn in cerchi o rette di Rn e preserva l’angolo dell’intersezione di due cerchi di
Sn .
CAPITOLO I. SPAZI TOPOLOGICI 15

Esempio 7.5 Sia S1 = {z ∈ C | |z| = 1}. Allora per ogni intero m 6= 0


l’applicazione
fm : S 1 ∋ z −
→ z m ∈ S1
è un omeomorfismo locale. Essa è un omeomorfismo se e soltanto se m = ±1.
Sia infatti z0 = eiθ0 un punto di S1 . Allora

Uz0 = {eiθ | |θ − θ0 | < π/|m|}

è un intorno aperto di z0 in S1 . L’applicazione

Uz0 ∋ eiθ −
→ eimθ ∈ {eiφ | |φ − mθ0 | < π}

ha inversa continua eiφ − → eiφ/m e quindi è un omeomorfismo. Osserviamo che


2
f±1 = id|S1 e quindi f±1 sono omeomorfismi; fm non è un omeomorfismo quando
m 6= ±1 perché non è iniettiva.
Esempio 7.6 L’applicazione

→ eiθ ∈ S1
R∋θ−

è un omeomorfismo locale, ma non un omeomorfismo in quanto non è iniettiva.


Esempio 7.7 Sia Ċ l’insieme dei numeri complessi z diversi da 0. Consideriamo
le applicazioni:

→ z m ∈ Ċ e
fm : Ċ ∋ z − → ez = eRe z (cos(Im z) + i sin(Im z)) ∈ Ċ.
exp : C ∋ z −

Le fm sono omeomorfismi locali quando m 6= 0 ed omeomorfismi se m = ±1.


L’applicazione esponenziale è un omeomorfismo locale.
Si chiama immersione topologica un’applicazione continua f : X − → Y tra due
f (X)
spazi topologici X e Y la cui abbreviazione f |X sia un omeomorfismo.
Si chiama immersione topologica locale un’applicazione continua f : X − → Y tra
f (X)
due spazi topologici X e Y la cui abbreviazione f |X sia un omeomorfismo locale.
Osserviamo che la restrizione di un’immersione topologica (o di una immersione
topologica locale) f : X −
→ Y a un aperto di X è ancora un’immersione topologica
(risp. un’immersione topologica locale).1
Esempio 7.8 Se X ⊂ Y è un sottospazio topologico di Y, allora l’inclusione
ι:X−→ Y è un’immersione topologica.
Esempio 7.9 L’applicazione R ∋ θ −→ eiθ ∈ C è una immersione topologica locale.
→ eiθ ∈ C non è né un’immersione topologica, né
L’applicazione [0, 2π[∋ θ −
un’immersione topologica locale.
Esempio 7.10 L’applicazione

S1 ∋ eiθ −
→ (1 − cos(2θ))eiθ ∈ C
1 Immersione e immersione locale corrispondono alle parole inglesi embedding e immersion
rispettivamente.
16 CAPITOLO I. SPAZI TOPOLOGICI

è un’immersione topologica locale, ma non un’immersione topologica perché non è


iniettiva.
Sia X uno spazio topologico e sia Y un sottoinsieme di X. Un’applicazione
continua X − → Y tale che f (y) = y per ogni y ∈ Y si dice una retrazione di X su
Y . Un sottoinsieme Y di X per cui si possa trovare una retrazione di X su Y si
dice un retratto di X.
Esempio 7.11 Ogni punto di uno spazio topologico è un suo retratto. L’insieme
{0, 1} non è un retratto di R, ma è un retratto ad esempio del sottospazio Q di R.
Teorema 7.9 Sia Y ⊂ X un sottoinsieme di uno spazio topologico X. Condizione
necessaria e sufficiente affinché Y sia un retratto di X è che per ogni spazio topo-
logico Z e ogni applicazione continua f : Y − → Z si possa trovare un’applicazione
˜
continua f : X −→ Z che la estenda, tale cioè che f˜|Y = f .

Dim. Se φ : X − → Y è una retrazione, per ogni f : Y −→ Z continua da Y in uno


spazio topologico Z possiamo definire l’estensione mediante f˜ = f ◦ φ.
Viceversa, una retrazione φ : X − → Y non è altro che una estensione continua a
X dell’applicazione identica di Y in sè.

Teorema 7.10 Sia (X, d) uno spazio metrico e A un sottoinsieme non vuoto di
X. Allora la funzione

→ d(x, A) = inf{d(x, y) | y ∈ A} ∈ R
X∋x−

è continua per la topologia definita su X dalla distanza.

Dim. Siano x, y ∈ X e z ∈ A. Allora

d(x, A) ≤ d(x, z) ≤ d(x, y) + d(y, z).

Passando all’estremo inferiore rispetto a z ∈ A, troviamo allora

d(x, A) ≤ d(x, y) + d(y, A) ∀x, y ∈ X

da cui si ricava (considerando l’analoga disuguaglianza che si ottiene scambiando y


e x):
|d(x, A) − d(y, A)| ≤ d(x, y).
Questa diseguaglianza implica la continuità.
Un sottoinsieme A di uno spazio topologico X si dice ritagliabile se è possibile
trovare una funzione continua f : X −→ I = [0, 1] che valga 0 su A e sia positiva su
X − A. In questo caso diciamo che f ritaglia A. Tutti gli insiemi ritagliabili sono
chiusi e, per il teorema precedente, i chiusi di uno spazio topologico metrizzabile
sono ritagliabili.
Esempio 7.12 Sia X un insieme e sia B(X) l’insieme di tutte le funzioni f : X −

R limitate, tali cioè che supx∈X |f (x)| < +∞. Allora

d(f, g) = sup |f (x) − g(x)|


x∈X
18 CAPITOLO I. SPAZI TOPOLOGICI

è una distanza su B(X).


Sia ora assegnata una topologia τ su X e sia {fn } una successione di funzioni
continue e linitate su X a valori in R. Se vi è una funzione f ∈ B(X) tale che

lim d(f, fn ) = 0
n−
→∞

allora f è continua.
Sia infatti x ∈ X e sia ǫ > 0. Fissiamo n in modo che d(f, fn ) < ǫ/3. Possiamo
trovare allora un intorno aperto U di x in X tale che |fn (x) − fn (y)| < ǫ/3 per ogni
y ∈ U . Abbiamo quindi, per y ∈ U :

|f (x) − f (y)| ≤|f (x) − fn (x)| + |fn (x) − fn (y)| + |fn (y) − f (y)|
≤d(f, fn ) + ǫ/3 + d(fn , f ) < ǫ

e questo dimostra che f è continua in x. Dunque f è continua in ogni punto di X


e pertanto è continua in x.
Un’applicazione f : X −
→ Y tra due spazi topologici X e Y si dice aperta (risp.
chiusa) se trasforma aperti di X in aperti di Y (risp. chiusi di X in chiusi di Y).
Un’applicazione continua, chiusa ed aperta si dice un omomorfismo topologico.
Gli omeomorfismi sono esempi di omomorfismi topologici.
Teorema 7.11 Se f : X −
→ Y è un omeomorfismo locale, allora è aperta.

Dim. Sia A un aperto di X. Per ogni punto x ∈ A possiamo trovare un intorno


f (U )
aperto Ux di x tale che f (Ux ) sia un aperto di Y e f |Ux x sia un omeomorfismo.
In particolare Vx = f (Ux ∩ A) è un aperto di f (Ux ) e quindi di Y. Allora f (A) =
∪x∈A Vx è un aperto di Y.
II. COSTRUZIONI TOPOLOGICHE 19

CAPITOLO II

COSTRUZIONI TOPOLOGICHE

§1 Prodotti topologici
Dal Teorema I.5.1 e dalla Proposizione I.1.1 segue immediatamente:
Teorema 1.1 Sia X un insieme e sia {Xi = (X, τi ) | i ∈ I} una famiglia di spazi
topologici, parametrizzata da un insieme I di indici. Supponiamo assegnata, per
ogni i ∈ I, un’applicazione fi : X − → Xi . Vi è un’unica topologia τ su X, meno
fine tra tutte quelle che rendono continue tutte le applicazioni fi . Una prebase Γ
di tale topologia è costituita dai sottoinsiemi di X:
[
Γ = {fi−1 (A) | A ∈ τi }
i∈I

e una base B dai sottoinsiemi

B = {∩i∈J f −1 (Ai ) | J ⊂ I finito, Ai ∈ τi ∀i ∈ J}.

La topologia τ è infatti la meno fine tra tutte le topologie su X che sono più fini
di ognuna delle fi∗ (τi ).
Y
Ricordiamo che il prodotto cartesiano X = Xi di una I-upla (Xi | i ∈ I) di
i∈I S
insiemi è l’insieme di tutte le applicazioni x : I −→ i∈I Xi tali che x(i) = xi ∈ Xi
per ogni i ∈ I. Chiaramente X = ∅ se uno dei fattori Xi è vuoto. Ammetteremo
nel seguito che valga l’assioma della scelta, che cioè, se I 6= ∅ e Xi 6= ∅, il prodotto
cartesiano di una qualsiasi I-upla2 di insiemi non vuoti sia un insieme non vuoto.
YSia (Xi = (Xi , τi ) | i ∈ I) una I-upla di spazi topologici non vuoti. Sia X =
Xi il loro prodotto cartesiano. Per ogni indice h ∈ I indichiamo con
i∈I

πh : X ∋ x −
→ x(h) = xh ∈ Xh

la proiezione sulla h-esima coordinata.


Chiamiamo topologia prodotto su X la meno fine tra leYtopologie che rendono
continue tutte le proiezioni πh per h ∈ I. L’insieme X = Xi , con la topologia
i∈I
prodotto τ , si dice prodotto topologico della I-upla di spazi topologici (Xi )i∈I .
2 Supporremo sempre nel seguito I 6= ∅.
20 II. COSTRUZIONI TOPOLOGICHE

Lemma 1.2 Sia m un intero positivo, (Xi = (Xi , τi ) | i = 1, ..., m) una m-upla di
spazi topologici non vuoti e sia X = (X, τ ) il loro prodotto topologico. Allora

B = {A1 × ... × Am | A1 ∈ τ1 , ..., Am ∈ τm }

è una base della topologia τ .

Dim. Il lemma è una conseguenza immediata del Teorema 1.1 e della definizione
di topologia prodotto.

Esempio 1.1 La topologia Euclidea di Rn è la topologia prodotto di n copie di R


con la topologia Euclidea.
Esempio 1.2 Consideriamo RN (insieme delle successioni di numeri reali) con la
topologia di prodotto topologico di una famiglia numerabile di copie di R con la
topologia Euclidea. Un sistema fondamentale di intorni di una successione a = (an )
in questa topologia è dato dalla famiglia

Ua = {x = (xn ) ∈ RN | |xj − aj | < 2−m per j ≤ m} | m ∈ N .

Esempio 1.3 Sia Y un insieme contenente almeno due punti, su cui consideriamo
la topologia discreta. Sia X = Y N l’insieme delle successioni a valori in Y , con
la topologia prodotto. La topologia di X è strettamente meno fine della topologia
discreta: una base degli aperti di X è costituita dagli insiemi

{(yn ) | yj = aj ∀j ≤ m}

al variare di m tra gli interi positivi e di (a0 , ..., am ) tra le m-uple di elementi di Y .

Osservazione Nel caso di un prodotto finito di spazi topologici una base di aperti
per la topologia prodotto è dataYdai prodotti di aperti dei singoli fattori. Invece
nel caso di un prodotto infinito Xi una base di aperti è costituita dai prodotti
i∈I
Y
di aperti Ai in cui tutti gli Ai , tranne al più un numero finito, siano uguali ad
i∈I
Xi . Infatti una base del prodotto sarà costituita dalle intersezioni finite di elementi
della prebase definita nel Lemma 1.2. In particolare se A è un aperto nella topologia
prodotto, abbiamo πi (A) = Xi per tutti, tranne al più un insieme finito di indici
i ∈ I.

i ) | i ∈ I) è una I-upla di spazi topologici non vuoti,


Osservazione (Se (Xi = (Xi , τ)
Y Y
la famiglia α = Ai | Ai ∈ τi è una base di una topologia su Xi , che si dice
i∈I i∈I
la topologia delle scatole. Essa coincide con la topologia prodotto se il numero di
fattori del prodotto che contengano più di un elemento è finito, ed è strettamente
più fine della topologia prodotto se tale numero è infinito.
Consideriamo ad esempio l’insieme X di tutte le applicazioni f : R − → R. Esso si
può considerare come il prodotto cartesiano di tante copie di R quanti sono i numeri
II. COSTRUZIONI TOPOLOGICHE 21

reali. Una base della topologia prodotto su X si ottiene considerando i sottoinsiemi


di X:
{f ∈ X | f (xi ) ∈]ai , bi [, i = 1, ..., n}
al variare di n tra i numeri naturali, e di xi e ai < bi tra i numeri reali. Questa è
la topologia della convergenza puntuale. La topologia delle scatole ha invece come
base degli aperti insiemi della forma

{f ∈ X | α(x) < f (x) < β(x)}

al variare di α, β tra le coppie di funzioni reali di variabile reale tali che α(x) < β(x)
per ogni x ∈ R. Questa topologia è più fine di quella della convergenza uniforme.

Teorema 1.3 Sia f : Y − → X un’applicazione


Q di uno spazio topologico Y in
uno spazio topologico prodotto X = i∈I Xi . Condizione necessaria e sufficiente
affinché f sia continua è che siano continue tutte le applicazioni fi = πi ◦ f : Y −

Xi (per i ∈ I) che si ottengono componendo la f con le proiezioni sui singoli fattori.

Dim. Poiché le proiezioni sui singoli fattori sono continue, se f è continua anche
le fi sono continue perché composte di applicazioni continue.
Supponiamo viceversa che tutte le fi siano continue. Gli aperti πi−1 (A) al variare
di i in I e di A tra gli aperti di Xi formano una prebase della topologia di X. Per
ciascuno di questi aperti f −1 (πi−1 (A)) = fi−1 (A) è aperto in Y . Quindi f è continua
perché sono aperte in Y le immagini inverse degli aperti di una prebase di X.
Q
Teorema 1.4 Sia X = (X = i Xi , τ ) il prodotto topologico di una I-upla di
spazi topologici non vuoti (Xi = (Xi , τi ) | i ∈ I). Fissato un elemento x0 ∈ X e un
indice h ∈ I, indichiamo con Xh (x0 ) il sottospazio di X:

Xh (x0 ) = {x ∈ X | xi = x0i ∀i 6= h}.

Sia ι = ιh,x0 l’applicazione ι : Xh −


→ X definita da

x0i ∀i 6= h
(ι(t))i =
t per i = h.

L’applicazione ι è un’immersione topologica, che ha per immagine il sottospazio


Xh (x0 ) di X.

Dim. La continuità di ι segue dal teorema precedente: πi ◦ ι è costante se i 6= h


X (x0 )
e l’identità su Xh quando i = h. La ι|Xhh è un omeomorfismo topologico perché
la sua inversa è continua essendo la restrizione πh |Xh (x0 ) della proiezione πh al
sottospazio Xh (x0 ).
Q
Teorema 1.5 Sia X = (X = i Xi , τ ) il prodotto topologico di una I-upla
di spazi topologici non vuoti (Xi = (Xi , τi ) | i ∈ I). Le proiezioni sulle coordinate
πi : X −
→ Xi sono applicazioni aperte.

Dim. Usiamo le notazioni introdotte nel teorema precedente.


22 II. COSTRUZIONI TOPOLOGICHE

Fissiamo un indice j ∈ I. Se A è un aperto di X, allora A ∩ Xj (x) è un aperto


di Xj (x) per ogni x ∈ X. Per il teorema precedente le applicazioni πj |Xj (x) :
Xj (x) − → Xj sono omeomorfismi per ogni x ∈ X. In particolare tutti gli insiemi
πj (A ∩ Xj (x)) = πj |Xj (x) (A ∩ Xj (x)) sono aperti di Xj e quindi
[
πj (A) = πj (A ∩ Xj (x))
x∈X

è un aperto di Xj .

Proposizione 1.6 Sia X il prodotto topologico di una I-upla di spazi topologici


(Xi | i ∈ I). Sia Fi , per ogni indice i ∈ I, un sottoinsieme chiuso di Xi . Il prodotto
Y
Fi è un chiuso di X.
i∈I

Dim. Per ogni indice i ∈ I l’insieme Ai = Xi − Fi è aperto in Xi . Quindi


Y [
X− Fi = πj−1 (AJ )
i∈I j∈J

è aperto in X.

Teorema 1.7 Sia X il prodotto topologico di una I-upla di spazi topologici


(Xi = (Xi , τi ) | i ∈ I), ciascuno dei quali contenga almeno due elementi.
Condizione necessaria e sufficiente affinché X sia metrizzabile è che ciascuno dei
fattori Xi sia metrizzabile e che l’insieme di indici I sia finito o al più numerabile.

Dim. Supponiamo che X = (X, τ ) sia metrizzabile. Allora tutti i suoi sottospazi
sono metrizzabili. Per il Teorema 1.3 ogni fattore sarà allora metrizzabile perché
omeomorfo a un sottospazio topologico di X. Per dimostrare che l’insieme di indici I
è al più numerabile, fissiamo una distanza d su X che induca la topologia prodotto di
X. Sia x0 un punto di X. Allora gli intorni aperti B(x0 , 2−n ) = {x ∈ X | d(x, x0 ) <
2−n } di x0 al variare di n in N formano un sistema fondamentale di intorni aperti di
x0 in X. Per ogni n ∈ N l’insieme In degli indici i ∈ I per cui πi (B(x0 , 2−n )) 6= Xi
è finito. Quindi I ′ = ∪n∈N In è un insieme finito o al più numerabile. Mostriamo
che I = I ′ . Ragioniamo per assurdo. Se cosı̀ non fosse, potremmo trovare un indice
h ∈ I \ I ′ . Per la definizione di I ′ abbiamo Xh ⊂ πh (B(x0 , 2−n )) per ogni n ∈ N e
quindi πh (U ) = Xh per ogni intorno U di x0 in X.
Fissiamo una distanza dh su Xh che induca la topologia τh di Xh . Poiché Xh
contiene almeno due punti, possiamo fissare in Xh un punto x1h distinto da x0h . Sia
0 < r < dh (x1h , x0h ). Allora U = πh−1 (Bh (x0h , r)) è un intorno aperto di x0 in X, con
πh (U ) ⊂ Xh . Abbiamo ottenuto una contraddizione e quindi I = I ′ è finito o al
6=
più numerabile.
Supponiamo ora che I sia un insieme numerabile o finito e gli Xi siano tutti
metrizzabili. Possiamo supporre che I ⊂ N. Fissiamo su ciascuno degli spazi
topologici Xi una distanza di che induca su Xi la topologia τi e rispetto alla quale
Xi abbia diametro ≤ 1. Definiamo allora una funzione d su X × X a valori reali
mediante: X
d(x, y) = 2−i di (xi , yi ) ∀x, y ∈ X.
i∈I
II. COSTRUZIONI TOPOLOGICHE 23

Si verifica immediatamente che d è una distanza su X. Resta da dimostrare che


essa induce la topologia prodotto su X. A tal fine mostriamo innanzi tutto che le
palle aperte della distanza d sono aperti di X. Sia x0 ∈ X e r > 0. Fissiamo un
punto y ∈ Bd (x0 , r). Sia ρ = r − d(y, x0 ) > 0 e sia I ′ l’insieme degli indici i ∈ I tali
che 2−i < ρ/4. L’insieme I ′′ = I \ I ′ è finito e quindi
\
U = πi−1 (Bdi (yi , ρ/2)))
i∈I ′′

è un intono aperto di y nella topologia di X. Esso è contenuto in Bd (x0 , r) perché,


se x ∈ U abbiamo: X
d(x, y) = 2−1 di (xi , yi )
i∈I
X X
≤ 2−i ρ/2 + 2−i < ρ.
i∈I ′′ i∈I ′

Quindi la topologia indotta dalla distanza d è meno fine della topologia prodotto.
Sia ora U un aperto della topologia prodotto e sia x0 un punto di U . Possiamo
allora trovare un numero reale positivo r e un insieme finito di indici I ′ ⊂ I tale
che \
πi−1 (Bdi (x0i , r)) ⊂ U.
i∈I ′

Fissato un intero positivo m tale che 2−m < r/2, risulta allora

Bd (x0 , 2−m−1 ) ⊂ U.

Ciò dimostra che la topologia indotta dalla distanza è più fine della topologia
prodotto e quindi le due topologie coincidono.

Teorema 1.8 (Proprietà associativa del prodotto topologico)


Sia (Xi | i ∈ I) una I-upla di spazi topologici non vuoti e sia X il loro prodotto
topologico. Sia {Jα | α ∈ A} una partizione dell’insieme di indici I: ciò significa che
I = ∪α∈A Jα e che Jα1 ∩ Jα2 = ∅ se α1 6= α2 ∈ A. Consideriamo sui prodotti
Y
Yα = Xj
j∈Jα

la topologia prodotto. L’applicazione bigettiva naturale


Y
f :X−
→ Yα .
α∈A

è un omeomorfismo per le topologie prodotto.


Y
Dim. Indichiamo con π̃β : Yα −→ Yβ , per β ∈ A, e con π̂j : Yα −
→ Xj , per
α∈A
j ∈ Jα , le proiezioni sulle coordinate. Dimostriamo che la f è continua: a questo
scopo è sufficiente dimostrare che le π̃α ◦ f sono continue per ogni α ∈ A. Ciò è
conseguenza del fatto che le π̂j ◦ π̃α ◦ f = πj sono continue per ogni j ∈ Jα .
Analogamente f −1 è continua perché πj ◦ f −1 = π̂j ◦ π̃α è continua se j ∈ Jα .
24 II. COSTRUZIONI TOPOLOGICHE

Infine si verifica facilmente che vale il:


Teorema 1.9 (Proprietà commutativa del prodotto topologico)
Sia (Xi )i∈I una I-upla di spazi topologici e sia σ ∈ S(I) una permutazione
dell’insieme I degli indici. L’applicazione
Y Y
σ∗ : Xi ∋ (xi ) −
→ (xσi ) ∈ X σi
i∈I i∈I

è un omeomorfismo.

§2 Quozienti topologici
Proposizione 2.1 Sia X = (X, τX ) uno spazio topologico, Y un insieme e f :
X−→ Y un’applicazione. Allora

f∗ (τX ) = {A ⊂ Y | f −1 (A) ∈ τX }

è una topologia su Y . Essa è la più fine tra le topologie su Y che rendono la f


continua.

Dim. Osserviamo che f −1 (∅) = ∅ e f −1 (Y ) = X, onde ∅, Y ∈ f∗ (τX ). Inoltre


\ [
f −1 (Ai ) = f −1 (∩i∈I Ai ) e f −1 (Ai ) = f −1 (∪i∈I Ai ))
i∈I i∈I

per ogni famiglia {Ai | i ∈ I} di sottoinsiemi di Y . Quindi f∗ (τX ) è una topologia


su Y e chiaramente essa è la più fine tra quelle che rendono la f continua.

Lemma 2.2 Sia X = (X, τX ) uno spazio topologico, Y, Z due insiemi e f : X −



Y, g :Y −
→ Z due applicazioni. Allora

(g ◦ f )∗ (τX ) = g∗ (f∗ (τX )).

Dim. Un sottoinsieme A di Z è un aperto della topologia (g ◦f )∗ (τX ) se e soltanto


se (g ◦ f )−1 (A) è un aperto di X. Se quindi A è un elemento di (g ◦ f )∗ (τX ),
g −1 (A) è un aperto di f∗ (τX ). Questo dimostra che (g ◦ f )∗ (τX ) ⊂ g∗ (f∗ (τX )). Sia
viceversa A un elemento di g∗ (f∗ (τX )). Allora g −1 (A) è un elemento di f∗ (τX ) e
quindi f −1 (g −1 (A)) = (g ◦ f )−1 (A) è un aperto di X. Questo dimostra l’inclusione
opposta g∗ (f∗ (τX )) ⊂ (g ◦ f )∗ (τX ) e quindi le due topologie coincidono.

Ricordiamo che una relazione di equivalenza ∼ su un insieme X è una relazione


tra gli elementi di X che è
(1) riflessiva: x ∼ x ∀x ∈ X,
(2) simmetrica: x, y ∈ X e x ∼ y ⇒ y ∼ x,
(3) transitiva: x, y, z ∈ X e x ∼ y, y ∼ z ⇒ x ∼ z.
II. COSTRUZIONI TOPOLOGICHE 25

Una relazione di equivalenza determina una partizione dell’insieme X: posto

[x] = {y ∈ X | y ∼ x}

la
X/∼ = {[x] | x ∈ X}
è una famiglia di sottoinsiemi di X che gode delle proprietà:
S
(1) x∈X [x] = X,
(2) x, y ∈ X e [x] ∩ [y] 6= ∅ ⇒ [x] = [y].
L’insieme X/∼ delle classi di equivalenza di X rispetto alla relazione di equivalenza
∼ si dice quoziente di X rispetto a ∼ e l’applicazione naturale surgettiva

π:X∋x−
→ [x] ∈ X/∼

proiezione sul quoziente.


Un sottoinsieme A di X si dice saturo rispetto alla ∼ se è unione di classi di
equivalenza: [
A = [x] = π −1 (π(A)).
x∈A

Sia X = (X, τX ) uno spazio topologico, ∼ una relazione di equivalenza sull’insie -


me X, e sia π : X − → X/∼ la proiezione naturale nel quoziente. La π∗ (τX ) si
dice topologia quoziente su X/∼ . Essa è la più fine tra le topologie che rendono
la proiezione π continua. Lo spazio topologico (X/∼ , π∗ (τX )) si dice quoziente
topologico di X rispetto alla relazione di equivalenza ∼ .
Gli aperti (risp. i chiusi) del quoziente sono le immagini degli aperti (risp. chiusi)
saturi di X.
Esempio 2.1 Se A è un sottoinsieme dell’insieme X, indichiamo con X/(A) il
quoziente ottenuto mediante la relazione di equivalenza

x ∼ y ⇔ (x = y oppure x, y ∈ A) .

Diciamo che X/(A) è ottenuto identificando a un punto l’insieme A.


Esempio 2.2 Sia R la retta reale con la topologia Euclidea e sia R/Q il quoziente
di R rispetto alla relazione di equivalenza

x ∼ y ⇔ x − y ∈ Q.

Allora la topologia quoziente di R/Q è la topologia indiscreta. Infatti R è il solo


aperto saturo non vuoto.
Esempio 2.3 Lo spazio proiettivo reale di dimensione n è il quoziente

RPn = Rn+1 \ {0} /∼

di Rn+1 \ {0} rispetto alla relazione di equivalenza

x ∼ y ⇔ x e y sono linearmente dipendenti.


26 II. COSTRUZIONI TOPOLOGICHE

Su di esso consideriamo la topologia quoziente della topologia di sottospazio di


Rn+1 \ {0} ⊂ Rn+1 .
Osserviamo che la proiezione nel quoziente

π : Rn+1 \ {0} −
→ RPn

è aperta. Infatti per ogni t ∈ R \ {0} l’omotetia

ωt : Rn+1 \ {0} ∋ x −
→ tx ∈ Rn+1 \ {0}

è un omeomorfismo. Quindi per ogni aperto A di Rn+1 \ {0}, il saturato


[
π −1 (π(A)) = ωt (A)
t∈R\{0}

è un aperto di Rn+1 \ {0}.


Se a ∈ GL(n+1, R), l’abbreviazione di a definisce un omeomorfismo di Rn+1 \{0}
in sè. Per passaggio al quoziente essa definisce un omeomorfismo di RPn in sè.
Quindi
(1) le proiettività di RPn sono omeomorfismi.
Abbiamo inoltre:
(2) L’applicazione Rn −
→ RPn definita in coordinate omogenee da

Rn ∋ (x1 , ..., xn ) −
→ (1, x1 , ..., xn ) ∈ RPn

è un’immersione topologica che ha come immagine un aperto di RPn .


In particolare gli Ui (i = 0, 1, . . . , n) definiti in coordinate omogenee (x0 , x1 , . . . , xn )
da:
Ui = {π(x0 , x1 , . . . , xn ) | xi 6= 0}

formano un ricoprimento aperto di RPn e sono tutti omeomorfi a Rn .


Esempio 2.4 Sullo spazio proiettivo complesso di dimensione n, definito da

CPn = Cn+1 \ {0} /∼

ove
z ∼ w ⇔ z e w sono linearmente dipendenti in Cn+1 ,

si considera la topologia quoziente della topologia di sottospazio di Cn+1 \ {0} ⊂


Cn+1 ≃ R2n+2 . Come nel caso reale, abbiamo:
(1) Le proiettività sono omeomorfismi di CPn .
(2) L’applicazione definita in coordinate omogenee da:

Cn ∋ (z1 , ..., zn ) −
→ (1, z1 , ..., zn ) ∈ CPn

è un’immersione topologica che ha come immagine un aperto di CPn .


II. COSTRUZIONI TOPOLOGICHE 27

Gli Ui (i = 0, 1, . . . , n) definiti in coordinate omogenee (z0 , z1 , . . . , zn ) da:

Ui = {π(z0 , z1 , . . . , zn ) | zi 6= 0}

formano un ricoprimento aperto di CPn e sono tutti omeomorfi a Cn .

Siano X, Y due insiemi e siano RX una relazione di equivalenza su X e RY una


relazione di equivalenza su Y . Indichiamo con [x]X e [y]Y rispettivamente le classi
di equivalenza di x ∈ X rispetto alla RX e di y ∈ Y rispetto alla RY e con

πX : X −
→ X/RX , πY : Y −
→ Y /RY

le relative proiezioni sui quozienti.


Sia f : X − → Y una applicazione. Condizione necessaria e sufficiente affinché
si possa trovare una applicazione fˆ : X/RX −
→ Y /RY che renda commutativo il
diagramma:

f
X −−−−→ Y
 

πX y
π
(2.1) y Y
X/RX −−−−→ Y /RY

è che f ([x]X ) ⊂ [f (x)]Y . L’applicazione fˆ è allora univocamente determinata da

fˆ([x]X ) = [f (x)]Y ∀x ∈ X.

Abbiamo:
Teorema 2.3 (di omomorfismo)Siano X e Y due spazi topologici e siano RX ,
RY relazioni di equivalenza sugli insiemi X e Y ed f : X − → Y un’applicazione tale
che f ([x]X ) ⊂ [f (x)]Y per ogni x ∈ X. Se f è continua, allora anche la fˆ descritta
dal diagramma commutativo (2.1) è continua.

Dim. Sia A un aperto di Y /RY per la topologia quoziente. L’insieme B = fˆ−1 (A)
−1
è un aperto di X/RX per la topologia quoziente se e soltanto se πX (B) è un aperto
di X. Ma
−1
πX −1
(B) = πX ◦ fˆ−1 (A) = (fˆ ◦ πX )−1 (A) = (πY ◦ f )−1 (A).

Quest’ultimo insieme è aperto perché πY ◦ f è continua in quanto composizione di


applicazioni continue.
Questo teorema si poteva ottenere anche come un corollario del seguente
Teorema 2.4 Siano X = (X, τX ) e Y = (Y, τY ) due spazi topologici e ∼ una
relazione di equivalenza su X. Un’applicazione f : X/∼ − → Y è continua se e
soltanto se l’applicazione composta f ◦ π : X − → Y , dove π : X −→ X/∼ è la
proiezione naturale nel quoziente, è continua.
28 II. COSTRUZIONI TOPOLOGICHE

Dim. La condizione è necessaria perché, se f è continua, anche f ◦ π è continua


in quanto composta di funzioni continue. Essa è anche sufficiente: supponiamo che
f ◦ π sia continua. Se A è un aperto di Y , allora (f ◦ π)−1 (A)) = π −1 (f −1 (A) è un
aperto perché immagine inversa di un aperto mediante una applicazione continua.
Per la definizione di topologia quoziente f −1 (A) è allora un aperto di X/∼ . Quindi
la f è continua.

Data una applicazione f : X −


→ Y tra due insiemi X e Y , la relazione

x1 (f )x2 ⇔ f (x1 ) = f (x2 )

è una relazione di equivalenza su X. L’applicazione fˆ : X/(f ) − → Y che si ottiene


per passaggio al quoziente è una applicazione iniettiva e si dice il quoziente iniettivo
dell’applicazione f . Abbiamo

Proposizione 2.5 Un’applicazione f : X − → Y tra due spazi topologici X, Y è


continua se e soltanto se il suo quoziente iniettivo è continuo.

Dim. L’enunciato è una facile conseguenza del precedente.

Un’applicazione f : X − → Y tra due spazi topologici X, Y si dice decomponibile


se il suo quoziente iniettivo è un omeomorfismo.
Osserviamo che ogni applicazione decomponibile è surgettiva e, per il teorema
precedente, continua.
Un’applicazione decomponibile ci permette di identificare il codominio a un
quoziente topologico del dominio e viceversa la proiezione di uno spazio topolo-
gico su un suo quoziente topologico è decomponibile.

Esempio 2.5 Sia f : R ∋ θ − → eiθ ∈ S1 ⊂ C, in cui si considerino su R la topologia


Euclidea e su S1 la topologia di sottospazio di C con la topologia Euclidea. Allora
f è decomponibile e, in particolare, S1 è omeomorfo al quoziente di R rispetto al
suo sottogruppo abeliano 2πZ = {2kπ | k ∈ Z}.
Per verificare questa affermazione, è sufficiente osservare che l’applicazione f è
aperta in quanto è un omeomorfismo locale e che il saturato di un aperto A di R è
un aperto: infatti
[
π −1 π(A) = {x + 2kπ | x ∈ A}
k∈Z

è aperto perché unione di aperti (le traslazioni sono omeomorfismi di R). Da questo
segue che fˆ è aperta e quindi un omeomorfismo.

Osserviamo che condizione necessaria e sufficiente affinché una applicazione f :


X− → Y tra due spazi topologici X = (X, τX ), Y = (Y, τY ) sia decomponibile è che
f∗ (τX ) = τY .

Teorema 2.6 Siano X, Y, Z tre spazi topologici e f : X −


→ Y, g : Y −
→ Z due
applicazioni. Allora:
(1) Se f e g sono decomponibili, anche g ◦ f è decomponibile.
(2) Se f è decomponibile e g ◦ f continua, allora g è continua.
(3) Se f e g sono continue e g ◦ f decomponibile, allora g è decomponibile.
II. COSTRUZIONI TOPOLOGICHE 29

Dim. (1). Supponiamo f e g decomponibili. La g ◦ f è surgettiva e quindi g ◦ f è


decomponibile per il Lemma 2.2.
(2). Supponiamo f decomponibile e g ◦ f continua. Per il primo teorema di
omomorfismo g ◦ fˆ : X/(f ) − → Z è continua. Poiché f è decomponibile, la fˆ :
X/(f ) −→ Y è un omeomorfismo. Allora g = g ◦ fˆ◦ fˆ−1 è continua perché composta
di funzioni continue.
(3). Supponiamo f e g continue e h = g ◦ f decomponibile. Indichiamo con ĥ il
quoziente iniettivo di h. Esso è un omeomorfismo di X/(g◦f ) su Z.
Dobbiamo dimostrare che ĝ : Y /(g) − → Z è un omeomorfismo. Essa è una
applicazione continua ed è surgettiva perché g ◦ f è surgettiva. È quindi bigettiva.
Sia fˆ il quoziente iniettivo di f . Allora ĝ −1 = fˆ ◦ ĥ−1 è continua perché composta
di applicazioni continue e quindi ĝ è un omeomorfismo e g è perciò decomponibile.

Teorema 2.7 Se f : X − → Y è una applicazione surgettiva, continua e aperta


(oppure chiusa) tra due spazi topologici X, Y, allora f è decomponibile.

Dim. Basta osservare che, se f è aperta (risp. chiusa) il suo quoziente iniettivo fˆ
è un’applicazione aperta (risp. chiusa) e quindi un omeomorfismo.
Siano R e R′ due relazioni d’equivalenza sullo stesso insieme X. Indichiamo
rispettivamente con [x] ed [x]′ le classi d’equivalenza di x ∈ X rispetto alle relazioni
R ed R′ . Diciamo che R è più fine di R′ se

[x] ⊂ [x]′ ∀x ∈ X,

se cioè le classi di equivalenza di R′ sono unioni di classi di equivalenza di R. In


questo caso risulta definita un’applicazione naturale

→ [x]′ ∈ X/R′ .
X/R ∋ [x] −

Proposizione 2.8 Sia X = (X, τX ) uno spazio topologico e siano R e R′ due


relazioni di equivalenza su X. Se R è più fine di R′ , allora l’applicazione naturale

→ [x]′ ∈ X/R′
g : X/R ∋ [x] −

è decomponibile per le topologie quoziente.

Dim. Sia π : X − → X/R la proiezione nel quoziente. Allora g ◦ π : X − → X/R′ è


la proiezione nel quoziente. Usiamo il Teorema 2.6. Per il punto (2), g è continua
perché π è decomponibile e g◦π è continua. Per il punto (3) allora g è decomponibile
perchè π e g sono continue e g ◦ π è decomponibile.

Teorema 2.9 Sia {A, B} un ricoprimento fondamentale dello spazio topologico


X. Sia ι : A −
→ X l’inclusione e sia ι̂ l’applicazione definita dal diagramma
commutativo:
ι
A −−−−→ X
 

πA y
π
y B
A/(A∩B) −−−−→ X/(B)
ι̂
30 II. COSTRUZIONI TOPOLOGICHE

dove le applicazioni πA e πX sono le proiezioni nel quoziente. Allora ι̂ è un omeo-


morfismo.

Dim. L’applicazione ι̂ è continua e bigettiva. Essa è aperta: se U è un aperto di


A/(A∩B) , allora
 −1 −1
−1 πA (U ) se πA (U ) ∩ B = ∅
πX (ι̂(U )) = −1 −1
πA (U ) ∪ B se πA (U ) ∩ B 6= ∅.

Questo è un aperto di X perchè {A, B} è un ricoprimento fondamentale. Quindi ι̂


è continua, surgettiva e aperta e quindi è un omeomorfismo.

Esempio 2.6 Il quoziente Dn /(Sn−1 ) è omeomorfo a Sn .


Consideriamo l’applicazione continua
p
f : Dn ∋ x −
→ (2|x|2 − 1, 2 (1 − |x|2 )x) ∈ Sn .

La sua abbreviazione
◦ p
Dn ∋ x −
→ (2|x|2 − 1, 2x (1 − |x|2 )) ∈ Sn − {e0 }

dove e0 = (1, 0, ..., 0) è il primo vettore della base canonica di Rn+1 è un omeomor-
fismo: la sua inversa è infatti l’applicazione continua

n ′ y′ ◦
S − {e0 } ∋ (y0 , y ) −
→p ∈ Dn .
4 − (1 + y0 ) 2

Dimostriamo che f è una applicazione chiusa. Se F è un chiuso di Dn che non


contiene punti di Sn−1 , allora possiamo trovare3 un numero reale r < 1 tale che
|x| < r per ogni x ∈ F . Poichè i due aperti Sn − {e0 } e {y ∈ Sn | y0 > 2r2 − 1}
formano un ricoprimento fondamentale di Sn , ed f (F ) è un chiuso del primo
insieme perchè l’abbreviazione di f è un omeomorfismo e ha intersezione vuota
con il secondo, se ne conclude che f (F ) è un chiuso di Sn . Se F interseca Sn−1 ,
allora f (F ) = f (F ∪ Sn−1 ). Osserviamo che F ∪ Sn−1 è un chiuso di Dn . Possiamo
quindi limitarci a considerare il caso in cui Sn−1 ⊂ F . Il suo complementare è allora

un aperto di Dn che è tutto contenuto in Dn e la sua immagine, complementare
dell’immagine di f (F ), un aperto di Sn in quanto aperto dell’aperto Sn − {e0 } me-
Sn −{e0 }
diante l’omeomorfismo f | ◦ . Essendo continua e chiusa, la f è decomponibile.
Dn
Il suo quoziente iniettivo ci dà allora un omeomorfismo tra Dn /Sn−1 ed Sn .
Una relazione di equivalenza ∼ su uno spazio topologico X si dice aperta (risp.
chiusa) se la proiezione nel quoziente π : X − → X/∼ è una applicazione aperta
(risp. chiusa). In modo equivalente: la ∼ è aperta se il satutato di un aperto è
ancora un aperto, chiusa se il saturato di un chiuso è ancora un chiuso.
Esempio 2.7 La relazione di equivalenza su R :

x∼y ⇔x−y ∈Z
3 {|x| | x
∈ F } è un sottoinsieme chiuso e limitato di R e quindi ha massimo per il teorema di
Weierstrass.
II. COSTRUZIONI TOPOLOGICHE 31

è aperta.
Esempio 2.8 La relazione di equivalenza su Sn :

x ∼ y ⇔ x = ±y

è aperta e chiusa.

§3 Incollamenti e attaccamenti
Descriviamo in questo paragrafo alcune costruzioni topologiche, che si deducono
dalle operazioni di prodotto topologico e di quoziente, utili in topologia algebrica e
in analisi funzionale.
A. Somme disgiunte Sia (Xi | i ∈ I) una I-upla di insiemi. La loro somma
disgiunta è l’insieme:
( ! )
G [
X= Xi = (x, i) ∈ Xi × I | x ∈ Xi ∀i ∈ I
i∈I i∈I

Definiamo le applicazioni ιi : Xi − → X mediante ιi (x) = (x, i) per ogni i ∈ I e


x ∈ Xi .
Se su ciascuno degli insiemi Xi è assegnata una topologia τi , la topologia somma
disgiunta su ⊔Xi è la più fine tra le topologie che rendono continue tutte le appli-
cazioni ιi . Lo spazio topologico X = ⊔i∈I Xi si dice la somma topologica disgiunta
della I-upla (Xi )i∈I . Osserviamo che ιi : Xi − → X è un’immersione topologica e
che i sottospazi ιi (Xi ) sono aperti e chiusi in X. In particolare {ιi (Xi ) | i ∈ I} è un
ricoprimento fondamentale di X mediante insiemi due a due disgiunti.
B. Incollamenti Sia (Xi )i∈I una I-upla di spazi topologici e sia R una relazione
di equivalenza su ⊔Xi . Lo spazio topologico quoziente Y = ⊔i∈I Xi /R si dice
ottenuto per incollamento mediante la relazione di equivalenza R. L’applicazione
composta
ji : Xi ∋ x −
→ π ◦ ιi (x) ∈ Y,

ove π : ⊔i∈I Xi −
→ Y è la proiezione nel quoziente, si dice affondamento i-esimo.
Vale la seguente:
Proposizione 3.1 La famiglia {ji (Xi ) | i ∈ I} è un ricoprimento fondamentale
di Y. Un’applicazione f : Y − → Z dell’incollamento topologico Y in uno spazio
topologico Z è continua se e soltanto se le f ◦ ji : Xi −
→ Z sono continue per ogni
i ∈ I.

C. Somme topologiche Sia (Xi )i∈I una I-upla di spazi topologici. Per ogni
coppia (i, j) ∈ I × I siano assegnati un sottospazio Xi,j ⊂ Xj e una applicazione
bigettiva4 φi,j : Xi,j −
→ Xj,i , in modo tale che valgano, per ogni i, j, k ∈ I:
(1) Xi,i = Xi e φi,i è l’identità su Xi ;

4 Per
semplicità supporremo che la funzione vuota sia l’unica applicazione bigettiva sull’insieme
vuoto, a valori nell’insieme vuoto.
32 II. COSTRUZIONI TOPOLOGICHE

(2) φi,k (Xi,k ∩ Xj,k ) = Xj,i ∩ Xk,i e il seguente diagramma è commutativo:

φi,k
Xi,k ∩ Xj,k −−−−→ Xj,i ∩ Xk,i
 

φj,k y
φ
y j,i
Xi,j ∩ Xk,j Xi,j ∩ Xk,j .

Risulta allora definita su ⊔i∈I Xi la relazione di equivalenza:

(x, i)R(y, j) ⇔ y ∈ Xi,j e φi,j (y) = x.

Il quoziente topologico Y = ⊔i∈I Xi /R si dice somma topologica L di (Xi ) mediante


le funzioni di incollamento φi,j : Xi,j −
→ Xj,i e sarà indicata con (Xi , Xij , φij ).
Osserviamo che una somma topologica è un incollamento in cui tutti gli affon-
damenti sono applicazioni iniettive. Viceversa, si verifica che ogni incollamento in
cui tutti gli affondamenti siano iniettivi è una somma topologica.
Osservazione Se i sottospazi Xij sono tutti vuoti e quindi le funzioni di incol-
lamento φij sono tutte vuote, allora la somma topologica coincide con la somma
disgiunta.
Proposizione 3.2 Se tutti i sottospazi Xi,j ⊂ Xj sono chiusi (oppure tutti
aperti) e le φi,j sono tutte omeomorfismi, allora gli affondamenti ji sono immersioni
topologiche per ogni i ∈ I.

Dim. Supponiamo che tutti i sottospazi Xi,j siano chiusi e tutte le φi,j siano degli
omeomorfismi. Se F è un chiuso di Xj , allora ι−1 i π −1 (jj (F )) = φi,j (F ∩ Xi,j )
è un chiuso in Xi per ogni (i, j) ∈ I × I. Quindi le jj : Xj − → Y , essendo appli-
cazioni chiuse, sono immersioni topologiche. Lo stesso ragionamento, sostituendo
alla parola chiuso la parola aperto, si applica nel caso in cui tutti i sottospazi Xi,j
siano aperti.

Esempio 3.1 Sia Xi = D2 per i = 1, 2, X1,2 = X2,1 = S1 e φ1,2 = φ2,1 sia


l’identità su S1 . Allora la somma topologica di X1 ed X2 mediante le φi,j (1 ≤
i, j ≤ 2) è omeomorfa alla sfera S2 .
D. Topologia debole associata a un ricoprimento Sia Γ = {Ai | i ∈ I} un
ricoprimento di uno spazio topologico X = (X, τ ). Poniamo Xi,j = Ai ∩ Aj per
ogni i, j ∈ I e utilizziamo l’identità sui sottoinsiemi Xi,j = Xj,i come funzioni di
incollamento. La somma topologica che otteniamo si può identificare a un nuovo
spazio topologico (X, τ ′ ), dotato di una topologia τ ′ in generale più fine della to-
pologia τ di X. Infatti un sottoinsieme B di X è un aperto di τ ′ se e soltanto se,
per ogni i ∈ I, l’insieme B ∩ Ai è aperto in τ |Ai . Osserviamo che tutte le ji sono
immersioni topologiche.
E. Limiti e filtrazioni Sia (Xn )n∈N una successione di spazi topologici. Per
ogni n ∈ N sia assegnata una immersione topologica φn : Xn −
→ Xn+1 . Poniamo

Xn se n ≤ m
Xm,n =
φn ◦ φn−1 ◦ ... ◦ φm (Xm ) se n > m,
II. COSTRUZIONI TOPOLOGICHE 33
 Xm,n
 φm ◦ φm−1 ◦ ... ◦ φn |Xm
 se n < m
φn,m = id|Xn se n = m

 X
(φn ◦ φn−1 ◦ ... ◦ φm )−1 |Xm,n
n,m
se n > m.
La somma topologica degli (Xn ) rispetto alle funzioni di incollamento (φm,n ) si dice
il loro limite induttivo stretto e si indica con

lim
−→ (Xn , φn ).
n

Esempio 3.2 Sia Xn l’insieme di tutte le funzioni continue f : RN −


→ R tali che

supp(f ) = {x ∈ RN | f (x) 6= 0} ⊂ {|x| ≤ n}.

Su Xn consideriamo la topologia indotta dalla distanza:

dn (f, g) = sup |f (x) − g(x)| ∀f, g ∈ Xn .


x∈RN

Abbiamo ovviamente un’immersione topologica: φn : Xn ֒→ Xn+1 . Il limite


induttivo stretto della successione (Xn ) è lo spazio Cc0 (RN ) delle funzioni continue
a supporto compatto in Rn .
P∞
Esempio 3.3 Sia Xn l’insieme di tutte le serie f (z) = n=0 an z n con an ∈ C
che convergono assolutamente su {z ∈ C | |z| < 1/n}, con la topologia indotta dalla
distanza
sup |f (z) − g(z)| ∀f, g ∈ Xn .
|z|≤1/(n+1)

Le restrizioni φn : Xn − → Xn+1 sono immersioni topologiche. Il limite induttivo


stretto delle Xn si indica con O0 e si dice lo spazio dei germi di funzioni olomorfe
nell’origine 0 di C.
Una successione (Xn )n∈N di sottospazi di uno spazio topologico X si dice una
filtrazione se:
(a) Xn ⊂SXn+1 per ogni n ∈ N;
(b) X = n∈N Xn e {Xn } è un ricoprimento fondamentale di X.
In questo caso abbiamo X = lim
−→n∈N Xn rispetto alle funzioni di inclusione Xn ֒→
Xn+1 .
F. Attaccamenti Siano X1 , X2 spazi topologici, Y un sottospazio di X1 e
φ:Y − → X2 una funzione continua. Sia Rφ la relazione di equivalenza su X1 ⊔ X2
che identifica i punti di Y alla loro immagine in X2 mediante φ:

 x=y se x, y ∈ X1 ⊔ X2 \ (Y ⊔ φ(Y ))


 y = φ(x) se x ∈ Y, y ∈ X2
xRφ y ⇔


 x = φ(y) se y ∈ Y, x ∈ X2

φ(x) = φ(y) se x, y ∈ Y.
Lo spazio topologico quoziente
[
X1 X2 = (X1 ⊔ X2 ) /Rφ
φ
34 II. COSTRUZIONI TOPOLOGICHE

si dice l’attaccamento di X1 a X2 mediante φ.


S
Proposizione 3.3 L’affondamento j2 : X2 −
→ X1 φ X2 è un’immersione topolo-
gica.

Dim. Sia π : X1 ⊔ X2 − → X1 ∪φ X2 la proiezione nel quoziente. Sia A un


sottoinsieme
 di X 2 . Allora il saturato π −1 (j2 (A)) di j2 (A) è il sottoinsieme j2 (A) ∪
j1 φ−1 (A) . Esso è aperto in Y ⊔ X2 se e soltanto se A è aperto in X2 , perché φ
è continua. Supponiamo che A sia un aperto
−1
 di X2 e sia B un aperto di X1 ⊔ X2
tale che B ∩ (Y ⊔ X2 ) = j2 (A) ∪ j1 φ (A) . Allora

j2 (A) = π (ι2 (A)) = π(B) ∩ j2 (X2 ).

Osserviamo che B è un aperto saturo di X1 ⊔ X2 e quindi π(B) è un aperto di


X1 ∪φ X2 . Questo dimostra che l’abbreviazione j2 : X2 −
→ j2 (X2 ) è un’applicazione
aperta e quindi, essendo continua e bigettiva, un omeomorfismo con l’immagine.

§4 Coni, sospensioni e giunti


A. Coni Sia X uno spazio topologico. Si dice cono topologico di base X lo spazio
topologico quoziente:

(4.1) CX = (X × I) / (X × {0}) .

Sia π : X × I − → CX la proiezione nel quoziente. Scriviamo per semplicità t · x


invece di π(x, t) se x ∈ X, t ∈ [0, 1]; osservando che 0x = 0y per ogni x, y ∈ X,
indichiamo tale punto con 0 e lo diciamo vertice del cono CX.
L’applicazione
X∋x− → t · x ∈ CX
è un’immersione topologica per ogni t ∈]0, 1].
Per ogni s ∈ [0, 1], l’applicazione CX ∋ t · x −
→ (st) · x ∈ CX è continua.
Proposizione 4.1 Se f : X −
→ Y è un’applicazione continua tra due spazi topo-
logici, allora

(4.2) Cf : CX ∋ t · x −
→ t · f (x) ∈ CY

è ancora un’applicazione continua.

Dim. Abbiamo infatti il diagramma commutativo

f ×id
X × I −−−−→ Y × I
 
 
y y
CX −−−−→ CY
Cf

in cui le frecce verticali denotano proiezione nel quoziente. L’applicazione f × id


è continua perché prodotto di applicazioni continue. Quindi Cf è continua per il
teorema di omomorfismo.
II. COSTRUZIONI TOPOLOGICHE 35

Osservazione Sia A un sottoinsieme di Rn e sia K il sottoinsieme di Rn+1


definito da:
K = {(t, tx1 , ..., txn ) | 0 ≤ t ≤ 1, (x1 , ..., xn ) ∈ A}.
L’applicazione
CA ∋ t · x −
→ (t, tx) ∈ K
è continua e bigettiva. La sua inversa è ovviamente continua in tutti i punti (t, tx)
con 0 < t ≤ 1 e x ∈ A. Essa non è però in generale continua nel punto (0, 0): lo è
nel caso in cui il sottoinsieme A di Rn sia chiuso e limitato. La topologia di CA è
quindi in generale più fine della topologia indotta dalla topologia Euclidea sul cono
geometrico K corrispondente.
Esempio 4.1 Il cono CSn è omeomorfo ad disco Dn+1 .
L’omeomorfismo è dato da

CSn ∋ t · x −
→ tx ∈ Dn+1

B. Sospensioni Sia X uno spazio topologico. Definiamo su X × I una relazione


di equivalenza ponendo:

 s = t = 0, oppure

(x, t)R(y, s) ⇔ s = t = 1, oppure


0 < s = t < 1 e x = y.

Il quoziente topologico
SX = (X × I) /R
si dice la sospensione topologica di X. Detta π : X × I −
→ SX la proiezione nel
quoziente, l’insieme π(X × {1/2}) si dice base di SX. Osserviamo che per ogni
0 < t < 1, l’applicazione
X∋x− → π(x, t) ∈ SX
è un’immersione topologica. L’applicazione naturale CX − → SX è decomponibile
e SX è omeomorfo al quoziente che si ottiene identificando a un punto la base del
cono CX.
Osservazione Abbiamo gli omeomorfismi:

SDn ≃ Dn+1
SSn ≃ Sn+1 .

Gli omeomorfismi si ottengono per passaggio al quoziente dalle applicazioni:


p
Dn × I ∋ (x, t) −
→ (2 t − t2 x, 2t − 1) ∈ Dn+1

e p
Sn × I ∋ (x, t) −
→ (2 t − t2 x, 2t − 1) ∈ Sn+1 .

Possiamo definire per ricorrenza la sospensione k-esima S k X dello spazio topo-


logico X ponendo  0
S X=X

S k X = S S k−1 X se k ≥ 1.
36 II. COSTRUZIONI TOPOLOGICHE

C. Giunti topologici Siano X1 e X2 due spazi topologici. Consideriamo sul


prodotto cartesiano X1 × X2 × I la relazione di equivalenza:

 0 < s = t < 1 e x1 = y1 , x2 = y2 , oppure

(4.3) (x1 , x2 , t)R(y1 , y2 , s) ⇔ s = t = 0 e x1 = y1 , oppure


s = t = 1 e x 2 = y2 .

Il quoziente topologico:

X1 ∗ X2 = (X1 × X2 × I)/R

si dice il giunto topologico di X1 e X2 . Sia π : X1 × X2 × I −


→ X1 ∗ X2 la proiezione
nel quoziente. I sottospazi π(X1 × X2 × {0}) e π(X1 × X2 × {1}) si dicono basi del
giunto.
Lemma 4.2 L’applicazione

X1 × X2 × I ∋ (x1 , x2 , t) −
→ ((1 − t) · x1 , t · x2 ) ∈ CX1 × CX2

definisce per passaggio al quoziente un’immersione topologica

(4.4) α : X1 ∗ X2 −
→ CX1 × CX2 .

Dim. Osserviamo che α(X1 ∗ X2 ) è il sottospazio chiuso Y di CX1 × CX2 definito


da
Y = {(t · x1 , s · x2 ) ∈ CX1 × CX2 | s + t = 1}.
Consideriamo le applicazioni continue:

φ :X1 × X2 × I ∋ (x1 , x2 , t) −
→ (x1 , 1 − t, x2 , t)∈ X1 × I × X2 × I
ψ :X1 × I × X2 × I ∋ (x1 , s, x2 , t) −
→ (x1 , x2 , t)∈ X1 × X2 × I.

L’applicazione composta ψ ◦φ è l’identità su X1 ×X2 ×I. Per passaggio ai quozienti


otteniamo un diagramma commutativo:
φ ψ
X1 × X2 × I −−−−→ X1 × I × X2 × I −−−−→ X1 × X2 × I
  
  
y y y
X1 ∗ X2 −−−−→ CX1 × CX2 −−−−→ X1 ∗ X2
α β

dove le frecce verticali rappresentano le proiezioni nei quozienti. La β è continua


e la sua restrizione all’immagine di α è l’inversa dell’abbreviazione di α. Questo
dimostra che α è un’immersione topologica.
In modo analogo si dimostrano gli omeomorfismi:
Lemma 4.3 Siano Xi , per i = 1, 2, 3 spazi topologici. Abbiamo allora omeomor-
fismi naturali:

(4.5) X1 ∗ X2 ≃ X2 ∗ X1 ,
II. COSTRUZIONI TOPOLOGICHE 37

(4.6) (X1 ∗ X2 ) ∗ X3 ≃ X1 ∗ (X2 ∗ X3 ) .

Dim. Il primo omeomorfismo si ottiene a partire dall’omeomorfismo

X1 × X2 × I ∋ (x1 , x2 , t) −
→ (x2 , x1 , 1 − t) ∈ X2 × X1 × I

per passaggio ai quozienti. Il secondo si ricava utilizzando l’immersione topologica


descritta nella proposizione precedente: sia Y il sottospazio di CX1 × CX2 × CX3
definito da:

Y = {(t1 · x1 , t2 · x2 , t3 · x3 ) | xi ∈ Xi , ti ∈ I i = 1, 2, 3, t1 + t2 + t3 = 1};

abbiamo le immersioni topologiche:

α′ : (X1 ∗ X2 ) ∗ X3 −→ Y ⊂ CX1 × CX2 × CX3 ,


α′′ : X1 ∗ (X2 ∗ X2 ) −
→ Y ⊂ CX1 × CX2 × CX3 ,

che si ottengono per passaggio al quoziente e abbreviazione dalle applicazioni:

X1 × X2 × I × X3 × I −
→ X1 × I × X2 × I × X3 × I,

definita da

(x1 , x2 , s, x3 , t) −
→ (x1 , (1 − t)(1 − s), x2 , (1 − t)s, x3 , t)

e
X1 × I × X2 × X3 × I −
→ X1 × I × X2 × I × X3 × I,
definita da:

(x1 , s, x2 , x3 , t) −
→ (x1 , s, x2 , (1 − s)(1 − t), x3 , (1 − s)t).
−1
La α′′ ◦ α′ dà l’omeomorfismo cercato.
Se (Xi )1≤i≤m è una m-upla di spazi topologici, possiamo definire, utilizzando
l’associatività dell’operazione di giunto topologico dimostrata nella proposizione
precedente, lo spazio topologico X1 ∗ ... ∗ Xm : esso si identifica in modo canonico
al sottospazio

{(t1 · x1 , ..., tm · xm ) |xi ∈ Xi , ti ∈ I, 1 ≤ i ≤ m, t1 + ... + tm = 1}


Qm
del prodotto topologico i=1 CXi .

Proposizione 4.4 Sia (Xi )1≤i≤m una m-upla di spazi topologici. Allora C(X1 ∗
Qm
... ∗ Xm ) è omeomorfo a i=1 CXi .

Dim. Definiamo un’applicazione continua


m
Y
φ : (X1 ∗ ... ∗ Xm ) × I −
→ CXi
i=1
38 II. COSTRUZIONI TOPOLOGICHE

Qm
identificando X1 ∗ ... ∗ Xm al sottospazio di i=1 CXi formato dalle m-uple (t1 ·
x1 , ..., tm · xm ) con xi ∈ Xi , ti ∈ I per i = 1, ..., m e t1 + ... + tm = 1 e ponendo

φ(t1 · x1 , ..., tm · xm , t) = ((tt1 ) · x1 , ..., (ttm ) · xm ) .


Il suo quoziente iniettivo è l’omeomorfismo cercato.

Proposizione 4.5 Sia X uno spazio topologico. Abbiamo i seguenti omeomorfi-


smi:
X ∗ D0 ≃ CX
X ∗ S0 ≃ SX
X ∗ Sk ≃ S k X.

Dim. Il primo si ottiene per passaggio al quoziente dall’applicazione:

X × D0 × I ∋ (x, 0, t) −
→ (x, t) ∈ X × I;

il secondo per passaggio al quoziente e abbreviazione da:

X × S0 × I ∋ (x, s, t) −
→ (x, (1 + st)/2) ∈ X × I,

(nota che s = ±1).


Il terzo omeomorfismo si ricava dalla proprietà associativa del giunto topologico:

S k+1 X≃ S k (X ∗ S0 ) ≃ S k−1 (X ∗ S0 ∗ S0 )
≃ S k−1 (X ∗ S1 ) ≃ ...
... ≃ X ∗ Sk

in qunto Sj ∗ S0 ≃ Sj+1 per ogni intero non negativo j.

Esempio 4.2 Siano m1 , ..., mn interi non negativi. Abbiamo gli omeomorfismi:

(1) Sm1 ∗ Sm2 ∗ ... ∗ Smn ≃ Sm1 +m2 +...+mn +n−1


(2) Dm1 × Dm2 × ... × Dmn ≃ Dm1 +m2 +...+mn
(3) Dm1 ∗ Dm2 ∗ ... ∗ Dmn ≃ Dm1 +m2 +...+mn +n−1 .

Basta dimostrare che gli omeomorfismi valgono per n = 2. Quindi la (1) è stata già
verificata. La (2) è ovvia se m1 = 0 o m2 = 0. Se m1 , m2 ≥ 1, abbiamo la catena
di omeomorfismi:

Dm1 × Dm2 ≃ CSm1 −1 × CSm2 −1 ≃ C Sm1 −1 ∗ Sm2 −1
≃ C Sm1 +m2 −1 ≃ Dm1 +m2 .

Anche per la (3) possiamo limitarci a considerare il caso m1 , m2 ≥ 1. Abbiamo


allora:
 
Dm1 ∗ Dm2 ≃ CSm1 −1 ∗ C Sm2 −1 ≃ Sm1 −1 ∗ D0 ∗ Sm2 −1 ∗ D0
≃ Sm1 −1 ∗ Sm2 −1 ∗ D0 ∗ D0 ≃ Sm1 +m2 −1 ∗ D0 ∗ D0
≃ CSm1 +m2 −1 ∗ D0 ≃ Dm1 +m2 ∗ D0
≃ CDm1 +m2 ≃ Dm1 +m2 +1 .
III. ASSIOMI DI SEPARAZIONE 39

CAPITOLO III

ASSIOMI DI SEPARAZIONE

L’esistenza di funzioni continue a valori reali non banali su uno spazio topologico
X è naturalmente legata alle proprietà della struttura topologica. In questo capitolo
esamineremo alcuni degli assiomi di separazione e numerabilità collegati a questo
problema e le loro conseguenze.

§1 Assiomi di separazione
Un intorno di A di uno spazio topologico X è un qualsiasi sottoinsieme B di X

tale che A ⊂ B.
Diciamo che uno spazio topologico X soddisfa l’assioma di separazione Ti (i =
1, 2, 3, 4) se:
(T1 ) Per ogni x 6= y ∈ X, esiste un intorno di x in X che non contenga y.
In modo equivalente: Per ogni punto x ∈ X, l’insieme {x} è chiuso in X.
(T2 ) Due qualsiasi punti distinti di X ammettono intorni disgiunti: per ogni
x 6= y ∈ X, possiamo trovare un aperto Ux ∋ x e un aperto Uy ∋ y tali che
Ux ∩ Uy = ∅.
(T3 ) Se F è un chiuso di X e x un punto di X non appartenente ad F , esiste
un aperto A ⊃ F e un aperto U ∋ x tali che A ∩ U = ∅.
Questa prorietà è equivalente al fatto che: Ogni punto x di X ha un
sistema fondamentale di intorni chiusi.
(T4 ) Ogni coppia di chiusi disgiunti di X ammette una coppia di intorni
disgiunti.
Se cioè F, G sono due chiusi di X con F ∩ G = ∅, allora esistono due
aperti A ⊃ F e B ⊃ G di X tali che A ∩ B = ∅.

Uno spazio topologico che soddisfi l’assioma T2 soddisfa anche l’assioma T1 e si


dice di Hausdorff o separato.
Uno spazio topologico che soddisfi gli assiomi T1 e T3 soddisfa anche l’assioma
T2 e si dice regolare.
Uno spazio topologico che soddisfi gli assiomi T1 e T4 soddisfa anche gli assiomi
T2 e T3 e si dice normale.
Esempio 1.1 Un qualsiasi insieme X che contenga almeno due punti, con la to-
pologia indiscreta, soddisfa T3 e T4 ma non T1 e T2 .
Esempio 1.2 La topologia dell’ordine su un insieme X linearmente ordinato
soddisfa T2 .
Siano infatti x < y due punti distinti di X. Se esiste a ∈ X tale che x < a < y,
allora le semirette {z ∈ X | z < a} e {z ∈ X | a < z} sono intorni aperti disgiunti
di x e y rispettivamente. Se non esiste nessun elemento a per cui sia x < a < y,
40 III. ASSIOMI DI SEPARAZIONE

allora {z ∈ X | z < y} e {z ∈ X | x < z} sono intorni aperti disgiunti di x ed y


rispettivamente.
Esempio 1.3 Sia X un insieme che contenga almeno due punti, a un punto di X.
La topologia τ = {∅, X, {a}} rende X uno spazio T4 ma non T3 . Infatti se A e
B sono due chiusi disgiunti di X, uno dei due è necessariamente vuoto. Il chiuso
X \ {a} e il punto a non hanno intorni disgiunti, in quanto X è l’unico aperto di
X che contiene X \ {a}.
Esempio 1.4 Sia X lo spazio topologico ottenuto considerando sull’intervallo [0, 1]
di R la topologia τ che ha come prebase degli aperti la famiglia Γ formata dagli
insiemi [0, b[, ]b, 1] al variare di b in ]0, 1[ e dall’insieme

/ N − {0}
U = {x ∈ [0, 1[ | x(1 + n) ∈ ∀n ∈ N} .

Lo spazio topologico cosı̀ ottenuto soddisfa T2 ma non T3 . La topologia che si


ottiene su [0, 1] è più fine della topologia Euclidea e quindi è separata. Mostriamo
che essa non soddisfa l’assioma T3 : l’insieme F = {(1 + n)−1 | n ∈ N} è un chiuso
di ([0, 1], τ ) che non contiene il punto 0. Ma 0 ed F non hanno intorni disgiunti:
infatti gli aperti Ub = [0, b[∩U di 0 , al variare di b in ]0, 1[, formano un sistema
fondamentale di intorni di 0 nella τ . Fissato b ∈]0, 1[, possiamo trovare ν ∈ N
tale che (1 + ν)−1 < b. Un qualsiasi aperto contenente F contiene un intervallo
](1 + ν)−1 − ǫ, (1 + ν)−1 + ǫ[ per qualche ǫ > 0 sufficientemente piccolo e quindi ha
intersezione non vuota con Ub .
Esempio 1.5 Lo spazio vettoriale Kn , con la topologia di Zariski, soddisfa T1 ,
ma, se K contiene infiniti elementi e n ≥ 1, non soddisfa gli assiomi T2 , T3 , T4 .
Teorema 1.1 Un sottospazio di uno spazio topologico che soddisfa l’assioma
di separazione Ti soddisfa ancora l’assioma di separazione Ti se i = 1, 2, 3. Un
sottospazio chiuso di uno spazio topologico che soddisfi l’assioma T4 soddisfa l’assio -
ma T4 .

Dim. Sia Y un sottospazio topologico dello spazio topologico X.


Se X soddisfa T1 , i sottoinsiemi di Y formati da un solo punto sono chiusi in X
e quindi a maggior ragione nella topologia di sottospazio di Y . Quindi anche Y
soddisfa T1 .
Supponiamo che X sia di Hausdorff. Se x 6= y ∈ Y , esistono due intorni aperti
disgiunti Ux di x e Uy di y in X. Allora Ux ∩Y e Uy ∩Y sono intorni aperti disgiunti
di x e y in Y. Quindi Y è anch’esso di Hausdorff.
Supponiamo ora che X soddisfi T3 . Siano F un chiuso di Y e y un punto di Y
non appartenente ad F . Per la definizione della topologia di sottospazio, esiste un
sottoinsieme chiuso A di X tale che A ∩ Y = F . Allora A è un chiuso di X che non
contiene il punto y e possiamo trovare aperti B ed U in X tali che

A ⊂ B, y ∈ U, B ∩ U = ∅.

Allora B ∩ Y e U ∩ Y sono intorni disgiunti di F ed y in Y.


Supponiamo infine che X soddisfi l’assioma T4 e che Y sia un chiuso di X. Se
F1 ed F2 sono chiusi disgiunti di Y, allora essi sono anche chiusi disgiunti di X e
vi sono quindi due aperti A1 , A2 di X tali che

F1 ⊂ A1 , F2 ⊂ F2 , A1 ∩ A2 = ∅.
III. ASSIOMI DI SEPARAZIONE 41

Allora A1 ∩ Y e A2 ∩ Y sono intorni aperti disgiunti di F1 ed F2 in Y.

Osservazione Vedremo nel seguito che un sottospazio chiuso di uno spazio nor-
male può non essere un sottospazio normale.
Teorema 1.2 Ogni spazio metrizzabile è normale.

Dim. Sia X uno spazio metrizzabile e sia d : X ×X − → R una distanza che definisce
la topologia di X.
Dimostriamo innanzi tutto che X è di Hausdorff: se x 6= y ∈ X, le palle aperte
B(x, 12 d(x, y)) e B(y, 21 d(x, y)) sono due intorni aperti disgiunti di x e y.
Siano ora A e B due chiusi disgiunti di X. Poiché le funzioni X ∋ x − → d(x, A) ∈
ReX∋x− → d(x, B) ∈ R sono continue, i due insiemi

U = {x ∈ X | d(x, A) < d(x, B)} e V = {x ∈ X | d(x, A) > d(x, B)}

sono aperti disgiunti X, che contengono rispettivamente A e B.

Teorema 1.3 Ogni retratto di uno spazio di Hausdorff è chiuso.

Dim. Sia Y ⊂ X un retratto dello spazio topologico di Hausdorff X = (X, τX ).


Sia ρ : X −→ Y una retrazione. Se Y = X, la tesi è banalmente vera. Supponiamo
quindi Y 6= X e sia x ∈ X − Y . Poiché X è di Hausdorff, x e ρ(x) hanno intorni
aperti disgiunti U e V . Poiché ρ è continua, possiamo trovare un intorno aperto U ′
di x contenuto in U tale che ρ(U ′ ) ⊂ V . Ma questa inclusione implica in particolare
che ρ(y) 6= y se y ∈ U ′ , cioè U ′ ∩ Y = ∅. Quindi X \ Y è intorno di ogni suo punto,
perciò aperto e Y è chiuso.

Teorema 1.4 Condizione necessaria e sufficiente affinché uno spazio topologico


X sia di Hausdorff è che la diagonale ∆X = {(x, x) | x ∈ X} sia chiusa nel prodotto
topologico X × X.

Dim. Supponiamo che X sia di Hausdorff e siano x 6= y due punti distinti di X.


Se Ux , Uy sono intorni aperti disgiunti di x e y rispettivamente, allora Ux × Uy è un
intorno di (x, y) in X × X che non interseca ∆X . Questo dimostra che X × X \ ∆X
è aperto in X × X.
Supponiamo viceversa che ∆X sia chiusa in X × X. Se x, y sono punti distinti di
X, allora (x, y) ∈
/ ∆X e possiamo trovare un intorno aperto U = Ux × Uy , con Ux
e Uy aperti di X, che non interseca ∆X . Chiaramente Ux e Uy sono in X intorni
disgiunti di x e di y rispettivamente.

Proposizione 1.5 Siano f, g : X − → Y due applicazioni continue definite su uno


spazio topologico X e a valori in uno spazio di Hausdorff Y. Allora

{x ∈ X | f (x) = g(x)}

è chiuso in X.

Dim. L’applicazione

(f, g) : X ∋ x −
→ (f (x), g(x)) ∈ Y × Y
42 III. ASSIOMI DI SEPARAZIONE

è continua. La diagonale ∆Y = {(y, y) | y ∈ Y } è chiusa in Y × Y perché Y è di


Hausdorff e dunque la sua immagine inversa mediante (f, g) è un chiuso di X.

Teorema 1.6 Sia h uno degli interi 1, 2, 3. Il prodotto topologico X = (X, τ ) di


una I-upla (Xi )i∈I di spazi topologici non vuoti soddisfa l’assioma Th se e soltanto
se ogni spazio topologico Xi soddisfa l’assioma Th .

Dim. La condizione è necessaria perché ogni spazio Xi ammette un’immersione


topologica nel prodotto X.
Il prodotto di spazi T1 è T1 perché il prodotto di chiusi è un chiuso.
Supponiamo ora che tutti gli Xi siano separati. Se x, y sono punti distinti di X,
vi è almeno un indice i ∈ I per cui xi 6= yi . Se A, B sono intorni aperti disgiunti
di xi , yi in Xi , allora πi−1 (A) e πi−1 (B) sono intorni aperti disgiunti di x e y in X.
Supponiamo ora che tutti gli Xi soddisfino l’assioma T3 . Sia x un punto di X.
Vogliamo dimostrare che esso ammette un sistema fondamentale di intorni chiusi.
Sia U un qualsiasi intorno di x in X. Esso contiene un intorno aperto di x della
forma \
πj−1 (Aj )
j∈J

ove J ⊂ I è finito e Aj , per j ∈ J, un intorno aperto di xj in Xj . Poiché Xj è T3 ,


possiamo trovare chiusi Bj tali che

xj ∈ B j ⊂ Bj = B j ⊂ Aj ∀j ∈ J.

Allora \ \ ◦
U ⊃B = πj−1 (Bj ) ⊃ πj−1 (B j ) ∋ x
j∈J j∈J

e quindi B è un intorno chiuso di x contenuto in U . Ciò dimostra che X soddisfa


l’assioma T3 .

Osservazione In generale il prodotto di spazi normali può non essere uno spazio
normale.

§2 Funzioni di Urysohn
Lemma 2.1 Siano A e B due chiusi disgiunti di uno spazio topologico X che
soddisfa l’assioma T4 . Sia Γ la famiglia degli intorni aperti di A che non intersecano
B e sia ∆ l’insieme di tutti i numeri razionali della forma m · 2−n con m ed n interi
e 0 ≤ m · 2−n ≤ 1. Esiste una applicazione

φ:∆−
→Γ

tale che
φ(r1 ) ⊂ φ(r2 ) ∀r1 , r2 ∈ ∆ con r1 < r2 .

Dim. Indichiamo con ∆n l’insieme

∆n = {m2−n | m ∈ N, 0 ≤ m ≤ 2n }.
III. ASSIOMI DI SEPARAZIONE 43

Osserviamo che ∆n ⊂ ∆n+1 . Dimostriamo per induzione su n che è possibile


definire φn : ∆n −
→ Γ tale che
(1) φn (r1 ) ⊂ φn (r2 ) ∀r1 , r2 ∈ ∆n con r1 < r2 ,
(2) φn+1 |∆n = φn se n ≥ 0.
Sia n = 0. Allora ∆0 = {0, 1}. Definiamo φ0 (1) = X \ B. Poiché X soddisfa
T4 , A ammette un intorno chiuso F contenuto in X − B. Possiamo porre allora

φ0 (0) = F .
Supponiamo di aver definito φn per un n ≥ 0. Definiamo allora φn+1 sugli
elementi (2m) · 2−n−1 = m · 2−n mediante φn+1 (2m · 2−n−1 ) = φn (m · 2−n ). Per
ogni intero dispari 0 < 2m + 1 < 2n+1 , dopo aver scelto un intorno chiuso Fm

di φn (m · 2−n ) in φn ((m + 1) · 2−n ), poniamo φn+1 ((2m + 1) · 2−n−1 ) = F m . La
φn+1 cosı̀ definita soddisfa le condizioni (1) e (2). Ottenuta la successione delle φn ,
definiamo l’applicazione φ : ∆ − → Γ mediante

φ|∆n = φn ∀n ∈ N.

Tale applicazione soddisfa la tesi.

Teorema 2.2 (Lemma di Urysohn) Siano A e B due chiusi disgiunti di uno


spazio topologico X che soddisfa l’assioma T4 . Allora esiste una funzione continua

f :X−
→ [0, 1]

tale che
f (x) = 0 ∀x ∈ A, f (x) = 1 ∀x ∈ B.

Dim. Sia φ : ∆ − → Γ l’applicazione definita nel lemma precedente. Definiamo una


funzione f : X −
→ I = [0, 1] ponendo:

inf{r ∈ ∆ | x ∈ φ(r)} se x ∈ φ(1)
f (x) =
1 se x∈
/ φ(1).

Questa funzione vale 0 su A e 1 su B. Inoltre


S
(i) f −1 ([0, r[) = φ(s) è aperto in X per ogni r ∈ [0, 1];
s∈∆
s<r
T T
(ii) f −1 ([0, r]) = φ(s) = φ(s)
s∈∆ s∈∆
s>r s>r
è chiuso in X per ogni r ∈ [0, 1];
quindi f −1 (]r, 1]) = X − f −1 ([0, r]) è aperto per ogni r ∈ [0, 1].
Poiché gli aperti della forma [0, r[ e ]r, 1] formano una prebase della topologia di
I = [0, 1], ne segue che f : X −
→ I è continua.
Una funzione continua f : X −→ I = [0, 1] che valga 0 su A e 1 su B si dice una
funzione di Urysohn della coppia (A, B). Abbiamo quindi il
44 III. ASSIOMI DI SEPARAZIONE

Teorema 2.3 Condizione necessaria e sufficiente affinché uno spazio topologico


X soddisfi l’assioma T4 è che ogni coppia di chiusi disgiunti di X ammetta una
funzione di Urysohn.

Osservazione Sia X uno spazio topologico che soddisfa l’assioma di separazione


T4 e sia (A, B) una coppia di chiusi disgiunti di X. Se A è ritagliabile, possiamo
trovare una funzione di Urysohn della coppia (A, B) strettamente positiva su X \A:
se infatti f : X −
→ I è una funzione di Urysohn della coppia (A, B) e g : X − →I
una funzione continua tale che g(x) = 0 per x ∈ A e g(x) > 0 se x ∈ / A, allora la
funzione
max(f, g) : X ∋ x −
→ max(f (x), g(x)) ∈ I
è ancora continua e gode delle proprietà desiderate.
Se A e B sono due chiusi disgiunti ed entrambi ritagliabili, allora possiamo
trovare una funzione di Urysohn della coppia (A, B) tale che A = f −1 (0) e B =
f −1 (1). Se infatti f1 : X −
→ I una funzione di Urysohn della coppia (A, B) con A =
−1
f1 (0) e f2 : X − → I una funzione di Urysohn della coppia (B, A) con f2−1 (0) = B,
allora la f : X ∋ x − → f1 (x) (1 − f2 (x)) ∈ I è una funzione di Urysohn della coppia
(A, B) con le proprietà desiderate.

Osservazione Componendo funzioni di Urysohn con le trasformazioni affini

R∋t−
→ at + b ∈ R

(ove a ∈ R\{0}, b ∈ R) si possono ottenere funzioni continue che assumano arbitrari


valori reali α 6= β su una coppia di chiusi disgiunti (A, B) di uno spazio topologico
X che soddisfi T4 .

La caratterizzazione di Urysohn degli spazi che godono della proprietà di sepa-


razione T4 suggerisce di introdurre la seguente nozione:
Uno spazio topologico X si dice completamente regolare se per ogni chiuso A di
X ed ogni punto x ∈ / A di X esiste una funzione continua f : X −
→ I tale che

f (x) = 0, f (y) = 1 ∀y ∈ A.

Uno spazio topologico che sia completamente regolare e T1 si dice di Tychonoff.


Teorema 2.4 Un sottospazio topologico di uno spazio normale è di Tychonoff.

Dim. Siano Y un sottospazio topologico di uno spazio normale X, F un chiuso


di Y e y un punto di Y non appartenente ad F . Se B è un chiuso di X tale che
B ∩ Y = F , posto A = {y}, osserviamo che A è chiuso in X perché X è normale e
dunque in particolare T1 , ed è disgiunto da B. La restrizione a Y di una funzione
di Urysohn della coppia (A, B) ci dà una funzione continua f : Y −→ I che vale 0 in
y e 1 nei punti di F . Questo dimostra che Y è completamente regolare. È anche
T1 perché sottospazio di uno spazio T1 e quindi di Tychonoff.

Teorema 2.5 Un prodotto topologico di spazi completamente regolari è comple-


tamente regolare.
III. ASSIOMI DI SEPARAZIONE 45

Dim. Sia X = (X, τ ) il prodotto topologico della I-upla di spazi topologici com-
pletamente regolari (Xi )i∈I . Fissato un punto x di X e un chiuso F di X che non lo
contenga, possiamo trovare un sottoinsieme finito J di I ed aperti Aj ∋ xj = πj (x)
di Xj , per j ∈ J, tali che \
πj−1 (Aj ) ∩ F = ∅.
j∈J

Per ogni j ∈ J sia fj : Xj − → I una funzione continua tale che fj (xj ) = 1 ed


fj (y) = 0 per y ∈ Xj \ Aj . Allora
Y
f :X∋y−
→ fj (πj (y)) ∈ I
j∈J

è una funzione continua che vale 1 in x e 0 su F .

§3 Estensione di funzioni continue


Teorema 3.1 (Teorema di estensione di Urysohn) Sia A un chiuso non
vuoto di uno spazio topologico X che soddisfa l’assioma di separazione T4 . Per
ogni funzione continua
f :A− →R
possiamo trovare una funzione continua

f˜ : X −
→R

che prolunga f : tale cioè che risulti

f˜|A = f.

Inoltre possiamo fare in modo che f˜(X) sia contenuto nell’inviluppo convesso di
f (A).

Per dimostrare questo teorema utilizzeremo il seguente


Lemma 3.2 Sia X uno spazio topologico T4 e F un chiuso non vuoto di X. Sia L
un numero reale positivo e
φ:F −→ [−L, L]
una funzione continua. Esiste allora una funzione continua

ψ:X−
→ [−L, L]

tale che

(i) |ψ(x)| ≤ L/3 ∀x ∈ X

(ii) |ψ(x) − φ(x)| ≤ 2L/3 ∀x ∈ F.


46 III. ASSIOMI DI SEPARAZIONE

Dim. I sottoinsiemi:

A = {x ∈ F | φ(x) ≤ −L/3} e B = {x ∈ F | φ(x) ≥ L/3}.

sono due chiusi disgiunti di X. Per il Lemma di Urysohn esiste una funzione
continua ψ : X − → [−L/3, L/3] che valga −L/3 su A e L/3 su B. Tale funzione
soddisfa le condizioni (i) ed (ii).
Dimostrazione del Teorema 3.1 Supponiamo inizialmente che la funzione f
sia a valori nell’intervallo [−1, 1]. Dico che allora possiamo trovare una successione
{gn } di funzioni continue gn : X − → [−1, 1], per n ≥ 0, tale che

|gn (x)| ≤ 2−1 (2/3)n
(*) Pn
|f (x) − j=1 gj (x)| ≤ (2/3)n ∀x ∈ X.

La successione {gn } può essere definita per ricorrenza: poniamo g0 = 0 e suppo-


niamo di aver costruito g0 , ..., gn che soddisfino le (∗). Allora
n
X
A∋x−
→ f (x) − gj (x) ∈ [−(2/3)n , (2/3)n ]
j=1

è una funzione continua e per il lemma precedente possiamo trovare una funzione
continua gn+1 : X −→ [−(2/3)n , (2/3)n ] che soddisfi:

|gn+1 (x)| ≤ (1/3)(2/3)n ∀x ∈ X,


n+1
X
|f (x) − gj (x)| ≤ (2/3)n+1 ∀x ∈ A.
j=1
P∞
→R
La serie j=0 gn converge allora uniformemente a una funzione continua g : X −
ed abbiamo:
∞ ∞
X X

gn (x) ≤ (1/3)
(2/3)n = 1,
j=0 j=0

g|A = f.
Consideriamo ora il caso generale. Sia J l’inviluppo convesso di f (A) in R. Se J
è un intervallo della forma [a, b] con −∞ < a < b < ∞, ci riconduciamo al caso
precedente componendo la f con la trasformazione affine

2t − a − b
R∋t−
→ h(t) = ∈ R.
b−a

La h ◦ f è una applicazione continua su A a valori in [−1, 1]. Se g : X − → [−1, 1]


˜ −1
è una sua estensione continua, la f = h ◦ g è una estensione continua di f a
valori in [a, b]. Se J è un intervallo limitato, consideriamo la sua chiusura J in
R. Per le considerazioni appena svolte, possiamo supporre J = [−1, 1] e trovare
un’estensione g : X −→ [−1, 1] di f . Allora F e g −1 ([−1, 1] − J) sono chiusi disgiunti
III. ASSIOMI DI SEPARAZIONE 47

di X e possiamo trovare una funzione continua χ : X − → I = [0, 1] che valga 1 su F


−1 ˜
e 0 su g ([−1, 1] − J). La f : X ∋ x −→ g(x) · χ(x) ∈ J è allora l’estensione cercata.
Infine, se J non è un intervallo limitato di R, ci riconduciamo ai casi precedenti
componendo f con l’omeomorfismo

t
R∋t−
→ ∈] − 1, 1[.
1 + |t|

§4 Partizione dell’unità negli spazi normali


Sia f : X −→ R una funzione a valori reali definita su uno spazio topologico X.
Si dice supporto di f la chiusura in X dell’insieme dei punti x di X in cui f (x) 6= 0:

suppf = {x ∈ X | f (x) 6= 0}.

Sia Γ un ricoprimento di X. Una partizione continua dell’unità su X subordinata


al ricoprimento Γ è il dato di una famiglia

→ R | A ∈ Γ}
{φA : X −

di applicazioni continue tali che


(i) φA (x) ≥ 0 ∀A ∈ Γ, ∀x ∈ X;
(ii) {suppφA | A ∈ Γ} è un ricoprimento localmente finito di X;
P
(iii) A∈Γ φA (x) = 1 ∀x ∈ X.

Lemma 4.1 Sia X uno spazio topologico che soddisfa l’assioma T4 e sia Γ =
{Ai | i ∈ I} un ricoprimento aperto localmente finito di X. Possiamo allora trovare
un ricoprimento aperto ∆ = {Bi | i ∈ I} di X tale che B i ⊂ Ai per ogni i ∈ I.

Dim. Introduciamo su I un buon ordinamento5 <. Costruiremo la famiglia ∆ per


induzione transfinita, in modo che
(1) B i ⊂ Ai ∀i ∈ I,
(2) ∀j ∈ I, {Bi | i ≤ j} ∪ {Ai | j < i} è un ricoprimento aperto di X.
Fissiamo j0 ∈ I e supponiamo di aver costruito i Bi per i < j0 in modo che la (1)
valga per i < j0 e che per ogni h ∈ I con h < j0 {Bi | i ≤ h} ∪ {Ai | h < i} sia un
ricoprimento aperto di X.
Allora
∆j0 = {Bi | i < j0 } ∪ {Ai | i ≤ j0 }
è un ricoprimento aperto di X. Infatti, se x ∈ X, allora J = {i ∈ I | x ∈ Ai } è
finito per l’ipotesi che Γ fosse un ricoprimento localmente finito. Se qualche i ∈ J è
≥ j0 , allora ∆j0 contiene un aperto Ai che contiene x. Altrimenti, indichiamo con
j ′ il più grande elemento di J. Poiché per l’ipotesi induttiva

{Bi | i ≤ j ′ } ∪ {Ai | j ′ < i}


5 Ciò
significa che I è totalmente ordinato rispetto a < e che ogni sottoinsieme non vuoto di I
ammette minimo rispetto a <.
48 III. ASSIOMI DI SEPARAZIONE

è un ricoprimento aperto di X, x ∈ Bi per qualche i ≤ j ′ < j0 e dunque appartiene


a un Bi ∈ ∆j0 .
Consideriamo ora l’insieme
 
[ [
F = X \ Bj ∪ Aj  .
j<j0 j0 <j

Esso è un chiuso contenuto in Aj0 in quanto ∆j0 è un ricoprimento di X. Essendo


X uno spazio T4 , il chiuso F ha un intorno chiuso G contenuto in Aj0 . Posto

Bj0 = G, chiaramente
{Bi | i ≤ j0 } ∪ {Ai | j0 < i}
è un ricoprimento aperto di X e vale la (1) per j ≤ j0 .
Per induzione transfinita otteniamo quindi una famiglia ∆ = {Bi | i ∈ I} tale
che valgano le (1), (2). Chiaramente ∆ è un ricoprimento aperto di X: se x ∈ X
e j è il minimo indice in I tale che x ∈
/ Aj , la (2) ci dice che x ∈ Bi per qualche
i ≤ j.
La dimostrazione è completa.

Teorema 4.2 Sia Γ un ricoprimento aperto localmente finito di uno spazio to-
pologico X che soddisfi l’assioma di separazione T4 . Allora esisteuna partizione
continua dell’unità subordinata a Γ.

Dim. Sia Γ = {Ai | i ∈ I}. Utilizzando il lemma precedente, otteniamo due


ricoprimenti aperti B = {Bi | I ∈ I} e D = {Di | i ∈ I} tali che

Di ⊂ Bi ⊂ B i ⊂ Ai ∀i ∈ I.

Per ogni i ∈ I sia ψi : X −


→ I una funzione continua tale che

1 per x ∈ Di
ψj (x) =
0 per x ∈ X \ Bi .
La somma X
ψ(x) = ψi (x)
i∈I

è localmente finita e quindi definisce una funzione continua su X. Inoltre ψ(x) ≥ 1


per ogni x ∈ X. Ponendo quindi

φi (x) = ψi (x)/ψ(x) ∀x ∈ X, ∀i ∈ I

otteniamo la partizione dell’unità continua cercata.

Osservazione Nel caso in cui il ricoprimento aperto Γ sia numerabile o finito,


possiamo dimostrare il teorema sull’esistenza di partizioni continue dell’unità su-
bordinate a Γ facendo uso del solo assioma di induzione di Peano.

§5 Funzioni semicontinue e spazi normali


Indichiamo con R la retta reale estesa:

R = R ∪ {−∞, +∞}
III. ASSIOMI DI SEPARAZIONE 49

con la relazione d’ordine usuale.


Una funzione
→R
f :X−
definita su uno spazio topologico X si dice
semicontinua superiormente se {x ∈ X | f (x) < a} è aperto in X per ogni a ∈ R;
semicontinua inferiormente se {x ∈ X | f (x) > a} è aperto in X per ogni a ∈ R.
Osservazione In modo equivalente: f : X − → R è semicontinua superiormente
se {x ∈ X |f (x) ≥ a} è chiuso in X per ogni a ∈ R;
è semicontinua inferiormente se {x ∈ X |f (x) ≤ a} è chiuso in X per ogni a ∈ R.
Osservazione Una funzione f : X − → R per cui la X ∋ x − → f (x) ∈ R sia
contemporaneamente semicontinua superiormente e inferiormente è continua.6
Indichiamo con SCS(X) (risp. SCI(X)) l’insieme delle funzioni semicontinue
superiormente tali che f (X) ⊂ [−∞, +∞[ (risp. inferiormente tali che f (X) ⊂
] − ∞, +∞]) sullo spazio topologico X.
Indichiamo con C(X) l’insieme di tutte le funzioni continue a valori reali sullo
spazio topologico X.
Per l’osservazione precedente,

SCS(X) ∩ SCI(X) = C(X).

Esempio 5.1 Sia X un insieme e A un sottoinsieme di X. Si dice funzione


→ I ⊂ R definita da:
caratteristica dell’insieme A la funzione χA : X −

1 se x ∈ A
χA (x) =
0 se x ∈
/ A.

Se X è uno spazio topologico, la funzione caratteristica χA è semicontinua superior-


mente se e soltanto se l’insieme A è chiuso, semicontinua inferiormente se e soltanto
se l’insieme A è aperto.
Infatti: se χA è semicontinua superiormente,

A = {x ∈ X | χA (x) ≥ 1}

è un chiuso. Viceversa, se A è un chiuso, χA è semicontinua superiormente perché:



 X se a ≤ 0

{x ∈ X | χA (x) ≥ a} = A se 0 < a ≤ 1


∅ se a > 1

è chiuso per ogni a ∈ R.


Se χA è semicontinua inferiormente, allora

A = {x ∈ X | χA (x) > 0}
6 In questo paragrafo, per semplificare le notazioni, non faremo distinzione tra una funzione f
a valori in un sottoinsieme A di R e la funzione a valori in R che si ottiene componendola con
l’inclusione A −→ R.
50 III. ASSIOMI DI SEPARAZIONE

è un aperto. Viceversa, se A è aperto:



 X se a < 0

{x ∈ X | χA (x) > a} = A se 0 ≤ a < 1


∅ se a ≥ 1

è aperto per ogni a ∈ R e quindi χA è semicontinua inferiormente.

Lemma 5.1 Siano f, g ∈ SCS(X) e λ ∈ R, λ > 0. Allora


(1) f + g ∈ SCS(X),
(2) λf ∈ SCS(X),
(3) max{f, g} ∈ SCS(X)
(4) −f ∈ SCI(X).
Analogamente: Siano f, g ∈ SCI(X) e λ ∈ R, λ > 0. Allora
(1′ ) f + g ∈ SCI(X),
(2′ ) λf ∈ SCI(X),
(3′ ) min{f, g} ∈ SCI(X)
(4′ ) −f ∈ SCS(X).

→ R è a
Dim. Verifichiamo la (1). Siano f, g ∈ SCS(X). La funzione f + g : X −
valori in [−∞, +∞[. Inoltre, per ogni a ∈ R,
[
{x ∈ X | f (x) + g(x) < a} = ({x ∈ X | f (x) < s} ∩ {x ∈ X | g(x) < t})
s+t<a

è aperto perché unione di aperti.


La verifica della (2) e della (4) sono immediate.
Mostriamo che max{f, g} ∈ SCS(X) se f, g ∈ SCS(X). Intanto

−∞ ≤ max{f, g}(x) < +∞ per ogni x ∈ X

perché −∞ ≤ f (x), g(x) < +∞. Se poi a è un qualsiasi numero reale,

{x ∈ X | max{f, g}(x) < a} = {x ∈ X | f (x) < a} ∩ {x ∈ X | g(x) < a}

è aperto perché intersezione di due aperti.


Le affermazioni relative a SCI(X) si verificani in modo analogo.

Lemma 5.2 Sia A un sottoinsieme di R e φ : A −


→ R una funzione non decrescente.
Se φ ∈ SCS(A), f ∈ SCS(X) e f (X) ⊂ A, allora φ ◦ f ∈ SCS(X).
Se φ ∈ SCI(A), f ∈ SCI(X) e f (X) ⊂ A, allora φ ◦ f ∈ SCI(X).

Dim. Supponiamo f ∈ SCS(X). Per ogni a ∈ R, consideriamo l’insieme:


[
Ea = {x ∈ X | f (x) < t}.
φ(t)<a
III. ASSIOMI DI SEPARAZIONE 51

Esso è aperto perché unione di aperti e

Ea ⊂ {x ∈ X | φ ◦ f (x) < a}

perché φ è non decrescente.


Per dimostrare che φ◦f ∈ SCS(X), mostriamo che questi due insiemi coincidono.
Sia x0 ∈ X tale che φ ◦ f (x0 ) < a. Posto f (x0 ) = s, abbiamo φ(s) < a e, poiché
abbiamo supposto la φ semicontinua superiormente, possiamo trovare un ǫ > 0 tale
che φ(t) < a se s − ǫ < t < s + ǫ. Allora x0 ∈ {x ∈ X | f (x) < s + 2ǫ } ⊂ Ea . Questo
dimostra che
{x ∈ X | φ ◦ f (x) < a} ⊂ Ea
e quindi i due insiemi coincidono.
La dimostrazione dell’enunciato che riguarda le funzioni semicontinue inferior-
mente è analoga.

Teorema 5.3 Sia {fi | i ∈ I} una qualsiasi famiglia di funzioni di SCS(X). Allora
la
→ inf fi (x) ∈ R
f :X∋x−
i∈I

è ancora una funzione semicontinua superiormente della classe SCS(X). Sia {fi | i ∈
I} una qualsiasi famiglia di funzioni di SCI(X). Allora la

→ sup fi (x) ∈ R
f :X∋x−
i∈I

è ancora una funzione semicontinua inferiormente della classe SCI(X).

Dim. Supponiamo {fi | i ∈ I} ⊂ SCS(X) e f (x) = inf i∈I fi (x) per ogni x ∈ X.
Fissato un qualsiasi numero reale a l’insieme:
[
{x ∈ X | f (x) < a} = {x ∈ X | fi (x) < a}
i∈I

è aperto perché unione di aperti. Quindi la f è semicontinua inferiormente e chia-


ramente è a valori in [−∞, +∞[ se tutte le fi sono a valori in tale insieme.
La dimostrazione della seconda parte del teorema è del tutto analoga.

Lemma 5.4 Siano {fn } e {gn } due successioni di funzioni continue a valori in I,
definite su uno spazio topologico X. Supponiamo che inf n fn = f ≤ g = supn gn .
Possiamo allora trovare una funzione continua h : X −
→ I tale che f ≤ h ≤ g.

Dim. Sostituendo a fn la funzione continua min{f0 , ...., fn } e a gn la funzione


continua max {g0 , ..., gn } possiamo supporre che fn ≥ fn+1 e gn ≤ gn+1 per ogni
n ∈ N.
Definiamo ora due successioni di funzioni continue {αn } e {βn } ponendo

 α0 = 0


j≤n min{fj , gj } se n > 0
 α = max
n


 β0 = 1

βn = max{αn−1 , fn } se n > 0.
52 III. ASSIOMI DI SEPARAZIONE

Le funzioni
h1 : X ∋ x −
→ sup αn (x) ∈ I,
n

h2 : X ∋ x −
→ inf βn (x) ∈ I,
n

sono la prima semicontinua inferiormente e la seconda semicontinua superiormente


su X. Inoltre αn ≤ gn e βn ≥ fn per ogni n ci dicono che h1 ≤ g e h2 ≥ f .
Vogliamo dimostrare che h1 = h2 = h: la h risulterà continua e soddisferà la tesi
del lemma.
Sia R ∋ t < h1 (x) per un punto x ∈ X. Poiché la successione delle αn è non
decrescente, possiamo trovare un intero ν ≥ 1 tale che αn (x) > t per ogni n ≥ ν. In
particolare, per un indice µ con 1 ≤ µ ≤ ν abbiamo fµ (x) > t e gµ (x) > t. Quindi

f1 (x) ≥ f2 (x) ≥ ... ≥ fµ (x) > t < αµ (x) ≤ αµ+1 (x) ≤ ...

e quindi anche βn (x) > t per ogni n. Ciò dimostra che h1 ≤ h2 .


Sia ora t un numero reale con t > h1 (x). Scegliamo un altro numero reale s tale
che h1 (x) < s < t. Allora αn (x) < s per ogni n e quindi min{fn (x), gn (x)} < s
per ogni n. Se fosse fn (x) > t per ogni n, avremmo gn (x) < s per ogni n e dunque
g(x) ≤ s < t ≤ f (x) ci darebbe una contraddizione. Deve quindi essere fν (x) ≤ t
per qualche intero positivo ν e dunque βν (x) ≤ t. Allora h2 (x) ≤ t. Ne segue che è
anche h2 ≤ h1 e dunque le due funzioni sono uguali. La dimostrazione è completa.

Lemma 5.5 Sia X uno spazio topologico T4 e siano f ∈ SCS(X), g ∈ SCI(X) due
funzioni tali che
0 ≤ f (x) ≤ g(x) ≤ 1 ∀x ∈ X.
→ R tale che
Esiste allora una funzione continua h : X −

f (x) ≤ h(x) ≤ g(x) ∀x ∈ X.

Dim. Per ogni coppia di interi positivi m, n con 1 ≤ m ≤ n sia φn,m : X − →


[m
n , 1] ⊂ R una funzione continua che valga m
n sul chiuso {x ∈ X | g(x) ≤ m−1
n } e
m
1 sul chiuso {x ∈ X | f (x) ≥ n }. Abbiamo φn,m (x) ≥ f (x) su X. Per ogni intero
positivo n consideriamo allora la funzione continua

→ min φn,m (x) ∈ R.


φn : X ∋ x −
1≤m≤n

m+1 m
Abbiamo allora φn (x) ≥ f (x) su X e inoltre φn (x) ≤ n se g(x) ≤ n. Posto

f0 (x) = inf φn (x) per x ∈ X,


n

otteniamo una funzione semicontinua superiormente tale che

f (x) ≤ f0 (x) ≤ g(x) ∀x ∈ X.

Applicando lo stesso ragionamento alle funzioni x − → 1 − g(x) e 1 − f0 (x), che


sono la prima semicontinua superiormente e la seconda semicontinua inferiormente,
III. ASSIOMI DI SEPARAZIONE 53

possiamo trovare una successione {ψn } di funzioni continue ψn : X − → I tali che,


posto G0 = inf n ψn , risulti 1 − g(x) ≤ G0 (x) ≤ 1 − f0 (x) per ogni x ∈ X. Allora
g0 (x) = 1 − G0 (x) è l’estremo superiore di una successione di funzioni continue e
risulta
f (x) ≤ f0 (x) ≤ g0 (x) ≤ g(x) ∀x ∈ X.
Per il lemma precedente possiamo trovare una funzione continua h : X − → I tale
che f0 (x) ≤ h(x) ≤ g0 (x) per ogni x ∈ X. Tale funzione h soddisfa la tesi.

Osservazione La proprietà espressa dal Lemma ?? caratterizza gli spazi topo-


logici T4 . Siano infatti A e B due chiusi disgiunti dello spazio topologico X. Dette
χA e χB le loro funzioni caratteristiche, le funzioni 1 − χA e χB sono la prima
semicontinua inferiormente, la seconda semicontinua superiormente e

χB (x) ≤ 1 − χA (x) ∀x ∈ X.

Una funzione continua h : X −


→ I tale che

χB (x) ≤ h(x) ≤ 1 − χA (x) ∀x ∈ X

è una funzione di Urysohn della coppia (A, B).


Quindi, uno spazio topologico X per cui valga l’enunciato del Lemma ?? soddisfa
necessariamente l’assioma di separazione T4 .
Teorema 5.6 (Teorema di interpolazione) Sia X uno spazio topologico T4
ed f ∈ SCS(X), g ∈ SCI(X) due funzioni tali che

−∞ < f (x) ≤ g(x) < +∞ ∀x ∈ X.

→ R continua tale che


Esiste allora una funzione h : X −

f (x) ≤ h(x) ≤ g(x) ∀x ∈ X.

Dim. Consideriamo la funzione α : R −


→ I definita da:
1 t
α(t) = + ∀t ∈ R.
2 1 + 2|t|

Essa definisce un omeomorfismo crescente di R sull’intervallo aperto I =]0, 1[, che
ha inversa ( 2s−1
4s per 0 < s ≤ 1/2
β(s) = 2s−1
4(1−s) per 1/2 ≤ s < 1.

Consideriamo la funzione α ◦ f . Essa è ancora semicontinua superiormente perché


composta di una funzione semicontinua superiormente e di una funzione continua
e crescente.
Analogamente α ◦ g è ancora semicontinua inferiormente perché composta di una
funzione semicontinua inferiormente e di una funzione continua e crescente.
Per il lemma precedente possiamo trovare una funzione continua λ : X − → I tale
che
α ◦ f (x) ≤ λ(x) ≤ α ◦ g(x) ∀x ∈ X.
54 III. ASSIOMI DI SEPARAZIONE

La funzione continua h = β ◦ λ soddisfa allora le condizioni del teorema.

Teorema 5.7 Sia X uno spazio normale. Allora


(1) Ogni f ∈ SCS(X) limitata superiormente è estremo inferiore di una famiglia
di funzioni continue.
(2) Ogni f ∈ SCI(X) limitata inferiormente è estremo superiore di una famiglia
di funzioni continue.

Dim. Sia f ∈ SCS(X) e supponiamo che f (x) ≤ c su X per una costante c ∈ R.


Supponiamo vi sia un punto x0 ∈ X in cui f (x0 ) < c. Fissato un qualsiasi numero
reale s con f (x0 ) < s < c, la funzione

s se x = x0
ψ(x) =
c se x ∈ X \ {x0 }

è semicontinua inferiormente perché X \ {x0 } è aperto in quanto abbiamo supposto


che X soddisfi l’assioma T1 . Per il teorema di interpolazione, possiamo trovare una
funzione continua h : X −→ R tale che

max{f (x), s} ≤ h(x) ≤ ψ(x) ∀x ∈ X.

Da questa osservazione segue che, detto F l’insieme di tutte le funzioni continue


h:X− → R tali che h ≥ f , abbiamo

f (x) = inf{h(x) | h ∈ {}.

La dimostrazione della (2) è analoga.

§6 Assiomi di numerabilità e di separabilità


Uno spazio topologico X si dice separabile se contiene un sottoinsieme D denso
e numerabile.
Esempio 6.1 La retta reale R con la topologia euclidea è separabile, in quanto
l’insieme Q dei numeri razionali è denso in R e numerabile.
Diciamo che uno spazio topologico X soddisfa al primo assioma di numerabilità
se ogni punto di X ammette un sistema fondamentale di intorni numerabile.
Diciamo che uno spazio topologico X soddisfa al secondo assioma di numerabilità
o che è a base numerabile se ammette una base numerabile di aperti.
Teorema 6.1 Uno spazio topologico X che soddisfa il secondo assioma di nume -
rabilità soddisfa anche al primo ed è separabile.

Dim. Sia B = {An | n ∈ N} una base numerabile degli aperti della topologia τX di
X. Fissato un punto x di X, la famiglia {An ∈ B | x ∈ An } è una base numerabile
di intorni di x in X.
Per ogni n appartenente all’insieme N′ dei numeri naturali per cui An 6= ∅,
scegliamo un elemento xn ∈ An . Allora D = {xn | n ∈ N′ } è un sottoinsieme denso
e numerabile di X.
III. ASSIOMI DI SEPARAZIONE 55

Teorema 6.2 Uno spazio topologico metrizzabile soddisfa al primo assioma di


numerabilità. Esso soddisfa al secondo assioma di numerabilità se e soltanto se è
separabile.

Dim. Sia X uno spazio topologico metrizzabile e d una distanza su X che ne


definisca la topologia. Per ogni x ∈ X le palle aperte Bd (x, 2−n ) di X per la
distanza d formano un sistema fondamentale di intorni numerabile di X.
Abbiamo già osservato che se X soddisfa al secondo assioma di numerabilità
allora è separabile. Supponiamo ora viceversa che X sia separabile. Sia D =
{xn | n ∈ N} un sottoinsieme denso e numerabile di X. Dico che allora

B = {Bd (xn , 2−m ) | m, n ∈ N}

è una base numerabile di X. Sia infatti A un aperto di X e x ∈ A. Possiamo


allora trovare un ǫ > 0 tale che Bd (x, ǫ) ⊂ A. Scegliamo un intero positivo m tale
che 2−m < ǫ/2. Poiché D è denso in X, esiste xn ∈ D tale che d(x, xn ) < 2−m .
Allora x ∈ Bd (xn , 2−m ) ⊂ A. Quindi ogni punto di un aperto A è contenuto in un
elemento di B contenuto in A. Questo dimostra che B è una base di X. Chiaramente
la base B che abbiamo ottenuto è numerabile.
Si verifica facilmente la:
Proposizione 6.3 Un sottospazio di uno spazio topologico che soddisfi al primo
(risp. al secondo) assioma di numerabilità soddisfa anch’esso al primo (risp. al
secondo) assioma di numerabilità.

Esempio 6.2 Un sottospazio di uno spazio topologico separabile non è neces-


sariamente separabile. Sia X = (R, τ ) ove τ è la topologia che ha come base
degli aperti gli intervalli chiusi a sinistra e aperti a destra della forma [a, b[ con
a < b. Lo spazio topologico prodotto X × X è separabile, in quanto Q × Q ne è un
sottoinsieme denso e numerabile. D’altra parte la topologia indotta sul sottospazio
Y = {(x, −x) | x ∈ R} è la topologia discreta e quindi Y non è separabile con la
topologia di sottospazio.
Teorema 6.4 Sia X = (X, τ ) il prodotto topologico di una I-upla (Xi )i∈I di
spazi topologici, ciascuno dei quali contenga almeno due punti. Allora
(1) X soddisfa al primo assioma di numerabilità se ogni Xi soddisfa al primo
assioma di numerabilità e I è finito o numerabile.
(2) X soddisfa al secondo assioma di numerabilità se ogni Xi soddisfa al
secondo assioma di numerabilità e I è finito o numerabile.
(3) X è separabile se e ogni Xi è separabile e I ha al più la potenza del
continuo.

Dim. (1) Sia x ∈ X e per ogni i ∈ I sia Ui un sistema fondamentale numerabile


di intorni di xi = πi (x) in Xi . Allora

U = {∩i∈J πi−1 (Ui ) | J ⊂ I è finito e U i ∈ Ui }

è un sistema fondamentale di intorni numerabile di x.


56 III. ASSIOMI DI SEPARAZIONE

(2) Per ogni i ∈ I sia Bi una base numerabile di Xi . Allora

B = {∩i∈J πi−1 (Ai ) | J ⊂ I è finito e Ai ∈ Bi }

è una base numerabile di τ .


(3) Se I ha al più la potenza del continuo, possiamo supporre che I ⊂ [0, 1[⊂ R.
Indichiamo con Λ l’insieme di tutte le partizioni finite di [0, 1[ in intervalli chiusi
a sinistra e aperti a destra con estremi razionali. L’insieme Λ è numerabile. Per
ogni indice i ∈ I sia Di = {xin }n∈N un sottoinsieme numerabile e denso di Xi .
Consideriamo il sottoinsieme di X:
D = {x ∈ X | ∃{E1 , ..., Ek } ∈ Λ, n1 , ..., nk ∈ N
tali che πi (x) = xins se i ∈ Es ∩ I 1 ≤ s ≤ k}.

L’insieme D è numerabile. Esso è denso in X. Se infatti J è un sottoinsieme


finito di I e, per ogni j ∈ J, Aj un aperto di Xj , possiamo trovare una partizione
{E1 , ..., Ek } ∈ Λ tale che ciascun insieme della partizione contenga al più un
elemento j di J. Per ogni j ∈ J l’aperto Aj di Xj contiene un elemento xjnj
di Dj . Allora l’elemento x di D definito da

xhnj se h, j ∈ Es per qualche 1≤s≤k
xh =
xh0 altrimenti

appartiene a ∩j∈J πj−1 (Aj ).

Teorema 6.5 Ogni spazio topologico che soddisfi l’assioma T3 e sia a base nu-
merabile soddisfa anche l’assioma T4 .

Dim. Sia B una base numerabile di aperti di uno spazio topologico X, che soddisfi
anche l’assioma di separazione T3 . Siano A e B due chiusi disgiunti di X. Per ogni
punto x ∈ A esiste un intorno aperto Ux ∈ B di x tale che U x ∩ B = ∅ e per ogni
y ∈ B un intorno aperto Vy ∈ B di y tale che V y ∩ A = ∅. Poiché B è numerabile,
possiamo trovare due successioni {xn } ⊂ A e {yn } ⊂ B tali che

{Ux | x ∈ A} = {Uxn | n ∈ N}, = {Vy | y ∈ B} = {Vyn | n ∈ N}.

Poniamo Un = Uxn e Vn = Vyn . Allora {Un } e {Vn } sono due ricoprimenti aperti
di A e B rispettivamente che sono numerabili e hanno la proprietà:

U n ∩ B = ∅, Vn ∩ A = ∅ ∀n ∈ N.

Poniamo
U0′ = U0
Sn−1
Un′ = Un \ j=1 V j
Sn
Vn′ = Vn \ j=0 U j .
Allora S∞
U = j=0 Un′ è un aperto contenente A
S∞
V = j=0 Vn′ è un aperto contenente B.
Dico che i due aperti U e V sono disgiunti. Se infatti fosse x ∈ U ∩ V , avremmo
x ∈ Un′ ∩ Vm′ per due interi m, n ≥ 0. Non può essere n ≤ m perché in questo caso
III. ASSIOMI DI SEPARAZIONE 57

Un′ ∩ Vm′ ⊂ Un ∩ (Vm \ Un ) = ∅, né n > m in quanto in questo caso Un′ ∩ Vm′ ⊂
(Un \ Vm ) ∩ Vm = ∅. Quindi U ∩ V = ∅. La dimostrazione è completa.

§7 Un teorema di immersione e metrizzabilità


Teorema 7.1 Ogni spazio regolare a base numerabile ammette un’immersione
topologica in ℓ2 .

Dim. Sia X uno spazio topologico regolare a base numerabile e sia B una base
numerabile degli aperti di X. Sia

∆ = {(U, V ) | U, V ∈ B, U ⊂ V }.

L’insieme ∆ è numerabile e possiamo quindi trovare una applicazione surgettiva

N∋n−
→ (Un , Vn ) ∈ ∆.

Per il Teorema 6.4 X è uno spazio normale. Per ogni n ∈ N esiste quindi una
funzione di Urysohn fn della coppia (U n , X − Vn ). Consideriamo l’applicazione

→ (2−n fn (x))n∈N ∈ ℓ2 .
f :X∋x−

L’applicazione f è iniettiva: se x 6= y sono due punti distinti di X, possiamo trovare


una coppia di aperti A, B ∈ B tali che x ∈ A ⊂ A ⊂ B 6∋ y e quindi un indice n ∈ N
tale che x ∈ Un e y 6∈ Vn . Allora fn (x) = 0, fn (y) = 1 e dunque f (x) 6= f (y).
Dimostriamo che f è continua: fissiamo x0 ∈ X ed ǫ > 0. Possiamo scegliere
m ∈ N sufficientemente grande, in modo che

X
2−2n < ǫ2 /2.
n=m+1

Poiché ciascuna delle funzioni fn è continua, possiamo poi trovare un intorno aperto
W di x0 tale che

|fn (x) − fn (x0 )| < ǫ/2 per n = 0, ..., m.

Allora
P∞
kf (x) − f (x0 )k2 = n=0 2−2n |fn (x) − fn (x0 )|2
Pm P∞
≤ (ǫ2 /4) n=0 2−2n + n=m+1 2−2n < ǫ2 ,

∀y ∈ W.

f (X)
Sia ora g : f (X) − → X la funzione inversa dell’abbreviazione f |X :X −
→ f (X).
Sia y0 = f (x0 ) ∈ f (X) e sia W un intorno di x0 in X. Possiamo allora trovare
una coppia (Un , Vn ) ∈ ∆ con x ∈ Un ⊂ Vn ⊂ W . Se y ∈ B(y0 , 2−n ) ∩ f (X) =
{f (x) | kf (x) − y0 k < 2−n } avremo in particolare |fn (x) − fn (x0 )| = fn (x) < 1
e quindi x ∈ Vn ⊂ W . Questo dimostra che anche g è continua e quindi f è
un’immersione topologica.
58 III. ASSIOMI DI SEPARAZIONE

Poiché un sottospazio di uno spazio metrizzabile è metrizzabile, abbiamo otte-


nuto il
Teorema 7.2 Uno spazio topologico a base numerabile è metrizzabile se e sol-
tanto se è regolare.

Esempio Sia τ la topologia su R che ha come base di aperti la famiglia B =


a, b ∈ R, a < b} degli intervalli chiusi a sinistra e aperti a destra. Poiché
{[a, b[ | S
]a, b[= a<c<b [c, b[, la topologia τ è più fine di quella Euclidea e quindi è separata.
Inoltre (R, τ ) soddisfa al primo assioma di numerabilità ed è separabile, perché
l’insieme Q dei razionali è numerabile e denso in (R, τ ). Dico che (R, τ ) soddisfa
l’assioma di separazione T4 . Per dimostrare questo fatto mostriamo che :
Un sottoinsieme A ⊂ R è chiuso in (R, τ ) se e soltanto se ogni sottoinsieme non
vuoto di A limitato inferiormente ammette minimo in A.
Sia infatti A un chiuso di (R, τ ), sia B un sottoinsieme di A e sia b = inf B. Se
fosse b ∈ / A, esisterebbe un ǫ > 0 tale che [b, b + ǫ[⊂ R \ A. In particolare x ≥ b + ǫ
per ogni x ∈ B, contraddicendo il fatto che b = inf B.
Sia viceversa A ⊂ R un insieme che contiene gli estremi inferiori dei suoi sot-
toinsiemi limitati inferiormente. Se a ∈ R \ A, consideriamo l’insieme B = {x ∈
A | x > a}. Se B = ∅, allora [a, +∞[ è un intorno aperto di a in (R, τ ) disgiunto da
A. Se B 6= ∅, allora B, essendo limitato inferiormente da a e contenuto in A, ha un
minimo b ∈ A. Abbiamo allora a < b perché a ∈ / A e [a, b[ è un intorno aperto di a
un (R, τ ) disgiunto da A. Questo dimostra che A è chiuso.
Siano ora A e B due chiusi disgiunti di (R, τ ). Per ogni a ∈ A sia xa l’estremo
inferiore dell’insieme {x ∈ B | x > a} (ricordiamoci la convenzione che inf ∅ = +∞).
Abbiamo a < xa perché xa ∈ / A e quindi Ua = [a, xa [ è un intorno aperto di
a in (R, τ ). Analogamente, S per ogni b ∈ B S poniamo yb = inf{y ∈ A | y > b} e
Vb = [b, yb [. Allora U = a∈A [a, xa [ e V = b∈B Vb sono intorni aperti disgiunti di
A e B, rispettivamente.
Ciò dimostra che (R, τ ) soddisfa l’assioma di separazione T4 .
Osserviamo che (R, τ ) non è né a base numerabile, né metrizzabile. Infatti il
sottospazio {x + y = 0} ⊂ R2 del prodotto topologico di due copie di (R, τ ) ha la
topologia discreta e quindi non è a base numerabile. Quindi il prodotto topologico
(R2 , τ ×τ ) non è a base numerabile e quindi non lo sono i suoi fattori. D’altra parte,
essendo separabile, se (R, τ ) fosse metrizzabile sarebbe anche a base numerabile.
IV. COMPATTEZZA 59

CAPITOLO IV

COMPATTEZZA

§1 Definizioni e prime proprietà


Uno spazio topologico si dice compatto se ogni suo ricoprimento aperto ammette
un sottoricoprimento finito.
Esempio 1.1 Uno spazio topologico X che contenga un numero finito di punti
è compatto. Uno spazio topologico X con la topologia discreta è compatto se e
soltanto se contiene un numero finito di punti.
Un sottoinsieme A di uno spazio topologico X si dice compatto se è compatto
per la topologia indotta. Ciò equivale al fatto che ogni ricoprimento aperto di A in
X ammetta un sottoricoprimento finito.
Se A ⊂ B sono sottoinsiemi di uno spazio topologico X, diciamo che A è
relativamente compatto in B se la sua chiusura in B è compatta. Scriviamo A ⋐ B
per indicare che A è relativamente compatto in B, che cioè A ∩ B è compatto.
Lemma 1.1 Siano A ⊂ B due sottoinsiemi di uno spazio topologico X. Condizione
necessaria e sufficiente affinché A ⋐ B è che ogni ricoprimento aperto di B contenga
un sottoricoprimento finito di A ∩ B.

Dim. Supponiamo che A ⋐ B. Sia Γ un ricoprimento aperto di B. Esso è allora


un ricoprimento aperto di A ∩ B, che per ipotesi è compatto. Possiamo quindi
estrarre da Γ un sottoricoprimento finito di A ∩ B.
Viceversa, supponiamo che da ogni ricoprimento aperto di B si possa estrarre un
sottoricoprimento finito di A ∩ B. Sia Γ un ricoprimento aperto di A ∩ B. L’insieme
B \ A è un aperto di B ed esiste quindi un aperto G di X tale che G ∩ B = B \ A.
Allora Γ′ = Γ ∪ {G} è un ricoprimento aperto di B. Da esso per ipotesi possiamo
estrarre un ricoprimento finito ∆′ di A ∩ B. Allora ∆ = ∆′ \ {G} ⊂ Γ è un
ricoprimento aperto finito di A ∩ B.
Da questo lemma si ricava immediatamente il:
Teorema 1.2 Ogni sottospazio chiuso di uno spazio topologico compatto è com-
patto. Ogni sottoinsieme di uno spazio compatto è in esso relativamente compatto.

Esempio 1.2 Sia X un insieme che contiene infiniti elementi. Fissato a ∈ X,


consideriamo su X la topologia τ che ha come base degli aperti la famiglia B di
tutti i sottoinsiemi di X che contengono a. Abbiamo τ = B∪{∅}. Il sottoinsieme {a}
di X è finito e quindi compatto in (X, τ ). Abbiamo {a} = X, che non è compatto
perché il ricoprimento aperto Γ = {{a, x} | x ∈ X \ {a}} di X non ammette un
sottoricoprimento finito.
60 IV. COMPATTEZZA

In uno spazio topologico generale X un sottoinsieme compatto può quindi non


essere relativamente compatto in X.
Sia Γ una famiglia di sottoinsiemi di un insieme X. Diciamo che Γ ha la proprietà
dell’intersezione finita se una qualsiasi intersezione di una sottofamiglia finita di Γ
è non vuota.
Teorema 1.3 Sia X uno spazio topologico. Condizione necessaria e sufficiente
affinché X sia compatto è che l’intersezione di una qualsiasi famiglia Γ di chiusi di
X che goda della proprietà dell’intersezione finita sia non vuota.

Dim. Supponiamo che X sia compatto. Sia T Γ una famiglia di chiusi di X che goda
della proprietà dell’intersezione finita. Se Γ fosse vuota, allora {X − A | A ∈ Γ}
sarebbe un ricoprimento aperto di X. Potremmo allora, per la compattezza di X,
trovare un sottoinsieme finito {A1 , ..., An } di chiusi di Γ tali che
n
[
(X \ Aj ) = X.
j=1

Ma questa relazione equivale a


n
\
Aj = ∅,
j=1

che contraddice l’ipotesi che Γ godesse della proprietà dell’intersezione finita.


Supponiamo ora che ogni famiglia di sottoinsiemi chiusi di X che abbia la
proprietà dell’intersezione finita abbia intersezione non vuota. Sia Γ un ricopri-
mento aperto di X.
La famiglia di chiusi {X \ A | A ∈ Γ} non gode della proprietà dell’intersezione
finita, perché \
(X \ A) = ∅.
A∈Γ

Esiste quindi un sottoinsieme finito {A1 , ..., An } di Γ tale che


n
\
(X \ Aj ) = ∅.
j=1

Ciò equivale al fatto che {A1 , ..., An } sia un ricoprimento di X. Questo dimostra
che X è compatto.

Teorema 1.4 (Teorema di Weierstrass) Ogni funzione reale semicontinua


superiormente su uno spazio compatto ammette massimo.
Ogni funzione reale semicontinua inferiormente su uno spazio compatto ammette
minimo.

Dim. Sia f : X − → [−∞, +∞[ una funzione semicontinua superiormente su uno


spazio compatto X e sia α ∈ R ∪ {+∞} l’estremo superiore di f in X. Allora per
ogni numero reale a < α, l’insieme

Fa = {x ∈ X | f (x) ≥ a}
IV. COMPATTEZZA 61

è un sottoinsieme chiuso non vuoto di X. La famiglia di chiusi {Fa | a < α} gode


della proprietà dell’intersezione finita, in quanto

Fa1 ∩ .... ∩ Fan = Fa se a = max{a1 , ..., an }.

La sua intersezione \
F = Fa
a<α

è non vuota perché X è compatto. Ogni punto di F è punto di massimo per f .


La dimostrazione dell’esistenza di minimo per funzioni reali semicontinue infe-
riormente è analoga.

→ R su uno spazio
Osservazione In particolare: Ogni funzione continua f : X −
compatto X ammette massimo e minimo.

Teorema 1.5 Compatti disgiunti di uno spazio di Hausdorff ammettono intorni


disgiunti.
Ogni compatto di uno spazio di Hausdorff è chiuso.
Ogni spazio di Hausdorff compatto è normale.

Dim. Siano A e B due compatti disgiunti di uno spazio di Hausdorff X. Per


ogni x ∈ A e y ∈ B possiamo trovare un intorno aperto U (x, y) di x e un intorno
aperto V (x, y) di y in X tali che U (x, y) ∩ V (x, y) = ∅. Fissato y ∈ B, gli aperti
{U (x, y) | x ∈ A} formano un ricoprimento aperto di A. Poiché A è compatto,
possiamo trovare x1 , ..., xn ∈ A tali che
n
[
A⊂ U (xj , y) = Gy .
j=1

Poniamo
n
\
W (y) = V (xj , y).
j=1

Abbiamo W (y)∩Gy = ∅ per ogni y ∈ B. Inoltre, {W (y)} è un ricoprimento aperto


di B e perciò, essendo B compatto, possiamo trovare y1 , ..., ym ∈ B tali che
m
[
W = W (yj ) ⊃ B.
j=1

Allora
m
\
G = Gyj
j=1

è un intorno aperto di A disgiunto da W . Questo dimostra la prima affermazione


del teorema.
Sia ora A un compatto di uno spazio di Hausdorff X. Se x ∈ / A, poiché {x} è un
compatto disgiunto da A possiamo trovare un intorno aperto U di x disgiunto da
A. Ciò dimostra che X − A è aperto e quindi che A è chiuso.
62 IV. COMPATTEZZA

Dalle prime due affermazioni del teorema segue immediatamente che uno spazio
di Hausdorff compatto è normale.

Teorema 1.6 Se X = (X, τ ) è uno spazio compatto che soddisfa l’assioma


di separazione T1 , ogni suo ricoprimento fondamentale numerabile ammette un
sottoricoprimento finito.

Dim. Sia Γ = {An | n ∈ N} un ricoprimento fondamentale numerabile di X. Se


X non fosse ricoperto da una sottofamiglia finita di sottoinsiemi di Γ, potremmo
trovare una successione xn di elementi di X tali che

n
[
xn ∈
/ Aj .
j=0

Sia K = {xn | n ∈ N}. Questo insieme contiene infiniti punti ed è chiuso perché
la sua intersezione con ogni elemento del ricoprimento fondamentale Γ è finita e
quindi chiusa perché X soddisfa T1 . Dunque K è compatto perché sottospazio
chiuso di uno spazio compatto. D’altra parte ogni sottoinsieme di K interseca
ciascuno degli An in un numero finito di punti: quindi è chiuso e la topologia
di K come sottospazio di X è la topologia discreta. Abbiamo cosı̀ ottenuto una
contraddizione, perché uno spazio topologico compatto con la topologia discreta
contiene al più un numero finito di punti.

Teorema 1.7 (Teorema di Alexander) Sia X uno spazio topologico e sia Γ


una prebase degli aperti della topologia di X. Allora X è compatto se e soltanto se
ogni ricoprimento ∆ ⊂ Γ ammette un sottoricoprimento finito.

Dim. La condizione è ovviamente necessaria. Per dimostrare la sufficienza ragio-


niamo per assurdo. Se X non è compatto, la famiglia G dei ricoprimenti aperti di
X che non ammettono sottoricoprimenti finiti è non vuota. Essa è parzialmente
ordinata mediante inclusione ed è induttiva:
S se {∆j | j ∈ J} è una sottofamiglia
totalmente ordinata7 di G, allora ∆ = j∈J ∆j è ancora un elemento di G. Se non
Sm si potrebbero trovare un numero finito di aperti A1 , ..., An ∈ ∆ tali
lo fosse, infatti,
che X = h=1 Ah . Se Ah ∈ ∆jh , allora {A1 , ..., An } ⊂ ∆ℓ con ℓ = max{j1 , ..., jn }
contraddice ∆ℓ ∈ G.
8
S Per il Lemma di Zorn la famiglia G possiede un elemento massimale ∆. Abbiamo
∆ = X e per la massimalità di ∆, se A è un qualsiasi aperto di X che non
appartenga a ∆, ∆ ∪ {A} ammette un sottoricoprimento finito.
Osserviamo che Γ ∩ ∆ non può essere un ricoprimento di X perché tutti i
ricoprimenti contenuti in Γ ammettono un sottoricoprimento finito. Sia quindi

7 Ciò
significa che J è un insieme totalmente ordinato rispetto a una relazione d’ordine < e che
∆j1 ⊂ ∆j2 se j1 < j2 .
8 Il lemma di Zorn è equivalente all’assioma della scelta e al principio del buon ordinamento.

Esso si enuncia nel modo seguente: Sia E un insieme non vuoto, con una relazione di ordine
parziale rispetto alla quale ogni suo sottoinsieme totalmente ordinato ammetta un maggiorante.
(Un insieme parzialmente ordinato con questa proprietà si dice induttivo). Allora E contiene un
elemento massimale, cioè un elemento che non precede nessun altro elemento distinto da esso.
IV. COMPATTEZZA 63

x ∈ X \ ∪(Γ ∩ ∆) e sia A un elemento di ∆ che contenga x. Poiché Γ è una prebase,


potremo trovare B1 , ..., Bn ∈ Γ tali che
n
\
x∈ Bj ⊂ A.
j=1

Poiché x ∈
/ ∪(Γ ∩ ∆), nessuno dei Bj appartiene a ∆. Quindi, per ogni j = 1, ..., n
possiamo trovare un sottoinsieme finito ∆j di ∆ tale che
[ 
X = ∆j ∪ B j .

S 
n
Ma allora j=1 ∆j ∪ {A} è un ricoprimento di X contenuto in ∆. Infatti
S S S S
A∪( ∆1 ) ∪ ... ∪ ( ∆n )⊃ (B
Tn 1 ∩ ... ∩ B n
S ) ∪ ( ∆ 1 ) ∪ ... ∪ ( ∆n )
⊃ j=1 (Bj ∪ ( ∆j )) = X.

Abbiamo cosı̀ ottenuto una contraddizione. Il teorema è completamente dimostrato.

Esempio 1.3 L’intervallo I = [0, 1], con la topologia euclidea, è compatto.


Osserviamo che

Γ = {[0, a[ |a ∈]0, 1[} ∪ {]a, 1] | a ∈]0, 1[}

è una prebase della topologia di I. Sia ∆ un ricoprimento aperto di I contenuto in


Γ. Sia α l’estremo superiore dell’insieme dei numeri reali a ∈]0, 1[ tali che [0, a[∈ ∆
e β l’estremo inferiore dei numeri reali a tali che ]a, 1] ∈ ∆. Allora α > 0 e β < 1.
Se fosse β ≥ α,Sci sarebbe un numero reale r con α ≤ r ≤ β e questo non potrebbe
appartenere a ∆. È dunque β < α e quindi potremo trovare 0 < a2 < a1 < 1 tali
che [0, a1 [ e ]a2 , 1] appartengano a ∆. Essi formano un sottoricoprimento finito,
formato da due elementi, di ∆.

Teorema 1.8 L’immagine di un compatto mediante un’applicazione continua è


un compatto.

Dim. Sia f : X − → Y un’applicazione continua tra due spazi topologici X e Y.


Sia A un compatto di X e Γ un ricoprimento aperto di f (A). Allora {f −1 (A) | A ∈
Γ} è un ricoprimento aperto di A in X. Poiché A è compatto, possiamo trovare
A1 , ..., An ∈ Γ tali che {f −1 (A1 ), ..., f −1 (An )} sia un ricoprimento di A. Allora
{A1 , ..., An } ⊂ Γ è un ricoprimento finito di f (A).

Teorema 1.9 (Teorema di Tychonoff) Un prodotto topologico di spazi to-


pologici non vuoti è compatto se e soltanto se ciascuno dei fattori è compatto.

Dim. Sia X = (X, τ ) il prodotto topologico della famiglia di spazi topologici non
vuoti Xj = (Xj , τj ). Se X è compatto, ciascuno degli Xj è compatto perché
immagine di X mediante l’applicazione continua πj : X − → Xj . Per dimostrare la
sufficienza della condizione, applichiamo il teorema di Alexander. Sia Γ la prebase
64 IV. COMPATTEZZA

di X formata dagli aperti πj−1 (A) al variare di j ∈ J e di A tra gli aperti di Xj .


Sia ∆ ⊂ Γ un ricoprimento di X. Per ogni indice j ∈ J poniamo

∆j = {πj−1 (A) | A ∈ τj } ∩ ∆.

∆′j = {A ∈ τj | πj−1 (A) ∈ ∆}.


Supponiamo che per qualche indice j ∈ J la famiglia di aperti ∆j sia un ricopri-
mento di X. Allora ∆′j è un ricoprimento aperto di Xj e per la compattezza di Xj
potremo allora trovare A1 , ..., An ∈ ∆′j tali che
n
[
Aj = Xj .
j=1

Allora
n
[
πj−1 (Aj ) = X
j=1

e {πj−1 (A1 ), ..., πj−1 (An )} è un sottoricoprimento finito di X contenuto in ∆.


Se per nessun indice j la famiglia
S ∆j ricopre X, allora potremo trovare un punto
xSin X tale che xj = πj (x) ∈ / ∆′j per ogni j ∈ J. Il punto x allora non appartiene
a ∆ e quindi ∆ non è un ricoprimento di X, contro l’ipotesi.

Esempio 1.4 I sottoinsiemi chiusi e limitati di Rn sono compatti. Sono infatti


compatti in R gli intervalli chiusi e limitati [a, b] con a < b reali. Un sottoinsieme
chiuso e limitato di Rn è un sottospazio chiuso di un prodotto di intervalli chiusi e
limitati e quindi un compatto perché sottoinsieme chiuso di un compatto.

§2 Compattezza e completezza negli spazi metrici


Sia X = (X, τ ) uno spazio topologico e sia {xn }n∈N una successione a valori in
X. Un elemento L ∈ X si dice limite della successione {xn }n∈N , e si scrive

L ∈ lim xn
n−
→∞

se, per ogni intorno U di L in X possiamo trovare un numero naturale ν tale che

xn ∈ U ∀n ≥ ν.

Una successione che ammetta limite si dice convergente.


Se lo spazio topologico X è separato, una successione convergente {xn }n∈N a
valori in X ammette un unico limite L, che si dice allora il limite della successione
e si indica con
L = lim xn .
n−
→∞
Uno spazio topologico X si dice compatto per successioni se da ogni successione a
valori in X se ne può estrarre9 una convergente.
9 Se
{xn } è una successione a valori in un insieme X, si dice estratta da essa ogni successione
{yn } tale che risulti yn = xkn per una successione crescente {kn } di numeri naturali.
IV. COMPATTEZZA 65

Teorema 2.1 Ogni spazio topologico compatto che soddisfi il primo assioma di
numerabilità è compatto per successioni.

Dim. Sia X = (X, τX ) uno spazio topologico compatto e sia {xn } una successione
a valori in X. Per ogni numero naturale n indichiamo con Fn la chiusura in X
dell’insieme {xm | m ≥ n}. La famiglia di chiusi Fn ha la proprietà dell’intersezione
finita e quindi ha intersezione non vuota

F = ∩n∈N Fn 6= ∅.

Sia L ∈ F . Poiché X soddisfa il primo assioma di numerabilità, possiamo trovare un


sistema fondamentale
T di intorni numerabile {Un } di L in X. A meno di sostituire
ad Un l’intorno m≤n Um di L, possiamo supporre che Un ⊃ Un+1 per ogni n ∈ N.
Costruiamo una successione estratta dalla {xn } che converge a L ponendo

k0 = min{m | xm ∈ A0 }
kn+1 = min{m > kn | xm ∈ An+1 } se n ≥ 0.

Supponiamo che X sia metrizzabile e sia d : X × X − → R una distanza che


definisce la topologia di X. In questo caso il limite L di una successione convergente
{xn }n∈N a valori in X si caratterizza mediante la proprietà:

∀ǫ > 0 ∃ν ∈ N tale che d(xn , L) < ǫ ∀n ≥ ν.

Una successione {xn }n∈N a valori in uno spazio metrico (X, d) si dice di Cauchy
se soddisfa la condizione:

∀ǫ > 0 ∃ν ∈ N tale che d(xn , xm ) < ǫ ∀n, m ≥ ν.

Ogni successione convergente a valori in uno spazio metrico è di Cauchy.


Uno spazio metrico in cui tutte le successioni di Cauchy siano convergenti si dice
completo.
Osservazione Un sottospazio chiuso di uno spazio metrico completo è completo.
Esempio 2.1 La completezza è una proprietà metrica e non topologica. Ad
esempio, la metrica euclidea

d(x, y) = |x − y| per x, y ∈ R

e la metrica
x y
d′ (x, y) = − per x, y ∈ R
1 + |x| 1 + |y|
definiscono entrambe la topologia euclidea su R. La retta reale R è completa
rispetto alla metrica euclidea, ma non lo è rispetto alla metrica d′ in quanto la
successione {n} è di Cauchy rispetto a d′ , ma non è convergente.
66 IV. COMPATTEZZA

Esempio 2.2 Sia ∆ = {z ∈ C | |z| < 1}. Con la metrica euclidea di C, il disco
∆ non è uno spazio metrico metrico completo. Esso diviene uno spazio metrico
completo con la metrica definita dalla distanza

z−w
d(z, w) = arcth = 1 log |1 − z w̄| + |z − w|
1 − z w̄ 2 |1 − z w̄| − |z − w|

(distanza iperbolica del disco).10


Uno spazio metrico (X, d) si dice totalmente limitato se per ogni ǫ > 0 esso può
essere ricoperto da un numero finito di palle aperte di raggio ǫ.
Uno spazio metrico totalmente limitato è limitato.
L’esempio 2.1 mostra che in generale non è vero il viceversa.
La compattezza negli spazi metrici si caratterizza per mezzo del seguente
Teorema 2.2 Sia (X, d) uno spazio metrico e sia X lo spazio topologico che
si ottiene considerando su X la topologia definita dalla distanza d. Sono allora
equivalenti:
(1) X è compatto.
(2) (X, d) è completo e totalmente limitato.
(3) X è compatto per successioni.

Dim. (1)⇒(2). Fissiamo un qualsiasi numero reale positivo ǫ. Allora Γ =


{Bd (x, ǫ)} è un ricoprimento aperto di X. Se X è compatto, Γ ammette un
sottoricoprimento finito e dunque X è ricoperto da un numero finito di palle aperte
di raggio ǫ.
Sia ora {xn } una successione di Cauchy a valori in X. Per ogni n ∈ N sia Fn
la chiusura dell’insieme {xj | j ≥ n}. La famiglia di chiusi {Fn } ha la proprietà
dell’intersezione finita e quindi, poiché X è compatto,

\
F = Fn 6= ∅.
n=0

Dico che, se L ∈ F , allora


L = lim xn .
n−
→∞
Sia infatti ǫ > 0 un qualsiasi numero reale positivo. Potremo allora trovare ν ∈ N
tale che
d(xn , xm ) < ǫ/2 se m, n ≥ ν.
Abbiamo Bd (L, ǫ/2) ∩ Fν 6= ∅ e quindi possiamo trovare un m ≥ ν tale che

d(L, xm ) < ǫ/2.

Abbiamo allora

d(L, xn ) ≤ d(L, xm ) + d(xm , xn ) < ǫ ∀n ≥ ν.

10 È dz dz̄
la distanza associata alla metrica di Poincaré ds2 = .
(1 − z z̄)2
IV. COMPATTEZZA 67

Questo dimostra che {xn } converge a L.


(2)⇒(3) Supponiamo che (X, d) sia completo e totalmente limitato. Sia {xn }
una successione a valori in X. Per ogni n sia ∆n un ricoprimento finito di X con
palle aperte di raggio 2−n .
Dimostriamo per ricorrenza che è possibile trovare una successione {yn } a valori
in X tale che

d(yn , yn−1 ) < 21−n se n > 0
(*)
xm ∈ Bd (yn , 2−n ) per infiniti indici m ∈ N.

Infatti, poiché ∆0 è finito, uno dei suoi elementi contiene xm per infiniti indici
m ∈ N. Scegliamo quindi y0 in modo che Bd (y0 , 1) ∈ ∆0 contenga xm per infiniti
indici m. Supponiamo di aver costruito y0 , ..., yn in modo che valgano le (∗). Allora
Bd (yn , 2−n ) è ricoperta da un numero finito di palle aperte di ∆n+1 . Una di queste,
diciamo Bd (yn+1 , 2−(n+1) ), avrà intersezione non vuota con Bd (yn , 2−n ) e conterrà
xm per infiniti indici m ∈ N. Chiaramente

d(yn , yn+1 ) < 2−n + 2−(n+1) < 21−n

perché le due palle hanno intersezione non vuota.


Costruiamo la successione estratta {xkn } per ricorrenza, ponendo

k0 = min{n | xn ∈ Bd (y0 , 1)}


kn+1 = min{n | n > kn , xn ∈ Bd (yn+1 , 2−(n+1) )}.

Se n < m abbiamo
Pm−1
d(xkn , xkm )≤ d(xn , yn ) + j=n d(yj , yj+1 ) + d(ym , xm )
Pm−1
< 2−n + j=n 2j−1 + 2−m < 12 · 2−n

e quindi la {xkn } è una successione di Cauchy. Poiché per ipotesi (X, d) è completo,
essa è convergente. Questo dimostra che la (2) implica la compattezza per succes-
sioni.
(3)⇒(1) Dimostriamo innanzi tutto che X è totalmente limitato. Se non lo fosse,
potremmo trovare ǫ > 0 tale che non sia possibile ricoprire X con palle aperte di
raggio ǫ. Fissato un punto x0 ∈ X, potremmo allora costruire per ricorrenza una
successione {xn } tale che
n
[
xn+1 ∈
/ Bd (xj , ǫ) se n ≥ 0.
j=0

Avremmo allora d(xm , xn ) ≥ ǫ se m 6= n ∈ N e da questa successione non se ne


potrebbe estrarre una convergente.
Se (X, d) è totalmente limitato, allora X è separabile: sia infatti ∆n , per ogni
n ∈ N, un ricoprimento finito di X con palle aperte di raggio 2−n . Per ogni n sia
Fn l’insieme formato dai centri delle palle in ∆n . Allora Fn è un insieme finito e

D = ∪∞
n=0 Fn
68 IV. COMPATTEZZA

è un sottoinsieme denso e numerabile di X. Poiché X è metrizzabile, questa


proprietà equivale al secondo assioma di numerabilità. In particolare, se Γ è un rico-
primento aperto di X, esso ammette un sottoricoprimento numerabile. Sia dunque
{An | n ∈ N} ⊂ Γ un ricoprimento numerabile di X. Se esso non ammettesse
sottoricoprimenti finiti, potremmo trovare una successione {xn } a valori in X tale
che
n
[
xn ∈
/ An .
j=0

Ma dalla {xn } non si potrebbe estrarre allora nessuna sottosuccessione convergente.

§3 Alcuni esempi ed applicazioni


Teorema 3.1 ℓ2 è uno spazio metrico completo.

Dim. Sia {a(n) } una successione di Cauchy in ℓ2 . Per ogni indice 0 ≤ j < ∞ la
(n)
successione di numeri reali {aj } è di Cauchy e quindi converge a un numero reale
Lj . Vogliamo dimostrare che

L = (Lj )j∈N ∈ ℓ2 e che lim a(n) = L.


n−
→∞

Fissato ǫ > 0, sia ν un numero naturale tale che

d(a(m) , a(n) ) < ǫ/8 ∀m, n ≥ ν.

Sia µ ∈ N tale che



X (ν) 2 ǫ
aj < .
j=µ
64

Allora, per ogni intero positivo h, e per ogni n ≥ ν,


   2 1/2  
Pµ+h (n) 2 1/2 Pµ+h (n) (ν) Pµ+h (ν) 2 1/2
j=µ aj ≤ j=µ aj − aj + j=µ aj

< ǫ/8 + ǫ/8 = ǫ/4.

Passando al limite in questa espressione troviamo che


µ+h
X
L2j ≤ ǫ2 /16 ∀h ∈ N
j=µ

e quindi

X
L2j ≤ ǫ2 /16.
j=µ

Da questo ricaviamo innanzi tutto che L ∈ ℓ2 .


Abbiamo inoltre

X (n) 2
aj ≤ ǫ2 /16 per n ≥ ν.
j=µ
IV. COMPATTEZZA 69

Possiamo poi trovare ν ′ ∈ N tale che


µ−1
X 2
(n) 2
se n ≥ ν ′ .

L
j − a j < ǫ /16
j=0

Allora per n ≥ max{ν, ν ′ } abbiamo:


 2 1/2 P 2 1/2
P∞ (n)

µ−1 (n)
j=0 Lj − aj ≤ j=0 Lj − aj
 
P
∞ 2
1/2 P∞ (n) 2 1/2
+ j=µ Lj + j=µ aj


≤ 4 < ǫ.

Questo dimostra che L è il limite della successione {a(n) }.

Teorema 3.2 (Fréchet-Kolmogorov) Condizione necessaria e sufficiente af-


finché un sottoinsieme A di ℓ2 sia relativamente compatto è che

A sia limitato
(*) P∞
∀ǫ > 0 ∃ν ∈ N tale che 2
n=ν |an | < ǫ
2
∀a = (an ) ∈ A.

Dim. Se A è compatto, esso è limitato e totalmente limitato. Potremo dunque


trovare elementi a1 , ..., aN di ℓ2 tali che

A ⊂ ∪N j
j=1 B(a , ǫ/2).

Possiamo fissare un intero positivo ν tale che



X
|arj |2 < ǫ2 /4 per 1 ≤ r ≤ N.
j=ν

Quindi, se a ∈ A, abbiamo
 1/2  1/2
X∞ X∞
 |aj |2  ≤ min ka − ar k + max  |arj |2  < ǫ.
1≤r≤N 1≤r≤N
j=ν j=ν

Le condizioni (∗) sono quindi necessarie.


Supponiamo ora che l’insieme A soddisfi le (∗). Dimostriamo in primo luogo che
allora A è totalmente limitato. Fissato ǫ > 0 possiamo trovare ν ∈ N tale che

X
|aj |2 < ǫ2 /16 ∀a ∈ A.
j=ν

Da questa disuguaglianza segue che



X
|aj |2 ≤ ǫ2 /16 ∀a ∈ A.
j=ν
70 IV. COMPATTEZZA

L’applicazione
→ (a0 , ..., aν−1 ) ∈ Rν
π : ℓ2 ∋ a −
trasforma insiemi limitati in insiemi limitati. In particolare π(A) è limitato e quindi
relativamente compatto in Rν . In particolare π(A) è totalmente limitato in Rν e
potremo dunque trovare a1 , ..., aN ∈ A tali che

π(A) ⊂ ∪N ν j
j=1 {x ∈ R | |π(a ) − x| < ǫ/2}.

Se a ∈ A avremo allora
P∞ 1/2
min1≤j≤N ka − aj k≤ min1≤j≤N |π(a) − π(aj )| + |ah |2
h=ν
P 1/2
∞ j 2
+ max1≤j≤N h=ν |a h | < ǫ.

Poiché ℓ2 è completo, A è anch’esso completo ed essendo totalmente limitato è


compatto.

Siano X = (X, τX ) e Y = (Y, τY ) due spazi topologici. Indichiamo con C(X, Y )


l’insieme di tutte le applicazioni continue f : X −
→Y.
Lemma 3.3 Sia X uno spazio compatto e (Y, d) uno spazio metrico. Allora

→ sup d(f (x), g(x)) ∈ R


d : C(X, Y ) × C(X, Y ) ∋ (f, g) −
x∈X

è una distanza su C(X, Y ).

Dim. Osserviamo che se f, g ∈ C(X, Y ), allora la funzione

→ d(f (x), g(y)) ∈ R


X∋x−

è continua e quindi ammette massimo per il teorema di Weierstrass. Perciò la


→ R è ben definita. Si verifica facilmente che essa
funzione d : C(X, Y ) × C(X, Y ) −
definisce una distanza su C(X, Y ).
Indichiamo con Cu (X, Y ) l’insieme delle funzioni continue dallo spazio compatto
X allo spazio metrico Y con la distanza definita nel lemma precedente.
Teorema 3.4 Se X è uno spazio compatto ed (Y, d) uno spazio metrico completo,
allora Cu (X, Y ) è uno spazio metrico completo.

Dim. Sia {fn } una successione di Cauchy a valori in Cu (X, Y ). Per ogni x ∈ X
fissato, la successione {fn (x)} è una successione di Cauchy a valori in Y . Poiché
(Y, d) è completo, essa ha limite in Y . Indichiamo con f (x) il valore del limite:

f (x) = lim fn (x) ∀x ∈ X.


n−
→∞

Fissiamo ǫ > 0 e sia ν ∈ N tale che

d (fn , fm ) < ǫ/2 ∀n, m ≥ ν.


IV. COMPATTEZZA 71

Per ogni x ∈ X abbiamo allora

d(f (x), fn (x)) = lim d(fm (x), fn (x)) ≤ ǫ/2 < ǫ ∀n ≥ ν.


m−
→∞

Quindi: per ogni ǫ > 0 possiamo trovare un intero ν tale che

sup d(f (x), fn (x)) < ǫ ∀n ≥ ν.


x∈X

Per completare la dimostrazione, basterà allora dimostrare che f ∈ Cu (X, Y ).


Fissiamo x0 ∈ X ed ǫ > 0. Sia ν ∈ N tale che

sup d(f (x), fn (x)) < ǫ/3 ∀n ≥ ν.


x∈X

Poiché fν è continua, possiamo trovare un intorno aperto U di x0 in X tale che

d(fν (x0 ), fν (x)) < ǫ/3 ∀x ∈ U.

Abbiamo allora

d(f (x0 ), f (x)) ≤ d(f (x0 ), fν (x0 )) + d(fν (x0 ), fν (x)) + d(fν (x), f (x)) < ǫ ∀x ∈ U.

Quindi f ∈ Cu (X, Y ). La dimostrazione è completa.

Un sottoinsieme F di Cu (X, Y ) si dice equicontinuo se, per ogni x0 ∈ X ed ogni


ǫ > 0, possiamo trovare un intorno aperto U di x0 in X tale che

d(f (x0 ), f (x)) < ǫ ∀f ∈ F, ∀x ∈ U.

Esso si dice equilimitato se per ogni x ∈ X l’insieme {f (x) | f ∈ F} è totalmente


limitato in Y .
Teorema 3.5 (Teorema di Ascoli-Arzelà) Sia X = (X, τX ) uno spazio com-
patto e (Y, d) uno spazio metrico completo. Condizione necessaria e sufficiente
affinché un sottoinsieme F di Cu (X, Y ) sia relativamente compatto è che esso sia
equicontinuo ed equilimitato.

Dim. Possiamo supporre nella dimostrazione che F sia un sottoinsieme chiuso di


Cu (X, Y ). Infatti la chiusura di un sottoinsieme equilimitato è equilimitata e la
chiusura di un sottoinsieme equicontinuo è equicontinua.
Dimostriamo innanzi tutto che le condizioni del teorema sono necessarie. Sup-
poniamo che F sia compatto. Esso è limitato perché i compatti degli spazi metrici
sono limitati. Fissiamo ora ǫ > 0. Poiché F è totalmente limitato, possiamo trovare
f1 , ..., fN ∈ F tali che
F ⊂ ∪Nj=1 Bd (fj , ǫ/3).

Se x0 ∈ X, poniamo

U = ∩N
j=1 {x ∈ X | d(fj (x), fj (x0 )) < ǫ/3}.
72 IV. COMPATTEZZA

Poiché le funzioni fj sono continue, U è un intorno aperto di x0 in X. Sia f ∈ F.


Fissiamo un indice j con 1 ≤ j ≤ N tale che d (f, fj ) < ǫ/3. Allora, per ogni x ∈ U ,
abbiamo:
d(f (x), f (x0 ))≤ d(f (x), fj (x))
+ d(fj (x), fj (x0 )) + d(fj (x0 ), f (x0 ))
≤ 2dd(f, fj ) + d(fj (x), fj (x0 )) < ǫ.
Questo dimostra che la condizione è necessaria.
Per dimostrare la sufficienza, poiché un sottospazio chiuso di uno spazio metrico
completo è completo, è sufficiente dimostrare che F è totalmente limitato. Fissiamo
ǫ > 0. Per ogni x0 ∈ X sia Ux0 un intorno aperto di x0 in X tale che

d(f (x), f (x0 )) < ǫ/4 ∀f ∈ F, ∀x ∈ Ux0 .

Poiché X è compatto, possiamo trovare un insieme finito di punti x1 , ..., xN ∈ X


tali che {Uxj | 1 ≤ j ≤ N } sia un ricoprimento di F.
Consideriamo l’applicazione

→ (f (x1 ), ..., f (xN )) ∈ Y N .


φ : Cu (X, Y ) ∋ f −

Essa è continua. Inoltre φ(F) è totalmente limitato in Y N .


Possiamo quindi trovare un numero finito di elementi f1 , ..., fM di F tali che

F ⊂ ∪M
h=1 {f ∈ Cu (X, Y ) | d(f (xj ), fh (xj )) < ǫ/4 per 1 ≤ j ≤ N }.

Sia ora f ∈ F e x ∈ X. Fissiamo 1 ≤ h ≤ N tale che d(f (xj ), fh (xj )) < ǫ/4 per
1 ≤ j ≤ N . Sia x ∈ X. È x ∈ Uxj per qualche 1 ≤ j ≤ N e dunque

d(f (x), fh (x)) ≤ d(f (x), f (xj )) + d(f (xj ), fh (xj )) + d(fh (xj ), fh (x)) < (3/4)ǫ.

Ne segue che d (f, fh ) ≤ (3/4)ǫ < ǫ e questo dimostra che F è totalmente limitato.

§4 Isometrie, contrazioni, completamento di uno spazio metrico


Siano (X, d) e (Y, δ) due spazi metrici. Un’applicazione φ : X −→ Y si dice
un’isometria se
δ(φ(x1 ), φ(x2 )) = d(x1 , x2 ) ∀x1 , x2 ∈ X ,
una contrazione se

δ(φ(x1 ), φ(x2 )) ≤ d(x1 , x2 ) ∀x1 , x2 ∈ X.

Un completamento di uno spazio metrico (X, d) è il dato di uno spazio metrico


completo (Y, δ) e di un’isometria

φ:X−
→ Y,

tale che φ(X) sia denso in Y per la topologia indotta dalla distanza.
Teorema 4.1 Ogni spazio metrico (X, d) ammette un completamento.
Sia (Y, δ) un completamento di (X, d) e φ : X −→ Y l’isometria di X nel suo
completamento. Per ogni spazio metrico completo (Z, η) ed ogni contrazione
IV. COMPATTEZZA 73

f :X− → Z vi è un’unica applicazione continua f˜ : Y −


→ Z che renda commutativo
il diagramma
f
X −−−−→ Z


φy



Y −−−−→ Z
La f˜ : Y −
→ Z è ancora una contrazione.
Se f è un’isometria, anche f˜ è un’isometria.

Dim. Sia (X, d) uno spazio metrico. Indichiamo con X l’insieme di tutte le suc-
cessioni di Cauchy di (X, d). Introduciamo su X la relazione di equivalenza:

{xn } ∼ {yn } ⇔ ∀ǫ > 0 ∃ν ∈ N tale che d(xn , yn ) < ǫ ∀n ≥ ν.

Se {xn } e {yn } sono due successioni di Cauchy a valori in X, poniamo

δ̃({xn }, {yn }) = lim d(xn , yn ).


n−
→∞

Tale limite esiste in quanto {d(xn , yn )} è una successione di Cauchy in R: infatti,


fissato ǫ > 0, possiamo trovare ν ∈ N tale che

d(xm , xn ) < ǫ/2 e d(ym , yn ) < ǫ/2 ∀m, n ≥ ν.

Allora

|d(xm , ym ) − d(xn , yn )| ≤ d(xm , xn ) + d(ym , yn ) < ǫ ∀m, n ≥ ν.

Osserviamo ora che δ̃({xn }, {yn }) ≥ 0 e che δ̃({xn }, {yn }) = 0 se e soltanto se


{xn } ∼ {ym } per la definizione della relazione di equivalenza. Inoltre, se {x′n } ∼
{xn } e {yn′ } ∼ {yn }, abbiamo

d(xn , yn ) − d(yn , yn′ ) − d(x′n , xn ) ≤d(x′n , yn′ ) ≤ d(x′n , xn ) + d(xn , yn )


+ d(yn , yn′ ) ∀n ∈ N

e quindi
δ̃({x′n }, {yn′ }) = δ̃({xn }, {yn }).
Possiamo quindi definire una distanza δ sul quoziente Y = X/∼ ponendo

δ([{xn }], [{yn }]) = δ̃({xn }, {yn })

se {xn }, {yn } sono due successioni di Cauchy a valori in X e [{xn }], [{yn }] le
rispettive classi di equivalenza in Y .
Facendo corrispondere a x ∈ X la classe di equivalenza della successione costante
xn = x ∀n ∈ N, otteniamo un’isometria φ : X − →Y.
Dico che φ(X) è denso in Y . Se infatti y ∈ Y è la classe di equivalenza della
successione di Cauchy {xn } ⊂ X, allora {φ(xn )} è una successione a valori in φ(X)
74 IV. COMPATTEZZA

che converge a y: per dimostrare questo fatto, fissato un qualsiasi numero reale
positivo ǫ, scegliamo ν ∈ N tale che

d(xm , xn ) < ǫ/2 ∀m, n ≥ ν.

Allora
δ(φ(xm ), y) = lim d(xm , xn ) ≤ ǫ/2 < ǫ ∀m ≥ ν.
n−
→∞
Dimostriamo che (Y, δ) è completo. Sia {yn } una successione di Cauchy a valori in
Y . Poiché φ(X) è denso in Y , per ogni n ∈ N possiamo trovare xn ∈ X tale che

δ(φ(xn ), yn ) < 2−n .

La successione {xn } è una successione di Cauchy a valori in X. Infatti

d(xm , xn ) = δ(φ(xm ), φ(xn ))


≤ δ(φ(xm ), ym ) + δ(ym , yn ) + δ(yn , φ(xn ))
≤ δ(ym , yn ) + 2−m + 2−n
∀m, n ∈ N.

Quindi, fissato ǫ > 0, se ν ∈ N è tale che

2−n < ǫ/3 ∀n ≥ ν, δ(ym , yn ) < ǫ/3 ∀m, n ≥ ν,

abbiamo
d(xm , xn ) < ǫ ∀m, n ≥ ν.
Questo dimostra che {xn } è di Cauchy. Inoltre la successione {yn } converge alla
classe di equivalenza [{xn }]. Infatti abbiamo:

δ(ym , [{xn }])≤ δ(ym , φ(xm )) + δ(φ(xm ), [{xn }])


≤ 2−m + limn− →∞ d(xm , xn );

quindi, fissato ν ∈ N tale che

2−n < ǫ/2 ∀n ≥ ν, d(xm , xn ) < ǫ/2 ∀m, n ≥ ν,

otteniamo
δ(ym , [{xn }]) < ǫ ∀m ≥ ν.
Se f : X −→ Z è una contrazione, essa trasforma successioni di Cauchy a valori
in X in successioni di Cauchy a valori in Z. Sia (Y, δ) uno spazio metrico completo
eφ:X− → Y un completamento di X. Poiché φ(X) è denso in Y , per ogni y ∈ Y
possiamo trovare una successione {xn } ⊂ X tale che y = limn− →∞ φ(xn ). Poiché
φ è un’isometria, {xn } è una successione di Cauchy in (X, d) e quindi {f (xn )} è
una successione di Cauchy in (Z, η). Essa ammette limite perché (Z, η) è completo.
Osserviamo che, se {x′n } ⊂ X è un’altra successione tale che y = limn− ′
→∞ φ(xn ),
allora {xn } ∼ {x′n } e
lim f (x′n ) = lim f (xn ).
n−
→∞ n−→∞
IV. COMPATTEZZA 75

Possiamo perciò definire senza ambiguità

f˜(y) = lim f (xn ).


n−
→∞

Si verifica immediatamente che la f˜ è l’applicazione cercata. Essa è univocamente


determinata perché è continua ed è univocamente determinata sul sottoinsieme
denso φ(X) di Y .
L’ultima affermazione del teorema si verifica in modo ovvio.

Osservazione Il completamento di uno spazio metrico è essenzialmente unico: se


infatti φ : X −
→Y eψ:X − → Z sono due completamenti dello spazio metrico (X, d)
in spazi metrici (Y, δ) e (Z, η), risultano definite, per l’ultima parte del teorema
precedente, due isometrie

ψ̃ : Y −
→Z e φ̃ : Z −
→Y

che rendono commutativo il diagramma

ψ̃
Y −−−−→ Z
x x

φ
ψ

X X
 

ψy
φ
y
Z −−−−→ Y.
φ̃

In particolare le φ̃ e ψ̃ sono una l’inversa dell’altra e quindi (Y, δ) e (Z, η) sono


isometrici.
Esempio 4.1 Sia C0 (R) lo spazio vettoriale di tutte le funzioni continue f : R −
→R
che si annullano fuori da un compatto di R. Allora
Z ∞
kf kL2 (R) = |f (x)|2 dx
−∞

è una norma su C0 (R). Con la distanza d definita da questa norma, C0 (R) non è
completo. Consideriamo ad esempio la funzione

 0 se x ≤ −1

f (x) = 1 − x2 se − 1 ≤ x ≤ 1


0 se x ≥ 1.

Allora {f 1/(n+1) } è una successione di Cauchy per la distanza d, ma non ammette


limite in C0 (R).
Il completamento di C0 (R) rispetto alla distanza d si indica con L2 (R) e si dice
lo spazio delle funzioni a quadrato sommabile su R.
76 IV. COMPATTEZZA

§5 Secondo teorema di immersione


Per il teorema di Tychonoff, se J è un insieme qualsiasi, l’insieme I J di tutte le
applicazioni di J in I, con la topologia prodotto, è uno spazio compatto. Chiame-
remo un tale spazio topologico un cubo di Tychonoff.
Lemma 5.1 Sia X = (X, τX ) uno spazio topologico, sia {Yj = (Yj , τj ) | j ∈ J}
una famiglia di spazi topologici e Y = (Y, τy ) il loro prodotto topologico. Sia

f :X−
→Y

un’applicazione continua e indichiamo con fj : X −


→ Yj l’applicazione continua:

fj : X ∋ x −
→ πj ◦ f (x) ∈ Yj .

Se per ogni chiuso A ⊂ X ed ogni x ∈ X \ A esiste un indice j ∈ J tale che


f (X)
fj (x) ∈
/ fj (A), allora f |X : X −
→ f (X) è aperta.
In particolare, se f soddisfa questa condizione ed è inoltre iniettiva, essa è
un’immersione topologica.

Dim. Sia U un aperto non vuoto di X. Se x ∈ U , possiamo trovare j ∈ J tale che


fj (x) ∈
/ fj (X \ U ). Quindi

Y \ πj−1 (fj (X \ U ) ∩ f (X) ⊂ f (U )

è un intorno aperto di f (x) in f (U ). Quindi f (U ) è aperto in f (X) perché è intorno


di ogni suo punto.

Teorema 5.2 Ogni spazio di Tychonoff ammette un’immersione topologica in un


prodotto topologico I J .

Dim. Sia J l’insieme di tutte le applicazioni continue f : X − → I dello spazio di


Tychonoff X nell’intervallo I = [0, 1]. Per il lemma precedente, l’applicazione

→ IJ
f :X−

definita da fj (x) = j(x) per ogni j ∈ J è un’immersione topologica.

§6 Compattificazione di Stone-Čech
Sia X = (X, τX ) uno spazio di Tychonoff, sia J l’insieme di tutte le applicazioni
continue φ : X −
→ I e sia
f :X−→ IJ
l’immersione topologica di X nel cubo di Tychonoff I J descritta nel paragrafo
precedente. Indichiamo con X la chiusura di f (X) in I J . Con la topologia di
sottospazio, X è compatto e di Hausdorff. Chiamiamo l’immersione topologica:

ι = f |X
X :X −
→X

compattificazione di Stone-Čech di X.
IV. COMPATTEZZA 77

Teorema 6.1 Sia X uno spazio di Tychonoff e sia X la sua compattificazione di


Stone-Čech. Ogni applicazione continua di X in uno spazio di Hausdorff compatto
Z = (Z, τZ ) si estende in modo unico a un’applicazione continua di X in Z.

Dim. Sia ι : X − → X ⊂ I J la compattificazione di Stone-Čech di X e sia f :


X − → Z un’applicazione continua di X in uno spazio di Hausdorff compatto Z.
Vogliamo dimostrare che esiste un’unica applicazione continua f˜ : X −
→ Z tale che
˜ ι(X)
f |ι(X) = f ◦ ι|X .
Sia H l’insieme di tutte le applicazioni continue h : Z −
→ I. Poiché Z è uno
spazio normale, e quindi di Tychonoff, abbiamo l’immersione topologica topologica

→ (h(z))h∈H ∈ I H
φ:Z∋z−

di Z nel cubo di Tychonoff I H . Indichiamo con f ∗ l’applicazione:

f∗ : H ∋ h −
→ h ◦ f ∈ J.

Risulta allora definita un’applicazione

F : IJ −
→ IH

mediante
F ((tj )j∈J ) = (tf ∗ (h) )h∈H ∀(tj )j∈J ∈ I J .
Per verificare che la F è continua basta verificare che

I J ∋ (tj )j∈J −
→ tf ∗ (h) ∈ I

è continua per ogni h ∈ H. Ma ciò è ovvio perché questa applicazione non è altro
che la proiezione sulla f ∗ (h)-esima coordinata del prodotto topologico I J .
Abbiamo quindi un diagramma commutativo di applicazioni continue
ι
X −−−−→ IJ
 

fy

yF
Z −−−−→ I H
φ

in cui le frecce verticali sono immersioni topologiche. Poiché Z è compatto, φ(Z) è


compatto e quindi chiuso in I H e l’immagine di F ◦ ι è contenuta in φ(Z). Quindi
F −1 (φ(Z)) è contenuto nella compattificazione di Stone-Čech X di X e la

φ(Z)
f˜ = (φ|Z )−1 ◦ F |
X

è un’estensione continua della f ◦ ι|ι(X) |X .


L’estensione è certamente unica, perché l’insieme dei punti di uno spazio topo-
logico Y in cui due applicazioni continue a valori in uno spazio di Hausdorff Z
assumono lo stesso valore è un chiuso.
78 IV. COMPATTEZZA

Teorema 6.2 Sia φ : X − → E un’immersione topologica di uno spazio topologico


X in uno spazio compatto di Hausdorff 11 E. Se per ogni applicazione continua
f : X −→ I possiamo trovare un’unica estensione continua f˜ : E −
→ I della f ◦
φ(X) −1
(φ|X ) , allora vi è un unico omeomorfismo

ψ:X−
→E

che renda commutativo il diagramma:

X
ιւ ցφ

X −
→ E.
ψ

Dim. Per il teorema precedente la φ si estende in modo unico a una ψ : X − →E


continua. Per ogni applicazione continua j : X − → I vi è un’unica applicazione
φ(X)
→ I tale che j̃|φ(X) = j ◦ (φ|X )−1 . Posto
continua j̃ : E −

g(y) = (j̃(y))j∈J

otteniamo un’applicazione g : E − → I J a valori in X che inverte la ψ. Quindi la ψ


è continua e bigettiva dallo spazio di Hausdorff compatto X sullo spazio topologico
E ed è quindi un omeomorfismo.

§7 Spazi localmente compatti


Uno spazio topologico si dice localmente compatto se ogni suo punto ha un intorno
compatto.
Osservazione Ogni spazio compatto è anche localmente compatto e ogni sotto-
spazio chiuso di uno spazio localmente compatto è localmente compatto. Il prodotto
topologico di una famiglia finita di spazi localmente compatti è localmente com-
patto.
Teorema 7.1 In uno spazio di Hausdorff localmente compatto ogni punto ha un
sistema fondamentale di intorni compatti.
Un sottospazio aperto di uno spazio di Hausdorff localmente compatto è local-
mente compatto.

Dim. Sia x un punto di uno spazio topologico X di Hausdorff e localmente


compatto. Sia V un intorno compatto di x. Allora V è uno spazio normale perché
di Hausdorff e compatto. Perciò x ammette in V un sistema fondamentale U di
intorni chiusi e quindi compatti. Poiché V è un intorno di x in X, la famiglia U è
un sistema fondamentale di intorni compatti di x in X.
La seconda affermazione segue immediatamente: se A è un aperto di X, ogni
punto x di A ammette un intorno compatto contenuto in A perché gli intorni
compatti dei punti di X formano un sistema fondamentale di intorni.
11 Osserviamo che X è allora uno spazio di Tychonoff.
IV. COMPATTEZZA 79

Teorema 7.2 Ogni compatto di uno spazio di Hausdorff localmente compatto


ammette un sistema fondamentale di intorni compatti.

Dim. Sia A un compatto di uno spazio di Hausdorff localmente compatto X e


sia U un aperto di X contenente A. Per ogni punto x ∈ A possiamo allora trovare
un intorno aperto Ux di x in X tale che Ux ⋐ U . Poiché A è compatto, possiamo
trovare x1 , ..., xn ∈ A tali che
A ⊂ ∪nj=1 Uxj .
Allora
V = ∪nj=1 U xj
è un intorno compatto di A contenuto in U .

Teorema 7.3 Sia X uno spazio di Hausdorff localmente compatto e siano A un


compatto e B un chiuso di X. Possiamo allora trovare una funzione di Urysohn
della coppia (A, B). In particolare: ogni spazio di Hausdorff localmente compatto
è completamente regolare.

Dim. Sia V un intorno compatto di A contenuto in X \B. Allora A e la frontiera


bV di V sono due chiusi disgiunti contenuti nello spazio normale V e possiamo allora
trovare una funzione continua φ : V − → I tale che φ(x) = 0 se x ∈ A e φ(x) = 1 se

x ∈ bV . Poiché {V, X \ V } è un ricoprimento chiuso finito e quindi fondamentale
di X, la funzione (
φ(x) se x ∈ V
f (x) = ◦
1 se x ∈ X \ V
è una funzione di Urysohn della coppia (A, B).

Teorema 7.4 (Teorema di estensione di Tietze) Sia X uno spazio di Hau-


sdorff localmente compatto, A un compatto di X e sia f : A − → R una funzione
continua. Possiamo allora trovare una funzione continua f˜ : X −
→ R tale che:
(1) f˜|A = f ;
(2) f˜(X) sia contenuto nell’inviluppo convesso di f (A).

Dim. Per il teorema di Weierstrass, la funzione f ammette massimo e minimo


in A. Siano m = minA f, M = maxA f . Se m = M , la f è costante e possiamo
estenderla ponendo f˜(x) = m = M per ogni x ∈ X. Se m < M , scelto un intorno
compatto U di A in X, osserviamo che A e bU sono due chiusi disgiunti dello spazio
normale U . La funzione 
f (x) se x ∈ A
g(x) =
m se x ∈ bU
è allora continua su A ∪ bU e per il teorema di estensione di Urysohn possiamo
trovare una funzione continua g̃ : U − → [m, M ] tale che g̃|A∪bU = g. Definiamo
˜
allora l’estensione continua f di f a X ponendo:
(
g̃(x) se x ∈ U
f˜(x) = ◦
m se x ∈ X \ U .
80 IV. COMPATTEZZA

Osservazione Dalla dimostrazione del Teorema di Tietze risulta immediata-


→ R, definita su un sottoinsieme compatto
mente che ogni funzione continua f : A −
di uno spazio topologico di Hausdorff localmente compatto X, si può estendere a
una funzione continua con supporto compatto in X.

§8 Compattificazione di Alexandroff
Chiamiamo compattificazione di uno spazio topologico X = (X, τX ) il dato di uno
spazio topologico compatto Y = (Y, τY ) e di un’immersione topologica φ : X − →Y.
Esempio 8.1 Sono compattificazioni dell’intervallo aperto ]0, 1[ le

]0, 1[∋ t −
→ t ∈ [0, 1],

→ e2πi t ∈ S 1 .
]0, 1[∋ t −

Esempio 8.2 Sono compattificazioni dello spazio euclideo R2 le

(x, y)
R2 ∋ (x, y) −
→p ∈ D2 = {(ξ, η) ∈ R2 | x2 + y 2 ≤ 1},
2
1+x +y 2

(4x, 4y, x2 + y 2 − 4)
R2 ∋ (x, y) −
→ p ∈ S 2 = {(ξ, η, τ ) ∈ R3 | ξ 2 + η 2 + τ 2 = 1}
4+x +y2 2

(applicazione inversa della proiezione stereografica),

R2 ∋ (x, y) −
→ [(x, y, 1)] ∈ RP2

dove R3 ∋ (ξ, η, τ ) −
→ [(ξ, η, τ )] ∈ RP2 è la proiezione nel quoziente, (immersione
dello spazio affine nello spazio proiettivo della stessa dimensione),
 2πix 
√ √2πiy
2
R ∋ (x, y) −
→ e 1+x , e 1+y
2 2
∈ S1 × S1.

Una compattificazione φ : X − → Y si dice compattificazione di Alexandroff o


compattificazione con l’aggiunta di un punto dello spazio topologico X = (X, τX )
se
(i) φ(X) è aperto in Y,
(ii) Y \ φ(X) contiene un solo punto,
(iii) Se K è un compatto chiuso di X, allora φ(K) è chiuso in Y.

Teorema 8.1 Ogni spazio topologico X ammette una compattificazione di Ale-


xandroff, unica a meno di omeomorfismi. Inoltre, la compattificazione di Alexan-
droff di X soddisfa l’assioma di separazione T1 se e soltanto se X lo soddisfa.

Dim. Indichiamo con ∞ un elemento che non appartenga all’insieme X e sia


Y = X ∪ {∞}. Sia
φ:X∋x− →x∈Y
l’inclusione. Sia τY la famiglia di sottoinsiemi di Y cosı̀ definita:
IV. COMPATTEZZA 81

A ∈ τY se o A ⊂ X e A ∈ τX , oppure ∞ ∈ A e Y \ A è chiuso e compatto in


X. Verifichiamo che τY è una topologia su Y . L’insieme vuoto è un aperto di X
contenuto in X e quindi è in τY . L’insieme Y contine ∞ e il suo complementare
è l’insieme vuoto, che è un compatto chiuso di X. Quindi Y ∈ τY . Inoltre τY
contiene le intersezioni finite delle sue sottofamiglie: se Γ è una sottofamiglia finita
di τY , sia Γ′ = {A ∈ Γ | A ⊂ X} e Γ′′ = {A ∈ Γ | ∞ ∈ A}. Se Γ′′ = ∅, allora
∩Γ = ∩Γ′ ∈ τX ⊂ τY . Se Γ′ = ∅, allora

X \ (∩Γ′′ ) = ∪{Y \ A | A ∈ Γ′′ }

è chiuso perché unione finita di chiusi e compatto perché unione finita di compatti.
Quindi ∩Γ = ∩Γ′′ ∈ τY anche in questo caso. Supponiamo ora che Γ′ e Γ′′
siano entrambi non vuoti. Osserviamo che, per ogni A ∈ Γ′′ , l’insieme A ∩ X è
il complementare in X del chiuso X \ A e quindi aperto in X. Allora

∩Γ = (∩Γ′ ) ∩ (∩{A ∩ X | A ∈ Γ′′ }) ∈ τX ⊂ τY .

Si ragiona in modo analogo per dimostrare che l’unione di una qualsiasi sottofami-
glia Γ di τY è ancora un elemento di τY . Se Γ ⊂ τX , allora ∪Γ ∈ τX ⊂ τY . Se
∞ ∈ A per ogni A ∈ Γ, allora

Y \ (∪Γ) = ∩{Y \ A | A ∈ Γ}

è un compatto chiuso perché intersezione di compatti chiusi (e quindi chiuso dentro


un qualsiasi compatto dell’intersezione). Infine, nel caso generale in cui le due
sottofamiglie Γ′ = Γ ∩ τX e Γ′′ = {A ∈ Γ | ∞ ∈ A} siano entrambe non vuote,
osserviamo che
Y \ ∪Γ = (Y \ (∪Γ′′ )) ∩ (Y \ (∪Γ′ ))
è un compatto chiuso perché intersezione del compatto chiuso Y \ (∪Γ′′ ) con il
chiuso (Y \ ∪Γ′ ).
Osserviamo che Y è compatto: se infatti Γ è un qualsiasi ricoprimento aperto di
Y , vi sarà almeno un aperto A ∈ Γ che contiene ∞. Il suo complementare X \ A
è un compatto chiuso di X e ∆ = {A ∩ X | A ∈ Γ} ne è un ricoprimento aperto
in X. Possiamo quindi trovare una sottofamiglia finita ∆′ ⊂ ∆ che ricopre X \ A.
La sottofamiglia Γ′ di Γ formata dall’insieme A e, per ogni B ∈ ∆, da un aperto
B̃ ∈ Γ tale che B̃ \ {∞} = B, è allora un ricoprimento finito di Y contenuto in Γ.
Poiché X ∈ τY , e Y \ X = {∞} contiene un solo punto, Y = (Y, τY ) con
l’applicazione φ : X − → Y è una compattificazione di Alexandroff di X.
Per dimostrare l’unicità a meno di omeomorfismi, basta osservare che la topologia
su Y per cui φ : X ∋ x − → x ∈ Y sia una compattificazione di Alexandroff di X è
univocamente determinata. Sia infatti τ una topologia su Y per cui la φ sia una
compattificazione di Alexandroff di X.
Poiché φ è un’immersione topologica e φ(X) = X è un aperto di Y, abbiamo
φ∗ (τX ) ⊂ τ . Inoltre, dal momento che (Y, τ ) è uno spazio compatto, i complemen-
tari degli aperti di τ sono chiusi compatti di (Y, τ ). Se A è un aperto di τ che
contiene ∞, allora Y \ A = X \ A è un compatto di X. Esso è anche chiuso in X
perché chiuso in X per la topologia di sottospazio, che coincide con quella di X
perché la φ è un’immersione topologica.
82 IV. COMPATTEZZA

L’ultima affermazione è conseguenza del fatto che per definizione {∞} è un chiuso
della compattificazione di Alexandroff di X.

Teorema 8.2 Sia Y = (Y, τY ) uno spazio compatto e sia φ : X − → Y una


compattificazione di Alexandroff di uno spazio topologico X = (X, τX ). Allora
(i) φ(X) è denso in Y se e soltanto se X non è compatto.
(ii) Y è uno spazio di Hausdorff se e soltanto se X è uno spazio di Hausdorff
localmente compatto.

Dim. Se φ(X) fosse chiuso in Y, allora sarebbe compatto in Y. Quindi anche


X sarebbe compatto perché φ è un’immersione topologica. Viceversa, se X fosse
compatto, φ(X) sarebbe chiuso in Y e dunque non sarebbe un sottoinsieme denso
di Y.
Supponiamo ora che Y sia uno spazio di Hausdorff. Fissato un qualsiasi punto
x ∈ X, potremmo trovare un aperto U ∋ x e un aperto V ∋ ∞ tali che U ∩ V = ∅.
Allora U è un aperto di X contenente x e quindi il compatto X \ V è un intorno di
x in X.
Viceversa, se X è di Hausdorff e localmente compatto e x, y sono due punti
distinti di Y , distinguiamo i due casi:
Se x = φ(ξ), y = φ(η) con ξ, η ∈ X, allora ξ 6= η e poiché X è di Hausdorff vi sono
intorni disgiunti Uξ e Uη di ξ e η in X. Allora φ(Uξ ) e φ(Uη ) sono intorni aperti
disgiunti di x e y in Y.
Se x = φ(ξ) con ξ ∈ X e η ∈ / φ(X), possiamo trovare un compatto U in X tale che
◦ ◦
ξ ∈ U ⊂ U . Osserviamo che U è chiuso perché X è di Hausdorff. Allora x ∈ φ(U ) ⊂
φ(U ) e quindi φ(U ) e Y \ φ(U ) sono intorni disgiunti di x e ∞ rispettivamente.
Se viceversa supponiamo che Y sia uno spazio compatto di Hausdorff, in esso gli
intorni compatti dei punti formano sistemi fondamentali di intorni e in particolare,
per ogni punto ξ ∈ X, vi è in Y un intorno compatto U di x = φ(ξ) contenuto
nell’aperto φ(X). Allora φ−1 (U ) è un intorno compatto di ξ in X.

§9 Applicazioni proprie
Siano X e Y due spazi topologici. Un’applicazione continua f : X − → Y si dice
propria se è chiusa e f −1 (K) è compatto in X per ogni K compatto in Y.
Teorema 9.1 Siano X e Y due spazi topologici. Se f : X − → Y è continua,
chiusa e f −1 (y) è compatto in X per ogni y ∈ Y , allora f è propria.

Dim. Sia K un compatto di Y e sia Γ un ricoprimento aperto di f −1 (K). Per


ogni y ∈ K vi è una sottofamiglia finita Γy di Γ tale che f −1 (y) ⊂ ∪Γy . Sia
Uy = ∪Γy . Poiché f è chiusa, l’insieme Vy = Y \ f (X \ Uy ) è aperto. Osserviamo
che y ∈ Vy e f −1 (Vy ) ⊂ Uy . Poiché K è compatto, possiamo trovare y1 , . . . , yn tali
che K ⊂ ∪nh=1 Vyh . Da questo segue che Γy1 ∪ . . . ∪ Γyn ⊂ Γ è un ricoprimento finito
di f −1 (K).

Corollario 9.2 Siano X, Y spazi topologici. Se Y è compatto, la proiezione


πX : X × Y ∋ (x, y) −
→ x ∈ X è propria.
84 IV. COMPATTEZZA

−1
Dim. Per ogni x ∈ X, l’immagine inversa πX (x) = {x} × Y è un sottospazio
di X × Y omeomorfo ad Y , e quindi compatto. Resta quindi da dimostrare che
πX : X × Y −→ X è un’applicazione chiusa. Sia F un qualsiasi chiuso di X × Y e sia
x0 un punto di X \ πX (F ). Per ogni y ∈ Y , il punto (x0 , y) non appartiene ad F ed
esistono quindi un intorno aperto Uy di x0 in X e un intorno aperto Vy di y in Y
tali che F ∩ (U
Sny × Vy ) = ∅. Poiché Y T
è compatto, possiamo trovare y1 , . . . , yn ∈ Y
n
tali che Y = i=1 Vyi . Poniamo U = i=1 Uyi . Allora :

n
[ n
[
−1
πX (U ) = U × Y = (U × Vyi ) ⊂ (Uyi × Vyi ) ⊂ (X × Y ) \ F .
i=1 i=1

Ciò dimostra che U è un intorno aperto di x0 in X che non interseca πX (F ). Per


l’arbitrarietà di x0 , questo dimostra che πX (F ) è chiuso. Quindi πX : X × Y −
→X
è chiusa e perciò è propria.

Teorema 9.3 Siano X, Y spazi di Hausdorff localmente compatti e sia f : X − →


Y un’applicazione continua. Siano X̃ = X ∪ ∞X e Ỹ = Y ∪ ∞Y , con le topologie
delle compattificazioni di Alexandroff di X e Y rispettivamente. Allora: f è propria
se e soltanto se la f˜ : X̃ −
→ Ỹ definita da:

f (x) se x ∈ X
f˜(x) =
∞Y se x = ∞X

è continua.

Dim. Supponiamo che f : X − → Y sia propria. Per dimostrare la continuità di f˜,


è sufficiente dimostrare che f˜ è continua in ∞X . Un intorno aperto di ∞Y è della
forma Ỹ \ K con K compatto in Y . Poiché f è propria, f −1 (K) è un compatto di
X. Quindi U = X̃ \ f −1 (K) è un intorno aperto di ∞X in X̃ e f˜(U ) ⊂ Ỹ \ K.
Viceversa, supponiamo la f˜ : X̃ − → Ỹ sia continua. Sia K un compatto di Y .
Allora K è un chiuso di Ỹ e f −1 (K) = f˜−1 (K) è un chiuso di X̃ contenuto in X e
quindi un compatto di X.

Teorema 9.4 Siano X, Y spazi di Hausdorff localmente compatti ed f : X −


→Y
un’applicazione propria. Allora f è chiusa.

Dim. Usiamo le notazioni del teorema precedente. Se F è un chiuso di X, allora


F ∪ {∞X } è un chiuso e quindi un compatto di X̃. Ne segue che f˜(F ∪ {∞X }) è
un compatto e quindi un chiuso di Ỹ e f (F ) = f˜(F ∪ {∞X }) ∩ Y è un chiuso di Y.
V. CONNESSIONE 85

CAPITOLO V

CONNESSIONE

§1 Connessione
Uno spazio topologico X = (X, τX ) si dice sconnesso se contiene due aperti A
e B non vuoti tali che

A ∪ B = X, A ∩ B = ∅.

Osserviamo che in questo caso A = X \ B e B = X \ A sono anche chiusi, e


quindi nella definizione precedente potevamo in modo equivalente richiedere che i
due sottoinsiemi A e B fossero entrambi chiusi. Diciamo che due aperti (e chiusi)
A, B con queste proprietà sconnettono X.
Uno spazio topologico X = (X, τX ) si dice connesso se non è sconnesso. Ciò
equivale ad affermare che gli unici sottoinsiemi di X che siano contemporaneamente
aperti e chiusi sono ∅ e X.
Un sottoinsieme A di X si dice connesso se è connesso per la topologia di sotto-
spazio.
Esempio 1.1 L’insieme vuoto e ogni sottoinsieme che contenga un solo punto
sono connessi. Uno spazio topologico con la topologia indiscreta è connesso. Un
sottoinsieme discreto di uno spazio topologico è connesso se e soltanto se contiene
al più un punto.

Lemma 1.1 Se A e B sono due aperti che sconnettono lo spazio topologico X


allora ogni sottoinsieme connesso di X è contenuto o in A o in B.

Dim. Sia C un connesso di X. Se fosse A ∩ C 6= ∅ e B ∩ C 6= ∅, allora A ∩ C e


B ∩ C sarebbero due aperti di C che lo sconnettono.

Teorema 1.2 Un sottoinsieme A di R è connesso se e soltanto se è convesso, cioè


se per ogni coppia di numeri reali a < b ∈ A l’intervallo [a, b] = {x ∈ R | a ≤ x ≤
b} ⊂ A.

Dim. Supponiamo che A ⊂ R sia connesso e siano a < b ∈ A. Se vi fosse c ∈ R \ A


con a < c < b, allora
] − ∞, c[∩A e ]c, ∞[∩A
sarebbero due aperti disgiunti di A, non vuoti, con unione uguale ad A ed A
risulterebbe sconnesso. La condizione è quindi necessaria.
Dimostriamone la sufficienza. Sia A un sottoinsieme convesso di A e supponiamo
per assurdo che esso sia sconnesso. Potremmo allora trovare due chiusi non vuoti
e disgiunti U, V di A tali che U ∪ V = A e U ∩ V = ∅. Poiché U e V sono non
86 V. CONNESSIONE

vuoti, possiamo fissare a ∈ U e b ∈ V . Allora K1 = U ∩ [a, b] e K2 = V ∩ [a, b]


sono compatti non vuoti e disgiunti e K1 ∪ K2 = [a, b]. L’applicazione K1 × K2 ∋
→ |x − y| ∈ R ammette per il teorema di Weierstrass un minimo positivo r:
(x, y) −
avremo cioè per due punti x0 ∈ K1 e y0 ∈ K2 :

0 < r = |x0 − y0 | ≤ |x − y| ∀x ∈ K1 , ∀y ∈ K2 .

Ma ciò è impossibile perché il punto z = (x0 + y0 )/2 appartiene all’intervallo [a, b],
ma non può appartenere né a K1 né a K2 in quanto |z − x0 | = |z − y0 | = r/2 < r.
Abbiamo dimostrato quindi per contraddizione che A è connesso.

Teorema 1.3 L’immagine di un connesso mediante un’applicazione continua è


un connesso.

Dim. Sia f : X − → Y un’applicazione continua tra due spazi topologici X =


(X, τX ) e Y = (Y, τY ) e sia A un connesso di X. Sostituendo ad f l’abbreviazione
f (A)
f |A , ci riconduciamo al caso in cui X = A sia connesso ed f sia surgettiva.
Supponiamo dunque che valgano queste ulteriori ipotesi. Se per assurdo Y non
fosse connesso, potremmo trovare due aperti U, V di f (X) che lo sconnettono; ma
in questo caso f −1 (U ) e f −1 (V ) sarebbero due aperti che sconnettono X.

Osservazione Il grafico di un’applicazione continua definita su un connesso è un


connesso.
L’osservazione è una conseguenza immediata del teorema precedente: ricor-
diamo infatti che il grafico di un’applicazione f : X −
→ Y è l’immagine in X × Y
dell’applicazione
F :X∋x− → (x, f (x)) ∈ X × Y.
Se X = (X, τX ) e Y = (Y, τY ) sono spazi topologici e f : X − → Y è continua,
allora anche l’applicazione F è continua (perché ciascuna delle sue componenti è
continua) e quindi la sua immagine è un connesso di X × Y se X è connesso.
Teorema 1.4 Un prodotto di spazi topologici non vuoti è connesso se e soltanto
se è connesso ogni fattore.

Dim. La condizione è necessaria per il teorema precedente, in quanto le proiezioni


del prodotto su ciascuno dei fattori sono applicazioni continue.
Sia ora {Xi = (Xi , τi ) | i ∈ I} una famiglia di spazi topologici connessi non vuoti
e indichiamo con X = (X, τ ) il loro prodotto topologico. Sia F un sottoinsieme
non vuoto di X che sia al tempo stesso aperto e chiuso in X. Dico che F gode della
seguente proprietà:
Se x ∈ F e y ∈ X è tale che {i ∈ I | yi 6= xi } contiene al più un elemento, allora
y ∈ F.
Consideriamo infatti, per un fissato x ∈ F e h ∈ I, l’immersione topologica

ιh : Xh −
→X

definita da πi (ιh (t)) = xi se i 6= h, πh (ιh (t) = t per ogni t ∈ Xh . La sua immagine


è un connesso di X e quindi la sua intersezione con F essendo aperta e chiusa per
la topologia di sottospazio e non vuota coincide con ιh (Xh ).
V. CONNESSIONE 87

Ne segue per ricorrenza che Se x ∈ F e y ∈ X è tale che {i ∈ I | yi 6= xi } contiene


al più un numero finito di elementi, allora y ∈ F .
Poiché F è aperto e non vuoto, esso contiene un aperto U della forma

U = ∩j∈J πj−1 (Aj )

con J ⊂ I finito e Aj aperto non vuoto di Xj .


Poiché ogni punto di X ha al più un numero finito di coordinate diverse da
quelle di un punto di U , ne segue che F = X. Abbiamo dimostrato cosı̀ che ogni
sottoinsieme non vuoto di X che sia al tempo stesso aperto e chiuso coincide con
X e quindi X è connesso.

§2 Componenti connesse
Teorema 2.1 Sia {Ai | i ∈ I} una famiglia di sottoinsiemi connessi di uno spazio
topologico X. Se
Ai ∩ Aj 6= ∅ ∀i, j ∈ I
allora
A = ∪i∈I Ai
è connesso.

Dim. Sia F un sottoinsieme aperto e chiuso non vuoto di A. Allora F ∩ Ai 6= ∅


per qualche indice i ∈ I. Allora F ∩ Ai è aperto e chiuso e non vuoto in Ai e quindi
coincide con Ai . Allora F ∩ Aj ⊃ Aj ∩ Ai 6= ∅ per ogni j ∈ i e ne segue che F ⊃ Aj
per ogni j ∈ I, onde F = A.

Osservazione Sia I un insieme beneordinato di indici: ciò significa che su I è


definita una relazione di ordinamento totale ”≺” tale che ogni sottoinsieme non
vuoto J ⊂ I ammetta minimo. Supponiamo che I 6= ∅ e indichiamo con i0 il
minimo di I.
Sia X uno spazio topologico e {Ai | i ∈ I} una famiglia di sottoinsiemi connessi
di X che gode della proprietà: per ogni i ∈ I \ {i0 },
 
\ [
Ai  Aj  6= ∅ .
j≺i

S
Allora A = i∈I Ai è connesso.
Per dimostrare questa affermazione, possiamo ragionare nel modo seguente: se
A non fosse connesso, potremmo trovare due aperti U e V di A che lo sconnettono.
Poiché gli Ai sono connessi, la famiglia I si decompone in due sottoinsiemi non
vuoti disgiunti:

I1 = {i ∈ I | Ai ⊂ U } e I2 = {i ∈ I | Ai ⊂ V } .

Possiamo supporre che i0 ∈ I1 e quindi il minimo j di I2 è diverso da i0 . Abbiamo


per ipotesi  
[ \
 Ai  Aj 6= ∅ ,
i≺j
88 V. CONNESSIONE

S
ma questo contraddice il fatto che i≺j Ai ⊂ U , Aj ⊂ V e U ∩ V = ∅. La tesi è
quindi dimostrata.
Un sottoinsieme non vuoto A di uno spazio topologico X si dice una componente
connessa di X se è connesso e non è propriamente contenuto in nessun connesso
di X.
Sia x un punto dello spazio topologico X = (X, τX ). Per il teorema precedente,
l’unione di tutti i connessi che contengono x, che è non vuota perché {x} è un
connesso che contiene x, è ancora un connesso. Esso è il più grande connesso,
rispetto all’inclusione, che contenga x e si dice la componente connessa di x in X.
Lemma 2.2 La componente connessa di un punto x di uno spazio topologico
X = (X, τX ) è una componente connessa di X.

Dim. Sia A la componente connessa di un punto x ∈ X. Se B è un connesso di X


tale che A ∩ B 6= ∅, allora A ∪ B è un connesso che contiene x e quindi è contenuto
in A: ne segue che B ⊂ A e dunque A non è propriamente contenuto in nessun
connesso di X ed è una componente connessa di X.

Teorema 2.3 Le componenti connesse di uno spazio topologico X = (X, τX )


formano una partizione di X.

Dim. Indichiamo con x̃ la componente connessa di x ∈ X. Chiaramente {x̃ | x ∈


X} è un ricoprimento di X. Inoltre, x̃ ⊂ ỹ per ogni y ∈ x̃, perché x̃ è un connesso
che contiene y. Ma allora anche x ∈ ỹ e quindi ỹ ⊂ x̃ e i due insiemi coincidono.

Osservazione Ogni connesso di uno spazio topologico X è contenuto in una


componente connessa di X.
Teorema 2.4 Se A è un sottoinsieme connesso di X = (X, τX ), allora A è ancora
connesso.
In particolare, le componenti connesse di X sono chiuse.

Dim. Sia A un connesso dello spazio topologico X. Se A = ∅ non vi è nulla da


dimostrare. Supponiamo quindi A 6= ∅. Se A non fosse connesso, potremmo trovare
due sottoinsiemi aperti U e V di A che lo sconnettono. Osserviamo che U e V sono
aperti e chiusi in A e in particolare sono chiusi in X.
Possiamo supporre che U ∩ A 6= ∅. Allora A ⊂ U in quanto A è connesso e
A ∩ U è aperto e chiuso e non vuoto in A. Ne segue che U \ V è un chiuso di X che
contiene A ed è propriamente contenuto in A, ma questo ci dà una contraddizione
e quindi A è connesso.

Esempio 2.1 Sia A ⊂ R2 il grafico dell’applicazione continua

→ sin(1/t) ∈ R.
]0, 1[∋ t −

Poiché esso è connesso, anche la sua chiusura

A = A ∪ ({0} × [−1, 1])

è un connesso di R2 .
V. CONNESSIONE 89

Uno spazio topologico X = (X, τX ) si dice totalmente sconnesso se per ogni


x ∈ X, la componente connessa di x è {x}.
Esempio 2.2 Uno spazio topologico con la topologia discreta è totalmente scon-
nesso; l’insieme Q dei numeri razionali, con la topologia indotta da R, è totalmente
sconnesso.

§3 Archi
Chiamiamo arco o cammino continuo in uno spazio topologico X = (X, τX ) una
qualsiasi applicazione continua

α : I = [0, 1] ∋ t −
→ xt ∈ X.

I punti x0 = α(0) e x1 = α(1) si dicono gli estremi dell’arco α.


L’insieme
|α| = {α(t) | 0 ≤ t ≤ 1}
si dice supporto dell’arco α.
Chiaramente il supporto di un arco α è un sottoinsieme connesso di X.
Se α, β : I −→ X sono due archi tali che α(1) = β(0), diciamo che essi sono
consecutivi e definiamo il loro prodotto mediante:

α(2t) se 0 ≤ t ≤ 1/2
α · β(t) =
β(2t − 1) se 1/2 ≤ t ≤ 1 .

Abbiamo |α · β| = |α| ∪ |β|. Definiamo inoltre l’inverso dell’arco α : I −


→ X
mediante:
α−1 (t) = α(1 − t) ∀0 ≤ t ≤ 1.

Due archi α, β : I − → X si dicono equivalenti, o ottenuti mediante riparame-


trizzazione, se esiste un omeomorfismo φ : I −→ I tale che φ(0) = 0, φ(1) = 1
e
β = α ◦ φ.
Due archi equivalenti hanno lo stesso supporto, ma in generale non è vero il vice-
versa.
Lemma 3.1 Siano α, β, γ : I − → X tre archi consecutivi nello spazio topologico
X = (X, τ ). Allora i due cammini (α · β) · γ e α · (β · γ) sono equivalenti.

Dim. Abbiamo:

 α(4t)
 se 0 ≤ t ≤ 1/4
(α · β) · γ(t) = β(4t − 1) se 1/4 ≤ t ≤ 1/2


γ(2t − 1) se 1/2 ≤ t ≤ 1 ,

 α(2t)
 se 0 ≤ t ≤ 1/2
α · (β · γ)(t) = β(4t − 2) se 1/2 ≤ t ≤ 3/4


γ(4t − 3) se 3/4 ≤ t ≤ 1 .
90 V. CONNESSIONE

Sia φ : I −
→ I l’omeomorfismo definito da:


 2t se 0 ≤ t ≤ 1/4

φ(t) = t + (1/4) se 1/4 ≤ t ≤ 1/2
 t+1


se 1/2 ≤ t ≤ 1 .
2
Allora
(α · (β · γ)) ◦ φ = (α · β) · γ .

Converremo nel seguito di definire il prodotto di un numero finito di archi


consecutivi α1 , α2 , . . . , αn mediante la formula induttiva:

α1 · α2 · . . . · αn = α1 · (α2 · . . . · αn ) .

È spesso conveniente considerare gli archi di uno spazio topologico modulo la


relazione di equivalenza definita dalla riparametrizzazione. Chiamiamo la classe di
equivalenza di un arco modulo riparametrizzazione arco geometrico. Per il lemma
precedente il prodotto di archi geometrici consecutivi è ben definito e gode della
proprietà associativa.

§4 Connessione per archi


Lo spazio topologico X si dice connesso per archi se, per ogni coppia di punti
x0 , x1 ∈ X possiamo trovare un arco che li abbia come estremi.
Un sottoinsieme A di X si dice connesso per archi se è connesso per archi con la
topologia di sottospazio di X.
Esempio 4.1 L’insieme vuoto e i sottoinsiemi di uno spazio topologico formati
da un solo punto sono connessi per archi. Tutti i sottoinsiemi connessi di R sono
connessi per archi. Un sottoinsieme convesso12 di Rn è connesso per archi. Ogni
aperto connesso di Rn è connesso per archi.
Teorema 4.1 Uno spazio topologico connesso per archi è connesso.

Dim. Sia X = (X, τX ) uno spazio topologico connesso per archi. Se X = ∅,


non c’è nulla da dimostrare. Se X 6= ∅, fissato un punto x0 , lo spazio X risulta
unione dei supporti dei suoi archi di punto iniziale x0 . Essi formano una famiglia
di sottoinsiemi connessi che hanno due a due intersezione non vuota e quindi X è
connesso.

Osservazione Non è vero il viceversa: uno spazio topologico può essere connesso
senza essere connesso per archi.
Consideriamo ad esempio X = {(x, sin(1/x)) | 0 < x < 1}∪{(0, y) | −1 ≤ y ≤ 1},
con la topologia di sottospazio di R2 . Esso è connesso (cf. Esempio 2.1) ma non
connesso per archi: supponiamo per assurdo che vi sia un arco

α:I∋t−
→ (xt , yt ) ∈ X
12 Unsottoinsieme A di uno spazio vettoriale reale V si dice convesso se, per ogni coppia di
vettori v, w ∈ A, il segmento {v + t(w − v) | 0 ≤ t ≤ 1} è contenuto in A.
V. CONNESSIONE 91

con α(0) = (0, 0) e α(1) = (1/π, 0). Sia t0 il massimo dell’insieme {t ∈ I | xt = 0}.
Poiché α è continua, potremmo trovare ǫ > 0 tale che

0 < xt ≤ 1/2π, |yt − yt0 | < 1/2 se t0 < t < t0 + ǫ.

Ma questo ci dà una contraddizione, perché {xt | t0 < t < t0 + ǫ}, essendo connesso
in R, contiene l’intervallo ]0, xt0 +ǫ [ e la funzione sin(1/x) assume in tale intervallo
tutti i valori compresi tra −1 e 1.

Teorema 4.2 Sia {Ai | i ∈ I} una famiglia di sottospazi connessi per archi di uno
spazio topologico X. Se
Ai ∩ Aj 6= ∅ ∀i, j ∈ I,
S
allora A = i∈I Ai è connesso per archi.

Dim. Siano x0 , x1 ∈ A. Allora x0 ∈ Ah e x1 ∈ Ak per due indici h, k ∈ I. Sia


z ∈ Ah ∩ Ak . Poiché Ah e Ak sono connessi per archi, possiamo trovare due archi

α:I−
→ Ah , β:I−
→ Ak

tali che
α(0) = x0 , α(1) = z, β(0) = z, β(1) = x1 .
Allora l’arco 
α(2t) se 0 ≤ t ≤ 1/2
α · β(t) =
β(2t − 1) se 1/2 ≤ t ≤ 1
è contenuto in A e ha estremi x0 e x1 .

Esempio 4.2 Un sottoinsieme A di Rn si dice stellato rispetto al suo punto x0 se,


per ogni x ∈ A, il segmento

[x0 , x] = {x0 + t(x − x0 ) | 0 ≤ t ≤ 1}

è contenuto in A. Se A è stellato rispetto al punto x0 , allora


[
A= [x0 , x]
x∈A

è connesso per archi.


Chiamiamo componente connessa per archi di uno spazio topologico X un
sottoinsieme non vuoto A di X che sia connesso per archi e non sia propriamente
contenuto in un altro sottoinsieme connesso per archi di X.
Se x è un punto di uno spazio topologico X, l’unione di tutti i sottoinsiemi di
X connessi per archi che contengono il punto x è ancora connessa per archi. Vi è
dunque un più grande, rispetto all’inclusione, sottoinsieme connesso per archi che
contiene il punto x. Esso si dice la componente connessa per archi di x in X.
Teorema 4.3 Le componenti connesse per archi di uno spazio topologico X
formano una partizione di X.
92 V. CONNESSIONE

Dim. Indichiamo con x̃ la componente connessa per archi di x ∈ X. Chiaramente


{x̃ | x ∈ X} è un ricoprimento di X. Inoltre, x̃ ⊂ ỹ per ogni y ∈ x̃ perché x̃ è
connesso per archi e contiene y. Ma allora anche x ∈ ỹ e quindi ỹ ⊂ x̃ e i due
insiemi coincidono.
Teorema 4.4 Un’applicazione continua f : X − → Y trasforma sottoinsiemi
connessi per archi in sottoinsiemi connessi per archi.

Dim. Basta infatti osservare che, se α : I − → X è un arco di estremi x0 , x1 ∈ X,


allora f ◦ α : I −
→ Y è un arco di estremi f (x0 ), f (x1 ) in Y .
Teorema 4.5 Un prodotto topologico non vuoto è connesso per archi se e soltanto
se ogni suo fattore è connesso per archi.

Dim. Sia X = (X, τ ) il prodotto topologico della famiglia di spazi topologici non
vuoti {Xi = (Xi , τi ) | i ∈ I}.
Se X è connesso per archi, ogni fattore Xi è connesso per archi perché immagine
di X mediante l’applicazione continua (proiezione) πi : X − → Xi .
Supponiamo ora che tutti gli spazi topologici Xi siano connessi per archi. Siano
x, x′ ∈ X. Per ogni indice i ∈ I sia αi : I − → Xi un arco con estremi xi = πi (x) e
x′i = πi (x′ ). Allora l’applicazione α : I −
→ X definita da πi ◦ α = αi per ogni i ∈ I
è un arco in X con estremi x e x′ .

§5 Spazi localmente connessi


Uno spazio topologico X = (X, τX ) si dice localmente connesso se per ogni
x ∈ X gli intorni aperti connessi di x in X formano un sistema fondamentale di
intorni.
Esso si dice localmente connesso per archi se per ogni x ∈ X gli intorni aperti
connessi per archi di x in X formano un sistema fondamentale di intorni.
Uno spazio topologico localmente connesso per archi è localmente connesso, ma
in generale non è vero il viceversa.
Osserviamo inoltre che uno spazio topologico connesso (risp. connesso per archi)
può non essere localmente connesso. Consideriamo ad esempio il sottoinsieme del
toro T2 = S1 × S1 , definito da
 
X = eit , eiπt t ∈ R .
Esso è connesso per archi perché immagine continua della retta reale R, ma non è
localmente connesso per la topologia di sottospazio di R4 .
Teorema 5.1 Se X è uno spazio topologico localmente connesso allora le sue
componenti connesse sono contemporaneamente aperte e chiuse.

Dim. Sappiamo già che le componenti connesse di X sono chiuse. Supponiamo


ora che X sia localmente connesso e sia A una componente connessa di X. Se
x ∈ A, allora x ha in X un intorno aperto connesso U . Poiché x ∈ A ∩ U 6= ∅, il
sottoinsieme A ∪ U è ancora connesso e quindi U ⊂ A perché A è una componente
connessa. Dunque A è aperto perché è intorno di ogni suo punto.
Teorema 5.2 Se X è localmente connesso per archi, allora le sue componenti
connesse per archi sono anche componenti connesse e dunque sono aperte e chiuse
in X.
V. CONNESSIONE 93

Dim. Sia A una componente connessa per archi di X. Se x ∈ A e U è un intorno


aperto di x connesso per archi, poiché A ∩ U 6= ∅, l’insieme A ∪ U è ancora connesso
per archi. Quindi U ⊂ A e A è aperto e chiuso perché contiene un intorno di ogni
suo punto aderente.
Osserviamo infine che un sottoinsieme connesso che sia aperto e chiuso in X è
necessariamente una componente connessa e quindi il teorema è dimostrato.
Un sottoinsieme A di uno spazio topologico X si dice localmente connesso (risp.
localmente connesso per archi) se è tale per la topologia di sottospazio.
Osservazione I sottoinsiemi aperti di uno spazio topologico localmente connesso
(risp. localmente connesso per archi) sono localmente connessi (risp. localmente
connessi per archi).
Da questa osservazione si ricava il
Teorema 5.3 Condizione necessaria e sufficiente affinché uno spazio topologico
X sia localmente connesso è che le componenti connesse dei suoi aperti siano aperte.
Condizione necessaria e sufficiente affinché uno spazio topologico X sia local-
mente connesso per archi è che le componenti connesse per archi dei suoi aperti
siano aperte.

§6 Continui topologici
Si dice continuo topologico uno spazio topologico compatto e connesso.
Un sottospazio connesso e compatto Y di uno spazio topologico X si dice un
continuo topologico di X.
Osservazione L’immagine di un continuo topologico mediante un’applicazione
continua è un continuo topologico.
Sia X = (X, τX ) uno spazio topologico e siano x, y due punti distinti di X.
Diciamo che un sottoinsieme A di X connette x e y se non è possibile sconnettere
A mediante due sottoinsiemi U e V , aperti nella topologia di sottospazio di A, tali
che x ∈ U e y ∈ V .
Osservazione Supponiamo che il sottoinsieme A dello spazio topologico X =
(X, τX ) connetta i due punti distinti a e b di X. Supponiamo che A sia sconnesso
e siano U e V due aperti di A che lo sconnettono, con a ∈ U . Allora b ∈ U e U
connette a e b.

Lemma 6.1 Siano a, b due punti distinti di uno spazio di Hausdorff compatto
X = (X, τX ). Se {Yi | i ∈ I} è una famiglia di chiusi di X, totalmente ordinata
mediante inclusione,
T tale che ciascuno degli Yi connetta a e b, allora anche la loro
intersezione Y = i∈I Yi connette a e b.

Dim. Osserviamo che Y è un compatto non vuoto di X. Supponiamo per assurdo


che Y non connetta a e b. Possiamo allora trovare due aperti U e V di X tali che

Y ⊂ U ∪ V, Y ∩ U ∩ V = ∅, a ∈ U, b ∈ V.

Possiamo supporre che U ∩ V = ∅. Infatti K ′ = Y \ V ⊂ U e K ′′ = Y \ U ⊂


V sono compatti disgiunti dello spazio di Hausdorff compatto X ed ammettono
94 V. CONNESSIONE

quindi intorni aperti disgiunti Ũ ⊂ U e Ṽ ⊂ V in X. Poiché K ′ ∪ K ′′ = Y ,


possiamo sostituire Ũ a U e Ṽ a V e quindi supporre che U e V soddisfino l’ulteriore
condizione
U ∩ V = ∅.
Per ogni indice i ∈ I definiamo

Ki = Yi \ (U ∪ V ) .

Gli insiemi Ki sono compatti e totalmente ordinati mediante inclusione. Inoltre


non sono vuoti perché Yi connette a e b per ogni indice i. Quindi K = ∩i∈I Ki è
un compatto non vuoto di X contenuto in Y e disgiunto da U ∪ V . Ciò è assurdo
perché avevamo supposto che Y ⊂ U ∪ V . Quindi Y connette a e b e il lemma è
dimostrato.

Teorema 6.2 Sia X uno spazio di Hausdorff compatto. Se X connette due suoi
punti distinti a e b, allora contiene un continuo K che contiene a e b.

Dim. Sia Γ la famiglia dei chiusi di X che connettono a e b. Poiché per ipotesi
X ∈ Γ, la famiglia Γ è non vuota. Per il principio della catena massimale13 possiamo
allora trovare una catena massimale di insiemi {Yi | i ∈ I} ⊂ Γ totalmente ordinata
mediante inclusione. Per il lemma precedente, Y = ∩i∈I Yi ∈ Γ.
Dico che Y è un continuo. Infatti Y è compatto. Se non fosse connesso,
potremmo trovare due aperti U e V nella topologia di sottospazio di Y tali che
U 6= ∅, V 6= ∅, Y = U ∪ V , con a ∈ U . Poiché Y connette a e b, anche b ∈ U e
U = Y \ V è un chiuso che connette a e b ed è propriamente contenuto in Y . Ciò
contraddice il fatto che la catena {Yi } fosse massimale. Quindi Y è un continuo e
il teorema è dimostrato.

§7 Caratterizzazione topologica del segmento e del cerchio


Sia X = (X, τX ) uno spazio topologico. Diciamo che un sottoinsieme Y ⊂ X
sconnette X se X \ Y è sconnesso. Diciamo che x ∈ X sconnette X se X \ {x} è
sconnesso.

Esempio 7.1 Sia A un aperto non denso di uno spazio topologico X. Allora la
frontiera bA di A sconnette X: infatti X \ bA è unione dei due aperti non vuoti e
disgiunti A e X \ A.
Lemma 7.1 Sia X = (X, τX ) un continuo di Hausdorff e supponiamo vi sia un
punto a ∈ X che lo sconnetta. Siano U , V due aperti non vuoti e disgiunti tali che
X \ {a} = U ∪ V . Allora U = U ∪ {a} e V = V ∪ {a} sono continui.

Dim. Osserviamo che, poiché X è di Hausdorff, X \ {a} è aperto. Quindi U e V


sono aperti in X e non possono essere contemporaneamente chiusi in X perché X
è connesso e U, V 6= ∅, X.
13 Il
principio della catena massimale, equivalente all’assioma della scelta, si enuncia nel modo
seguente: Se A è un insieme ordinato mediante una relazione d’ordine ”<” e B un sottoinsieme di
A su cui ”<” definisce un ordinamento totale, allora vi è un sottoinsieme B̃ di A, contenente B, su
cui ”<” è una relazione di ordine totale, che non è contenuto propriamente in nessun sottoinsieme
totalmente ordinato di A.
V. CONNESSIONE 95

Poiché U e V sono chiusi in X \ {a}, la loro chiusura in X sarà necessariamente


data da U = U ∪ {a} e V = V ∪ {a} rispettivamente.
Consideriamo la funzione f : X − → U ∪ {a} definita da

x se x ∈ U ∪ {a}
f (x) =
a se x ∈ V ∪ {a}.

Essa è surgettiva e continua perché {U , V } è un ricoprimento chiuso finito e dunque


fondamentale di X. Quindi U ∪ {a} è connesso perché immagine di un connesso
mediante un’applicazione continua e compatto perché sottoinsieme chiuso di un
compatto. È dunque un continuo. In modo analogo si verifica che V ∪ {a} è
anch’esso un continuo.

Teorema 7.2 Un continuo di Hausdorff che contenga almeno due punti contiene
almeno due punti che non lo sconnettono.

Dim. Sia X = (X, τX ) un continuo di Hausdorff. Sia N ⊂ X l’insieme dei punti


che non sconnettono X e supponiamo per assurdo che N abbia cardinalità minore
o uguale di 1. Fissiamo un punto x0 ∈ X \ N . Possiamo allora fissare una coppia
di aperti non vuoti e disgiunti U, V di X tali che

U ∪ V = X \ x0 , N ⊂ V.

Per ogni punto x ∈ U , fissiamo una coppia Ux , Vx di aperti non vuoti e disgiunti
tali che
Ux ∩ Vx = ∅, X \ {x} = Ux ∪ Vx , x0 ∈ Vx .
Osserviamo che, se x, y ∈ U e y ∈ Ux , allora

Uy = Uy ∪ {y} ⊂ Ux .

Infatti Vx ∪{x} è un continuo che non contiene y. Esso sarà dunque tutto contenuto
in uno dei due aperti disgiunti Uy , Vy . Poiché x0 ∈ Vx ∩ Vy 6= ∅, ne segue che

Vx ∪ {x} ⊂ Vy

e questa, per passaggio ai complementari, ci dà:

Uy ∪ {y} ⊂ Ux .

Sia Γ = {Ux | x ∈ U }. Per il principio della catena massimale, Γ contiene una


catena massimale C = {Uxj | j ∈ J} totalmente ordinata mediante inclusione.
Osserviamo che, se xi ∈ Uxj , allora Uxi ∪ {xi } ⊂ Uxj e i < j nella relazione
d’ordine indotta su J dall’inclusione propria. Per la massimalità della catena C,
per ogni j ∈ J vi è un indice i ∈ J con i < j e xi ∈ Uj . Se poniamo quindi

Kj = ∩ x ∈ U (Uxi ∪ {xi })
i xj
i∈J
otteniamo una famiglia di compatti non vuoti totalmente ordinati mediante inclu-
sione. Quindi
∅ 6= K = ∩j∈J Kj ⊂ ∩j∈J Uxj .
96 V. CONNESSIONE

Ma, se p ∈ K, allora Up ⊂ Up ∪ {p} ⊂ Uxj per ogni j ∈ J contraddice il fatto che


6=
la catena C sia massimale. Abbiamo quindi ottenuto una contraddizione. Ne segue
che N contiene almeno due punti distinti.
Lemma 7.3 Sia X = (X, τX ) un continuo di Hausdorff e sia x ∈ X un punto
che lo sconnette. Siano U e V due aperti non vuoti e disgiunti di X tali che
U ∪ V = X \ {x}. Allora ciascuno dei due aperti U e V contiene un punto che non
sconnette X.

Dim. Osserviamo che U ∪ {x} è un continuo di Hausdorff che contiene almeno due
punti. Esso contiene quindi almeno un punto y distinto da x che non lo sconnette.
Dico che y non sconnette X. Infatti, se cosı̀ non fosse, avremmo X \ {y} = A ∪ B
con A aperti non vuoti e disgiunti di X. I due aperti A e B hanno chiusura A ∪ {y}
e B ∪ {y} rispettivamente. In particolare, poiché y appartiene sia alla chiusura di
A che alla chiusura di B, l’intorno aperto U di y interseca sia A che B. Quindi il
punto y sconnetterebbe U ∪ {x}. Questo ci dà una contraddizione e dimostra che
y non sconnette X.
Lemma 7.4 Sia X = (X, τX ) un continuo di Hausdorff che contiene esattamente
due punti a, b che non lo sconnettono. Allora per ogni x ∈ X \ {a, b}, l’insieme
X \{x} è unione di due componenti connesse, l’una contenente a e l’altra contenente
b.

Dim. Sia x ∈ X \{a, b}. Allora X \{x} è unione di due aperti non vuoti e disgiunti
U e V e possiamo supporre che a ∈ U . Per il lemma precedente V contiene un punto
che non sconnette X. Poiché gli unici punti che non sconnettono X sono a e b e
a∈/ V , ne segue che b ∈ V .
Per completare la dimostrazione basta quindi verificare che U e V sono connessi.
Sia y ∈ U \ {a}. Sia X \ {y} = Uy ∪ Vy con Uy e Vy aperti non vuoti e disgiunti
e a ∈ Uy . Per le osservazioni precedenti Vy ∋ b. Poiché V ∪ {x} è un continuo che
contiene b e non contiene y, esso è tutto contenuto in uno dei due aperti Uy o Vy .
Essendo b ∈ V ∩ Vy 6= ∅, ne segue che
V ∪ {x} ⊂ Vy
da cui, passando ai complementari,
Uy ∪ {y} ⊂ U.
Quindi, se y ∈ U , l’aperto U contiene un continuo che contiene a e y. Ne segue che
U è connesso. Analogamente si dimostra che V è connesso.
Lemma 7.5 Sia X = (X, τX ) un continuo di Hausdorff che contiene esattamente
due punti a, b che non lo sconnettono. Per ogni x ∈ X indichiamo con [a, x[ la
componente connessa di X \ {x} che contiene a e con ]x, b] la componente connessa
di X \ {x} che contiene b. Definiamo la relazione
x≺y se x, y ∈ X e x ∈ [a, y[ oppure y = b.
Allora
(1) ”≺” è un ordinamento totale su X.
(2) Gli insiemi [a, x[ e ]x, b] al variare di x ∈ X \ {a, b} formano una prebase di
aperti per la topologia di X.
V. CONNESSIONE 97

Dim. Siano x, y ∈ X. Supponiamo che x 6= y e che x ∈ / [a, y[. Sarà allora x ∈]y, b]
e dunque la componente connessa [a, x[ di a in X \ {x} contiene [a, y[∪{y} perché
tale insieme è un continuo contenente a e contenuto in X \ {x}. Questo dimostra
che y ≺ x se x 6= y e x ⊀ y. Il fatto che la relazione ”≺” sia una relazione d’ordine
segue immediatamente perché

x ≺ y ⇔ [a, x[∪{x} ⊂ [a, y[.

Sia τ la topologia su X che ha come prebase degli aperti la famiglia Γ degli insiemi
della forma [a, x[ e ]x, b] con a ≺ x ≺ b. Siano x, y ∈ X con x ≺ y. Allora [a, x[∪{x}
e ]y, b] ∪ {y} sono due chiusi disgiunti di X. Poiché X è connesso, vi è un punto
z ∈ X che non appartiene a nessuno dei due insiemi. Allora x ≺ z ≺ y e [a, z[ e ]z, b]
sono elementi di Γ disgiunti che contengono rispettivamente x e y. La topologia τ
è quindi di Hausdorff. L’applicazione ι : X ∋ x − → x ∈ X è continua da X con la
topologia di Hausdorff τX per cui X è compatto su X con la topologia τ . Poiché ι è
bigettiva, essa è un omeomorfismo. Questo dimostra anche la seconda affermazione
del lemma.

Lemma 7.6 Sia ∆ = {m · 2−n | m, n ∈ N, 0 < m < 2n }. Se D è un insieme


numerabile, totalmente ordinato mediante una relazione d’ordine ”≺”, tale che

∀x ≺< y ∈ D ∃z ∈ D tale che x ≺ z ≺ y,

e tale che D non contenga nè un massimo nè un minimo. Allora possiamo trovare
un’applicazione bigettiva crescente

φ:∆−
→ D.

Dim. Poniamo ∆n = {m · 2−n | m ∈ N, 0 < m < 2n }. Sia D = {xn | n ∈ N}, con


xn 6= xm se n 6= m. Definiamo per ricorrenza φn : ∆n ∋ r −
→ φn (r) tale che

φn (r1 ) ≺ φn (r2 ) se r1 < r2 ∈ ∆n
(*)
φn |∆n−1 = φn−1 se n ≥ 2.

Per n = 1, l’insieme ∆1 contiene soltanto 1/2. Definiamo φ1 (1/2) = x0 . Suppo-


niamo di aver definito φh per h ≤ n ≥ 1 in modo tale che le (∗) siano soddisfatte.
Definiamo allora

 φn (r) se r ∈ ∆n

φn+1 (r) = xν se r = (2m + 1) · 2−(n+1) e


ν = min{m ∈ N | φn (m · 2−n ) ≺ xm ≺ φn ((m + 1) · 2−n )}.

Si verifica immediatamente che φ1 , ..., φn+1 verificano ancora le (∗). Possiamo allora
definire φ : ∆ −→ D ponendo φ|∆ = φn per ogni intero n ≥ 1. Poiché l’ordinamento
”≺” è totale, la φ è surgettiva ed è inoltre strettamente crescente per costruzione.
98 V. CONNESSIONE

Teorema 7.7 Sia X = (X, τX ) un continuo di Hausdorff metrizzabile. Se X


contiene soltanto due punti distinti a, b che non lo sconnettono, allora X è omeo-
morfo all’intervallo I.

Dim. Uno spazio compatto di Hausdorff metrizzabile è separabile. Sia D un


sottoinsieme denso e numerabile di X. Possiamo supporre che a, b ∈ / D. Sia ≺
la relazione d’ordine su X introdotta nel Lemma I.22.5. Sia φ : ∆ −→ D bigettiva e
crescente. Essa è continua per le topologie di ∆ come sottospazio di I e di D come
sottospazio di X. Definiamo f : X − → I ponendo

1 se x = b
f (x) =
inf{r ∈ ∆ | x ∈ [a, φ(r)[} se x ∈ X \ {b}.

La f dà l’omeomorfismo cercato. Infatti la f è bigettiva perché, se x ≺ y ∈ X,


allora possiamo trovare elementi z1 , z2 ∈ D tali che x ≺ z1 ≺ z2 ≺ y e quindi

f (x) ≤ φ−1 (z1 ) < φ−1 (z2 ) ≤ f (y).

la f −1 è continua perché gli aperti della forma [0, r[ e ]r, 1] con r ∈ ∆ formano una
prebase degli aperti di I e f ([0, r[) = [a, φ(r)[, f (]r, b]) =]φ(r), b] sono aperti di X.
Poiché X e I sono compatti di Hausdorff, la f è allora un omeomorfismo.

Teorema 7.8 Sia X = (X, τX ) un continuo metrico che contiene almeno due
punti, tale che, per ogni coppia di punti distinti x, y di X, il sottospazio X \ {x, y}
non sia connesso. Allora X è omeomorfo al cerchio S 1 = {z ∈ C | |z| = 1}.

Dim. Dividiamo la dimostrazione in diversi passi.


(α) Nessun punto di X lo sconnette.
Supponiamo per assurdo che vi sia un punto a ∈ X tale che X \{a} sia sconnesso.
Sia X \{a} = U ∪V con U e V aperti non vuoti e disgiunti. Allora U ∪{a} e V ∪{a}
sono entrambi continui e quindi contengono due punti a 6= x ∈ U e a 6= y ∈ V che
non li sconnettono. Allora

X \ {x, y} = ((U ∪ {a}) \ {x}) ∪ ((V ∪ {a}) \ {y})

sarebbe connesso perché unione di due connessi contenenti il punto a. Questo


dimostra l’asserzione (α).
(β) Fissiamo due punti distinti a, b ∈ X. Siano U e V due aperti non vuoti e
disgiunti tali che
X \ {a, b} = U ∪ V.
Allora U ∪ {a, b} e V ∪ {a, b} sono entrambi connessi.
Supponiamo per assurdo che U ∪ {a, b} non sia connesso. Sia

U ∪ {a, b} = W1 ∪ W2

con W1 e W2 aperti non vuoti e disgiunti del sottospazio U ∪ {a, b}. Possiamo
supporre che a ∈ W1 . Se W1 contenesse anche il punto b, allora W2 sarebbe aperto
e chiuso in X e questo non è possibile perché X è connesso. Quindi b ∈ W2 . Allora
W1 \ {a} e W2 ∪ V sono due chiusi disgiunti di X \ {a} la cui unione è X \ {a} e
V. CONNESSIONE 99

questo contraddice il punto (α). Notiamo in particolare che U ∪ {a, b} e V ∪ {a, b}


sono due continui.
(γ) Uno dei due insiemi U ∪ {a, b} e V ∪ {a, b} è omeomorfo all’intervallo I ⊂ R.
Se cosı̀ non fosse, ciascuno dei due insiemi conterrebbe un punto distinto da a e
b che non li sconnette. Siano x ∈ U e y ∈ V punti che non sconnettono U ∪ {a, b}
e V ∪ {a, b} rispettivamente. Allora

X \ {x, y} = ((U ∪ {a, b}) \ {x}) ∪ (V ∪ {a, b}) \ {y})

sarebbe connesso perché unione di due connessi che hanno in comune i punti a e b.
(δ) Ciascuno dei due insiemi U ∪ {a, b} e V ∪ {a, b} è omeomorfo a I.
Per il punto (γ) uno dei due insiemi, diciamo V ∪{a, b}, è omeomorfo all’intervallo
I. Se U ∪ {a, b} non fosse anch’esso omeomorfo a I, allora conterrebbe un punto
x distinto da a e da b che non lo sconnette. Scegliamo un qualsiasi punto y ∈
V . Allora, se A e B sono le componenti connesse di a e b rispettivamente in
(V ∪ {a, b}) \ {y}, avremmo

X \ {x, y} = ((U ∪ {a, b}) \ {x}) ∪ A ∪ B

connesso perché unione di connessi due a due non disgiunti. Quindi U ∪ {a, b} e
V ∪ {a, b} sono entrambi omeomorfi a I.
(ǫ) Sia φ1 : I −→ U ∪ {a, b} un omoemorfismo con φ(0) = a, φ1 (1) = b e sia
ψ2 : I −→ V ∪ {a, b} un omeomorfismo con ψ2 (0) = b, ψ2 (1) = a. Definiamo
f :I−→ X mediante

ψ1 (2t) se 0 ≤ t ≤ 1/2
f (t) =
ψ2 (2t − 1) se 1/2 ≤ t ≤ 1.

Otteniamo un’applicazione continua e chiusa che per passaggio al quoziente iniet-


tivo, tenuto conto dell’omeomorfismo I/({0, 1}) ≃ S 1 , dà l’omeomorfismo deside-
rato.

§8 Spazi di Peano
Uno spazio di Peano è un continuo topologico metrizzabile e localmente connesso.
In questo paragrafo dimostreremo il seguente
Teorema 8.1 Uno spazio metrizzabile connesso, compatto e localmente connesso
è connesso per archi.

Premettiamo alla dimostrazione di questo teorema alcune nozioni e risultati.


Sia X = (X, τX ) uno spazio topologico e siano x, y due punti di X. Una catena
semplice di aperti che congiunge x a y è una famiglia finita di aperti {A1 , ..., An }
con le proprietà:
(i) x ∈ A1 , y ∈ An
(ii) Ai ∩ Aj 6= ∅ ⇔ |i − j| = 1.

Teorema 8.2 Sia X = (X, τX ) uno spazio topologico connesso e sia Γ un rico-
primento aperto di X. Dati due punti x, y di X, è possibile trovare una catena
semplice di elementi di Γ che congiunge x a y.
100 V. CONNESSIONE

Dim. Sia x un punto di X e sia Y l’insieme di tutti i punti y di X che possono


essere congiunti a x mediante una catena semplice di aperti di Γ. Se {A1 , ..., An }
è una catena semplice di aperti di Γ che congiunge x a y, allora essa congiunge x
a tutti i punti di An e quindi An ⊂ Y . Perciò Y è un sottoinsieme aperto di X.
Per dimostrare che Y è anche chiuso, fissiamo un punto z ∈ Y . Esso è contenuto
in un aperto B ∈ Γ. L’aperto B contiene un elemento y ∈ Y . Sia {A1 , ..., An } una
catena semplice che congiunge x a y. Certamente An ∩ B 6= ∅ e vi sarà quindi un
minimo intero h con 1 ≤ h ≤ n tale che B ∩ Ah 6= ∅. Allora {A1 , ..., Ah , B} è una
catena semplice di aperti di Γ che congiunge x a y. Quindi Y è aperto e chiuso in
X e non vuoto perché contiene x. Dunque coincide con X perché X è connesso.

Siano A = {A1 , ..., An } e B = {B1 , ..., Bm } due catene semplici che congiungono
i punti x e y di uno spazio topologico X = (X, τX ). Diciamo che la catena A raffina
la catena B se è possibile trovare un’applicazione non decrescente

τ : {1, ..., n} −
→ {1, ..., m}

tale che Aj ⊂ Bτ (j) per ogni 1 ≤ j ≤ n.


Lemma 8.3 Sia X = (X, τX ) uno spazio di Hausdorff connesso e localmente
connesso. Sia B = {B1 , ..., Bm } una catena semplice di aperti connessi di X che
congiunge x 6= y ∈ X. Sia Γ una famiglia di aperti di X tale che ogni aperto Bj sia
unione di elementi di Γ. Vi è allora una catena semplice A = {A1 , ..., An } di aperti
di Γ che congiunge x a y ed è un raffinamento della catena B.

Dim. Ragioniamo per induzione sul numero m di aperti della catena semplice B.
Se m = 1, poiché B1 è connesso, la tesi segue dal teorema precedente. Supponiamo
ora m > 1 e la tesi vera per catene semplici di aperti connessi contenenti meno di
m elementi. Fissiamo un punto z ∈ Bm−1 ∩ Bm . Allora B ′ = {B1 , ..., Bm−1 } è una
catena semplice di aperti connessi che congiungono x a z e possiamo quindi trovare
una catena semplice {A1 , ..., Aℓ } di aperti di Γ che congiunge x a z e raffina B ′ .
Poiché Bm è un aperto connesso che contiene z e y, possiamo, per il teorema
precedente, trovare una catena semplice di aperti C = {C1 , ..., Ch } di Γ, tutti
contenuti in Bm che congiunge z a y. Sia r ≤ ℓ il più piccolo intero positivo
per cui Ar ∩ (∪hi=1 Ci ) 6= ∅. Sia poi s il più grande intero positivo con 1 ≤ s ≤ h tale
che Ar ∩ Cs 6= ∅. Allora A = {A1 , ..., Ar , Cs , Cs+1 , ..., Ch } è la catena di aperti di
Γ cercata.
Dimostrazione del Teorema .8.1.
Siano x e y due punti distinti di uno spazio di Peano X = (X, τX ). Fissiamo una
distanza d su X che definisca la topologia di X. Indichaimo con Γn la famiglia degli
aperti connessi di X che hanno rispetto alla distanza d diametro minore di 2−n .
Osserviamo che per ogni n la famiglia Γn è una base degli aperti di X. Costruiamo
per ricorrenza per ogni h ∈ N catene semplici Ah = {Ah1 , ..., Ahnh } di aperti di Γh
che congiungono x a y tali che Ah+1 sia un raffinamento di Ah per ogni h ≥ 1 e
nh+1
∪i=1 A(h+1)i ⊂ ∪ni=1
h
Ahi ∀h ≥ 1.

Per il Teorema .8.2, vi è una catena semplice A1 = {A11 , ..., A1n1 } di elementi di Γ1
che congiunge x a y. Supponiamo di aver costruito A1 , ..., Ah−1 con le proprietà
102 V. CONNESSIONE

richieste, per qualche h ≥ 2. Osserviamo che la famiglia Γ′h formata dagli aperti
U di Γh tali che U sia contenuto in uno degli aperti della catena Ah−1 soddisfa le
ipotesi del Lemma .8.1 e quindi possiamo trovare una catena semplice Ah di aperti
di Γ′h che congiunge x a y e raffina Ah .
Osserviamo ora che, posto Ah = ∪ni=1 h
Ahi , abbiamo

∩∞ ∞
h=1 Ah = ∩h=1 Ah = K

e quindi K è un continuo che contiene x e y. Sia z ∈ K \ {x, y}. Per ogni h ∈ N


siano jh e kh rispettivamente il più piccolo e il più grande intero positivo i con
1 ≤ i ≤ nh tali che z ∈ Ahi e poniamo

Uh = ∪i<jh Aji e Vh = ∪i>kh Aji .

Allora
U = ∪h Uh e V = ∪ h Vh
sono due aperti disgiunti di X che ricoprono K \ {z} e contengono il primo x e il
secondo y. Ne segue che il continuo K contiene soltanto i due punti x e y che non
lo sconnettono e pertanto è omeomorfo all’intervallo I.

Osservazione Uno spazio di Peano è localmente connesso per archi.


Con una dimostrazione simile a quella del teorema precedente, si può anche
dimostrare:
Teorema 8.4 Uno spazio metrico completo connesso e localmente connesso è
connesso per archi.

Dim. Si costruiscono le catene semplici di aperti Ah come nella dimostrazione


del teorema precedente. Osserviamo poi che l’iniseme K ottenuto intersecando
gli insiemi Ah = ∪Ah è un continuo. Esso è infatti compatto perché è chiuso di
X (in quanto intersezione di chiusi) e quindi è uno spazio metrico completo ed è
inoltre totalmente limitato (la catena Ah è un ricoprimento finito di K con aperti
di diametro minore di 2−h ). Esso è connesso. Se infatti vi fossero due sottoinsiemi
non vuoti F1 e F2 di K contemporaneamente aperti e chiusi in K con F1 ∪ F2 = K,
sarebbe d(F1 , F2 ) = δ > 0. Sia h un intero positivo tale che 21−h < δ. Allora vi è
almeno un elemento Ahih della catena Ah che non interseca nè F1 nè F2 e quindi
non interseca K. Per la costruzione delle catene Ah possiamo supporre che per ogni
h con 2h > 2/δ risulti
A(h+1)i(h+1) ⊂ Ahih
e otteniamo quindi una contraddizione perché, per la completezza di (X, d),

∅ 6= ∩2h >2/δ Ahih 6⊂ K.

Si dimostra poi che l’insieme K è omeomorfo all’intervallo I = [0, 1] con lo stesso


argomento usato nella dimostrazione del Teorema .8.1.
VI. PARACOMPATTEZZA 103

CAPITOLO VI

PARACOMPATTEZZA

§1 Paracompattezza e partizione dell’unità


Uno spazio topologico si dice paracompatto se è di Hausdorff e se in ogni suo
ricoprimento aperto se ne può inscrivere uno localmente finito.
Esempio 1.1 Ogni spazio di Hausdorff compatto è paracompatto.
Osservazione Un sottospazio chiuso di uno spazio paracompatto è paracom-
patto.
Lemma 1.1 Ogni spazio paracompatto è regolare.

Dim. Sia x un punto di uno spazio paracompatto X = (X, τX ) ed U un suo


intorno aperto in X. Poiché X è di Hausdorff, ogni punto y ∈
/ U ha un intorno
aperto Vy ∋ y in X con x ∈
/ V y . La famiglia

Γ = {U } ∪ {Vy | y ∈ X \ U }

è un ricoprimento aperto di X. Poiché X è paracompatto, la famiglia Γ ammette


un raffinamento ∆ localmente finito. Sia

∆′ = {A ∈ ∆ | A ⊂ Vy per qualche y ∈ X \ U }.
S
Allora W = ∆′ è un intorno aperto di X \ U . Poiché ∆ è localmente finito, la
chiusura dell’unione degli elementi di ∆ è l’unione delle chiusure dei suoi elementi :
[
W = A | A ∈ ∆′ .

Abbiamo perciò
x∈X \W ⊂X \W ⊂U
| {z } | {z }
aperto chiuso

e dunque X \ W è un intorno chiuso di x contenuto in U .


Abbiamo quindi dimostrato che ogni punto di X ammette un sistema fondamen-
tale di intorni chiusi e quindi X è regolare.

Lemma 1.2 Sia X = (X, τX ) uno spazio paracompatto e sia

Γ = {Aj | j ∈ J}
104 VI. PARACOMPATTEZZA

un ricoprimento aperto di X. Possiamo allora trovare un raffinamento aperto lo-


calmente finito di Γ della forma:
∆ = {Bj | j ∈ J}
tale che
B j ⊂ Aj ∀j ∈ J.

Dim. Per ogni x ∈ X scegliamo un indice ĵ(x) ∈ J tale che x ∈ Aĵ(x) . Poiché
X è uno spazio regolare, possiamo trovare per ogni x ∈ X un intorno aperto Ux di
x tale che
U x ⊂ Aĵ(x) ∀x ∈ X.
Il ricoprimento aperto {Ux | x ∈ X} ammette, poiché X è paracompatto, un
raffinamento aperto ∆′ localmente finito. Sia
∆′ ∋ W −
→ x(W ) ∈ X
una funzione di raffinamento, cioè una applicazione tale che
W ⊂ Ux(W ) ∀W ∈ ∆′ .
Poniamo allora, per ogni j ∈ J:
[
Bj = {W ∈ ∆′ | ĵ(x(W )) = j}
e definiamo
∆ = {Bj | j ∈ J}.
Allora ∆ è un ricoprimento localmente finito di X che gode della proprietà richiesta:
infatti [
Bj = {W | W ∈ ∆′ , ĵ(x(W )) = j}

perché ∆′ è localmente finito e quindi B j ⊂ Aj in quanto U x ⊂ Aj se ĵ(x) = j.

Teorema 1.3 Ogni spazio paracompatto è normale.

Dim. Sia X uno spazio paracompatto. Per dimostrare che è normale, mostriamo
che ogni chiuso di X ha un sistema fondamentale di intorni chiusi. Sia A un chiuso
di X e sia U un intorno aperto di A in X. Allora {U, X \ A} è un ricoprimento
aperto di X e per il lemma precedente possiamo trovare un ricoprimento aperto
{V, W } di X tale che V ⊂ U e W ⊂ X \ A. Poiché W è contenuto in X \ A, l’aperto
V contiene A. In particolare V è un intorno chiuso di A contenuto in U .
Ricordiamo che una partizione continua dell’unità subordinata a un ricoprimento
aperto Γ di uno spazio topologico X = (X, τX ) è il dato di una famiglia di funzioni
continue
{φA : X −→ [0, 1] | A ∈ Γ}
tali che
(i) suppφA = {x ∈ X | φA (x) 6= 0} ⊂ A;
{suppφA | A ∈ Γ} è una famiglia di chiusi localmente finita;
(ii) P
(iii) A∈Γ φA (x) = 1 ∀x ∈ X.
VI. PARACOMPATTEZZA 105

Teorema 1.4 Uno spazio topologico X = (X, τX ) è paracompatto se e soltanto se


è di Hausdorff e ad ogni suo ricoprimento aperto si può subordinare una partizione
continua dell’unità su X.

Dim. Supponiamo che X sia paracompatto. Sia Γ = {Aj | j ∈ J} un qualsiasi


ricoprimento aperto di X. Per il Lemma 1.2 possiamo allora trovare un raffinamento
localmente finito di Γ della forma ∆ = {Bj | j ∈ J} tale che B j ⊂ Aj per ogni
j ∈ J. Poiché X è uno spazio normale e ∆ è localmente finito, per il Teorema
III.4.2 possiamo trovare una partizione dell’unità {φj | j ∈ J} subordinata a ∆.
Essa è allora subordinata a Γ.
Dimostriamo ora il viceversa. Sia Γ un qualsiasi ricoprimento aperto di X. Se
{φA | A ∈ Γ} è una partizione continua dell’unità subordinata a Γ, allora

∆ = {{x ∈ X | φA (x) 6= 0} | A ∈ Γ}

è un raffinamento aperto localmente finito di Γ.

§2 Paracompattezza e connessione
Teorema 2.1 Sia X = (X, τX ) uno spazio di Hausdorff localmente compatto. Se
X è unione numerabile di compatti di X, allora X è paracompatto. Viceversa, se
X è connesso e paracompatto, allora è unione numerabile di compatti.

Dim. Supponiamo che X sia uno spazio di Hausdorff localmente compatto e che
vi sia una successione {Kn | n ∈ N} di compatti tali che

[
X = Kn .
n=0

In X ogni compatto ammette un sistema fondamentale di intorni compatti. In


particolare possiamo trovare un compatto A0 ⋐ X tale che

K0 ⊂ A0 6= ∅.

Per ricorrenza, possiamo costruire una successione {An | n ∈ N} di compatti di X


tale che, con A0 definito come sopra, risulti:
 
n
[ ◦
 Aj  ∪ Kn+1 ⊂ An+1 ∀n ∈ N.
j=0

Sia ora Γ un qualsiasi ricoprimento aperto di X. Per ogni n ∈ N possiamo trovare


una sottofamiglia finita Γn di Γ tale che
[
An ⊂ Γn .

Posto A−1 = ∅, definiamo:



∆n = {B ∩ (An+1 \ An−1 ) | B ∈ Γn }.
106 VI. PARACOMPATTEZZA

Sia

[
∆ = ∆n .
n=0

Osserviamo allora che


S
(a) ∆ è un ricoprimento aperto di X. Infatti ∆n ⊃ An \ An−1 per ogni n ∈ N
e quindi
[ ∞
[ ∞
[
∆⊃ (An \ An−1 ) = An = X.
n=0 n=0

(b) ∆ è inscritto in Γ.
(c) ∆ è localmente finito. Sia infatti x ∈ X. Sia n il più piccolo intero positivo

tale che x ∈ An . Allora An+1 è un intorno aperto di x in X che interseca al
Sn+2
più gli elementi di ∆ che sono in j=0 ∆j , e questi sono in numero finito.
Supponiamo ora che X sia di Hausdorff, localmente compatto, paracompatto e
connesso. Poiché X è uno spazio di Hausdorff localmente compatto, ammette un
ricoprimento aperto Γ̃ tale che, se A ∈ Γ̃, allora A sia compatto in X. Poiché
X è paracompatto, possiamo trovare un raffinamento Γ di Γ̃ localmente finito.
Chiaramente A è ancora compatto in X per ogni A ∈ Γ. Fissiamo un sottoinsieme
finito ∆0 di aperti non vuoti di Γ e poniamo
[
K0 = {A | A ∈ ∆0 }.

Questo insieme è compatto perché unione finita di compatti e non vuoto. Definiamo
per ricorrenza
 n Sn o
 ∆
 n+1 = A ∈ ∆ \ j=0 ∆ j | A ∩ K n 6
= ∅ , n≥0


 S
Kn+1 = ∆n+1 n ≥ 0.

Poiché gli insiemi di una famiglia localmente finita che hanno intersezione non vuota
con un compatto assegnato sono in numero finito, otteniamo per ricorrenza:

∆n è finito, Kn è compatto ∀n ∈ N.
Sn
Poniamo An = j=0 Kj . Allora


Kn ⊂ An ⊂ An+1 .
S∞
Poiché i ∆n sono due a due disgiunti, ∆ = n=0 ∆n è una sottofamiglia di una
famiglia localmente finita e dunque è localmente finita. Ne segue che la famiglia
∆ = {A | A ∈ ∆} è anch’essa localmente finita e dunque la famiglia {Kn | n ∈ N} è
localmente finita in quanto i suoi elementi sono unioni finite di elementi di ∆. Ne
segue che
[∞
Y = Kn
n=0
VI. PARACOMPATTEZZA 107

è chiuso in X. D’altra parte


∞ ∞
◦ [ ◦ [
Y ⊃ An ⊃ An = Y
n=0 n=0

e quindi Y è anche aperto in X. Essendo un sottoinsieme contemporaneamente


aperto e chiuso e non vuoto di uno spazio connesso, è X = Y .

§3 Paracompattezza degli spazi metrizzabili


Teorema 3.1 (Teorema di Stone) Ogni spazio metrizzabile è paracompatto.
Premettiamo alla dimostrazione di questo teorema due lemmi.
Lemma 3.2 Sia X = (X, τX ) uno spazio topologico di Hausdorff in cui ogni ri-
coprimento aperto ammetta un raffinamento chiuso localmente finito. Allora X è
paracompatto.

Dim. Sia Γ un ricoprimento aperto di X e sia Γ′ un suo raffinamento chiuso


localmente finito. Indichiamo con

α : Γ′ −
→Γ

la funzione di raffinamento:

F ⊂ α(F ) ∀F ∈ Γ′ .

Poiché Γ′ è localmente finito, possiamo trovare un ricoprimento aperto U di X tale


che ogni aperto U di U intersechi solo un numero finito di chiusi di Γ′ .
Per ipotesi, U ammette un raffinamento chiuso ∆ localmente finito. Indichiamo
con
β:∆− →U
la funzione di raffinamento (F ⊂ β(F ) ∀F ∈ ∆). Per ogni B ∈ Γ′ l’insieme
[
VB = {F ∈ ∆ | F ∩ B = ∅}

è chiuso perché unione di una famiglia localmente finita di chiusi. Quindi, per ogni
B ∈ Γ′ ,
LB = X \ VB
è un aperto di X. Poniamo, per ogni B ∈ Γ′ :

GB = α(B) ∩ LB .

Abbiamo allora:
B ⊂ GB ⊂ α(B) ∀B ∈ Γ′ .
Quindi
Γ̃ = {GB | B ∈ Γ′ }
108 VI. PARACOMPATTEZZA

è un ricoprimento aperto di X inscritto in modo naturale in Γ. Dico che Γ̃ è


localmente finito. Infatti, se x ∈ X, possiamo trovare un intorno aperto U di x in
X tale che
Φ = {F ∈ ∆ | F ∩ U 6= ∅}
sia finito. Allora anche l’insieme
n [  o
Ψ = B ∈ ∆|B ∩ Φ 6= ∅

è finito. Ma, se U ∩ GB 6= ∅, allora U ∩ LB 6= ∅, cioè U deve intersecare qualche F


con F ∩ B 6= ∅. Dunque, se U ∩ GB 6= ∅, allora B ∈ Ψ e U interseca solo un numero
finito di aperti di Γ̃.

Lemma 3.3 Uno spazio regolare in cui ogni ricoprimento aperto ammetta un
raffinamento localmente finito è paracompatto.

Dim. Sia X = (X, τX ) uno spazio regolare in cui ogni ricoprimento aperto
ammetta un raffinamento localmente finito. Sia Γ un ricoprimento aperto di X.
Poiché X è regolare, possiamo trovare un raffinamento aperto ∆ di Γ tale che,
detta
α:∆− →Γ
la funzione di raffinamento, sia

A ⊂ α(A) ∀A ∈ ∆.

Se ∆′ è un raffinamento localmente finito di ∆, con funzione di raffinamento β :


∆′ −
→ ∆, allora
Γ̃ = {B | B ∈ ∆′ }
è un raffinamento chiuso localmente finito di Γ, con

B ⊂ α(β(B)) ∀B ∈ ∆′ .

Per il lemma precedente, X è paracompatto.


Dimostrazione del Teorema di Stone.
Sia (X, d) uno spazio metrico. Sia Γ un qualsiasi ricoprimento aperto di X. Per
ogni A ∈ Γ ed ogni n ∈ N, poniamo

An = {x ∈ A | d(x, X \ A) ≥ 2−n }.

Gli insiemi An sono chiusi e



[
An = A.
n=0

Sia ”≺” un buon ordinamento dell’insieme Γ. Definiamo allora


[
BA,n = An \ Dn+1 ,
D∈Γ, D≺A
110 VI. PARACOMPATTEZZA
n o
−(n+3)
GA,n = x ∈ X | d(x, BA,n ) < 2 .

Gli insiemi GA,n sono aperti e

GA,n ⊂ A ∀A ∈ Γ, ∀n ∈ N.

Infatti, se x ∈ GA,n , allora possiamo trovare y ∈ BA,n tale che d(x, y) < 2−(n+3) .
In particolare y ∈ An e quindi d(y, X \ A) ≥ 2−n . Perciò

d(x, X \ A) ≥ d(y, X \ A) − d(x, y) > 2−n − 2−(n+3) > 0.

Inoltre
{GA,n | A ∈ Γ, n ∈ N}
è un ricoprimento aperto di X. Infatti, se x ∈ X e A0 è il minimo, rispetto a
”≺” degli aperti di Γ che contengono x, allora possiamo trovare un n ∈ N tale che
x ∈ A0 n e x ∈ BA,n perché x ∈/ A se A ∈ Γ e A ≺ A0 .
Dico che, per ogni intero non negativo n fissato, la famiglia

{GA,n | A ∈ Γ}

è localmente finita. Infatti, se x ∈ GA,n e y ∈ GD,n con A ≺ D ∈ Γ, allora


y∈ / GA,(n+1) , cioè d(y, X \ A) < 2−(n+1) . Quindi abbiamo

d(x, y) ≥ d(x, X \ A) − d(y, X \ A) > 2−n − 2−(n+1) = 2−(n+1) .

Ne segue che ogni palla aperta di raggio minore di 2−(n+2) interseca al più uno solo
dei GA,n . Poniamo  S
 Gn = {GA,n | A ∈ Γ}

W = S

n m≤n Gm


 W−1 = ∅

Ln = Wn \ Wn−1 se n ≥ 0.
Allora
Γ̃ = {Ln ∩ GA,n | A ∈ Γ, n ∈ N}
è un ricoprimento aperto localmente finito di X inscritto in Γ.
Infatti, se x ∈ X, posto n̄ = min{n ∈ | x ∈ Gn }, e scelto un intorno V di x che
intersechi solo un numero finito di aperti GA,m con A ∈ Γ e m ≤ n̄, l’aperto

V ∩ Gn̄

è un intorno aperto di x che interseca solo un numero finito di insiemi di Γ̃. Poiché
X, essendo metrizzabile è regolare, la tesi segue dal lemma precedente.
VII. SPAZI DI BAIRE 111

CAPITOLO VII

SPAZI DI BAIRE

§1 Definizione ed esempi di spazi di Baire


Un sottoinsieme A di uno spazio topologico X = (X, τX ) si dice raro o da nessuna

parte denso se la sua chiusura Ā non contiene punti interni, cioè se Ā = ∅.
Un sottoinsieme A di X si dice di prima categoria se è unione numerabile di
insiemi rari.
Un sottoinsieme di X che non sia di prima categoria si dice di seconda categoria.

Osservazione Un’unione numerabile di insiemi di prima categoria è di prima


categoria.
Defininizione Uno spazio topologico X si dice di Baire se l’intersezione di una
sua qualsiasi famiglia numerabile di aperti densi è ancora un sottoinsieme denso.
Lemma 1.1 Sia X = (X, τX ) uno spazio topologico. Sono equivalenti:
(1) X è uno spazio di Baire. S∞
(2) Se {Fn | n ∈ N} è una famiglia numerabile di chiusi e F = n=0 Fn è tale
◦ ◦
che F 6= ∅, allora esiste ν ∈ N tale che F ν 6= ∅.
(3) Ogni aperto non vuoto di X è di seconda categoria.
(4) Il complementare in ogni aperto non vuoto di X di un sottoinsieme di prima
categoria di X è di seconda categoria.

Dim. (1) ⇒ (2). Supponiamo che X sia uno spazio di Baire e sia {Fn } una
qualsiasi successione di chiusi ciascuno con parte interna vuota. Allora An = X \Fn
è per ogni n un aperto denso di X. Quindi

\ ∞
[
D= An = X \ Fn
n=0 n=0
S∞
è denso in X. Se U fosse un aperto non vuoto contenuto in n=0 Fn , sarebbe
D ∩ U = ∅, ma questo non è possibile perché D è denso in X.
(2) ⇒ (3). Supponiamo valga la (2) e sia A un qualsiasi aperto non vuoto di X.
Se A fosse di prima categoria, allora sarebbe unione numerabile di una successione
{Rn } di insiemi rari. Allora {Fn = Rn } sarebbe una famiglia di chiusi con parte
interna vuota la cui unione conterrebbe l’aperto A, contraddicendo la (2).
(3) ⇒ (4). È ovvia, perché l’unione di due insiemi di prima categoria è di prima
categoria.
112 VII. SPAZI DI BAIRE

(4) ⇒ (1). Supponiamo valgaT∞(4). Sia {An } una successione di aperti densi di
X. Per dimostrare che D = n=0 An è denso in X, fissiamo un qualsiasi aperto
U di X e consideriamo per ogni n ∈ N l’insieme Fn =S X \ An . Questo insieme

è un chiuso con parte interna vuota di X. Allora F = n=0 Fn è un sottoinsieme
di prima categoria in X e quindi U \ F è di seconda categoria e in particolare non
vuoto. Poiché U \ F = U ∩ D, otteniamo la tesi.
Da 3) segue subito che:
Osservazione Ogni sottospazio aperto di uno spazio di Baire è uno spazio di
Baire.
Teorema 1.2 Ogni spazio di Hausdorff localmente compatto è di Baire.
T∞ compatto. Sia {An } una
Sia X = (X, τX ) uno spazio di Hausdorff localmente
famiglia numerabile di aperti densi di X e sia D = n=0 An . Vogliamo dimostrare
che per ogni aperto non vuoto U di X interseca D. A questo scopo costruiamo
induttivamente una successione {Bn } di aperti non vuoti tali che

 B n è compatto ∀n ∈ N,

(*) B n ⊂ U ∀n ∈ N,


B n+1 ⊂ Bn ∩ An+1 ∀n ∈ N.

Poiché X è localmente compatto, U ∩ A0 contiene un aperto non vuoto B0 con


chiusura compatta contenuta in U ∩ A0 . Supponiamo di aver costruito B0 , ..., Bn
in modo che le (∗) siano soddisfatte. Basterà allora scegliere un aperto non vuoto
Bn+1 con chiusura compatta contenuta in Bn ∩ An+1 .
La famiglia {B n } è una famiglia di sottoinsiemi chiusi
T∞ del compatto B 0 che gode
della proprietà dell’intersezione finita. Quindi ∅ 6= n=0 B n ⊂ D ∩ U e la tesi è
dimostrata.

Teorema 1.3 Ogni spazio metrico completo è uno spazio di Baire.

Dim. Sia (X, d) uno spazio metrico completo e sia {An } una successione di aperti
densi di X. Fissiamo un aperto npon vuoto U di X. Costruiamo per ricorrenza
una successione {Bn } di palle aperte di X tali che

 B n ⊂ U ∀n ∈ N,

(*) Bn = B(xn , rn ) con xn ∈ X e 0 < rn < 2−n ∀n ∈ N


B n+1 ⊂ Bn ∀n ∈ N.

A questo scopo osserviamo che A0 ∩ U è un aperto non vuoto e quindi, fissati

x0 ∈ A0 ∩ U e 0 < r0 < min{1, d(x0 , X \ (A0 ∩ U ))}

e posto B0 = B(x0 , r0 ) abbiamo B 0 ⊂ A0 ∩ U. Supponiamo di aver costruito, per


n ≥ 0, le palle B0 ,..., Bn in modo che valgano le (∗). Fissato un punto xn+1 di
Bn ∩ An+2 ⊂ U , possiamo trovare 0 < rn+1 < 2−(n+1) tale che, posto Bn+1 =
B(xn+1 , rn+1 ) risulti B n+1 ⊂ An+2 ∩ Bn . La successione {xn } dei centri delle palle
Bn è chiaramente una successione di Cauchy. Il suo limite x∞ appartiene a B n per
ogni n ∈ N e quindi ad An ∩ U per ogni n. Dunque x∞ ∈ D ∩ U 6= ∅.
VII. SPAZI DI BAIRE 113

§2 Alcuni teoremi sulle funzioni reali continue e semicontinue


Teorema 2.1 (Baire) Sia X = (X, τX ) uno spazio topologico e sia {fn } una
successione di funzioni continue a valori reali definite su X. Supponiamo che per
ogni x ∈ X esista il limite della successione {fn (x)} ⊂ R. Allora l’insieme dei punti
x ∈ X in cui la funzione

→ lim fn (x) ∈ R
f :X∋x−
n−
→∞

non è continua è di prima categoria in X.

Dim. Per ogni intero positivo n ed ogni numero reale ǫ > 0 poniamo

Pn (ǫ) = {x ∈ X | |f (x) − fn (x)| ≤ ǫ}.

Poniamo

[ ◦
G(ǫ) = P n (ǫ).
n=0

Dimostriamo che

\
Y = G(2−n )
n=0

è il sottoinsieme dei punti di X in cui f è continua. Supponiamo infatti che f sia


continua in x0 ∈ X. Fissato ǫ > 0, possiamo trovare un indice ν ∈ N tale che

|fn (x0 ) − f (x0 )| ≤ ǫ/3 ∀n ≥ ν.

Poiché sia f che fν sono continue in x0 , esiste un intorno aperto U di x0 in X tale


che
|f (x) − f (x0 )| < ǫ/3 e |fν (x) − fν (x0 )| < ǫ/3 ∀x ∈ U.
Allora

|fν (x) − f (x)| ≤ |fν (x) − fν (x0 )| + |fν (x0 ) − f (x0 )| + |f (x0 ) − f (x)| < ǫ ∀x ∈ U.

Ciò dimostra che A ⊂ Pν (ǫ) e quindi x0 ∈ P n (ǫ) ⊂ G(ǫ). Poiché ǫ > 0 è arbitrario,
ne segue che x0 ∈ Y .

Sia viceversa x0 ∈ Y . Fissiamo ǫ > 0. Poiché x0 ∈ G(ǫ/3), avremo x0 ∈ P n (ǫ/3)
per qualche indice n ∈ N. Sia dunque U un intorno aperto di x0 in cui

|fn (x) − f (x)| ≤ ǫ/3.

Poiché fn è continua in x0 , possiamo trovare un intorno aperto U ′ di x0 contenuto


in U in cui risulti
|fn (x) − fn (x0 )| < ǫ/3.
Avremo allora:

|f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < ǫ ∀x ∈ U ′
114 VII. SPAZI DI BAIRE

e ciò dimostra la continuità di f in x0 .


Poniamo ora, per ogni intero non negativo n e ogni numero reale ǫ > 0:

Fn (ǫ) = {x ∈ X | |fn (x) − fm (x)| ≤ ǫ ∀m ≥ n}.

Per la continuità delle fn , questi insiemi sono chiusi. Inoltre, per la convergenza
puntuale della successione {fn }, abbiamo

[
X = Fn (ǫ).
n=0

Inoltre risulta
Fn (ǫ) ⊂ Pn (ǫ),
quindi
◦ ◦
F n (ǫ) ⊂ P n (ǫ),
e dunque

[ ◦
L(ǫ) = F n (ǫ) ⊂ G(ǫ).
n=0

Ma per il complementare di L(ǫ) abbiamo allora



[ ◦
X \ L(ǫ) = (Fn (ǫ) \ F n (ǫ))
n=0

unione numerabile di chiusi con parte interna vuota. Quindi X \ L(ǫ) è di prima
categoria e lo è quindi a maggior ragione X \ G(ǫ). Quindi l’insieme dei punti in
cui f è discontinua:

[
X \Y = (X \ G(2−n ))
n=0

è di prima categoria.

→ R una funzione
Teorema 2.2 Sia X = (X, τX ) uno spazio di Baire e sia f : X −
semicontinua inferiormente. Allora ogni aperto non vuoto U di X contiene un
aperto non vuoto V su cui f è limitata superiormente.

Dim. Ogni aperto U di X è uno spazio di Baire. Poniamo, per ogni intero non
negativo n:
Fn = {x ∈ U | fn (x) ≤ n}.
Tali insiemi sono chiusi in U perché f è semicontinua inferiormente e

[
Fn = U
n=0


perché la f è a valori reali. Possiamo quindi trovare ν ∈ N tale che V = F n 6= ∅.
VII. SPAZI DI BAIRE 115

Lemma 2.3 Sia (X, d) uno spazio metrico compatto e sia f : X − → R una
funzione semicontinua inferiormente. Possiamo allora trovare una successione non
decrescente {fn } di funzioni continue su X a valori reali tale che

f (x) = lim fn (x) = sup fn (x) ∀x ∈ X.


n−
→∞ n∈N

Dim. Sia a = minX f (x) ∈ R. Per ogni intero non negativo n siano xn1 , ..., xnℓn
punti di X tali che
ℓn
[
X = B(xnj , 2−(n+1) ).
j=1

Per ogni j = 1, ..., ℓn poniamo

µnj = min{f (x) | d(x, xnj ) ≤ 2−n }.

→ R tali che
Per il lemma di Urysohn possiamo trovare funzioni continue wnj : X −

 a ≤ wnj (x) ≤ µnj ∀x ∈ X

wjn (x) = µjn ∀x ∈ B(xnj , 2−(n+1) )


wjn (x) = a ∀x ∈ / B(xnj , 2−n ).

Poniamo
gn (x) = max{wn1 (x), ..., wnℓn (x)} ∀x ∈ X.
Allora
→ gn (x) ∈ R
gn : X ∋ x −
è continua per ogni n ∈ N e
gn ≤ f su X.
Poniamo
fn (x) = max{g0 (x), g1 (x), ..., gn (x)} ∀x ∈ X.
Allora
→ fn (x) ∈ R
fn : X ∋ x −
sono continue per ogni n ∈ N e

fn ≤ f su X.

La successione {fn } è una successione non decrescente di funzioni continue. Dico


che
f (x) = lim fn (x) = sup fn (x) ∀x ∈ X.
n−
→∞ n∈N

Infatti, per ogni x ∈ X ed ogni n ∈ N sia xnjn tale che x ∈ B(xnjn , 2−(n+1) ).
Possiamo allora trovare xn con d(xn , xnjn ) ≤ 2−(n+1) tale che µnjn = f (xn ) =
wnjn (xn ). Allora fn (xn ) = f (xn ) e fn (x) ≥ f (xn ) perché f (x) ≥ wnjn (x) = µnjn .
116 VII. SPAZI DI BAIRE

La successione {xn } converge a x e dunque abbiamo, poiché f è semicontinua


inferiormente,
sup fn (x) ≥ limn f (xn ) ≥ f (x).
n

Poiché d’altra parte supn fn (x) ≤ f (x), vale l’uguaglianza e il lemma è dimostrato.

Teorema 2.4 Sia X = (X, τX ) uno spazio metrizzabile localmente compatto. Se


f :X− → R è semicontinua inferiormente, allora l’insieme dei punti in cui la f non
è continua è di prima categoria.

Dim. La tesi segue dal lemma e dal teorema precedenti.

Teorema 2.5 Esiste una funzione continua f : R −


→ R che non è derivabile in
nessun punto di R.

→ R, che si annullano
Dim. Sia C0 (I) l’insieme di tutte le funzioni continue φ : I −
in 0 e 1, con la topologia indotta dalla distanza

d(φ, ψ) = sup |φ(x) − ψ(x)| ∀φ, ψ ∈ C0 (X).


I

Con questa distanza, C0 (X) è uno spazio metrico completo e quindi di Baire.
Per ogni intero positivo n sia
 
|g(x) − g(y)|
Fn = g ∈ C0 (I) ∃x ∈ I tale che ≤ n ∀y ∈ I \ {x} .
|x − y|

Dico che Fn è un chiuso. Sia infatti g ∈ C0 (I) una funzione continua a valori reali
definita su I tale che esista una successione {gν }ν∈N in Fn tale che d(gν , g) −
→0
per ν −→ ∞. Per ogni ν ∈ N indichiamo con xν ∈ I un punto per cui valga

|gν (y) − gν (xν )|


≤n ∀y ∈ I \ {xν }.
|y − xν |

Poiché I è compatto, passando a una sottosuccessione possiamo supporre che xν −→


x∞ ∈ I per ν − → ∞. Se y ∈ I \ {x∞ }, allora xν 6= y per ν sufficientemente grande
e otteniamo quindi

|g(y) − g(x∞ )| |gν (y) − gν (xν )|


= lim ≤ n.
|y − x∞ | ν−
→∞ |y − xν |

Dimostriamo ora che per ogni intero positivo n il chiuso Fn è raro.


Se cosı̀ non fosse, potremmo trovare, per un intero positivo n, una g ∈ Fn tale
che per qualche ǫ > 0 ogni h ∈ C(I) con d(h, g) < ǫ appartenga ad Fn .

Mostriamo in primo luogo che F n contiene una funzione lineare a tratti. Infatti

→ g(x) − g(y) ∈ R
I × I ∋ (x, y) −

è una funzione continua e quindi esiste un intorno aperto U di {(x, x) | x ∈ I} in


I × I tale che |g(x) − g(y)| < ǫ per ogni (x, y) ∈ U . La topologia prodotto in
VII. SPAZI DI BAIRE 117

I × I è definita dalla distanza euclidea di R2 e quindi, se 2δ > 0 è la distanza da


{(x, x) | x ∈ I} al complementare di U , avremo |g(x) − g(y)| < ǫ se |x − y| < δ.
Consideriamo una partizione

0 = x0 < x1 < .... < xN = 1

dell’intervallo I tale che

xj − xj−1 < δ per j = 1, ..., N.

Definiamo allora la funzione lineare a tratti:


x − xj
ψ(x) = g(xj ) + (g(xj+1 ) − g(xj )) se xj ≤ x ≤ xj+1 , j = 0, ..., N − 1.
xj+1 − xj

Abbiamo:
xj+1 − x x − xj
|g(x) − ψ(x)| ≤ |g(x) − g(xj )| + |g(x) − g(xj+1 )| < ǫ
xj+1 − xj xj+1 − xj
per xj ≤ x ≤ xj+1 , j = 0, ..., N − 1,

e quindi ψ ∈ F n .

Mostriamo ora che, se supponiamo che F n contenga una funzione lineare a tratti

ψ, otteniamo una contraddizione. Sia r > 0 tale che F n ⊃ B(ψ, r) e sia L > 0 tale
che
|ψ(x) − ψ(y)|
≤ L ∀x = 6 y ∈ I.
|x − y|
Consideriamo, per un intero positivo M > 0 fissato la funzione lineare a tratti

 rM (x − j/M ) ⇔ j/M ≤ x ≤ (2j + 1)/(2M )

φM (x) = rM ((j + 1)/M − x) ⇔ (2j + 1)/(2M ) ≤ x ≤ j + 1/M


j = 0, 1, ..., M − 1.

Abbiamo
|φM (x)| ≤ r/2 ∀x ∈ I
e inoltre per ogni x ∈ I abbiamo

|φM (y) − φM (x)|


sup = rM
y∈I |y − x|
y 6= x

Chiaramente hM = ψ + φM ∈ B(ψ, r), ma hM ∈


/ Fn se rM − L > n. Questo
dimostra che gli Fn sono rari. Quindi

[
Fn = F
n=1

è di prima categoria e dunque F 6= C0 (I) perché questo è uno spazio di Baire. Una
qualsiasi funzione k ∈ C0 (I) \ F non è derivabile in alcun punto di I. Si ottiene
118 VII. SPAZI DI BAIRE

una funzione f : R −
→ R non derivabile in nessun punto di R estendendo la k per
periodicità:
f (x) = k(x − q) ⇔ q ∈ Z e q ≤ x ≤ q + 1.

§3 Alcune applicazioni agli spazi normati


Sia V uno spazio vettoriale reale. Una norma su V è un’applicazione

→ kvk ∈ R
V ∋v−

che gode delle proprietà:


(i) k0k = 0 e kvk > 0 ⇐⇒ 0 6= v ∈ V ;
(ii) kλvk = |λ| kvk ∀λ ∈ R ∀v ∈ V ;
(iii) kv + wk ≤ kvk + kwk ∀v, w ∈ V.
Consideriamo sullo spazio normato V la struttura di spazio metrico definita dalla
distanza:
→ d(v, w) = kv − wk ∈ R .
V × V ∋ (v, w) −
Uno spazio normato che sia completo rispetto alla distanza definita dalla norma
si dice uno spazio di Banach.
Due norme k · k e ||| · ||| sullo stesso spazio vettoriale V si dicono equivalenti se vi
è una costante positiva c tale che

c−1 kvk ≤ |||v||| ≤ ckvk ∀v ∈ V.

Norme equivalenti definiscono distanze che inducono la stessa topologia sullo spazio
vettoriale V . Abbiamo
Teorema 3.1 Sia V uno spazio vettoriale reale. Due norme su V rispetto alle
quali V sia uno spazio di Banach sono equivalenti fra loro.

Dim. Siano k · k1 e k · k2 due norme sullo spazio vettoriale V rispetto alle quali
V sia uno spazio di Banach. Definiamo una nuova norma k · k su V ponendo

kvk = kvk1 + kvk2 ∀v ∈ V .

Osserviamo che V è uno spazio di Banach con la norma k · k.


Indichiamo con X lo spazio metrico completo che si ottiene considerando su V
la distanza relativa alla norma k · k1 . Poniamo, per ogni numero reale positivo r:

Fr = {v ∈ V | kvk ≤ r}.

Poiché

[
Fn = V,
n=1

per il teorema di Baire possiamo trovare un intero positivo ν tale che F ν contenga
punti interni di X (la chiusura si intende rispetto alla topologia associata alla norma
VII. SPAZI DI BAIRE 119

k · k1 . Poiché le omotetie e le traslazioni sono omeomorfismi di V, ne segue che F 1


contiene un intorno aperto dell’origine in X:

F 1 ⊃ {v ∈ V | kvk1 < ǫ}

per qualche ǫ > 0.


Avremo allora
F r ⊃ {v ∈ V | kvk1 < ǫr} ∀r > 0.
Fissiamo un qualsiasi vettore v ∈ V con kvk1 < 1.
Costruiamo per ricorrenza una successione {vn }n∈N tale che

 2−n
 kvn k ≤
 ∀n ≥ 0
ǫ

 Pn
kv − j=0 vj k1 < 2−(n+1)

∀n ≥ 0.

Poiché F 1/ǫ ⊃ {w ∈ V | kwk1 < 1}, possiamo trovare v0 ∈ F1/ǫ tale che

kv − v0 k1 < 1/2 .

Supponiamo di aver costruito v0 , v1 , ..., vn . Poiché


n
X
kv − vj k < 2−(n+1) e F 2−(n+1) /ǫ ⊃ {w ∈ V | kwk1 < 2−(n+1) } ,
j=0

possiamo trovare vn+1 ∈ F2−(n+1) /ǫ tale che

n+1
X
kv − vj k1 < 2−(n+2) .
j=0

Abbiamo allora

X
v = vj in X
j=0

e

X ∞
X
kvj k ≤ (1/ǫ) 2−j = 2/ǫ.
j=0 j=0
P∞
Da questa relazione ricaviamo che la serie j=0 vj converge a un elemento ṽ di V
nella metrica definita dalla norma k · k. Abbiamo inoltre

2
kṽk ≤ .
ǫ

Poiché
n
X n
X
kṽ − vj k1 ≤ kṽ − vj k ,
j=1 j=1
120 VII. SPAZI DI BAIRE

segue per l’unicità del limite in X che v = ṽ. Otteniamo quindi

2
kvk1 < 1 =⇒ kvk ≤ .
ǫ
Per l’omogeneità della norma abbiamo allora:

2
kvk ≤ kvk1 ∀v ∈ V ,
ǫ
da cui si ricava:
2
kvk2 ≤ kvk1 ∀v ∈ V .
ǫ
In modo analogo si dimostra che esiste una costante positiva c tale che

kvk1 ≤ c kvk2 ∀v ∈ V

e quindi le due norme sono equivalenti.

Teorema 3.2 Tutte le norme su uno spazio vettoriale reale di dimensione finita
sono equivalenti.

Dim. Sia V uno spazio vettoriale P reale di dimensione finita. Possiamo supporre
n
sia V = R . Indichiamo con |v| = ( j=1 vj2 )1/2 la norma euclidea. Sarà sufficiente
n

mostrare che una qualsiasi norma k · k su Rn è equivalente alla norma euclidea.


Se v = (v1 , ..., vn ) ∈ Rn , abbiamo
v 
u n
uX
kvk ≤ |v1 | ke1 k + ... + |vn | ken k ≤ t kej k2  · |v|.
j=1

Da questa disuguaglianza segue che

Rn ∋ v −
→ kvk ∈ R

è un’applicazione continua per le topologie euclidee usuali. Poiché

S n−1 = {v ∈ Rn | |v| = 1}

è un compatto di Rn , la funzione

S n−1 ∋ v −
→ kvk ∈ R

ammette su S n−1 un minimo positivo µ. Quindi, se v ∈ Rn e v 6= 0, abbiamo

k(v/|v|)k ≥ µ.

Da questa si ricava
|v| ≤ (1/µ)kvk ∀v ∈ Rn .
La dimostrazione è completa.
122 VII. SPAZI DI BAIRE

Corollario Sia V uno spazio vettoriale reale normato e sia f : Rn − → V


un’applicazione lineare iniettiva. Allora f è una immersione topologica. Ogni
sottospazio vettoriale di dimensione finita di uno spazio vettoriale reale normato è
chiuso.
Dim. Per dimostrare che un’applicazione lineare iniettiva f : Rn − → V è una
immersione topologica, basta osservare che, indicando con | · | la norma euclidea di
Rn e con k · k la norma su V , le norme

x−
→ kf (x)k e x−
→ |x|

sono equivalenti su Rn .
In particolare, se W è un sottospazio di dimensione finita di V , esso è uno spazio
metrico completo per la restrizione a W della distanza indotta dalla norma di V .
Chiaramente un sottospazio completo di uno spazio metrico è chiuso.

Teorema 3.3 Sia V uno spazio vettoriale reale normato, su cui consideriamo
la topologia definita dalla distanza indotta dalla norma. Condizione necessaria e
sufficiente affinché V sia localmente compatto è che V abbia dimensione finita.

Dim. Sia V uno spazio vettoriale reale con una norma k · k. Se V ha dimensione
finita, allora è localmente compatto per il teorema precedente.
Supponiamo ora che V sia localmente compatto e dimostriamo che ha dimensione
finita. Osserviamo innanzi tutto che tutte le palle chiuse {v ∈ V | kvk ≤ r, per r
reale positivo, sono compatte. In particolare, possiamo trovare vettori e1 , ..., en con
kej k ≤ 1 per j = 1, ..., n tali che
n
[
{v ∈ V | kvk ≤ 1} ⊂ {v ∈ V | kv − ej k < 1/2}.
j=1

Sia W il sottospazio vettoriale di V generato da e1 , ..., en .


Se W = V , allora V ha dimensione finita e la tesi è dimostrata. Supponiamo
sia W 6= V . Per il corollario del teorema precedente, W è un sottospazio completo
di V e quindi è chiuso. Fissiamo un punto w ∈ V \ W . Allora d(w, W ) = δ > 0.
Possiamo quindi trovare un vettore v ∈ W tale che

δ ≤ kv − wk ≤ (3/2)δ.

Allora k2(v − w)/(3δ)k ≤ 1 e possiamo trovare ej tale che

k2(v − w)/(3δ) − ej k < 1/2,

ma questa ci dà una contraddizione perché

z = v − (3δ/2) ej ∈ W

e
kw − zk < (3/4)δ < δ.
VIII. SPAZI DI FUNZIONI CONTINUE 123

CAPITOLO VIII

SPAZI DI FUNZIONI CONTINUE

§1 Il teorema di approssimazione di Stone-Weierstrass


Sia X = (X, τX ) uno spazio di Hausdorff compatto e sia C(X) l’insieme di tutte
le funzioni continue f : X − → R. Lo spazio C(X) è uno spazio vettoriale reale per
l’operazione di combinazione lineare di funzioni, un’algebra rispetto al prodotto di
funzioni, e un reticolo rispetto alle operazioni

C(X) × C(X) ∋ (f, g) −


→ f ∨ g ∈ C(X),

C(X) × C(X) ∋ (f, g) −


→ f ∧ g ∈ C(X);
ove
(f ∨ g)(x) = max{f (x), g(x)} ∀x ∈ X,
(f ∧ g)(x) = min{f (x), g(x)} ∀x ∈ X.
Siano f, g ∈ C(X). Diciamo che f ≤ g se f (x) ≤ g(x) per ogni x ∈ X. Indichiamo
con |f | la funzione
|f |(x) = |f (x)| ∀x ∈ X.
Rispetto alla norma

→ kf k = sup |f (x)| ∈ R
C(X) ∋ f −
x∈X

C(X) è uno spazio di Banach. Valgono le diseguaglianze:

(*) kf gk ≤ kf k · kgk ∀f, g ∈ C(X),

(**) |f (x)| ≤ |g(x)| ∀x ∈ X =⇒ kf k ≤ kgk .

Se c ∈ R, indicheremo ancora con c la funzione continua su X che vale c in ogni


punto di X.
Teorema 1.1 (Teorema di Stone-Weierstrass) Sia A una sottoalgebra di
C(X) che contenga le costanti e separi i punti 14 di X. Allora A è densa in C(X).

Dim. a. Se A è una sottoalgebra di C(X), anche la sua chiusura A è una sot-


toalgebra di C(X). Questa è una conseguenza immediata di (∗). Vogliamo quindi
dimostrare che, se A soddisfa le ipotesi del teorema, allora A = C(X).
14 Se cioè x 6= y ∈ X, possiamo trovare f ∈ A tale che f (x) 6= f (y).
124 VIII. SPAZI DI FUNZIONI CONTINUE

b. Se f ∈ A, allora anche

X fn
exp(f ) = ∈ A.
n=0
n!

Infatti il secondo membro è una serie di funzioni di A che converge uniformemente


su X.
In modo analogo si ottiene: se f ∈ A e f (x) > 0 per ogni x ∈ X, allora


1 X (kf k + 1 − f )n
= n+1
∈ A,
f n=0
(kf k + 1)

e se f ∈ A e f (x) ≥ 1 per ogni x ∈ X


X
log(f ) = − log(1/f ) = − (1/n)((f − 1)/f )n ∈ A.
n=1

c. Se f ∈ A, allora |f | ∈ A.
Infatti  
1 nf (x) −nf (x)
|f (x)| = lim log e +e
→∞ n
n−

e poiché
  
0 < (1/n) log enf + e−nf − |f | = (1/n) log en(f −|f |) + e−n(f +|f |) ≤ (1/n) log 2

il limite è uniforme su X.
d. Se f, g ∈ A, allora

f ∨ g = (1/2)(f + g + |f − g|) e f ∧ g = (1/2)(f + g − |f − g|) ∈ A.

e. Se x0 , x1 sono punti distinti di X e t0 , t1 numeri reali assegnati, allora possiamo


trovare f ∈ A tale che
f (x0 ) = t0 , f (x1 ) = t1 .
Fissata infatti g ∈ A che assuma in x0 e x1 valori distinti, poniamo:

t0 (g(x1 ) − g(x)) + t1 (g(x) − g(x0 ))


f (x) = per x ∈ X.
g(x1 ) − g(x0 )

f. Siano A e B chiusi disgiunti di X. Possiamo allora trovare una funzione di


Urysohn f della coppia (A, B) che appartenga ad A.
Per ogni coppia di punti (x, y) ∈ A × B sia fx,y ∈ A una funzione che valga −1
in x e 2 in y. Per ogni y ∈ B fissato, gli aperti

Uy (x) = {z ∈ X | fx,y (z) < 0}


VIII. SPAZI DI FUNZIONI CONTINUE 125

formano, al variare di x in A, un ricoprimento aperto di A. Poiché A è compatto,


possiamo trovare x1 , ..., xn tali che
N
[
A⊂ Uy (xj ).
j=1

Poniamo allora
φy = fx1 ,y ∧ .... ∧ fxN ,y .
Otteniamo in questo modo una famiglia {φy | y ∈ B} di funzioni continue in A con
le proprietà:
φy (x) < 0 ∀x ∈ A, φy (y) = 2 ∀y ∈ B.
Poniamo
Vy = {z ∈ X | φy (z) > 1}.
Al variare di y in B, questi insiemi formano un ricoprimento aperto di B. Possiamo
allora trovare y1 , ..., yM ∈ B tali che
M
[
B⊂ Vyj .
j=1

La funzione
ψ = (φy1 ∨ 0) ∨ ... ∨ (φyM ∨ 0)
appartiene ancora a A ed è uguale a 0 su A e > 1 su B. Allora

f = ψ∧1∈A

assume valori in [0, 1] e vale 0 su A e 1 su B.


g. Possiamo concludere la dimostrazione ripetendo l’argomento del teorema di
estensione di Urysohn.
Sia f ∈ C(X). Se f è costante su X, allora f ∈ A e non c’è nulla da dimostrare.
Altrimenti avremo
m = min f (x) < max f (x) = M.
x∈X x∈X

Consideriamo la funzione
 
2 M +m
g(x) = f (x) − .
M −m 2

Essa assume valori nell’intervallo [−1, 1] e chiaramente g ∈ A se e soltanto se f ∈ A.


Poniamo

A = {x ∈ X | g(x) ≤ −(1/3)}, B = {x ∈ X | g(x) ≥ 1/3}.

Per il punto (f) possiamo trovare una funzione g1 ∈ A a valori in [−(1/3), 1/3] che
valga −(1/3) su A e 1/3 su B. Allora:

kg1 k ≤ 1/3
kg − g1 k ≤ 2/3.
126 VIII. SPAZI DI FUNZIONI CONTINUE

Possiamo costruire per ricorrenza una successione {gn }n≥1 di funzioni di A tali che

kgn k ≤ 2n−1 /3n
kg − g1 − ... − gn k ≤ (2/3)n .

Infatti, supponiamo di aver costruito g1 , ..., gn per qualche n ≥ 1. Possiamo allora


trovare gn+1 ∈ A che assuma valori nell’intervallo [−(2n /3n+1 ), 2n /3n+1 ] e che valga
−(2n /3n+1 ) su An = {x ∈ X | g(x) − g1 (x) − ... − gn (x) ≤ −(2n /3n+1 )} e 2n /3n+1
su Bn = {x ∈ X | g(x) − g1 (x) − ... − gn (x) ≥ 2n /3n+1 }. Abbiamo quindi

X
g = fj
n=1

con convergenza uniforme su X e il teorema è dimostrato, in quanto le somme


parziali della serie a secondo membro sono funzioni di A.
Ricordiamo che un sottoinsieme I di un’algebra commutativa A su un campo K
si dice un ideale se è un sottospazio K-lineare di A e se

fg ∈ I ∀f ∈ A, ∀g ∈ I.

Osserviamo che ogni ideale di A è anche una sottoalgebra di A.


Teorema 1.2 Sia X = (X, τX ) uno spazio topologico compatto di Hausdorff e
sia I un ideale chiuso di C(X) che non coincida con C(X). Allora esiste un punto
x0 ∈ X tale che g(x0 ) = 0 per ogni g ∈ I.

Dim. Sia I un ideale di C(X). Dimostriamo che, se, per ogni punto x ∈ X vi è
una g ∈ I con g(x) 6= 0, allora I = C(X).
(i) I separa i punti di X.
Infatti, fissati x 6= y in X, possiamo trovare una funzione continua f ∈ C(X)
tale che f (x) = 1 e f (y) = 0. Se g ∈ I è una funzione con g(x) 6= 0, allora f g ∈ I
e f (x)g(x) 6= 0 = f (y)g(y).
(ii) I contiene le costanti.
Per ogni x ∈ X sia φx una funzione di I tale che φx (x) 6= 0. Al variare di x in
X, gli aperti
Ux = {y ∈ X | φx (y) 6= 0}
formano un ricoprimento aperto di X. Poiché X è compatto, possiamo trovare
x1 , ..., xN ∈ X tali che
N
[
X = U xj .
j=1

Allora
g = φ2x1 + ... + φ2xN ∈ I
ed è positiva in tutti i punti di X. Per il punto (b) della dimostrazione del teorema
precedente abbiamo 1/g ∈ I e quindi 1 = g · (1/g) ∈ I dimostra che I contiene le
costanti. Per il teorema di Stone-Weierstrass è allora I = C(X). La dimostrazione
è completa.
VIII. SPAZI DI FUNZIONI CONTINUE 127

Sia X = (X, τX ) uno spazio di Hausdorff compatto e indichiamo con C(X, C)


l’insieme di tutte le funzioni continue f : X −→ C. Osserviamo che C(X, C) è uno
spazio vettoriale complesso, che è uno spazio di Banach rispetto alla norma

C(X, C) ∋ f −
→ kf k = sup |f (x)| ∈ R.
x∈X

Esso è un’algebra su C per il prodotto di funzioni e possiede una involuzione indotta


dal coniugio sui numeri complessi:

→ f¯ ∈ C(X, C)
C(X, C) ∋ f −

ove
f¯(x) = f (x) ∀x ∈ X.
Dal teorema di Stone-Weierstrass per le funzioni continue a valori reali si ricava
immediatamente:
Teorema 1.3 Sia X = (X, τX ) uno spazio di Hausdorff compatto. Una sotto-
C-algebra A di C(X, C) che contenga le costanti, separi i punti di X e sia chiusa
rispetto al coniugio è densa in C(X, C).
Abbiamo in particolare i teoremi:
Teorema 1.4 (Weierstrass) Sia K un compatto di Rn . Allora ogni funzione
continua f su K a valori reali su K è limite, nella topologia della convergenza
uniforme su K, di una successione {pn } di polinomi di R[x1 , ..., xn ].
Ogni funzione continua f su K a valori complessi è limite uniforme su K di una
successione {pn } di polinomi di C[x1 , ..., xn ].

Teorema 1.5 (Weierstrass) Sia C# (Rn ) l’insieme di tutte le funzioni continue


su Rn periodiche di periodo 2π rispetto a tutte le variabili:

C# (Rn ) = {f ∈ C(X) | f (x + 2πq) = f (x) ∀q ∈ Zn .}

Allora l’algebra P dei polinomi trigonometrici:


 

 


 


 X 


P = (aα cos(hx, αi) + bα sin(hx, αi)) m ∈ N, aα , bα ∈ R
 
N n
 


 α ∈ 


 
|α| ≤ m

è densa in C# (Rn ) per la topologia della convergenza uniforme su Rn .


L’algebra complessa PC dei polinomi trigonometrici a coefficienti complessi è
densa, rispetto alla topologia della convergenza uniforme su Rn , nell’algebra
C# (Rn , C) delle funzioni continue su Rn , a valori complessi, periodiche di periodo
2π rispetto a ciascuna delle variabili.

Dim. Basta applicare il teorema di Stone-Weierstrass nel caso in cui X = T n =


Rn /Zn è il toro di dimensione n.
128 VIII. SPAZI DI FUNZIONI CONTINUE

§2 La topologia compatta–aperta
Siano X = (X, τX ) e Y = (Y, τY ) due spazi topologici. Indichiamo con C(X, Y )
l’insieme di tutte le applicazioni continue f : X − → Y . Se (A1 , ..., An ) è una n-upla
di sottoinsiemi di X e (Y1 , ..., Yn ) una n-upla di sottoinsiemi di Y , poniamo

C(X, A1 , ..., An ; Y, B1 , ..., Bn ) = {f ∈ C(X, Y ) | f (Aj ) ⊂ Bj ∀j = 1, ..., n.}

Sia Φ una famiglia assegnata di sottoinsiemi di X. Indichiamo con CΦ (X, Y )


l’insieme C(X, Y ) con la topologia che ha come prebase degli aperti gli insiemi

C(X, A; Y, B) al variare di A in Φ e di B in τY .

Se Φ è la famiglia K di tutti i compatti di X, la topologia di CK (X, Y ) si dice


la topologia compatta–aperta di C(X, Y ). Poiché questa è la topologia usata più di
frequente sullo spazio delle funzioni continue, scriveremo d’ora in poi semplicemente
C(X, Y ) per indicare lo spazio topologico CK (X, Y ).

Teorema 2.1 Se Y è uno spazio di Hausdorff, allora C(X, Y ) è di Hausdorff.

Dim. Se f, g ∈ C(X, Y ) e f 6= g, allora possiamo trovare un punto x ∈ X tale


che f (x) 6= g(x). Se U e V sono intorni aperti disgiunti di x e y rispettivamente
in Y , allora C(X, {x}; Y, U ) e C(X, {x}; Y, V } sono intorni aperti disgiunti di f e g
rispettivamente in C(X, Y ).
Teorema 2.2 Se X è compatto e Y metrizzabile, allora C(X, Y ) è metrizzabile.
Se d è una distanza che induce la topologia di Y, allora

d (f, g) = sup d(f (x), g(x)) per f, g ∈ C(X, Y )


x∈X

è una distanza su C(X, Y ) che induce la topologia di C(X, Y ).

Dim. Sia K un compatto di X e B un aperto di Y. Sia f ∈ C(X, K; Y, B).


L’insieme f (K) è un compatto di Y contenuto in B. Fissata una distanza d su Y
che induce la topologia di Y, abbiamo

ǫ = d(f (K), Y \ B) > 0.

Allora la palla aperta

B(f, ǫ) = {g ∈ C(X, Y ) | d (f, g) < ǫ}

è contenuta in C(X, K; Y, B). Questo dimostra che la topologia indotta su C(X, Y )


dalla metrica d è più fine della topologia di C(X, Y ).
Viceversa, fissata f ∈ C(X, Y ) ed r > 0, osserviamo che f (X) è un sottoinsieme
compatto di Y. Possiamo allora ricoprirlo con un numero finito di palle aperte Bj ,
j = 1, ..., N di raggio minore di r/2. Per ogni indice j sia Cj una palla aperta di
raggio minore di r/2 contenente la chiusura di Bj . Allora

C(X, f −1 (B1 ), ..., f −1 (BN ); Y, C1 , ..., CN )


VIII. SPAZI DI FUNZIONI CONTINUE 129

è un intorno aperto di f in C(X, Y ) contenuto in Bd (f, r) = {g ∈ C(X, Y ) | d (f, g) <


r}. Quindi la topologia di C(X, Y ) è più fine della topologia indotta dalla distanza
d e quindi le due topologie coincidono.
Teorema 2.3 Siano X = (X, τX ) uno spazio topologico e {Yj = (Yj , τj )} una
famiglia di spazi topologici non vuoti. Allora l’applicazione naturale
Y Y
C(X, Yj ) −
→ C(X, Yj )
j∈J j∈J

è un omeomorfismo.

Teorema 2.4 Siano X, Y, Z tre spazi topologici. Data una applicazione continua

φ:X−
→Z

l’applicazione
φ∗ : C(Z, Y ) ∋ f −
→ f ◦ φ ∈ C(X, Y )
è continua per le topologie compatte-aperte.
Se X è uno spazio di Hausdorff compatto, Z di Hausdorff, e φ surgettiva, allora

φ è una immersione topologica.

Dim. La φ∗ è continua perché φ(K) è compatto in Z per ogni compatto K di X.


Supponiamo ora che X sia uno spazio di Hausdorff compatto, che Z sia uno
φ∗ (C(Z,X))
spazio di Hausdorff e che φ sia surgettiva. Dimostriamo che φ∗ |C(Z,X) è aperta.
Sia K un compatto di Z e U un aperto di Y . Allora

φ∗ (C(Z, K; Y, U )) = {f ◦ φ | f ∈ C(Z, Y ), f (K) ⊂ U }


= φ∗ (C(Z, Y )) ∩ {g ∈ C(X, Y ) | g(φ−1 (K)) ⊂ U }.

Questo è un aperto di φ∗ (C(Z, Y )) perché φ−1 (K) è un compatto di X.


Teorema 2.5 a. Siano X, Y, Z tre spazi topologici. Se

φ:X ×Y −
→Z

è continua per la topologia prodotto su X × Y , allora la

X∋x−
→ φ̌(x) ∈ C(Y, Z)

definita da
φ̌(x)(y) = φ(x, y) ∀x ∈ X, ∀y ∈ Y
è continua per la topologia compatta-aperta su C(Y, Z).
b. Supponiamo inoltre che Y sia localmente compatto e di Hausdorff. Se

ψ:X−
→ C(Y, Z)

è una applicazione continua per la topologia compatta-aperta di C(X, Y ), allora la

ψ̂ : X × Y −
→Z
130 VIII. SPAZI DI FUNZIONI CONTINUE

definita da
ψ̂(x, y) = ψ(x)(y) ∀x ∈ X, ∀y ∈ Y
è continua.

Dim. a. Siano K un compatto di Y e U un aperto di Z. Allora

A = φ̌−1 (C(Y, K; Z, U )) = {x ∈ X | φ(x, y) ∈ U ∀y ∈ K}.

Sia x0 ∈ A. Per ogni y ∈ K possiamo trovare un intorno aperto Wy di x0 e un


intorno aperto Vy di y tali che

φ(Wy × Vy ) ⊂ U.

Poiché K è compatto, possiamo trovare y1 , ..., yn ∈ K tali che


n
[
K⊂ Vyj .
j=1
Tn
Se W = j=1 Wyj , allora x0 ∈ W ⊂ A e quindi A contiene un intorno aperto di
ogni suo punto e quindi è aperto. Ciò dimostra che φ̌ è continua.
b. Sia (x0 , y0 ) ∈ X × Y e sia U un intorno aperto di (ψ̂(x0 , y0 ) in Z. Scegliamo
un intorno compatto V di y0 in Y tale che V ⊂ ψ(x0 )−1 (U ). Allora

W = ψ −1 (C(Y, V ; Z, U ))

è aperto in X e ψ̂(W × V ) ⊂ U.
Teorema 2.6 Siano X, Y, Z tre spazi topologici. Con le notazioni del teorema
precedente:
α : C(X × Y, Z) ∋ φ −
→ φ̌ ∈ C(X, C(Y, Z))
è continua. Se Y è localmente compatto di Hausdorff, allora α è un omeomorfismo.

Dim. Siano K un compatto di X, F un compatto di Y e U un aperto di Z. Per


il punto (a) del teorema precedente:

α−1 (C(X, K; C(Y, Z), C(Y, F ; Z, U )) = C(X × Y, K × F ; Z, U ).

Questa uguaglianza dimostra che α è continua. Dimostriamo ora che anche α−1 è
continua, sotto le ulteriori ipotesi che X, Y siano di Hausdorff e Y sia localmente
compatto.
Sia Q un compatto di X × Y e sia U un aperto di Z. Sia f : X × Y − → Z
una applicazione continua tale che f (Q) ⊂ U . Per ogni punto (x, y) ∈ Q possiamo
trovare un intorno compatto Ax,y di x in πX (Q) e un intorno compatto Bx,y di y
in πY (Q) tali che
f (Ax,y × Bx,y ) ⊂ U.
Poiché Q è compatto, possiamo trovare (x1 , y1 ), ..., (xn , yn ) ∈ Q tali che
n
[
Q⊂ (Axj ,yj × Bxj ,yj ).
j=1
132 VIII. SPAZI DI FUNZIONI CONTINUE

Allora
n
\
C(X × Y, Axj ,yj × Bxj ,yj ; Z, U )
j=1

è un intorno aperto di f in C(X × Y, Z) contenuto in C(X × Y, Q; Z, U ) e quindi


n
\
C(X, Axj ,yj ; C(Y, Z), C(Y, Byj ,xj )) ⊂ α(C(X × Y, Q; Z, U ))
j=1

è un intorno aperto di α(f ) in C(X, C(Y, Z)). Questo dimostra che α è aperta e
quindi è un omeomorfismo.

§3 Il teorema di approssimazione nel caso non compatto


Osserviamo che la topologia di C(X, R) è la topologia della convergenza uniforme
sui compatti di X. L’insieme C(X, R) è un’algebra reale e un reticolo con le
operazioni definite nel paragrafo precedente.
Abbiamo
Teorema 3.1 Sia X uno spazio paracompatto, localmente compatto e connesso.
Allora ogni sottoalgebra di C(X, R) che contenga le costanti e separi i punti di X è
densa in C(X, R).
Ogni sottoalgebra complessa di C(X, C) che contenga le costanti, separi i punti
di X e sia chiusa rispetto alla coniugazione, è densa in C(X, C).

Dim. Infatti X è unione numerabile di una successione di compatti {Kn } con



Kn ⊂ K n+1 per ogni n ∈ N. Supponiamo che A sia una sottoalgebra di C(X, R)
che contenga le costanti e separi i punti di X. Allora A|Kn = {g|Kn | g ∈ A} è
una sottoalgebra di C(Kn , R) che contiene le costanti e separa i punti di Kn . Per
il Teorema di Stone-Weierstrass, se f ∈ C(X, R), per ogni n possiamo trovare una
funzione fn ∈ A tale che

sup |f (x) − fn (x)| < 2−n .


x∈Kn

Allora {fn } è una successione di funzioni di A che converge a f in C(X, R).


Si ragiona in modo analogo nel caso di sottoalgebre complesse di C(X, C).
IX. GRUPPI TOPOLOGICI 133

CAPITOLO IX

GRUPPI TOPOLOGICI

§1 Definizioni principali
Sia G un gruppo. Fissato un elemento a ∈ G, indichiamo con La , Ra , ad(a) le
applicazioni bigettive di G in sè:

La : G ∋ g −
→ ag ∈ G traslazione a sinistra;
(1.1) Ra : G ∋ g −
→ ga ∈ G traslazione a destra;
→ aga−1 ∈ G
ad(a): G ∋ g − aggiunta .

Osserviamo che

(1.2) ad(a) = La ◦ Ra−1 = Ra−1 ◦ La .

Per ogni coppia di elementi a, b ∈ G valgono le relazioni:

La ◦ Lb = Lab
Ra ◦ Rb = Rba
(1.3)
La ◦ Rb = Rb ◦ La
ad(a) ◦ ad(b)= ad(ab)

Lemma 1.1 Sia G un gruppo. Le applicazioni L : G ∋ a − → La ∈ S(G) ed


R− : G ∋ a − → Ra−1 ∈ S(G) sono rappresentazioni fedeli di G nel gruppo S(G)
delle permutazioni degli elementi di G.
L’applicazione ad : G ∋ a −→ ad(a) ∈ Aut(G) è una rappresentazione di G nel
gruppo dei suoi automorfismi.

La rappresentazione ad : G − → Aut(G) si dice la rappresentazione aggiunta di


G. Il suo nucleo è il centro di G:

ker ad = CG (G) = {a ∈ G | ag = ga ∀g ∈ G } .

Esso è un sottogruppo abeliano normale di G.


Se A, B sono sottoinsiemi di un gruppo G, useremo nel seguito le notazioni:

A−1 = {g −1 | g ∈ A} e AB = {g1 g2 | g1 ∈ A , g2 ∈ B } .

Sia G un gruppo. Una topologia τ su G si dice compatibile con la struttura di


gruppo se l’applicazione

(1.4) → g −1 h ∈ G
G × G ∋ (g, h) −
134 IX. GRUPPI TOPOLOGICI

è continua (per la topologia prodotto su G × G).


Ciò equivale al fatto che siano continue le due applicazioni:

G × G ∋ (g, h) −
→ gh ∈ G e → g −1 ∈ G .
G∋g−

Un gruppo G su cui si sia fissata una topologia τ compatibile con la struttura di


gruppo si dice un gruppo topologico.
Lemma 1.2 Sia G un gruppo topologico. Allora per ogni a ∈ G le applicazioni
La , Ra ed ad(a) sono omeomorfismi di G in sè. Il centro CG (G) è un sottospazio
chiuso di G. Ogni sottogruppo H di G è un gruppo topologico con la topologia di
sottospazio di G.

Osservazione La topologia discreta e la topologia indiscreta su un gruppo G


sono entrambe compatibili con la struttura di gruppo. Quindi ogni gruppo si può
considerare (in modo banale) come un gruppo topologico.

§2 Proprietà generali
Teorema 2.1 Sia G un gruppo topologico. La componente connessa dell’identità
Ge è un sottogruppo chiuso normale di G. La componente connessa per archi
dell’identità è anch’essa un sottogruppo normale di G.

Dim. L’immagine in G di Ge × Ge mediante l’applicazione (g, h) − → g −1 h è


un connesso di G che contiene e ed è quindi contenuta in Ge . Quindi Ge è un
sottogruppo di G. Inoltre per ogni a ∈ G, ad(a)(Ge ) è un connesso che contiene e
ed è quindi contenuto in Ge . Dunque Ge è un sottogruppo normale di G.
Si ragiona in modo analogo per la componente connessa per archi di e in G.

Teorema 2.2 Sia H un sottogruppo del gruppo topologico G. Se H è aperto,


allora è anche chiuso in G.
S
Dim. Infatti, se H è aperto, anche il suo complementare G \ H = g∈H / gH è
aperto in G.

Dato un sottogruppo H di un gruppo G, indichiamo con G H l’insieme delle
 G H = {gH | g ∈ G }. Se G è un gruppo
classi laterali sinistre di H in G:
topologico, considereremo su G H la topologia quoziente.
Teorema 2.3 Sia G un gruppo topologico e sia H un suo sottogruppo. La
proiezione nel quoziente

(2.1) π:G−→G H

è un’applicazione aperta.
S
Dim. Se A è un aperto di G, allora il saturato π −1 (π(A)) = h∈H Ah è aperto
perché unione di aperti.

Teorema 2.4 Sia G un gruppo topologico e H un suo sottogruppo. Allora la


chiusura H è ancora un sottogruppo di G. Se H è normale, anche H è normale.
IX. GRUPPI TOPOLOGICI 135

−1
Dim. L’applicazione r : G ∋ g − → g ∈ G è un omeomorfismo. Quindi, se H è
un sottogruppo di G, risulta r H = r(H) = H. Analogamente avremo Lg (H) =
Rg (H) = H per ogni g ∈ H. Queste relazioni ci danno ancora Lg (H) ∪ Rg (H) ⊂ H
per ogni g ∈ H e quindi Lg (H) ∪ Rg (H) ⊂ H per ogni g ∈ H. Ciò dimostra che H
è un sottogruppo di G.
Poiché ad(a) è per ogni a ∈ G un omeomorfismo di G, abbiamo ad(a)(H) =
ad(a)(H) per ogni a ∈ G, e quindi H è normale se lo è H.
Teorema
 2.5 Sia G un gruppo topologico e H un suo sottogruppo. Il quoziente
G H è uno spazio regolare se e solo se H è chiuso. In particolare G è uno spazio
regolare se e solo se {e} è un chiuso, cioè se e solo se è uno spazio T1 .

Dim. La condizione è chiaramente necessaria.


Supponiamo ora che H sia un chiuso. Allora sono chiuse tutte le sue classi
laterali sinistre e quindi G H è uno spazio T1 .
Sia F un chiuso di G H e g un elemento di G tale che π(g) ∈ / F , cioè gH ∩
−1
π (F ) = ∅. 
Vogliamo dimostrare che π(g) ed F ammettono in G H intorni disgiunti. Ciò
equivale al fatto che g e π −1 (F ) abbiano in G intorni saturi disgiunti.
Indichiamo con λ l’applicazione continua (g, h) − → g −1 h. Poiché π −1 (F ) è un
chiuso che non contiene λ(e, g), possiamo trovare intorni aperti Ue di e e Ug di g
tali che Ue−1 Ug ∩ π −1 (F ) = ∅. Poniamo:
[ [
Ũg = π −1 (π(Ug )) e Ṽ = Ue a = a π −1 (F ) .
a∈π −1 (F ) a∈Ue

Poiché la proiezione π è un’applicazione aperta, Ũg è un aperto saturo che contiene


g, Ṽ un’aperto saturo che contiene π −1 (F ). Per completare la dimostrazione basterà
allora verificare che Ũg ∩ Ṽ = ∅. Se cosı̀ non fosse, potremmo trovare g1 ∈ Ug ,
g2 ∈ H, g3 ∈ Ue , g4 ∈ π −1 (F ) tali che g1 g2 = g3 g4 . Da questa relazione ricaviamo
g3−1g1 = g4 g2−1 ∈ π −1 (F ), contraddicendo la scelta di Ug ed Ue . Ciò dimostra che
G H soddisfa anche l’assioma T3 e quindi è regolare.
Un gruppo topologico G in cui {e} sia chiuso si dice separato; per il teorema
precedente un gruppo topologico separato è uno spazio regolare.
Sia G un gruppo topologico. Poiché {e} è un sottogruppo normale, il quoziente
G è un gruppo topologico separato, che si indica con Gsep e si dice il separato
{e}
di G.
Teorema 2.6 Siano G1 e G2 due gruppi topologici e sia φ : G1 − → G2 un
omomorfismo di gruppi. Condizione necessaria e sufficiente affinché φ sia continua
è che sia continua nell’origine.

Dim. La condizione è ovviamente necessaria. Dimostriamo la sufficienza. Sia


g ∈ G1 e sia V un intorno aperto di φ(g). Allora φ(g −1 ) · V è un intorno aperto di
eG2 . Sia U un intorno aperto di eG1 in G1 tale che φ(U ) ⊂ φ(g −1 ) · V . Allora gU
è un intorno aperto di g in G1 e φ(gU ) = φ(g)φ(U ) ⊂ φ(g)φ(g −1 )V = V . Quindi
φ è continua in ogni punto g di G e quindi è continua in G.
136 IX. GRUPPI TOPOLOGICI

Siano G1 , G2 due gruppi topologici. Chiamiamo omomorfismo di gruppi topolo-


gici un omomorfismo di gruppi φ : G1 −→ G2 che sia al tempo stesso un’applicazione
continua. Se φ : G1 −
→ G2 è un omeomorfismo e un isomorfismo di gruppi, diremo
che è un isomorfismo topologico.
Sia G un gruppo topologico. Indichiamo con Autc (G) l’insieme degli isomorfismi
topologici del gruppo topologico G in sé. Esso è un gruppo per l’operazione di
composizione di applicazioni.
Teorema 2.7 Siano G1 , G2 due gruppi topologici e sia φ : G1 − → G2 un
epimorfismo topologico. Allora
. φ è un’applicazione aperta se e soltanto se il suo
quoziente iniettivo φ̂ : G1 ker φ −
→ G2 è un isomorfismo topologico.
.
Dim. Ciò è conseguenza del fatto che la proiezione G1 −
→ G1 ker φ è un’applica -
zione aperta.
Teorema 2.8 Se G1 è un gruppo topologico compatto e G2 un gruppo topologico
di Hausdorff, allora ogni epimorfismo topologico φ : G1 −
→ G2 è un’applicazione
aperta.

Dim. Sia φ : G1 − → G2 un epimorfismo topologico. Poiché G2 è separato, ker φ


è un sottogruppo normale
. chiuso di G1 . Passando al quoziente iniettivo otteniamo
un’applicazione φ̂ : G1 ker φ −
→ G2 continua e bigettiva tra spazi di Hausdorff
compatti e quindi un omeomorfismo. La tesi segue allora dal teorema precedente.
Esempio Sia H il corpo non commutativo dei quaternioni, che identifichiamo alla
sottoalgebra delle matrici complesse 2 × 2 della forma:
 
a b
−b̄ ā

(con a, b ∈ C). Le matrici di H con determinante uguale a uno formano un


gruppo topologico per la topologia definita dall’identificazione standard con la sfera
S3 ⊂ C2 . Esso è un gruppo di Hausdorff compatto e si indica con SU∗ (2). Il suo
sottoinsieme {I, −I} è un sottogruppo chiuso normale. Il quoziente
.
SU∗ (2) {I, −I}
è un gruppo topologico di Hausdorff e compatto omeomorfo a RP3 .

Teorema 2.9 Se G è un gruppo topologico connesso, allora ogni intorno aperto


U dell’identità è un insieme di generatori del gruppo.

Dim. Sia U −1 = {g −1 | g ∈ U }. Allora V = U −1 ∩ U è anch’esso un intorno aperto


dell’identità di G. Poniamo V 1 = V e definiamo per ricorrenza V n+1S∞= {gh |g ∈
n n n n+1 n
V, h ∈ V }. Ogni V è aperto e V ⊂ V per ogni n. Quindi n=1 V è un
sottogruppo aperto di G. Esso è perciò anche chiuso per il Teorema 2.2, e quindi
coincide con G perché G è connesso. Quindi V , e a maggior ragione U , genera G.

§3 Spazi di matrici
Sia K un campo. Indichiamo con Mm,n (K) il K-spazio vettoriale delle matrici
m × n a coefficienti in K.
IX. GRUPPI TOPOLOGICI 137

Data una matrice


 
a11 a12 ··· a1n
 a21 a22 ··· a2n 
A = 
 ... .. .. ..  ∈ Mm,n (C) ,
. . . 
am1 am2 ··· amn

indichiamo con A∗ ∈ Mn,m (C) la sua aggiunta:


 
ā11 ā21 ··· ām1
 ā12 ā22 ··· ām2 
A∗ = 
 ... .. .. ..  ∈ Mn,m (C) .
. . . 
ā1n ā2n ··· āmn

Definiamo su Mm,n (C) un prodotto scalare Hermitiano ponendo


m X
X n
(A|B) = tr(B ∗ A) = trA B ∗ = aij b̄ij ,
i=1 j=1

p
per A, B ∈ Mm,n (C). Sia kAk = (A|A) la norma associata e d(A, B) = kA − Bk
la relativa distanza. Considereremo su Mm,n (C) la struttura di spazio metrico
definita da questa distanza.
Teorema 3.1 Siano m, n interi positivi. Le applicazioni Mm,n ∋ A − → tA ∈
Mn,m (C) e Mm,n ∋ A − → A∗ ∈ Mn,m (C) sono isometrie; la prima è C-lineare, la
seconda anti-C-lineare.
Sia k un altro intero positivo. La moltiplicazione righe per colonne: Mm,n (C) ×
Mn,k (C) ∋ (A, B) − → AB ∈ Mm,k (C) è un’applicazione bilineare continua, per cui
vale:
kABk ≤ kAk · kBk ∀A ∈ Mm,n (C), ∀B ∈ Mn,k .

Dim. La verifica delle prime due affermazioni è immediata. Per verificare l’ultima,
consideriamo
t 
A1
.
A =  ..  e B = (B 1 , . . . , B k ) con A1 , . . . , Am , B 1 , . . . , B k ∈ Cn .
t
Am

Allora AB = (cji ) 1≤i≤m con cji = (Ai |B̄ j ). Quindi:


1≤j≤k

X X 
kABk2 = |(Ai |B̄ j )|2 ≤ kAi k2 kBj k2 = kAk2 · kBk2 .
i,j i,j

Indichiamo con GL(n, K) il gruppo delle matrici n × n invertibili con coefficienti in


K.
Teorema 3.2 Per ogni intero positivo n i gruppi GL(n, R) e GL(n, C) sono
gruppi topologici.
138 IX. GRUPPI TOPOLOGICI

Dim. Poiché la topologia di ciascuno dei gruppi GL(n, R) e GL(n, C) è la topo-


2
logia di sottospazio di Cn , è sufficiente osservare che i coefficienti della matrice
prodotto sono polinomi nei coefficienti dei fattori e che i coefficienti a−1 ij della
matrice inversa a−1 sono funzioni razionali dei coefficienti aij della matrice a.

§4 L’esponenziale di matrici
Teorema 4.1 Per ogni matrice A ∈ Mn,n (C), la serie

X 1 h
(4.1) exp(A) = A
h!
h=0

è convergente e definisce un elemento del gruppo lineare GL(n, C). L’applicazione


(4.2) → GL(n, C)
exp : Mn,n (C) −
è continua e surgettiva.
Siano λ1 , . . . , λn ∈ C gli autovalori di A, ripetuti con la loro molteplicità. Allora
eλ1 , . . . , eλn sono gli autovalori di exp(A) (ripetuti con la loro molteplicità). In
particolare vale la formula:
(4.3) det (exp(A)) = etr(A) .


X 1
Dim. La serie a termini positivi kAh k è maggiorata termine a termine dalla
h!
h=0
∞ ∞
X 1 h
X 1 h
serie convergente, a termini di segno positivo, kAk e quindi la serie A
h! h!
h=0 h=0
converge in Mn,n (C), uniformemente sui sottoinsiemi compatti. Quindi, tenuto
conto del fatto che Mn,n (C) è localmente compatto, exp : Mn,n (C) − → Mn,n (C) è
continua perché limite uniforme sui compatti di una successione di funzioni continue
(polinomi).
Per completare la dimostrazione, è utile premettere il seguente:
Lemma 4.2 Siano A, B ∈ Mn,n (C). Se AB = BA, allora
exp(A + B) = exp(A) exp(B) .

Dim. Abbiamo infatti:



X (A + B)h
exp(A + B)=
h!
h=0

P h!
X p+q=h p!q! Ap B q
=
h!
h=0

X Ap B q
=
p,q=0
p!q!

! ∞ !
X Ap X Bq
=
p=0
p! q=0
q!
= exp(A) exp(B)
IX. GRUPPI TOPOLOGICI 139

Proseguiamo ora la dimostrazione del Teorema.


h
Osserviamo ora che, se A ∈ Mn,n (C) e a ∈ GL(n, C), abbiamo a A a−1 =
a Ah a−1 per ogni intero h ≥ 0 e quindi

exp aAa−1 = a (exp(A)) a−1 ∀A ∈ Mn,n (C), ∀a ∈ GL(n, C) .
Questa formula ci permette di calcolare l’esponenziale di una matrice usando la
formula di Jordan: per ogni A ∈ Mn,n (C) possiamo trovare una matrice diagonale
S, una matrice nilpotente N , e una matrice invertibile a ∈ GL(n, C) tali che:
   
λ1 0 . . . 0 0 0 ǫ1 . . . 0 0
 0 λ2 . . . 0 0  0 0 ... 0 0 
 . . . . .  . . . . .. 
S= . . . . . , N =  .. .. . . ..
 . . . . .   . ,
 0 0 . . . λn−1 0   0 0 . . . 0 ǫn−1 
0 0 ... 0 λn 0 0 ... 0 0
con ǫi ∈ {0, 1} e A = a (S + N ) a−1 , SN = N S.
Poiché SN = N S, abbiamo, per il Lemma, exp(S + N ) = exp(N ) exp(S) =
exp(S) exp(N ). Si ottiene facilmente:
 λ1 
e 0 ... 0 0
 0 e λ2 . . . 0 0  n−1
X Nh
 . .. . .. .. 
exp(S) =  .
 . . . . . 
.  e exp(N ) = .
 0 λn−1
h!
0 ... e 0  h=0
λn
0 0 ... 0 e
Chiaramente exp(S) è invertibile ed ha determinante e(λ1 +···+λn ) = etr(A) . La
matrice exp(N ) è somma dell’identità e una matrice nilpotente e quindi ha deter-
minante 1. Quindi
det(exp(A)) = det(exp(S + N )) = det(exp(S))det(N ) = det(exp(S)) = etr(A) .
Ciò dimostra che exp(A) ∈ GL(n, C).
Per dimostrare che exp : Mn,n (C) − → GL(n, C) è surgettiva, è sufficiente mo-
strare che ogni matrice di Jordan invertibile appartiene ad exp(Mn,n (C)). Chiara-
mente basterà dimostrare che ciò è vero per matrici m × m della forma:
 
λ 1 0 ... 0 0
0 λ 1 ... 0 0
 
0 0 λ ... 0 0
A=  ... ... . . . . . . ... ... 

 
0 0 0 ... λ 1
0 0 0 ... 0 λ
con λ ∈ C \ {0}. Abbiamo A = S(I + N ) = (I + N )S con
   
λ 0 0 ... 0 0 0 λ−1 0 ... 0 0
0 λ 0 ... 0 0   0 0 λ−1 ... 0 0 
   
0 0 λ ... 0 0 0 0 0 ... 0 0 
S=  ... ... . . . . . . .....  e N = .
 .. .
.. . .. .. .. ...
 .  . . .

0 0 0 ... λ −1 
0   0 0 0 ... 0 λ
0 0 0 ... 0 λ 0 0 0 ... 0 0
140 IX. GRUPPI TOPOLOGICI

Sia λ = reiφ = r(cos φ + i sin φ), con r, φ ∈ R, r > 0. Poniamo: S ′ = (log r + iφ)I
Pm−1 (−N )h
e N ′ = − h=1 . Allora S = exp(S ′ ), (I + N ) = exp(N ′ ) e quindi, poiché
h
S ′ N ′ = N ′ S ′ , abbiamo: A = exp(S ′ + N ′ ).
In particolare otteniamo:
Teorema 4.3 Per ogni intero n ≥ 1 il gruppo topologico GL(n, C) è connesso
per archi.

Osservazione Osserviamo che l’esponenziale di una matrice a coefficienti reali è


→ GL(n, R)
un elemento del gruppo lineare reale. Ma l’applicazione exp : Mn,n (R) −
non è surgettiva.
Dimostriamo ora alcune proprietà di differenziabilità dell’esponenziale di matrici.
Lemma 4.4 Sia A una matrice n × n a coefficienti complessi. Allora l’applicazione
2
R∋t−→ exp(tA) ∈ GL(n, C) ⊂ Cn è differenziabile di classe C ∞ e risulta:
 k
d
(4.4) exp(tA) = Ak exp(tA) = exp(tA) Ak .
dt

Dim. Siano s, t ∈ R. Abbiamo allora



X exp(tA)Ah h
exp ((s + t)A) = s ,
h!
h=0

con convergenza uniforme sui compatti di R × R. Da questa osservazione segue la


tesi.

Lemma 4.5 Sia A una matrice n × n a coefficienti complessi. Se exp(tA) ∈


Mn,n (R) per ogni t ∈ R, allora A ∈ Mn,n (R).

Dim. Utilizzando il lemma precedente, troviamo che Av ∈ Rn per ogni v ∈ Rn , e


questo implica che A ∈ Mn,n (R).

§5 Matrici Hermitiane
Una matrice A ∈ Mn,n (C) si dice Hermitiana se A∗ = A. Le matrici Hermitiane
formano un sottospazio reale di dimensione n2 di Mn,n (C). Indicheremo tale spazio
vettoriale con pn .
Una matrice u ∈ GL(n, C) si dice unitaria se u∗ u = I. Le matrici unitarie sono
le matrici dei cambiamenti di base ortonormali per il prodotto scalare Hermitiano
standard di Cn . Esse formano un sottogruppo di GL(n, C), che indichiamo con
U(n).
Lemma 5.1 Ogni matrice Hermitiana è diagonalizzabile ed ha autovalori reali. Se
A ∈ pn possiamo trovare u ∈ U(n) tale che uAu−1 sia diagonale e reale.
IX. GRUPPI TOPOLOGICI 141

Dim. Se λ è un autovalore di A ∈ pn , con autovettore v ∈ C \ {0}, abbiamo:

λ|v|2 = (A(v)|v) = (v|A∗ (v)) = (v|A(v)) = (v|λv) = λ̄|v|2 ,

onde λ̄ = λ e λ è reale. Se w è un vettore ortogonale a v, abbiamo

(A(w)|v) = (w|A∗ (v)) = (w|A(v)) = (w|λv) = 0 .

Quindi A(v ⊥ ) ⊂ v ⊥ . Da questo deduciamo che esiste una base ortonormale di


autovettori di A, da cui segue il lemma.
Indichiamo con Pn l’insieme delle matrici Hermitiane definite positive, cioè
delle matrici Hermitiane che hanno tutti gli autovalori positivi. Su tale insieme
2
consideriamo la topologia di sottospazio di Cn .
Teorema 5.2 L’applicazione esponenziale definisce un omeomorfismo:

(5.1) pn ∋ A −
→ exp(A) ∈ Pn .


Dim. Si verifica facilmente che (exp(A)) = exp(A∗ ) e quindi exp(pn ) ⊂ pn .
Inoltre, se A ∈ pn ha autovalori λ1 , ..., λn ∈ R, la matrice exp(A) ha autovalori
exp(λ1 ), ..., exp(λn ), che sono numeri reali positivi.
Dimostriamo ora che (5.1) è surgettiva. Sia p ∈ Pn . Per il Lemma 5.1 esiste
u ∈ U(n) tale che upu−1 = diag(k1 , . . . , kn ) con 0 < k1 ≤ . . . ≤ kn . Posto
Q = diag(log k1 , . . . , log kn ), con log kj ∈ R per 1 ≤ j ≤ n, otteniamo P =
u exp(Q)u−1 = exp(uQu−1 ).
Dimostriamo ora che (5.1) è iniettiva. Siano A, B ∈ pn tali che exp(A) = exp(B).
Fissiamo una base ortonormale e1 , ..., en di autovettori di A: abbiamo A(ej ) = λj ej
con λj ∈ R per j = 1, ..., n. Sia µ ∈ R un autovalore di B con autovettore
v = a1 e1 + · · · + an en . Allora:
n
X n
X 
eµ v = (aj eµ ) ej = exp(B)(v) = exp(A)(v) = aj e λj e j .
j=1 j=1

Da questa relazione ricaviamo che aj eµ = aj eλj per ogni j = 1, ..., n. Poiché


l’esponenziale è iniettivo su R, otteniamo che µ = λj se aj 6= 0, e in questo caso ej
è autovettore di B rispetto all’autovalore µ = λj . Da questo segue che B = A.
Dimostriamo infine che (5.1) è un omeomorfismo. A questo scopo basta osservare
che, fissati due numeri reali a, b con a < b, gli insiemi

pn (a, b) = P ∈ pn a|v|2 ≤ (P (v)|v) ≤ b|v|2

e 
Pn (a, b) = p ∈ Pn ea |v|2 ≤ (p(v)|v) ≤ eb |v|2
sono compatti di Hausdorff e l’applicazione esponenziale definisce tra essi una
trasformazione continua e bigettiva e quindi un omeomorfismo. Poiché tali insiemi,
al variare delle coppie di numeri reali a, b con a < b costituiscono un ricoprimento
fondamentale di pn e di Pn rispettivamente, ne segue che (5.1) è un omeomorfismo.
142 IX. GRUPPI TOPOLOGICI

Data p ∈ Pn , indichiamo con log(p) l’unico elemento P ∈ pn tale che exp(P ) = p.


Denotiamo con pn (R) (risp. Pn (R)) il sottospazio delle matrici reali di pn
(risp. diPn ). Osserviamo che pn (R) è lo spazio vettoriale delle matrici reali n × n
simmetriche. Abbiamo:
Teorema 5.3 Per ogni intero n ≥ 1 l’applicazione pn (R) ∋ P −
→ exp(P ) ∈ Pn (R)
è un omeomorfismo.

Dim. Infatti ogni matrice simmetrica reale n × n ammette una base ortonormale
in Rn . Quindi exp(pn (R)) = Pn (R) e la tesi segue dal teorema precedente.

§6 Decomposizione di matrici di GL(n, C)


Teorema 6.1 Sia n un intero positivo. Ogni matrice a ∈ GL(n, C) si decompone
in modo unico nel prodotto up di una matrice unitaria u ∈ U(n) e di una matrice
Hermitiana definita positiva pPn .

Dim. Data a ∈ GL(n, C), la matrice a∗ a è Hermitiana e definita positiva. Esiste


allora un’unica matrice Hermitiana Q ∈ pn tale che a∗ a = exp(Q). Posto p =
exp(Q/2), sia u = ap−1 . Allora:

uu∗ = ap−1 p−1 a∗ = ap−2 a∗ = a(a∗ a)−1 a∗ = aa−1 a∗ −1 a∗ = I

e u ∈ U(n).
Dimostriamo ora che la decomposizione è unica. Da a = up otteniamo a∗ a =
pu∗ up = p2 e quindi l’unicità è conseguensa del seguente:
→ p2 ∈ Pn è un
Lemma 6.2 Sia n un intero positivo. L’applicazione Pn ∋ p −
omeomorfismo.

Dim. Abbiamo infatti il seguente diagramma commutativo:


P →2P
pn −−−−→ pn
 

expy
exp
y
Pn −−−−→ Pn
p→p2

in cui le frecce verticali e l’orizzontale in alto sono omeomorfismi. Quindi anche la


freccia orizzontale in basso è un omeomorfismo.

Data p ∈ Pn , indichiamo con p l’unico elemento q di Pn tale che q 2 = p.

L’applicazione Pn ∋ p − → p ∈ Pn è, per il lemma precedente, un omeomorfismo.
Teorema 6.3 Sia n un intero positivo. L’applicazione:

(6.1) → u exp(P ) ∈ GL(n, C)


U(n) × pn ∋ (u, P ) −

è un omeomorfismo.

Dim. L’applicazione è infatti continua e la sua inversa è continua, essendo definita


√ −1 √ 
da GL(n, C) ∋ a −
→ a a a ∗ ∗
, log a a ∈ U(n) × pn .
IX. GRUPPI TOPOLOGICI 143

§7 Algebre di Lie
Sia K un campo. Un’algebra g su K si dice algebra di Lie se il prodotto

(7.1) g × g ∋ (X, Y ) −
→ [X, Y ] ∈ g

è un’applicazione K-lineare antisimmetrica che soddisfa l’identità di Jacobi:

(7.2) [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 ∀X, Y, Z ∈ g .

Esempio 7.1 Se V è un qualsiasi spazio vettoriale su K, il prodotto [v1 , v2 ] = 0 per


ogni v1 , v2 ∈ V definisce su V una struttura di algebra di Lie, che si dice abeliana.
Esempio 7.2 Sia V uno spazio vettoriale su K. Indichiamo con glK (V ) lo spazio
degli endomorfismi K-lineari di V , con il prodotto definito da

(7.3) [A, B] = A ◦ B − B ◦ A .

Con questa operazione glK (V ) è un’algebra di Lie su K.


In particolare lo spazio vettoriale Mn,n (K) delle matrici n×n a coefficienti in K è
un’algebra di Lie per il commutatore di matrici: [A, B] = AB − BA. Quest’algebra
di Lie sarà denotata con gl(n, K).
Esempio 7.3 Sia A un’algebra associativa sul campo K, con prodotto A × A ∋
(a, b) −
→ a · b ∈ A. Il prodotto [a, b] = a · b − b · a deinisce sullo spazio vettoriale A
una struttura di algebra di Lie. Indicheremo con ALie l’algebra di Lie ottenuta in
questo modo da un’algebra associativa A.
Sia g un’algebra di Lie di dimensione finita N su K e sia X1 , ..., XN una base di
g come spazio vettoriale su K. Risultano allora univocamente determinati cki,j ∈ K
per 1 ≤ i, j, k ≤ N tali che

N
X
(7.4) [Xi , Xj ] = cki,j Xk ∀1 ≤ i, j ≤ N .
k=1

I coefficienti cki,j si dicono le costanti di struttura di g e verificano le relazioni:


(
ckj,i = −cki,j (antisimmetria),
(7.5) PN  i r i r i r

i=1 c c
j,k i,h + c c
k,h i,j + c h,j i,k = 0
c (identità di Jacobi).

Viceversa, costanti di struttura che verifichino le (7.5) definiscono su uno spazio


vettoriale V di dimensione N una struttura di algebra di Lie.
Esempio 7.4 Consideriamo in R3 il prodotto vettore:

(7.6) R3 × R3 ∋ (v, w) −
→ v × w ∈ R3 ,

definito dall’identità:

(7.7) det(v, w, z) = (v × w|z) ∀v, w, z ∈ R3 .


144 IX. GRUPPI TOPOLOGICI

Esso si può definire nella base ortonormale canonica e1 , e2 , e3 di R3 mediante le


costanti di struttura cij,k = ǫ(i, j, k), dove ǫ(i, j, k) è uguale a zero se due degli
indici i, j, k sono uguali ed altrimenti è la segnatura della permutazione (i, j, k)
di (1, 2, 3). Per verificare che R3 , col prodotto esterno, è un’algebgra di Lie, è
sufficiente verificare la relazione e1 × (e2 × e3 ) + e2 × (e3 × e1 ) + e3 × (e1 × e2 ) = 0,
e questa è verificata perché tutti gli addendi sono nulli.
Se a, b sono due sottospazi vettoriali di un’algebra di Lie g, indichiamo con [a, b]
il sottospazio vettoriale di g generato dai commutatori [X, Y ] al variare di X in a
e di Y in b. Un sottospazio vettoriale a di g si dice una sottoalgebra di Lie di g se
[a, a] ⊂ a e un ideale se [g, a] ⊂ a.
Si verifica facilmente il segente:
Lemma 7.1 Siano g, h due algebre di Lie e φ : g − → h un omomorfismo di algebre
di Lie. Allora ker φ = {X ∈ g | φ(X) = 0} è un ideale di g.
Se a è un ideale dell’algebra di Lie g, allora vi è un’unica struttura di algebra di
π
Lie sul quoziente g /a che renda la proiezione naturale g − → g /a un omomorfismo
di algebre di Lie.
Data un’algebra A su un campo K, si dice derivazione di A un’applicazione K-
lineare D : A −→ A che soddisfi l’identità di Leibnitz:

(7.8) D(a · b) = (Da) · b + a · (Db) ∀a, b ∈ A .

Lemma 7.2 Sia A un’algebra su K. L’insieme DerK (A) delle derivazioni di A è


una sottoalgebra di Lie di glK (A).

Dim. Il fatto che DerK (A) sia un K-spazio vettoriale segue dalla bilinearità del
prodotto A × A ∋ (a, b) −
→ a · b ∈ A.
Siano ora D1 , D2 ∈ DerK (A) e dimostriamo che anche [D1 , D2 ] ∈ DerK (A). Per
ogni a, b ∈ A risulta:

[D1 , D2 ](a · b)= D1 (D2 a · b + a · D2 b) − D2 (D1 a · b + a · D1 b)


= D1 ◦ D2 a · b + D2 a · D1 b + D1 a · D2 b + a · D1 ◦ D2 b
− (D2 ◦ D1 a · b + D1 a · D2 b + D2 a · D1 b + a · D2 ◦ D1 b)
= (D1 ◦ D2 − D2 ◦ D1 )a · b + a · (D1 ◦ D2 − D2 ◦ D1 )b
= [D1 , D2 ]a · b + a · [D1 , D2 ]b .

La dimostrazione è completa.

Lemma 7.3 Sia A un’algebra associativa su K. Allora l’applicazione A ∋ a − →


Da ∈ glK (A), definita da Da (x) = a · x − x · a per ogni x ∈ A, è una derivazione di
A. L’applicazione: ALie ∋ a −→ Da ∈ DerK (A) è un omomorfismo di algebre di Lie.

Sia g un’algebra di Lie su K e sia X ∈ g. Definiamo

(7.9) ad(X) : g ∋ Y −
→ [X, Y ] ∈ g .

Si verifica che vale:


IX. GRUPPI TOPOLOGICI 145

Teorema 7.4 Sia g un’algebra di Lie sul campo K e sia X ∈ g. Allora ad(X) è
una derivazione di g e l’applicazione
(7.10) ad : g ∋ X −
→ ad(X) ∈ DerK (g)
è un omomorfismo di g nell’algebra di Lie delle derivazioni di g.
La (7.10) si dice la rappresentazione aggiunta di g.
Osservazione I.D.Ado (Uspiehi Math. Nauk, 1947) nel caso di algebre di Lie
su campi di caratteristica 0 e K. Iwasawa (Japan J. Math., 1948) nel caso generale
hanno dimostrato che ogni algebra di Lie g di dimensione finita su K ammette una
rappresentazione fedele φ : g −→ gl(n, K) per qualche intero positivo n.
Non sarà quindi restrittivo, nel seguito, considerare soltanto sottoalgebre di Lie
dell’algebra di Lie degli endomorfismi di uno spazio vettoriale V di dimensione finita
su K.

§8 Gruppi di Lie di trasformazioni lineari e loro algebre di Lie


In questo paragrafo studieremo le relazioni tra gruppi di Lie di trasformazioni
lineari e algebre di Lie.
Lemma 8.1 Sia n un intero positivo e siano X, Y due elementi di gl(n, C) e sia k
un intero positivo. Valgono allora le formule seguenti:
(i) ad(X)(XY ) = Xad(X)(Y ) ,
k   
X k h
(ii) k
X Y =YX + k
ad (Y ) X k−h ,
(8.1) h
h=1
k  
X k
h
(iii) YX =x Y +k k
(−1) X k−h ad(X)h Y .
h
h=1

Dim. Dimostriamo la (i). Abbiamo:


ad(X)(XY ) = X(XY ) − (XY )X = X(XY − Y X) = Xad(X)Y .
La dimostrazione di (ii) e di (iii) sono simili. Mostriamo ad esempio che vale la
(iii). A questo scopo osserviamo che per k = 1 la formula si riduce alla definizione
di ad(X) e quindi è verificata. Supponiamo m ≥ 1 e la formula valida per k ≤ m.
Abbiamo:
m   !
X m
Y X m+1 = Y X m X = X m Y + (−1)h X m−h ad(X)h Y X
h
h=1
m  
h m
X
=X m+1 m
Y − X ad(X)Y + (−1) X m−h+1 ad(X)h Y
h
h=1
m  
X m
− (−1)h X m−h ad(X)h+1 Y
h
h=1
= X m+1 Y − X m ad(X)Y + (−1)m+1 ad(X)m+1 Y
m    
X m h m
+ (−1) + X m−h+1 ad(X)h Y
h h−1
h=1
 m
− m
1 X ad(X)Y
146 IX. GRUPPI TOPOLOGICI

m

perché i due endomorfismi ad(X)(·) e X ◦ (·) commutano per la (i). Poiché h +
m
 m+1

h−1 = h , otteniamo la (iii).

Teorema 8.2 (Formula dello Jacobiano) Sia n un intero positivo. L’ap -


plicazione esponenziale exp : gl(n, C) − → GL(n, C) è differenziabile in ogni punto e
il suo differenziale in A ∈ gl(n, C) è dato da:

I − exp (−ad(A))
(8.2) d exp(A)(X) = exp(A)X ∀X ∈ gl(n, C) ,
ad(A)


I − exp (−ad(A)) X (−1)h
ove = ad(A)h .
ad(A) (h + 1)!
h=0

Dim. Fissiamo A ∈ gl(n, C). Per ogni X ∈ gl(n, C) abbiamo:

h−1
X
h h
(A + X) = A + Ar XAh−r−1 + o(X) .
r=0

La formula di commutazione (iii) del Lemma precedente ci dà:

s
 
r s s h−j−1
X
j
A XA = (−1) A ad(A)j X .
j=0
j

Sostituendo troviamo:
h−1 s
 
X
r s
XX s h−j−1 j
A XA = (−1) A ad(A)j X
s=0 j=0
j
r+s=h−1
h−1 h−j−1
!
X X j + k 
= (−1)j Ah−j−1 ad(A)j X
s=0
j
k=0
h−1  
X
j h
= (−1) Ah−j−1 ad(A)j X .
s=0
j + 1

Otteniamo perciò:

X (A + X)h
exp(A + X)=
h!
h=0
X 1 X
= Ar XAs + o(X)
h!
r+s=h−1
∞ h−1
X X Ah−j−1 (−1)j ad(A)j
= X + o(X)
(h − j − 1)! (j + 1)!
h=1 j=0
I − exp(−ad(A))
= exp(A) X
ad(A)
I − exp(−ad(A))
= exp(A) X .
ad(A)
IX. GRUPPI TOPOLOGICI 147

Abbiamo perciò ottenuto:

I − exp(−ad(A))
exp(A + X) = exp(A) + exp(A)X + o(X)
ad(A)

che ci dà la formula desiderata per il differenziale.


Enunciamo ora il teorema della funzione inversa per applicazioni differenziabili
tra aperti di Rn :
Teorema 8.3 (Teorema dell’applicazione inversa) Sia Ω un aperto di Rn
e sia f : Ω −→ Rn un’applicazione differenziabile di classe C k , con 1 ≤ k ≤ ∞. Sia
x0 ∈ Ω un punto in cui df (x0 ) : Rn −→ Rn sia un isomorfismo lineare. Allora esiste
f (U )
un intorno aperto U di x0 in Ω tale che f (U ) sia aperto e f |U : U − → f (U ) ⊂ Rn
sia un omeomorfismo la cui inversa sia ancora un’applicazione differenziabile di
classe C k .
Siano U, V due aperti di Rn ed f : U − → V un omeomorfismo. Se sia f che f −1
sono applicazioni differenziabili di classe C k , diciamo che f è un diffeomorfismo di
classe C k .
Dal teorema dell’applicazione inversa ricaviamo:
Teorema 8.4 Sia n un intero positivo. Allora l’ applicazione: exp : gl(n, C) − →
GL(n, C) è un diffeomorfismo di classe C ∞ di un intorno aperto di 0 in gl(n, C) su
un intorno aperto dell’identità in GL(n, C).
Analogamente, exp : gl(n, R) − → GL(n, R) è un diffeomorfismo di classe C ∞ di
un intorno aperto di 0 in gl(n, R) su un intorno aperto dell’identità in GL(n, R).

Dim. L’enunciato è conseguenza del Teorema dell’applicazione inversa, perché il


differenziale dell’applicazione esponenziale in 0 è l’identità su gl(n, C).

Teorema 8.5 (Coordinate di seconda specie) Sia n un intero positivo, in-


dichiamo con K il campo dei numeri reali o dei numeri complessi, e siano V, W
due sottospazi vettoriali reali di gl(n, K) tali che gl(n, K) = V ⊕ W . Per ogni
X ∈ gl(n, K) siano XV ∈ V e XW ∈ W le componenti di X in V, W , tali che
XV +XW . Allora l’applicazione φ : gl(n, K) ∋ X − → exp(XV ) exp(XW ) ∈ GL(n, K)
è un diffeomorfismo di classe C di un intorno di 0 in gl(n, K) su un intorno

dell’identità in GL(n, K).

Dim. Per la formula dello Jacobiano abbiamo:

φ(X)= exp(XV ) exp(XW ) = (I + XV + o(XV ))(I + XW + o(XW ))


= I + XV + XW + o(X) = I + X + o(X) ,

e quindi dφ(0) è l’identità su gl(n, K). La tesi è quindi conseguenza del teorema
dell’applicazione inversa.
Osservazione La serie

X (e − x)h
log(x) = log(e + (x − e)) = −
h
h=1
148 IX. GRUPPI TOPOLOGICI

converge uniformemente su {x ∈ GL(n, C) | kx − Ik ≤ r} se 0 ≤ r < 1 e definisce


un elemento log(x) ∈ gl(n, C) tale che exp(log(x)) = x.

Lemma 8.6 Sia n un intero positivo. Se X, Y ∈ gl(n, C) e t ∈ R, abbiamo:


 
t2 3
(8.3) exp(tX) exp(tY ) = exp t(X + Y ) + [X, Y ] + O(t ) .
2

Dim. Basta dimostrare che le due applicazioni

F1 : R ∋ t −  exp(tY ) ∈2 GL(n,C)
→ exp(tX) e
t
→ exp t(X + Y ) + 2 [X, Y ] ∈ GL(n, C)
F2 : R ∋ t −

e le loro derivate fino al second’ordine assumono lo stesso valore in 0. Da:


 
F1 (t)= I + tX + 21 t2 X 2 + O(t3 ) I + tY + 12 t2 Y 2 + O(t3 )
2
= I + t(X + Y ) + t2 (X 2 + 2XY + Y 2 ) + O(t3 )

otteniamo: F1 (0) = I, F1′ (0) = X + Y , F1′′ (0) = X 2 + 2XY + Y 2 .


D’altra parte:
 2
  2
2
F2 (t)= I + tX + tY + t2 [X, Y ] + 12 tX + tY + t2 (XY − Y X) + O(t3 )
2 
= I + t(X + Y ) + t2 [X, Y ] + X 2 + XY + Y X + Y 2 + O(t3 )
2
= I + t(X + Y ) + t2 (X 2 + 2XY + Y 2 ) + O(t3 )

da cui otteniamo: F2 (0) = I, F2′ (0) = X + Y , F2′′ (0) = X 2 + 2XY + Y 2 . La


dimostrazione è completa.
Questo lemma ci permette di esplicitare la relazione tra sottogruppi chiusi di
GL(n, C) e sottoalgebre di Lie reali di gl(n, C).
Teorema 8.7 Sia n un intero positivo e sia G un sottogruppo chiuso di GL(n, C).
Sia g il sottoinsieme di tutte le matrici X ∈ gl(n, C) tali che exp(tX) ∈ G per ogni
t ∈ R. Allora g è un’algebra di Lie reale e l’applicazione g ∋ X − → exp(X) ∈ G
definisce un omeomorfismo di un intorno di 0 in g su un intorno dell’identità in G.

Dim. Segue immediatamente dalla definizione che, se X ∈ g, anche tX ∈ g per


m
ogni t ∈ R. Siano ora X, Y ∈ g. Allora (exp(tX/m) exp(tY /m)) ∈ G per ogni
numero reale t ed ogni intero positivo m. Utilizzando il lemma
 precedente, abbiamo:
m 2
(exp(tX/m) exp(tY /m)) = exp t(X + Y ) + O(t /m) . Facendo tendere m al -
l’infinito, poiché abbiamo supposto che G fosse chiuso in GL(n, C), otteniamo che
exp(t(X + Y )) ∈ G per ogni t ∈ R e quindi anche (X + Y ) ∈ g. Questo dimostra
che g è uno spazio vettoriale. Utilizzando ancora il Lemma 8.6, abbiamo per ogni
intero positivo m:
 
G ∋exp(tX/m) exp(Y /m) exp − t(X+Y m
)
  3   
t(X+Y ) t2 t t(X+Y )
= exp + 2m2 [X, Y ] + O m3 exp − m
 2m  3 
t t
= exp 2m 2 [X, Y ] + O m3 .
IX. GRUPPI TOPOLOGICI 149
  3 
2 t2 t
Elevando alla m , otteniamo che G ∋ exp 2 [X, Y]+O m per ogni intero
positivo m ed ogni numero reale t. Passando al limite per m − → +∞ otteniamo
allora che exp(t[X, Y ]) ∈ G per ogni X, Y ∈ g ed ogni t ≥ 0. Scambiando tra loro
X e Y , otteniamo l’inclusione anche per t < 0 e quindi concludiamo che [X, Y ] ∈ g.
Quindi g è una sottoalgebra di Lie reale di gl(n, C).
Sia ora G′ il sottogruppo di G generato da exp(g) = {exp(X) | X ∈ g}. Dico
che G′ è un intorno dell’identità in G. Se cosı̀ non fosse, potremmo trovare una
successione {gν }ν∈N ⊂ G \ G′ tale che gν − → I per ν − → +∞. Scegliamo un
sottospazio vettoriale reale V di gl(n, C) tale che gl(n, C) = g ⊕ V . Per il teorema
sulle coordinate di seconda specie, esistono intorni aperti U di 0 in g e U ′ di 0 in
→ exp(X) exp(Y ) ∈ GL(n, C) sia un diffeomorfismo di
V tali che U × U ′ ∋ (X, Y ) −
classe C di U × U su un intorno W dell’identità in GL(n, C). A meno di passare
∞ ′

a una successione estratta, possiamo allora supporre che gν = exp(Xν ) exp(Yν ) con
Xν ∈ U , Yν ∈ U ′ per ogni ν ∈ N. Inoltre Xν , Yν − → 0 per ν −→ +∞. Poiché per
ipotesi Yν 6= 0 per ogni ν ∈ N, risulta definita una successione di interi non negativi
mν tali che mν ≤ kYν k−1 < µν + 1. A meno di passare a una sottosuccessione
possiamo allora supporre che limν − →∞ mν Yν = Y ∈ V \ {0}. Per ogni coppia di
interi p, q con q > 0 poniamo: pmν = qsν + rν , con 0 ≤ rν < q. Poiché rν Yν − →0
per ν −→ +∞, otteniamo:
   
exp pq Y = limν − →∞ exp pmν
q Y ν

→∞ (exp(Yν )) ∈ G .
= limν −

Quindi G contiene gli elementi exp(tY ) per ogni t razionale. Poiché G è chiuso ne
segue che G contiene exp(tX) per ogni t reale, e questo ci dà una contraddizione
perché Y ∈/ g. Ne segue perciò che G′ è un intorno aperto di I in G e quindi
coincide con la componente connessa dell’identità in G. Inoltre, la dimostrazione
ci mostra che l’esponenziale definisce un omeomorfismo di un intorno aperto di 0
in g su un intorno aperto di I in G.
Un sottogruppo chiuso G di GL(n, C) si dice un gruppo di Lie di trasformazioni
di Cn . L’algebra di Lie reale:

(8.4) g = {X ∈ gl(n, C) | exp(tX) ∈ G ∀t ∈ R}

si dice l’algebra di Lie del gruppo G.


Teorema 8.8 (Rappresentazione aggiunta) Sia G un sottogruppo chiuso di
GL(n, C) e sia g la sua algebra di Lie. Allora, per ogni g ∈ G ed X ∈ g, risulta
Ad(g)(X) = gXg −1 ∈ g. L’applicazione

(8.5) → Ad(g)(X) = gXg −1 ∈ g


Ad(g) : g ∋ X −

è un isomorfismo dell’algebra di Lie g.


L’applicazione

(8.6) Ad : G ∋ g −
→ Ad(g) ∈ glR (g)

è un omomorfismo di gruppi.
150 IX. GRUPPI TOPOLOGICI

Dim. Se X ∈ g e g ∈ G, allora exp(tgXg −1 ) = g exp(tX)g −1 ∈ G per ogni t ∈ R


e quindi Ad(g)(X) ∈ g.
Sia g ∈ G. Per dimostrare che Ad(g) è un isomorfismo dell’algebra
 di Lie  g,
d2 d2
basta osservare che [X, Y ] = dt2 |t=0 (exp(tX) exp(tY )) e che Ad(g) dt2 f (t) =
2
d
dt2 (Ad(g)(f (t))) per ogni funzione f : R −
→ gl(n, C) di classe C 2 . Poiché Ad(g −1 )
è l’inverso di Ad(g), quest’ultimo è un isomorfismo di algebre di Lie. Infine,
osserviamo che Ad(g)Ad(h) = Ad(gh) per ogni coppia di elementi g, h ∈ G e
quindi Ad : G − → GLR (g) è un omomorfismo di gruppi.

§9 Proprietà topologiche di U(n)


Sia n un intero positivo. Ricordiamo che U(n) è il gruppo delle matrici u ∈
GL(n, C) tali che uu∗ = u∗ u = I.
Lemma 9.1 Ogni matrice di U(n) è diagonalizzabile e ammette una base orto-
normale di autovettori. I suoi autovalori hanno tutti modulo 1.

Dim. Sia λ un autovalore di una u ∈ U(n), con relativo autovettore v ∈ Cn \ {0}.


Allora kvk2 = ku(v)k2 = (u(v)|u(v)) = (λv|λv) = |λ|2 kvk2 e quindi |λ| = 1.
Se w ∈ v ⊥ , abbiamo λ(v|u(w)) = (u(v)|u(w)) = (v|u∗ u(w)) = (v|w) = 0, onde
u v ⊥ ⊂ v ⊥ . Ne segue che u ammette una base ortonormale di autovettori.

Teorema 9.2 Sia n un intero positivo. Il gruppo U(n) è un sottogruppo chiuso


compatto di GL(n, C). La sua algebra di Lie è

(9.1) u(n) = {X ∈ gl(n, C) | X + X ∗ = 0}

e l’applicazione esponenziale

(9.2) u(n) ∋ X −
→ exp(X) ∈ U(n)

è surgettiva.

Dim. L’applicazione φ : gl(n, C) ∋ a − → aa∗ ∈ gl(n, C) è continua e quindi U(n) =


−1
φ (I) è un chiuso. Inoltre kak = 1 se a ∈ U(n). Quindi U(n) è anche limitato e
quindi compatto per il teorema di Weierstrass.

Sia X ∈ gl(n, C). Poiché (exp(X)) = exp (X ∗ ), se X ∗ = −X abbiamo
exp(tX) exp(tX ∗ ) = I per ogni t ∈ R. Quindi {X | X + X ∗ = 0} è contenuto
nell’algebra di Lie di U(n). Viceversa, derivando in t = 0 i due membri dell’identità
exp(tX) exp(tX ∗ ) = I, otteniamo X + X ∗ = 0. Vale quindi l’inclusione opposta e
ciò dimostra che u(n) è l’algebra di Lie di U(n).
Infine, un elemento u ∈ U(n) si scrive, per il lemma precedente, nella forma
 iλ1 
e ... 0
. .. ..  −1
u = a  .. . . a con λ1 , . . . , λn ∈ R e a ∈ U(n) .
iλn
0 ... e
Allora  
iλ1 ... 0
. .. ..  −1
X = a  .. . . a ∈ u(n)
0 ... iλn
IX. GRUPPI TOPOLOGICI 151

ed exp(X) = u.
Osserviamo, in particolare, che U(n) è connesso per archi, in quanto immagine
di uno spazio vettoriale reale mediante un’applicazione continua.

§10 I gruppi SL(n, C) e SU(n)


Sia n un intero positivo. Definiamo il gruppo speciale unitario SU(n) mediante:

(10.1) SU(n) = {u ∈ U(n) | det(u) = 1} .

Teorema 10.1 Il gruppo SU(n) è un sottogruppo chiuso normale di U(n). La


sua algebra di Lie è

(10.2) su(n) = {X ∈ u(n) | tr(X) = 0}

e l’applicazione esponenziale

(10.3) su(n) ∋ X −
→ exp(X) ∈ SU(n)

è surgettiva.

Dim. Se X ∈ gl(n, C), abbiamo:



d
(10.4) det(exp(tX)) = tr(X) .
dt t=0

Quindi se exp(tX) ∈ SU(n) per ogni numero reale t, otteniamo subito che X +X ∗ =
0 e tr(X) = 0. Il viceversa è ovvio. Infine, osserviamo che ogni elemento u ∈ SU(n)
si può scrivere nella forma
 
eiθ1 ... 0 0
 ... ..
.
..
.
..
.  −1
u = a
 0 iθn−1
a
... e 0 
−i(θ1 +···+θn−1 )
0 ... 0 e

con a ∈ u(n). Allora


 
iθ1 ... 0 0
 .. ..
.
.. ..  −1
X = a . . .  a ∈ su(n)
 0 ... eiθn−1 0 
0 ... 0 −i(θ1 + · · · + θn−1 )

ed exp(X) = u.
Definiamo il gruppo speciale lineare complesso SL(n, C) come il sottogruppo di
GL(n, C) formato dalle matrici n × n a determinante 1.
Teorema 10.2 Sia n un intero positivo. Il gruppo SL(n, C) è un sottogruppo
chiuso normale di GL(n, C). La sua algebra di Lie è

(10.5) sl(n, C) = {X ∈ gl(n, C) | tr(X) = 0} .


152 IX. GRUPPI TOPOLOGICI

L’applicazione esponenziale:

(10.6) exp : sl(n, C) ∋ X −


→ exp(X) ∈ SL(n, C)

è surgettiva.
Inoltre l’applicazione:

(10.7) → u exp(X) ∈ SL(n, C) ,


SU(n) × p0 (n) ∋ (u, X) −

ove p0 (n) = {X ∈ pn | tr(X) = 0}, è un omeomorfismo. In particolare SL(n, C) è


2
omeomorfo al prodotto topologico SU(n) × Rn −1 .

Dim. Sia sl(n, C) lo spazio vettoriale delle matrici n × n a traccia nulla. Se X ∈


sl(n, C), abbiamo exp(tX) ∈ SL(n, C) per ogni t ∈ R e viceversa, derivando per
t = 0 i due membri dell’equazione exp(tX) = I, otteniamo tr(X) = 0. Quindi
sl(n, C) è l’algebra di Lie di SL(n, C). Sia ora a ∈ SL(n, C). Abbiamo già osservato
che a si può scrivere nella forma a = s exp(N ) con s semisemplice e N nilpotente,
con [s, N ] = 0. Possiamo allora trovare una g ∈ GL(n, C) tale che δ = gsg −1 sia
diagonale. Poiché det(s) = det(δ) = 1, avremo
 λ1 
e ... 0 0
 ... ..
.
..
.
..
. 
δ=   con λ1 , . . . , λn−1 ∈ C.
0 . . . eλn−1 0 
0 ... 0 e−(λ1 +···+λn−1 )
Posto  
λ1 ... 0 0
 .. ..
.
.. .. 
D= . . . ,
 0 ... λn−1 0 
0 ... 0 −(λ1 + · · · + λn−1 )
otteniamo s = exp(g −1 Dg), con g −1 Dg ∈ sl(n, C). Quindi a = exp(g −1 Dg + N )
con g −1 Dg + N ∈ sl(n, C) e ciò dimostra che l’esponenziale è surgettivo.
Sia ora a ∈ SL(n, C) ⊂ GL(n, C). Possiamo scrivere in modo unico a = u exp(P )
con u ∈ U(n) e P ∈ pn . Otteniamo 1 = det(aa∗ ) = det(exp(2P )), da cui tr(P ) = 0
perché P è diagonalizzabile con autovalori reali. Allora 1 = det(a) = det(u) ci dice
che u ∈ SU(n). Quindi (10.7) è un omeomorfismo e dunque SL(n, C) è omeomorfo
2
al prodotto topologico SU(n) × Rn −1 , in quanto le matrici Hermitiane a traccia
nulla formano uno spazio vettoriale reale di dimensione n2 − 1.

§11 I gruppi O(n) e SO(n)


Il gruppo O(n) è il gruppo delle isometrie lineari e il gruppo SO(n) è il gruppo
delle rotazioni dello spazio Euclideo Rn :
O(n)= {a ∈ GL(n, R) | a t a = t a a = I}
(11.1)
SO(n)= {a ∈ O(n) | det(a) = 1}

Teorema 11.1 Sia n un intero positivo. I due gruppi O(n) e SO(n) sono
sottogruppi compatti di GL(n, R) e hanno la stessa algebra di Lie:

(11.2) o(n) = {X ∈ gl(n, R) | X + t X = 0} .


IX. GRUPPI TOPOLOGICI 153

SO(n) è la componente connessa dell’identità di O(n) e l’applicazione esponenziale:

(11.3) exp : o(n) −


→ SO(n)

è surgettiva. In particolare SO(n) è connesso per archi. Il gruppo O(n) è unione


di due componenti connesse, ciascuna omeomorfa a SO(n).

Dim. Ricordiamo che det(a) = ±1 se a ∈ O(n). Poiché det è un’applicazione


continua, det(exp(X)) = 1 per ogni X che appartenga all’algebra di Lie di O(n).
Questo mostra che O(n) e SO(n) hanno la stessa algebra di Lie.
Se X appartiene all’algebra di Lie di O(n), derivando la relazione

I = exp(tX)(t exp(tX)) = exp(tX) exp(t (t X)) ,

otteniamo che t X + X = 0. Viceversa, se vale questa relazione, abbiamo


exp(tX)(t exp(tX)) = I per ogni t ∈ R. Questo dimostra che o(n) è l’algebra di Lie
di O(n) e di SO(n).
Sia ora a ∈ SO(n). Possiamo decomporre Rn nella somma diretta di sottospazi
Vi di dimensione ≤ 2, due a due ortogonali, tali che a|Vi sia l’identità se Vi ha
dimensione uno, sia una rotazione piana se Vi ha dimensione due.
Basterà quindi osservare che, se θ ∈ R, abbiamo:
   
0 θ cos θ sin θ
(11.4) exp = .
−θ 0 − sin θ cos θ

Questa formula dimostra che exp : o(2) − → SO(2) è surgettiva, e da questa segue
la surgettività nel caso generale.  
−1 0 ... 0
 0 1 ... 0
Osserviamo infine che la moltiplicazione per la matrice 
 ... .. .. ..  è un
. . .
0 0 ... 1
omeomorfismo di SO(n) sull’insieme delle matrici di O(n) con determinante uguale
a −1 e O(n) = SO(n) ∪ {a ∈ O(n) | det(a) = −1}.

Osservazione SO(n) è omeomorfo a S1 mediante l’omemorfismo SO(n) ∋ a − →


a(e1 ) ∈ S1 ove e1 = t (1, 0) è il primo vettore della base canonica di R2 .

§12 L’omomorfismo canonico SU(2) − → SO(3)


Le algebre di Lie su(2) e o(3) hanno entrambe dimensione reale tre. Esse sono
isomorfe tra loro e ad R3 con la struttura di algebra di Lie definita dal prodotto
vettore.
Sia infatti w = t(x, y, z) ∈ R3 . L’applicazione lineare R3 ∋ v −
→ v × w ∈ R3 è
definita dalla matrice:
 
0 z −y
Rw =  −z 0 x  ∈ o(3) .
y −x 0
154 IX. GRUPPI TOPOLOGICI

Si verifica facilmente che [Rw , Rv ] = Rw×v e quindi la corrispondenza w −


→ Rw è
un isomorfimso di algebre di Lie. Definiamo ora
 
3 t 1 iz y + ix
(12.1) λ : R ∋ (x, y, z) −
→ ∈ su(2) .
2 −y + ix −iz
Si verifica che λ è un isomorfismo di (R3 , ×) con su(2). Possiamo allora far operare
SU(2) su R3 mediante la rappresentazione aggiunta: otteniamo un omomorfismo
ρ : SU(2) ∋ u − → λ−1 ◦ Ad(u) ◦ λ ∈ GL(3, R).
Lemma 12.1 Per ogni u ∈ SU(2), ρ(u) ∈ SO(3).

Dim. Abbiamo |v|2 = 2det(λ(v)) per ogni v ∈ R3 . Quindi


|ρ(u)(v)|2 = 2det(uλ(v)u−1 ) = 2det(λ(v)) = |v|2
per ogni v ∈ R3 e ρ(u) ∈ O(3). Poiché SU(2) è connesso, e ρ(0) = I, abbiamo
ρ(u) ∈ SO(3).

Teorema 12.2 L’applicazione ρ : SU(2) − → SO(3) è un omomorfismo surgettivo


di gruppi. Il suo nucleo è il sottogruppo normale {I, −I} ⊂ SU(2).

Dim. La verifica che ρ è un omomorfismo è immediata: infatti ρ(a) = λ−1 Ad(a)λ


e quindi
ρ(a)ρ(b) = λ−1 Ad(a)λλ−1 Ad(b)λ = λ−1 Ad(ab)λ = ρ(ab) .
La surgettività è conseguenza del diagramma commutativo:
exp
su(2) −−−−→ SU(2)
x 
 ρ
λ−1 R−1  y
o(3) −−−−→ SO(3)
exp

in cui le frecce orizzontali sono surgettive e la freccia verticale bigettiva.


Infine, il nucleo di ρ è uguale al nucleo della rappresentazione aggiunta di SU(2)
su su(2). Poiché
  
α β 2 2
(12.2) SU(2) = | α, β ∈ C , |α| + |β| = 1
−β̄ ᾱ
da      
α β iz y + ix ᾱ −β iz y + ix
=
−β̄ ᾱ −y + ix −iz β̄ α −y + ix −iz
per ogni x, y, z ∈ R, segue che α = ±1, β = 0.
Corollario 12.3 Il gruppo topologico SU(2) è omeomorfo a S3 e il gruppo
topologico SO(3) allo spazio proiettivo reale RP3 .

Dim. L’applicazione SU(2) ∋ a − → a(e1 ) ∈ S3 , ove e1 è il primo vettore della


base canonica
. di C2 , definisce un omeomorfismo di SU(2) su S3 . Il quoziente
SU(2) {I, −I} è allora omeomorfo al quoziente di S3 ⊂ C2 rispetto alla relazione
di equivalenza che identifica i punti antipodali di S3 : v ∼ w ⇐⇒ v = ±w.
X. I GRUPPI CLASSICI 155

CAPITOLO X

I GRUPPI CLASSICI

§1 La lista di Cartan
Diamo qui di seguito la lista di Cartan dei gruppi classici di matrici reali e
complesse. Essi sono sottogruppi chiusi del gruppo lineare e sono quindi determinati
dalle rispettive algebre di Lie. Accanto a ciascun gruppo descriviamo la rispettiva
algebra di Lie e la sua dimensione come spazio vettoriale.
Introduciamo le seguenti matrici:
 
1 0 ··· 0
0 1 ··· 0
In = I =
 ... ... .. ..  è la matrice identità n × n;
. .
0 0 ··· 1
 
0 −In
Jn = J = è la matrice simplettica 2n × 2n;
In 0
 
−Ip 0 è la matrice simmetrica canonica
Ipq =
0 Iq di segnatura (p, q).

A. Gruppi di matrici a coefficienti complessi.


1) Gruppo lineare complesso:

GL(n, C) = {g ∈ HomC (Cn , Cn )|det(g) 6= 0}.

Algebra di Lie del gruppo lineare complesso: gl(n, C) = HomC (C, C).
dimC gl(n, C) = n2 .
2) Gruppo lineare speciale complesso.

SL(n, C) = {g ∈ GL(n, C) | det(g) = 1}.

Algebra di Lie del gruppo lineare speciale complesso:

sl(n, C) = {A ∈ gl(n, C) | tr(A) = 0}.

dimC sl(n, C) = n2 − 1.
3) Gruppo unitario:

U (n) = {g ∈ GL(n, C) | g ∗ g = I}.


156 X. I GRUPPI CLASSICI

Algebra di Lie delle matrici antihermitiane:

u(n) = {A ∈ gl(n, C) | A∗ + A = 0}.

dimR u(n) = n2 .
4) Gruppo speciale unitario:

SU (n) = U (n) ∩ SL(n, C).

Algebra di Lie delle matrici antihermitiane a traccia nulla:

su(n) = u(n) ∩ sl(n, C).

dimR su(n) = n2 − 1.
5) Gruppo unitario di segnatura p, q.

U (p, q) = {g ∈ GL(n, C) | g ∗ Ipq g = Ipq }.

Algebra di Lie delle matrici anti-(p, q)-hermitiane:

u(p, q) = {A ∈ gl(n, C) | A∗ Ipq + Ipq A = 0}


  
A11 A12
= | A11 ∈ u(p), A22 ∈ u(q) .
A∗12 A22
dimR u(p, q) = (p + q)2 = n2 .
6) Gruppo speciale unitario di segnatura p, q:

SU (p, q) = U (p, q) ∩ SL(n, C).

Algebra di Lie delle matrici anti-(p, q)-hermitiane a traccia nulla:

su(p, q) = u(p, q) ∩ sl(n, C).

dimR su(p, q) = (p + q)2 − 1 = n2 − 1.


7) Gruppo speciale simplettico:

SU ∗ (2n) = {g ∈ SL(2n, C) | gJ ḡ −1 = J}.

Algebra di Lie speciale simplettica:

su∗ (2n) = {A ∈ sl(2n, C) | AJ − J Ā = 0}

=   
A11 A12
| A11 , A12 ∈ gl(n, C), tr(Re A11 ) = 0 .
−Ā12 Ā11
dimR su∗ (2n) = 4n2 − 1.
8) Gruppo ortogonale complesso:
t
SO(n, C) = {g ∈ SL(n, C) | gg = I}.
X. I GRUPPI CLASSICI 157

Algebra di Lie complessa antisimmetrica:


t
so(n, C) = {A ∈ gl(n, C) | A + A = 0}.

dimC so(n, C) = n(n − 1).


9) Gruppo ortogonale simplettico:

SO∗ (2n, C) = {g ∈ SO(2n, C) | g ∗ Jg = J}.

Algebra di Lie antisimmetrica simplettica:

so∗ (2n, C) = {A ∈ so(2n, C) | A∗ J + JA = 0}


  
A11 A12
= | A12 = A∗12 , A11 ∈ so(n, C) .
−Ā12 Ā11
dimR so∗ (2n, C) = n(2n − 1).
10) Gruppo simplettico complesso:
t
Sp(n, C) = {g ∈ GL(n, C) | gJg = J}.

Algebra di Lie simplettica complessa:


t
sp(n, C) = {A ∈ gl(n, C) | AJ + JA = 0}
  
A11 A12 t t
= | A12 = A12 , A21 = A21 .
A21 −t A11
dimC sp(n, C) = 2n2 + n.
11) Gruppo (p, q)-simplettico:
    
∗ Ipq 0 Ipq 0
Sp(p, q; C) = g ∈ Sp(n, C) | g g= .
0 Ipq 0 Ipq

Il gruppo di Lie associato è

     
∗ Ipq 0 Ipq 0
sp(p, q; C) = A ∈ sp(n, C) | A + A=0 .
0 Ipq 0 Ipq

Le matrici in sp(p, q; C) sono della forma:


 
A11 A12 A13 A14
 A∗ A22 t
A14 A24 
A =  12 
−Ā13 Ā14 Ā11 −Ā12
A∗14 −Ā24 −t A12 Ā22
con
A11 , A13 di ordine p,
A12 , A14 matrici p × q,
158 X. I GRUPPI CLASSICI

A22 , A24 di ordine q,


A11 ∈ u(p), A22 ∈ u(q),
t t
A13 = A13 , A24 = A24 .
dimR sp(p, q; C) = 2n2 + n, con p + q = n.
12) Gruppo unitario simplettico:

Sp(n) = Sp(n, C) ∩ U (2n).

La sua algebra di Lie è:


sp(n) = sp(n, C) ∩ u(2n)
  
A11 A12 t
= | A11 ∈ u(n), A12 = A12 .
−A∗12 −t A11
dimR sp(n) = 2n2 + n.

B. Gruppi di matrici a coefficienti reali.


1) Gruppo lineare reale:

GL(n, R) = {g ∈ HomR (Rn , Rn ) | det(g) 6= 0}.

La sua algebra di Lie è


gl(n, R) = HomR (Rn , Rn ).
dimR gl(n, R) = n2 .
2) Gruppo lineare speciale reale:

SL(n, R) = {g ∈ GL(n, R) | det(g) = 1}.

La sua algebra di Lie è:

sl(n, R) = {A ∈ gl(n, R) | tr(A) = 0}.

dimR sl(n, R) = n2 − 1.
3) Gruppo ortogonale:
t
O(n) = {g ∈ GL(n, R) | gg = I}.

La sua algebra di Lie è


t
o(n) = {A ∈ gl(n, R) | A + A = 0}.

dimR o(n) = n(n − 1)/2.


4) Gruppo ortogonale speciale, o gruppo delle rotazioni:

SO(n) = O(n) ∩ SL(n, R).

La sua algebra di Lie è la stessa del gruppo ortogonale.


160 X. I GRUPPI CLASSICI

5) Gruppo ortogonale di segnatura p, q:

O(p, q) = U (p, q) ∩ GL(n, R).

La sua algebra di Lie è:


o(p, q) = u(p, q) ∩ gl(n, R)
è composta dalle matrici della forma:
 
A11 A12
A= t
A12 A22

con
A11 ∈ o(p), A22 ∈ o(q), A12 matrice p × q reale.
dimR o(p, q) = n(n − 1)/2 con p + q = n.
6) Gruppo simplettico:

Sp(n, R) = Sp(n, C) ∩ GL(2n, R).

La sua algebra di Lie è

sp(n, R) = sp(n, C) ∩ gl(2n, R).

dimR sp(n, R) = n2 + n.
XI. PROPRIETÀ DEI GRUPPI CLASSICI 161

CAPITOLO XI

PROPRIETÀ TOPOLOGICHE DEI GRUPPI CLASSICI

§1 Decomposizione di Cartan dei gruppi di matrici


Un sottogruppo G di GL(n, C) si dice pseudoalgebrico se può essere definito
mediante equazioni

(1.1) f1 (g, g ∗ ) = 0, . . . , fN (g, g ∗ ) = 0

dove f1 , . . . , fN sono polinomi a coefficienti reali nelle parti reali e immaginarie dei
coefficienti di g ∈ GL(n, C). I sottogruppi pseudoalgebrici sono ovviamente chiusi.
Vale il seguente
Teorema 1.1 Sia G un sottogruppo pseudoalgebrico di GL(n, C). Se vale la
proprietà:

(1.2) g ∈ G =⇒ g ∗ ∈ G

allora l’applicazione:

(1.3) (G ∩ U(n)) × (g ∩ pn ) ∋ (u, X) −


→ u exp(X) ∈ G ,

ove g è l’algebra di Lie di G, è un omeomorfismo.

Dim. Ogni elemento g ∈ G ⊂ GL(n, C) si decompone in modo unico nel prodotto


di una matrice unitaria u ∈ U(n) e di una matrice Hermitiana definita positiva
p ∈ Pn : g = u ◦ p. Per dimostrare il teorema, basterà verificare che u, p ∈ G.
Poiché abbiamo supposto che g ∗ = p ◦ u∗ = p ◦ u−1 ∈ G, anche p2 = g ∗ g
appartiene al gruppo G. Sia B l’unico elemento di pn tale che p = exp(B) e sia
a ∈ U(n) tale che u ◦ B ◦ u−1 sia in forma diagonale:
 
θ1 . . . 0
. .
u ◦ B ◦ u−1 =  .. . . . .. 
0 . . . θn
con θi ∈ R per i = 1, . . . , n. Osserviamo che ad(a)(G) è ancora un sottogruppo
pseudoalgebrico di GL(n, C); quindi le matrici diagonali reali di ad(a)(G) formano
ancora un sottogruppo pseudoalgebrico Q di GL(n, C). Esistono  quindi polinomi

ξ1 . . . 0
 . . 
g1 , ..., gM ∈ R[x1 , . . . , xn ] tali che la matrice diagonale reale  .. . . . ..  ap-
0 . . . ξn
partiene a Q se e soltanto se g1 (ξ1 , . . . , ξn ) = 0, . . ., gM (ξ1 , . . . , ξn ) = 0. Otteniamo
allora 
gj e2kθ1 , . . . , e2kθn = 0 per j = 1, . . . , M , ∀k ∈ Z .
162 XI. PROPRIETÀ DEI GRUPPI CLASSICI

Per concludere la dimostrazione utilizziamo il seguente:

Lemma 1.2 Sia f : R −


→ R un esponenziale-polinomio della forma:


X
f (t) = c j dbj t t ∈ R,
j=1

con cj , bj ∈ R e bi 6= bj se i 6= j. Se f si annulla per ogni t ∈ Z \ {0}, allora f si


annulla per ogni t ∈ R.

Dim. Poniamo ξj = ebj , per 1 ≤ j ≤ ℓ. Consideriamo la matrice:

ξ ξ2 ξ3 ... ξℓ 
1
 ξ12 ξ22 ξ32 ... ξℓ2 
 3
ξ23 ξ33 ξℓ3  .

 ξ1
M (ξ1 , . . . , ξℓ ) =  ...
 .. .. .. ..
.
.. 

. . . .
ξ1ℓ ξ2ℓ ξ3ℓ ... ξℓℓ

Il suo determinante è:


Y
det(M (ξ1 , . . . , ξℓ ) = ξ1 · · · ξℓ ξ1 (ξj − ξi ) .
1≤i<j≤ℓ

Infatti det(M (ξ1 , . . . , ξℓ ) = ξ1 · · · ξℓ · det(V (ξ1 , . . . , ξℓ )), dove V (ξ1 , . . . , ξℓ )) è la


matrice di Vandermonde:
1 1 1 ... 1
 ξ1 ξ2 ξ3 ... ξℓ 
 2
ξ22 ξ32 ξℓ2  .

V (ξ1 , . . . , ξℓ )) =  ξ ...
 .1 .. .. .. .. 
 . . 
. . . .
ξ1ℓ ξ2ℓ ξ3ℓ ... ξℓℓ

In particolare, M (ξ1 , . . . , ξℓ ) è una matrice invertibile e la relazione


(c1 , . . . , cℓ )M (ξ1 , . . . , ξℓ ) = 0 implica che c1 = 0, . . ., cℓ = 0.

Concludiamo la dimostrazione del teorema. Per il lemma appena dimostrato,


tθ1 tθn
otteniamo le relazioni gj e , . . . , e = 0 implicano che exp(t(aBa∗ )) ∈ Q per
ogni t ∈ R. Quindi B ∈ pn ∩g; abbiamo allora p ∈ G e dunque anche u ∈ G∩U(n).
L’applicazione (G ∩ U(n)) × (G ∩ Pn ) ∋ (u, p) − → u ◦ p ∈ G è continua e surgettiva
∗ −1/2
e ha inversa continua G ∋ g −→ (g ◦ (g g) , (g ∗ g)1/2 ) ∈ (G ∩ U(n)) × (G ∩ Pn )
e quindi è un omeomorfismo.

Nello studio della struttura topologica di un gruppo classico G ⊂ GL(n, C)


seguiremo quindi il seguente procedimento:
(1) Verificheremo che g ∈ G =⇒ g ∗ ∈ G ;
(2) Calcoleremo g ∩ pn ;
(3) Studieremo la struttura del sottogruppo compatto G ∩ U(n).
XI. PROPRIETÀ DEI GRUPPI CLASSICI 163

Osserviamo ancora che l’algebra di Lie del sottogruppo chiuso G ∩ U(n) è g ∩ u(n)
e che l’applicazione esponenziale

g ∩ u(n) ∋ X −
→ exp(X) ∈ G ∩ U(n)

ha come immagine la componente connessa dell’identità di G ∩ U(n). Infatti vale


il:

Teorema 1.3 (Cartan-Weyl-Hopf) Se G è un sottogruppo connesso e com-


patto di GL(n, C), allora l’applicazione exp : g −
→ G è surgettiva.
Non diamo la dimostrazione di questo teorema. Ricaveremo il risultato di volta in
volta nei singoli casi in esame.

§2 I gruppi U (p, q) e SU (p, q)

Lemma 1. Se g ∈ U (p, q), allora g ∗ ∈ U (p, q).

Dim.. Per la definizione del gruppo U (p, q) , abbiamo

g ∗ Ip,q = Ip,q g −1 .

Da questa otteniamo, passando alle inverse:

(g ∗ )∗ Ip,q = gIp,q = Ip,q (g ∗ )−1

e quindi g ∗ ∈ U (p, q).

Lemma 2. U (p, q) ∩ U (n) ∼


= U (p) ⊲⊳ U (q).
Dim.. Scriviamo un elemento g ∈ U (p, q) ∩ U (n) nella forma
 
a c
g=
d b

con matrici a di tipo p × p, b di tipo q × q, c di tipo p × q, d di tipo q × p. Poiché


g ∈ U (p, q), abbiamo

a∗ a − d∗ d = Ip , a∗ c = d∗ b, b∗ b − c∗ c = Iq .

Essendo g ∈ U (n), abbiamo anche:

a∗ a + d∗ d = Ip , a∗ c + d∗ b = 0, b∗ b + c∗ c = Iq .

Da queste uguaglianze ricaviamo

c = 0, d = 0

da cui segue la tesi.


164 XI. PROPRIETÀ DEI GRUPPI CLASSICI

Corollario. SU (p, q) ∩ U (n) è omeomorfo al prodotto topologico SU (p) ×


SU (q) × S 1 .
Dim.. Se σ ∈ C, indichiamo con δ1 (σ) la matrice diagonale
 
σ 0 ··· 0
0 1 ··· 0
δ1 (σ) =  .
. . ··· .
0 0 ··· 1

L’applicazione
 
1 δ1 (σ)a 0
SU (p) × SU (q) × S ∋ (a, b, σ) −→ ∈ SU (p, q) ∩ U (n)
0 δ1 (σ)−1 b

è continua e bigettiva e dunque un omeomorfismo perché i due spazi sono compatti


di Hausdorff.
Teorema 2.1 SU (p, q) è omeomorfo al prodotto topologico

SU (p) × SU (q) × S 1 × Cpq .

U (p, q) è omeomorfo al prodotto topologico SU (p, q) × S 1 . I due gruppi sono


pertanto connessi per archi ma non compatti se pq 6= 0.

Dim.. Data g ∈ SU (p, q), possiamo decomporla in modo unico in un prodotto

(1) g = ab con a ∈ U (n) e b ∈ P (n)

dove ricordiamo che P (n) è l’insieme delle matrici hermitiane definite positive.
Per il Lemma 1, è g ∗ ∈ SU (p, q) e dunque

g ∗ g = b∗ a∗ ab = b∗ b = b2 ∈ SU (p, q).

Scriviamo
b = Exp(B)
con  
B11 B12
B= ∗ ,
B12 B22
B11 hermitiana p × p, B12 matrice complessa p × q, B22 hermitiana q × q. Abbiamo
allora
Exp(2B)Ip,q = Ip,q Exp(−2B).
Poiché l’esponenziale è un’applicazione bigettiva dallo spazio vettoriale reale delle
matrici hermitiane all’insieme delle matrici hermitiane definite positive, dall’ugua -
glianza:
Ip,q Exp(2B)Ip,q = Exp(−2B)
ricaviamo che
Ip,q BIp,q = −B.
XI. PROPRIETÀ DEI GRUPPI CLASSICI 165

Questa equazione ci dà:


B11 = 0, B22 = 0.
Viceversa, se
 
0 B12
(2) B= ∗
B12 0

allora b = Exp(B) ∈ SU (p, q). Le matrici della forma (2) formano uno spazio
vettoriale reale L di dimensione 2pq. Osserviamo infine che, nella decomposizione
(1), essendo b ∈ SU (p, q), è a ∈ SU (p, q) ∩ U (n).
Abbiamo ottenuto in questo modo un omeomorfismo

(SU (p, q) ∩ U (n)) × L ∋ (a, B) −→ aExp(B) ∈ SU (p, q)

che, in virtù del lemma precedente, definisce un omeomorfismo di SU (p) × SU (q) ×


S 1 × Cpq su SU (p, q). Infine, l’applicazione

SU (p, q) × S 1 ∋ (g, σ) −→ δ1 (σ)g ∈ U (p, q)

è un omeomorfismo. La dimostrazione è completa.

§3 Il gruppo Sp(n) = Sp(n, C) ∩ U (2n)


Ricordiamo che il corpo (non commutativo) H dei quaternioni di Hamilton si
può identificare all’anello associativo delle matrici 2 × 2 a coefficienti complessi:
 
z w
(1) ,
−w̄ z̄

con z, w ∈ C. Identifichiamo un numero complesso z con la matrice


 
z 0
0 z̄

e indichiamo con j la matrice  


0 1
.
−1 0
La matrice (1) si può allora associare all’espressione

z + wj = z + j w̄.

Nel seguito scriveremo di preferenza un quaternione nella forma z+jw con z, w ∈ C.


Il prodotto di due quaternioni si può allora esprimere mediante:

(z1 + jw1 ) · (z2 + jw2 ) = (z1 z2 − w̄1 w2 ) + j(w1 z2 + z̄1 w2 ) ∀z1 , z2 , w1 , w2 ∈ C.

Questa formula si ricava immediatamente da:

jz = z̄j ∀z ∈ C
166 XI. PROPRIETÀ DEI GRUPPI CLASSICI

e
j 2 = −1.
Il coniugato di un quaternione (corrispondente all’aggiunta della matrice con cui è
definito) è dato da:
z + jw = z̄ − jw.
Indichiamo con σ l’isomorfismo:

C2n ∋ (z h , wh )1≤h≤n −→ (z h + jwh )1≤h≤n ∈ Hn .

Allora
σ −1 jσ = J
dove J è la matrice 2n × 2n:
 
0 −I
J= .
I 0

e abbiamo indicato con I l’identità su Cn .


Consideriamo una matrice B = C + jD = (Chk + jDhk )1≤h,k≤n con coefficienti
Chk + jDhk ∈ H, Chk , Dhk ∈ C. Se u = v + jw ∈ Hn , con v, w ∈ Cn , abbiamo

Bu = (Cv − D̄w) + j(Dv + C̄v).

Ad essa risulta dunque associata una B̃ ∈ HomC (C2n , C2n ) rappresentata dalla
matrice:  
C D
B̃ = .
−D̄ C̄
Le matrici di questa forma sono tutte e sole le matrici 2n × 2n complesse A che
soddisfano la:
AJ = J Ā.
Ricordiamo ora che, se g ∈ Sp(n, C), abbiamo:
t
gJg = J.

Se inoltre g ∈ U (2n), è g ∗ = g −1 , da cui


t
g = ḡ −1 .

Otteniamo perciò la condizione:


gJ = J ḡ.
Abbiamo dunque un’inclusione naturale

Sp(n) ֒→ GL(n, H).

Possiamo allora caratterizzare Sp(n) come il gruppo delle trasformazioni H-lineari


su Hn , che lasciano invariato il prodotto scalare sui quaternioni:
n
X
(u1 |u2 )H = uh1 ūh2 .
h=1
XI. PROPRIETÀ DEI GRUPPI CLASSICI 167

Se scriviamo le componenti uhl nella forma vlh + jwlh con vlh , wlh ∈ C per l = 1, 2,
troviamo per il prodotto scalare sui quaternioni l’espressione:
n
X n
X
(u1 |u2 )H = v1h v̄2h + w̄1h w2h +j w1h v̄2h − v̄1h w2h .
h=1 h=1

Una g ∈ U (2n) lascia invariato il primo addendo, una g ∈ Sp(n, C) lascia invariato
il secondo. Infatti il primo addendo si può scrivere:
   
v1 v2
w̄1 w̄2 C

e il secondo, moltiplicato a sinistra per j, mediante


t
   
v̄1 v̄2
J .
w1 w2

Sia K uno dei corpi R, C, H e indichiamo con e1 , · · · , en la base canonica di Kn .


Possiamo allora identificare O(n − 1), SO(n − 1), U (n − 1), SU (n − 1), Sp(n − 1) ai
sottogruppi rispettivamente di O(n), SO(n), U (n), SU (n), Sp(n) che lasciano fisso
il vettore e1 . Abbiamo allora i seguenti omeomorfismi:
Teorema 3.1
U (1) ∼
= S1.
Sp(1) ∼
= S3.
= SO(n)/SO(n − 1) ∼
O(n)/O(n − 1) ∼ = S n−1 se n > 1.
U (n)/U (n − 1) ∼
= SU (n)/SU (n − 1) ∼
= S 2n−1 se n > 1.
Sp(n)/Sp(n − 1) ∼
= S 4n−1 se n > 1 .

Dim. In ciascuno dei casi l’omeomorfismo si ottiene per passaggio al quoziente


dall’applicazione
g −→ ge1 .
Poiché i guppi considerati sono compatti, si deduce immediatamente che i quozienti
iniettivi sono omeomorfismi.

Teorema 3.2 Per ogni intero n ≥ 1 i gruppi Sp(n) sono compatti e connessi.

Dim.. Osserviamo che Sp(n) è compatto in quanto sottospazio topologico chiuso


di U (2n), che è compatto. Dimostriamo che è connesso per induzione su n. Per
n = 1 Sp(1) è omeomorfo a S 3 e quindi connesso. Sia ora m > 1 e supponiamo il
teorema vero per n = m−1. Le classi di equivalenza di Sp(m)/Sp(m−1) sono allora
insiemi connessi. Ne segue che un insieme contemporaneamente aperto e chiuso in
Sp(m) è saturo e dunque Sp(m) è connesso in quanto il quoziente è connesso.
Osserviamo che Sp(n) è localmente connesso per archi, in quanto l’applicazione

Exp : sp(n) −→ Sp(n)


168 XI. PROPRIETÀ DEI GRUPPI CLASSICI

definisce un omeomorfismo di un intorno di 0 in sp(n) su un intorno di e in Sp(n):


Sp(n) è dunque localmente connesso per archi e perciò connesso per archi in quanto
connesso.

Teorema 3.3 U (n) è omeomorfo a SU (n) × S 1 . In particolare U (2) ∼


= S3 × S1.

Dim.. Definiamo l’applicazione

U (n) ∋ g −→ (δ1 (det(g))−1 g, det(g)) ∈ SU (n) × S 1 .

Essa è continua e bigettiva tra spazi compatti di Hausdorff e dunque un omeomor-


fismo.

§4 I gruppi Sp(n, C) e SU ∗ (2n)


Lemma. Se g ∈ Sp(n, C), allora g ∗ ∈ Sp(n, C).
Dim.. Abbiamo
t
gJg = J
e dunque
t −1
Jg = g J
da cui, passando alle inverse:
g −1 J = J t
g.
Passando ai coniugati, otteniamo:

ḡ −1 J = Jg ∗

da cui
t ∗
g Jg ∗ = J
e dunque g ∗ ∈ Sp(n, C).

Teorema 4.1 Sp(n, C) è omeomorfo a Sp(n) × Rn(2n+1) .

Dim.. Sia g ∈ Sp(n, C). Possiamo decomporre g in modo unico nella forma:

g = ab con a ∈ U (2n) e b ∈ P (2n).

Poiché g ∗ ∈ Sp(n, C), otteniamo

b∗ a∗ ab = b∗ b = b2 ∈ Sp(n, C).

La b si può rappresentare in modo unico come esponenziale di una matrice hermi-


tiana B:
b = Exp(B) B = B ∗ .
XI. PROPRIETÀ DEI GRUPPI CLASSICI 169

Abbiamo allora

−JExp(2B)J = Exp(J −1 2BJ) = Exp(−2 t


B)

ed essendo questa un’uguaglianza tra esponenziali di matrici hermitiane otteniamo


che
−JBJ = − t B.
Scriviamo B nella forma  
B11 B12
B= ∗
B12 B22
con Bhk matrici complesse n × n, B11 e B22 hermitiane. Otteniamo allora le
uguaglianze:
B11 = − t B22
t
B12 = B12 .
La matrice B è dunque della forma
 
B11 B12
(1) B= ∗
B12 −B̄11

con B11 hermitiana e B12 simmetrica. Viceversa, l’esponenziale di una matrice B


di questa forma è un elemento di Sp(n, C). Le matrici della forma (1) formano uno
spazio vettoriale reale L di dimensione n2 + n(n + 1) = n(2n + 1) e dunque la tesi
segue dall’omeomorfismo:

Sp(n) × L ∋ (a, B) −→ aExp(B) ∈ Sp(n, C).

2
Teorema 4.2 Il gruppo SU ∗ (2n) è omeomorfo a Sp(n) × R2n −n−1
.

Dim.. Ricordiamo che g ∈ SU ∗ (2n) se g ∈ SL(2n, C) e

Jg = ḡJ.

Ne segue che, se g ∈ SU ∗ (2n) ∩ U (2n) abbiamo

t
gJg = J

e dunque g ∈ Sp(n).
Si verifica immediatamente che g ∗ ∈ SU ∗ (2n) se g ∈ SU ∗ (2n) e dunque possiamo
ripetere il ragionamento fatto nella dimostrazione del teorema precedente: dopo
aver decomposto g mediante

g = ab con a ∈ U (2n) e b ∈ P (2n)

osserviamo che
b∗ b = b2 ∈ SU ∗ (2n).
170 XI. PROPRIETÀ DEI GRUPPI CLASSICI

Dopo aver scritto b come l’esponenziale di una matrice hermitiana B, troviamo che
le B devono appartenere allo spazio vettoriale reale L di dimensione 2n2 − n − 1)
delle matrici della forma:  
B11 B12
B= ∗
B12 B̄11
con B11 matrice n × n hermitiana con traccia nulla e B12 matrice n × n complessa
antisimmetrica: t B12 = −B12 . L’omeomorfismo

Sp(n) × L ∋ (a, B) −→ aExp(B) ∈ SU ∗ (2n)

dimostra allora la tesi.

§5 I gruppi SO(n, C) e SO∗ (n, C)


2
Teorema 5.1 SO(n, C) è omeomorfo a SO(n) × R(n −n)/2
.

Dim.. Osserviamo in primo luogo che l’aggiunta g ∗ di un elemento g di SO(n, C


è ancora un elemento del gruppo. Infatti le equazioni che definiscono il gruppo
sono:
det(g) = 1, t gg = I.
Un elemento g di SO(n, C) ∩ U (n) soddisfa
t
g = g −1 = g ∗

e dunque è una matrice a coefficienti reali. Otteniamo perciò:

SO(n, C) ∩ U (n) = SO(n).

Decomponiamo g ∈ SO(n, C) in modo unico mediante

g = ab con a ∈ U (n) e b ∈ P (n).

Ricaviamo che

a ∈ SO(n, C) ∩ U (n) e b ∈ SO(n, C) ∩ P (n)

e che gli elementi di SO(n, C) ∩ P (n) sono tutti e soli gli esponenziali delle matrici
dello spazio vettoriale reale L di dimensione (n2 − n)/2:
t
L = {B|B hermitiana e B = −B}

cioè delle matrici a coefficienti puramente immaginari antisimmetriche. La tesi


segue come nelle dimostrazioni dei teoremi precedenti.
2
Teorema 5.2 SO∗ (2n, C) è omeomorfo a U (n) × Rn −n
.

Dim.. Dimostriamo in primo luogo che il gruppo SO∗ (2n, C)∩U (2n) è isomorfo,
come gruppo topologico, a U (n). Infatti, per un elemento g di tale gruppo, valgono
le equazioni:
t
gg = I, g ∗ Jg = J, g ∗ g = I, det(g) = 1.
XI. PROPRIETÀ DEI GRUPPI CLASSICI 171

La prima e la terza di queste equazioni ci dicono che g è una matrice reale di


SO(2n). La seconda ci dice allora che g commuta con J e dunque è C-lineare per
la struttura complessa su R2n definita da J. Si verifica facilmente che, se definiamo
l’isomorfismo R-lineare σ : R2n −→ Cn mediante

σ(ek ) = ek per 1 ≤ k ≤ n e σ(Jek ) = σ(ek+n ) = iek

l’applicazione

SO∗ (2n, C) ∩ U (2n) ∋ g −→ σ ◦ g ◦ σ −1 ∈ U (n)

è un isomorfismo di gruppi topologici. Per concludere la dimostrazione, osserviamo


che il gruppo SO∗ (2n, C) è chiuso rispetto all’aggiunzione e dunque, dalla decom-
posizione
g = ab con a ∈ U (2n) e b ∈ P (2n)
deduciamo che b2 ∈ SO∗ (2n, C). Troviamo allora che b = Exp(B) dove B è
univocamente determinata come un elemento dello spazio vettoriale reale L di
dimensione n2 − n delle matrici:
 
B11 B12
B= con B11 , B12 hermitiane puramente immaginarie}.
B12 −B11

L’omeomorfismo cercato segue nel modo standard.

§6 I gruppi Sp(p, q; C)
Teorema 6.1 Abbiamo l’omeomorfismo

Sp(p, q) ∼
= Sp(p) × Sp(q) × R4pq .

Dim.. Ricordiamo che il gruppo Sp(p, q; C) è caratterizzato dalle equazioni:


t
gJg = I,
   
∗ Ip,q 0 Ip,q 0
g g= .
0 Ip,q 0 Ip,q
Come abbiamo visto in precedenza, possiamo considerare un elemento
g ∈ Sp(p, q; C) ∩ U (2n) ⊂ Sp(n) come un elemento di GL(n, H). Scriviamo g̃
per la matrice a coefficienti quaternioni corrispondente a g. Troviamo allora: se
g ∈ Sp(p, q; C), allora
g̃ ∗ g̃ = I
g̃ ∗ Ip,q g = Ip,q .
Si ottiene quindi
 
g1 0
g̃ = con g1 ∈ Sp(p), g2 ∈ Sp(q).
0 g2
172 XI. PROPRIETÀ DEI GRUPPI CLASSICI

D’altra parte abbiamo al solito l’invarianza di Sp(p, q; C) rispetto all’aggiunzione.


Dalla decomposizione standard di g ∈ GL(n, C) nel prodotto di una matrice unitaria
e di una hermitiana definita positiva, troviamo un omeomorfismo
 
g1 0
Sp(p) × Sp(q) × L ∋ (g1 , g2 , B) −→ Exp(B) ∈ Sp(p, q; C)
0 g2

ove in questo caso L è uno spazio vettoriale reale di dimensione 4pq di matrici
hermitiane. Le matrici di L hanno la forma:
 
0 B12 0 B14
∗ t
 B12 0 B14 0 
B= 
0 B̄14 0 −B̄12

B14 0 −t B12 0

con B12 e B14 matrici complesse di tipo p × q.

§7 I gruppi SO(p, q)

Teorema 7.1 Siano p, q due interi positivi con p + q = n. Allora il gruppo


SO(p, q) è omeomorfo a {−1, 1} × SO(p) × SO(q) × Rpq .

Dim.. Ragioniamo come nella dimostrazione dei teoremi precedenti. Ricaviamo


in primo luogo che SO(p, q) ∩ U (n) è formato dalle matrici:
 
g1 0
g=
0 g2

con g1 ∈ O(p), g2 ∈ O(q) e det(g1 )det(g2 ) = 1.


Quindi abbiamo l’omeomorfismo:

SO(p, q) ∩ U (n) ∼
= {−1, 1} × SO(p) × SO(q).

D’altra parte SO(p, q) ∩ P (n) è l’immagine iniettiva mediante l’applicazione espo-


nenziale delle matrici  
0 B12
B= t
B12 0
ove B12 è una matrice reale p × q. Usando la decomposizione degli elementi di
GL(n) in prodotto di unitarie e hermitiane positive, si ottiene la tesi.
XII. OMOTOPIA 173

CAPITOLO XII

OMOTOPIA

§1. Omotopia libera di applicazioni continue.


Siano f0 , f1 : X −→ Y applicazioni continue tra due spazi topologici X, Y .
Diciamo che f0 e f1 sono omotope se è possibile trovare un’applicazione continua:

F : X × I −→ Y

(I = [0, 1]), tale che

F (x, 0) = f0 (x) e F (x, 1) = f1 (x) ∀x ∈ X.

La F si dice un’omotopia tra f0 e f1 . Osserviamo che un’omotopia F definisce


un’applicazione continua

I ∋ t −→ Ft = F (·, t) ∈ C(X, Y )

dall’intervallo I allo spazio C(X, Y ) delle funzioni continue da X in Y su cui si


consideri la topologia compatta-aperta. Viceversa, se X è uno spazio di Hausdorff
localmente compatto un’applicazione continua

I ∋ t −→ Ft ∈ C(X, Y )

definisce un’omotopia tra F0 e F1 . In questo caso, data una funzione continua


f : X −→ Y , l’insieme delle funzioni g ∈ C(X, Y ) omotope a f è la componente
connessa per archi di f in C(X, Y ).
Proposizione 1.1. L’omotopia è una relazione di equivalenza in C(X, Y ) .
Dim. Scriviamo f ∼ g per indicare che due funzioni f, g ∈ C(X, Y ) sono omo-
tope. Verifichiamo che questa è una relazione di equivalenza. Intanto è f ∼ f
mediante l’omotopia costante

X × I ∋ (x, t) −→ f (x) ∈ Y.

Se
F : X × I −→ Y
è un’omotopia tra f e g, allora

X × I ∋ (x, t) −→ F (x, 1 − t) ∈ Y

è un’omotopia tra g ed f . Quindi

f ∼ g ⇐⇒ g ∼ f.
174 XII. OMOTOPIA

Se inoltre
G : X × I −→ Y
è un’omotopia tra g ed h, allora la

F (x, 2t) se t ∈ [0, 1/2]
H(x, t) =
F (x, 2t − 1) se t ∈ [1/2, 1]
definisce un’omotopia tra f e h. Dunque
f ∼ g e g ∼ h =⇒ f ∼ h.

Indichiamo con π(X, Y ) il quoziente di C(X, Y ) rispetto all’equivalenza omoto-


pica. Questo insieme si dice l’omotopia libera delle applicazioni continue di X in
Y.
Proposizione 1.2. Siano X, Y, V, W spazi topologici e ϕ : V −→ X, ψ : Y −→
W due applicazioni continue. L’applicazione:
ψ∗ ϕ∗ : C(X, Y ) ∋ f −→ ψ ◦ f ◦ ϕ ∈ C(V, W )
definisce per passaggio al quoziente un’applicazione
π(ϕ, ψ) : π(X, Y ) −→ π(V, W ).

§2. Equivalenza omotopica di spazi topologici.


Due applicazioni continue
f : X −→ Y
e
g : Y −→ X
si dicono omotopicamente inversa l’una dell’altra se
g ◦ f ∼ idX in π(X, X)
e
f ◦ g ∼ idY in π(Y, Y ).
Diciamo allora che f e g sono equivalenze omotopiche. Due spazi topologici X e Y
tra i quali si possa stabilire una equivalenza omotopica si dicono omotopicamente
equivalenti o dello stesso tipo di omotopia.
L’equivalenza omotopica è una relazione di equivalenza nella categoria degli spazi
topologici. Si dimostra facilmente la seguente:
Proposizione 2.1. Siano X, Y , Z spazi topologici e ϕ : X −→ Y , ψ : Y −→ Z
due applicazioni continue. Se due delle applicazioni continue ϕ, ψ, ψ ◦ ϕ sono
equivalenze omotopiche, anche la terza lo è.
Se X, Y , V , W sono spazi topologici e ϕ : V −→ X, ψ : Y −→ W sono due
equivalenze omotopiche, allora
π(ϕ, ψ) : π(X, Y ) −→ π(V, W )
è un’applicazione bigettiva.

§3. Spazi topologici contrattili.


Uno spazio topologico X si dice contrattile se idX è omotopicamente equivalente
a un’applicazione costante in π(X, X).
XII. OMOTOPIA 175

Proposizione 3.1. Uno spazio topologico è contrattile se e soltanto se ha lo


stesso tipo di omotopia dello spazio formato da un solo punto.
Dim. Indichiamo con D0 (disco 0-dimensionale) lo spazio formato da un solo
punto. Siano
f : D0 −→ X
g : X −→ D0
omotopicamente inverse l’una dell’altra. Allora

f ◦ g : X −→ X

è costante e omotopicamente equivalente a idX . Viceversa, se

ϕ : X −→ X

è un’applicazione costante omotopicamente equivalente a idX , definiamo

f : D0 −→ X

mediante
f (D0 ) = ϕ(X)
e consideriamo l’unica applicazione

g : X −→ D0 .

Poiché f ◦ g = ϕ, la f e la g sono equivalenze omotopiche.


Osservazione. Uno spazio topologico contrattile è connesso per archi.
Dim. Sia
F : X × I −→ X
un’omotopia tra l’identità su X e un’applicazione costante. Allora, per ogni coppia
di punti x, y ∈ X, 
F (x, 2t) se t ∈ [0, 1/2]
α(t) =
F (y, 2 − 2t) se t ∈ [1/2, 1]
definisce un cammino continuo che congiunge x a y.
Proposizione 3.2. Sia X uno spazio topologico contrattile. Allora, per ogni
spazio topologico Y , π(Y, X) contiene un solo elemento.
Dim. Se f : D0 −→ X è un’equivalenza omotopica, allora

π(idY , f ) : π(Y, X) −→ π(Y, D0 )

è bigettiva. Il secondo insieme contiene un solo elemento e dunque la tesi è dimo-


strata.
In particolare, due qualsiasi applicazioni costanti di uno spazio contrattile in sè
sono omotopicamente equivalenti.
176 XII. OMOTOPIA

Osservazione. Se X è uno spazio topologico contrattile e Y un qualsiasi spazio


topologico,allora π(X, Y ) è in corrispondenza biunivoca con le componenti connesse
per archi di Y . Infatti, per ogni f : X −→ Y continua, f (X) è contenuta in
una componente connessa per archi di Y , univocamente determinata dalla classe di
omotopia dell’applicazione f .

§4. Omotopia legata. Retratti di deformazione.


Sia (X, A) una coppia topologica (X è uno spazio topologico e A un suo sotto-
spazio). Dato uno spazio topologico Y, un’omotopia

F : X × I −→ Y

si dice legata su A, o A-omotopia, se

F (x, t) = F (x, 0) ∀x ∈ A, ∀t ∈ I.

La relazione di A-omotopia è una relazione di equivalenza su C(X, Y ) e il relativo


quoziente si indica con πl (X, A; Y ). Fissata un’applicazione continua ϕ : A −→ Y ,
indichiamo con π(X,
 Y ; ϕ)
l’immagine in πl (X, A; Y ) dell’insieme
f ∈ C(X, Y ) f A = ϕ .
Un sottospazio A di uno spazio topologico X si dice un suo retratto di deforma-
zione se possiamo trovare una retrazione

̺ : X −→ A

(cioè un’applicazione continua a valori in A con ̺|A = idA ) tale che l’applicazione
composta:
̺ ι
X− →A− →X
sia omotopa all’identità su X.
Diciamo che A è un retratto di deformazione stretto di X se l’applicazione
composta
̺ ι
X− →A− →X
è A-omotopa a idX , se cioè possiamo trovare un’omotopia

F : X × I −→ X

tra ̺ ◦ ι e idX con:


F (x, t) = x ∀x ∈ A, ∀t ∈ I.

§5. Omotopia relativa.


Le nozioni precedenti si possono generalizzare alla situazione seguente: dati due
spazi topologici X, Y e sottospazi A1 , · · · An di X e B1 , · · · , Bn di Y , indichiamo
con
C(X, A1 , · · · , An ; Y, B1 , · · · , Bn )
lo spazio delle funzioni continue f : X −→ Y tali che

f (Ai ) ⊂ Bi ∀i = 1, · · · , n.
XII. OMOTOPIA 177

Chiamiamo omotopia relativa alle (n + 1)-uple (X, A1 , · · · An ) e (Y, B1 , · · · , Bn )


un’omotopia
F : X × I −→ Y
tale che
F (Ai × I) ⊂ Bi ∀i = 1, · · · , n.
L’omotopia relativa definisce una relazione di equivalenza su
C(X, A1 , · · · , An ; Y, B1 , · · · , Bn ). Denotiamo il relativo quoziente con

π(X, A1 , · · · , An ; Y, B1 , · · · , Bn )

§6. k-connessione.
Useremo in Rn coordinate x0 , · · · , xn−1 e indicheremo con e0 , · · · , en−1 i vettori
della base canonica. Definiamo:
D0 = {0}
Dn = {x ∈ Rn | |x| ≤ 1} se n > 0,
S n = {x ∈ Rn+1 | |x| = 1} se n ≥ 0.
Abbiamo S n−1 ⊂ Dn . Considereremo S n come un sottospazio di S n+1 mediante
l’inclusione canonica
S n ∋ x −→ (x, 0) ∈ S n+1 .
Indichiamo con σ+ e σ− le immersioni canoniche:
p
σ+ : Dn ∋ x −→ (x0 , · · · , xn−1 , 1 − |x|2 ) ∈ S n
p
σ− : Dn ∋ x −→ (x0 , · · · , xn−1 , − 1 − |x|2 ) ∈ S n .
Ricordiamo ancora che l’applicazione

S n × I ∋ (x, t) −→ tx ∈ Dn+1

(coordinate polari) definisce un omeomorfismo canonico

Sn × I
n
−→ Dn+1 .
S × {0}

Abbiamo allora:
Lemma 6.1. Sia X uno spazio topologico e

f : S n −→ X

un’applicazione continua. Le seguenti condizioni sono equivalenti:


a) f è omotopa a un’applicazione costante.
b) f si può prolungare a un’applicazione continua

f˜ : Dn+1 −→ X.
178 XII. OMOTOPIA

c) f ◦ σ+ e f ◦ σ− sono S n−1 -omotope.


d) f è {e0 }-omotopa all’ applicazione costante.
Dim. a) ⇒ b).
Sia
F : S n × I −→ X

un’omotopia di f con un’applicazione costante.


L’applicazione

S n × I ∋ (x, t) −→ g(x, t) = (1 − t)x ∈ Dn+1

è decomponibile. Poiché F è costante su t = 1, passa al quoziente definendo


un’applicazione continua
f˜ : Dn+1 −→ X

che rende commutativo il diagramma:

F
S n × I −−−−→ X
 x

gy
˜
f .
Dn+1 −−−−−→ Dn+1
idDn+1

Chiaramente f˜|S n = F |{t = 0} = f .


b) ⇒ c), d).
Sia
f˜ : Dn+1 −→ X

un prolungamento continuo di f . Allora


p
F (x, t) = f˜(x, (1 − 2t) 1 − |x|2 )

definisce una S n−1 -omotopia tra f ◦ σ+ e f ◦ σ− e la

G(x, t) = f˜(t + (1 − t)x0 , (1 − t)x1 , · · · , (1 − t)xn−1 )

definisce una {e0 }-omotopia

G : S n × I −→ X

di f con l’applicazione costante.


c) ⇒ b). Sia
F : Dn × I −→ X

una S n−1 -omotopia tra f ◦ σ+ e f ◦ σ− . Definiamo


 p 
h : Dn × I ∋ (x, t) −→ h(x, t) = x, (1 − 2t) 1 − |x|2 ∈ Dn+1 .
XII. OMOTOPIA 179

Allora h è un’applicazione decomponibile e la F per passaggio al quoziente definisce


un prolungamento f˜ di f che rende commutativo il diagramma:
F
Dn × I −−−−→ X
 x
 ˜
hy f .
Dn+1 −−−−−→ Dn+1
idDn+1

L’implicazione d) ⇒ a) è banale e dunque la dimostrazione è completa.

Uno spazio topologico non vuoto X si dice k-connesso , con 0 ≤ k ≤ ∞, se per


ogni intero non negativo n ≤ k ogni applicazione continua S n −→ X è omotopa a
un’applicazione costante, ovvero se

π(S n , X) contiene un solo elemento ∀0 ≤ n ≤ k.

Uno spazio topologico omotopicamente equivalente ad uno spazio k-connesso è esso


stesso k-connesso.
Gli spazi contrattili sono ∞-connessi.
Gli spazi 0-connessi sono gli spazi connessi per archi.
Uno spazio 1-connesso si dice semplicemente connesso.

§7. k-connessione relativa.


Una coppia topologica (X,A) si dice k-connessa se, per ogni intero 0 ≤ n ≤ k
ogni applicazione continua f : Dn −→ X tale che

f (S n−1 ) ⊂ A

è S n−1 -omotopa a un’applicazione continua g : Dn −→ X tale che

g(Dn ) ⊂ A.

Il lemma seguente permette di dare una condizione equivalente di k-connessione, in


termini di omotopia relativa.
Lemma 7.1. Sia f ∈ C(Dn , S n−1 ; X, A). Condizione necessaria e sufficiente
affinché f sia omotopa a un’applicazione costante in π(Dn , S n−1 ; X, A) è che f sia
S n−1 -omotopa a un’applicazione g con g(Dn ) ⊂ A.
Dim. Necessità. Sia
F : Dn × I −→ X
un’omotopia con
F (·, 0) = f
F (S n−1 , t) ⊂ A ∀t ∈ I
F (x, 1) = costante ∀x ∈ X.
Definiamo allora

F (x/|x|, 2(1 − |x|)) se |x| ≥ 1 − t/2
G(x, t) =
F (x/(1 − t/2), t) se |x| ≤ 1 − t/2
180 XII. OMOTOPIA

La G definisce allora una S n−1 -omotopia tra f e una funzione continua



F (x/|x|, 2(1 − |x|) se |x| ≥ 1/2
g(x) =
F (2x, 1) se |x| ≤ 1/2

Sufficienza. Sia
G : Dn × I −→ X
una S n−1 -omotopia tra f e un’applicazione g con g(Dn ) ⊂ A. Definiamo allora
l’omotopia: 
G(x, 2t) se 0 ≤ t ≤ 1/2
F (x, t) =
G(2(1 − t)x, 1) se 1/2 ≤ t ≤ 1.
Essa è un’omotopia di f con un’applicazione costante in π(Dn , S n−1 ; X, A).

Osserviamo che, se A è un retratto di deformazione stretto di X, allora la coppia


(X, A) è ∞-connessa.
Per n = 0 poniamo S −1 = ∅. Allora l’enunciato del Lemma precedente è ancora
valido: Una coppia topologica (X, A) è 0-connessa se ogni punto di X può essere
congiunto a un punto di A da un cammino continuo.
Citiamo senza dimostrazione il seguente risultato:
Se l’inclusione A ֒→ X è un’equivalenza omotopica, allora la coppia (X, A) è
∞-connessa.

§8. Il lemma di Sard.


Per proseguire lo studio dell’omotopia, utilizzeremo nel seguito alcune proprietà
delle applicazioni differenziabili.
Lemma 8.1. Siano m, n, due interi positivi con m < n. Sia A un aperto di Rm
e f : A −→ Rn un’applicazione differenziabile. Allora f (A) è di prima categoria.
Dim. Per ogni intero positivo N ed ogni α ∈ Zn indichiamo con Q(α, N ) il cubo
m-dimensionale:

Q(α, N ) = {x ∈ Rm | |N xi − αi | ≤ 1/2 per i = 1, · · · , m}.

La famiglia
{Q(α, N )|α ∈ Zn , N ∈ N − {0}}
è numerabile e le sue sottofamiglie formate dai cubi di lato 1/N sono ricoprimenti
chiusi localmente finiti (quadrettature) di Rm . Possiamo scrivere A come unione
numerabile di tutti i cubi Q(α, N ) in esso contenuti:

A = ∪Qν

con Qν = Q(αν , Nν ), ν ∈ N.
Abbiamo allora
f (A) = ∪f (Qν )
unione numerabile di insiemi compatti. Basterà dunque dimostrare che ciascuno di
questi insiemi f (Qν ) ha parte interna vuota.
XII. OMOTOPIA 181

Supponiamo per assurdo che ciò non sia vero. A meno di sostituire ad f la
funzione di classe C 1

x −→ k (f (hx + α/N ) − f (α/N ))

(per opportuni numeri reali positivi k, h e α ∈ Zm ) possiamo supporre che:

(i) A ⊃ Q(m) = {x ∈ Rm | |xi | ≤ 1/2 per i = 1, · · · , m}.

(ii) f (Q(m)) ⊃ Q(n) = {y ∈ Rn | |y i | ≤ 1/2 per i = 1, · · · , n}.

Le derivate parziali prime di f sono uniformemente limitate su Q(m). Per il teorema


della media, abbiamo allora, per una costante L,

|f (x1 ) − f (x2 )| ≤ L|x1 − x2 | ∀x1 , x2 ∈ Q(m).

La f trasforma perciò un sottoinsieme di Q(m) contenuto in una palla di raggio δ


in un sottoinsieme di Rn contenuto in una palla di raggio Lδ.
Fissato un intero positivo N , suddividiamo Q(m) in N m cubi di lato 1/N .
√ mediante f di ciascuno di questi cubi è contenuta in un cubo di R di
n
L’immagine
lato 2L m/N . Il volume di Q(n) dovrebbe essere allora inferiore alla somma dei
volumi di tali cubi: √
1 = vol (Q(n)) ≤ (2L m)n · N m−n
ci dà una contraddizione perché il secondo membro di questa diseguaglianza tende
a 0 per N → ∞. La dimostrazione è completa.

Osservazione. Segue dalla dimostrazione che, se

f : A −→ Rn

è un’applicazione differenziabile definita su un aperto A di Rm , e m < n, allora


f (A) è contenuta in un insieme di misura di Lebesgue nulla di Rn .

Sia A un aperto di Rm e sia

f : A −→ Rn

un’applicazione differenziabile. Per ogni punto x di A indichiamo con

∂f 1 /∂x1 ∂f 1 /∂xm
 
...
 . ... . 
df (x) =  
. ... .
∂f /∂x1
n
... ∂f n /∂xm

la matrice jacobiana di f in x. Il punto x si dice critico per f se df (x) ha rango


< n. Il corrispondente punto f (x) ∈ Rn si dice valore critico di f . Indichiamo con
C(f ) e CV (f ) rispettivamente l’insieme dei punti critici e dei valori critici di f . I
punti di f (A) − CV (f ) si dicono valori regolari di f .
182 XII. OMOTOPIA

Osservazione. (Teorema delle funzioni implicite). Sia A un aperto di Rm e


sia
f : A −→ Rn
un’applicazione di classe C k con 1 ≤ k ≤ ∞. Se x0 ∈ A non è un punto critico di
f possiamo trovare un intorno aperto V di f (x0 ) in Rn , un intorno aperto W di 0
in Rm−n , un intorno U di x0 in A e un omeomorfismo

g : V × W −→ U

di classe C k tale che g non abbia punti critici in V × W e

f (g(y, z)) = y ∀(y, z) ∈ V × W.

In particolare, se m = n, la g è un omeomorfismo di V su un aperto g(V ) di A.


In questo caso diciamo che la f definisce un sistema di coordinate di classe C k in
g(V ).
Dal teorema delle funzioni implicite deduciamo immediatamente il seguente
Lemma 8.2. Sia A un aperto di Rn ,

f : A −→ Rn

un’applicazione differenziabile di classe C 1 . Se y è un valore regolare di f , allora


f −1 (y) è un sottospazio discreto di A.
Dim. Dal teorema delle funzioni implicite segue che ogni punto x di f −1 (y) ha
un intorno aperto U tale che

f −1 (y) ∩ U = {x}.

Teorema 8.1. (Lemma di Sard).


Sia A un aperto di Rm e sia f : A −→ Rn un’applicazione di classe C ∞ . Allora
CV (f ) è di prima categoria.
Dim. Osserviamo che C(f ) è un sottoinsieme chiuso di A. Essendo A unione nu-
merabile di compatti, la tesi è equivalente al fatto che, per ogni compatto K ⊂ A,
l’insieme compatto f (K ∩ C(f )) sia privo di punti interni. Il teorema è banale
quando n = 0, perché in questo caso l’insieme dei punti critici di f è vuoto. Pos-
siamo quindi supporre n > 0 e il teorema vero per applicazioni di classe C ∞ a valori
in Rn−1 . Ancora, il teorema è banale se m = 0; potremo quindi supporre m ≥ 1 e
il teorema vero per applicazioni differenziabili di classe C ∞ definite su aperti di Rk
con k < m.
Poniamo C = C(f ) e per ogni intero positivo k indichiamo con Ck il sottoinsieme
di C in cui si annullano le derivate parziali di f fino all’ordine k:

Ck = {x ∈ Rn | Dα f (x) = 0 se 0 < |α| ≤ k}.

Poniamo
C∞ = ∩Ck .
XII. OMOTOPIA 183

Gli insiemi Ck , per 0 < k ≤ ∞, sono sottoinsiemi chiusi di C. Dimostreremo


separatamente che l’immagine di C − C1 , di Ck − Ck+1 e di C∞ sono di prima
categoria in Rn .
Sia x0 un punto di C − C1 . Dimostriamo che esso ammette un intorno compatto
B in A tale che f (B ∩C) non abbia punti interni. Possiamo supporre per semplicità
che x0 = 0 , f (0) = 0 e ∂f 1 /∂x1 6= 0 in 0. Possiamo trovare allora un intorno W di
0 in A in cui, dopo un opportuno cambiamento di coordinate di classe C ∞ in un
intorno di 0 in Rn , la f si può scrivere nella forma:

f (x) = f (x1 , x2 , ..., xn ) = (x1 , f 2 (x), ..., f n (x)).

(Ciò si ottiene applicando il teorema delle funzioni impicite alla


A ∋ x −→ (f 1 (x), x2 , ..., xm ) ∈ Rm .) Sia B un intorno compatto di 0 in W della
forma:
B = [−r, r] × G
con r > 0, G intorno compatto di 0 in Rm−1 . Supponiamo che f (C ∩ B) contenga
punti interni e sia y0 un punto interno di f (C ∩ B). La proiezione

Rn ∋ (y 1 , y 2 , ..., y n ) −→ (y 2 , ..., y n ) ∈ Rn−1

è aperta. Consideriamo l’applicazione differenziabile di classe C ∞

W ∋ x −→ g(x) = (f 2 (x), ..., f n (x)) ∈ Rn−1 .

Per l’ipotesi induttiva, l’insieme

g(C(g)) ∩ B

non ha punti interni.


Poiché B ∩ C ⊂ C(g), se ne deduce che l’intersezione di f (C ∩ B) con l’iperpiano
{y 1 = y01 } non contiene un intorno di y0 per la topologia di sottospazio dell’iperpia -
no. Ciò contraddice l’ipotesi che y0 fosse punto interno di f (C ∩ B) ed abbiamo
quindi dimostrato che f (C ∩ B) è un compatto privo di punti interni. Possiamo
quindi ricoprire C − C1 con una famiglia numerabile di compatti {Bl } tali che
f (C ∩ Bl ) sia privo di punti interni e dunque

f (C − C1 ) = ∪f (C ∩ Bl )

è di prima categoria.
Sia ora k ≥ 1 e x0 ∈ Ck − Ck+1 , che possiamo supporre essere l’origine. Indi-
chiamo con ϕ una derivata parziale di f di ordine k, per cui sia dϕ(0) 6= 0. Possiamo
supporre che f (0) = 0 e che ϕ(x) = x1 , a meno di restringerci a un intorno aperto
W di 0.
Allora Ck ∩ W è contenuto in {x1 = 0} e quindi f (Ck ∩ W ) è contenuto
nell’insieme dei valori critici dell’applicazione

g(x2 , ..., xm ) = f (0, x2 , ..., xm ),

definita e di classe C ∞ in un intorno A′ di 0 in Rm−1 . L’insieme f (Ck ∩ W ) è allora


di prima categoria per l’ipotesi induttiva su m.
184 XII. OMOTOPIA

Sia ora K un compatto contenuto in C∞ . Poiché tutte le derivate parziali di


f si annullano identicamente su K, per ogni intero positivo l possiamo trovare un
intorno aperto U di K in A tale che
|f (x)| < dist(x, K)l ∀x ∈ U.
Supponiamo per assurdo che f (K) contenga dei punti interni. Non è restrittivo
allora supporre che f (K) contenga il cubo
Q = {y ∈ Rn | |y i | ≤ 1/2}
e che K sia contenuto nel cubo
Q′ = {x ∈ Rm | |xj | ≤ 1/2}.
Sia N un intero positivo, con N dist(K, Rm − U ) > 1 e suddividiamo Q′ in N m cubi
di lato 1/N . Se P è uno di questi cubetti che interseca K, esso è tutto contenuto
in √U e la sua immagine mediante f sarà contenuta in un cubo di lato minore di
2( m/N )l . Avremo dunque:

1 = vol(Q) ≤ 2n N m ( m/N )ln .
Scegliendo ln > m, otteniamo una contraddizione.
Ne segue che l’immagine f (K ∩ C), essendo un compatto di prima categoria in
Rn , ha parte interna vuota. La dimostrazione è completa.
Dalla dimostrazione si può osservare come l’ipotesi del teorema che la f sia di
classe C ∞ si possa indebolire a f di classe C k con kn > m.

§9. Varietà differenziabili.


Si dice varietà topologica di dimensione n uno spazio topologico X di Hausdorff,
numerabile all’infinito, in cui ogni punto ha un intorno aperto omeomorfo ad un
aperto di Rn .
Un atlante su X è una famiglia A = {(Ui , ϕi )} in cui {Ui } è un ricoprimento
aperto di X e per ogni indice i
ϕi : Ui −→ ϕ(Ui ) = Vi ⊂ Rn
è un omeomorfismo su un aperto V di Rn . Le funzioni
gij = ϕi ◦ ϕ−1
j : ϕj (Ui ∩ Uj ) −→ ϕi (Ui ∩ Uj )

sono omeomorfismi tra aperti di Rn e si dicono le funzioni di transizione dell’atlante


A.
Un atlante di una varietà topologica X si dice di classe C k (0 ≤ k ≤ ∞) se le
sue funzioni di transizione sono di classe C k . Due atlanti di classe C k sulla stessa
varietà topologica X si dicono k-equivalenti se la loro unione è ancora un atlante
di classe C k .
Si dice varietà differenziabile di classe C k una varietà topologica munita di una
classe di equivalenza di atlanti di classe C k .
Un atlante A di classe C k su una varietà topologica M di dimensione n determina
su M un’unica struttura di varietà differenziabile di classe C k . Un omeomorfismo
ϕ : U −→ V ⊂ Rn
di un intorno aperto U di un punto p di M su un aperto V di Rn si dice un sistema
di coordinate (o carta locale) di classe C k in p se {(U, ϕ)} ∪ A è k-equivalente ad A.
XII. OMOTOPIA 185

Osservazione. Siano M , N , varietà differenziabili di classe C k e sia f : M −→


N un’applicazione continua. Dato un punto p ∈ M sono equivalenti:
i) Possiamo trovare una carta locale (U, ϕ) in p e una carta locale (V, ψ) in f (p)
tali che
ϕ(U ∩ f −1 (V )) ∋ x −→ ψ ◦ f ◦ ϕ−1 (x) ∈ ψ(V )
sia un’applicazione di classe C k in un intorno di ϕ(p).
ii) Per ogni carta locale (U, ϕ) in p e per ogni carta locale (V, ψ) in f (p)

ϕ(U ∩ f −1 (V )) ∋ x −→ ψ ◦ f ◦ ϕ−1 (x) ∈ ψ(V )

è un’applicazione di classe C k in un intorno di ϕ(p).


In questo caso diciamo che f è un’applicazione di classe C k in p. un’applicazione
f si dice di classe C k in M se è tale in ogni punto di M .
Esempi.
1. Un aperto A di Rn è una varietà differenziabile di classe C ∞ con l’atlante
(A, idA ).
2. Il toro T n = Rn /Zn è una varietà differenziabile di classe C ∞ con l’atlante
formato dalle immagini, mediante la proiezione canonica, degli aperti

U (x0 ) = {x ∈ Rn | |xi − xi0 | < 1/2}

al variare di x0 in Rn e dagli omeomorfismi inversi delle restrizioni a U (x0 ) della


proiezione nel quoziente.
3. La sfera S n è una varietà differenziabile di classe C ∞ e di dimensione n con
l’atlante {(U+ , ϕ+ ), (U− , ϕ− )} ove

U+ = {x ∈ S n | x0 > −1}

U− = {x ∈ S n | x0 < 1}
ϕ+ (x0 , x1 , ..., xn ) = (x1 /(1 + x0 ), ..., xn /(1 + x0 )) ∈ Rn
ϕ− (x0 , x1 , ..., xn ) = (x1 /(1 − x0 ), ..., xn /(1 − x0 )) ∈ Rn .
(proiezioni stereografiche di centri rispettivamente e0 e −e0 .)
4. Lo spazio proiettivo RPn è una varietà differenziabile di classe C ∞ e di
dimensione n con l’atlante

{(Ui , ϕi )|i = 0, ..., n}

ove in coordinate omogenee abbiamo:

Ui = {xi 6= 0}

ϕi (x0 , ..., xi−1 , xi , xi+1 , ..., xn ) = (x0 /xi , ..., xi−1 /xi , xi+1 /xi , ..., xn /xi ) ∈ Rn .

5. Sia A un aperto di Rm , m > n e

f : A −→ Rn
186 XII. OMOTOPIA

un’applicazione di classe C k con k ≥ 1. Se y ∈ f (A) è un valore regolare di f , allora


f −1 (y) è una varietà differenziabile di classe C k e di dimensione m − n (sottovarietà
differenziabile di classe C k di A) con l’atlante definito dai sistemi di carte locali:

f −1 (y) ⊃ Uξ,x0 ∋ x −→ ξ(x) = ξ 1 (x), ..., ξ m−n (x) ∈ ξ(Uξ,x0 ) ⊂ Rm−n
al variare di x0 in f −1 (y) e di ξ ∈ HomR (Rm , Rm−n ) tra le applicazioni lineari tali
che g(x) = (x, ξ(x)) sia regolare in x0 . Per il teorema delle funzioni implicite, la
g definisce allora un omeomorfismo di un intorno V di x0 su un aperto V ′ di Rn .
Poniamo Uξ,x0 = V ∩ f −1 (y).
Siano M ,N varietà differenziabili di classe C k con k ≥ 1. Data un’applicazione
differenziabile di classe C k
f : M −→ N
un punto p che sia critico per la rappresentazione di f in un sistema di coordinate
locali in p e in f (p), lo è anche per la sua rappresentazione rispetto a qualsiasi altro
sistema di coordinate locali.
Possiamo quindi definire senza ambiguità l’insieme C(f ) dei punti critici di f in
M e l’insieme CV (f ) dei valori critici di f in N .
Usando atlanti formati da un insieme al più numerabile di elementi otteniamo
immediatamente:
Teorema 9.1. (Lemma di Sard) Siano M ed N varietà differenziabili di classe
C ∞ . Allora, per ogni applicazione
f : M −→ N

di classe C , CV (f ) è un insieme di prima categoria in N .

§10. Proprietà di omotopia delle sfere.


Mostriamo in questo paragrafo che la sfera S n è (n − 1)-connessa, ma non n-
connessa.
Teorema 10.1. S n è (n − 1)-connessa.
Dim. Sia m un intero non negativo < n e sia
f : S m −→ S n
un’applicazione continua. Per il teorema di Stone-Weierstrass possiamo trovare
un’applicazione a componenti polinomiali
P : Rm+1 −→ Rn+1
tale che
|P (x) − f (x)| < 1/2 ∀x ∈ S m .
Abbiamo quindi
|f (x) + t(P (x) − f (x))| > 1/2 ∀(x, t) ∈ S m × I.
L’applicazione:
f (x) + t(P (x) − f (x))
S m × I ∋ (x, t) −→ ∈ Sn
|f (x) + t(P (x) − f (x))|
è un’omotopia tra f e la restrizione g di P/|P | a S m . Dico che la g non è surgettiva.
Infatti, g è di classe C ∞ su S m e quindi, per il teorema 9.1, g(S m ) è di prima
categoria in S n . Poiché S n meno un punto è omeomorfa a Rn , che ha lo stesso tipo
di omotopia del punto, g è omotopa a un’applicazione costante.
XII. OMOTOPIA 187

Lemma 10.1. Sia n un intero ≥ 1. Definiamo una applicazione (sospensione)

σ : C(S n , S n ) −→ C(S n+1 , S n+1 )

mediante:
! !
p (x0 , ..., xn )
σf (x0 , ..., xn , xn+1 ) = 1 − (xn+1 )2 · f p , xn+1 .
1 − (xn+1 )2

Essa induce un’applicazione bigettiva

σ∗ : π(S n , S n ) −→ π(S n+1 , S n+1 ).

Dim. Poiché un’omotopia di applicazioni continue di S n in sè si trasforma me-


diante σ in un’omotopia di applicazioni continue si S n+1 in sè, la σ∗ è ben definita.
Iniettività Siano f, g : S n −→ S n due applicazioni continue. Se σf è omotopa
a σg, possiamo trovare un’omotopia

F : S n+1 × I −→ S n+1

tale che
F (x, 0) = σf (x) ∀x ∈ S n+1
F (x, 1) = σg(x) ∀x ∈ S n+1 .
Osserviamo allora che

Ψ(x, t) = t(|F n+1 (x, t)| − |xn+1 |) · e0 + F (x, t) 6= 0

∀(x, t) ∈ S n+1 × I con |F n+1 (x, t)| ≥ |xn+1 |.


Infatti, se |F n+1 (x, t)| > 0, i due termini nella somma sono linearmente indipen-
denti. Se |F n+1 (x, t)| = 0, allora Ψ(x, t) = F (x, t) 6= 0.
Possiamo allora definire un’omotopia

F (x, t) se |F n+1 (x, t)| ≤ |xn+1 |
G(x, t) =
Ψ(x, t)/|Ψ(x, t)| se |F n+1 (x, t)| ≥ |xn+1 |.

Osserviamo che
G(x, 0) = F (x, 0) = σf (x)
in quanto
(σf )n+1 (x) = xn+1
e che analogamente

G(x, 1) = F (x, 1) = σg(x) ∀x ∈ S n+1 .

Abbiamo
|Gn+1 (x, t)| < 1 ∀(x, t) ∈ S n × I
188 XII. OMOTOPIA

in quanto ciò è vero se t = 0, 1 e per t 6= 0, x ∈ S n il vettore

Ψ(x, t) = t|F n+1 (x, t)|e0 + F (x, t)

non è proporzionale a en+1 . Otteniamo quindi un’omotopia

H : S n × I −→ S n

di f con g definendo

x′
̺ : S n+1 ∩ {|xn+1 | < 1} ∋ x −→ ∈ Sn
|x′ |

(ove x′ = (x0 , ..., xn )), e ponendo

H(x′ , t) = ̺ ◦ G(x′ , 0; t).

Surgettività Sia
f : S n+1 −→ S n+1
un’applicazione continua.
a) Supponiamo che, posto
n+1
S+ = {x ∈ S n+1 | xn+1 ≥ 0}

e
n+1
S− = {x ∈ S n+1 | xn+1 ≤ 0}
sia
n+1 n+1 n+1 n+1
f (S+ ) ⊂ S+ e f (S− ) ⊂ S− .
Possiamo allora costruire un’omotopia tra f e σg, dove g è l’applicazione:
g
S n ∋ (x0 , ..., xn ) −
→ f (x0 , ..., xn , 0) ∈ S n

nel modo seguente. Indichiamo con h : Dn+1 −→ Dn+1 la funzione continua:



|y|g(y/|y|) ∀y 6= 0
h(y) =
0 se y = 0.

Siano σ+ e σ− le applicazioni introdotte nel §6. Sia

p : S n+1 ∋ (x0 , ..., xn , xn+1 ) −


→ (x0 , ..., xn ) ∈ Dn+1

la proiezione naturale. Allora


 n+1
σ+ (h(p(x)) ∀x ∈ S+
σg(x) = n+1
σ− (h(p(x)) ∀x ∈ S− .

Indichiamo con f+ , f− : Dn+1 −


→ Dn+1 le funzioni continue:

f+ (y) = p ◦ f (σ+ (y)) per y ∈ Dn+1


XII. OMOTOPIA 189

f− (y) = p ◦ f (σ− (y)) per y ∈ Dn+1


n+1 n+1
La proprietà della funzione f di trasformare in sè i due emisferi S+ e S− si può
esprimere mediante:
 n+1
σ+ ◦ f+ (p(x)) se x ∈ S+
f (x) = n+1
σ− ◦ f− (p(x)) se x ∈ S− .

Allora un’omotopia F : S n+1 × I − → S n+1 tra f e σg si può ottenere rialzando


l’omotopia lineare tra f+ ,f− e h:
 n+1
σ+ (f+ (p(x)) + t(h(p(x)) − f+ (p(x))) se x ∈ S+
F (x, t) = n+1
σ− (f− (p(x)) + t(h(p(x)) − f− (p(x))) se x ∈ S− .

b) Consideriamo ora il caso generale. Sia

f : S n+1 −→ S n+1

una qualsiasi applicazione continua. Se f non è surgettiva, allora è omotopa a


un’applicazione costante e questa è omotopa alla σh ove h(x) = e0 ∀x ∈ S n .
Supponiamo quindi f surgettiva. Ripetendo il ragionamento svolto nella dimo-
strazione del teorema 10.1, possiamo supporre che f sia di classe C ∞ . L’insieme
dei suoi valori critici è allora un compatto di S n+1 privo di punti interni e potremo
trovare una coppia di punti diametralmente opposti che siano entrambi valori
regolari (non critici) di f . A meno di una rotazione, che possiamo ottenere me-
diante un’omotopia dell’identità, in quanto SO(n + 2) è connesso per archi, pos-
siamo supporre che en+1 e −en+1 siano valori regolari di f . Poniamo per semplicità
N = en+1 e S = −en+1 . Per il teorema delle funzioni implicite, ogni punto di
N ∗ = f −1 (N ) ed ogni punto di S ∗ = f −1 (S) ha un intorno aperto che non contiene
altri punti di N ∗ ∪ S ∗ . I due insiemi sono dunque sottoinsiemi discreti di S n+1 e
perciò finiti. Possiamo trovare una forma lineare ξ in (Rn+2 )∗ che assume valori
distinti sui punti distinti di N ∗ ∪S ∗ . Infatti, per ogni coppia di punti distinti di Rn+2
l’insieme delle forme lineari che hanno nei due punti valori distinti è un aperto denso
in (Rn+2 )∗ e una intersezione finita di aperti densi di (Rn+2 )∗ è ancora un aperto
denso in (Rn+2 )∗ . Scegliamo ξ in modo che |ξ| = 1 e |ξ(x)| < 1 su N ∗ ∪ S ∗ . A meno
di una rotazione, per cui valgono le considerazioni svolte sopra, possiamo supporre
sia ξ(x) = (x|N ). Suddividiamo ora [−1, 1] in un numero finito di intervalli, me-
diante punti −1 < c1 < ... < cl < 1, in modo che

(x|N ) 6= ci per i = 1, ..., l se x ∈ N ∗ ∪ S ∗

card({(x|N )|x ∈ N ∗ ∪ S ∗ } ∩ [ci , ci+1 ]) = 1 per i = 1, ..., l − 1


c1 < (x|N ) < cl ∀x ∈ N ∗ ∪ S ∗ .
Costruiamo ora un’omotopia

H : S n+1 × I −→ S n+1

tra l’identità e un omeomorfismo dipS n+1 la cui inversa trasformi i punti


x = (x0 , ..., xn+1 ) ∈ N ∗ in x̄ = ( 1 − (xn+1 )2 , 0, ..., 0, xn+1 ) e i punti
190 XII. OMOTOPIA
p
x = (x0 , ..., xn+1 ) ∈ S ∗ in x̄ = (− 1 − (xn+1 )2 , 0, ..., 0, xn+1 ). Sia infatti, per
ogni indice i, gi (t) un arco continuo in SO(n + 2) formato da applicazioni che
lasciano fisso il punto N (l’insieme delle applicazioni in SO(n + 2) che lasciano
fisso N è isomorfo, come gruppo topologico, a SO(n + 1) ed è quindi connesso per
archi) e tali che gi (1)x̄ = x se x ∈ N ∗ ∪ S ∗ e ci < (N |x) < ci+1 . Poniamo quindi,
indicando con xi l’elemento di N ∗ ∪ S ∗ tale che ci < (xi |N ) < ci+1 e con ηi (x) la
funzione definita per ci < (x|N ) < ci+1 mediante:
 
−|(x − xi |N )|2
ηi (x) = exp
[(x|N ) − ci ][ci+1 − (x|N )]

e uguale a 0 nei punti non appartenenti a tale striscia. Essa è una funzione di classe
C ∞ . Consideriamo quindi l’omotopia:

x
 se (x|N ) ∈
/ [c1 , cl ]
H(x, t) = gi (tηi (x))x se ci < (x|N ) < ci+1 , i = 1, ..., l − 1


x se (x|N ) = ci , i = 1, ..., l.

L’omotopia f (H(x, t)) trasforma f in un’applicazione g(x) = f (H(x, 1)) per cui
g −1 (N ) è un insieme finito di punti con

(x|e0 ) ≥ 0

e g −1 (S) è un insieme finito di punti con

(x|e0 ) ≤ 0.

Questa applicazione è omotopa a quella ottenuta componendola con una rotazione


di SO(n + 2) che trasforma e0 in N . Ci siamo quindi ricondotti alla situazione
seguente: abbiamo una applicazione continua

g : S n+1 −→ S n+1

omotopa ad f tale che


n+1
g −1 (N ) ⊂ S+
n+1
g −1 (S) ⊂ S− .

Per la continuità di g, possiamo trovare 0 < ǫ < 1/2 tale che

n+1
g(S+ ) ⊂ {x ∈ S n+1 |xn+1 > 2ǫ − 1},

n+1
g(S− ) ⊂ {x ∈ S n+1 |xn+1 < 1 − 2ǫ}.

Poniamo

Ψ+ (x, t) = x′ , (1/ǫ − 1)(ǫ(1 + t) − t(1 − xn+1 ) ,

Ψ− (x, t) = x′ , (1/ǫ − 1)(t(1 + xn+1 ) − ǫ(1 + t) .
XII. OMOTOPIA 191

Definiamo l’omotopia:

 x se |xn+1 | ≥ 1 − ǫ


 Ψ (x, t)/|Ψ (x, t)|
+ + se 1 − ǫ(1 + 1/t) ≤ xn+1 ≤ 1 − ǫ
L(x, t) =
 x/|x|

 se |xn+1 | ≤ 1 − ǫ(1 + 1/t)

Ψ− (x, t)/|Ψ− (x, t)| se − 1 + ǫ(1 + 1/t) ≤ xn+1 ≤ ǫ − 1.

tra l’identità e un’applicazione λ : S n+1 −→ S n+1 tale che

λ({|xn+1 | ≤ 1 − 2ǫ}) ⊂ S n .

Allora la L(g(x), t) è un’omotopia di g con un’applicazione continua L(g(x), 1) =


h(x) tale che
n+1 n+1
h(S+ ) ⊂ S+ ,
n+1 n+1
h(S− ) ⊂ S− .
Ad essa si applica quindi l’argomento del punto a). La dimostrazione è completa.
Teorema 10.2. Consideriamo l’ insieme di applicazioni continue Φ formato
dalle
ϕk : S 1 ∋ eiθ −→ ϕk (eiθ ) = ekiθ ∈ S 1 .
per k ∈ Z. L’applicazione naturale:

Φ −→ π(S 1 , S 1 )

è una bigezione.
Dim. Ogni applicazione continua f : S 1 −→ S 1 è omotopa a un’applicazione
continua g : S 1 −→ S 1 tale che g(1) = 1. Quindi, per il lemma 6.1,

π(S 1 , {1}; S 1 , {1}) ≃ π(S 1 , S 1 ).

Osserviamo che l’applicazione

(*) R ∋ θ −→ eiθ ∈ S 1

è un omeomorfismo locale. Per ogni applicazione continua

f : S 1 −→ S 1

con
f (1) = 1
possiamo allora trovare un’unica applicazione continua

f˜ : R −→ R

tale che
f˜(0) = 0
192 XII. OMOTOPIA

e il diagramma

R −−−−→ R
 
  i·
ei· y ye
S 1 −−−−→ S 1
f

sia commutativo. Abbiamo allora

f˜(2π) = 2kπ per qualche k ∈ Z.

L’applicazione che fa corrispondere l’intero k alla funzione f è un’applicazione con-


tinua
C(S 1 , {1}; S 1 , {1}) −→ R
che assume solo valori interi.
Essa è dunque costante sulle componenti connesse di C(S 1 , {1}; S 1 , {1}). Ciò
dimostra che (*) è iniettiva. Siano ora f, g ∈ C(S 1 , {1}; S 1 , {1}) tali che f˜(2π) =
g̃(2π). Allora l’omotopia lineare:

(θ, t) −→ f˜(θ) + t[g̃(θ) − f˜(θ)]

induce un’omotopia tra f e g. Ne segue che la (*) è anche iniettiva. La dimostra-


zione è completa.

Teorema 10.3. Sia n ≥ 2. L’applicazione

C(S 1 , S 1 ) ∋ f −→ σf ∈ C(S n , S n )

ove, posto x = (x0 , x1 , x′′ ),


p
σf (x0 , x1 , x′′ ) = ( 1 − |x′′ |2 f (x0 , x1 ), x′′ ),

induce un’applicazione bigettiva

π(S 1 , S 1 ) −→ π(S n , S n ).

In particolare, l’applicazione

Z ∋ k ←→ ϕk ∈ Φ

induce per ogni n ≥ 1 una bigezione:

Z ←→ π(S n , S n ).

Dim. La prima affermazione segue per iterazione dal lemma 10.1 e la seconda
dal teorema 10.2.
L’intero associato ad un’applicazione continua f : S n −
→ S n si dice il grado di f
e si indica con deg(f ).
194 XII. OMOTOPIA

§11 Il teorema del punto fisso di Brouwer.


Un’importante applicazione dei risultati del paragrafo precedente è il seguente
Teorema 11.1. (Teorema di Brouwer)
Ogni applicazione continua

f : Dn −→ Dn

ha almeno un punto fisso.


Dim.. Il teorema è banale se n = 0. Sia n > 0 e supponiamo per assurdo che vi
sia una funzione continua f : Dn −→ Dn tale che

f (x) 6= x ∀x ∈ Dn .

Allora l’applicazione ψ : Dn −→ S n−1 che associa ad ogni punto x di Dn l’inter -


sezione di S n−1 con la semiretta

t −→ x + t (x − f (x)) , per t ≥ 0

è continua ed è una retrazione di Dn su S n−1 : essa infatti è descritta analiticamente


mediante:
p
(x|x − f (x))2 + (1 − |x|2 )|x − f (x)|2 − |(x|x − f (x))|
ψ(x) = x + (x − f (x)).
|x − f (x)|2

L’applicazione
Dn × I ∋ (x, t) −→ (1 − t)x + tψ(x) ∈ Dn
è una S n−1 omotopia dell’identità con una retrazione di Dn su S n−1 . Ciò è assurdo
perchè S n−1 non può essere un retratto di deformazione stretto di Dn . Infatti Dn
e S n−1 non sono omotopicamente equivalenti in quanto Dn è contrattile, mentre
per il teorema 10.3 S n−1 non è (n − 1)-connesso.
Osservazione. Il teorema di Brouwer si applica ovviamente a tutti i sottoinsiemi
di Rn che sono omeomorfi a Dn ; in particolare a tutti i sottoinsiemi convessi e
compatti di uno spazio euclideo.
XIII. GRUPPI DI OMOTOPIA 195

CAPITOLO XIII

GRUPPI DI OMOTOPIA

§1 Gruppi di omotopia di uno spazio puntato


Uno spazio puntato è uno spazio topologico non vuoto X su cui si sia fissato
un punto base x0 . Chiamiamo n-esimimo gruppo di omotopia dello spazio puntato
(X, x0 ), e indichiamo con πn (X, x0 ), l’insieme π(Sn , e0 ; X, x0 ) delle classi di e0 -
omotopia delle applicazioni continue f : Sn − → X tali che f (e0 ) = x0 .
Il gruppo π1 (X, x0 ) si dice anche gruppo fondamentale di X con punto base x0 .
Per descrivere la struttura di gruppo di πn (X, x0 ) (quando n ≥ 1) è conveniente
utilizzare l’isomorfismo tra πn (X, x0 ) e π(In , bIn ; X, x0 ) descritto dal seguente:
Lemma 1.1 Sia n ≥ 1. Possiamo definire un’applicazione continua φ : In −
→ Sn
con le proprietà:
 n n n
 (i) φ definisce un omeomorfismo di I \ bI su S \ {e0 };

(ii) φ−1 (e0 ) = bIn ;
 
(iii) il quoziente iniettivo di φ è un omeomorfismo di In bIn su Sn .

Per ogni spazio topologico X, con punto di base x0 , l’applicazione

(1.1) φ∗ : π(Sn , e0 ; X, x0 ) −
→ π(In , bIn ; X, x0 )

è bigettiva.

Dim. Definiamo:
( q 
1
2|x| − 1, 2x |x| − 1 se 0 < |x| ≤ 1
ψ(x) =
0 se x = 0.

La ψ : Dn − → Sn è continua
. e definisce, per passaggio al quoziente iniettivo, un
n
omeomorfismo di D su Sn , che trasforma Sn−1 in e0 .
Sn−1
Per ottenere la φ cercata sarà quindi sufficiente comporre la ψ con un omeomor-
fismo τ di In su Dn che trasformi bIn in Sn−1 . Poniamo kvk∞ = sup1≤i≤n |vi | per
v = (v1 , . . . , vn ) ∈ Rn e sia e = (1, . . . , 1) = e1 + · · · + en . Possiamo allora definire
τ : In −
→ Dn mediante:
 2x − e

 k2x − ek∞ se 2x 6= e
|2x − e|
τ (x) =


0 se 2x = e.
196 XIII. GRUPPI DI OMOTOPIA

Allora φ = ψ ◦ τ : In −
→ Sn è l’applicazione continua cercata.
Per concludere, basta osservare che l’applicazione

C(Sn , e0 ; X, x0 ) ∋ f −
→ f ◦ φ ∈ C(In , bIn ; X, x0 )

è un omeomorfismo per la topologia compatta-aperta.


Dati f, g ∈ C(In , bIn ; X, x0 ), con n ≥ 1, definiamo
 1
f (2s1 , s2 , . . . , sn ) se 0 ≤ s1 ≤ 2
(1.2) f · g(s1 , . . . , sn ) = 1
g(2s1 − 1, s2 , . . . , sn ) se 2 ≤ s1 ≤ 1 .

Indicheremo il prodotto f · g anche con

|
f | g
|

Teorema 1.2 Sia X uno spazio topologico con punto di base x0 ∈ X. Per ogni
intero n ≥ 1 l’applicazione

(1.3) C(In , bIn ; X, x0 ) × C(In , bIn ; X, x0 ) ∋ (f, g) −


→ f · g ∈ C(In , bIn ; X, x0 )

definisce per passaggio al quoziente un’operazione interna:

(1.4) πn (X, x0 ) × πn (X, x0 ) ∋ (α, β) −


→ α · β ∈ πn (X, x0 )

rispetto alla quale πn (X, x0 ) è un gruppo, il cui elemento neutro corrisponde all’ap -
plicazione costante x̂0 : In ∋ s − → x0 ∈ X. Se n ≥ 2, allora πn (X, x0 ) è abeliano.

Dim. Se F, G : In × I − → X sono due bIn -omotopie con F (bIn , t) = G(bIn , t) =


{x0 } per ogni 0 ≤ t ≤ 1, allora anche
 1
F (2s1 , s2 , . . . , sn ; t) se 0 ≤ s1 ≤ 2
F · G(s; t) = 1
G(2s1 − 1, s2 , . . . , sn ; t) se 2 ≤ s1 ≤ 1

è una bIn -omotopia con F · G(bIn , t) = {x0 } per ogni 0 ≤ t ≤ 1. L’operazione su


πn (X, x0 ) è perciò ben definita.
Dimostriamo ora che πn (X, x0 ) è un gruppo per n ≥ 1.
a. [x̂0 ] è l’elemento neutro del prodotto
Sia f ∈ C(In , bIn ; X, x0 ). Definiamo
( t
x0 se 0 ≤ s1 ≤ 2
F1 (s; t) =  
f 2s2−t
1 −t
, s2 , . . . , sn se t
2 ≤ s1 ≤ 1

e (  
2s1 2−t
f 2−t , s2 , . . . , sn se 0 ≤ s1 ≤ 2
F2 (s; t) =
2−t
x0 se 2 ≤ s1 ≤ 1.
XIII. GRUPPI DI OMOTOPIA 197

La prima è una bIn -omotopia tra f e x̂0 · f , la seconda tra f e f · x̂0 :

| |
F1 F2
f −→ x̂0 | f e f −→ f | x̂0
| |

b. Esistenza dell’inversa.
Data f ∈ C(In , bIn ; X, x0 ) definiamo
fˇ(s) = f (1 − s1 , s2 , . . . , sn ) ∀s = (s1 , . . . , sn ) ∈ In .
Dico che f · fˇ ∼ fˇ · f ∼ x̂0 in C(In , bIn ; X, x0 ). Osserviamo a questo scopo che

f (2ts1 , s2 , . . . , sn ) se 0 ≤ s1 ≤ 21
F (s; t) =
f (2t(1 − s1 ), s2 , . . . , sn ) se 21 ≤ s1 ≤ 1
è un’omotopia tra x̂0 e f · fˇ. Chiaramente la F (1 − s1 , s2 , . . . , sn ; t) è allora
un’omotopia tra x̂0 e fˇ · f perché fˇ = f .
c. Il prodotto è associativo
L’associatività segue da schema:

| | | |
F
f | g | h −−−−→ f | g | h
| | | |
con
 1
 f (2(1 + t)s1 , s2 , . . . , sn ) se 0 ≤ s1 ≤ 2(1+t)


  
1 1 3+2t
F (s; t) = g 2s 1 − ,
2(1+t) 2 s , . . . , s n se 2(1+t) ≤ s1 ≤ 4(1+t)

  

 h 4(1+t)s1 −(3+2t) , s , . . . , s 3+2t
1+2t 2 n se 4(1+t) ≤ s1 ≤ 1.

d. Il prodotto è commutativo per n ≥ 2.


La dimostrazione della commutatività del prodotto per n ≥ 2 segue dallo schema:

| f | x̂0 f x̂0 | f
F1 F2 F3
f | g −−−−→ −− | −− −−−−→ − − − −−−−→ − − −
| x̂0 | g g g | x̂0

F
y 4
|
g | f
|

Le omotopie sono date da:




 x0 se 0 ≤ s1 ≤ 1/2, 0 ≤ s2 ≤ t/2

 f (2s1 , 2s2 −t , s3 , . . . , sn )
 se 0 ≤ s1 ≤ 1/2, t/2 ≤ s2 ≤ 1
2−t
F1 (s; t) = 1

 g(2s1 − 1, (1 + t)s2 , s3 , . . . , sn ) se 1/2 ≤ s1 ≤ 1, 0 ≤ s2 ≤ 1+t


 1
x0 se 1/2 ≤ s1 ≤ 1, 1+t ≤ s2 ≤ 1;
198 XIII. GRUPPI DI OMOTOPIA

 1−t 1

 x0 se 0 ≤ s1 ≤ 2 , 0 ≤ s2 ≤ 2

 g( 2s1 +t−1 , 2s2 , s3 , . . . , sn )

se 1−t
≤ s1 ≤ 1, 0 ≤ s2 ≤ 1
1+t 2 2
F2 (s, t) = 1


 f ((2 − t)s1 , 2s2 − 1, s3 , . . . , sn ) se 0 ≤ s1 ≤ 2−t , 1/2 ≤ s2 ≤ 1

 1
x0 se 2−t ≤ s1 ≤ 1, 1/2 ≤ s2 ≤ 1;

 1 1

 g((1 + t)s1 , 2s2 , s3 , . . . , sn ) se 0 ≤ s1 ≤ 1+t , 0 ≤ s2 ≤ 2

 1
 x0 se 1+t ≤ s1 ≤ 1, 0 ≤ s2 ≤ 12
F3 (s) =


 x0 se 0 ≤ s1 ≤ 2t , 1
2 ≤ s2 ≤ 1

 2s1 −t t 1
f ( 2−t , 2s2 − 1, s3 , . . . , sn ) se 2 ≤ s1 ≤ 1, 2 ≤ s2 ≤ 1 ;



 g(2s1 , (2 − t)s2 , s3 , . . . , sn ) se 0 ≤ s1 ≤ 21 , 0 ≤ s2 ≤ 1
2−t


 x0 se 0 ≤ s1 ≤ 12 , 1
2−t ≤ s2 ≤ 1
F4 (s) = 1 1−t


 x0 se 2 ≤ s1 ≤ 1, 0 ≤ s2 ≤ 2

f (2s1 − 1, 2s21+t
+t−1
 1 1−t
, s3 , . . . , sn ) se 2 ≤ s1 ≤ 1, 2 ≤ s2 ≤ 1 .

Teorema 1.3 Sia G un gruppo topologico con identità e. Allora π1 (G, e) è un


gruppo abeliano.

Dim. Siano α, β ∈ C(I, {0, 1}; G, e). Definiamo l’applicazione

φ : I × I ∋ (s, t) −
→ α(s)β(t) ∈ G .

Osserviamo che, posto


 
(2t, 0) se 0 ≤ t ≤ 12 (0, 2t) se 0≤t≤ 1
2
γ1 (t) = γ2 (t) =
(1, 2t − 1) se 12 ≤ t ≤ 1 (2t − 1, 0) se 1
2 ≤t≤1

abbiamo:
α · β(s) = φ ◦ γ1 (s), β · α(s) = φ ◦ γ2 (s) .
Quindi
I × I ∋ (s, t) −
→ F (s; t) = φ(tγ2 (s) + (1 − t)γ1 (s)) ∈ G
è un’omotopia tra α · β e β · α.
Osserviamo che, se X è uno spazio topologico, x0 ∈ X ed Y è la componente
connessa per archi di X contenente x0 , abbiamo πn (Y, x0 ) = πn (X, x0 ) per ogni
n ≥ 1, mentre l’insieme π0 (X, x0 ) è in corrispondenza biunivoca con le componenti
connesse per archi di X.

§2 Cambiamento del punto di base e azione del gruppo fondamentale


Sia X uno spazio topologico connesso per archi, e sia α : I −→ X un cammino
continuo. Posto xt = α(t), 0 ≤ t ≤ 1, possiamo definire per ogni n ≥ 1 un’applica -
zione α∗ : πn (X, x0 ) −
→ πn (X, x1 ) nel modo seguente:
XIII. GRUPPI DI OMOTOPIA 199

data f ∈ C(In , bIn ; X, x0 ) definiamo


 1 2
f (3s1 − 1, . . . , 3sn − 1) se 3 ≤ si ≤ 3 ∀1 ≤ i ≤ n
(2.1) α ⋄ f (s) =  
α max1≤i≤n 3 si − 1 − 1
2 2 altrimenti .

Teorema 2.1 L’applicazione

(2.2) C(In , bIn ; X, x0 ) ∋ f −


→ α ⋄ f ∈ C(In , bIn ; X, x1 )

definisce un isomorfismo di πn (X, x0 ) su πn (X, x1 ).

Dim. Si verifica infatti che α−1 ⋄ è l’applicazione inversa di α⋄.


Osserviamo che, in particolare, se α, β ∈ C(I, {0, 1}; X, x0 ),
 1
 α(1 − 3s)
 se 0≤s≤ 3
α ⋄ β(s) = β(3s − 1) se 1
3 ≤s≤ 2
3 ∼ α−1 · β · α .

 2
α(3s − 2) se 3 ≤s≤1

Otteniamo quindi il seguente:


Teorema 2.2 Sia X uno spazio topologico e sia x0 ∈ X. Per ogni intero n ≥ 1
l’applicazione

(2.3) C(I, {0, 1}; X, x0 ) × C(In , bIn ; X, x0 ) ∋ (α, f ) −


→ α ⋄ f ∈ C(In , bIn ; X, x0 )

definisce per passaggio al quoziente un’azione a destra:

(2.4) π1 (X, x0 ) × πn (X, x0 ) ∋ (η, ξ) −


→ ξ · η ∈ πn (X, x0 )

del gruppo fondamentale π1 (X, x0 ) sull’n-esimo gruppo di omotopia πn (X, x0 ) con


punti base x0 .
Per n = 1 tale azione coincide con l’inversa della rappresentazione aggiunta.

§3 Insiemi convessi in Rn
Un sottoinsieme K di Rn si dice convesso se per ogni coppia di punti x0 , x1 ∈ K
il segmento [x0 , x1 ] = {x0 + t(x1 − x0 ) | 0 ≤ t ≤ 1} è tutto contenuto in K.
Un’applicazione f : Rm − → Rn si dice affine se f (x0 + t(x1 − x0 )) = f (x0 ) +
t(f (x1 ) − f (x0 )) per ogni x0 , x1 ∈ Rm e per ogni t ∈ R.
Proposizione 3.1 Immagini dirette e inverse di convessi mediante applicazioni
affini sono convesse.

Sia K un intorno convesso di 0 in Rn . La funzione di Minkowski di K è la


funzione

(3.1) qK (x) = inf{t > 0 | t−1 x ∈ K} .


200 XIII. GRUPPI DI OMOTOPIA

Proposizione 3.2 Se K è un intorno convesso dell’origine di Rn , la funzione di


Minkowski qK : Rn −
→ R è continua, positiva su Rn \ {0} e gode delle proprietà:

qK (tx) = t qK (x) ∀x ∈ Rn , ∀t > 0 (positiva omogeneità)
qK (x + y) ≤ qK (x) + qK (y) ∀x, y ∈ R n
(subattività) .

Dim. La positiva omogeneità segue immediatamente dalla definizione. Dimo-


striamo la subattività: siano x, y ∈ Rn e siano s > 0, t > 0 tali che s−1 x, t−1 y ∈ K.
−1
Poiché K è convesso, posto λ = s−1s+t−1 , abbiamo s−1 x + λ(t−1 y − s−1 x) =
1
(s+t)−1 (x + y) ∈ K, onde qK (x + y) ≤ s + t, e la subadditività si ottiene passando
all’estremo inferiore a secondo membro.
Poiché 0 è un punto interno di K, avremo B(0, r) ⊂ K per qualche r > 0. Questa
relazione ci dà
1
qK (x) ≤ |x| ∀x ∈ Rn .
r
r
Infatti abbiamo |x| x ∈ K per ogni x ∈ Rn \ {0}. Per la subadditività otteniamo
allora
1
|qK (x) − qK (y)| ≤ |x − y| ∀x, y ∈ Rn
r
e quindi la qK è continua.
Teorema 3.3 Due qualsiasi insiemi convessi e compatti con parte interna non
vuota di Rn sono omeomorfi tra loro. Ogni omeomorfismo tra le loro frontiere si
estende a un omeomorfismo tra i due convessi.

Dim. Siano K e K ′ due convessi compatti con parte interna non vuota. A meno
di una traslazione possiamo supporre che 0 sia un punto interno di K ∩ K ′ . La
funzione
qk (x)
Rn \ {0} ∋ x −
→ ∈R
qK ′ (x)
è continua e positivamente omogenea di grado 0. Ammette pertanto massimo e
minimo in Rn \ {0}. Ne segue che la
(
qk (x)
qK ′ (x) ·x se x 6= 0
g(x) =
0 se x=0

è un omeomorfismo di K su K ′ .

Osserviamo infine che se K è un convesso compatto con 0 ∈ K, allora il quoziente
. continua bK × I ∋ (x, t) −
iniettivo dell’applicazione → tx ∈ K definisce un omeo-
morfismo di (bK × I) (bK × {0}) su K. Se φ : bK − → bK ′ è un omeomorfismo
tra le frontiere di due convessi compatti che contengono 0 come punto interno,
φ×idI
l’omeomorfismo bK × I −−−−→ bK ′ × I induce per passaggio al quoziente un omeo-
morfismo K − → K ′ che estende φ : bK −
→ bK ′ .
In particolare ogni convesso compatto con parte interna non vuota di Rn è omeo-
morfo a Dn e ha frontiera omeomorfa a Sn−1 .
XIII. GRUPPI DI OMOTOPIA 201

§4 Fibrati di Serre
p
Un fibrato topologico E − → B è il dato di due spazi topologici E, B e di
un’applicazione continua p : E − → B.
Chiamiamo E lo spazio totale, B la base e p la proiezione sulla base del fibrato
p
E− → B.
p
Una sezione continua del fibrato E −→ B su un aperto U di B è un’applicazione
continua s : U − → E tale che p ◦ s(b) = b per ogni b ∈ U . Indichiamo con Γ(U, E)
l’insieme delle sezioni continue di E su U .
p
Sia E −
→ B un fibrato; sia Y uno spazio topologico e sia φ : Y −→ B un’applica -
zione continua. Diciamo che f : Y − → E è un rilevamento di φ se è continua e
p ◦ f = φ.
p
Un fibrato topologico E − → B è un fibrato di Serre se per ogni intero n ≥ 0 ed
ogni coppia di applicazioni continue

f : In −
→ E ed F : In × I −
→ B tali che F (y, 0) = p(f (y)) per ogni y ∈ In

esiste un’applicazione continua



n F̃ (y, 0) = f (y) per ogni y ∈ In
F̃ : I × I −
→ E tale che
p(F (y, t)) = F (y, t) per ogni y ∈ In e t ∈ I.

p
Lemma 4.1 Supponiamo che E − → B sia un fibrato di Serre. Fissiamo un punto
ξ0 ∈ E e sia b0 = p(ξ0 ) ∈ B. Sia n un intero non negativo. Per ogni φ ∈
C(In , 0; B, b0 ) esiste una f ∈ C(In , 0; E, ξ0 ) tale che φ = p ◦ f .

Dim. Ragioniamo per ricorrenza su n. Per n = 0 la tesi segue dalla definizione


di fibrazione di Serre. Supponiamo ora che m sia un intero positivo e che la tesi
sia vera per n = m − 1. In particolare c’è un’applicazione g ∈ C(Im−1 , 0; E, ξ0 )
tale che p(g(s1 , ..., sm−1 )) = φ(s1 , ..., sm−1 , 0), g(0, . . . , 0) = ξ0 . Per definizione di
fribrato di Serre esisterà allora una f : Im−1 ×I = Im − → E con f (s1 , . . . , sm−1 , 0) =
g(s1 , . . . , sm−1 ) e p ◦ f = φ. Tale f soddisfa la tesi del lemma.
p
Lemma 4.2 Sia E − → B un fibrato di Serre e siano ξ0 ∈ E, b0 = p(ξ0 ). Se
f, g ∈ C(In , 0; E, ξ0 ) e p ◦ f = p ◦ g = φ ∈ C(In , 0; B, b0 ), allora f e g sono {0}-
omotope in un’omotopia F : In × I − → E tale che p ◦ F (s; t) = φ(s) per ogni
(s, t) ∈ In × I.

Dim. Il caso n = 0 è banale. Possiamo quindi ragionare per ricorrenza, suppo-


nendo che n > 0 e la tesi sia vera per applicazioni di C(In−1 , 0; E, ξ0 ). In particolare
possiamo supporre che esista G : In−1 × I − → E continua tale che G(0; t) =
ξ0 per ogni t ∈ I e G(s1 , . . . , sn−1 ; 0) = f (s1 , . . . , sn−1 , 0), G(s1 , . . . , sn−1 ; 1) =
g(s1 , . . . , sn−1 , 0), p ◦ G(s1 , . . . , sn−1 ; t) = φ(s1 , . . . , sn−1 ; 0).
Definiamo un’applicazione continua h : bIn+1 \ {sn = 1} − → E mediante:

 f (s1 , . . . , sn )
 se t = 0
h(s1 , . . . , sn ; t) = g(s1 , . . . , sn ) se t = 1


G(s1 , . . . , sn−1 ; t) se sn = 0 .
202 XIII. GRUPPI DI OMOTOPIA

Definiamo φ̃(s; t) = φ(s) per ogni (s, t) ∈ In × I. Sia ψ : In+1 − → In+1 un omeo-
morfismo di In+1 in sè che trasformi bIn+1 \ {sn = 1} in bIn+1 ∩ {t = 0}. Per la
definizione di fibrato di Serre possiamo estendere h◦ψ −1 a un’applicazione continua
h̃ ◦ ψ −1 : In+1 −
→ E tale che p ◦ h̃ ◦ ψ −1 (s; t) = φ̃ ◦ ψ −1 (s; t) per ogni (s, t) ∈ In × I.
La h̃ definisce allora l’omotopia cercata.
p
Teorema 4.3 Sia E − → B un fibrato di Serre. Fissiamo un intero n ≥ 0 e siano
φ ∈ C(In+1 , B), f0 , f1 ∈ C(In+1 , E) tali che

p ◦ f0 = p ◦ f1 = φ
f0 (s′ , 0) = f1 (s′ , 0) ∀s′ ∈ In .

Allora esiste un’applicazione continua F : In+1 × I − → E tale che p ◦ F (s, t) = φ(s)


n+1
per ogni (s, t) ∈ I × I e F (s , 0, t) = f0 (s , 0) = f1 (s′ , 0) per ogni s′ ∈ In .
′ ′

Dim. La F cercata è il rialzamento di In+2 ∋ (s, t) −


→ φ(s) ∈ B tale che
 ′ ′ ′
 F (s , 0, t) = f0 (s , 0) = f1 (s , 0)
 ∀s′ ∈ In , ∀t ∈ I
F (s, 0) = f0 (s) ∀s ∈ In+1

∀s ∈ In+1 .

F (s, 1) = f1 (s)

§5 Fibrati localmente banali


Siano E, B spazi topologici e sia p : E −→ B un’applicazione continua. Sia F
p
uno spazio topologico. Diciamo E − → B è un fibrato localmente banale con fibra F
se per ogni punto
x ∈ B esiste un intorno aperto U di x in B e un omeomorfismo
φ:U ×F − → E U che renda commutativo il diagramma:

φ
U × F −−−−→ E U
 

πU y
p
y
U U .
Vale il seguente:
Teorema 5.1 Ogni fibrato localmente banale è un fibrato di Serre.
La dimostrazione si basa sul seguente criterio:
Lemma 5.2 Siano E, B spazi topologici e sia p : E − → B continua. Condizione
p
necessaria e sufficiente affinché E −
→ B sia un fibrato di Serre è che per ogni x ∈ B
p|p−1 (U )
vi sia un intorno U di x in B tale che p−1 (U ) −−−−−→ U sia un fibrato di Serre.

Dim. La condizione è chiaramente necessaria. Dimostriamo la sufficienza. Siano


f ∈ C(In , E) e F ∈ C(In+1 , B) tali che p◦f (s) = F (s, 0) per s ∈ In . Poiché F (In+1 )
è un compatto di B, possiamo ricoprirlo con un numero finito di aperti U1 , . . . , Uℓ
p|p−1 (U
j)
di B tali che p−1 (Uj ) −−−−−−→ Uj sia un fibrato di Serre per ogni j = 1, . . . , ℓ.
A questo punto suddividiamo il cubo In+1 in cubi Q1 , . . . , Qk , di lato 1/N , con
k = N n+1 , in modo tale che Qr ⊂ Ujr con 1 ≤ jr ≤ ℓ per 1 ≤ r ≤ k. Ordiniamo i
XIII. GRUPPI DI OMOTOPIA 203

cubi Qr in modo che i loro centri siano in ordine lessicografico. (Cioè: Q1 = {0 ≤


si ≤ 1/N per 1 ≤ i ≤ n + 1}, Q2 = {1/N ≤ s1 ≤ 2/N, e 0 ≤ si ≤ 1/N per 2 ≤
i ≤ n + 1}, . . .) Possiamo allora procedere alla costruzione di F̃ per ricorrenza
S
su r≤h Qr , definendo la F̃ su Qh in modo che p ◦ F̃ = F su Qh e coincida con
S S 
l’applicazione già definita su r<h Qr sull’intersezione r<h Qr ∩ Qh , utilizzando
S
l’omeomorfismo tra le coppie topologiche (In+1 , In ) e (Qh , r<h Qr ∩ Qh ).
Dimostrazione del teorema
p
Basta dimostrare che un fibrato banale B × F − → B, ove p(b, τ ) = b per ogni
(b, τ ) ∈ B × F è di Serre. Date f : In ∋ s − → (φ(s), ψ(s)) ∈ B × F e Φ :
n
I × I ∋ (s, t) − → Φ(s, t) ∈ B con Φ(s; 0) = φ(s), rialziamo Φ ponendo Φ̃(s; t) =
(Φ(s, t), ψ(s)) per ogni (s, t) ∈ In × I. Chiaramente Φ̃ è continua e p ◦ Φ̃ = Φ.

§6 Successione esatta di omotopia di un fibrato di Serre


a. Successioni esatte
Sia {Ak }k=0,1,... una successione di insiemi non vuoti, su ciascuno dei quali sia
fissato un punto base ak0 ∈ Ak . Una sequenza di applicazioni:
fn fn−1
· · · −−−−→ An −−−−→ An−1 −−−−→ An−2 −−−−→ · · ·
(6.1)
f2 f1
··· −−−−→ A2 −−−−→ A1 −−−−→ A0
si dice un complesso di insiemi puntati se

(6.2) fn (An ) ⊂ fn−1


1
(an−1
0 ) ∀n ≥ 1 .

La (6.1) è una successione esatta di insiemi puntati se

(6.3) fn (An ) = fn−1


1
(an−1
0 ) ∀n ≥ 1 .

Se gli Ak hanno ciascuno una struttura di gruppo, con identità ak0 , e se le fn (n ≥ 1)


sono omomorfismi di gruppi, diremo che (6.1) è un complesso o una successione
esatta di gruppi.
b. Definizione dell’applicazione ∆
Sia φ ∈ C(In , bIn ; B, b0 ). Possiamo allora trovare una f ∈ C(In , E) tale che
f (s) = ξ0 su {s ∈ bIn | 0 < sn ≤ 1} ∪ {(s′ , 0) | s′ ∈ bIn−1 }. Poiché φ(bIn ) = {b0 },
f (s′ , 0) ∈ F per ogni s′ ∈ In−1 . Perciò la restrizione di f a In−1 ≃ {s ∈ In | sn = 0}
definisce un elemento di C(In−1 , bIn−1 ; F, ξ0 ) e quindi una classe di omotopia [f |In−1 ]
in πn−1 (F, ξ0 ).
c.
p
Teorema 6.1 Sia E −
→ B un fibrato di Serre. Allora la successione:
ι p∗
. . . −−−−→ πn+1 (F, ξ0 ) −−−∗−→ πn+1 (E, ξ0 ) −−−−→ πn+1 (B, b0 )
∆ ι p∗
−−−−→ πn (F, ξ0 ) −−−∗−→ πn (E, ξ0 ) −−−−→ πn (B, b0 )
(6.4) · · · −−−−→ ··· ··· −−−−→ π2 (B, b0 )
∆ ι p∗
−−−−→ π1 (F, ξ0 ) −−−∗−→ π1 (E, ξ0 ) −−−−→ π1 (B, b0 )
∆ ι p∗
−−−−→ π0 (F, ξ0 ) −−−∗−→ π0 (E, ξ0 ) −−−−→ π0 (B, b0 )
204 XIII. GRUPPI DI OMOTOPIA

ι
è una successione esatta di insiemi puntati. Per n ≥ 1 le applicazioni πn (F, ξ0 ) −→ ∗

p∗ ∆
πn (E, ξ0 ), πn (E, ξ0 ) −→ πn (B, b0 ) e πn+1 (B, b0 ) −→ πn (F, ξ0 ) sono omomorfismi di
gruppi.

Dim. Il fatto che (6.4) sia un complesso di insiemi puntati e che p∗ , ι∗ , ∆ siano
omomorfismi di gruppi quando i due insiemi tra cui agiscono hanno una struttura
di gruppo, sono facili conseguenze delle definizioni. Dimostriamo l’esattezza.
Esattezza in πn (F, ξ0 ).
Sia f ∈ C(In , bIn ; F, ξ0 ), e supponiamo che ι∗ ([f ]) = 0. Ciò significa che esiste
un’applicazione continua F : In × I − → E tale che
 n
 F (s, 0) = f (s) ∀s ∈ I

F (s, t) = ξ0 ∀(s, t) ∈ (bIn ) × I

∀s ∈ In .

F (s, 1) = ξ0

Sia φ = p ◦ F . Allora φ ∈ C(In , bIn ; B, b0 ) e segue dalla definizione che [f ] = ∆([φ]).


Esattezza in πn (E, ξ0 )
Sia f ∈ C(In , bIn ; E, ξ0 ). Supponiamo che p∗ ([f ]) = 0. Ciò significa che esiste
una F : In × In −→ B continua tale che
 n
 F (s, 0) = p ◦ f (s) ∀s ∈ I

F (s, t) = b0 ∀(s, t) ∈ (bIn ) × I

∀s ∈ In .

F (s, 1) = b0

Possiamo allora rialzare F a una F̃ : In × I − → E continua con le proprietà:



 F̃ (s, 0) = f (s)
 ∀s ∈ In
F̃ (s, t) = xi0 ∀(s, t) ∈ (bIn ) × I


p ◦ F̃ (s, t) = F (s, t) ∀(s, t) ∈ In × I .

Allora la g : In ∋ s −→ F̃ (s, 1) ∈ F appartiene a C(In , bIn ; F, ξ0 ) e ι∗ ([g]) = [f ].


Esattezza in πn (B, b0 )
Sia φ ∈ C(In , bIn ; B, b0 ) e sia f ∈ C(In , bIn ; E, ξ0 ) tale che
 ′
 f (s , sn ) = ξ0
 ∀s = (s′ , sn ) ∈ (bIn−1 ) × I
f (s′ , 1) = ξ0 ∀s′ ∈ In−1

p ◦ f (s) = φ(s) ∀s ∈ In .

Supponiamo ∆([φ]) = 0. Allora esiste un’applicazione continua Φ : In−1 × I −


→F
con le proprietà:  ′ ′ ′ n−1
 Φ(s , 1) = f (s , 0) ∀s ∈ I

Φ(s′ , t) = ξ0 ∀s′ ∈ bIn−1

Φ(s′ , 0) = ξ0 ∀s′ ∈ In−1 .

Definiamo f ∈ C(In , bIn ; E, ξ0 ) ponendo:


 1
Φ(s′ , 2sn ) se 0 ≤ sn ≤ 2
f (s) = 1
f (s′ , 2sn − 1) se 2 ≤ sn ≤ 1 .
XIII. GRUPPI DI OMOTOPIA 205

Osserviamo che
 1
b0 se 0 ≤ sn ≤ 2
p ◦ f (s) = 1
φ(s′ , 2sn − 1) se 2 ≤ sn ≤ 1 .

Quindi p∗ ([f ]) = [p ◦ f ] = [b̂0 · φ] = [b̂0 ] · [φ] = [φ]. La dimostrazione è completa.


Un fibrato topologico localmente banale con fibra discreta si dice un rivestimento.
p
Corollario 6.2 Se E − → B è un rivestimento, ξ0 ∈ E e b0 = p(ξ0 ), allora
πn (E, ξ0 ) ≃ πn (B, b0 ) per ogni n ≥ 2, e per n = 1 abbiamo la successione esatta di
insiemi puntati:
p∗
(6.5) 0 −−−−→ π(E, ξ0 ) −−−−→ π1 (B, b0 ) −−−−→ π0 (F, ξ0 ) −−−−→ 0 .

Abbiamo indicato con 0 l’insieme (o il gruppo) che contengono un solo elemento.

§7 Esempi
Gruppi di omotopia delle sfere
Sappiamo dai risultati dei parabrafi precedenti che:

m 0 se n ≤ m − 1
(7.1) πn (S , e0 ) =
Z se n = m.

In generale i gruppi πm (Sm , e0 ) non sono banali se n > m.


Il problema di calcolare tutti i gruppi di omotopia di ordine > m della sfera Sm ,
per un m arbitrario, non è ancora completamente risolto. Sono stati calcolati tutti
i gruppi πn (Sm , e0 ) per n ≤ n + 23. Qui ci limitiamo a fornire una lista di risultati
sui gruppi di omotopia delle sfere di dimensione ≤ 4. Abbiamo:

1 Z se n=1
(7.2) πn (S , e0 ) =
0 altrimenti.


 0 se n ≤ 1




 Z se n = 2




 Z se n = 3




 Z2 se n = 4


 Z2 se n = 5
(7.3) πn (S2 , e0 ) =


 Z12 se n = 6




 Z2 se n = 7




 Z2 se n = 8




 Z3 se n = 9

... ...


3 0 se n≤2
(7.4) πn (S , e0 ) = 2
πn (S , e0 ) se n ≥ 3.
206 XIII. GRUPPI DI OMOTOPIA

L’uguaglianza segue qui dalla fibrazione di Hopf: infatti S2 è omeomorfo alla retta
proiettiva complessa CP1 . Allora l’applicazione naturale

S3 ⊂ C2 \ {0} ∋ z −
→ [z] ∈ CP1
p
definisce un fibrato localmente banale S3 −
→ S2 con fibra S1 . Dalla successione
esatta del fibrato:

··· −−−−→ πn+1 (S1 , e0 )

−−−−→ πn (S2 , e0 ) −−−−→ πn (S3 , e0 ) −−−−→ πn (S1 , e0 )

−−−−→ ···

otteniamo che πn (S3 , e0 ) ≃ πn (S2 , e0 ) per ogni n ≥ 2.


Ancora, abbiamo:

 0 se n ≤ 3




 Z se n = 4




 Z2 se n = 5




 Z2 se n = 6


 Z ⊕ Z12 se n = 7
(7.5) π(S4 , e0 ) =


 Z2 ⊕ Z2 se n = 8




 Z2 ⊕ Z2 se n = 9




 Z2 ⊕ Z24 se n = 10




 Z15 se n = 11

... ...

Gruppi di omotopia degli spazi proiettivi reali


Abbiamo per lo spazio proiettivo reale di dimensione 1:

1 Z se n = 1
(7.6) πn (RP , b) =
0 se n 6= 1

e per lo spazio proiettivo reale di dimensione n > 1:



 Z2 se n=1


0 se 1<n<m
(7.7) πn (RPm , b) =


 Z se n=m

πn (Sm , e0 ) se n ≥ 2.

Gruppi di omotopia degli spazi proiettivi complessi


L’applicazione p : S2m+1 ∋ z − → [z] ∈ CPm è, per ogni m ≥ 1, un fibrato
topologico localmente banale con fibra S1 . Dalla successione esatta di un fibrato
ricaviamo allora:

(7.8) πn (CPm , b) ≃ πn (S2m+1 , e0 ) ∀n ≥ 3 .


XIII. GRUPPI DI OMOTOPIA 207

Abbiamo poi la successione esatta:

0 ≃ π2 (S2m+1 , e0 ) −−−−→ π2 (CPm , b) −−−−→ Z ≃ π1 (S1 , e0 )


(7.9)
−−−−→ 0 ≃ π1 (S2m+1 , e0 ) −−−−→ π1 (CPm , b) −−−−→ 0

e quindi:

π1 (CPm , b) = 0
(7.10)
π2 (CPm , b) ≃ Z .

Gruppi di omotopia dei gruppi classici


I gruppi classici connessi sono prodotti topologici di fattori compatti, omeomorfi
ai gruppi compatti SO(n), U(n), Sp(n), e di fattori non compatti, omeomorfi a
spazi Euclidei. Sarà sufficiente quindi considerare i gruppi di omotopia dei gruppi
compatti.
Il gruppo SO(n).
Abbiamo già osservato che valgono gli omeomorfismi:
 1
 SO(2) ≃ S

SO(3) ≃ RP3

SO(4) ≃ S3 × RP3 .

Abbiamo quindi: 
Z se n=1
πn (SO(2), e) =
0 se n 6= 1 .

 Z2 se n = 1


0 se n = 2
πn (SO(3), e) =


 Z se n = 3
 3
πn (S , e0 ) se n > 3

 Z2 se n = 1


0 se n = 2
πn (SO(4), e) =


 Z⊕Z se n = 3
 3 3
πn (S , e0 ) ⊕ πn (S , e0 ) se n > 3 .
Se n ≥ 5 l’applicazione:

→ g(e0 ) ∈ Sn−1
SO(n) ∋ g −

definisce un fibrato localmente banale con fibra omeomorfa a SO(n − 1). Abbiamo
quindi la successione esatta:

··· −−−−→ πm+1 (Sn−1 , e0 )


(7.11) −−−−→ πm (SO(n − 1), e) −−−−→ πm (SO(n), e) −−−−→ πm (Sn−1 , e0 )

−−−−→ ···
208 XIII. GRUPPI DI OMOTOPIA

In particolare, poiché πm (Sn−1 , e0 ) = 0 se m < n − 1 e πm (Sn−1 , e0 ) ≃ Z se


m = n − 1, otteniamo:

(7.12) πm (SO(n), e) ≃ πm (SO(n − 1), e) se m < n − 2

e un omomorfismo surgettivo:

(7.13) πn−2 (SO(n − 1)) −


→ πn−2 (SO(n)) −
→0 per n ≥ 5.

In particolare

(7.14) π1 (SO(n), e) ≃ π1 (SO(3), e) ≃ Z2 ∀n ≥ 3 ,

(7.15) π2 (SO(n), e) ≃ π2 (SO(4), e) ≃ 0 ∀n ≥ 2 .

Consideriamo il caso n = 5, m = 3. Abbiamo allora:

··· −−−−→ Z ≃ π4 (S4 , e0 )

−−−−→ π3 (SO(4), e) ≃ Z ⊕ Z −−−−→ π3 (SO(5), e) −−−−→ 0 ≃ π3 (S4 , e0 )

−−−−→ ···

e quindi π3 (SO(n), e) è, per ogni n ≥ 5, un quoziente di Z ⊕ Z rispetto a un


sottogruppo abeliano libero.
Gruppi di omotopia di SU(m)
Il gruppo SU(2) è omeomorfo a S3 . Per m ≥ 3, l’applicazione

(7.16) → g(e0 ) ∈ S2m−1


SU(m) ∋ g −

definisce un fibrato localmente banale con fibra omeomorfa s SU(m−1). Otteniamo


quindi la successione esatta:
(7.17)
··· −−−−→ πn+1 (S2m−1 , e0 )

−−−−→ πn (SU(m − 1), e) −−−−→ πn (SU(m), e) −−−−→ πn (S2m−1 , e0 )

−−−−→ ···
da cui ricaviamo che:

(7.18) πn (SU(m), e) ≃ πn (SU(m − 1), e) se n < 2m − 1

e l’omomorfismo πn (SU(m − 1), e) −


→ πn (SU(m), e) è surgettivo per n = 2m − 1.
Abbiamo quindi per m ≥ 2:

 π1 (SU(m), e) = 0


 π (SU(m), e) = 0
2
(7.19)


 π3 (SU(m), e) = Z

π4 (SU(m), e) = Z2
XIII. GRUPPI DI OMOTOPIA 209

Gruppi di omotopia di Sp(m)


Abbiamo Sp(1) ≃ S3 . L’applicazione:

(7.20) → g(e0 ) ∈ S4m−1


Sp(m) ∋ g −

definisce un fibrato localmente banale con fibra Sp(m − 1). Otteniamo perciò una
successione esatta:

··· −−−−→ πn+1 (S4m−1 , e0 )


(7.21) −−−−→ πn (Sp(m − 1), e) −−−−→ πn (Sp(m), e) −−−−→ πn+1 (S4m−1 , e0 )

−−−−→ ···

Quindi:

(7.22) πn (Sp(m), e) ≃ πn (Sp(m − 1), e) se n ≤ 4m − 3.

In particolare

(7.23) πn (Sp(m), e) ≃ πn (S3 , e0 ) se n ≤ 5.

§8 Rivestimenti
In questo paragrafo tutti gli spazi topologici che considereremo saranno di Hau-
sdorff, connessi e localmente connessi per archi.
Chiamiamo rivestimento in senso stretto un fibrato topologico localmente banale
p
E −→ B in cui E e B sono spazi di Hausdorff connessi e localmente connessi per
archi, con fibre discrete.
Nel seguito useremo la parola rivestimento al posto della locuzione rivestimento
in senso stretto.
Osserviamo che la cardinalità delle fibre Eb = p−1 (b) di un rivestimento è local-
mente costante e quindi costante: essa si dice il numero di fogli del rivestimento.
Esempio 1
L’applicazione S1 ∋ z − → z n ∈ S1 è un rivestimento a n fogli.
L’applicazione R ∋ t − → e2πit = cos(2πt) + i sin(2πt) ∈ S1 è un rivestimento a
un’infinità numerabile di fogli.
Esempio 2
→ [x] ∈ RPn è un rivestimento a due fogli.
L’applicazione Sn ∋ x −
Esempio 3
Consideriamo la relazione di equivalenza ∼ su R2 generata dalle (x, y) ∼ (x, y+1)
e (x, y) ∼ (x+1, −y). La proiezione nel quoziente π : R2 − → R2 /∼ è un rivestimento
a infiniti fogli. (Il quoziente R /∼ è la bottiglia di Klein.)
2

Esempio 4
Sia p(z) ∈ C[z] un polinomio a coefficienti complessi di grado m ≥ 1 e sia K
l’insieme dei valori critici di C ∋ z −
→ p(z) ∈ C. Allora C \ p−1 (K) − → C \ K è un
rivestimento a m fogli.
210 XIII. GRUPPI DI OMOTOPIA

p
Teorema 8.1 (Rialzamento dei cammini) Sia E − → B un rivestimento e sia
s:I− → B un arco. Sia ξ0 ∈ E con p(ξ0 ) = s(0). Esiste un’unico arco s̃ : I −
→E
tale che
p ◦ s̃(t) = t ∀t ∈ I e s̃(0) = ξ0 .

Dim. Sia {Ui | i ∈ I} un ricoprimento aperto di B mediante aperti di trivializ-


zazione connessi, con omeomorfismi di trivializzazione φi : Ui × F − → p−1 (Ui ).
Poniamo φ−1 i (ξ) = (p(ξ), fi (ξ)) con fi (ξ) ∈ F . Possiamo trovare una partizione
0 = t0 < t1 < · · · < tk−1 < tk = 1 tale che s([tj−1 , tj ]) ⊂ Uij per j = 1, ..., k.
Definiamo allora per ricorrenza:

φi1 (s(t), ξ0 ) per 0 ≤ t ≤ t1
s̃(t) =
φij (s(t), fij (s̃(tj−1 ))) se 2 ≤ j ≤ k e tj−1 ≤ t ≤ tj .

Allora la s̃ : I −
→ E cosı́ definita è un arco che rialza s (cioè p◦s̃ = s) e s̃(0) = ξ0 . Per
dimostrare l’unicità, osserviamo che per ogni j = 1, ..., k l’immagine della [tj−1 , tj ] ∋
→ s̃(t) ∈ E è contenuta nella componente connessa φij Uij × f ij (s̃(tj−1 )) di
t −
−1
p (Uij ), su cui p definisce un omeomorfismo con Uij e quindi s̃ è univocamente
determinata su [tj−1 , tj ].
p
Teorema 8.2 (Rialzamento dell’omotopia) Sia E − → B un rivestimento.
Sia X uno spazio topologico connesso e localmente connesso per archi e siano f :
X− →E e Φ:X ×I− → B due applicazioni continue tali che p ◦ f (x) = Φ(x, 0) per
ogni x ∈ X. Allora esiste un’unica applicazione continua F : X × I − → E tale che
F (x, 0) = f (x) e p ◦ F = Φ.

Dim. Per ogni x ∈ X sia I ∋ t − → F (x, t) ∈ E il cammino continuo di punto


iniziale f (x) che rialza I ∋ t −→ Φ(x, t) ∈ B. In questo modo risulta univocamente
determinata un’applicazione X × I ∋ (x, t) − → F (x, t) ∈ E tale che F (x, 0) = f (x),
p ◦ F = Φ e continua rispetto alla variabile t ∈ I per ogni x fissato. Per dimostrare
che F è continua, fissato (x0 , t0 ) ∈ X × I, siano b0 = Φ(x0 , t0 ) e ξ0 = F (x0 , t0 ).
p
Sia U un intorno di b0 di trivializzazione per E − → B; sia F = Eb0 = p−1 (b0 ) e sia
ψ : U ×F − → p−1 (U ) un omeomorfismo di trivializzazione. Fissiamo un intorno
aperto connesso A di x0 in X e un interallo aperto J di I contenente t0 tali che
Φ(A × J) ⊂ U . Poiché ogni punto di A × J può essere congiunto a (x0 , t0 ) da un
arco in A × J, per l’unicità del rialzamento di cammini F (A × J) è tutto contenuto
in ψ(U × F (x0 , t0 )) e quindi F (x, t) = ψ(Φ(x, t), F (x0 , t0 )) è continua su A × J. Ciò
dimostra che F è continua. La dimostrazione è completa.
p
Teorema 8.3 Sia E − → B un rivestimento, con E, B spazi di Hausdorff connessi
e localmente connessi per archi. Siano ξ0 ∈ E e b0 = p(ξ0 ) ∈ B. L’applicazione
p∗ : π1 (E, ξ0 ) −
→ π1 (B, b0 ) è iniettiva.

Dim. Sia α ∈ C(I, {0, 1}; E, ξ0 ). Se F : I × I è una {0, 1}-omotopia tra p ◦ α e il


laccetto costante, il rialzamento F̃ di F tale che F̃ (s, 0) = α(s) per s ∈ I è, per il
teorema precedente, una {0, 1}-omotopia tra α e il laccetto costante.
p
Sia E −→ B un rivestimento, con E e B spazi di Hausdorff connessi e localmente
connessi per archi. Fissati ξ0 ∈ E e b0 ∈ B con p(ξ0 ) = b0 , sia F = Eb0 = p−1 (b0 ).
XIII. GRUPPI DI OMOTOPIA 211

Definiamo un’applicazione λ : C(I, {0, 1}; B, b0 ) −


→ F facendo corrispondere ad ogni
α ∈ C(I, {0, 1}; B, b0 ) l’estremo α̃(1) del suo rialzamento α̃ con punto iniziale ξ0 .
Abbiamo:
Teorema 8.4 L’applicazione λ : C(I, {0, 1}; B, b0 ) − → F definisce per passaggio
al quoziente un’applicazione λ∗ : π1 (B, b0 ) −→ F surgettiva. L’immagine inversa di
ξ0 mediante λ∗ è il sottogruppo p∗ π1 (E, ξ0 ).
La λ∗ identifica quindi F allo spazio delle classi laterali sinistre di p∗ π1 (E, ξ0 ) in
π1 (B, b0 ).

§9 Gruppi propriamente discontinui


Sia X uno spazio topologico e Sc (X) il gruppo degli omeomorfismi di X in sè.
Sia G un gruppo. Un’azione continua di G su X è un omomorfismo

(9.1) φ:G∋g−
→ {X ∋ x −
→ gx ∈ X} ∈ Sc (X) .

Diciamo che G opera su X in modo discreto se


(i) Per ogni x ∈ X l’orbita Gx = {gx | g ∈ G} è un sottospazio discreto di
X;
(ii) Ogni x ∈ X ha un intorno aperto U tale che U ∩ Gy contiene al più un
punto per ogni y ∈ X.
Diciamo che G opera in modo propriamente discontinuo se opera in modo discreto
ed inoltre
(iii) Se g ∈ G e g 6= e, allora g non ha punti fissi in X, cioè gx 6= x per ogni
x ∈ X.

Lemma 9.1 Supponiamo che il gruppo G agisca in modo propriamente disconti-


nuo su uno spazio di Hausdorff connesso X. Allora ogni g ∈ G che abbia un punto
fisso in X lascia fissi tutti i punti di X. L’insieme delle g ∈ G che lasciano fisso un
punto (e quindi tutti i punti di X) formano un sottogruppo normale H di G.
Per passaggio al quoziente il gruppo G H opera su X in modo propriamente
discontinuo.

Sia g ∈ G e supponiamo che Y = {x ∈ X | gx = x} sia non vuoto. Poiché X è


di Hausdorff, Y è chiuso. Sia ora x0 ∈ Y . Fissiamo un intorno U di x0 che incontri
ogni orbita di G in X in al più un punto. Poiché g è continua, esiste un intorno
aperto V di x0 in U tale che gV ⊂ U . Chiaramente gy = y per ogni y ∈ V . Ciò
dimostra che Y è anche aperto e quindi Y = X perché X è connesso.
Le rimanenti affermazioni del teorema seguono immediatamente.

Teorema 9.2 Sia E uno spazio di Hausdorff


 connesso e G un gruppo che agisce
p
su E in modo continuo. Sia B = E G e E − → B la proiezione nel quoziente.
p
Condizione necessaria e sufficiente affinché E −
→ B sia un rivestimento è che G
operi su E in modo discreto.

Dim. La condizione è chiaramente necessaria. Per dimostrare la sufficienza, pos-


siamo supporre che G operi in modo propriamente discontinuo. Fissato ξ0 ∈ E,
fissiamo un intorno aperto U di ξ0 in E che intersechi ogni orbita di G al più in un
212 XIII. GRUPPI DI OMOTOPIA

punto. Allora p(U ) è un aperto di B e la p(U ) × G ∋ (p(ξ), g) −→ gξ ∈ p−1 (p(U ))


p
è una trivializzazione locale. In questo modo definiamo su E −→ B la struttura di
fibrato localmente banale con fibra discreta.

Teorema 9.3 Sia E uno spazio topologico di Hausdorff connesso e localmente


connesso per archi, su cui il gruppo G opera in modo propriamente discontinuo.
Fissiamo ξ0 in E e b0 in B = E G , con b. 0 = p(ξ0 ). Allora p∗ π1 (E, ξ0 ) è un

sottogruppo normale di π1 (B, b0 ) e π1 (B, b0 ) p π (E, ξ ) ≃ G.


∗ 1 0

Dim. Sia [α] ∈ π1 (B, b0 ) con α ∈ C(I, {0, 1}; B, b0 ), sia α̃ il suo rialzamento con
punto iniziale ξ0 e sia g ∈ G l’unico elemento tale che gξ0 = α̃(1). Poiché α̃(1) è
univocamente determinato dalla classe di omotopia di α, otteniamo un’applicazione
ψ : π1 (B, b0 ) −
→ G. Essa è surgettiva perché E è connesso per archi. È un
omomorfismo di gruppi perchè, se α e α̃ sono definiti come sopra, il rialzato di α
con punto iniziale gξ0 è g α̃. Infine, il nucleo di ψ è p∗ π1 (E, ξ0 ).

§10 Automorfismi di un rivestimento


p p
Sia E −→ B un rivestimento. Un automorfismo di E − → B è un omeomorfismo
f :E− → E tale che p ◦ f = p.
p
Gli automorfismi di un rivestimento formano un gruppo Aut(E − → B) rispetto
al prodotto di composizione.
p
Fissiamo per il seguito un rivestimento E −
→ B e siano ξ0 ∈ E, b0 = p(ξ0 ) ∈ B,
F = Eb0 = p−1 (b0 ). Supponiamo inoltre che E e B siano di Hausdorff, connessi e
localmente connessi per archi.
p
Lemma 10.1 Se f, g ∈ Aut(E − → B) e f (ξ0 ) = g(ξ0 ), allora f = g. L’applicazione
p p
Aut(E −
→ B) ∋ f −→ f (ξ0 ) ∈ F è iniettiva e la Aut(E −→ B) ∋ f − → f F F ∈ S(F )
un monomorfismo di gruppi.
p
Dim. La prima affermazione segue dal fatto che, se f, g ∈ Aut(E −
→ B), allora
l’insieme A = {ξ ∈ E | f (ξ) = g(ξ)} è aperto e chiuso in E. Le rimanenti
affermazioni sono conseguenze della prima.
Dal lemma segue il:
p
Teorema 10.2 Il gruppo Aut(E −→ B) opera su E in modo propriamente discon-
tinuo.
p
Posto G = Aut(E −
→ B), abbiamo il diagramma commutativo:
̺ 
E −
→E G
pց ւω
B

in cui tutte le applicazioni sono di rivestimento. Sappiamo che


. ̺∗ (π1 (E, ξ0 )) è un
sottogruppo normale di π1 (E/G, ̺(ξ0 )) e che π1 (E/G, ̺(ξ0 )) ̺ (π (E, ξ )) ≃ G .
∗ 1 0
Abbiamo:
Proposizione 10.3 ω∗ (π1 (E/G, ̺(ξ0 ))) è il normalizzatore di p∗ (π1 (E, ξ0 )) in
π1 (B, b0 ).
214 XIII. GRUPPI DI OMOTOPIA

Dim. Sappiamo che

̺∗ (π1 (E, ξ0 )) ⊳ π1 (E/G, ̺(ξ0 ))

e quindi
p∗ (π1 (E, ξ0 )) = ω∗ ◦ ̺∗ (π1 (E, ξ0 )) ⊳ ω∗ (π1 (E/G, ̺(ξ0 ))).
Dunque ω∗ (π1 (E/G, ̺(ξ0 ))) ⊂ N(p∗ (π1 (E, ξ0 ))) e ci resta solo da dimostrare l’in -
clusione opposta.
A questo scopo mostriamo come ad ogni elemento [α] di N(p∗ (π1 (E, ξ0 ))) si
possa associare un automorfismo f[α] del rivestimento. Sia α ∈ C(I, {0, 1}; B, b0 )
un rappresentante di [α]. Dato ξ ∈ E, sia γ ∈ C(I, 0, 1; ξ0 , ξ) e consideriamo il
rialzamento α−1 ^ · p ◦ γ di α−1 · p ◦ γ con punto iniziale ξ0 . Dico che α−1^ · p ◦ γ(1)

dipende solo dal punto ξ e non dall’arco γ scelto. Se infatti γ ∈ C(I, 0, 1; ξ0 , ξ)
è un altro arco con punto iniziale ξ0 e stesso punto finale ξ, abbiamo γ ′ · γ −1 ∈
C(I, {0, 1}; E, ξ0 ) e per ipotesi il rialzamento del laccetto α−1 · p ◦ γ ′ · ◦γ · α con
punto iniziale ξ0 è ancora un laccetto in ξ0 . Ma questo implica che α−1 ^ · p ◦ γ(1) =
α−1^
· p ◦ γ ′ (1).

§11 Il Teorema di Van Kampen


Teorema 11.1 Sia X uno spazio topologico e siano A, B sottospazi di X tali che
X = A ∪ B ed A, B e A ∩ B siano tutti connessi per archi. Siano ιA : A ֒→ X,
ιB : B ֒→ X, θA : A ∩ B ֒→ A, θB : A ∩ B ֒→ B le applicazioni di inclusione. Fissato
x0 ∈ A ∩ B, sia N(A, B, x0 ) il sottogruppo normale del prodotto libero di gruppi
π1 (A, x0 ) ∗ π1 (B, x0 ), generato dall’insieme: {θA ∗ (ξ) ∗ θB ∗ (ξ −1 ) | ξ ∈ π1 (A ∩ B, x0 )}.
Allora:

π1 (A, x0 ) ∗ π1 (B, x0 )
(11.1) π1 (X, x0 ) ≃ .
N(A, B, x0 )
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 215

CAPITOLO XIV

GEOMETRIA DIFFERENZIALE DELLE CURVE

§1 Curve parametriche in Rn .
Una curva parametrica di classe C k in Rn è una applicazione differenziabile di
classe C k :

(1.1) → Rn
α:J −

definita su un intervallo J di R. Chiamiamo l’immagine α(J) di α il suo supporto.


Per semplicità supporremo sempre nel seguito che J = [a, b] sia un intervallo
compatto.
Diciamo che α è una curva regolare se k > 0 e

α̇(t) = Dα(t) 6= 0 ∀t ∈ J.

Diciamo che α è una curva chiusa (o un laccetto) di classe C k se J = [t0 , t1 ] è un


intervallo compatto e Di α(t0 ) = Di α(t1 ) per ogni i = 0, ..., k, aperta altimenti. La
curva α si dice semplice se è aperta e l’applicazione α è iniettiva oppure se è chiusa
e la sua restrizione a ogni sottointervallo proprio di J è iniettiva. Se [t0 , t1 ] ⊂ J
chiamiamo la restrizione
→ Rn
α|[t0 , t1 ] : [t0 , t1 ] −
arco di α da t0 a t1 .
→ Rn una curva parametrica differenziabile di classe C k e sia
Sia α : J −

σ : J′ −
→J

un diffeomorfismo di classe C k . Allora la

α ◦ σ : J′ −
→ Rn

è ancora una curva parametrica di classe C k , che si dice ottenuta da α per ripara-
metrizzazione. La riparametrizzazione definisce una relazione di equivalenza tra le
curve parametriche di classe C k . Le corrispondenti classi di equivalenza si dicono
curve geometriche o semplicemente curve. Si ricava immediatamente dal teorema
delle funzioni implicite:
Proposizione 1.1 Il supporto di una curva semplice regolare di classe C k è una
sottovarietà differenziabile di classe C k di dimensione 1 di Rn .
Due curve semplici, regolari, aperte, di classe C k sono equivalenti se e soltanto
se hanno lo stesso supporto.
216 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

Due curve chiuse, semplici, regolari, di classe C k sono equivalenti se e solo se


hanno lo stesso supporto e lo stesso punto iniziale.
Ricordiamo che un sottoinsieme L di Rn si dice un sottospazio affine se per ogni
coppia di punti x, y ∈ L la retta

xy = {tx + (1 − t)y|t ∈ R}

è contenuta in L. In questo caso, fissato y ∈ L,

L0 = {x − y|x ∈ L}

è un sottospazio vettoriale di Rn , che non dipende dalla scelta del punto y ∈ L usato
per definirlo. La dimensione di L0 come sottospazio vettoriale si dice dimensione
del sottospazio affine L. Un sottospazio affine di dimensione m si può descrivere in
forma parametrica mediante

(1) L = {x0 + s1 v1 + ... + sm vm |s1 , ..., sm ∈ R}

ove x0 è un qualsiasi punto di L e v1 , ..., vm una qualsiasi base di L0 , oppure in


forma implicita mediante

(2) L = {x ∈ Rn |ξ i (x) = ci i = 1, ..., n − m}

ove ξ 1 , ..., ξ n−m è una base dell’annullatore di L0 in (Rn )′ e ξ i (x0 ) = ci (i =


1, ..., n − m) per un qualsiasi punto x0 ∈ L.
Supponiamo che una curva α : J − → Rn di classe C k abbia il supporto contenuto
in un sottospazio affine L di dimensione m < k. Se L è descritto in forma
parametrica da (1), avremo su J

α(t) = x0 + s1 (t)v1 + ... + sm (t)vm

→ R di classe C k . In particolare la matrice


con funzioni s1 , ..., sm : J −

(3) (Dα(t), ..., Dk α(t))

ha rango minore o uguale a m in tutti i punti di J. Indicheremo nel seguito


con Aα
m (t) o semplicemente con Am (t) quando non vi sia ambiguità, la matrice
(Dα(t), ..., Dm α(t)) per m ≤ k.
Abbiamo, con le notazioni introdotte sopra:
Proposizione 1.2 Sia m un intero non negativo ed

→ Rn
α:J −

una curva di classe C m+1 tale che

rkAm (t) = rkAm+1 (t) = m

per ogni t ∈ J. Allora il supporto di α è contenuto in un sottospazio affine di


dimensione m e nessun arco di α è contenuto in un sottospazio affine di dimensione
m − 1.
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 217

Dim. Se m = 0, la curva α è costante e dunque la tesi è verificata. Supponiamo


m > 0. Segue dall’ipotesi che Dm+1 α(t) è in ogni punto di J combinazione lineare
di Dα, ..., Dm α e sono univocamente determinate applicazioni continue λ1 , ..., λm :
J− → R tali che

Dm+1 α(t) = λ1 (t)Dα(t) + ... + λm (t)Dm α(t)

per ogni t ∈ J. Fissiamo un punto t0 ∈ J e sia ξ 1 , ..., ξ n−m una base dell’annullatore
del sottospazio vettoriale di Rn generato da Dα(t0 ), ..., Dm α(t0 ). Definiamo le
funzioni di classe C 1 su J:
wi,j (t) = ξ j (Di α(t))
per i = 1, ..., m, j = 1, ..., n − m. Esse sono soluzione del problema di Cauchy
omogeneo:

 ẇi,j = wi+1,j
 i = 1, ..., m − 1
ẇm,j = λ1 (t)w1,j + ... + λm (t)wm,j i = m


wi,j (t0 ) = 0 i = 1, ..., m

e quindi sono identicamente nulle su J. In particolare ne segue che ξ j (α) è costante


su J e dunque il supporto di α è contenuto nel sottospazio affine L definito da
(2), con x0 = α(t0 ). L’ultima affermazione dell’enunciato è una conseguenza della
discussione precedente: se un arco di α fosse contenuto in un sottospazio affine di
dimensione minore di m, allora Am (t) avrebbe rango inferiore a m in qualche punto
di J.
Ricordando che una funzione analitica reale su un intervallo J che si annulli su
un sottoinsieme aperto di J si annulla identicamente su J, otteniamo:
Proposizione 1.3 → Rn una curva analitica reale. Sia
Sia α : J −

m = max{rkAn (t)|t ∈ J}.

Allora il supporto di α è contenuto in un sottospazio affine di dimensione m di Rn


e nessun arco di α è contenuto in un sottospazio affine di dimensione m − 1 di Rn .

Dim. Osserviamo che rkAm (t) = m su un arco di α. Applichiamo su questo arco


il ragionamento svolto nel teorema precedente: le funzioni analitiche ξ j (α) essendo
costanti su tale arco sono costanti su tutto J e otteniamo quindi la tesi.
Sia
→ Rn
α:J −
una curva differenziabile di classe C k con k ≥ n. Diciamo che essa è sghemba se

A(t) = An (t) = (Dα(t), ..., Dn α(t))

ha rango n in tutti i punti di J. Per la Proposizione 1.2 nessun arco di una curva
sghemba è contenuto in un sottospazio affine proprio di Rn . Fissato un punto
t0 ∈ J, associamo a tale punto i sottospazi affini:

L0 (t0 ) = {α(t0 )},


218 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

L1 (t0 ) = {α(t0 ) + sDα(t0 )|s ∈ R}


(retta tangente),

Lj (t0 ) = {α(t0 ) + s1 Dα(t0 ) + ... + sj Dj α(t0 )|s1 , ..., sj ∈ R}

(spazio osculatore di dimensione j) per j = 2, ..., n.


Essi sono caratterizzati dalla proprietà:
Sia d(x, y) = |x − y| la distanza su Rn associata a un qualsiasi prodotto scalare.
Allora
d(α(t), Lj (t0 )) = o(|t − t0 |j ).
Infatti, posto x0 = α(t0 ), vj = (j!)−1 Dj α(t0 ), abbiamo per la formula di Taylor:

α(t) = x0 + v1 (t − t0 ) + ... + vn (t − t0 )n + o(|t − t0 |n )

e dunque

d(α(t), Lj (t0 )) ≤ |vj+1 (t − t0 )j+1 + ... + vn (t − t0 )n + o(|t − t0 |n ).

Ricordiamo la formula della derivazione di una funzione composta (formula di Faà


di Bruno): se
f g
→ J′ −
J− →R
sono funzioni di classe C k (k ≥ 1) su intervalli J, J ′ ⊂ R, allora
X
Dk (g ◦ f )(t) = σ(k; a1 , ..., ak )(Dg(t))a1 ...(Dk g(t))ak )(Dm f )(g(t))
1≤m≤k
a1 +2a2 +...+kak =k
a1 +...+ak =m

ove i coefficienti multinomiali σ(k; a1 , ..., ak ) sono definiti da:

σ(k; a1 , ..., ak ) = k!/((1!)a1 a1 !...(k!)ak ak !).

Se dunque σ : J ′ − → Rn una curva di


→ J è un’applicazione di classe C k e α : J −
classe C k , per la curva di classe C k β = α ◦ σ avremo:

Aβk (t) = Aα σ
k (σ(t))Tk (t)

dove Tkσ (t) è una matrice k × k triangolare superiore della forma


 σ̇(t) ∗ ... ∗ 
2
 0 σ̇ (t) ... ∗ 
Tkσ (t) = 
 .. .. .. .. .

. . . .
0 0 ... σ̇ k (t)

§2. Decomposizioni di Gauss e di Gram.


XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 219

Dato un sottogruppo G del gruppo GL(n) degli automorfismi lineari di Rn ,


consideriamo su Rn le trasformazioni affini della forma

x−
→ gx + v

al variare di g in G e di v in Rn . Esse formano un gruppo, che si denota con G1 e


si dice il gruppo affine associato a G o la prima estensione del gruppo G. Esso è
isomorfo al sottogruppo di GL(n + 1) delle matrici della forma
 
1 0
v g

per (g, v) ∈ G × Rn . Si verifica facilmente che G è un sottogruppo chiuso di GL(n)


se e soltanto se G1 è un sottogruppo chiuso di GL(n + 1). Se g è l’algebra di Lie di
G, allora l’algebra di Lie g1 di G1 è data da:
 
0 0
g1 = { |v ∈ Rn , X ∈ g}.
v X

Osserviamo che in ogni caso G1 opera transitivamente su Rn : lo spazio Rn si


identifica quindi allo spazio omogeneo

Rn ≃ G1 /G.

Date due curve di classe C k :


→ Rn ,
α:J −
β : J′ −
→ Rn ,
diciamo che esse sono G1 -congruenti se possiamo trovare un diffeomorfismo σ :
J−→ J ′ di classe C k e un elemento g ∈ G1 tali che il diagramma
α
J −−−−→ Rn
 

σy
g
y
J ′ −−−−→ Rn
β

sia commutativo. Per lo studio della G1 -congruenza di curve, è utile premettere


alcuni risultati generali sulla decomposizione di matrici.
Introduciamo i seguenti sottogruppi di GL(n):

Z+ (n) = {(zij )|zii = 1, zij = 0 se i > j},

Z− (n) = {(zij )|zii = 1, zij = 0 se i < j},


D(n) = {(zij )|zii 6= 0, zij = 0 se i 6= j},
T+ (n) = {(zij )|zii 6= 0 zij = 0 se i > j},
T− (n) = {(zij )|zii 6= 0, zij = 0 se i < j}.
220 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

Gli ultimi due si dicono rispettivamente i gruppi delle matrici triangolari superiori
e triangolari inferiori invertibili, D(n) il gruppo delle matrici diagonali.
Data una matrice n × n
M = (mij )
indichiamo con
Mji11...j
...ih
h

il determinante della matrice h × h (mip ,jq )1≤p,q≤h . Poniamo per semplicità

1...h
Dh (M ) = M1...h

e conveniamo che
D0 (M ) = 1
per ogni matrice M .
Una matrice M si dice regolare se

Dh (M ) 6= 0 per h = 1, ..., n.

Teorema 1.4 (Decomposizione di Gauss) Data una matrice regolare M ,


risultano univocamente determinate tre matrici ζ ∈ Z− (n), δ ∈ D(n), z ∈ Z+ (n)
tali che
M = ζδz.
I coefficienti delle matrici ζ, δ, z sono funzioni razionali dei coefficienti di M .
La dimostrazione sarà suddivisa in una serie di lemmi.
Lemma 1.5 Se M ∈ gl(n) e z ∈ Z+ (n), allora per ogni 1 ≤ h ≤ n e 1 ≤ j1 < ... <
jh ≤ n abbiamo:
j1 ...jh j1 ...jh
M1...h = (M z)1...h .

Dim. Scriviamo
M = (M1 , ..., Mn )
M z = (M1′ , ..., Mn′ ).
Allora
Mj′ = M1 z1j + ... + Mj−1,j zj−1,j + Mj
e dunque
M1′ ∧ ... ∧ Mh′ = M1 ∧ ... ∧ Mh
per ogni h = 1, ..., n, da cui segue l’asserzione sui determinanti dei minori.
Lemma 1.6 Sia t = (tij ) ∈ T− (n). Allora:

(i) Dh (t) = t11 ...thh

1...(h−1)r
(ii) t1...h = trh Dh−1 (t).
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 221

Dim. La (i) è un caso particolare di (ii). Quest’ultima si ricava osservando che


1...(h−1)r
t1...h è uguale a 0 se r < h e per r ≥ h è il determinante della matrice triangolare
inferiore:  
t11 0 0 ... 0 0
 t21 t22 0 ... 0 0 
 . . . .. . .. 
 . . . . . .
. 
 . . . .
t th−1,2 th−1,3 . . . th−1,h−1 0 
h−1,1
th1 th2 th3 ... th,h−1 thr

Lemma 1.7 Ogni matrice regolare M si decompone in modo unico nella forma

M = tz

con t ∈ T− (n) e z ∈ Z+ (n).

Dim. Poniamo M = (mij ) e determiniamo i coefficienti xij per i > j risolvendo il


sistema lineare

(*) mℓ1 x1j + ... + mℓ(j−1) x(j−1)j = −mℓj ℓ = 1, ..., j − 1.

Questo ha una e una sola soluzione, perché il determinante della matrice dei suoi
coefficienti è Dk−1 (M ). Essa si calcola con la regola di Kramer, e dunque è funzione
razionale dei coefficienti di M . Posto xii = 1 e xij = 0 per i < j, abbiamo allora

M (xij ) = t ∈ T− (n)

e dunque, con z = (xij )−1 ∈ Z+ (n) otteniamo la decomposizione cercata. Vice-


versa, la condizione che M z −1 ∈ T− (n) è equivalente al fatto che i coefficienti di
(xij ) = z −1 soddisfino (*) e dunque la decomposizione è unica.
Utilizziamo i lemmi precedenti per calcolare i coefficienti tij della matrice t ∈
T− (n) ottenuti in questa decomposizione: per il Lemma 2.1, essendo M = tz
abbiamo:
j1 ...jh j1 ...jh
M1...h = t1...h
e dunque, per il Lemma 2.2:

1...(h−1)r 1...(h−1)r
M1...h = t1...h = trh Dh−1 (t) = trh Dh−1 (M ).

È quindi
1...(h−1)r
trh = M1...h /Dh−1 (M ).
La decomposizione di Gauss segue ora dall’osservazione che ogni matrice t ∈ T− (n)
si scrive in modo unico mediante:
t = ζδ
con ζ ∈ Z− (n) ove δ ∈ D(n) ha la stessa diagonale principale della matrice t.
222 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

Indichiamo con K+ (n) il sottogruppo di T+ (n) delle matrici triangolari superiori


ad elementi della diagonale principale positivi.
Teorema 1.8 (Decomposizione di Gram) Ogni matrice a ∈ GL(n) si decom-
pone in modo unico mediante
a = uk
con u ∈ O(n) e k ∈ K+ (n). Abbiamo u ∈ SO(n) se e soltanto se Det(A) > 0.
L’applicazione
O(n) × K+ (n) ∋ (u, k) −
→ uk ∈ GL(n)
è un diffeomorfismo analitico.

Dim. La decomposizione si può ottenere mediante il procedimento di ortogona-


lizzazione di Gram-Schmidt. Qui la deduciamo dalla decomposizione di Gauss:
questo procedimento ci consente di esplicitare meglio il carattere delle operazioni e
di ottenere formule per il calcolo dei coefficienti delle matrici della decomposizione.
Osserviamo che la matrice t aa è definita positiva e quindi regolare. Possiamo
quindi decomporla in un unico modo mediante:
t
aa = ζδz

con ζ ∈ Z− (n), δ ∈ D(n), z ∈ Z+ (n). Inoltre δ = diag(δ1 , ..., δn ) con

δh = Dh (t aa)/Dh−1 (t aa) > 0 per h = 1, ..., n.

Poiché t aa è simmetrica, dall’unicità della decomposizione di Gauss ricaviamo


ancora che
ζ = tz.
Sia √ p p
δ = diag( δ1 , ..., δn )
dove si è scelta la determinazione reale positiva della radice quadrata. Allora

k = δz ∈ K+ (n)

e abbiamo
t
aa = tkk.
Da questa uguaglianza segue immediatamente che

u = ak −1 ∈ O(n).

Infatti:
t
u u = tk −1 ta a k −1 = tk −1 tk k k −1 = I .
Abbiamo cosı̀ ottenuto la decomposizione di Gram a = uk. Essa è unica perché, se

a = uk

con u ∈ O(n) e k ∈ K+ (n), allora


t
aa =t kk
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 223

e k è unica per l’unicità della decomposizione di Gauss.


I coefficienti della diagonale principale della matrice k nella decomposizione di
Gram sono dati da:
s
Dh (t aa)
khh = .
Dh−1 (t aa)

Decomposizione di Gram nello spazio di Minkowski


La decomposizione di Gram si può generalizzare ad altri gruppi diversi dal
gruppo ortogonale euclideo. Ad esempio, consideriamo il gruppo O(1, n) delle
trasformazioni ortogonali rispetto al prodotto di Minkowski [ · | · ] su Rn+1 . Ri-
cordiamo che, posto
 
1 0 0 ... 0
 0 −1 0 . . . 0 
 
I1,n =  0 0 −1 . . . 0 
. .. .. .. .. 
 .. . . . . 
0 0 0 . . . −1
O(1, n) è il sottogruppo di GL(n + 1) delle matrici a per cui

t
aI1,n a = I1,n

e la sua algebra di Lie o(1, n) è formata dalle X ∈ gl(n + 1) tali che

t
XI1,n + I1,n X = 0

cioè dalle matrici della forma  


t
0 v
v Y
con v ∈ Rn e Y ∈ o(n). In questo caso otteniamo:
Teorema 1.9 Sia a ∈ GL(n + 1) e supponiamo che

[ae0 |ae0 ] > 0.

Allora possiamo decomporre a in modo unico nella forma:

a = uk

con u ∈ O(1, n) e k ∈ K+ (n + 1). L’applicazione

O(1, n) × K+ (n + 1) ∋ (u, k) −
→ uk ∈ GL(n + 1)

è iniettiva e analitica reale.

Dim. La dimostrazione è analoga a quella svolta per la decomposizione di Gram.


Osserviamo che t aI1,n a è regolare, in quanto la forma di Minkowski è non degenere
224 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

su ogni sottospazio che contenga un vettore di tipo tempo. Quindi t aI1,n a ammette
un’unica decomposizione di Gauss
t
aI1,n a = ζδz

con ζ ∈ Z− (n), δ ∈ D(n), z ∈ Z+ (n). Dall’unicità della decomposizione segue che


ζ =t z. Inoltre
δ = diag(k02 , −k12 , ..., −kn2 )
con numeri reali positivi k0 , ..., kn . Posto

∆ = diag(k0 , k1 , ..., kn ),

otteniamo
δ = ∆I1,n ∆.
Poniamo a questo punto
k = ∆z ∈ K+ (n + 1).
Otteniamo
t
aI1,n a =t kI1,n k.
Se poniamo
u = ak −1
risulta allora u ∈ O(1, n) e questo ci dà la decomposizione cercata. L’unicità segue
da considerazioni analoghe a quelle svolte per la decomposizione di Gram.

Curve in un gruppo di Lie di matrici


Concludiamo questo paragrafo dimostrando un teorema sui sottogruppi chiusi di
GL(n).
Teorema 1.10 (i) Sia G un sottogruppo chiuso di GL(n) e sia g ⊂ gl(n) la sua
algebra di Lie. Se
α:J − → G ⊂ GL(n)
è una curva di classe C 1 , allora

α−1 (t)α̇(t) ∈ g ∀t ∈ J.

(ii) Viceversa, se
A:J −
→g
è una curva differenziabile di classe C k , con k ≥ 0, t0 ∈ J, allora la soluzione del
problema di Cauchy lineare:

α̇(t) = α(t)A(t) t ∈ J
(C)
α(t0 ) = g0 ∈ G

→ G a valori in G di classe C k+1 .


è una curva α : J −

Dim. (i) Fissiamo un intorno U0 di 0 in g tale che

U0 ∋ X −
→ exp(X) ∈ Ue = exp(U0 )
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 225

sia un diffeomorfismo analitico di U0 su un intorno Ue dell’identità di G. Sia t̄ ∈ J,


ḡ = α(t̄). Allora possiamo trovare un intorno aperto connesso J0 di t̄ in J tale che
α(J0 ) ⊂ ḡUe . Risulta allora univocamente determinata una curva di classe C 1 in
U0 :
J0 ∋ t −
→ X(t) ∈ U0 ⊂ g
tale che
α(t) = ḡexp(X(t)) ∀t ∈ J¯
e
X(t̄) = 0.
Avremo allora, con
Y0 = Ẋ(t̄) ∈ g,
α̇(t̄) = ḡY0 ,
cioè α(t̄)−1 α̇(t̄) = Y0 ∈ g.
(ii) Osserviamo che, per il punto (i), per ogni funzione reale di classe C 1

J ∋t−
→g

abbiamo
d
exp(−X(t)) exp(X(t)) ∈ g
dt
per ogni t ∈ J. Più precisamente ricordando la formula di differenziazione dell’espo -
nenziale:
d
exp(−X(t)) exp(X(t)) = H(X(t))Ẋ(t)
dt
ove
I − e−Ad(X)
H(X) = exp(−X) exp(X)
Ad(X)
è un’applicazione analitica

g∋X−
→ H(X) ∈ gl(g)

con
H(0) = Idg .
Quindi il problema di Cauchy non lineare:
 d
exp(−X(t)) dt exp(X(t)) = H(X(t))Ẋ(t) = A(t)
X(t0 ) = 0

ammette un’unica soluzione, che è una funzione di classe C k+1 definita su un intorno
connesso J ′ di t0 in J, a valori in g. Allora

g0 exp(X(t))

è una curva di classe C k+1 definita su J ′ a valori in G e coincide con la soluzione α


del problema di Cauchy (C) per l’unicità. Questo argomento, ripetuto a partire da
un qualsiasi punto t̄ ∈ J per cui α(t̄) ∈ G, ci dice che l’insieme dei punti t ∈ J per
226 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

cui α(t) ∈ G è aperto J. Esso è anche chiuso perché abbiamo supposto G chiuso in
GL(n), quindi coincide con J perché è non vuoto contenendo t0 .

§2 Curve nello spazio Euclideo


Studiamo in questo paragrafo la congruenza di curve nello spazio Euclideo, cioè
rispetto al gruppo O1 (n) delle isometrie di Rn . Indichiamo con ( · | · ) il prodotto
scalare canonico di Rn e con | · | la norma associata. Data una curva

→ Rn
α : [t0 , t1 ] −

definita e di classe C 1 su un intervallo compatto [t0 , t1 ], definiamo la sua lunghezza


mediante Z t1
ℓ(α) = |α̇(t)|dt.
t0

Le formule di cambiamento di variabili dell’integrale ci dicono che la lunghezza di


una curva non dipende dalla sua parametrizzazione. Nel caso di una curva semplice
il cui supporto sia un segmento, la lunghezza coincide con la lunghezza del segmento
definita nella geometria elementare. Inoltre, se consideriamo l’immagine della curva
α mediante una isometria:
β(t) = uα(t) + v
con u ∈ O(n) e v ∈ Rn fissati, abbiamo

β̇(t) = uα̇(t)

e dunque
|β̇(t)| = |α̇(t)|
su [t0 , t1 ]. La lunghezza di una curva è dunque invariante per isometrie di Rn .
Supponiamo ora che due curve

→ Rn
αi : Ji −

(i = 1, 2) di classe C k , con k ≥ 1 siano O1 (n) congruenti e sia


α
1
J1 −−−− → Rn
 

σy
g
y
α
2
J2 −−−− → Rn

un diagramma commutativo che descrive la congruenza, con σ : J1 − → J2 un


diffeomorfismo di classe C k e g ∈ O1 (n). Per restrizione esso definisce una O1 (n)
congruenza di qualsiasi arco di α1 sull’arco corrispondente di α2 e dunque avremo,
fissato t0 ∈ J1 :
Z t Z σ(t)
|α̇1 (ξ)|dξ = |α̇2 (ξ)|dξ
t0 σ(t0 )

per ogni t ∈ J1 .
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 227

Sia ora
→ Rn
α:J −
una curva regolare di classe C k (k ≥ 1). Allora, fissato t0 ∈ J, la funzione
Z t
s(t) = |α̇(ξ)|dξ
t0

è un diffeomorfismo di classe C k , strettamente crescente, di J su un intervallo J ′


di R. La curva
β = α ◦ s−1 : J ′ −
→ Rn
si dice ottenuta riparametrizzando α per lunghezza d’arco. Essa gode della proprietà
che
|β̇(s)| = 1 ∀s ∈ J ′ .
Una curva di classe C k con k ≥ 1 che goda di questa proprietà si dice parametrizzata
per lunghezza d’arco. Useremo di solito la lettera s per il parametro lungo una
curva parametrizzata per lunghezza d’arco e la lettera t per indicare che non si
pongono speciali condizioni sulla parametrizzazione. Due diverse parametrizzazioni
per lunghezza d’arco si ottengono l’una dall’altra per trasformazioni di R della
forma:
s−→ ±s + s0
(isometrie di R).
Da questa discussione segue il:
Lemma 2.1 Siano αi : Ji − → Rn (i = 1, 2) due curve parametrizzate per lunghezza
d’arco. Se esse sono O1 (n) congruenti, è possibile determinare g ∈ O1 (n), ǫ = ±1,
s0 ∈ R tali che
α2 (s) = gα1 (ǫs + s0 ).

Ricaviamo ora dalla decomposizione di Gram gli invarianti euclidei di una curva
sghemba. Sia
α:J − → Rn
una curva sghemba. Indichiamo con A(t) la matrice di GL(n):

A(t) = (Dα(t), ..., Dn α(t)).

Applichiamo ad A(t) la decomposizione di Gram: abbiamo

A(t) = E(t)K(t)

con
E(t) = (e1 (t), ..., en (t)) ∈ O(n)
e
K(t) ∈ K+ (n).
Osserviamo che, se α è di classe C k con k ≥ n, allora i coefficienti di E(t) sono
funzioni di classe C k−n+1 e quelli di K(t) sono funzioni di classe C k−n .
228 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

La matrice E(t) si dice il riferimento di Frenet lungo la curva α. Le sue colonne


e1 (t), ..., en (t) sono dette:
e1 (t) versore tangente
e2 (t) versore normale
e3 (t) versore binormale .
... ...
en (t) versore (n − 1)-normale
Se dovremo considerare contemporaneamente il riferimento di Frenet di più curve,
indicheremo la curva considerata a esponente. Scriveremo cioè E α , eα
i invece di E ed
ei . Il riferimento di Frenet lungo una curva dipende soltanto dall’orientazione della
curva: abbiamo osservato che un cambiamento σ della parametrizzazione cambia
A(t) in una matrice
A(σ(t))Tnσ (t)
ove Tnσ (t) è una matrice diagonale superiore con diagonale principale

(σ̇(t), σ̇(t)2 , ..., σ̇ n (t))

e dunque avremo
E ασ (t) = E α (σ(t))
se σ̇ > 0 (la riparametrizzazione conserva il verso della curva)
 
−1 0 0 . . . 0
 0 1 0 ... 0 
 
E ασ (t) = E α (σ(t))  0 0 −1 . . . 0 
 . .. .. .. .. 
 .. . . . . 
0 0 0 . . . (−1)n
se σ̇ < 0 (la riparametrizzazione cambia il verso della curva). In quest’ultimo caso
sarà eα i ασ
i (σ(t)) = (−1) ei (t) per i = 1, ..., n.
Se la curva α è parametrizzata per lunghezza d’arco, allora i coefficienti sulla
diagonale principale della matrice triangolare superiore K(t) nella decomposizione
di Gram di A(t) sono degli invarianti della curva. Osserviamo che k11 = 1 e
dunque gli elementi dalla diagonale di K(t) definiscono lungo la curva n−1 funzioni
invarianti rispetto all’azione di O1 (n). Definiamo a partire da essi le curvature di
α mediante:
ki+1,i+1 (s)
ki (s) = .
kii (s)
Se non supponiamo la curva parametrizzata per lunghezza d’arco avremo

ki+1,i+1 (t)
ki (t) = .
kii (t)|α̇(t)|

L’espressione trovata nel paragrafo precedente per i coefficienti kii ci permette di


esprimere le curvature mediante la matrice A(t):
s
Di+1 (t A(t)A(t)) · Di−1 (t A(t)A(t))
ki (t) = .
Di2 (t A(t)A(t)) · |α̇(t)|2
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 229

Il Teorema 2.4. nel caso del gruppo ortogonale dà:


Lemma 2.2 (i) Se
J ∋t−
→ O(n)

è una curva differenziabile di classe C 1 , allora

E −1 (t)Ė(t) =t E(t)Ė(t) ∈ o(n) ∀t ∈ J.

(ii) Assegnato un intervallo J in R, un punto t0 ∈ J, un elemento u0 ∈ O(n) e una


curva
X:J − → o(n)

di classe C k con k ≥ 0, la soluzione del problema di Cauchy:



Ė(t) = E(t)X(t) t ∈ J
E(t0 ) = u0

è una curva di classe C k+1 a valori in O(n).

Dim. Diamo una dimostrazione indipendente dal Teorema 2.4. (i) Differenziando
l’identità
t
E(t)E(t) = Id

troviamo

t
(*) E ′ (t)E(t) +t E(t)E ′ (t) = 0,

cioè, ponendo X(t) =t E(t)E ′ (t) = E(t)−1 E ′ (t),

t
X(t) + X(t) = 0

che ci dice che X(t) ∈ o(n).


(ii) Poniamo M (t) =t E(t)E(t), ove E è la soluzione del problema di Cauchy in
(ii). Differenziando M abbiamo allora

M ′ (t) = M (t)X(t) − X(t)M (t).

Poiché M (t0 ) = Id ne segue che M (t) = Id per ogni t ∈ J e quindi E(t) ∈ O(n).

Teorema 2.3 Sia


→ Rn
α:J −

una curva sghemba e sia


E:J −
→ O(n)

il suo riferimento di Frenet. Allora la matrice antisimmetrica

Ω(t) = E −1 (t)E ′ (t)


230 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

è della forma:
 0 −k1 (t) 0 0 ... 0 0 
 k1 (t) 0 −k2 (t) 0 ... 0 0 
 
 0 k2 (t) 0 −k3 (t) ... 0 0 
 
Ω(t) = |α̇(t)|  0 0 k3 (t) 0 ··· 0 0 .
 . .. .. .. .. .. .. 
 . . 
 . . . . . . 
 
0 0 0 0 ... 0 −kn−1 (t)
0 0 0 0 ... kn−1 (t) 0

Dim. I coefficienti della matrice Ω(t) = (ωij ) sono dati da

ωij = (ei (t)|ėj (t)).

Poiché ej (t) è combinazione lineare di Dα(t), ..., Dj α(t), ėj (t) è combinazione li-
neare di Dα(t), ..., Dj α(t), Dj+1 α(t) e dunque ortogonale a ei se i > j + 1. Essendo
Ω(t) antisimmetrica, si conclude che ωij (t) = 0 se |i − j| 6= 1.
Per calcolare i coefficienti di Ω(t), supponiamo dapprima che α sia di classe
C n+1 . Allora la A(t) e quindi anche la K(t) nella decomposizione di Gram di A(t)
è di classe C 1 . Posto
A′ (t) = A(t)M (t)
otteniamo:

(*) Ω(t) = K(t)M (t)K −1 (t) − K ′ (t)K −1 (t).

La matrice M (t) è della forma


0 0 0 ... 0 λ1 (t) 
1 0 0 ... 0 λ2 (t) 
 
0 1 0 ... 0 λ3 (t) 
M (t) = 
 .. .. .. . . .. .. 

. . . . . . 
 
0 0 0 ... 0 λn−1 (t)
0 0 0 ... 1 λn (t)

e quindi possiamo facilmente calcolare ωi+1,i usando (*). Il secondo addendo a


secondo membro è triangolare superiore e quindi non dà contributo. Otteniamo
perciò
ki+1,i+1 (t)
ωi+1,i (t) =
kii (t)
da cui segue la tesi. Se α è solo di classe C n , possiamo approssimarla uniformemente
con le derivate fino all’ordine n sui sottoinsiemi compatti di J (per il teorema di
Stone-Weierstrass) con una successione αn di curve sghembe di classe C ∞ . Per
ciascuna di esse vale la conclusione del teorema e dunque l’enunciato segue per
passaggio al limite, in quanto sia i coefficienti delle matrici Ωn (t) che quelli delle
matrici Kn (t) associate alle αn convergono a quelli di Ω(t) e di K(t) per ogni punto
t ∈ J.

Il sistema di equazioni
E ′ (t) = E(t)Ω(t)
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 231

soddisfatto dal riferimento di Frenet della curva α si dice sistema di equazioni di


Frenet della curva. Esso è descritto completamente dalle funzioni di curvatura, che
abbiamo visto essere invarianti euclidei della curva. Esplicitiamo tale sistema di
equazioni:
ė1 (t) = v(t)k1 (t)e2 (t)
ė2 (t) = v(t)[−k1 (t)e1 (t) + k2 (t)e3 (t)]
ė3 (t) = v(t)[−k2 (t)e2 (t) + k3 (t)e4 (t)]
...
ėn−1 (t) = v(t)[−kn−2 (t)en−2 (t) + kn−1 (t)en (t)]
ėn (t) = −v(t)kn−1 (t)en−1 (t)
ove abbiamo posto
v(t) = |α̇(t)|.
Otteniamo quindi:
Teorema 2.4 (i) Siano αi : Ji − → Rn due curve sghembe. Condizione necessaria
e sufficiente affinché siano O1 (n) congruenti è che, avendole parametrizzate per
lunghezza d’arco, dette kji (s) le curvature delle due curve (i = 1, 2, j = 1, ..., n − 1)
risulti con ǫ = ±1 e un s0 ∈ R):

s−
→ ǫs + s0

è bigettiva da J2 su J1 e
kj1 (s) = kj2 (ǫs + s0 ) ∀s.
(ii) Assegnate n − 1 funzioni continue a valori positivi:

→R
kj : J −

di classe C k ,con k ≥ 0, un punto t0 ∈ J, un punto x0 ∈ Rn e un elemento u ∈ O(n),


possiamo trovare una e una sola curva α : J − → Rn , parametrizzata per lunghezza
d’arco, con α(t0 ) = x0 , avente in t0 riferimento di Frenet u, e avente le kj (t) come
funzioni di curvatura.

Dim. (i) La condizione è ovviamente necessaria. Per dimostrare la sufficienza,


possiamo supporre che le due curve αi siano definite sullo stesso intervallo J e non
è restrittivo supporre che 0 ∈ J e che le curvature delle due curve siano uguali per
uguali valori del parametro:

kjα1 (s) = kjα2 (s) = kj (s) ∀s ∈ J ∀j = 1, ..., n − 1.

Risulterà allora associata alle due curve la stessa matrice

Ωα1 (s) = Ωα2 (s) = Ω(s)

data da
Ω(s) = (kj (s)[δi,j+1 − δj,i+1 ])i,j=1,...,n .
Allora i riferimenti di Frenet E αi (s) delle due curve soddisfano lo stesso sistema di
equazioni differenziali ordinarie:

(*) E ′ (s) = E(s)Ω(s) su J.


232 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

Sia u = E α1 (0) ∈ O(n), w = E α2 (0) ∈ O(n). Allora per l’esistenza e unicità della
soluzione di (*) per una condizione iniziale E(0) = g ∈ O(n) assegnata, troviamo
che deve essere
E α2 (s) = wu−1 E α1 (s) ∀s ∈ J.
Quindi, posto g = wu−1 , avremo in particolare

α̇2 (s) = g α̇1 (s) ∀s ∈ J

da cui
α2 (s) = gα1 (s) + x0 ∀s ∈ J
per un opportuno x0 ∈ Rn . (ii) La curva cercata è l’unica soluzione delle equazioni
di Frenet e del sistema
α̇(t) = e1 (t)
con le condizioni iniziali assegnate.
Questo teorema ci dice che la lunghezza d’arco e le curvature costituiscono
un sistema completo di invarianti indipendenti per le curve sghembe dello spazio
euclideo. Dalla discussione della O1 (n) congruenza si deduce immediatamente
quella della SO1 (n) congruenza. In questo caso dobbiamo prendere in conside-
razione un altro invariante delle curve parametriche sghembe: il segno del deter-
minante della matrice A(t) = (Dα, ..., Dn α). Se questo è positivo, diciamo che la
curva parametrica α ha torsione positiva, se è negativo diciamo che la curva ha
torsione negativa. Si dice torsione della curva la n − 1-esima curvatura con il segno
+ se la torsione è positiva e con il segno − se la torsione è negativa. Osserviamo che
il segno della torsione è il determinante del riferimento di Frenet. Un cambiamento
dell’orientazione di una curva parametrica in Rn ne cambia il segno della torsione
se il numero n(n + 1)/2 è dispari, mantiene inalterato il senso della torsione se esso
è pari. Abbiamo dunque:
Teorema 2.5 Se n(n+1)/2 è dispari, due curve sghembe sono SO1 (n) congruenti
se e soltanto se sono O1 (n) congruenti. Se n(n + 1)/2 è pari, due curve sghembe
sono SO1 (n) congruenti se e soltanto se hanno torsione dello stesso segno e sono
O1 (n) congruenti.
In uno spazio euclideo di dimensione n con n(n + 1)/2 pari si usano definire
levogire le curve con torsione positiva e destrogire le curve con torsione negativa. Il
significato geometrico del segno della torsione è diverso a seconda che la dimensione
n dello spazio sia pari o dispari. Nel caso della dimensione dispari è il seguente: i
vettori e1 , ..., en−1 del riferimento di Frenet in un punto α(t) di una curva sghemba
α:J − → Rn determinano univocamente un iperpiano e su di esso un’orientazione.
Risulta cioè univocamente indviduato un vettore n tale che (e1 , ..., en−1 , n) ∈
SO(n). Diremo che i punti

x = α(t) + ξ 1 e1 + ... + ξ n−1 en−1 + ξ n n

con ξ n = 0 appartengono all’iperpiano osculatore, quelli con ξ n > 0 appartengono


al semipiano superiore, quelli con ξ n < 0 al semipiano inferiore. Se la torsione di α
è positiva, allora potremo trovare un ǫ > 0 tale che α(t′ ) appartenga al semipiano
superiore se t < t′ < t + ǫ, al semipiano inferiore se t − ǫ < t′ < t. La situazione
si scambia nel caso la torsione sia negativa. Se la dimensione n è pari, allora un
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 233

arco della curva contenente α(t) sarà tutto contenuto nel semispazio superiore se
la torsione è positiva, nel semipiano inferiore se la torsione è negativa.
Riscriviamo in particolare le equazioni di Frenet per curve piane e curve nello
spazio ordinario.
In R2 , le equazioni di Frenet di una curva parametrizzata per lunghezza d’arco
sono date da:

ė1 = k(s)e2
ė2 = −k(s)e1

In R3 le equazioni di Frenet di una curva parametrizzata per lunghezza d’arco


sono date da: 
 ė1 = −k1 (s)e2

ė2 = −k1 e1 + k2 (s)e3


ė3 = −k2 (s)e2

Esempi
1. In R2 le curve con curvatura costante sono archi di circonferenza: infatti per
R ∋ k > 0,il sistema 
ė1 = ke2
ė2 = −ke2
con (e1 (s), e2 (s)) ∈ O(2) ha soluzione generale
 
cos(ks + s0 )
e1 (s) =
sin(ks + s0 )
 
− sin(ks + s0 )
e2 (s) =
cos(ks + s0 )
e dunque le curve con curvatura costante k sono descritte da:
 
k −1 sin(ks + s0 ) + a
α(s) =
−k −1 cos(ks + s0 ) + b

con a, b ∈ R. Osserviamo che una curva che descrive una circonferenza risulterà
avere torsione positiva o negativa a seconda che ne descriva la frontiera (per valori
crescenti del parametro) in senso antiorario o orario.
2. Consideriamo ora curve in R3 con curvature k1 , k2 > 0 costanti. Fissiamo un
angolo θ ∈ (0, π/2) tale che
tan θ = k1 /k2 .
Se (e1 (s), e2 (s), e3 (s)) è il riferimento di Frenet lungo una curva con curvature
k1 , k2 > 0 costanti, consideriamo il vettore

w(s) = e1 (s) cos θ + e3 (s) sin θ.

Abbiamo allora per le equazioni di Frenet:

(*) ẇ(s) = k1 e2 (s) cos θ − k2 e2 (s) sin θ = 0


234 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

e dunque w(s) = w è un vettore costante. Ricaviamo quindi:

(e1 (s)|w) = cos θ = costante.


 
1
Da questa otteniamo, se per esempio fissiamo w =  0 ,
0
 
cos θ
e1 (s) =  sin θ cos(hs + s0 ) 
sin θ sin(hs + s0 )

con
k1
h=
sin θ
e da questa ricaviamo che la curva cercata è isometrica a una curva della forma
 
(cos θ)s
α(s) =  −h−1 (sin θ) sin(hs) 
h−1 (cos θ) cos(hs)

a meno di traslazioni del parametro s e dell’azione del gruppo O1 (n).


Infatti la curva α si proietta in una curva piana β, con riferimento di Frenet
(ǫ1 , ǫ2 ) i cui vettori sono le proiezioni di e1 , e2 sul piano (x2 , x3 ), divise per sin θ.
Le equazioni di Frenet della curva β si ricavano da quelle della curva α e sono date
da: (
k1
ǫ̇1 = sin θ ǫ2
k1
ǫ̇2 = − sin θ ǫ1 .

La conclusione segue quindi dalla discussione delle curve piane a curvatura costante
dell’esempio 1.
Curve di questo tipo si dicono eliche circolari.
In generale la condizione che il rapporto tra le due curvature sia costante implica
che la tangente alla curva α in ogni punto forma un angolo costante con una
direzione assegnata w: infatti la (*) vale quando k1 /k2 = costante = tan θ. Curve
con questa proprietà si dicono eliche.
Consideriamo un’elica generale. Definiamo la curva:

β(t) = α(t) − tw cos θ.

Abbiamo
d
(w|β) = (e1 |w) − cos θ = 0
dt
e dunque la curva β è una curva piana su un piano affine

(w|x) = costante.

Indichiamo con
(ǫ1 , ǫ2 )
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 235

il riferimento di Frenet della curva piana β. Allora abbiamo:

e1 − w cos θ
ǫ1 =
sinθ
e dunque la curva β verifica le equazioni:
(
ǫ̇1 = ksin
1 (s)
θ ǫ2
(**) k1 (s)
ǫ̇2 = − sin θ ǫ1

dove s è ancora il parametro di lunghezza d’arco lungo la curva α.


Troviamo quindi l’equazione generale di un’elica nella forma:

α(s) = β(s) + sw cos θ

per una curva piana β in un piano ortogonale a w, la cui forma si ricava dall’equa -
zione (**).

§3 Complementi sulle curve nello spazio Euclideo


.
→ Rn è una curva di classe C n con
Se α : J −

An−1 = (Dα(t), ..., Dn−1 α(t))

di rango n − 1 per tutti i t ∈ J, per mezzo del procedimento di ortogonalizzazione


di Gram-Schmidt risulta associata ad essa una curva

E:J −
→ SO(n)

tale che
A(t) = (Dα(t), ..., Dn−1 α(t), Dn α(t)) = E(t)K(t)
dove K(t) è una matrice triangolare superiore

K(t) = (kij (t))

con kii (t) > 0 per i < n, mentre knn (t) può assumere qualsiasi valore reale. Come
abbiamo osservato nel §2, il numero
−1
τ (t) = |α̇(t)|−1 kn−1,n−1 (t)knn (t)

è la torsione della curva α in t.


Curve piane
Nel caso di una curva piana, la torsione si dice curvatura della curva orientata e
i punti in cui essa cambia di segno si dicono flessi della curva piana.
Nel caso di una curva piana, poiché SO(2) si può identificare a S 1 mediante
l’isomorfismo di gruppi abeliani moltiplicativi:
 
1 iθ cos θ − sin θ
S ∋e − → ρ(θ) = ∈ SO(2)
sin θ cos θ
236 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

il riferimento di Frenet in SO(2) si può identificare a una curva

→ S1
J−

che si rialza al rivestimento universale R di S 1 come una applicazione differenziabile:

→R
θ:J −

univocamente determinata quando se ne fissi il valore in un punto t0 ∈ J.


Le equazioni di Frenet hanno allora la forma:

d
ρ(θ(t)) = ρ(θ(t))Ω(t)
dt

e, poiché
d  π π 
ρ(θ) = ρ θ + = ρ(θ)ρ
dθ 2 2
otteniamo π
θ̇(t)ρ (θ(t)) ρ = ρ(θ)Ω(t).
2
Ora, possiamo scrivere
π
Ω(t) = k(t)|α̇(t)|ρ( )
2
dove k(t) è la curvatura della curva orientata α in t, e dunque le equazioni di Frenet
si riducono all’unica equazione scalare:

θ̇(t) = |α̇(t)|k(t).

Se α è parametrizzata per lunghezza d’arco, otteniamo la formula per la curvatura


orientata:

k=
ds
Possiamo quindi determinare una curva piana, nota la sua curvatura orientata in
funzione della lunghezza d’arco, mediante due quadrature: avremo infatti
Z s
θ(s) = θ0 + k(ξ)dξ
s0

e le componenti x(s) e y(s) di α rispetto alle coordinate cartesiane di R2 si ottengono


da: Z s
x(s) = x0 + cos(θ(ξ))dξ
s0
Z s
y(s) = y0 + sin(θ(ξ))dξ.
s0

Esempio. Determiniamo una curva piana α con la proprietà che la sua tangente
in ogni punto α(t) formi un angolo costante φ ∈ [0, π/2] con la retta uscente
dall’origine e passante per il punto α(t).
XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE 237

È conveniente introdurre coordinate polari, cioè cercare la curva nella forma



x = r(t) cos(θ(t))
y = r(t) sin(θ(t)).

La tangente alla curva in t è data da:


   
cos(θ(t)) − sin(θ(t))
ṙ(t) + rθ̇ .
sin(θ(t)) cos(θ(t))

Dalla condizione:
|α̇|−1 |α|−1 (α̇|α) = cos φ
ricaviamo: q
ṙ(t) = cos φ ṙ2 (t) + r2 θ̇2 (t).
Calcolando i quadrati delle due espressioni otteniamo:

ṙ(t)
sin φ = ±θ̇(t) cos φ
r(t)

e dunque integrando otteniamo, a seconda della scelta del segno, le due curve:

log r(t) sin φ = costante + θ(t) cos φ

log r(t) sin φ = costante − θ(t) cos φ.


I due casi estremi sono rappresentati da φ = 0, π/2: nel primo θ è costante e la
curva è una semiretta uscente dall’origine. Nel secondo r è costante e la curva è
una circonferenza con centro nell’origine. Se 0 < φ < π/2, possiamo usare θ come
parametro sulla curva, ottenendo:

r(θ) = r0 eaθ

con a = ± cot φ. In coordinate cartesiane, avremo cioè



x = r0 cos θeaθ
y = r0 sin θeaθ

Una curva di questo tipo si dice una spirale logaritmica. La sua curvatura in ogni
punto è data da
dθ dθ dα
= /| |.
ds dθ dθ
Abbiamo quindi:
|k(θ)| = r0−1 sin φe−aθ .

Curve nello spazio ordinario


SU (2) è un rivestimento a due fogli di SO(3). Se rappresentiamo un elemento
di SU (2) come un quaternione di modulo 1, la corrispondenza

SU (2) ≃ S 3 ∋ u −
→ ru ∈ SO(3)
238 XIV. GEOMETRIA DIFFERENZIALE DELLE CURVE

associa al quaternione u, che scriveremo come u = cos θ11 + sin θu′ con u′ puramente
immaginario, la rotazione di angolo 2θ intorno all’asse u′ .
Sia ora E : J − → SO(3) un arco di classe C 1 . Fissato t0 ∈ J e un elemento
g0 ∈ SU (2) tale che rg0 = E(t0 ), possiamo rialzare in modo unico E a una curva
di classe C 1 g : J −
→ SU (2) in modo che il diagramma:

E
J −−−−→ SO(3)
x


J −−−−→ SU (2)
g

sia commutativo.
Differenziando la relazione ḡ · g = 1, otteniamo

ḡ · g ′ + ḡ ′ · g = 0, cioè ḡ · g ′ = −ḡ · g ′ ,

e dunque g −1 g ′ = ḡ · g ′ è puramente immaginario. Poniamo Ω̃(t) = g −1 (t)g ′ (t) =


ḡ(t)g ′ (t).
Differenziando la relazione:

E(t)(v) = g(t) · v · ḡ(t)

(ove il vettore v ∈ R3 si identifica a un quaternione puramente immaginario)


otteniamo

E(t)Ω(t)(v) = g(t) · (Ω(t)(v)) · ḡ(t) = g ′ (t) · v · ḡ(t) − g(t) · v · ḡ(t) · g ′ (t) · ḡ(t)

da cui
Ω(t)(v) = Ω̃(t) · v − v · Ω̃(t) = 2 Ω̃(t) × v
ove ”×” indica il prodotto esterno in R3 . Il vettore Ω̃ ha allora coordinate Euclidee
τ k τ k
2 , 0, 2 , ovvero è il quaternione 2 i + 2 k. Le equazioni di Frenet si scrivono quindi
nella forma:  
′ 1 τ k
g (t) = g(t) · Ω̃(t) = g(t) · i+ k .
2 2 2
1. File: Alcuni esercizi di topologia generale

Esercizio 1. Sia X = Pn (Q) con la topologia che viene dalla sua


presentazione come quoziente di Qn+1 \{0} ( Q è dotato della topologia
standard).
1. X è connesso?
2. X è compatto?
3. X è Hausdorff?
4. X soddisfa il primo assioma di numerabilità?
5. X soddisfa il secondo assioma di numerabilità?
6. X è localmente connesso?
7. X è localmente compatto?
(Uno spazio si dice localmente compatto se ogni punto ha un intorno
compatto)
Soluzione. Sia n > 0. (Se n = 0 allora P0 (Q) è un punto.)
1. No. In una carta Pn (Q) = Qn ∪ {∞} sia B la palla aperta di
centro zero e raggio π. Siccome π non è algebrico non esistono punti
di Qn a distanza π da zero. Quindi, detto A il complementare di B in
Pn (Q), si ha che A è aperto. Quindi A e B sono due aperti disgiunti,
entrambi non vuoti e la cui unione è Pn (Q).
2. No. In una carta locale Pn (Q) = Qn ∪ {∞} sia x = (e, . . . , e), per
n > 0 intero sia Un = B(x, πn ) \ B(x, n+1π
) e sia U0 il complementare
n
di U1 in P (Q). Siccome π ed e sono algebricamente indipendenti, e
siccome e non è algebrico, gli Ui sono tutti aperti e ricoprono Pn (Q).
Tale ricoprimento non ammette sotto ricoprimenti finiti.
3. Si. Dati due punti x, y in Pn (Q) si può sempre trovare una carta
P (Q) = Qn ∪{∞} in cui x, y 6= ∞. Qui basta considerare r = d(x, y)/4
n

e le palle aperte B(x, r) e B(y, r) sono disgiunte.


4. Si. In una carta locale le palle di raggio 1/n sono una base di
intorini numerabile.
5. Si. Segue dal punto 4 e dal fatto che Pn (Q) sia numerabile.
6. No. La dimostrazione del punto 1 si applica localmente.
7. No. La dimostrazione del punto 2 si applica localmente.
Esercizio 2. Sia S = {(x, y) ∈ R2 tali che x 6= 0 e y/x ∈ N}
1. Determinare S (la chiusura di S) e dire quali sono i punti di
accumulazione di S.
2. S è connesso?
3. S è connesso?
4. S è localmente connesso?
5. S è localmente connesso?
Soluzione. L’insieme S è costituito dall’unione di tutte le rette con
pendenza intera meno l’origine. (Contiene quindi le semirette orizzon-
tali ma non quelle verticali)
1
2

1. Sia Y l’asse delle y. Si ha S̄ = S ∪ Y . Infatti l’origine è punto


di accumulazione di ogni retta e quindi sta in S̄, d’altronde ogni punto
del tipo (0, y), con y 6= 0, è limite di ( ny , y) ∈ S. Quindi S ∪ Y ⊂ S̄.
D’altronde il complementare di S ∪ Y è costituito da un’unione di
settori aperti e quindi è aperto. Quindi S ∪ Y è chiuso. I punti di
accumulazione di S sono tutti e soli i punti di S̄ in quanto S̄ non ha
punti isolati.
2. No. Sia A = S ∩ {x < 0} e B = S ∩ {x > 0}. Siccome per
definizione i punti di S hanno x 6= 0, si ha S = A ∪ B. Per definizione
A e B sono disgiunti; entrambi sono aperti in quanto intersezione di S
con aperti di R2 ed entrambi sono non vuoti.
3. Si. S̄ è l’unione di connessi (ogni retta è connessa in quanto
omeomorfa a R che è connesso) con intersezione non vuota (l’origine).
4. Si. Ogni punto di S appartiene a una semiretta con pendenza
intera, quindi esiste un suo intorno che interseca solo quella retta in un
segmento.
5. No. Sia p = (0, y) ∈ Y allora U = B(p, y/2) ∩ S̄ è fatto da una
successione di segmenti disgiunti che si accumulano sull Y e quindi non
esite nessun intorno di p, contenuto in U che sia connesso.
Esercizio 3. In R2 munito della S topologia standard si consideri il
sottoinsieme A = ( { x2 +y 2 < 3 } { x = 0 } )∩{ y 6= 0 }. Determinare
1. l’insieme dei punti interni Ao e la chiusura A,
2. la frontiera ∂A,
3. le componenti connesse di A e di A.
4. Lo spazio A ∩ { x2 + y 2 ≤ 9 } è omeomorfo al disco unitario?

Soluzione. L’insieme A è il disco aperto di raggio 3, a cui è stato
tolto il diametro orizzontale e a cui sono state aggiunte le duesemirette
verticali aperte dell’asse delle y. Ne segue che: √
1. I punti interni di A sono i punti del disco aperto di raggio 3
meno il diametro orizzontale: Ao = {x 2 2
√ + y < 3} \ {y = 0}. La
chiusura di A è il disco chiuso di raggio 3 a cui è stato aggiunto l’asse
delle y: Ā = {x2 + y 2 ≤ 3} ∪ {x = 0}.
2. ∂A = Ā \ Ao = {x2 + y 2 = 3} ∪ {(0, y) : y 3 ≥ 3} ∪ {(x, 0) : x2 ≤ 3}.
3. Le componenti connesse di A √ sono A ∩ {y > 0} e 2A ∩ 2{y < 0}.
4. No. Se togliamo il punto (0, 3) allo spazio Ā∩ {x + y ≤ 9} lo si
sconnette mentre il disco unitario meno un qualsiasi suo punto rimane
connesso.
Esercizio 4. Identifichiamo R2 col sottoinsieme dei punti ”propri” di
P2 (R), e sia
Cn = {(x, y) ∈ R2 , tali che x = n} ⊆ R2 ⊆ P2 (R).
S
1. Determinare la chiusura D1 di n=1,..10 Cn in P2 (R).
S
2. Determinare la chiusura D2 di n∈N Cn in P2 (R).
3. L’insieme D1 è connesso?
3

4. L’insieme D2 è connesso?
5. L’insieme D1 è compatto?
6. L’insieme D2 è compatto?
Soluzione.
1. L’insieme Cn ha un unico punto all’infinito, indipendente da n.
Infatti R2 corrisponde al piano affine di R3 dato dall’equazione z = 1.
I punti di Cn corrispondono quindi alle rette r(y, n) di R3 passanti
per i punti del tipo (n, y, 1). Per y → ±∞ la retta r(y, n) tende alla
retta per (0, 1, 0) indipendentemente da n. Per cui D1 = ∪n=1,...,10 Cn ∪
{[(0, 1, 0)]}.
2. I punti limite per che si ottengono da r(y, n) facendo tendere r
ed n all’infinito sono tutte le possibili rette passanti per punti del tipo
(a, b, 0), ovvero l’intera retta all’infinito. Quindi D2 = ∪n∈N Cn Piú la
retta all’infinito.
3. Per quando detto nel punto 1, l’insieme D1 è costituito da un’unione
finita di insiemi del tipo Cn ∪ {[(0, 1, 0)]}, ognuno dei quali è con-
nesso in quanto omeomorfo a S 1 . Tali insiemi si intersecano nel punto
{[(0, 1, 0)]} e quindi D1 risulta connesso in quanto unione di connessi
con intersezione non vuota.
4. Lo stesso argomento del punto 3 si applica al caso di D2 .
5,6. P2 (R) è compatto, ergo sia D1 che D2 sono compatti in quanto
chiusi di un compatto.
Esercizio 5. Per n = 0, 1, · · · , sia
An = {(x, y) ∈ R2 : x ≥ 0, nx ≤ y ≤ (n + 1)x},
e sia [
A= Aon ,
dove o indica la parte interna di un insieme, cioè l’insieme dei punti
interni.
S
1. An è chiuso?
2. Determinare Ao , A, (A)o , e la frontiera ∂A di A.
3. Determinare le componenti connesse di A e quelle di A.
Sia R la relazione di equivalenza su A0 definita da :
(x, y)R(x′ , y ′ ) se (x, y) = (x′ , y ′ ) oppure
(x, y), (x′ , y ′ ) ∈ ∂A0 e dR2 ((x, y), (0, 0)) = dR2 ((x′ , y ′ ), (0, 0)).
4. Dimostrare che il quoziente A0 /R è omeomorfo a R2 .
Soluzione.
1. No. I punti del tipo (0, y) stanno nella chiusura di ∪An ma non
stanno in nessuno degli An .
2. A è aperto in quanto unione di aperti e coincide quindi con la sua
parte interna. La chiusura di A è il primo quadrante chiuso, la parte
interna della chiusura di A è il primo quadrante aperto, la frontiera di
A è la differenza tra la sua chiusura e la sua parte interna ed è formato
4

quindi dall’unione dei semi assi positivi e delle semirette {y = nx, x >
0}.
3. Aon è connesso (è connesso per archi) e aperto. A è unione dis-
giunta degli Aon , ne segue che le componenti connesse di A sono esat-
tamente gli insiemi A0n .
4. A0 è il settore tra l’asse orizzontale e la semiretta a 45 gradi (che è
2π/8). Quindi un omeomorfismo siu può costruire in coordinate polari
ponendo (ρ, θ) 7→ (ρ, 8θ).
Esercizio 6. Si considerino le seguenti topologie su R2 :
S: La topologia standard
Z: La topologia di Zariski: la meno fine tra le topologie contenenti
(come aperti) gli insiemi della forma
UP = {(x, y) ∈ R2 |P (x, y) 6= 0}
con P ∈ R[x, y] polinomio.
C: La topologia su R2 = R × R prodotto della topologia cofinita su R.
D: La topologia cofinita su R2 .
1. Comparare a due a due le topologie sopra definite stabilendo quale
sia la più fine.
2. Caratterizzare la topologia indotta da Z su una qualsiasi retta
l ⊆ R2 .
3. Per ognuna delle topologie dire se lo spazio topologico è: separa-
bile, Hausdorff, connesso, quasicompatto. (quest’ultima domanda può
essere non facile per Z.)
4. Quale di queste topologie è metrizzabile (esiste cioè una metrica
che induce tale topologia)?
Soluzione. Ricordiamo che una topologia τ si dice piú fine di un’altra
τ1 se ha piú aperti (ossia se ogni di τ1 è anche aperto di τ ).
1. S è strettamente piú fine di Z che è strettamente piú fine di C
che è strettamente piú fine di D. Infatti:
• S è piú fine di Z in quando gli zeri di polinomi sono chiusi
per la topologia standard e quindi i loro complementari aperti.
D’altro canto l’unico aperto di Z limitato è il vuoto, quindi Z
non è equivalente a S.
• Z è piú fine di C. Infatti una base per C è formata dai com-
plementari degli insiemi del tipo ({a1 , . . . , an } × R) ∪ (R ×
{b1 , . . . bk }) e dati a1 , . . . , an e b1 , . . . bk , il polinomio P (x, y) =
[(x−a1 ) · · · (x−an )][(y−b1 ) · · · (y−bk )] si annulla su ({a1 , . . . , an }×
R) ∪ (R × {b1 , . . . bk }). Per dimostrare che le due topologie non
sono equivalenti basta considerare il polinomio P (x, y) = x − y.
Non esiste nessun elemento della base di C che sia contentuno
in UP (che quindi non è aperto in C).
• C è piú fine di D. Infatti una base per D è costituita dagli
insiemi che sono complementari di un punto. Tali insiemi sono
5

aperti per C. Per vederlo, sia p = (x0 , y0 ) ∈ R2 . Gli insiemi U =


{x 6= x0 } e V = {y 6= y0 } sono aperti per C e R2 \ {p} = U ∪ V
che quindi è aperto in quanto unione di aperti. D’altronde,
l’insieme {x 6= 0} è aperto in C ma non contiene nessun insieme
cofinito e quindi non è aperto in D.
2. Essendo l definita da un’equazione lineare, per sostituzione di una
variabile si ottiene che la restrizione di Z a l è omeomorfa a quella di
Zariski su R (che è poi la cofinita).
3. R2 con la topologia standard è separabile, Hausdorff, connesso,
non compatto.
• Il fatto che (R2 , S) sia separabile implica che lo siano anche
(R2 , Z), (R2 , C), (R2 , D) in quanto topologie meno fini: un’insieme
denso per S lo è anche per ogni altra topologia meno fine. Stessa
cosa per la connessione: l’identità di R2 è continua da una
topologia piú fine verso una meno fine, R2 standard è connesso
e l’immagine continua di un connesso connessa.
• (R2 , Z) Non è Hausdorff: due aperti della base si intersecano
sempre. Ne segue che (R2 , C) e (R2 , D) non sono Hausdorff in
quanto meno fini di Z.
• Per vedere che è quasi compatto ci si deve appellare alle pro-
prietà dei polinomi. Due polinomi su R2 o hanno un fattore
comune oppure hanno un numero finito di zeri comune. Sia
X ⊂ R2 e siano Pi dei polinomi tali che {UPi } sia un ricopri-
mento di X. Se p è un fattore di Pi allora UPi = Up ∩UPi /p . Se p è
un fattore comune a tutti i polinomi Pi allora X ⊂ Up ∩(∪i UPi /p )
e quindi gli insiemi UPi /p coprono X. Possiamo quindi suppore
che i Pi non abbiano fattori comuni. Ne segue che possiamo
trovare un numero finito Pi1 , . . . , Pik senza fattori comuni. Tali
polinomi hanno un numero finito di radici x1 , . . . , xm ∈ R2 . Per
ognuna di queste radici che sta in X sappiamo che esiste un
polinomio Pixj della famiglia iniziale che non si annulla in xj .
Quindi la famiglia finita {UP : P = Pi1 , . . . , Pik } ∪ {UP : P =
Pix1 , . . . , Pixm } copre X. Ne segue che ogni sottoinsieme di R2
con la topologia Z è quasicompatto.
• La quasi compattezza di (R2 , Z) implica quelle di (R2 , C e (R2 , D)
in quanto topologie meno fini: l’immagine continua di un qua-
sicompatto è quasicompatta e l’identità di R2 è continua da Z
a C e D.
4. Ogni spazio metrico è Hausdorff, quindi né (R2 , Z) né (R2 , C) né
(R2 , D) sono metrizzabili. Mentre (R2 , S) è metrizzabile per definizione.

Esercizio 7. Sia Bn′ lo spazio topologico ottenuto partendo da n copie


di S 1 , (Cioè da S 1 × {1, · · · , n} con la topologia che si ottiene come
prodotto della topologia indotta da quella euclidea su S 1 con quella
6

discreta su {1, · · · , n}). Sia Bn lo spazio topologico che si ottiene da


Bn′ identificando a un punto l’insieme {(1, 1), (1, 2), · · · , (1, n)}.
1. Bn è compatto?
2. Bn è connesso?
3. Bn è localmente euclideo? (Uno spazio topologico si dice local-
mente euclideo se ogni suo punto ha un intorno omeomorfo a un aperto
di Rd .)
4) mostrare che Bn è omeomorfo a Bm solo se n = m.
Soluzione.
1. S 1 è compatto, l’inclusione di S 1 in Bn come S 1 × {i} è continua
per ogni i e quindi la sua immagine Si è un compatto. Ne segue che
Bn è unione finita di compatti e quindi è compatto.
2. Sia Si come sopra. Si è omeomorfo a S 1 e quindi è connesso,
d’altronde il punto [(1, i)] ∈ Bn appartiene ad ogni Si . Quindi Bn è
unione di connessi con intersezione non vuota e quindi è connesso.
3. Per n = 1 B1 = S 1 e quindi è localmente euclideo. Per n > 1
invece no. Infatti il punto [(1, i)] ∈ Bn ha un intorno connesso U tale
che se U meno [(1, i)] non è connesso mentre in Rn , per n > 1, ogni
aperto connesso rimane connesso se rimuoviamo un qualsiasi suo punto.
4. Il gruppo fondamentale di Bn è il gruppo libero su n elementi e il
gruppo libero su n elementi non è isomorfo a quello su m elementi se
m 6= n. (Alternativamente, si possono contare le componenti connesse
dell’intorno U meno [(1, i)] come nel punto precedente.)
Esercizio 8. Sia R la relazione di equivalenza su R definita da:

xRy se x = y oppure x + y = 0,
e X := R/R dotato della topologia quoziente.
1. X è Hausdorff?
2. X è omeomorfo a R?
Sia ora R la relazione di equivalenza su R2 definita da:
(x1 , x2 )R(y1 , y2 ) se x1 = y1 e x2 = y2 oppure x1 + y1 = 0 e x2 + y2 = 0,
e sia Y = R2 /R.
3. Y è Hausdorff?
4.(*) Y è omeomorfo a R2 ?
Soluzione. La classe di equivalenza di x ∈ R è data da [x] = {x, −x}.
Sia R+ = {x ∈ R : x ≥ 0} con la topologia indotta da R e sia f : X →
R+ definita da f ([x]) = |x|. Ovviamente tale funzione è ben definita.
In oltre, se F : R → R+ è definita da F (x) = |x| e se π : R → X è
la proiezione naturale, è chiaro che F = f ◦ π. Essendo F continua e
aperta (R+ è dotato della topologia indotta!!!) lo è pure f ; essendo f
biunivoca è quindi un omeomorfismo. Ne segue che:
1. X è Hausdorff in quanto R lo è ed R+ ⊂ R.
7

2. X non è omeomorfo a R in quanto se si toglie lo zero a R+ si


ottiene (0, ∞) che è connesso mentre se si toglie un qualsiasi punto a
R lo si sconnette.
Passiamo a R2 . In coordinate polari di R2 si ha che (ρ, θ)R(ρ′ , θ′ ) se
e solo ρ = ρ′ e θ = ±θ′ , il che si puó anche scrivere come [θ = θ′ oppure
θ = θ′ ± π]. La funzione f : Y → R2 data da f (ρ, θ) = (ρ, 2θ) è ben
definita in quanto θ è definito modulo 2π. Come sopra, se chiamiamo
F : R2 → R2 la funzione F (ρ, θ) = (ρ, 2θ) e π : R2 → Y la proiezione
naturale, si ha che F = f ◦π. Essendo F continua e aperta lo è anche f ,
che risulta quindi un omeomorfismo di Y con R2 in quanto biunivoca.
Quindi:
3. Si.
4. Si.
9. Per i = 0, 1, 2, 3 sia Xi la retta Xi = {(x, y) ∈ R2 , y = i},
Esercizio S
e sia X = Xi . Si consideri la relazione di equivalenza su X tale che:
(x, 0) ∼ (1/x, 1) ∼ (x, 2) ∼ (1/x, 3) per ogni x 6= 0

1.X/ ∼ è quasi-compatto?
2. X/ ∼ è connesso?
3. X/ ∼ è localmente euclideo? (Uno spazio topologico si dice
localmente euclideo se ogni suo punto ha un intorno omeomorfo a un
aperto di Rd .)
Soluzione. X è omeomorfo a una circonferenza con due “punti
doppi” quindi non è Hausdorff, è quasi-compatto ed è localmente eu-
clideo. Formalizziamo ora tale affermazione.
Siano Y1 = X0 ∪ X1 e Y2 = X2 ∪ X3 con le relazioni ∼1 e ∼2 definite
da (x, 0) ∼1 (1/x, 1) e (x, 2) ∼2 (1/x, 3). Sia Zi = Yi / ∼i e siano
S1 = [(0, 0)], N1 = [(0, 1)] ∈ Z1 e S2 = [(0, 2)], N2 = [(0, 3)] ∈ Z2 , N
ed S stanno per “polo Nord” e “polo Sud”. Andiamo a dimostrare che
Zi è una circonferenza per i = 1, 2 e che X è ottenuto indetificando i
punti di Z1 con quelli di Z2 tranne che i poli. Esaminiamo Z1 , per Z2
sará uguale.
Sia C la circonferenza di centro zero e raggio 1/2 in R2 . C è tan-
gente a X0 in P0 = (0, 0) e a X1 in P1 = (0, 1). Sia f0 la proiezione
stereografica di X1 su C con polo in (0, 0): f0 (x, 1) è il punto di in-
tersezione tra C e la retta passante per (0, 0) e (x, 1). Similmente sia
f1 la proiezione stereografica di X0 su C con polo (0, 1). Sia ora P =
(x, 1) ∈ X1 e sia Q = (y, 0) il punto definito da (y, 0) = f1−1 (f0 (x, 1)).
I triangoli P P1 P0 e P1 P0 Q sono simili e il diametro P1 P0 di C è 1. Ne
segue che y = 1/x. Sia F : Y1 → C definita da F (x, 1) = f0 (x, 1) e
F (y, 0) = f1 (y, 0). F è continua e aperta, in oltre, per il conto appena
fatto F passa al quoziente e definisce una funzione f : Z1 → C continua
8

e aperta, ed è immediato vedere che è biunivoca. Quindi f : Z1 → C è


un omeomorfismo che manda S1 in P0 e N1 in P1 .
Traslando tutto ció del vettore (0, 2) si definisce ugualmente un
omeomorfismo g : Z2 → C che manda S2 in P0 e N2 in P1 . Adesso è
chiaro che X è ottenuto dai due cerchi Z1 ∪ Z2 identificando i punti tali
che f (z1 ) = g(z2 ), tranne i poli.
Ora N1 ed N2 non hanno intorni disgiunti in X quindi X non è
Hausdorff. In oltre l’immagine di Z1 in X è connessa in quanto Z1 è un
cerchio e quindi è connesso, lo stesso vale per Z2 e quindi X è unione
di due connessi con intersezione non vuota e quindi è connesso.
L’inclusione di Z1 in X è un omeomorfismo con l’immagine (lo stesso
vale per Z2 ) e quindi X è localmente euclideo in quanto C lo è.
Esercizio 10. Sia r > 0 e
Ar = {(x, y) ∈ R2 t.c. min dR2 ((x, y), (n, 0)) < r}.
n∈Z

1. Determinare l’insieme dei punti interni, la chiusura e la frontiera


di Ar .
2. Determinare, al variare di r, le componenti connesse di Ar e quelle
di Ar . Esistono, in particolare, valori di r per cui Ar è connesso e Ar
non lo è?
Soluzione. Ar è l’unione delle palle aperte B((n, 0), r) di centro (n, 0)
e raggio r.
1. Ar è aperto in quanto unione di aperti. La chiusura di Ar è
l’unione delle palle chiuse di centro (n, 0) e raggio r. La frontiera di
Ar è costituita dall’unione dei cerchi di centro (n, 0) e raggio r meno i
punti di Ar stesso.
2. Per r ≤ 1/2 le palle B((n, 0, r)) sono disgiunte, sono degli aperti
di Ar e sono connesse. Sono quindi le componenti connesse di Ar . Per
r > 1/2 Ar è connesso in quanto unione di connessi a intersezione non
vuota. Mentre per Ar ; se r < 1/2 allora le palle chiuse B((n, 0), r)
sono disgiunte, aperte in Ar per la topologia indotta e connesse. Sono
quindi le componenti connesse di Ar . Per r ≥ 1/2, si ha che Ar è
connesso in quanto unione di connessi con intersezione non nulla (le
palle B((n, 0), r) si intersecano con B((n ± 1, 0), r)). Quindi per r =
1/2 si ha che Ar è connesso mentre Ar no.
Esercizio 11. Sia X un insieme, e τ1 , τ2 due topologie su X, τ1 più
τi
fine di τ2 . Per A ⊆ X sia A la chiusura di A rispetto alla topologia
τi , i = 1, 2.
1. mostrare che
τ1 τ2
A ⊆A .
2. Dare un esempio in cui l’inclusione è stretta e le topologie non sono
banali, cioè τ1 non è la topologia discreta e τ2 non è quella grossolana.
9

3. Sia X un insieme non finito. Mostrare che la topologia cofinita su


X × X non è la topologia prodotto della topologia cofinita su X. Le
due topologie sono confrontabili?
Soluzione.
1. Siccome τ1 è più fine di τ2 (e quindi ha più aperti) ogni chiuso di
τ2
τ2 è chiuso per τ1 . Quindi A , che è chiuso per τ2 , è chiuso anche per
τ1
τ1 e contiene A per definizione di chiusura. Quindi contiene A che
per definizione è il piú piccolo chiuso di τ1 che contiene A.
2. Su R2 = R × R sia τ1 la topologia euclidea, e τ2 la topologia
prodotto di quella grossoloana su un fattore R e di quella euclidea
sull’altro. Sia A = [0, 1] × [0, 1] ∈ R2 . A è chiuso per τ1 mentre la
chiusura di A per τ2 è [0, 1] × R (gli aperti per τ2 son tutti del tipo
U × R con U aperto in R).
3. Una base per la topologia prodotto della cofinita è formata dai
complementari degli insiemi del tipo ({a1 , . . . , an }×X)∪(X×{b1 , . . . bk }),
con ai ∈ X e bi ∈ X. Se X non è finito tali insiemi non sono aperti per
la topologia cofinita.
Le due topologie sono confrontabili e la topologia prodotto della
cofinita risulta piú fine della cofinita. Infatti una base per la topologia
cofinita è costituita dagli insiemi che sono complementari di un punto.
Tali insiemi sono aperti per la prima topologia. Per vederlo, sia p =
(x0 , y0 ) ∈ X × X. Gli insiemi U = {x 6= x0 } e V = {y 6= y0 } sono
aperti per la topologia prodotto della cofinita e (X × X) \ {p} = U ∪ V
che quindi è aperto in quanto unione di aperti. Quindi ogni aperto
della topologia cofinita è aperto anche nella prima topologia.
Esercizio 12. Identifichiamo R2 col sottoinsieme dei punti ”propri”
di P2 (R), e sia Y ⊆ R2 ⊆ P2 (R) il grafico della funzione f : R → R
1
f (x) = x sin( ) per x 6= 0, f (0) = 0.
x
1. Determinare la chiusura Y di Y in P2 (R).
2. Y con la topologia indotta da P2 (R) è localmente connesso?
Soluzione.
1. La funzione f è continua quindi Y è chiuso in R2 . In oltre, il
limite per x → ±∞ di f (x) è 1 quindi la chiusura di Y in P2 (R) si
ottiene aggiungendo un solo punto all’infinito a Y . (In coordinate ove
R2 è identificato con il piano di R3 dato da z = 1, il punto all’infinito
di Y in P2 (R) corrisponde alla retta per (1, 0, 0).)
2. Y è omeomorfo a S 1 ed è quindi localmente connesso per archi.
Consideranto S 1 = P(R) = R ∪ {∞}, l’omeomorfismo è dato da
(x, f (x)) 7→ x [(1, 0, 0)] 7→ ∞.
GEOMETRIA PROIETTIVA

FLAMINIO FLAMINI

1. Definizione formale di spazi proiettivi

Fino ad ora abbiamo introdotto gli spazi proiettivi "aggiungendo" punti agli spazi cartesiani Rn
usuali, n ≥ 1, seguendo la visione storica del punto di vista di Désargues, basato sugli studi di prospettiva
da parte di architetti e pittori del Rinascimento. Abbiamo visto che i punti "aggiunti" a Rn si considerano
come punti all'innito od impropri di Rn e che questi punti impropri hanno un'interpretazione geometrica
di direzioni in un opportuno spazio cartesiano Rn+1 piu' grande, con coordinate X0 , X1 , . . . , Xn , in cui
lo spazio cartesiano Rn di partenza si identica classicamente con l'iperpiano di equazione cartesiana
X0 = 1
e si intepreta come uno schermo su cui le varie direzioni (o rette vettoriali) uscenti dall'origine O di Rn+1
si proiettano (vedasi PARAGRAFO 13.1 del testo e Figura 1 qui sotto)

Figure 1. Schermo ane per n = 2

Poiche' e' del tutto naturale richiedere che i punti di una "struttura geometrica" abbiano tutti la
medesima natura, si rende necessaria una diversa introduzione alla Geometria Proiettiva, in modo tale
da renderla indipendente dalla geometria ane ed euclidea dello spazio cartesiano Rn .
1
2 FLAMINIO FLAMINI

Denizione 1. Sia V un R-spazio vettoriale. Consideriamo l'insieme


V \ {0}
e su esso deniamo la relazione di equivalenza ∼ cosi' posta:
u, v ∈ V \ {0} sono t.c. u ∼ v ⇔ ∃ λ ∈ R \ {0} t.c. u = λv.
Notare che la relazione ∼ e' stata gia' incontrata in ESEMPIO 13.1.2 nelle note.
La classe di equivalenza rispetto alla relazione ∼ di un vettore v ∈ V \ {0} la denoteremo con il
simbolo
[v]
ed e': 
[v] := u ∈ V \ {0} | u ∼ v, i.e. u = λv, per qualche λ ∈ R \ {0} .
In altri termini, l'elemento [v] rappresenta la retta vettoriale Span(v) ⊂ V privata del vettore nullo, piu'
precisamente [v] rappresenta tutti i vettori non nulli di questa retta vettoriale.
Visto che ∼ e' una relazione di equivalenza, abbiamo:
Denizione 2. L'insieme quoziente
V \ {0}

e' detto proietticazione dello spazio vettoriale V od equivalentemente spazio proiettivo associato a V e
sara' denotato con il simbolo P(V ). Gli elementi di P(V ) sono le classi di equivalenza [v], al variare di
v ∈ V \ {0}.
Per denizione di insieme quoziente, notiamo che esiste una naturale applicazione suriettiva
(1.1) π : V \ {0} →→ P(V )
(ricordiamo che il simbolo →→ sta a signicare che l'applicazione e' suriettiva) chiamata proiezione cano-
nica indotta da ∼; per ogni [v] ∈ P(V ) la sua bra (o insieme di controimmagini) secondo π e':

(1.2) π −1 ([v]) = Span(v) \ {0}.


Viceversa, per u, v ∈ V \ {0} si ha
π(u) = π(v) ⇔ [u] = [v] ⇔ u = λv, per qualche λ ∈ R \ {0}.
Denizione 3. Gli elementi [v] ∈ P(V ) verranno d'ora in poi chiamati punti di P(V ); per questo motivo
verranno denotati come P = [v].
Osservazione 1.1. Notiamo quindi che i punti di P(V ) parametrizzano le direzioni (equivalentemente
le rette vettoriali) di V e, per ogni v ∈ V \ {0}, la proiezione canonica π non fa altro che contrarre al
punto P = [v] la retta vettoriale Span(v) privata del suo vettore nullo {0}.
Per questo motivo si ha:
Denizione 4. Con la notazione precedente, si pone
dim(P(V )) := dimR (V ) − 1.
Notare che il simbolo a sinistra dim(P(V )) ha un signicato diverso rispetto a quello di destra
dimR (V ). Infatti P(V ) non ha una struttura di spazio vettoriale (ricordare PARAGRAFO 13.1 nel
testo); il concetto di dimensione per P(V ) e' quindi nel senso euristico di "variabilita'" di punti in P(V ).
Mentre dimR (V ) e' l'usuale nozione di dimensione di R-spazio vettoriale V .
In particolare,
• se V = {0}, allora P(V ) = ∅,
• se dimR (V ) = 1, allora P(V ) = {P } e' un unico punto e dim(P(V )) = 0;
• se dimR (V ) = 2, allora dim(P(V )) = 1;
GEOMETRIA PROIETTIVA 3

• se dimR (V ) = n + 1, allora dim(P(V )) = n.


Nel caso particolare in cui abbiamo ssato una base b di V , cosicche' V ∼= Rn+1 per mezzo
dell'isomorsmo via coordinate rispetto alla base b di V , in tal caso porremo
(1.3) Pn (R) := P(Rn+1 )
che chiameremo spazio proiettivo numerico n-dimensionale su R. Nel prosieguo, ci focalizzeremo sempre
su Pn (R) e quindi ometteremo il termine numerico d'ora in poi.
• P1 (R) viene detta retta proiettiva;
• P2 (R) viene detto piano proiettivo;
• P3 (R) viene detto spazio proiettivo tridimensionale;
• Pn (R) viene detto spazio proiettivo n-dimensionale;
Sullo spazio vettoriale Rn+1 consideriamo la base canonica
e := e0 , e1 , . . . en ;
poiche' ogni vettore v ∈ R n+1
\ {0} si scrive in modo unico come
v = X0 e0 + X1 e1 + . . . + Xn en
ove (X0 , X1 , . . . , Xn ) ∈ R n+1
\ {0} le coordinate di v rispetto alla base e, denoteremo con
(1.4) P = [v] := [X0 , X1 , . . . , Xn ].
Osservazione 1.2. (i) Visto che [v] = [λ v], per ogni λ ∈ R \ {0}, si ha allora
[X0 , X1 , . . . , Xn ] = [λX0 , λX1 , . . . , λXn ], ∀ λ ∈ R \ {0}.
Per questo motivo [X0 , X1 , . . . , Xn ] vengono chiamate coordinate omogenee del punto
P = [v] := [X0 , X1 , . . . , Xn ]
in P (R); esse sono denite a meno di proporzionalita', coerentemenete con la denizione di P(V ) come
n

in Denizione 1.
(ii) E' opportuno rilevare che, per costruzione, [0, 0, . . . , 0] non e' MAI denito in Pn (R). In altri termini,
per ogni punto P = [X0 , X1 , . . . , Xn ] ∈ Pn (R), esiste sempre almeno una coordinata Xi 6= 0, 0 ≤ i ≤ n.
Nei paragra seguenti reinterpretiamo le considerazioni fatte in PARAGRAFO 13.1 del testo
con questa nuova costruzione formale di Pn (R).
1.1. Retta proiettiva P1 (R). Per quanto descritto precedentemente, si ha
P1 (R) := {[X0 , X1 ] | (X0 , X1 ) 6= (0, 0), Xi ∈ R}
con l'ulteriore condizione che per (X0 , X1 ), (λX0 , λX1 ) ∈ R2 \ {0}, λ ∈ R \ {0}, si ha
[X0 , X1 ] = [λX0 , λX1 ].
Osserviamo che P1 (R) contiene come sottoinsieme
A0 := [X0 , X1 ] ∈ P1 (R) | X0 6= 0 .


Poiche' le coordinate omogenee [X0 , X1 ] sono denite a meno di proporzionalita' e X0 6= 0, ponendo


X1
(1.5) x :=
X0
si ha anche
A0 := {[1, x] | x ∈ R} = {x ∈ R} = R.
In altri termini, A0 e' identicato all'usuale asse reale R con coordinata (non piu' omogenea) x e l'unico
punto di P1 (R) non rappresentato in A0 e' il punto [0, 1] ∈ P1 (R) \ A0 . Pertanto A0 viene chiamato carta
(o schermo) ane della retta proiettiva P1 (R) e [0, 1] e' punto improprio (od all'innito) per la carta A0 .
Notiamo quindi che la carta ane A0 svolge il ruolo di retta cartesiana R cui abbiamo aggiunto il punto
improprio [0, 1] come fatto in PARAGRAFO 13.1 delle note (cf. Figura 2).
4 FLAMINIO FLAMINI

Figure 2. Schermo ane A0 e proiezione stereograca

Analogamente si ha
A1 := [X0 , X1 ] ∈ P1 (R) | X1 6= 0 .


Ponendo
X0
(1.6) ξ :=
X1
si ha anche
A1 := {[ξ, 1] | ξ ∈ R} = {ξ ∈ R} = R.
In altri termini anche A1 e' identicato ad un altro asse reale R con coordinata (non piu' omogenea) ξ e
l'unico punto di P1 (R) non rappresentato in A1 e' il punto [1, 0] ∈ P1 (R) \ A1 . Analogamente a prima,
A1 viene chiamato carta (o schermo) ane della retta proiettiva P1 (R) di cui [1, 0] e' punto improprio
(od all'innito) (cf. Figura 3)
Riassumendo:
• P1 (R) ha due carte ani fondamentali A0 ed A1 tali che
P1 (R) = A0 ∪ A1 ;
• ambedue le carte ani A0 ed A1 sono identicabili con una retta reale R, ciascuna con coordinata
cartesiana x e ξ , rispettivamente;
• l'origine x = [1, 0] = 0 ∈ A0 diventa punto improprio della carta ane A1 ;
• il punto improprio [0, 1] di A0 diventa origine ξ = [0, 1] = 0 della carta ane A1 ;
GEOMETRIA PROIETTIVA 5

Figure 3. Schermo ane A1 e proiezione stereograca

• in A0 ∩ A1 , dove entrambe le coordinate cartesiane x e ξ hanno signicato, vale la relazione


x ξ = 1.
Ritroviamo quindi le interpretazioni fornite in PARAGRAFO 13.1 e FIGURA 1 nelle note.
1.2. Piano proiettivo P2 (R). Come nel caso di P1 (R), abbiamo
P2 (R) := {[X0 , X1 , X2 ] | (X0 , X1 , X2 ) 6= (0, 0, 0), Xi ∈ R}
con l'ulteriore condizione che per (X0 , X1 , X2 ), (λX0 , λX1 , λX2 ) ∈ R3 \ {0}, λ ∈ R \ {0}, si ha
[X0 , X1 , X2 ] = [λX0 , λX1 , λX2 ].
Osserviamo dunque che P (R) contiene come sottinsiemi
2

A0 := [X0 , X1 , X2 ] ∈ P2 (R) | X0 6= 0 ,


A1 := [X0 , X1 , X2 ] ∈ P2 (R) | X1 6= 0 ,


A2 := [X0 , X1 , X2 ] ∈ P2 (R) | X2 6= 0 .


Come nel caso di P1 (R), poiche' le coordinate omogenee [X0 , X1 , X2 ] sono denite a meno di proporzio-
nalita' ed in A0 vale X0 6= 0, ponendo
X1 X2
(1.7) x := e y := ,
X0 X0
si ha anche
A0 := [1, x, y] | (x, y) ∈ R2 = (x, y) ∈ R2 = R2 .
 

In altri termini, A0 e' identicato all'usuale piano cartesiano R2 con coordinate (non piu' omogenee)
(x, y). I punti di P2 (R) non rappresentati in A0 sono tutti e soli i punti della forma [0, α, β], dove
[α, β] ∈ P1 (R). In altri termini sono tutti e soli i punti nel luogo geometrico di P2 (R) denito da
X0 = 0
che e' detto retta impropria (od all'innito) per la carta A0 . Il fatto che questo luogo sia eettivamente
una retta proiettiva dentro P2 (R) verra' giusticato meglio nel paragrafo Ÿ 2 piu' avanti.
6 FLAMINIO FLAMINI

Figure 4. I tre schermi ani A0 , A1 e A2 rispettivamente

In A1 , dove vale X1 6= 0, poniamo


X0 X2
(1.8) ξ := e η := ,
X1 X1
si ha quindi
A1 := [ξ, 1, η] | (ξ, η) ∈ R2 = (ξ, η) ∈ R2 = R2 .
 

Quindi A1 e' identicato ad un altro piano cartesiano R2 con coordinate (non piu' omogenee) (ξ, η). I
punti di P2 (R) non rappresentati in A1 sono tutti e soli i punti della forma [α, 0, β], dove [α, β] ∈ P1 (R).
In altri termini sono tutti e soli i punti nel luogo geometrico di P2 (R) denito da
X1 = 0
che e' detto retta impropria (od all'innito) per la carta A1 (cf. paragrafo Ÿ 2 piu' avanti).
Inne, in A2 dove vale X2 6= 0, poniamo
X0 X1
(1.9) z := e w := ,
X2 X2
si ha quindi
A2 := [z, w, 1] | (z, w) ∈ R2 = (z, w) ∈ R2 = R2 .
 

Quindi A2 e' identicato ad un altro piano cartesiano R2 con coordinate (non piu' omogenee) (z, w). I
punti di P2 (R) non rappresentati in A2 sono tutti e soli i punti della forma [α, β, 0], dove [α, β] ∈ P1 (R).
GEOMETRIA PROIETTIVA 7

Figure 5. I tre piani (ani) A0 , A1 e A2 in P2 (R)

In altri termini sono tutti e soli i punti nel luogo geometrico di P2 (R) denito da
X2 = 0
che e' detto retta impropria (od all'innito) per la carta A2 (cf. paragrafo Ÿ 2 piu' avanti).
Riassumendo:
• P2 (R) ha tre carte ani fondamentali A0 , A1 ed A2 tali che
P2 (R) = A0 ∪ A1 ∪ A2 ;
• ciascuna delle carte ani sono identicabili ad un piano cartesiano reale R2 , con opportune
cordinate cartesiane (non omogenee);
• in A0 ∩ A1 ∩ A2 vale X0 X1 X2 6= 0.

1.3. Spazio proiettivo n-dimensionale Pn (R). Seguendo pedissequamente le precedenti considerazioni


svolte per retta e piano proiettivo, facilmente si deduce che Pn (R), per n ≥ 3, e' dotato di n + 1 carte
ani fondamentali
(1.10) Ai := [X0 , X1 , . . . , Xn ] ∈ P2 (R) | Xi 6= 0 , 0 ≤ i ≤ n.


La carta ane Ai avra' come iperpiano improprio (od all'innito) il luogo geometrico denito da
Xi = 0, 0 ≤ i ≤ n
(cf. paragrafo Ÿ 2 piu' avanti per giusticazione del termine iperpiano).
1.4. Modelli per Pn (R). Come osservato in ESEMPIO 13.1.2 delle note, per descrivere un modello
di Pn (R) invece di considerare Rn+1 \ {0} ci si puo' restringere a
Sn ⊂ Rn+1 \ {0}
8 FLAMINIO FLAMINI

dove
Sn := {u ∈ Rn+1 | ||u|| = 1}
e' la sfera n-dimensionale di centro l'origine O di Rn+1 e raggio unitario. Infatti si ha un'applicazione
suriettiva
v : Rn+1 \ {0} →→ Sn
v
v −→ ||v||

dove l'applicazione v e' la versorizzazione di vettori. La relazione di equivalenza ∼ su Rn+1 \ {0} come in
Denizione 1 quando ristretta a Sn diventa la relazione antipodale (gia' menzionata in PARAGRAFO
13.2 delle note), che denoteremo con ≡, per cui si avra'

(1.11) u1 , u2 ∈ Sn sono t.c. u1 ≡ u2 ⇔ u1 = ±u2 .

Da Denizione 2, si ha pertanto
Sn
(1.12) Pn (R) = .

Per comprendere meglio l'eguaglianza in (1.12), commentiamo piu' in dettaglio i casi n = 1, 2.
Per quanto riguarda la retta proiettiva P1 (R) rappresentata via relazione antipodale ≡, consideri-
amo Figura 6. La semicirconferenza rossa si deve identicare a quella nera in gura; il punto in gura

Figure 6. P1 (R) via relazione antipodale

marcato con x in nero si deve identicare al punto marcato con x in rosso. Dopo queste due identi-
cazioni, si ottiene che P1 (R) e' quindi identicabile alla circonferenza unitaria S1 come visto in FIGURA
1 delle note.
Per quanto riguarda il modello di P2 (R) ottenibile via relazione antipodale, consideriamo Figura
7. La calotta rossa della sfera S2 in gura si deve identicare alla calotta nera in gura; i punti diame-
tralmente opposti della circonferenza sezionale con il piano X2 = 0 devono essere identicati.
GEOMETRIA PROIETTIVA 9

Figure 7. P2 (R) via relazione antipodale

2. Sottospazi proiettivi di Pn (R)


Si consideri lo spazio vettoriale Rn+1 e sia U ⊂ Rn+1 un qualsiasi sottospazio vettoriale. Poiche'
U e' a sua volta uno spazio vettoriale e poiche'
U \ {0} ⊂ Rn+1 \ {0},
la restrizione ad U \ {0} della proiezione canonica π come in (1.1) denisce
(2.1) P(U ) := π(U ) ⊂ Pn (R),
ove P(U ) e' esattamente come nel senso di Denizione 1 applicata ad U = V .
Denizione 5. Per ogni sottospazio vettoriale U ⊂ Rn+1 , l'insieme dei punti P(U ) come in (2.1) si
denisce sottospazio proiettivo di P (R). Si ha pertanto
n

dim(P(U )) = dimR (U ) − 1.
L'intero positivo
(2.2) c := dim(Pn (R)) − dim(P(U )) = dimR (Rn+1 ) − dimR (U )
viene chiamato la codimensione di P(U ) in Pn (R).
Notiamo che l'intero c coincide quindi con l'usuale concetto di codimensione del sottospazio U
nello spazio vettoriale Rn+1 , i.e. il numero di equazioni cartesiane omogenee (necessarie e sucienti) per
denire U in Rn+1 .
2.1. Equazioni cartesiane e parametriche di sottospazi proiettivi di Pn (R). Da Denizione 5,
ogni sottospazio proiettivo di Pn (R) e' il proietticato di un opportuno sottospazio vettoriale U dello
spazio vettoriale Rn+1 . Il sottospazio vettoriale U , in quanto tale, sara' denito da un sistema omogeneo
di equazioni cartesiane della forma:


 a1,0 X0 + a1,1 X1 + · · · + a1,n Xn = 0
 a2,0 X0 + a2,1 X1 + · · · + a2,n Xn = 0


(2.3) · · ·
· · ·




ac,0 X0 + ac,1 X1 + · · · + ac,n Xn = 0

10 FLAMINIO FLAMINI

con rg(A) = n + 1 − dimR (U ) = c, dove c come in Denizione 2.2. Per denizione di P(U ), le stesse
equazioni (2.3), deniscono equazioni cartesiane omogenee per P(U ) in Pn (R), visto che il sistema (2.3)
e' costituito da tutti monomi lineari e prive di termini noti.
Analogo discorso per le equazioni parametriche per P(U ) in Pn (R); queste equazioni coincideranno
con le equazioni parametriche che deniscono U come sottospazio di Rn+1 , che sono della forma:


 X0 = b0,1 λ1 + · · · + b0,n+1−c λn+1−c
 X1 = b1,1 λ1 + · · · + b1,n+1−c λn+1−c


(2.4) · · ·
· · ·




Xn = bn,1 λ1 + · · · + bn,n+1−c λn+1−c

ove [λ1 , . . . , λn+1−c ] ∈ Pn−c (R).


Esempio 2.1. In P1 (R) l'equazione X0 = 1 denisce necessariamente l'insieme vuoto. Infatti, nello
spazio vettoriale R , l'equazione X0 = 1 non denisce un sottospazio vettoriale. Inoltre, preso il punto
2

P = [1, 0] ∈ P1 (R), se consideriamo la coppia (1, 0) che lo rappresenta, essa e' soluzione di X0 = 1. Ma
la coppia (2, 0), che e' un'altra coppia rappresentante lo stesso punto P , non e' soluzione di X0 = 1.
Pertanto, l'equazione X0 = 1 (che infatti non e' omogenea) non e' atta a denire luoghi geometrici in
P1 (R).
Esempio 2.2. In P1 (R) l'equazione X0 − X1 = 0 e' equazione cartesiana per il punto P = [1, 1] ∈ P1 (R).
Infatti, la medesima equazione letta nello spazio vettoriale R , denisce la retta vettoriale
2
 
1
Span ⊂ R2 .
1
Le equazioni parametriche della retta vettoriale in R2 sono
X0 = λ, X1 = λ, λ ∈ R.
Le stesse equazioni, ma con λ ∈ R \ {0}, sono equazioni parametriche del punto P .
Esempio 2.3. In P2 (R) l'equazione X1 − X2 = 0 e' equazione cartesiana per la retta ` = P(U ) con-
giungente i punti [1, 0, 0] e [0, 1, 1]. Infatti la stessa equazione, letta nello spazio vettoriale R3 , denisce
il piano vettoriale    
 1 0 
U = Span 0 , 1 ⊂ R3
0 1
 

che, per costruzione, in P2 (R) si proietta nella retta proiettiva `. Le equazioni parametriche del piano
vettoriale U ⊂ R3 sono date da
X0 = λ1 , X1 = λ2 , X2 = λ2 (λ1 , λ2 ) ∈ R2 .
Le stesse equazioni, ma con [λ1 , λ2 ] ∈ P1 (R), sono equazioni parametriche in P2 (R) della retta ` ⊂ P2 (R).
2.2. Traccia di sottospazi proiettivi di Pn (R) nelle carte ani. Consideriamo la carta ane Ai di
Pn (R), come in (1.10), dove ricordiamo vale la condizione Xi 6= 0.
Denizione 6. Dato un sottospazio proiettivo P(U ) di Pn (R) ed un intero 0 ≤ i ≤ n, l'insieme
P(U ) ∩ Ai
viene detto traccia del sottospazio proiettivo P(U ) nella carta ane Ai .
Notiamo che se il sottospazio P(U ) e' contenuto nell'iperpiano Xi = 0 di Pn (R) allora la sua
traccia nella carta Ai e' l'insieme vuoto. Per comprendere meglio come sono fatte le tracce di sottospazi
proiettivi, discutiamo alcuni esempi.
GEOMETRIA PROIETTIVA 11

Esempio 2.4. Considerando nuovamente l'Esempio 2.3, avevamo la retta proiettiva ` ⊂ P2 (R) di
equazione cartesiana X1 − X2 = 0. Nella carta ane A0 , dove consideriamo coordinate cartesiane
(non omogenee) come in (1.7), si ha che la traccia
` ∩ A0

non e' altro che la retta del piano cartesiano R2 = A0 , con coordinate cartesiane (non omogenee) (x, y),
denita da equazione cartesiana x − y = 0. Notiamo che la retta (ane) `∩  A0 ⊂ A0 = R2 e' la retta
1
passante per l'origine O = (0, 0) = [1, 0, 0] di A0 e di vettore direttore v = . Come gia' discusso nei
1
precedenti paragra del testo, la retta proiettiva ` si puo' vedere come ottenuta dalla retta (ane) ` ∩ A0
contenuta nel piano cartesiano A0 = R2 con l' "aggiunta" del punto improprio di ` ∩ A0 . Sappiamo che
questo punto improprio deve essere collegato con la direzione (cioe' il vettore direttore) della retta ` ∩ A0 ,
i.e. esso e' [0, 1, 1]. Questo riette quanto osservato in Esempio 2.3, dove avevamo notato che la retta
proiettiva ` era la retta congiungente i punti [1, 0, 0] e [0, 1, 1] di P2 (R).
Esempio 2.5. Consideriamo in P2 (R) la retta proiettiva di equazione cartesiana X0 − X1 + X2 = 0.
Nella carta ane A0 , dove consideriamo coordinate cartesiane (non omogenee) come in (1.7), si ha che
la traccia
` ∩ A0
non e' altro che la retta del piano cartesiano R2 = A0 , con coordinate cartesiane (non omogenee) (x, y),
denita da equazione cartesiana
1 − x + y = 0.
Nella carta A1 , con coordinate cartesiane (non omogenee) come in (1.8), si ha che la traccia
` ∩ A1

non e' altro che la retta del piano cartesiano R2 = A1 , con coordinate cartesiane (non omogenee) (ξ, η),
denita da equazione cartesiana
ξ − 1 + η = 0.
Inne, nella carta A2 , con coordinate cartesiane (non omogenee) come in (1.9), si ha che la traccia
` ∩ A2

e' la retta del piano cartesiano R2 = A2 , con coordinate cartesiane (non omogenee) (z, w), denita da
equazione cartesiana
z − w + 1 = 0.

Esempio 2.6. Sempre in P2 (R) consideriamo la retta proiettiva di equazione cartesiana X1 = 0. La sua
traccia nella carta ane A0 non e' altro che l'asse delle ordinate
x = 0;

la sua traccia nella carta A2 e' la retta di equazione cartesiana


w = 0;

invece
` ∩ A1 = ∅.
12 FLAMINIO FLAMINI

2.3. Completamento proiettivo di luoghi geometrici lineari in Rn . Consideriamo Rn l'usuale


spazio cartesiano, in cui supponiamo di aver ssato un riferimento cartesiano monometrico ortogo-
nale RC(O; x1 , x2 , . . . , xn ). Per semplicita' di notazioni, quando faremo considerazioni/esempi nei casi
di R1 , R2 e R3 , i riferimenti cartesiani saranno denotati semplicemente con RC(O; x), RC(O; x, y) e
RC(O; x, y, z), rispettivamente, come usualmente fatto nei CAPITOLI 11 e 12 del testo.
Sappiamo che i luoghi geometrici lineari L ⊂ Rn (i.e. punti, rette, piani, . . ., iperpiani) di di-
mensione k ∈ {1, . . . , n − 1} sono deniti da equazioni cartesiane, i.e. da sistemi lineari (in generale)
non-omogenei e compatibili della forma:


 a1,1 x1 + a1,2 x2 + · · · + a1,n xn = b1
a2,1 x1 + a2,2 x2 + · · · + a2,n xn = b2



(2.5) · · ·
· · ·




an−k,1 x1 + an−k,2 x2 + · · · + an−k,n xn = bn−k

dove
   
a1,1 a1,2 ··· a1,n a1,1 a1,2 ··· a1,n b1

 a2,1 a2,2 ··· a2,n 


 a2,1 a2,2 ··· a2,n b2 

rg 
 · · ··· ·  = rg 
  · · ··· · · =n−k

 · · ··· ·   · · ··· · · 
an−k,1 an−k,2 ··· an−k,n an−k,1 an−k,2 ··· an−k,n bn−k
e da equazioni parametriche della forma:


 x1= p1 + b1,1 t1 + · · · + b1,k tk
 x2= p2 + b2,1 t1 + · · · + b2,k tk


(2.6) · · ·
· · ·




xn= pn + bn,1 t1 + · · · + bn,k tk

 
p1
 p2 
ove (t1 , . . . , tk ) ∈ Rk parametri liberi mentre P = 
 ·  ∈ L ⊂ R un punto su L.
  n

·
pn
La domanda che ci poniamo e' la seguente: sia dato un luogo geometrico lineare L ⊂ Rn , denito
da equazioni cartesiane (2.5) e parametriche (2.6); se per convenzione identichiamo lo spazio cartesiano
Rn con la carta ane A0 (come in (1.10)) di Pn (R), allora di quale sottospazio proiettivo P(U ) ⊂ Pn (R)
il luogo L e' traccia nella carta A0 ? In altri termini, per quale P(U ) ⊂ Pn (R) si ha
(2.7) L = P(U ) ∩ A0 ?

Denizione 7. Il procedimento di determinare P(U ) ⊂ Pn (R) che soddis (2.7) lo diremo completamento
proiettivo di L in Pn (R).
Notiamo che si dice completamento proprio perche' determinando P(U ) andiamo ad aggiungere a L ⊂ Rn i
suoi elementi improprio (od all'innito) per la carta ane A0 = Rn , i.e. completiamo L con i suoi elementi
impropri. Per questo motivo, per maggior chiarezza notazionale, P(U ) come in (2.7) lo denoteremo anche
con
L := P(U )
come se fosse una chiusura proiettiva di L. Questa notazione ci permettera' di ricordare meglio che
L ⊆ L = P(U ).
GEOMETRIA PROIETTIVA 13

Vediamo infatti che, dato L, allora L = P(U ) e' univocamente determinato. Infatti, per denizione
di carta ane A0 , abbiamo che X0 6= 0 e che
Xi
xi = , 1 ≤ i ≤ n.
X0
Pertanto, visto che L e' per ipotesi denito da equazioni cartesiane come in (2.5), e' chiaro allora che
L = P(U ) e' denito dal sistema omogeneo:


 a1,1 X1 + a1,2 X2 + · · · + a1,n Xn − b1 X0 = 0
a2,1 X1 + a2,2 X2 + · · · + a2,n Xn − b1 X0 = 0



(2.8) · · ·
· · ·




an−k,1 X1 + an−k,2 X2 + · · · + an−k,n Xn − bn−k X0 = 0

Infatti, nei punti di A0 , dove [X0 , X1 , X2 , . . . , Xn ] = [1, x1 , x2 , . . . , xn ], il sistema (2.8) fornisce tutte e sole
le soluzioni del sistema non omogeneo (2.5). Laddove X0 = 0 (che e' iperpiano improprio od all'innito
per A0 ), il sistema (2.8) fornisce


 X0 = 0
a1,1 X1 + a1,2 X2 + · · · + a1,n Xn − b1 X0 = 0




a2,1 X1 + a2,2 X2 + · · · + a2,n Xn − b1 X0 = 0

(2.9)

 · · ·
· · ·




an−k,1 X1 + an−k,2 X2 + · · · + an−k,n Xn − bn−k X0 = 0

che determina un sottospazio proiettivo (perche' denito da un sistema di equazioni omogenee) di Pn (R)
contenuto nell'iperpiano X0 = 0. I punti di questo sottospazio sono gli elementi di L \ L, i.e. gli elementi
impropri di L.
Se invece L e' dato da equazioni parametriche (2.6), allora ricordiamo che possiamo sempre con-
siderare Rk 3 (t1 , . . . , tk ) = [1, t1 , . . . , tk ] e porre
λi
ti := , λ0 , λi ∈ R, λ0 6= 0, 1 ≤ i ≤ k
λ0
mentre in Rn = A0 abbiamo
Xi
xi = , 1 ≤ i ≤ n.
X0
Allora il sistema (2.6) con queste sostituzioni si scrive:
p1 λ0 +b1,1 λ1 +···+b1,k λk

X1

 X0 = λ0
p2 λ0 +b2,1 λ1 +···+b2,k λk
 X2
=


 X0 λ0
(2.10) · · ·
· · ·




 Xn pn λ0 +bn,1 λ1 +···+bn,k λk
=

X0 λ0

che nelle coordinate omogenee di Pn (R) si legge come




 X0 = λ0
X1 = p1 λ0 + b1,1 λ1 + · · · + b1,k λk




X2 = p2 λ0 + b2,1 λ1 + · · · + b2,k λk

(2.11)

 · · ·
· · ·




Xn = pn λ0 + bn,1 λ1 + · · · + bn,k λk

con [λ0 , λ1 , . . . , λk ] ∈ Pk (R).


14 FLAMINIO FLAMINI

Esempio 2.7. Nella retta reale R con coordinata cartesiana (ane) x1 = x consideriamo il luogo
L = {x ∈ R | x = 2}.
Questo e' semplicemente il punto di ascissa x = 2. Visto che identichiamo R con la carta A0 di P1 (R),
dove vale x = X
X1
0
, allora L ⊂ P1 (R) e' denito dall'equazione cartesiana omogenea
X1 − 2X0 = 0,
che fornisce il punto P = [1, 2]. In questo caso abbiamo che
L = L.
Analogamente, le equazioni parametriche di L sono date dalle soluzioni del sistema omogeneo X1 −2X0 =
0, cioe'
X0 = λ0 , X1 = 2λ0 , λ0 6= 0.
Esempio 2.8. Nel piano cartesiano R2 , con coordinate cartesiane (x1 , x2 ) = (x, y), consideriamo dap-
prima la retta L1 denita dall'equazione cartesiana
x − y = 3.
   
3 1
Essa e' quindi la retta passante per il punto P = ∈ R e di vettore direttore v =
2
. Identicando
0 1
R2 con la carta ane A0 di P2 (R), dove valgono le (1.7), si ha che la retta L1 ⊂ P2 (R) completamento
proiettivo di L1 e' denita dall'equazione cartesiana omogenea
X1 − X2 − 3X0 = 0.
Notiamo che il punto P ∈ L1 lo ritroviamo ovviamente come punto [1, 3, 0] ∈ L1 . L'intersezione tra la
retta proiettiva L1 e la retta proiettiva di equazione X0 = 0 (quindi impropria per A0 ) e' data dalle
soluzioni del sistema omogeneo: 
X0 = 0
X1 − X2 − 3X0 = 0
Questo sistema e' equivalente al sistema omogeneo:

X0 = 0
(2.12)
X1 − X2 = 0
che fornisce come soluzione il punto [0, 1, 1] ∈ L1 \ L1 . Questo punto e' il punto improprio di L1 , collegato
con la direzione di L1 . In particolare abbiamo un esempio dove l'inclusione L1 ⊂ L1 e' stretta.
Sia ora L2 la retta di R2 denita da
x − y = 5.
Notiamo che L2 e' manifestamente parallela (ma non coincidente) a L1 . Similmente a prima, L2 ⊂ P2 (R)
e' denita da
X1 − X2 − 5X0 = 0.
L'intersezione tra la retta proiettiva L2 e la retta proiettiva di equazione X0 = 0 e' data da:

X0 = 0
X1 − X2 − 5X0 = 0.
Questo sistema e' equivalente a (2.12), pertanto
L1 ∩ L2 = [0, 1, 1]
sebbene in A0 = R sia avesse
2

L1 ∩ L2 = ∅
in quanto rette parallele ma non coincidenti. In altri termini, le rette ani L1 e L2 hanno medesimo punto
improprio, come e' giusto che sia, visto che la loro giacitura (equivalentemente il loro vettore direttore)
e' lo stesso (vedasi Figura 8)
GEOMETRIA PROIETTIVA 15

Figure 8. Le rette L1 e L2 ed i loro completamenti proiettivi

Osservazione 2.9. Il precedente esempio ci mostra una conseguenza particolarmente importante della
Geometria Proiettiva: la nozione di parallelismo sparisce in ambito proiettivo

3. Esercizi Svolti

Esercizio 1: Sia P1 (R) la retta proiettiva reale e siano dati P = [3, 2] e Q = [−6, −4].
(i) Stabilire se P = Q in P1 (R).
(ii) Trovare equazioni cartesiane e parametriche di P in P1 (R).
(iii) Determinare i punti traccia di P nelle carte ani fondamentali A0 e A1 di P1 (R).
Svolgimento. (i) Poiche' i vettori corrispondenti ai punti P e Q sono proporzionali, ne segue che P = Q.
(ii) Equazioni cartesiane per P sono date da 2X0 − 3X1 = 0 mentre equatzioni parametriche sono
X0 = 3λ, X1 = 3λ, λ 6= 0.
(iii) Nella carta A0 il punto P ha traccia x = 23 mentre nella carta A1 esso ha traccia ξ = 32 .


Esercizio 2: Nel piano proiettivo P2 (R) si considerino i punti


P = [1, 1, −1], Q = [1, 1, 0], R = [2, 1, 0].
(i) Stabilire se i punti sono allineati.
(ii) Determinare l'equazione cartesiana omogenea della retta per i punti P = [1, 1, −1] e Q = [1, 1, 0].
(iii) Determinare l'intersezione delle rette 2X0 − 2X1 + 3X2 = 0 e 2X0 − 4X1 + 6X2 = 0 in P2 (R).
16 FLAMINIO FLAMINI

Svolgimento. (i) I tre punti dati saranno allineati in P2 (R) se e solo se i tre vettori corrispondenti dello
spazio vettoriale R3 (di cui P2 (R) e' immagine mediante π ) sono linearmente dipendenti. Poiche' il vettore
corrispondente al punto P non puo' essere combinazione lineare dei vettori corrispondenti ai punti Q e
R, deduciamo che i tre punti di P2 (R) non sono allineati.
(ii) L'equazione cartesiana della retta congiungente P e Q e' la stessa dell'equazione cartesiana del
sottospazio vettoriale di R3 generato dai vettori corrispondenti ai punti P e Q. Questa e' data da
X0 − X1 = 0.
(iii) Notiamo che le due rette date hanno come tracce nella carta ane A0 le rette
2 − 2x + 3y = 0 1 − 2x + 3y = 0
rispettivamente. Esse sono parallele ma non coincidenti. Pertanto l'intersezione delle due rette proiettive
date e' semplicemente il loro punto improprio comune che e' [0, 3, 2].


Esercizio 3: Nel piano cartesiano R2 , con riferimento cartesiano RC(O; x, y), sia dato il fascio F di rette
parallele
x + 2y = t,
ove t ∈ R un parametro. Identicando R con la carta ane A0 di P2 (R), determinare il fascio di rette
2

proiettive che ha come traccia in A0 il fascio di rette ani dato.


Svolgimento. Visto che le rette del fascio in R2 sono tutte parallele, allora il fascio di rette proiettive e'
quello costituito dal fascio di rette per il punto [0, 2, −1] ∈ P2 (R). Notiamo quindi che questo e' un fascio
di rette a centro, dove il centro del fascio e' il punto improprio comune a tutte le rette ani di F . Se
scriviamo l'equazione
X1 + 2X2 − tX0 = 0, t ∈ R
stiamo descrivendo il completamento di tutte le rette del fascio F . Per individuare tutte le rette del
fascio F di rette proiettive di centro [0, 2, −1] dobbiamo includere la retta X0 = 0, che e' impropria per
A0 . Pertanto, possiamo considerare t = µ/λ e quindi F sara'
λX1 + 2λX2 − µX0 = 0;
per [λ, µ] = [0, 1] otteniamo appunto la retta X0 = 0 mentre per λ 6= 0 la precedente equazione e'
equivalente a X1 + 2X2 − tX0 = 0 e queste sono le uniche rette di F che hanno una traccia in A0 .


Esercizio 4: Sia dato il piano cartesiano R2 , con riferimento cartesiano RC(O; x, y). Si consideri la retta
r di equazione cartesiana 2x + 3y = 1.
(i) Considerando R2 come la carta ane (o schermo) A0 di P2 (R), determinare il punto improprio di r.
(ii) Trovare l'equazione cartesiana della retta passante in (1, 0) ∈ R2 ed avente come punto improprio
[0, 1, 2].

Svolgimento. (i) Il punto improprio di r e' dato dalle soluzioni del sistema omogeneo
2X1 + 3X2 − X0 = 0 = X0
che e' quindi [0, 3, −2].
(ii) Avere
  punto improprio [0, 1, 2] per una retta ane di R equivale a dire che ha vettore direttore
2

1
v= . Pertanto si deve trovare la retta passante per (1, 0) con tale vettore direttore.
2

GEOMETRIA PROIETTIVA 17

Esercizio 5: Sia dato il piano cartesiano R2 , con coordinate cartesiane (x, y). Sia date le rette
r : x − 2y − 1 = 0,

s : x + y + 4 = 0,
t : 4y − 2x + 8 = 0.
(i) Considerando R come la carta ane A0 di P2 (R), determinare i punti impropri di s e t.
2

(ii) Dette r, s e t i completamenti proiettivi delle rispettive rette, determinare le intersezioni di r, s e t.


(iii) Dedurre che le rette r e t sono parallele.
(iv) Trovare l'equazione cartesiana di r nelle altre carte ani A1 e A2 di P2 (R).
Svolgimento. (i) Il completamento proiettivo di s ha equazione
X1 + X2 + 4X0 = 0
quindi il punto improprio di s e' dato dal sistema
X0 = 0 = X1 + X2 = 0,
i.e.
[0, 1, −1].
Il completamento proiettivo di t ha equazione
4X2 − 2X1 + 8X0 = 0;
pertanto il punto improprio di t e' [0, 2, 1].
(ii) Notiamo subito che r e s gia' si intersecano in R2 nel punto di coordinate
7 5
(− , − ).
3 3
Pertanto l'intersezione in P2 (R) e' il punto [3, −7, −5]. Analogo discorso per s e t.
Invece il sistema non omogeneo formato dalle equazioni cartesiane di r e t e' incompatibile, cioe' non
esiste intersezione in R2 . In eetti, come nel punto (i) osserviamo che r e t hanno il medesimo punto
improprio. Pertanto
r ∩ t = [0, 2, 1].
Questa intersezione non e' visibile nella carta ane A0 .
(iii) Poiche' r e t hanno lo stesso punto improprio rispetto alla carta A0 , allora r e t sono parallele. Infatti
le loro giaciture in A0 sono ambedue proporzionali a
x − 2y = 0.
(iv) Nella carta A1 abbiamo che
ξ = X0 /X1 , η = X2 /X1 .
Pertanto la retta r induce nella carta A1 la retta traccia di equazione
ξ + 2η − 1 = 0.
Nella carta A2 abbiamo che
z = X0 /X2 , w = X1 /X2
pertanto r induce la retta di equazione
z − w + 2 = 0.

18 FLAMINIO FLAMINI

Esercizio 6: Nello spazio cartesiano R3 , con coordinate cartesiane (x, y, z), siano dati il piano
π :x−z =2
   
1 2
e la retta ` passante per il punto P = 1 e di vettore direttore v = 1. Identichiamo R3 con la
2 2
carta ane A0 di P3 (R).
(i) Determinare equazione cartesiana omogenea del completamento proiettivo π del piano π .
(ii) Determinare la retta impropria di π ed il punto improprio di `.
(iii) Dedurre che π e ` erano paralleli.
(iv) Descrivere π ∩ `.
Svolgimento. (i) L'equazione cartesiana omogenea del completamento proiettivo π e'
X1 − X3 − 2X0 = 0.
(ii) La retta impropria di π e' data dal sistema
X1 − X3 − 2X0 = 0 = X0 ,
che e' equivalente a
X1 − X3 = 0 = X0 .
Pertanto la retta impropria di π e' la retta di P3 (R) di equazioni parametriche
X0 = 0, X1 = λ0 , X2 = λ1 , X3 = λ0 , [λ0 , λ1 ] ∈ P1 (R).
Il punto improprio di ` e' direttamente individuato dalla sua direzione, i.e. [0, 2, 1, 2].
(iii) Il punto improprio di ` e' manifestamente contenuto nella retta impropria di π . Questo signica
appunto che ` era una retta paralella a π . Notare che ` non era pero' contenuta in π , visto che P non
appartiene a π .
(iv) Per quanto descritto precedentemente, ne segue che π ∩ ` = [0, 2, 1, 2].


Esercizio 7: Sia P1 (R) la retta proiettiva reale.


(i) Determinare la trasformazione proiettiva
F : P1 (R) → P1 (R)
t.c. mandi ordinatamente i punti
A = [1, 0], B = [0, 1], C = [1, 1]
rispettivamente in
A = [1, 0], D = [1, −2], E = [3, −2].
(ii) Determinare gli eventuali punti ssi di F .
Svolgimento. (i) La trasformazione proiettiva F e' rappresentata dalla classe di proporzionalita' della
matrice  
2 1
A= .
0 −2
(ii) La matrice A ha due autovalori distinti λ = 2 e µ = −2. I relativi autospazi determinano 2 punti ssi
di F che sono i punti P = [1, 0] e Q = [1, −4]. 

Esercizio 8: In P2 (R) si consideri la trasformazione proiettiva F : P2 (R) → P2 (R) determinata dalla


classe di proporzionalita' della matrice:
 
1 0 0
A= 0 1 2 .
0 0 1
GEOMETRIA PROIETTIVA 19

Vericare che F ha la retta X0 = 0 come luogo sso mentre ha la retta X2 = 0 come luogo di punti ssi.
Svolgimento. (i) F ([0, α, β]) = [0, α + 2β, β], percio' X0 = 0 viene ssato da F come retta.
(ii) F ([α, β, 0]) = [α, β, 0], cioe' la retta X2 = 0 e' ssata punto per punto da F .


Esercizio 9: Nel piano proiettivo P2 (R), si consideri la quaterna di punti


P0 = [1, 0, 0], P1 = [−1, 1, 0], P2 = [2, −1, 1], P3 = [0, 0, 1].
Determinare l'unica trasformazione proiettiva F che trasformi, ordinatamente, i punti della quaterna
precedente nei punti della quaterna
E0 = [1, 0, 0], E1 = [0, 1, 0], E2 = [0, 0, 1], E3 = [1, 1, 1]
Svolgimento. Per semplicita' ci calcoliamo la matrice associata alla trasformazione proiettiva inversa F −1 ,
che ha matrice  
−1 −1 2
A= 0 1 −1  .
0 0 1
Pertanto, la trasformazione proiettiva F sara' associata alla classe di matrici λA−1 , dove λ ∈ R∗ . 

Esercizio 10: Nel piano proiettivo P2 (R), si consideri la trasformazione proiettiva F di P2 determinata
dalla classe di proporzionalita' di matrici λA, dove:
 
−1 −1 2
A= 0 1 −1  .
0 0 1
(i) Determinare quali delle rette fondamentali del riferimento standard di P2R sono rette sse per la
proiettivita' F .
(ii) Stabilire se ciascuna retta ssa determinata al punto (i) e' retta di punti ssi per F .
(iii) Determinare i punti ssi di F .
Svolgimento. (i) Le rette X0 = 0 e X1 = 0 non sono rette sse per F . Infatti, per ogni (α, β) 6= (0, 0) si
ha
F ([0, α, β]) = [2β − α, α − β, β],
e
F ([α, 0, β]) = [2β − α, −β, β].
Invece X2 = 0 e' una retta ssa per F , poiche'
F ([α, β, 0]) = [−β − α, β, 0].
(ii) Ovviamente la retta X2 = 0 non e' retta di punti ssi per F .
(iii) I punti ssi su x2 = 0 si ottengono per quei valori di α e β tali che
−α − β = λα, β = λβ.
Si ottengono i due punti
[1, −2, 0] [1, 0, 0].
Questi eettivamente sono gli unici punti ssi di F . Infatti, la matrice A ha polinomio caratteristico
PA (t) = −(t + 1)(1 − t)2 ,
che ha soluzioni t = −1, semplice, e t = 1, di molteplicita' 2. I relativi autospazi in R3 sono proprio
generati da, rispettivamente, (1, 0, 0) e (1, −2, 0).

20 FLAMINIO FLAMINI

Esercizio 11: Nello spazio cartesiano R4 , con coordinate cartesiane (x, y, z, w), si consideri il sottospazio
vettoriale
π0 : {x + y + z + w = 0}
ed il suo traslato
π : {x + y + z + w = 1}.
Si consideri inoltre
τ : {x + 2y − z = 0}.
Identichiamo R con la carta ane A0 dello spazio proiettivo P4 (R), munito di coordinate omogenee
4

[X0 , X1 , X2 , X3 , X4 ].
(i) Si determinino equazioni parametriche e cartesiane omogenee del piano improprio di π0 , di quello di
π e di quello di τ .
(ii) Scrivere equazioni parametriche e cartesiane del piano β ⊂ R4 ottenuto come intersezione di π con τ .
(iii) Determinare equazioni parametriche e cartesiane omogenee della retta impropria del piano β . Ri-
conoscere che la retta impropria determinata e' la retta di P4 (R) che e' intersezione del piano improprio
di π con il piano improprio di τ .
Svolgimento. (i) Poiche' π0 e π sono due iperpiani paralleli in R4 , il piano improprio di π0 coincide con
quello di π . L'equazione cartesiana omogenea del completamento proiettivo di π in P4 (R) è
X1 + X2 + X3 + X4 − X0 = 0.
Le equazioni cartesiane del piano improprio di π (i.e. del piano di punti impropri di π rispetto alla carta
ane A0 ) sono dunque: 
X1 + X2 + X3 + X4 − X0 = 0
X0 = 0
e quindi 
X1 + X2 + X3 + X4 = 0
,
X0 = 0
che in eetti coincidono con le equazioni cartesiane omogenee del piano improprio di π0 .
Le equazioni parametriche omogenee in P4 (R) di questo piano improprio sono date da
X0 = 0, X1 = α1 + α2 + α3 , X2 = −α1 , X3 = −α2 , X4 = −α3 , con [α1 , α2 , α3 ] ∈ P2 (R).
Questa rappresentazione mostra che il piano improprio di π (e di π0 ) e' il piano in P4 (R) generato dai 3
punti (non allineati)
P1 = [0, 1, −1, 0, 0], P2 = [0, 1, 0, −1, 0], P3 = [0, 1, 0, 0, −1].
In eetti il sottospazio π0 di R4 , giacitura di π , e' il sottospazio vettoriale generato dai vettori
     
1 1 1
 −1   0
 , v3 =  0  ;
  
v1 =  , v =
0  2  −1
  
  0 
0 0 −1
in altri termini i tre punti P1 , P2 , P3 che generano il piano improprio di π (e di π0 ) si interpretano come
i vettori di giacitura di π cioe' come la base v1 , v2 , v3 di π0 sopra descritta.
Con conti analoghi, troviamo che le equazioni (omogenee) cartesiane del piano improprio di τ sono:

X1 + 2X2 − X3 = 0
.
X0 = 0
Le equazioni parametriche omogenee in P4 (R) di questo piano improprio sono date da
X0 = 0, X1 = 2β1 + β2 , X2 = −β1 , X3 = β2 , X4 = β3 , con [β1 , β2 , β3 ] ∈ P2 (R).
GEOMETRIA PROIETTIVA 21

Questa rappresentazione mostra che il piano improprio di τ e' il piano in P4 (R) generato dai 3 punti (non
allineati)
Q1 = [0, 2, −1, 0, 0], Q2 = [0, 1, 0, 1, 0], Q3 = [0, 0, 0, 0, 1].
In eetti τ e' il sottospazio vettoriale di R4 generato dai vettori
    

2 1 0
 −1   0
 , w3 =  0  ,
  
w1 = 
 0  , w2 =  1
 
  0 
0 0 1
i.e. analogamente a prima, i tre punti Q1 , Q2 , Q3 ∈ P4 (R) che generano il piano improprio di τ si
interpretano come i vettori della base di τ sopra menzionata.
(ii) Il piano β := π ∩ τ e' il piano di R4 di equazioni cartesiane

x+y+z+w = 1
.
x + 2y − z = 0
 
0
 0 
Esso e' dunque il piano passante per il punto R = 
 1  ∈ R e con giacitura data da
 4

0
    

 2 3 

  −1   −2 
Span b1 =    , b2 = 
  .

 0  −1 
−1 0
 

Pertanto, sue equazioni parametriche in R4 sono:


x = 2t + 3s, y = −t − 2s, z = −s, w = 1 − t, (t, s) ∈ R2 .
Notiamo che i vettori di giacitura del piano β sono (come giusto che sia) entrambi ortogonali ai vettori
   
1 1
 1   2 
nπ = 
 1  , nτ =  −1
  

1 0
che sono, rispettivamente, il vettore normale a π ed a τ .
(iii) Equazioni cartesiane (omogenee) della retta impropria di β sono date dal sistema omogeneo:

 X1 + X2 + X3 + X4 = 0
X1 + 2X2 − X3 = 0 .
X0 = 0

Questo mostra che tale retta impropria e' quindi l'intersezione del piano improprio di π (o di π0 ) e del
piano improprio di τ , come richiesto. Le equazioni parametriche omogenee della retta impropria di β in
P4 (R) sono date da:
X0 = 0, X1 = 2γ1 + 3γ2 , X2 = −γ1 − 2γ2 , X3 = −γ2 , X4 = −γ1 , dove [γ1 , γ2 ] ∈ P1 .
Con questa rappresentazione, notiamo che la retta impropria di β e' la retta generata dai due punti di
P4 (R)
B1 = [0, 3, −2, −1, 0], B2 = [0, 2, −1, 0, −1]
collegati ai vettori b1 e b2 precedentemente considerati.

ISOMETRIE ED AFFINITA’ NOTEVOLI DEL PIANO CARTESIANO R2 E DELLO
SPAZIO CARTESIANO R3

FLAMINIO FLAMINI

1. Alcune trasformazioni affini del piano cartesiano


In questo paragrafo approfondiamo alcuni argomenti discussi precedentemente, considerando lo
studio di alcune trasformazioni affini f : R2 → R2 che hanno un particolare significato geometrico.
Le trasformazioni che studieremo verranno chiamate con teminologia equivalente anche applicazioni e
saranno isometrie ed affinità particolarmente importanti di R2 .
In quanto segue, assumeremo di aver fissato una volta per tutto una origine O del piano cartesiano
R2 ed un sistema di riferimento cartesiano ortogonale monometrico RC(O; x, y). In altri termini, l’origine
O si identifica con il vettore nullo O della struttura di spazio vettoriale sottogiacente di R2 e l’asse x
(risp., y) si identifica con il sottospazio vettoriale Span(e1 ) (risp., Span(e2 )), ove e1 , e2 la base canonica
ortonormale di R2 spazio vettoriale euclideo rispetto al prodotto scalare standard ·.

Alcune isometrie del piano cartesiano R2 . Cominciamo con alcune fondamentali isometrie.

 
p1−→
2 2
• Equazioni di traslazioni di R : se P ∈ R è un punto del piano cartesiano e P :=OP = è il
p2
corrispondente vettore, denoteremo con tP la traslazione di passo P , che è chiaramente un’isometria
quindi anche una trasformazione affine. Nelle coordinate fissate (x, y) avremo che
   
x x + p1
(1.1) tP = .
y y + p2

In particolare, per ogni P, Q ∈ R2 , tP ◦ tQ = tP +Q , i.e. la composizione di due traslazioni è ancora una


traslazione.
Osserviamo che, nelle notazioni dei precedenti paragrafi, la rappresentazione di tP puo’ essere
anche data da
 
1 0 p1
 0 1 p2  .
0 0 1

• Equazioni di rotazioni di angolo θ attorno all’origine O: poiche’ una siffatta rotazione ha O come punto
fisso, vedremo che essa sara’ identificata ad un’applicazione lineare dello spazio vettoriale R2 . Piu’ pre-
cisamente, tale trasformazione sara’ un’ isometria lineare diretta dello spazio vettoriale R2 . Ricordiamo
che questo significa avere un’applicazione lineare la cui matrice rappresentativa nella base canonica e e’
una matrice M speciale ortogonale, in simboli M M t = M t M = I2 e det(M ) = 1.

Definizione 1. Sia θ ∈ R. Denotiamo con Rθ = Rθ,O l’applicazione di R2 in sè che ad un arbitrario


punto P ∈ R2 associa il punto Q = QP ∈ R2 , estremo libero del vettore Q ottenuto ruotando il vettore P
di un angolo θ attorno al vettore nullo O. Rθ si chiama rotazione attorno all’origine O di angolo θ.

1
2 FLAMINIO FLAMINI

 
x
Proposizione 1.1. Sia x = ∈ R2 arbitrario. Allora
y
    
x cos θ − sin θ x
(1.2) Rθ = .
y sin θ cos θ y
 0
0 x
In altri termini, se x = Rθ (x) = , le equazioni per la rotazione Rθ sono date da:
y0
 0
x = cos θ x − sin θ y
(1.3)
y 0 = sin θ x + cos θ y.
In particolare,
• se θ = 0, allora Rθ = Id;
• se θ > 0, la rotazione di x è in senso antiorario rispetto al vettore e1 ;
• se θ < 0, la rotazione di x è in senso orario rispetto al vettore e1 .
Dimostrazione. Sia α l’angolo convesso fra il vettore x e l’asse delle x. Precisamente, se x si trova nel
I o IV quadrante, allora α è l’angolo convesso fra i vettori x ed e1 ; se x si trova invece nel II o III
quadrante, allora α è l’angolo convesso fra i vettori x e −e1 . In ogni caso, si ha che
x = ||x|| cos α, y = ||x|| sin α.
Il vettore x0 := Rθ (x) è tale che ||x0 || = ||x|| e forma con l’asse delle x un angolo pari a α + θ. Pertanto
x0 = ||x|| cos(α + θ), y 0 = ||x|| sin(α + θ).
Per le formule di addizione delle funzioni trigonometriche e per le precedenti relazioni, abbiamo quindi:
x0 = ||x||(cos α cos θ − sin α sin θ) = x cos θ − y sin θ,
y 0 = ||x||(sin α cos θ − cos α sin θ) = x sin θ + y cos θ
onde l’asserto. 

Corollario 1.2. Per ogni θ ∈ R, le rotazioni Rθ attorno all’origine O sono isometrie lineari dirette dello
spazio vettoriale R2 , i.e. la matrice rappresentativa come in (1.2) è speciale ortogonale.
Dimostrazione. Il fatto che siano isometrie lineari discende direttamente dalla rappresentazione (1.2);
infatti per ogni θ le colonne della matrice rappresentativa costituiscono una base ortonormale di R2 .
Infine, il determinate della matrice rappresentativa di Rθ è dato da cos2 θ + sin2 θ = 1. 

Osservazione 1.3. Osserviamo che le rotazioni Rθ attorno all’origine in particolare conservano l’orientazione
di basi dello spazio vettoriale R2 , i.e. Or(v, w) = Or(Rθ (v), Rθ (w)), per ogni coppia di vettori linear-
mente indipendenti v, w di R2 e per ogni θ ∈ R.
Notiamo che le rotazioni attorno all’origine godono inoltre delle seguenti ovvie proprietà che dis-
cendono immeditamente da (1.2).
Proposizione 1.4. (i) Per θ, ϕ ∈ R, si ha Rθ ◦ Rϕ = Rϕ ◦ Rθ = Rθ+ϕ .
(ii) Per ogni θ ∈ R, R−1
θ = R−θ .

In particolare, la composizione di rotazioni attorno all’origine è ancora una rotazione attorno all’origine
e l’inversa di una rotazione attorno all’origine è una rotazione attorno all’origine.
Concludiamo con l’osservare che, nelle notazioni dei precedenti paragrafi, la rappresentazione di
Rθ puo’ essere anche data da
 
cos θ − sin θ 0
 sin θ cos θ 0  .
0 0 1
ISOMETRIE ED AFFINITA’ NOTEVOLI 3

 
p1
• Equazioni di rotazioni di angolo θ attorno ad un punto qualsiasi P : sia θ ∈ R e sia P = un
p2
punto di R2 . Denotiamo con Rθ,P l’isometria di R2 data dalla rotazione di angolo θ attorno al punto P .
Per ottenere le equazioni di tale rotazione, si procede nel modo seguente:
(i) prima si considera la traslazione t−P di passo −P , che porta quindi il punto P nell’origine O di R2 ;
(ii) poi si compie la rotazione lineare Rθ intorno ad O, come in Definizione 1;
(iii) infine si riapplica la traslazione tP di passo P che riporta cosı̀ O in P .
In definitiva, l’isometria cercata si può scrivere come:
(1.4) Rθ,P = tP ◦ Rθ ◦ t−P .
Pertanto       
x x − p1 cos θ − sin θ x − p1
Rθ,P = tP ◦ R θ = tP ,
y y − p2 sin θ cos θ y − p2
che fornisce le equazioni della rotazione attorno a P :
      
x cos θ − sin θ x q
(1.5) Rθ,P = + 1 ,
y sin θ cos θ y q2
dove       
q1 cos θ − sin θ −p1 p
:= + 1 .
q2 sin θ cos θ −p2 p2
Notiamo che l’espressione (1.5) mostra che Rθ,P è composizione di una opportuna traslazione e di
un’isometria lineare diretta.
Concludiamo con l’osservare che, nelle notazioni dei precedenti paragrafi, la rappresentazione di
Rθ,P come in (1.5) puo’ essere anche data da
 
cos θ − sin θ q1
 sin θ cos θ q2  .
0 0 1

• Equazioni di riflessioni (o simmetrie) rispetto ad un punto di R2 : questo sarà un caso particolare di


quanto discusso precedentemente per le rotazioni.
Definizione 2. Denotiamo con SO l’applicazione di R2 in sè che ad un arbitrario punto P associa il
punto estremo libero del vettore −P . SO è detta riflessione rispetto all’origine.
È chiaro dalla definizione che SO non è altro che la rotazione attorno all’origine di angolo θ = π.
Pertanto, SO è un’isometria lineare diretta di R2 . In particolare, essa conserva l’orientazione di basi dello
spazio vettoriale R2 , come ciascuna rotazione fa. Inoltre, le sue equazioni sono chiaramente:
    
x −1 0 x
(1.6) SO = .
y 0 −1 y
Nelle notazioni dei precedenti paragrafi, la rappresentazione di SO come in (1.6) puo’ essere anche
data da  
−1 0 0
 0 −1 0  .
0 0 1
Sia invece P un qualsiasi punto del piano cartesiano R2 . Denotiamo con SP l’isometria di R2 data
dalla riflessione rispetto al punto P . Per ogni punto Q ∈ R2 essa e’ definita dalla condizione
−→ −→
P Q= − P SP (Q) .
Per ottenere le equazioni di tale riflessione, si ragiona come nel caso delle rotazioni attorno ad un punto
P , i.e.
(i) si considera la traslazione t−P di passo −P , che porta quindi il punto P nell’origine O,
4 FLAMINIO FLAMINI

(ii) si applica la riflessione SO , come in (1.6),


(iii) infine si riapplica la traslazione tP di passo P che riporta cosı̀ O nel punto P .
In definitiva, l’isometria cercata è:
(1.7) SP = tP ◦ SO ◦ t−P .

• Equazioni di riflessioni (o simmetrie) rispetto a rette di R2 : sia r una qualsiasi retta del piano carte-
siano R2 . Denotiamo con Sr l’isometria di R2 data dalla riflessione rispetto alla retta r. Per ottenere le
equazioni di tale riflessione, possiamo procedere come segue.
Supponiamo che, nel riferimento dato, r abbia equazione cartesiana  ax  + by + c = 0. Consideriamo
q1
l’equazione parametrica della retta s passante per un punto arbitrario di R2 e perpendicolare a r.
q2
Essa e’:      
x q a
= 1 +t , t ∈ R.
y q2 b
 
q
La proiezione ortogonale di 1 su r è il punto di intersezione H = r ∩ s, ottenuto come punto su s per
q2
il valore del parametro
aq1 + bq2 + c
t0 := − .
a2 + b2
 
q1
Poiché si ottiene su s per t = 0, allora il suo simmetrico rispetto a r sarà determinato come punto
q2
su s per il valore del parametro
aq1 + bq2 + c
2t0 = −2 .
a2 + b2
Quindi, avremo che
     
q1 q1 aq1 + bq2 + c a
Sr = −2 .
q2 q2 a2 + b2 b
Sviluppando tutti i conti e scrivendola come trasformazione nelle coordinate di R2 si ha: otteniamo che
le equazioni per tale riflessione sono:
!  
  b2 −a2 −2ab −2ac 
x a2 +b2 a2 +b2 x a2 +b2
(1.8) Sr = −2ab a2 −b2
+ −2bc .
y 2 2 2 2
y a2 +b2
a +b a +b

Dalla precedente espressione, la retta r e’ luogo di punti fissi della isometria Sr , i.e. per ogni punto Q ∈ r
si ha Sr (Q) = Q.
Osserviamo che, nelle notazioni dei precedenti paragrafi, la rappresentazione di Sr come in (1.8)
puo’ essere anche scritta come:
 2 2 
b −a −2ab −2ac
a2 +b2 a2 +b2 a2 +b2
 −2ab a2 −b2 −2bc .

a2 +b2 a2 +b2 a2 +b2

0 0 1
Come conseguenza della (1.8), abbiamo inoltre:
Corollario 1.5. Per ogni retta vettoriale r0 : ax + by = 0, la riflessione Sr0 e’ data da
! 
  b2 −a2 −2ab
x 2
a +b 2 2
a +b 2 x
(1.9) Sr0 = −2ab a2 −b2
y 2 2 2 2
y
a +b a +b

ed e’ dunque una isometria lineare inversa, i.e. la matrice rappresentativa nella base canonica come in
(1.9) e’ ortogonale non speciale.
ISOMETRIE ED AFFINITA’ NOTEVOLI 5

Osservazione 1.6. Differentemente da quanto discusso in Osservazione 1.3, le riflessioni Sr0 in partico-
lare non conservano l’orientazione di basi dello spazio vettoriale R2 , i.e. Or(Sr0 (v), Sr0 (w)) = −Or(v, w),
per ogni coppia di vettori linearmente indipendenti v, w di R2 .
Notiamo infine che le riflessioni Sr0 rispetto a rette vettoriali godono delle seguenti ovvie proprietà
che discendono immeditamente da (1.9).
Proposizione
  1.7. Sia data r0 : ax + by = 0, orientata in maniera tale che il suo vettore direttore
b
v= formi un angolo convesso α con e1 . Denotiamo quindi Sr0 semplicemente con Sα . Si ha:
−a
(i) la riflessione rispetto all’asse x è:    
x x
S0 =
y −y
mentre la riflessione rispetto all’asse y è:
   
x −x
Sπ/2 = .
y y
(ii) Per ogni ϕ ∈ R, Sϕ è involutoria i.e. Sϕ ◦ Sϕ = Id. In particolare, Sϕ−1 = Sϕ .
(iii) Per ϕ 6= ψ ∈ R, si ha Sϕ ◦ Sψ = R2(ϕ−ψ) . In particolare, se ϕ = ψ + k π, k ∈ Z, allora Sϕ ◦ Sψ = Id.

In altri termini:
? a differenza delle rotazioni attorno all’origine, la composizione di riflessioni rispetto a rette vettoriali
non gode della proprietà commutativa, i.e. in generale si ha Sϕ ◦ Sψ 6= Sψ ◦ Sϕ .
? La composizione di due riflessioni rispetto a rette vettoriali distinte è una rotazione. Il fatto che una
tale composizione venga un’isometria lineare diretta (e non più inversa) è chiaro dal Teorema di Binet
e dal fatto che ogni riflessione rispetto ad una retta vettoriale r0 , essendo un’isometria lineare inversa
come osservato in Corollario 1.5, ha matrice rappresentativa in base canonica e che e’ ortogonale ed a
determinante −1.

Alcune trasfromazioni affini (non isometrie) del piano cartesiano. Le isometrie di R2 descritte preceden-
temente sono ovviamente anche affinità di R2 . Consideriamo ora le equazioni di due tipi fondamentali di
affinità lineari che non sono isometrie lineari.

• Le dilatazioni lineari:
Definizione 3. Siano λ, µ due numeri reali maggiori di od uguali ad 1, t.c. (λ, µ) 6= (1, 1). Denotiamo
con Dλ,µ l’affinità lineare definita da
    
x λ 0 x
(1.10) Dλ,µ = .
y 0 µ y
Una tale trasformazione viene chiamata dilatazione lineare. Notare che quando λ = µ abbiamo in
particolare un’omotetia di modulo λ. Ovviamente i casi in cui λ e µ sono o minori di 1 o negativi sono
analoghi ma non sono chiamate dilatazioni.
Quando almeno uno dei due numeri reali λ, µ e’ diverso da 1, la dilatazione lineare Dλ,µ non
conserva ne’ gli angoli ne’ le lunghezze (quindi non conserva le proprieta’ metriche). Pertanto è un
sicuro esempio di affinità lineare che non è un’isometria lineare. Se invece λ = µ, nel qual caso Dλ,λ è
un’omotetia di modulo λ > 1, allora gli angoli vengono conservati ma non viene conservata la lunghezza.
Osserviamo infine che, nelle notazioni dei precedenti paragrafi, la rappresentazione di Dλ,µ puo’
essere anche data da  
λ 0 0
 0 µ 0 .
0 0 1
6 FLAMINIO FLAMINI

• Le deformazioni lineari:

Definizione 4. Sia α ∈ R. Denotiamo con Tα l’affinità lineare definita da


    
x 1 α x
(1.11) Tα = .
y 0 1 y

Una tale trasformazione viene chiamata deformazione lineare (o shear). Ovviamente, se α 6= 0, una
deformazione lineare non conserva mai nè angoli nè tantomeno lunghezze.
Nelle notazioni dei precedenti paragrafi, la rappresentazione di Tα puo’ essere anche data da
 
1 α 0
 0 1 0 .
0 0 1

I due esempi trattati precedentemente determinano affinità lineari che non sono isometrie lineari.
Dalle matrici rappresentative si deduce che, sia le dilatazioni lineari che le deformazioni lineari conservano
l’orientazione di basi dello spazio vettoriale R2 .

• Trasformate di rette del piano cartesiano: data una retta r di R2 di equazione cartesiana ax+by+c = 0,
come trovare l’equazione cartesiana della retta s, trasformata di r mediante una qualsiasi trasformazione
affine di R2 ?
La risoluzione di questo problema è molto semplice. Basta considerare due punti arbitrari P e Q distinti
su r. Se f è l’isometria o l’affinità data dal problema, consideriamo i trasformati di questi punti mediante
f , i.e. f (P ) e f (Q). Concludiamo calcolando l’equazione cartesiana della retta per i due punti distinti
f (P ) e f (Q). Infatti, poichè f è biiettiva, P 6= Q implica f (P ) 6= f (Q). Applicheremo questa semplice
strategia nello svolgimento degli esercizi a fine del capitolo.
Quanto discusso precedentemente fornisce il seguente:

Teorema 1.8. Due qualsiasi rette del piano cartesiano R2 sono sempre fra di loro congruenti, i.e.
trasfromate l’una nell’altra da una isometria del piano cartesiano. In particolare, due qualsiasi rette del
piano cartesiano sono sempre affinemente equivalenti, i.e. trasformate l’una nell’altra da un’affinita’.

Dimostrazione. Siano r e s due rette di R2 . È sufficiente assumere che una delle due, ad esempio s, sia
l’asse delle ascisse y = 0. Infatti, se troviamo un’isometria fr di R2 che trasforma r nell’asse delle ascisse
ed analogamente un’isometria fs di R2 che trasforma s nell’asse delle ascisse, allora l’isometria fs−1 ◦ fr
sarà un’isometria che trasforma r in s.
Consideriamo allora un punto arbitrario P su r e poi la traslazione t−P di passo −P . La trasformata
di r coinciderà con la giacitura r0 della retta r. Scegliamo un’orientazione su r0 e calcoliamo l’angolo
convesso fra la retta orientata ed e1 . Sia questo θ. Se consideriamo la rotazione attorno all’origine di
angolo −θ allora tutti i punti di r0 verranno ruotati di modo che vadano a finire sull’asse delle ascisse. 

La dimostrazione del precedente risultato ha la seguente conseguenza fondamentale:

Corollario 1.9. Data una qualsiasi retta r del piano cartesiano,


 0 esiste sempre un opportuno riferimento
2 0 x
cartesiano di R , con origine O e coordinate cartesiane , in cui l’equazione cartesiana di r è
y0
y 0 = 0.

L’equazione cartesiana come in Corollario 1.9 viene chiamata equazione canonica metrica (rispet-
tivamente, affine) delle rette del piano cartesiano. Il precedente corollario asserisce che, quale che sia la
retta di partenza, esiste sempre un riferimento cartesiano in cui questa retta ha un’equazione cartesiana
più semplice possibile ed identificabile con il primo asse di questo nuovo riferimento di R2 .
ISOMETRIE ED AFFINITA’ NOTEVOLI 7

2. Alcune trasformazioni affini dello spazio cartesiano


Come nel precedente paragrafo, qui approfondiamo alcuni argomenti considerando lo studio di
alcune trasformazioni affini f : R3 → R3 con particolare significato geometrico. Come sopra, assumeremo
di aver fissato una volta per tutto una origine O dello spazio cartesiano R3 ed un sistema di riferimento
cartesiano ortogonale monometrico RC(O; x, y, z). In altri termini, l’origine O si identifica con il vettore
nullo O della struttura di spazio vettoriale sottogiacente di R3 e l’asse x (risp., y o z) si identifica con il
sottospazio vettoriale Span(e1 ) (risp., Span(e2 ) o Span(e3 )), ove e1 , e2 , e3 la base canonica ortonormale
di R3 spazio vettoriale euclideo rispetto al prodotto scalare standard ·.

Alcune isometrie fondamentali dello spazio cartesiano R3 . Iniziamo con il descrivere alcune isometrie di
R3 .
−→
• Equazioni di traslazioni dello spazio cartesiano R3 : P ∈ R3 è un punto del piano cartesiano e P :=OP =
 
p1
p2  è il corrispondente vettore dello spazio vettoriale R3 , denoteremo con t la traslazione di passo P ,
P
p3
che è chiaramente un’isometria dello spazio cartesiano. In coordinate avremo che
   
x x + p1
(2.1) tP  y  =  y + p 2  .
z z + p3

Chiaramente, per ogni P, Q ∈ R3 , si ha:

tP ◦ tQ = tP +Q ,

i.e. la composizione di due traslazioni è ancora una traslazione.


Nelle notazioni dei precedenti paragrafi, la rappresentazione di tP e’ anche data da
 
1 0 0 p1
 0 1 0 p2 
 .
 0 0 1 p3 
0 0 0 1

• Equazioni di rotazioni attorno a rette vettoriali: come fatto per R2 , cominciamo con il considerare al-
cune isometrie lineari notevoli: le rotazioni attorno ad una retta vettoriale. La teoria è un po’ più
complicata di quella sviluppata per R2 . Diamo la seguente:

Definizione 5. Sia θ ∈ R. Denotiamo con Rθ = Rθ,e1 l’applicazione di R3 in sè che ad un arbitrario


punto P ∈ R3 associa il punto Q = QP , estremo libero del vettore Q ottenuto ruotando il vettore P di
un angolo θ attorno al vettore e1 della base canonica e. Rθ si chiama rotazione di angolo θ attorno alla
retta vettoriale (orientata) Span(e1 ).
 
x
Proposizione 2.1. Sia x = y  ∈ R3 arbitrario. Allora
z
    
x 1 0 0 x
(2.2) Rθ y  =  0 cos θ − sin θ  y  .
z 0 sin θ cos θ z
8 FLAMINIO FLAMINI

 0  
x x
In particolare, se x0 := y 0  = Rθ y , le equazioni per la rotazione Rθ sono date da:
z0 z
 0
 x = x
(2.3) y0 = cos θ y − sin θ z
 0
z = sin θ y + cos θ z.
Dunque,
• se θ = 0, allora Rθ = Id;
• se θ > 0, la rotazione indotta sul piano vettoriale (y, z) è in senso antiorario rispetto al vettore e2 ;
• se θ < 0, la rotazione indotta sul piano vettoriale (y, z) è in senso orario rispetto al vettore e2 .
Dimostrazione. Osserviamo che la rotazione Rθ per costruzione fissa il vettore e1 della base e, mentre sul
piano vettoriale (y, z) si comporta come una rotazione di R2 attorno al vettore nullo. Pertanto, le formule
precedenti discendono immediatamente da questa osservazione e dalla dimostrazione di Proposizione
1.1. 

Abbiamo le ovvie conseguenze della precedente proposizione, le cui dimostrazioni sono identiche a
quelle svolte per le rotazioni in R2 attorno all’orgine.
Corollario 2.2. Per ogni θ ∈ R, le rotazioni Rθ attorno al vettore e1 sono isometrie lineari dirette, i.e.
la cui matrice rappresentativa in base canonica come in (2.2) è speciale ortogonale.
Osservazione 2.3. Dal Corollario 2.2-(ii), notiamo subito che le rotazioni Rθ attorno a e1 in particolare
conservano l’orientazione di basi dello spazio vettoriale R3 , i.e. Or(u, v, w) = Or(Rθ (u), Rθ (v), Rθ (w)),
per ogni terna di vettori linearmente indipendenti u, v, w di R3 e per ogni θ ∈ R.
Proposizione 2.4. (i) Per θ, ϕ ∈ R, si ha Rθ ◦ Rϕ = Rϕ ◦ Rθ = Rθ+ϕ .
(ii) Per ogni θ ∈ R, R−1
θ = R−θ .

In particolare, la composizione di rotazioni attorno ad e1 è ancora una rotazione attorno ad e1 e l’inversa


di una rotazione attorno ad e1 è una rotazione attorno ad e1 .
Osserviamo inoltre che, nelle notazioni dei precedenti paragrafi, la rappresentazione di Rθ come in
(2.2) e’ anche data da
 
1 0 0 0
 0 cos θ − sin θ 0 
 .
 0 sin θ cos θ 0 
0 0 0 1
Tuttavia, non tutte le rotazioni lineari coinvolte in possibili problemi di geometria in R3 saranno
necessariamente attorno al vettore e1 . Vogliamo quindi determinare le formule di rotazione attorno ad
una retta vettoriale qualsiasi utilizzando quanto dimostrato in Proposizione 2.1. Supponiamo quindi di
avere una retta vettoriale r di R3 ; vogliamo determinare le formule della rotazione di angolo θ attorno
a r. Prima di tutto, affinchè il problema sia ben posto, dobbiamo avere un’orientazione di r: se r non è
orientata, non è chiaro in quale direzione si deve fare la rotazione nel piano vettoriale r⊥ complemento
ortogonale di r. Pertanto, fissiamo su r un vettore direttore v. Per fissare il senso della rotazione parleremo
quindi di rotazione di angolo θ attorno al vettore v e la denoteremo con Rθ,v . Un modo naturale per
ottenere le formule di una tale rotazione è descritta nel seguente procedimento.
v
(i) In primo luogo, sia f 1 il versore direttore di r associato a v, i.e. f 1 = ||v|| . Scegliamo poi due altri
3
versori f 2 e f 3 , di modo che f := f 1 , f 2 , f 3 sia una base ortonormale di R ed equiorientata con la
base canonica e. Trovare una siffatta base f è molto semplice: il secondo versore f 2 di f si determina
prendendo un qualsiasi vettore non nullo w scelto ad arbitrio tra tutti quei vettori di R3 ortogonali a v e
w
poi si considera il versore associato a w, i.e. f 2 = ||w|| ; il terzo ed ultimo versore di f è dato direttamente
ISOMETRIE ED AFFINITA’ NOTEVOLI 9

dal prodotto vettoriale f 3 = f 1 ∧ f 2 . Notiamo quindi che basi siffatte possono essere scelte in infiniti
modi.

(ii) In tale base, la rotazione Rθ,v è la rotazione di angolo θ attorno a f 1 . Quindi, nelle notazioni di
Proposizione 2.1, questa non è altro che la rotazione Rfθ = Rfθ,f , dove l’apice in alto sta a ricordare
1
che stiamo vedendo tutto relativamente alla base f . Da Proposizione 2.1, abbiamo
 quindi che la matrice

1 0 0
Af := Mf,f (Rθ,v ) rappresentativa dell’endomorfismo Rθ,v in base f è Af =  0 cos θ − sin θ .
0 sin θ cos θ

(iii) L’obiettivo finale è quello di determinare la matrice A := Ae della rotazione cercata, espressa rispetto
alla base e di partenza, i.e.
A = Me,e (Rθ,v ).
Ricordiamo che, se M := Me f denota la matrice cambiamento di base dalla base e alla base f , allora
M e’ una matrice ortogonale i.e. M M t = M t M = I3 , visto che e ed f sono ambedue basi ortonormali.
Pertanto, si ha:
(2.4) A = M Af M t ,
che determina l’espressione della matrice di rotazione Rθ,v in base e come voluto.
Utilizzando Corollario 2.2 e Proposizione 2.4, abbiamo il seguente risultato immediato:
Corollario 2.5. Per ogni θ ∈ R, le rotazioni Rθ,v di angolo θ attorno ad una qualsiasi retta vettoriale
orientata r = Lin(v) sono isometrie lineari dirette, i.e. rappresentate da matrici ortogonali speciali.
In particolare, tali rotazioni conservano l’orientazione di basi dello spazio vettoriale R3 e godono delle
seguenti proprietà:
(i) Se θ = 0, allora R0,v = Id;
(ii) Per θ, ϕ ∈ R, si ha Rθ,v ◦ Rϕ,v = Rϕ,v ◦ Rθ,v = Rθ+ϕ,v .
(iii) Per ogni θ ∈ R, R−1θ,v = R−θ,v .

Dimostrazione. Notiamo che, da (2.4), per il Teorema di Binet si ha


det A = (det M ) (det Af ) (det M t ) = (det M ) (det Af ) (det M )−1 = det Af
dove la penultima eguaglianza discende direttamente dal fatto che M è ortogonale e dalla proprietà del
determinante della matrice inversa. Pertanto, per concludere basta applicare Corollario 2.2, Osservazione
2.3 e Proposizione 2.4. 

Esempio 2.6. A titolo di esempio, scriviamo le formule di rotazione R π2 ,v di angolo π2 attorno al vettore
 
1
v =  1 . Da quanto descritto sopra, vogliamo determinare f = f 1 , f 2 , f 3 una base ortonormale di
1
 √ 
1/√3
R3 positivamente orientata e con f 1 = v/||v|| =  1/√3 . Per prendere un vettore w ortogonale a
1/ 3
f 1 , notiamo ad 
esempioche le coordinate di f 1 sono tutte uguali; perciò una scelta possibile e naturale
1
è prendere w =  −1 , almeno avremo sicuramente f 1 · w = 0. Con tale scelta, abbiamo
0
 √   √ 
1/ √2 1/√6
f 2 =  −1/ 2  e f 3 = f 1 ∧ f 2 =  1/ √6  .
0 −2/ 6
10 FLAMINIO FLAMINI

In base f , la matrice rappresentativa della rotazione Rπ/2,v è


 
1 0 0
Af =  0 0 −1  .
0 1 0
Visto che, per definizione di matrice cambiamento di base, M = Me f ha come colonne le coordinate dei
vettori della base f espresse rispetto alla base e, si ha
 √ √ √ 
1/√3 1/ √2 1/√6
M =  1/√3 −1/ 2 1/ √6  ,
1/ 3 0 −2/ 6
che è infatti una matrice ortogonale. Pertanto, la matrice rappresentativa della rotazione Rπ/2,v in base
e è:  √ √ 
1/3 (1 − 3)/3 (1 +√ 3)/3
A = M Af M t =  1/3
√ 1/3
√ − 3/3  .
(1 − 3)/3 (1 + 3)/3 1/3
Nelle notazioni dei paragrafi precedenti, la rappresentazione di questa rotazione puo’ essere data anche
dalla matrice  √ √ 
1/3 (1 − 3)/3 (1 +√ 3)/3 0

 1/3
√ 1/3
√ − 3/3 0 
.
 (1 − 3)/3 (1 + 3)/3 1/3 0 
0 0 0 1

• Equazioni di rotazioni attorno a rette orientate qualsiasi: sia θ ∈ R e sia r una qualsiasi retta orien-
tata dello spazio cartesiano R3 non passante per l’origine. Sia P ∈ R un qualsiasi punto su r e sia v il
vettore direttore fissato per l’orientazione di r. In particolare, avremo che r ha equazione parametrica
vettoriale r : X = P + t v, t ∈ R. Denotiamo con Rθ,r l’isometria di R3 data dalla rotazione di angolo θ
attorno alla retta orientata r. Per ottenere le equazioni di tale rotazione, si procede nel modo seguente:
(i) prima si considera la traslazione t−P di passo −P , che porta il punto P ∈ r nell’origine O di R3 ;
(ii) poi si compie la rotazione lineare Rθ,v intorno alla giacitura r0 = Lin(v) di r, come descritto
precedentemente;
(iii) infine si riapplica la traslazione tP di passo P che riporta cosı̀ O in P .
In definitiva, l’isometria cercata si può scrivere come:
(2.5) Rθ,r = tP ◦ Rθ,v ◦ t−P .
 
p1
Per determinare esplicitamente le equazioni di tale isometria di R3 , sia P = p2 . Pertanto
p3
      
x x − p1 x − p1
Rθ,r y  = tP ◦ Rθ,v y − p2  = tP A y − p2  ,
z z − p3 z − p3
con A calcolata come in (2.4). Questo fornisce le equazioni della rotazione attorno alla retta orientata r
date da:
     
x x q1
(2.6) Rθ,r y  = A y  + q2  ,
z z q3
ISOMETRIE ED AFFINITA’ NOTEVOLI 11

     
q1 −p1 p1
dove q2  := A −p2  + p2 . Notiamo che essa è composizione di una traslazione e di un’isometria
q3 −p3 p3
lineare diretta.

• Equazioni di riflessioni (o simmetrie) rispetto a rette vettoriali: consideriamo adesso altre isometrie
lineari fondamentali: le riflessioni (o simmetrie) rispetto a rette vettoriali.
Definizione 6. Sia r0 una retta vettoriale di R3 . Denotiamo con Sr0 l’applicazione di R3 che ad un
arbitrario punto P ∈ R3 associa il punto Q = QP , estremo libero del vettore Q ottenuto per riflessione
di P rispetto ad r0 .
Notiamo subito che la riflessione rispetto ad una retta vettoriale r0 è un particolare tipo di rotazione
lineare, precisamente è la rotazione di angolo π intorno a r0 . In questo caso, è immediato osservare che
il risultato non dipende dall’orientazione di r.
Da ultimo, per ogni retta vettoriale r0 , Sr0 è chiaramente un’isometria lineare diretta; in particolare,
conserva l’orientazione di basi di R3 .

• Equazioni di riflessioni (o simmetrie) rispetto all’origine O:

Definizione 7. Denotiamo con SO l’applicazione di R3 in sè definita in modo che, per ogni punto P ∈ R3
si associa il punto estremo libero del vettore −P . SO è detta riflessione (o simmetria) rispetto all’origine.
Le equazioni della riflessione rispetto a O sono chiaramente:
      
x −1 0 0 x −x
(2.7) SO y  =  0 −1 0  y  = −y  .
z 0 0 −1 z −z
Pertanto, SO è un’isometria lineare inversa di R3 . In particolare, essa non conserva l’orientazione di basi
dello spazio vettoriale R3 .
Nelle notazioni dei precedenti paragrafi, la rappresentazione di SO e’ anche data da
 
−1 0 0 0
 0 −1 0 0 
 .
 0 0 −1 0 
0 0 0 1

• Equazioni di riflessioni (o simmetrie) rispetto a rette o punti arbitrari dello spazio cartesiano: per
quanto riguarda le riflessioni rispetto a rette non passanti per l’origine, si utilizza lo stesso procedi-
mento delle rotazioni sopra descritto. Se la retta r non passa per O e P ∈ r è un suo punto arbitrario,
basterà considerare che la riflessione rispetto a r è:
Sr := tP ◦ Sr0 ◦ t−P ,
dove r0 è la giacitura di r. Abbiamo già discusso precedentemente che la riflessione Sr0 non è altro che
una rotazione di angolo π.
Per quanto riguarda la riflessione rispetto ad un qualsiasi punto P ∈ R3 , basterà considerare
SP := tP ◦ SO ◦ t−P .
Un altro modo più geometrico è quello di osservare che il centro di riflessione, i.e. il punto P , è il punto
medio fra un qualsiasi punto Q di R3 ed il suo simmetrico SP (Q) rispetto a P . Di conseguenza, abbiamo
l’eguaglianza tra i vettori associati P = 12 (Q + SP (Q)). Se al posto di Q, prendiamo il vettore incognito
12 FLAMINIO FLAMINI

   
x p1
y  e se P = p2 , otteniamo
z p3
   
x 2p1 − x
(2.8) SP y  = 2p2 − y  .
z 2p3 − z
Ne consegue che, nelle notazioni dei precedenti paragrafi, la rappresentazione di SP e’ anche data
da  
−1 0 0 2p1
 0 −1 0 2p2 
 .
 0 0 −1 2p3 
0 0 0 1

• Equazioni di riflessioni rispetto a piani dello spazio cartesiano: sia τ un arbitrario piano di R3 . Vogliamo
determinare le equazioni della riflessione rispetto a τ , denotata con Sτ . Un modo geometrico è analogo
alla costruzione vista per le formule di riflessione in R2 rispetto ad una retta qualsiasi di R2 . Infatti, si
considera un punto arbitrario Q di R3 ed in seguito la sua proiezione ortogonale H su τ . Il riflesso (o
simmetrico) Sτ (Q) sara’, per definizione, quell’unico punto sulla retta passante per Q e H in posizione
tale che H sia il punto medio fra Q e Sτ (Q). Vediamo in dettaglio questa costruzione.
Supponiamo che τ abbia ad esempio equazione cartesiana ax + by + cz + d = 0. Consideriamo 
q1
l’equazione parametrica vettoriale della retta s passante per un punto arbitrario Q = q2  di R3 e
q3
perpendicolare a τ . Tale retta ha equazione parametrica vettoriale
     
x q1 a
y  = q2  + t  b  , t ∈ R.
z q3 c
 
q1
La proiezione ortogonale di q2  su τ si ottiene allora come punto su s per il valore del parametro
q3
aq1 + bq2 + cq3 + d
t0 := − .
a2 + b2 + c2
 
q1
Poiché il punto Q = q2  si ottiene su s per t = 0, allora il suo simmetrico rispetto a τ sarà determinato
q3
come punto su s per il valore del parametro
aq1 + bq2 + cq3 + d
2t0 = −2 .
a2 + b2 + c2
Quindi, avremo che      
q1 q1 a
aq1 + bq2 + cq3 + d  
Sτ q2  = q2  − 2 b .
a2 + b2 + c2
q3 q3 c
Sviluppando tutti i conti e scrivendo sotto forma di trasformazione nelle coordinate di R3 , otteniamo che
le equazioni per tale riflessione sono:
   b2 +c2 −a2 −2ab −2ac
  
−2ad 
x a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 x a2 +b2 +c2
 −2ab 2 2 2     −2bd 
(2.9) Sτ y  =  a2 +b a +c −b −2bc y + a2 +b2 +c2 .
2 +c2 a2 +b2 +c2 a2 +b2 +c2 
z −2ac −2bc 2 2
a +b −c 2
z −2cd
2 2
a +b +c 2 2 2
a +b +c 2 2 2
a +b +c2 a2 +b2 +c2
ISOMETRIE ED AFFINITA’ NOTEVOLI 13

In particolare:
Corollario 2.7. Per ogni piano vettoriale τ0 : ax + by + cz = 0, la riflessione Sτ0 e’ data da
   b2 +c2 −a2 −2ab −2ac
 
x a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 x
(2.10)
 −2ab
Sτ0 y  =  a2 +b a2 +c2 −b2 −2bc  
y
2 +c2 2 2
a +b +c 2 2 2
a +b +c 2 
z −2ac −2bc a2 +b2 −c2 z
2 2 2 2
a +b +c 2 2 2
a +b +c2 2 a +b +c

ed e’ dunque una isometria lineare inversa, i.e. la matrice rappresentativa nella base canonica come in
(2.10) e’ ortogonale non speciale.
Osservazione 2.8. Differentemente da quanto discusso in Corollario 2.5, le riflessioni Sτ0 in partico-
lare non conservano l’orientazione di basi dello spazio vettoriale R3 , i.e. Or(Sτ0 (u), Sτ0 (v), Sτ0 (w)) =
−Or(u, v, w), per ogni terna di vettori linearmente indipendenti u, v, w di R3 .
Notiamo infine che, nelle notazioni dei precedenti paragrafi, la rappresentazione di Sτ come in (2.9)
e’ anche data da
 2 2 2 
b +c −a −2ab −2ac −2ad
a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2
 −2ab a +c2 −b2
2
−2bc −2bd 
 a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 .

−2ac −2bc a +b2 −c2
2
−2cd

 
a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2 a2 +b2 +c2
0 0 0 1

Alcune trasformazioni affini (non isometrie) dello spazio cartesiano. Le isometrie dello spazio cartesiano
R3 descritte precedentemente sono ovviamente anche affinità di R3 . Come fatto per R2 , consideriamo
ora le equazioni di due tipi fondamentali di affinità lineari che non sono isometrie lineari.

• Le dilatazioni lineari:
Definizione 8. Siano λ, µ e ν numeri reali maggiori di od uguali ad 1 t.c. (λ, µ, ν) 6= (1, 1, 1). Denotiamo
con Dλ,µ,ν l’affinità lineare definita da
    
x λ 0 0 x
(2.11) Dλ,µ,ν y  =  0 µ 0  y  .
z 0 0 ν z
Una tale trasformazione viene chiamata dilatazione lineare. Notare che quando λ = µ = ν abbiamo
in particolare un’omotetia di modulo λ ≥ 1 . Ovviamente i casi in cui λ, µ e ν siano negativi o positivi
minori di 1 sono analoghi ma la trasformazione non si chiama dilatazione.
Notare che ad esempio, per λ, µ, ν generali, la dilatazione lineare Dλ,µ,ν non conserva nè gli angoli
nè le lunghezze. Pertanto è un sicuro esempio di affinità lineare che non è un’isometria lineare. Se invece
λ = µ = ν ∈ R, nel qual caso Dλ,λ,λ è un’omotetia di modulo λ ≥ 1, allora gli angoli vengono conservati;
ciò che non viene conservata è la lunghezza.
Osserviamo infine che, nelle notazioni dei precedenti paragrafi, la rappresentazione di Dλ,µ,ν come
in (2.11) e’ anche data da
 
λ 0 0 0
 0 µ 0 0 
 0 0 ν 0 .
 

0 0 0 1

• Le deformazioni lineari:
14 FLAMINIO FLAMINI

Definizione 9. Siano α, β, γ ∈ R. Denotiamo con Tα,β,γ l’affinità lineare definita da


    
x 1 α β x
(2.12) Tα y  =  0 1 γ  y  .
z 0 0 1 z
Come nel caso di R2 , una tale trasformazione viene chiamata deformazione lineare (o shear). Ovviamente,
se (α, β, γ) 6= (0, 0, 0), una deformazione lineare non conserva mai nè angoli nè tantomeno lunghezze.
Questi sono ulteriori esempi di affinità lineari che non sono isometrie lineari. Inoltre, sia le dilatazioni
che le deformazioni lineari conservano l’orientazione di basi dello spazio vettoriale R3 .
Nelle notazioni dei precedenti paragrafi, la rappresentazione di Tα,β,γ e’ anche data da
 
1 α β 0
 0 1 γ 0 
 0 0 1 0 .
 

0 0 0 1

• Trasformati di luoghi geometrici dello spazio cartesiano R3 : data una retta r (rispettivamente, un pi-
ano π) nello spazio cartesiano R3 , come trovare l’equazione della retta s (rispettivamente, del piano τ )
ottenuti per trasformazione di r (rispettivamente di π) mediante una qualsiasi isometria od una qualsiasi
affinità di R3 ?
La risoluzione di questo problema è molto semplice. Per la trasformata di r, basta considerare
due punti arbitrari P e Q distinti su r; per il trasformato di π, basta considerare tre punti arbitrari e
non allineati su π, P1 , Q1 e R1 . Se f è l’isometria o l’affinità data dal problema, allora consideriamo i
trasformati di questi punti mediante f . Concludiamo calcolando l’equazione della retta per i due punti
distinti f (P ) e f (Q), per trovare l’equazione di s, e l’equazione del piano per i tre punti distinti e non
allineati f (P1 ), f (Q1 ) e f (R1 ), per trovare l’equazione di τ .
Come nel caso di R2 , questa semplice osservazione ha come conseguenza un fatto molto importante.
Teorema 2.9. (i) Due qualsiasi rette dello spazio cartesiano R3 sono sempre fra di loro congruenti (in
particolare, affinemente equivalenti).
(ii) Due qualsiasi piani dello spazio cartesiano R3 sono sempre fra di loro congruenti (in particolare,
affinemente equivalenti).
La dimostrazione è concettualmente uguale a quella di Teorema 1.8, pertanto è lasciata al lettore per
esercizio. In particolare, utilizzando la stessa analisi, abbiamo come conseguenza:
Corollario 2.10. Dato una qualsiasi piano π dello spazio cartesiano,
 0  esiste sempre un opportuno riferi-
x
mento cartesiano di R3 , con origine O0 e coordinate cartesiane  y 0 , in cui l’equazione cartesiana di
z0
0
π è z = 0.
L’equazione cartesiana come sopra viene chiamata l’equazione canonica metrica (rispettivamente,
affine) dei piani dello spazio cartesiano. Il precedente corollario asserisce che, quale che sia il piano di
partenza, esiste sempre un riferimento cartesiano in cui questo piano ha un’equazione cartesiana più
semplice possibile. Analoga conseguenza si ha per le rette.

3. Esercizi Svolti
 
1
Esercizio 1: Siano dati in R2 la retta r : x − 2y − 1 = 0 ed il punto P = .
2
(i) Scrivere le formule di riflessione rispetto a r e le formule di rotazione di centro P e angolo θ = π/2.
(ii) Denotati con Sr e con RP,π/2 , rispettivamente, la riflessione e larotazione trovate al punto (i),
0
determinare le coordinate del punto (Sr ◦ RP,π/2 )(P1 ), dove P1 = .
1
ISOMETRIE ED AFFINITA’ NOTEVOLI 15

Svolgimento. (i) Per trovare le equazioni della riflessione, utilizziamo il metodo geometrico esposto prece-
dentemente. Da (1.8) si ottiene che le equazioni della riflessione sono
1 1
(3x + 4y + 2), y 0 = (4x − 3y − 4).
x0 =
5 5
Le equazioni della rotazione sono invece
x0 = 3 − y, y 0 = x + 1.
12
     
2 2
(ii) RP,π/2 (P1 ) = , quindi (Sr ◦ RP,π/2 )(P1 ) = Sr = 5
1 .
1 1 5


Esercizio 2 Sia s la retta di equazione cartesiana 2x + 3y = 0. Determinare l’equazione cartesiana della


retta s0 ottenuta per riflessione della retta s rispetto alla retta r, di equazione cartesiana r : x − y + 1 = 0.
 
p1
Svolgimento. Prima di tutto dobbiamo determinare le equazioni della riflessione Sr . Sia P =
p2
2
un punto arbitrario di R . La retta h passante perP e perpendicolare  a r ha equazione cartesiana
 0 
1
(p1 + p2 − 1) 0 p1
x+y = p1 +p2 . Sia H = r ∩h, che ha coordinate H = 2 . Allora il punto P :=
1
(p
2 1 + p +
2 1) p02

0 p2 − 1
sarà il simmetrico di P rispetto a r se, e solo, se P = 2H − P = . Questo significa che le
p1 + 1
equazioni della riflessione sono x0 = y − 1, y 0 = x + 1. Ora prendiamo due punti arbitrari sulla retta s.
Poiché s passa per l’origine,
 uno di tali puntisaràper comodità
  O. L’altropunto  possiamo
 prenderlo
 ad
3 0 −1 3 −3
arbitrio, ad esempio . Pertanto, Sr = mentre Sr = . Quindi,
−2 0
  1 −2 4
−2
un vettore direttore per s0 sarà dato da v = . L’equazione cartesiana di s0 si ottiene quindi
  3
x+1 y−1
considerando ad esempio det = 0, che determina s0 : 3x + 2y + 1 = 0. 
−2 3

Esercizio 3: Nel piano cartesiano R2 , con riferimento cartesiano standard RC(O; x, y), sia data la retta
r : x + 2y − 3 = 0.
(i) Determinare le formule di riflessione rispetto a r.
(ii) Determinare l’equazionecartesiana
 della circonferenza C ottenuta per riflessione rispetto a r della
2
circonferenza di centro C = e raggio 2.
1

Svolgimento. (i) Sia P = (a, b) il punto generico di R2 . La retta perpendicolare a r passante per P ha
equazioni parametriche
x = a + t, y = b + 2t.
L’intersezione con r determina
2 4 6
t=− a− b+ .
5 5 5
Pertanto le formule di riflessione sono
      
x 3/5 −4/5 x 6/5
f = + .
y −4/5 −3/5 y 12/5
(ii) Poiche’ una riflessione e’ un’isometria, e sufficiente conoscere
 le coordinate
 del riflesso del centro C,
−36/5
visto che il raggio rimarra’ invariato. Pertanto, poiche’ f (C) = , l’equazione cartesiana della
1/5
16 FLAMINIO FLAMINI

riflessa di C e’
(x + 36/5)2 + (y − 1/5)2 = 4.


Esercizio 4: Nel piano cartesiano R2 , con riferimento cartesiano ortogonale RC(O; x, y), e’ data la
trasformazione affine       
x 1 2 x 1
F = +
y −2 1 y 4
equivalentemente rappresentata dalla matrice orlata
 
1 2 1
 −2 1 4  .
0 0 1
(i) Stabilire se F e’ un’isometria o meno di R2 .
(ii) Sia r la retta di equazione cartesiana 2x + y − 3 = 0. Determinare l’equazione cartesiana della retta
F (r) trasformata di r mediante F .
 
1 2
Svolgimento. (i) Poiche’ la parte lineare della trasformazione F e’ rappresentata dalla matrice
−2 1
che ha determinante 5, F e’ necessariamente un’affinita’ che non e’ un’isometria di R2 .
(ii) Per trovare equazioni cartesiane di F (r) basta scegliere due punti arbitrari su r, P e Q e determinare
l’equazione cartesiana della retta per 2 punti 

Esercizio 5: Nello spazio cartesiano R3 , con riferimento cartesiano ortogonale standard RC(O, x, y, z),
sia α ⊂ R3 il piano di equazione cartesiana:
α: 2x − y + z = 4.
3
(i) Determinare l’isometria Sα di R descritta dalle formule di riflessione rispetto al piano α.
(ii) Descrivere i punti fissi di Sα .
(ii) Determinare equazioni parametriche del piano π ottenuto per riflessione rispetto ad α del piano
coordinato z = 0.
Svolgimento. (i) Sia P = (a, b, c) un punto arbitrario di R3 . Un vettore normale al piano α e’ il vettore
n = (2, −1, 1). Pertanto la retta r, passante per P e perpendicolare a α, ha equazione parametrica
vettoriale
x = P + t n,
e quindi equazioni parametriche scalari
x = a + 2t, y = b − t, z = c + t.
Se imponiamo l’intersezione di r con α, si ottiene il valore
4 + b − c − 2a
t0 = .
6
Quindi, se Sα (P ) denota il simmetrico di P rispetto a α, esso si ottiene come punto sulla retta r,
corrispondente al valore del parametro 2t0 , cioe’
4 + b − c − 2a
Sα (P ) = (a, b, c) + (2, −1, 1).
3
In definitiva, le formule di simmetria rispetto a α sono
Sα (a, b, c) = (−a/3 + 2b/3 − 2c/3 + 8/3; 2a/3 + 2b/3 + c/3 − 4/3; −2a/3 + b/3 + 2c/3 + 4/3).
(ii) Il luogo di punti fissi di Sα e’ ovviamente costituito dal piano α stesso, per definizione di riflessione.
ISOMETRIE ED AFFINITA’ NOTEVOLI 17

(iii) Prendiamo tre punti non allineati arbitrari su z = 0, siano essi (0, 0, 0), (0, 1, 0) e (1, 0, 0). I loro
riflessi sono rispettivamente A = (8/3, −4/3, 4/3), B = (10/3, −2/3, 5/3) e C = (7/3, −2/3, 2/3). Due
vettori direttori per la giacitura di π sono dati ad esempio da B − A ∼ (2, 2, 1) e C − A ∼ (1, −2, 2).
Pertanto, equazioni parametriche di π sono date da
(x, y, z) = (8/3, −4/3, 4/3) + t(2, 2, 1) + s(1, −2, 2), t, s ∈ R.


Esercizio 6: Nello spazio cartesiano R3 , con riferimento cartesiano ortogonale RC(O; x, y, z), sia Π il
piano di equazione cartesiana
x+y =1
e sia r la retta di equazioni cartesiane

x +y +2z = 0
y +z = 1
(i) Scrivere le formule di riflessione SΠ , rispetto al piano Π.
(ii) Calcolare le equazioni parametriche della retta m = SΠ (r), riflessa di r.
Svolgimento. (i)–(ii) Sia P = r ∩ Π. Percio’:
 
−1/2
P =  3/2  .
−1/2
 
−1
Sia Q =  1  ∈ r. La retta n passante per Q ed ortogonale a Π ha equazioni parametriche
0
     
x −1 1
 y  =  1  + t  1  , t ∈ R.
z 0 0
Quindi n ∩ Π si ottiene per t = 1/2. Percio’ il riflesso Q0 di Q rispetto a Π e’ per t = 1 cioe’ Q0 = (0, 2, 0).
Quindi m ha equazioni parametriche:
     
x 0 1
 y  =  2  + t  1  , t ∈ R.
z 0 1


Esercizio 7: Nello spazio cartesiano R3 , con riferimento cartesiano ortogonale RC(O; x, y, z), sia α il
piano di equazione cartesiana
x + 2y = 0.
Calcolare l’ equazione cartesiana del piano passante per i punti riflessi rispetto al piano α dei punti
O = (0, 0, 0), P = (1, 1, 0) e Q = (0, 1, 0).

Svolgimento. Visto che α passa per l’origine, si determina immediatamente:


   
x 3/5x − 4/5y
Sα  y  =  −4/5x − 3/5y  ∈ r.
z 1/5z
Basta quindi trovare l’equazione cartesiana del piano per i tre punti
(0, 0, 0), (−1/5, −7/5, 0), (−4/5, −3/5, 0).

18 FLAMINIO FLAMINI

Esercizio 8: Nello spazio cartesiano R3 , con riferimento cartesiano ortogonale RC(O; x, y, z), siano dati
il piano
π : x + 2y = 0
e la retta      
x 1 1
` :  y  =  0  + t  1  , t ∈ R.
z 1 1
(i) Trovare le equazioni cartesiane della retta r ottenuta per proiezione ortogonale di ` sul piano π.
(ii) Scrivere le formule di rotazione R π2 ,` di angolo π2 attorno alla retta orientata `.
(iii) Calcolare le equazioni parametriche della retta m = R π2 ,` (r), ottenuta cioe’ per rotazione di angolo
π
2 della retta r attorno alla retta orientata `.

Svolgimento. (i) Le equazioni cartesiane di ` sono



x −z = 0
x −y = 1
Percio’, il fascio F di piani di asse la retta ` ha equazione
(λ + µ)x − µy − λz − µ = 0, λ, µ ∈ R, (λ, µ) 6= (0, 0).
La retta r sara’ intersezione del piano π e dell’unico piano del fascio F che e’ ortogonale a π. Dunque
otteniamo la condizione    
λ+µ 1
 −µ  ·  2  = λ − µ = 0
−λ 0
e quindi le equazioni di r sono: 
2x −y −z = 1
x +2y = 0
 
1
(ii) Denotiamo con v =  1  il vettore direttore di `. Sia f = f 1 , f 2 , f 3 una base ortonormale di R3 ,
1
positivamente orientata e con f 1 = v/||v||. Percio’
 √   √   √ 
3 2 3
√3  2√   √33 
3
f1 =   , f 2 =  − 22  , f 3 = f 1 ∧ f 2  .
 
√3 3√ 
3 0 2 3
3 − 3
In base f , la matrice di rotazione Rπ/2,` e’:
 
1 0 0
Af =  0 0 −1  .
0 1 0
Percio’, se M = Me,f denota la matrice cambiamento di base dalla base canonica e alla base ortonormale
f , M e’ una matrice ortogonale. Conseguentemente, la matrice della rotazione Rπ/2,` in base e e’:
 √ √ 
1 1− 3 1+ 3
3√ 3 3√
f t 1+ 3 1 1− 3
A=M A M = .
 
3√ 3√ 3
1− 3 1+ 3 1
3 3 3
Pertanto, le formule di rotazione attorno alla retta orientata ` sono date da
   
x x−1
t 1  ◦ A ◦ t −1   y  = t 1  ◦ A  y  =

 0 
 
 0 
 z 
 0 
 z−1
     
1 −1 1
ISOMETRIE ED AFFINITA’ NOTEVOLI 19

 √ √ √   √ √ √ 
1 1− 3 1+ 3 2+ 3 1 1− 3 1+ 3 1− 3
3 x +√ 3 y + 3 √z − 3 3 x +√ 3 y + 3 √z + 3
1+ 3
= t 1 x + 13√y + 1−3 3 z −√ 23 = 1+ 3
x + 13√y + 1−3 3 z −√ 23

   
√3 √3
 
1− 3 1+ 3 1 3−2 1− 3 1+ 3 1 3+1
3 x+ 3 y + 3z + 3 x+ 3 y + 3z +

 0

3 3

 
1
(iii) Il vettore direttore v della retta r e’ dato dal prodotto vettoriale dei vettori normali dei piani che
definiscono la sua equazione cartesiana. Pertanto
     
2 1 2
v =  −1  ∧  2  =  −1  .
−1 0 5
 √ 
2 + 2√ 3
Il ruotato del vettore v e’ A(v) =  2 − √3 . Prendiamo ora un punto arbitrario su r, ad esempio P =
2− 3
 √ 
  −2 3
0 √ 3
 0 . Applichiamo le formule di rotazione del punto (ii) a questo punto, ottenendo Q =  3−3 .
 √ 3 
−1 3
3
Pertanto m ha equazioni parametriche
   −2√3   √ 
x √ 3 2 + 2√ 3
 y = 3−3  + t  2 −  , t ∈ R.
 √ 3  √3
z 3 2− 3
3


Esercizio 9: Nello spazio cartesiano R3 , con riferimento cartesiano ortonormale standard RC(O; x, y, z),
si consideri la sfera S di centro l’origine O e raggio r = 2. Sia inoltre π il piano di equazione cartesiana
x − z = 3.
 
x
(i) Determinare le formule di riflessione Sπ  y  rispetto al piano π
z
(ii) Determinare l’equazione
 cartesiana della sfera S 0 ottenuta per riflessione della sfera S rispetto a π.
1
(iii) Sia P =  √1  ∈ S. Sia Sπ (P ) ∈ S 0 il riflesso di P rispetto a π. Si determini l’equazione
2
cartesiana del piano tangente alla sfera S 0 nel punto Sπ (P ).
(iv) Sia α il piano di equazione cartesiana z + 2 = 0. Dopo aver verificato che α passa per Sπ (P ),
determinare l’equazione cartesiana della retta tangente nel punto Sπ (P ) alla circonferenza C 0 = S 0 ∩ α.
 
a
Svolgimento. (i) Prendiamo un punto arbitrario di R3 , sia esso K =  b  . Le equazioni parametriche
c
della retta h, passante per K e perpendicolare a π, sono
x = a + t, y = b, z = c − t t ∈ R.
Considerare h ∩ π equivale ad imporre
a+t−c+t−3=0
che fornisce
1
t= (−a + c + 3).
2
20 FLAMINIO FLAMINI

Visto che il punto K corrisponde al valore del parametro t = 0, allora il simmetrico di K si ottiene per
il valore di
t = −a + c + 3.
Sostituendo nelle equazioni parametriche di h questo valore di t, otteniamo quindi
x = c + 3, y = b, z = a − 3.
In altre parole, le formule di riflessione rispetto a π sono
   
x z+3
Sπ  y  =  y  .
z x−3
(ii) Il centro C 0 di S 0 e’    
0 3
C 0 = Sπ  0  =  0  .
0 −3
Poiche’ Sπ e’ un’isometria, il raggio di S e’ sempre r = 2. Pertanto, l’equazione cartesiana di S 0 e’:
0

(x − 3)2 + y 2 + (z + 3)2 = 4.
(iii) Si ha  √ 
3+ 2
Sπ (P ) =  1 
−2
e basta sostituire le sue coordinate nell’equazione di S 0 per verificare che esso appartiene a S 0 . Un vettore
normale al piano tangente a S 0 in Sπ (P ) e’ dato da
 √ 
−→ −→ − 2
OC 0 − OSπ (P )=  −1  .
−1
Pertanto, l’equazione del piano tangente a S 0 in Sπ (P ) e’ della forma

2x + y + z + d = 0,

con d parametro da determinare. Il passaggio per Sπ (P ) fornisce d = −1 − 3 2. Quindi il piano tangente
cercato e’ √ √
2x + y + z − 1 − 3 2 = 0.
(iv) L’equazione di C e’
(x − 3)2 + y 2 + (z + 3)2 − 4 = z + 2 = 0
i.e.
(x − 3)2 + y 2 − 3 = z + 2 = 0,
e la retta tangente cercata ha quindi equazione
√ √
2x + y + z − 1 − 3 2 = z + 2 = 0.


Esercizio 10: Nello spazio cartesiano R3 , con riferimento cartesiano standard RC(O; x, y, z), siano date
le due coppie di punti
       
1 0 1 3
P1 =  1  , P2 =  2  e Q1 =  2  , Q2 =  4  .
1 −1 0 3
(i) Determinare equazioni parametriche della retta `, congiungente i punti P1 e P2 , e della retta m,
congiungente i punti Q1 e Q2 .
ISOMETRIE ED AFFINITA’ NOTEVOLI 21

(ii) Verificare che l’affinita’ lineare data da


    
x 1 1 −1 x
F  y  :=  0 2 0  y 
z 0 1 −1 z
trasforma la retta ` nella retta m.
(iii) Determinare gli eventuali punti fissi dell’affinita’ F .
 
−1
Svolgimento. (i) ` e’ la retta passante per P1 e con vettore direttore v = P2 − P1 =  1 ; pertanto
−2
le sue equazioni parametriche sono
x = 1 + t, y = 1 − t, z = 1 + 2t, t ∈ R.
 
2
Analogamente m e’ la retta passante per Q1 e con vettore direttore v 0 = Q2 − Q1 =  2 ; pertanto le
3
sue equazioni parametriche sono
x = 1 + 2t, y = 2 + 2t, z = 3t, t ∈ R.
(ii) E’ facile verificare che
f (Pi ) = Qi , 1 ≤ i ≤ 2.
Quindi l’affinita’ lineare trasforma fra loro anche le rette che congiungono queste coppie di punti.
(iii) I punti fissi dell’affinita’ lineare F sono tutti e soli i vettori di R3 che soddisfano la relazione
    
1 1 −1 x x
 0 2 0  y  =  y ;
0 1 −1 z z
in altri termini, i punti fissi di F sono individuati dall’autospazio della matrice A relativo all’autovalore
1. In effetti 1 e’ autovalore di A e la sua molteplicita’ algebrica e geometrica coincidono e sono uguali ad
1. In effetti, l’autospazio e’ dato da
y=z=0
che e’ l’asse delle ascisse. In altri termini, l’asse x e’ retta fissa per F . Piu’ precisamente e’ retta di punti
fissi di F .

Dispense su:
Prodotti scalari e Spazi vettoriali euclidei
Operatori ortogonali ed autoaggiunti
Teorema spettrale di operatori autoaggiunti

Prof. F. Flamini

November 20, 2017


Prodotti scalari e spazi vettoriali
euclidei

0.1 Prodotto scalare geometrico


Lo spazio vettoriale V dei vettori geometrici può essere considerato come un prototipo della
nozione più generale di spazio vettoriale. Esattamente la stessa cosa avviene per la nozione
generale di prodotto scalare, che è storicamente preceduta dall’esempio particolare del prodotto
scalare di vettori geometrici. Ricorderemo ora brevemente la definizione ed alcune proprieta’ del
prodotto scalare di vettori geometrici.
Assegnati due vettori geometrici non nulli a e b indicheremo con
c
ab
il numero reale compreso tra 0 e π che misura l’angolo definito dalle semirette OA e OB , dove
il punto O e’ l’origine e OA, OB sono segmenti orientati che rappresentano rispettivamente a, b.
c non dipende dalla scelta del punto O. Se a oppure b e’ nullo
Non e’ difficile verificare che ab
c
converremo che ab = 0.
c
Il coseno dell’angolo compreso tra a e b è il numero reale cos (ab).
Definizione 0.1.1. Sia V lo spazio vettoriale dei vettori geometrici e siano a e b due suoi vettori.
Il prodotto scalare geometrico di a e b è il numero reale
c
a•b =| a || b | cos (ab).
ove | a | denota la lunghezza del segmento orientato OA che rappresenta a,
Come vedremo piu’ avanti, il prodotto scalare geometrico è un esempio particolare di una più
generale definizione di prodotto scalare.
a è l’angolo nullo, il suo coseno è 1 e quindi
Poiché ac
a • a =| a |2 .
Il prodotto scalare geometrico ha la seguente interpretazione geometrica: sia a non nullo allora il
vettore
a•b
p= a
a•a

iii
iv PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

è rappresentato dal segmento orientato OC, dove C è la proiezione perpendicolare del punto B
sulla retta OA. La trigonometria ci dice infatti che

a•b
|a|

ha come valore assoluto la lunghezza del segmento OC ed è positivo se OC e OA hanno lo stesso


verso, negativo in caso contrario. D’altra parte
a
|a|

è un vettore di lunghezza 1 che è proporzionale ad a e ne ha lo stesso verso. Utilizzando queste


due osservazioni, il lettore potra’ comprendere la precedente uguaglianza. Naturalmente p è pro-
porzionale al vettore a. È utile osservare, in vista di alcune applicazioni successive, che

n=b−p

è un vettore perpendicolare ad a. Ricordiamo che

Definizione 0.1.2. Due vettori geometrici u e v si dicono perpendicolari se sono non nulli e
hanno direzioni perpendicolari oppure se uno di essi è nullo.

Da cos ( π2 ) = 0 e dalla definizione segue immediatamente che: u e v sono perpendicolari se, e


solo se,
u • v = 0.
Il prodotto scalare geometrico determina ed è determinato dalla funzione

G : V × V → R,

che ad ogni coppia ordinata (a, b) ∈ V × V associa il numero reale

c
G(a, b) =| a || b | cos (ab).

Ogni proprieta’ del prodotto scalare di vettori geometrici può dunque essere descritta nei termini
di una corrispondente proprieta’ della funzione G. Esaminiamo da entrambi i punti di vista le
proprieta’ che ci interessano:
Proprietà commutativa ∀ a, b ∈ V,

a • b = b • a,

ovvero
G(a, b) = G(b, a).
c = ba.
La proprietà segue subito dalla definizione di prodotto scalare geometrico e dal fatto che ab c
0.1. PRODOTTO SCALARE GEOMETRICO v

Proprietà distributiva rispetto alla somma di vettori geometrici ∀ a, b, c ∈ V

a • (b + c) = a • b + a • c,

ovvero
G(a, b + c) = G(a, b) + G(a, c).
Si noti che, essendo valida la proprieta’ commutativa, vale anche G(b+c, a) = G(b, a)+G(c, a).
Proprietà di bilinearità ∀ a, b ∈ V e ∀ λ ∈ R

(λa) • b = λ(a • b) = a • (λb),

ovvero
G(λa, b) = λG(a, b) = G(a, λb).
\ = a(λb)
La proprietà segue osservando che (λa)b \ e che | λv |=| λ | | v |, dove | λ | è il valore
assoluto del numero reale λ.
(4) Proprietà di positività ∀ a ∈ V, a 6= 0,

a • a > 0.

La proprietà segue dall’uguaglianza a • a =| a |2 .


Un modo conveniente per calcolare un prodotto scalare geometrico consiste nel fissare una base

i, j, k

di V costituita da vettori di lunghezza 1 e a due a due perpendicolari. Questo significa che i tre
vettori della base sono rappresentati rispettivamente dai segmenti orientati OI, OJ, OK, dove i
punti O, I, J, K sono vertici di uno stesso cubo e OI, OJ, OK sono lati questo cubo. Poiché i
vettori sono a due a due perpendicolari abbiamo

i • j = i • k = j • k = 0,

poiché i vettori considerati hanno lunghezza 1 avremo inoltre

i • i = j • j = k • k = 1.

Siano ora a = a1 i + a2 j + a3 k e b = b1 i + b2 j + b3 k, per calcolare a • b possiamo calcolare


esplicitamente
(a1 i + a2 j + a3 k) • (b1 i + b2 j + b3 k).
Applicando la proprietà distributiva del prodotto scalare rispetto alla somma, utilizzando le prece-
denti uguaglianze e svolgendo i calcoli si ottiene che

(a1 i + a2 j + a3 k) • (b1 i + b2 j + b3 k) = a1 b1 + a2 b2 + a3 b3 .
vi PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

Definizione 0.1.3. Una base ortonormale di V è una base di V costituita da tre vettori i, j, k
che sono a due a due perpendicolari e di lungezza 1.
Sulla base delle ultime osservazioni svolte possiamo concludere questa sezione con la proprietà
seguente:
Proposizione 0.1.1. Se i, j, k è una base ortonormale di V e se a = a1 i + a2 j + a3 k e b =
b1 i+b2 j+b3 k, allora il prodotto scalare geometrico a•b è la somma dei prodotti delle coordinate
dello stesso indice, i.e.
a • b = a1 b1 + a2 b2 + a3 b3 .

0.2 Prodotti scalari


La nozione di prodotto scalare su uno spazio vettoriale qualsiasi è la seguente.
Definizione 0.2.1. Un prodotto scalare su uno spazio vettoriale V è una funzione

h, i:V ×V →R

dotata delle seguenti proprieta:


(1) Proprietà commutativa: ∀ x, y ∈ V

hx, yi = hy, xi

(2) Proprietà distributiva rispetto alla somma: ∀ x, y, z ∈ V

hx, y + zi = hx, yi + hx, yi e hy + z, xi = hy, xi + hz, xi.

(3) Proprietà di bilinearità : ∀ x, y ∈ V e ∀λ ∈ R

hλx, yi = λhx, yi = hx, λyi

(4) Positivita’: deve valere hx, xi > 0 per ogni x 6= 0 e h0, 0i = 0.


Per quanto riguarda la proprietà distributiva si noti che la seconda parte di tale proprietà segue
dalla prima parte e dalla proprietà commutativa. Essa poteva quindi essere anche omessa dalla
definizione.
Vediamo qualche esempio di prodotto scalare.
Esempio 0.2.1. Integrale di un prodotto di polinomi
Sia R[T ] lo spazio vettoriale dei polinomi a coefficienti reali in una indeterminata T e sia

h , i : R[T ] × R[T ] → R

la funzione che alla coppia di polinomi (P (T ), Q(T )) = (P, Q) ∈ R[T ]×R[T ] associa l’integrale
Z 1
P Q dT.
0
0.2. PRODOTTI SCALARI vii

h , yi è un esempio di prodotto scalare su R[T ]. Poiché P Q = QP è ovvio che la proprietà


commutativa è soddisfatta. D’altra parte si ha
Z 1 Z 1 Z 1
hP, Q1 + Q2 i = P (Q1 + Q2 ) dT = P Q1 dT + P Q2 dT,
0 0 0

poiché l’integrale commuta con la somma di funzioni. Sia poi λ ∈ R, allora


Z 1 Z 1
λG dT = λ G dT
0 0

per ogni funzione G, integrabile tra 0 e 1 e quindi


hλP, Qi = λhP, Qi = hP, λQi.
Se infine P è un polinomio non nullo, P 2 è non nullo e assume un valore ≥ 0 per ogni numero
reale. Inoltre P 2 si annulla soltanto per un numero finito di valori reali che sono le radici di P .
Usando tali osservazioni si può provare che
Z 1
hP, P i = P 2 dT > 0,
0

∀P ∈ R[T ]. Si ha dunque hP, P i ≥ 0 e hP, P i = 0 se, e solo se, P è il polinomio nullo.

Esempio 0.2.2. Prodotto scalare standard su Rn .


Su Rn abbiamo la base canonica e e quindi possiamo definire il seguente prodotto scalare
h , ie : Rn × Rn → R.
P P
Siano x = (x1 , . . . .xn ) e y = (y1 , . . . , yn ); allora x = i=1,...,n xi ei e y = i=1,...,n yi ei ,
quindi
hx, yie = x1 y1 + · · · + xn yn .
Questo particolare esempio si chiama prodotto scalare standard su Rn .

Esempio 0.2.3. Prodotto scalare determinato da tA A.


Sia A una matrice quadrata di ordine n e di rango n; un ulteriore esempio di prodotto scalare si
definisce a partire da A nel modo indicato dal seguente
Teorema 0.2.1. Sia A una matrice quadrata di ordine e di rango n e sia
F : Rn × R n → R
la funzione cosı̀ definita: qualunque siano x = (x1 , . . . , xq ) e y = (y1 , . . . , yq )
 
y1
t  .. 
F (x, y) = x1 , . . . , xq AA  .  .
yq
Allora F := h, iA è un prodotto scalare su Rn .
viii PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

Dimostrazione. La proprietà distributiva e la bilinearità di F sono di facile verifica con un calcolo


diretto, le lasciamo perciò al lettore.
Per verificare la proprietà commutativa si osservi che la matrice prodotto che si trova a destra
nell’ultima uguaglianza è uguale alla propria trasposta: semplicemente perché si tratta di una
matrice 1 × 1. D’altra parte la trasposta di tale matrice prodotto è il prodotto in ordine inverso
delle matrici trasposte dei fattori e cioè
 
x1
 t  .. 
y1 , . . . , yn A A  .  .
xn
Poiché tale espressione è F (y, x) ne segue che F (x, y) = F (y, x). Infine si deve verificare che
F (x, x) > 0, per ogni x = (x1 , . . . , xn ) non nullo. Sia
(x1 , . . . , xn )t A = (y1 , . . . , yn ),
passando da questa uguaglianza all’uguaglianza tra matrici trasposte otteniamo
   
x1 y1
 ..   .. 
A .  =  . .
xn yn
Quindi si ha
   
x1 y1
 t  ..   . 
F (x, x) = x1 , . . . , xn A A  .  = y1 , . . . , yn  ..  = y12 + · · · + yn2 .
xn yn
Si noti che A ha rango n e che quindi l’unica soluzione del sistema omogeneo determinato da A è
la soluzione nulla. Poiché x non è nullo x non è una soluzione
P 2del sistema e quindi almeno un yi
è diverso da zero. Possiamo dedurre da ciò che F (x, x) = yi > 0.
Se A = In la costruzione riproduce esattamente il prodotto scalare standard su Rn dell’esempio
precedente. Avremo modo di vedere che ogni prodotto scalare su uno spazio vettoriale di dimen-
sione finita può essere definito a partire da una matrice A come la precedente.

0.3 Prodotti scalari e matrici simmetriche


Sia V uno spazio vettoriale di dimensione n e sia u = u1 , . . . , un una sua base. Assegnato un
prodotto scalare
h, i:V ×V →R
su V , possiamo considerare la matrice
Bu (h , i)
il cui termine di posto i, j è
bij = hui , uj i.
0.3. PRODOTTI SCALARI E MATRICI SIMMETRICHE ix

Definizione 0.3.1. Bu (h , i) è la matrice del prodotto scalare h , i rispetto alla base u.


È chiaro che Bu (h , i) è una matrice quadrata di ordine n. Si noti inoltre che Bu (h , i) è una
matrice simmetrica. L’importanza della matrice Bu (h , i) è dovuta alla seguente proprieta’:
Proposizione 0.3.1. Data u = u1 , . . . , un una base di V , si ha
 
y1
  .. 
hx, yi = x1 . . . xn Bu (h , i)  .  ,
yn

qualunque siano i vettori x = x1 u1 + · · · + xn un e y = y1 u1 + · · · + un un di V , espressi in


coordinate rispetto alla base u.

Dimostrazione. La dimostrazione consiste di applicazioni successive della proprietà distributiva e


di linearità. Indicheremo i passi da compiere tralasciando i dettagli. Innanzitutto si ha
X X
hx, yi = hx, yj u j i = yj hx, uj i.
j=1,...,n j=1,...,n

D’altra parte X X
yj hx, uj i = yj h xi ui , uj i = yj xi hui , uj i
i=1,...,n i=1,...,n

e quindi X X X
hx, yi = yj xi hui , uj i = xi yj bij .
j=1,...,n i=1,...,n i,j=1,...,n

Calcolando infine x1 , . . . , xn Bu (h , i) si ottiene
   
y1 y1
  ..   . 
x1 , . . . , xn Bu (h , i)  .  = x1 b11 + · · · + xn bn1 . . . x1 b1n + · · · + xn bnn  ..  .
yn yn

Per concludere basta osservare che


 
y1
  X
x1 b11 + · · · + xn bn1 . . . x1 b1n + · · · + xn bnn  ...  = xi yj bij .
yn i,j=1,...,n

Esercizi 0.3.1. (1) Sia h , i il prodotto scalare standard su R2 e sia u = u1 , u2 una delle seguenti
basi:
- u1 = (1, 0), u2 = (0, 1)
−1
- u1 = ( √12 , √12 ), u2 = ( √12 , √ 2
)
- u1 = (1, −1), u2 = (1, −1)
x PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

- u1 = (1, 1), u2 = (0, 1).


Per ogni base u si determini la matrice Bu (h , i).
(2) Siano OA, OB, OC tre segmenti orientati di lunghezza 1 che a due a due formano in O un
angolo di ampiezza π3 . Siano poi a, b, c i vettori geometrici rappresentati rispettivamente da
OA, OB, OC. Si determini la matrice del prodotto scalare geometrico rispetto alla base a, b, c.

In definitiva, la matrice Bu (h , i) permette di calcolare facilmente il prodotto scalare hx, yi una


volta che siano note le coordinate dei vettori x e y rispetto alla base u.

0.4 Spazi vettoriali euclidei. Perpendicolarità e basi ortogonali rispetto


ad un prodotto scalare
In questo paragrafo, ed in varie occasioni successive, lavoreremo su uno spazio vettoriale V sul
quale converrà avere fissato una volta per tutte un prodotto scalare

h , i : V × V → R,

scelto tra gli infiniti prodotti scalari definiti su V . Lavoreremo quindi avendo assegnato la coppia
(V, h , i) e non solo lo spazio vettoriale V .
Definizione 0.4.1. Uno spazio vettoriale euclideo è una coppia (V, h , i) dove V è uno spazio
vettoriale e h , i è un prodotto scalare su V .
Dato (V, h , i) uno spazio vettoriale euclideo, vogliamo discutere alcune proprietà geometriche
notevoli di tale spazio. Abbiamo bisogno prima di alcuni preliminari.

Norma di un vettore
In uno spazio vettoriale euclideo si può introdurre la nozione di lunghezza di vettori. Infatti abbi-
amo:
Definizione 0.4.2. Sia V uno spazio vettoriale euclideo e sia v ∈ V un qualsiasi vettore. La
norma (o lunghezza) di v è il numero reale non negativo
p
|| v ||:= hv, vi.

Notiamo che, se V = Rn munito di prodotto scalare standard, date (y1 , . . . , yn ) le coordinate di v


rispetto alla base canonica e, allora
q
|| v ||= y12 + · · · + yn2 .

Versori. Versorizzazione di un vettore


Definizione 0.4.3. Sia V uno spazio vettoriale euclideo e sia v ∈ V . Il vettore v si dice versore,
se
|| v ||:= 1.
0.4. SPAZI EUCLIDEI xi

Notare che se invece v non e’ un versore, si puo’ sempre considerare un generatore di Span(v)
che sia un versore, i.e.
v
f= .
|| v ||
La precedente formula si dice, versorizzazione del vettore v

Disuguaglianza di Cauchy-Schwarz
Teorema 0.4.1. Sia V uno spazio vettoriale euclideo. Qualunque siano i vettori u, v ∈ V si ha

hu, vi2 ≤ || u ||2 || v ||2 .

Inoltre vale l’ uguaglianza se, e solo se, u e v sono linearmente dipendenti.

Dimostrazione. Al variare di t in R consideriamo il vettore tu + v ed osserviamo che

htu + v, tu + vi ≥ 0

in quanto h , i è un prodotto scalare. D’altra parte si calcola facilmente che

htu + v, tu + vi = at2 + 2bt + c

dove
a = hu, ui, b = hu, vi, c = hv, vi.
Se a = 0 allora u = 0 e la disuguaglianza diventa l’uguaglianza 0 = 0: in tal caso non c’è altro
da dimostrare. Consideriamo allora il caso rimanente e cioè a > 0: per il polinomio di secondo
grado at2 + 2bt + c sappiamo che vale

at2 + 2bt + c ≥ 0

qualunque sia t. Equivalentemente il discriminante 4(b2 − ac) di tale polinomio deve essere ≤ 0.
Ma allora abbiamo
b2 − ac = hu, vi2 − hu, ui hv, vi ≤ 0;
utilizzando la definizione di norma, ciò prova la prima parte del teorema.
Si noti infine che l’ultima disuguaglianza è un’uguaglianza se, e solo se, b2 − ac = 0 e cioè
se, e solo se, l’equazione at2 + 2bt + c = 0 ha un’unica radice t0 = − ab . Ciò avviene se, e solo
se,
ht0 u + v, t0 u + vi = 0
ovvero se, e solo se, t0 u + v = 0. Essendo u 6= 0 la condizione t0 u + v = 0 equivale alla
condizione che u e v siano linearmente dipendenti.

Coseno di angoli convessi.


A partire dalla disuguaglianza di Schwarz, possiamo dare una nozione di angolo convesso fra due
vettori non nulli di uno spazio vettoriale euclideo V , estendendo cosı̀ quanto considerato nel caso
xii PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

di vettori geometrici (cf. § 0.1). Siano u e v due vettori non nulli di V . È immediato verificare
che la diseguaglianza di Schwarz è equivalente a:
|hu, vi| ≤ ||u|| ||v||. (1)
Da (1) segue immediatamente che
hu, vi
−1 ≤ ≤ 1, (2)
||u|| ||v||
per ogni u e v come sopra. Grazie al fatto che la funzione coseno e’ monotona strettamente
decrescente (quindi invertibile) nell’intervallo reale [0, π], abbiamo:
Definizione 0.4.4. Dati due vettori non nulli u e v in uno spazio vettoriale euclideo V , definiamo
l’angolo convesso θ = θ(u, v) da essi formato quell’unico numero reale θ ∈ [0, π] tale che
hu, vi
cos θ := . (3)
||u|| ||v||
In altre parole, denotata con
arccos : [−1, 1] → [0, π]
la funzione inversa della funzione coseno nell’intervallo in questione, abbiamo che
hu, vi
θ := arccos( ).
||u|| · ||v||

Vettori ortogonali.
La nozione di perpendicolarità tra vettori di uno spazio vettoriale euclideo può essere agevolmente
introdotta imitando il caso del prodotto scalare geometrico:
Definizione 0.4.5. Due vettori u e v di uno spazio vettoriale euclideo V si dicono perpendicolari
(equivalentemente, ortogonali) se
hu, vi = 0.

Osservazione 0.4.1. Come semplici conseguenze della precedente definizione, ritroviamo che u
e v sono ortogonali se, e solo se, l’angolo convesso da essi formato è θ = π/2. Inoltre, da (3),
otteniamo una semplice relazione che lega il prodotto scalare tra i due vettori, l’angolo convesso
da essi formato e le loro norme:
hu, vi = ||u|| ||v|| cos θ(u, v). (4)
Riguardo alla perpendicolarita’ di vettori, più in generale vale la seguente
Definizione 0.4.6. Un sistema di vettori v = v 1 , . . . , v r si dice un sistema di vettori ortogonali
se i suoi elementi sono a due a due ortogonali, cioè se
i 6= j ⇒ hv i , v j i = 0, ∀ i, j ∈ {1, . . . , r}.
Una base ortogonale è una base di V formata da un sistema di vettori ortogonali.
0.4. SPAZI EUCLIDEI xiii

I sistemi di vettori ortogonali sono spesso più facili da studiare e più convenienti nelle applicazioni.
Si consideri ad esempio la seguente:
Proposizione 0.4.2. Sia v = v 1 , . . . , v r un sistema di vettori ortogonali. Se v i 6= 0 per ogni
i = 1, . . . , r, allora i vettori v 1 , . . . , v r sono linearmente indipendenti.

Dimostrazione. Dobbiamo provare che λ1 v 1 + · · · + λr v r = 0 ⇒ λ1 = · · · = λr = 0. A tale


scopo osserviamo che
X
0 = hv i , 0i = hv i , λ1 v 1 + · · · + λr v r i = λj hv i , v j i.
j=1,...,r

D’altra parte hv i , v j i = 0 se i 6= j e quindi


X
0= λj hv i , v j i = λi hv i , v i i.
j=1,...,r

Infine, essendo v i 6= 0, si ha hv i , v i i =
6 0 e quindi λi = 0, (i = 1, . . . , r).

Procedimento di ortogonalizzazione di Gram-Schmidt


Il problema che vogliamo affrontare è quello di costruire una base ortogonale di uno spazio vet-
toriale euclideo. Il procedimento di Gram-Schmidt è un algoritmo che permette, in particolare, di
risolvere tale problema.
Lemma 0.4.3. Sia w = w1 , . . . , ws un sistema ortogonale di vettori non nulli di V e sia S =
Span(w1 , . . . , ws , v). Allora il vettore
X hv, wi i
n=v− w
hwi , wi i i
i=1,...,s

è perpendicolare ai vettori w1 , . . . , ws e inoltre S = Span(w1 , . . . , ws , n).

Dimostrazione. Sia wj uno dei vettori di w, per i 6= j si ha hwi , wj i = 0 e quindi


X hv, wi i
hw , w i = −hv, wj i.
hwi , wi i i j
i=1,...,s

Ciò implica hn, wj i = hv, wj i − hv, wj i = 0 e pertanto n è ortogonale ad ogni wj . Per provare la
seconda parte dell’enunciato osserviamo innanzitutto che

Span(w1 , . . . , ws , n) ⊆ S.

Ogni vettore u = u1 w1 +· · ·+us ws +us+1 n di Span(n, w1 , . . . , ws ) è infatti anche un vettore di


S: per verificarlo basta sostituire, in quest’ultima combinazione lineare, n con la sua espressione
come combinazione lineare di v w1 , . . . , ws data nell’enunciato. Nello stesso modo si prova che
xiv PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

S ⊆ Span(w1 , . . . , ws , v). Infatti v è combinazione lineare di n, w1 , . . . , ws , come si evince


subito dall’enunciato. Sia allora t = t1 w1 + · · · + ts ws + ts+1 v ∈ S, sostituendo v con la sua
espressione come combinazione lineare di n w1 , . . . , ws , segue che t è combinazione lineare di
n, w1 , . . . , ws . Perciò t ∈ Span(n, w1 , . . . , ws ) e vale la precedente inclusione.

Per rendere piu familiare la formula che appare nell’enunciato del precedente lemma, il lettore
osservi che per due vettori v, w si ha
hw, vi
n=v− w.
hw, wi
La formula generale che appare nell’enunciato del lemma viene utilizzata, nella dimostrazione
del successivo teorema, per costruire un sistema di vettori ortogonali che generi lo stesso spazio
generato da un sistema di vettori assegnato. Tale costruzione è nota come procedimento di Gram-
Schmidt.
Teorema 0.4.4. Sia v = v 1 , . . . , v n un sistema di vettori non tutti nulli di uno spazio vettoriale
euclideo e sia S = Span(v 1 , . . . , v n ). Allora esiste una base ortogonale w = w1 , . . . , ws di S.

Dimostrazione. Procediamo per induzione su n: se n = 1 v 1 è non nullo ed è una base di S. Una


base formata da un solo vettore è sempre ortogonale quindi v 1 è una base ortogonale di S. Sia
ora n > 1, consideriamo i vettori v 1 , . . . , v n−1 ed il sottospazio T da essi generato. Per ipotesi
induttiva esiste una base ortogonale
w1 , . . . , wt
del sottospazio T . Si noti che w1 , . . . , wt e v 1 , . . . , v n−1 generano lo stesso spazio. Quindi anche
i sistemi di vettori w1 , . . . , wt v n e v 1 , . . . , v n−1 v n generano lo stesso spazio e percio’

S = Span(w1 , . . . , wt , v n ).

Per Lemma 0.4.3, il vettore


X hv, wi i
wt+1 = v n − w
hwi , wi i i
i=1,...,s

è ortogonale a w1 , . . . , wt e S = Span(w1 , . . . , wt+1 ). Se wt+1 = 0 allora w1 , . . . , wt è una


base ortogonale di S. Se wt+1 6= 0 allora i vettori w1 , . . . , wt+1 sono non nulli ed a due a due
perpendicolari. Per Proposizione 0.4.2, essi sono linearmente indipendenti. Quindi sono una base
ortogoale di S.

La cosa importante è applicare la dimostrazione, o il lemma che la precede, in modo concreto tutte
le volte che sia assegnato un sistema di vettori

v = v1 , . . . , vn .

Supporremo non tutti nulli i vettori di v e, a meno di riassegnare gli indici, v 1 6= 0. Indichiamo i
passi da compiere:
0.4. SPAZI EUCLIDEI xv

(1) Porre w1 = v 1 .
hw1 ,v 2 i
(2) Porre w2 = v 2 − hw1 ,w1 i w 1 .
..
.
(k) Porre
X hwi , v k i
wk = v k − w
hwi , wi i i
i=1,...,k−1, wi 6=0

..
.
(n) Dopo n passi il procedimento termina avendo costruito un sistema di vettori

w = w1 , . . . , wn .

Si noti che, per ogni k = 1, . . . , n, la costruzione è tale che

Span(v 1 , . . . , v k ) = Span(w1 , . . . , wk ).

Ciò segue immediatamente dalla dimostrazione del precedente teorema. I vettori w1 , . . . , wn


generano dunque Span(v 1 , . . . , v n ) e sono inoltre, per come sono stati costruiti, a due a due
perpendicolari. Non è escluso che alcuni dei vettori costruiti possano essere nulli, infine:
eliminando da w i vettori nulli si ottiene una base ortogonale di Span(v 1 , . . . , v n ).

Sottospazio ortogonale
Definizione 0.4.7. Sia V uno spazio vettoriale euclideo e sia S ⊂ V un sottoinsieme non vuoto.
L’insieme
S ⊥ := {v ∈ V | hv, wi = 0, ∀ u ∈ S}
è un sottospazio vettoriale di V detto sottospazio ortogonale a S.
In altri termini, anche se S è solo un sottoinsieme, S ⊥ ha sempre una struttura di sottospazio
vettoriale di V . Se in particolare S = {u}, per qualche u ∈ V , allora scriveremo u⊥ invece di
{u}⊥ ; in particolare, vale
u⊥ = Span(u)⊥ .
È facile verificare che, se S ⊂ V è anch’esso un sottospazio vettoriale, allora S ∩ S ⊥ = {0}.
Inoltre, se u = u1 , . . . , un è una base per S, risulta

S ⊥ = u⊥ ⊥
1 ∩ · · · ∩ un .

Proposizione 0.4.5. Sia V uno spazio vettoriale euclideo di dimensione n. Sia S ⊂ V un sot-
tospazio vettoriale s dimensionale di V . Allora,

V = S ⊕ S⊥.

In particolare, dim S ⊥ = n − s.
xvi PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

Dimostrazione. Sia u = u1 , . . . , us una base per S. A meno di applicare Teorema 0.4.4, possiamo
supporre che u sia una base ortogonale. Dal Teorema di estensione ad una base e dal Teorema
0.4.4, u si estende ad una base ortogonale v = u1 , . . . , us , us+1 , . . . , un per V . Per definizione
di base ortogonale, us+1 , . . . , un ∈ S ⊥ . Pertanto, V = S + S ⊥ ed i vettori us+1 , . . . , un ∈ S ⊥
sono linearmente indipendenti in S ⊥ perché lo sono in V . Da quanto osservato precedentemente,
poiché si ha S ∩ S ⊥ = {0}, allora V = S ⊕ S ⊥ ed il sistema di vettori linearmente indipendenti
w = us+1 , . . . , un è una base per S ⊥ .

Definizione 0.4.8. Dato S un sottospazio vettoriale di uno spazio vettoriale euclideo V , S ⊥ viene
detto il complemento (o supplemento) ortogonale di S.

0.5 Basi ortonormali e matrici ortogonali


Nel seguito useremo il simbolo di Kronecker δij per indicare il termine di posto i, j della matrice
identità di ordine assegnato; questo vuol dire che δij = 0 se i 6= j e che δij = 1 se i = j.

Definizione 0.5.1. Sia V uno spazio vettoriale euclideo di dimensione n. Diremo che una base
v = v 1 , . . . , v n è ortonormale se
hv i , v j i = δij

Si noti che una base ortonormale v = v 1 , . . . , v n è certamente una base ortogonale, segue infatti
dalla definizione che hv i , v j i = 0 se i 6= j. La proprietà in più che caratterizza le basi ortonormali
tra tutte le basi ortogonali è che

hv i , v i i = 1, i = 1, . . . , n,

i.e. che ogni vettore v i e’ un versore per ogni i = 1, . . . , n.


• Sia V lo spazio dei vettori geometrici e siano OI, OJ, OK tre segmenti orientati che coinci-
dono con i tre lati di un cubo di vertice nel punto O. Allora le classi di equipollenza i, j, k di
OI, OJ, OK sono un esempio di base ortonormale di V per il prodotto scalare geometrico.
• È inoltre facile verificare che la base canonica di Rn è una base ortonormale per il prodotto
scalare standard di Rn .
Sia V uno spazio vettoriale euclideo di dimensione n; per costruire una base ortonormale di V è
sufficiente costruire una base ortogonale

w = w1 , . . . , wn

di V con il procedimento di Gram-Schmidt. Infatti, una volta costruita una base ortogonale w
come sopra, e’ sufficiente versorizzare i vettori di w ponendo, per ogni i = 1, . . . , n,

1
ui = p wi
hwi , wi i
0.5. BASI ORTONORMALI E MATRICI ORTOGONALI xvii

ottenendo cosi’ una base ortonormale


u = u1 , . . . , un
dedotta da w. Abbiamo infatti gia’ osservato che
1
hui , uj i = p q hwi , wj i = δij .
hwi , wi i hwj , wj i

In particolare i vettori u1 , . . . , un sono non nulli, a due a due perpendicolari e tali che hui , ui i = 1.
Le prime due proprietà implicano che tali vettori sono linearmente indipendenti. Quindi, essendo
in numero uguale alla dimensione di V , essi formano una base ortogonale. L’ultima proprietà ci
dice che tale base è ortonormale.

Sia v = v 1 , . . . , v n una base di V e sia


Bv := Bv (h , i)
la matrice del prodotto scalare h , i rispetto alla base v. Poiché il termine di posto i, j di Bv è il
prodotto scalare hv i , v j i è chiaro che:
Proposizione 0.5.1. v è una base ortonormale se, e solo se, Bv è la matrice identità.

Una buona proprietà delle basi ortonormali è la seguente: siano x, y ∈ V due vettori e sia
u = u1 , . . . , un
una base ortonormale di V e sia Bu := Bu (h , i) la matrice del prodotto scalare rispetto aalla
base u. Allora sappiamo che:
 
y1
  .. 
hx, yi = x1 , . . . , xn Bu  .  .
yn
Poiché u è per ipotesi ortonormale, si ha che Bu è la matrice identità In quindi
   
y1 y1
 .  .  X
hx, yi = x1 , . . . , xn In  ..  = x1 , . . . , xn  ..  = xi yi .
yn yn i=1,...,n

La precedente proprietà viene spesso riassunta a parole nel modo seguente:

(P1) Se u è una base ortonormale il prodotto scalare hx, yi è la somma dei prodotti delle coordi-
nate omonime di x e y rispetto a u.
In (P1) la terminologia ”coordinate omonime” vuol dire coordinate di x e di y aventi indice uguale
e cioè xi e yi , 1 ≤ i ≤ n.

Una ulteriore buona proprietà di una base ortonormale è che le coordinate di un vettore v ∈ V
sono determinate dal prodotto scalare:
xviii PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

Proposizione 0.5.2. Sia V uno spazio vettoriale euclideo e sia u = u1 , . . . , un una sua base
ortonormale. Per ogni vettore v ∈ V la componente j-esima di v rispetto alla base u è il prodotto
scalare
hv, uj i.

Dimostrazione. Sia v = x1 u1 + · · · + xn un . Per provare la proprieta’ basta osservare che


X X X
hv, uj i = h xi ui , uj i = xi hui , uj i = xi δij = xj .
i=1,...,n i=1,...,n i=1,...,n

Assegnate due basi ortonormali


u = u1 , . . . , un
e
v = v1 , . . . , vn
di V , le matrici
Muv e Mvu ,
rispettivamente, del cambiamento di base da u a v e da v ad u hanno un’importanza particolare.

Definizione 0.5.2. Una matrice quadrata M si dice ortogonale se


t
M M = In .

Equivalentemente M è una matrice ortogonale se, e solo se, M è invertibile e l’inversa di M


coincide la trasposta di M :
M −1 = t M.
Dal Teorema di Binet e dal fatto che t M M = In , si ottiene che, se M e’ una matrice ortogonale
allora
det(M ) = ±1.

Definizione 0.5.3. Una matrice ortogonale M si dice speciale ortogonale se

det(M ) = 1,

si dice invece ortogonale non-speciale se

det(M ) = −1.

Perché interessarsi alle matrici ortogonali? Il fatto e’ che le matrici ortogonali sono, come
vedremo tra poco, esattamente le matrici del cambiamento di base tra due basi ortonormali.
0.5. BASI ORTONORMALI E MATRICI ORTOGONALI xix

Teorema 0.5.3. Sia V uno spazio vettoriale di dimensione finita e siano u e v due sue basi qual-
siasi. Sia poi h , i un prodotto scalare su V e siano Bu := Bu (h , i) e Bv := Bv (h , i)
rispettivamente le matrici di tale prodotto scalare rispetto alle basi u e v. Allora la relazione tra
le matrici Bu e Bv dei prodotti scalari in queste due basi è la seguente:

Bv = tMuv Bu Muv , (5)

dove Muv è la matrice del cambiamento di base da u a v.

Dimostrazione. Siano u = u1 , . . . , un , v = v 1 , . . . , v n e siano assegnati due vettori qualsiasi

x = x1 v 1 + · · · + xn v n e y = y1 v 1 + · · · + yn v n ,

espressi mediante le loro coordinate rispetto alla base v. Dalla formula del cambiamento di coor-
dinate, le colonne delle coordinate di x e y rispetto alla base u sono, rispettivamente,
   
x1 y1
 ..   .. 
Muv  .  e Muv  .  .
xn yn
Si osservi inoltre che la trasposta del primo prodotto è

x1 , . . . , xn tMuv .

Poiché Bu è la matrice di h , i rispetto alla base u, ne segue che in base u si ha:


 
y1
 t  .. 
hx, yi = x1 , . . . , xn Muv Bu Muv  .  .
yn
Poiché la precedente eguaglianza vale qualunque siano i vettori x e y, possiamo dedurre che

Bv = tMuv Bu Muv .

Si osservi infatti che le coordinate di v i (rispettivamente, di v j ) rispetto a v sono nulle salvo quella
i-esima (rispettivamente, la j-esima), che vale 1. La penultima eguaglianza implica allora
 
0
 .. 
.
 t  
hv i , v j i = 0 . . . 1i . . . 0 Muv Bu Muv  
1j  .
 .. 
.
0
L’espressione a destra di quest’ultima uguaglianza è esattamente il termine di posto i, j della
matrice prodotto
t
Muv Bu Muv .
xx PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

D’altra parte Bv è, per definizione di matrice associata ad un prodotto scalare rispetto ad una base,
esattamente la matrice il cui termine di posto i, j è hv i , v j i. Per ogni i, j, tMuv Bu Muv e Bv hanno
dunque lo stesso termine i, j. Quindi sono matrici uguali.

La relazione (5) tra le matrici Bu e Bv è molto importante e svolgerà un ruolo fondamentale anche
in altri argomenti che affronteremo in seguito (cf. e.g. Capitolo 0.9). Abbiamo infatti la seguente
situazione più generale:

Definizione 0.5.4. Due matrici A e B, n×n, si dicono congruenti se esiste una matrice invertibile
M , n × n, tale che valga
B = tM AM. (6)
Se A è B soddisfano la relazione (6), esse si dicono congruenti per mezzo di M .

Da Teorema 0.5.3 abbiamo quindi che, dato uno spazio vettoriale euclideo V , le matrici di un
prodotto scalare rispetto a due qualsiasi basi di V sono congruenti.
Nelle stesse notazioni di Definizione 0.5.4, abbiamo inoltre:

Lemma 0.5.4. Sia M una matrice ortogonale n × n. Allora, per ogni matrice A n × n, si ha la
seguente identità:
M −1 AM = t M AM. (7)
In particolare, se M e’ ortogonale, due matici A e B sono simili (o coniugate) se e solo se sono
congruenti.

Dimostrazione. Discende dal fatto immediato che, essendo M ortogonale, allora t M = M −1 .

Pertanto, se su uno spazio vettoriale euclideo (V, h, i) prendiamo due basi ortonormali (rispetto
a h, i) si ha:

Teorema 0.5.5. Sia V uno spazio vettoriale e siano u e v due sue basi ortonormali rispetto ad
uno stesso prodotto scalare h , i su V . Allora la matrice del cambiamento di base Muv è una
matrice ortogonale.

Dimostrazione. Siano Bu := Bu (h, i) e Bv := Bv (h, i) rispettivamente le matrici del prodotto


scalare considerato rispetto alle basi u e v. Poiché u e v sono ortonormali si ha che Bu = In = Bv .
Applicando (5), segue allora che

In = tMuv In Muv = tMuv Muv .


−1 = tM , quindi M
In altri termini Muv uv uv è una matrice ortogonale.

Proiettori ortogonali su sottospazi


Quanto osservato precedentemente, permette di dare ulteriori importanti definizioni.
0.5. BASI ORTONORMALI E MATRICI ORTOGONALI xxi

Definizione 0.5.5. Dati due vettori non nulli u e v in uno spazio vettoriale euclideo V , definiamo
la proiezione ortogonale di u lungo la direzione determinata da v (i.e. sul sottospazio Span(v))
il vettore
πv (u)
definito dalla condizione
hu − πv (u), vi = 0. (8)
L’applicazione lineare πv sopra definita si chiama proiettore ortogonale sul sottospazio Span(v).
Ovviamente se u e v sono linearmente dipendenti, allora chiaramente πv (u) = u. Pertanto, la
precedente definizione è di interessante utilizzo principalmente quando u e v sono linearmente
indipendenti. Utilizzando (3) e (4), abbiamo il seguente semplice risultato.
Proposizione 0.5.6. Dati due vettori non nulli u e v, linearmente indipendenti, in uno spazio
vettoriale euclideo V , allora:

(i) πv (u) = λu v, dove


hu, vi ||u||
λu := = cos θ(u, v) ∈ R; (9)
||v||2 ||v||

(ii) la proiezione ortogonale (8) determina una decomposizione ortogonale del vettore u in
un vettore parallelo a v, i.e. πv (u) come in (i), e di un vettore perpendicolare a v, i.e.
nv (u) := u − πv (u) = u − λu v. In altri termini, u si esprime in modo unico come

u = πv (u) + nv (u),

con πv (u) ∈ Span(v) e nv (u) ∈ Span(v)⊥ .

È chiaro che si può definire, vicendevolmente, la proiezione ortogonale di v su u.

Dimostrazione di Proposizione 0.5.6. (i) Per definizione di proiezione ortogonale su v, il vettore


πv (u) dovrà appartenere a Span(v). In tal caso esiste, ed è univocamente determinato, uno scalare
non nullo λ ∈ R tale che πv (u) = λ v. Vogliamo determinare tale λ in funzione di u e v. Per fare
questo, utilizziamo (8):

0 = hu − πv (u), vi = hu, vi − λhv, vi = hu, vi − λ||v||2 ,

che fornisce la prima eguaglianza in (9). La seconda eguaglianza è chiaramente conseguenza della
prima e di (4).
(ii) È ovvia conseguenza di (i) e di (8).

Più in generale, sia U un sottospazio vettoriale di V . Da Proposizione 0.4.5, si ha la decom-


posizione ortogonale
V = U ⊕ U ⊥,
xxii PRODOTTI SCALARI E SPAZI VETTORIALI EUCLIDEI

dove U ⊥ è il complemento ortogonale di U rispetto al prodotto scalare h , i fissato su V (cf.


Definizione 0.4.8). Poiche’ la somma e’ diretta, ogni vettore v ∈ V si scrive in modo unico come

v = v U + v U ⊥ , con v U ∈ U, v U ⊥ ∈ U ⊥ ; (10)

in particolare, poiché la decomposizione è ortogonale, vale anche

||v||2 = ||v U ||2 + ||v U ⊥ ||2 .

Definizione 0.5.6. Dato un vettore v ed un sottospazio vettoriale U non nulli in uno spazio vetto-
riale euclideo V , definiamo le proiezioni ortogonali di v sui sottospazi U e U ⊥ , rispettivamente, i
vettori
πU (v) := v U e πU ⊥ (v) := v U ⊥
come in (10).
Proposizione 0.5.7. Siano U e v come sopra. Sia dim U = k < n = dim(V ). Sia u =
u1 , u2 , . . . , uk una qualsiasi base ortogonale per U . La proiezione ortogonale di v su U è il
vettore
hv, u1 i hv, u2 i hv, uk i
πU (v) = u1 + u2 + . . . + u . (11)
hu1 , u1 i hu2 , u2 i huk , uk i k
Equivalentemente, πU (v) è il vettore la cui i-esima componente rispetto alla base u di U è:

hv, ui i
, 1 ≤ i ≤ k.
hui , ui i

In modo analogo, da (10), la proiezione ortogonale di v su U ⊥ sarà data da v − πU (v). Notiamo


inoltre che, nel caso in cui u sia una base ortonormale, per πU (v) ritroviamo quanto dimostrato in
Proposizione 0.5.2.

Dimostrazione di Proposizione 0.5.7. Per il teorema di completamento ad una base ed il procedi-


mento di Gram-Schmidt, troviamo una base

v = u1 , u2 , . . . , uk , uk+1 , . . . , un

di V che è ortogonale e che completa la base data di U ; in particolare, u′ := uk+1 , uk+2 , . . . , un


è una base ortogonale per U ⊥ . Rispetto a tale base di V , ragionando come in Proposizioni 0.5.2 e
0.5.6-(i), la i-esima coordinata di v rispetto alla base u è data da

hv, ui i
, 1 ≤ i ≤ n.
hui , ui i

Pertanto, per l’unicità della decomposizione (10), abbiamo l’asserto.

Concludiamo il presente capitolo con testi di alcuni esercizi proposti.


0.5. BASI ORTONORMALI E MATRICI ORTOGONALI xxiii

Testi di esercizi riepilogativi 0.1. (1) Nello spazio vettoriale euclideo R2 , munito di base canon-
ica e e di prodotto scalare standard, si consideri il vettore u = (−1, 1) espresso nelle sue coor-
dinate rispetto ad e. Determinare tutti i vettori x che sono ortogonali ad u e con norma uguale a
2.
(2) Sia R3 lo spazio vettoriale euclideo, munito di prodotto scalare standard e di base canonica e.
Sia U ⊂ R3 il sottoinsieme delle soluzioni del sistema lineare x + y + 2z = x − y + z = 0.
(i) Giustificare che U è un sottospazio vettoriale di R3 .
(ii) Determinare una base ortonormale di U .
(iii) Denotato con U ⊥ il complemento ortogonale di U in R3 , determinare un’equazione lineare
in x, y e z che rappresenti U ⊥ .
(iv) Utilizzando il procedimento di ortonormalizzazione di Gram-Schmidt, estendere la base ortonor-
male di U determinata nel punto (ii) ad una base ortonormale di R3 .
(3) Sia F : R2 × R2 → R la funzione sullo spazio vettoriale R2 definita da: ∀ x, y ∈ R2 ,
F (x, y) := 2x1 y1 + x2 y1 + x1 y2 + x2 y2 , dove x = (x1 , x2 ) e y = (y1 , y2 ) denotano le coordinate
dei vettori dati rispetto alla base canonica e.
(i) Verificare che F è un prodotto scalare su R2 e determinare la matrice Be (F ) di F in base e.
(ii) Considerata la base b data dai vettori v 1 := e1 + e2 , v 2 := 2e1 − e2 di R2 , determinare la
matrice Bb (F ) di F in base b.
(4) Nello spazio vettoriale euclideo R3 , munito del prodotto scalare standard, siano dati i vettori
v 1 = (1, 2, −1), v 2 = (1, 0, 1), v 3 = (1, 2, 0) espressi rispetto alla base canonica e.
(i) Determinare ||v 1 ||, il prodotto scalare hv 1 , v 2 i ed il coseno dell’angolo formato da v 2 e v 3 .
(5) Nello spazio vettoriale euclideo R3 , munito del prodotto scalare standard, determinare il vet-
tore proiezione ortogonale del vettore v 1 = (1, 1, 0) sul vettore v 2 = (1, 0, 1), dove ambedue i
vettori sono espressi rispetto alla base canonica e.
(6) Sia R3 lo spazio vettoriale euclideo, munito di base canonica e e prodotto scalare standard.
(i) Determinare una base ortonormale f di R3 costruita a partire dalla base b := v 1 , v 2 , v 3 , dove
v 1 = (1, 0, 1), v 2 = (0, 1, 1), v 3 = (0, 1, −1).
(ii) Verificare che la matrice cambiamento di base Mef è ortogonale.
(7) Nello spazio vettoriale euclideo R3 , munito del prodotto scalare standard, determinare la
proiezione ortogonale del vettore v = (0, 1, 2) sul sottospazio W generato dai vettori v 1 =
(1, 1, 0) e v 2 = (0, 0, 1).
Matrici ed operatori ortogonali.
Orientazione in uno spazio vettoriale

In questo capitolo studiamo alcune proprietà fondamentali delle matrici ortogonali su uno spazio
vettoriale euclideo V . Assoceremo a tali matrici degli opportuni operatori lineari su V , detti oper-
atori ortogonali. Considereremo poi esempi concreti di operatori ortogonali negli spazi vettoriali
euclidei R2 o R3 , muniti di prodotto scalare standard, che hanno importanti risvolti dal punto di
vista della geometria euclidea.
Come in § 0.4, per tutto il capitolo sarà notazionalmente più conveniente considerare la n-upla di
coordinate di un vettore rispetto ad una base data come una matrice colonna.

0.6 Operatori e matrici ortogonali


Definizione 0.6.1. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n. Sia F un o-
peratore lineare su V . F si dice operatore ortogonale (rispetto a h , i) se, per ogni x, y ∈ V ,
vale:
hF (x), F (y)i = hx, yi. (12)

Proposizione 0.6.1. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n. Un operatore
F è ortogonale se, e solo se, è un operatore invertibile (i.e. esiste l’inverso F −1 ) e se, in ciascuna
base ortonormale f di V , la matrice rappresentativa B := Mf (F ) di F è una matrice ortogonale,
i.e. B −1 = t B.

Dimostrazione. ⇒) Sia f una qualsiasi base ortonormale di V e sia B = Mf (F ). Poiché la


nozione di rango di una matrice è indipendente dalla scelta di una base, per dimostrare contempo-
raneamente che F è invertibile e che B è ortogonale basta verificare che t BB = In , cioè che per
ogni x ∈ V , si ha t B(B(x)) = x.
Siano x e y due vettori arbitrari di V . Visto che F è ortogonale, abbiamo hF (x), F (y)i = hx, yi.
   
x1 y1
 ·  ·
Ora, rispetto alla base f , supponiamo di avere coordinate x =   ·  e y =  · . Poiché
  

xn yn
f è per ipotesi ortonormale, la matrice del prodotto scalare Bf (h , i) è la matrice identità (cf.

xxv
xxvi MATRICI ORTOGONALI
 
y1
·
Proposizione 0.5.1). Pertanto, in base f , hF (x), F (y)i = (x1 . . . xn ) t BIn B 
 · . Poiché, per

yn
 
y1
·
ipotesi, quest’ultimo deve essere uguale a hx, yi = (x1 . . . xn )In  · , per ogni scelta di x e y

yn
in V , otteniamo l’identità tra matrici t BB = In .
⇐) F è per ipotesi invertibile. Sia f una qualsiasi base ortonormale di V e sia B = Mf (F ).
La matrice di F −1 in base f è quindi B −1 = t B, per le ipotesi su B. Per ogni x e y in V ,
con coordinate rispetto a f come nel punto precedente, dalle ipotesi su F e su B si ha hx, yi =
   
y1 y1
· t ·
 
 ·  = (x1 . . . xn ) BB  ·  = hF (x), F (y)i, cioè F è ortogonale.
(x1 . . . xn )In  

yn yn

Notiamo inoltre

Corollario 0.6.2. Date due matrici A e B, n × n, esse sono congruenti per mezzo di una matrice
ortogonale M , n × n, se e solo se sono simili per mezzo di M .

Dimostrazione. Discende direttamente da Lemma 0.5.4 e dalle nozioni di congruenza (cf. Definizione
0.5.4) e di matrici simili o coniugate.

Osservazione 0.6.1. (a) Dalla condizione (12), osserviamo che un operatore ortogonale conserva
il prodotto scalare tra vettori. Quindi conserva la norma di un vettore e conserva l’angolo convesso
tra due vettori non nulli. In particolare, un operatore ortogonale trasforma basi ortonormali in basi
ortonormali (cf. Teorema 0.5.5).
(b) Se un operatore ortogonale ha autovalori reali, allora essi sono solamente ±1. Infatti, sia λ
un autovalore reale di F e sia x un relativo autovettore, i.e. F (x) = λx. Allora, poiché da (a)
abbiamo ||F (x)|| = ||λx|| = |λ|||x|| = ||x||, si ha che |λ| = 1.
(c) Tuttavia, possono esistere operatori ortogonali che non hanno mai autovalori reali (e pertanto
sono sicuramente non diagonalizzabili). Ad esempio, prendiamo R2 con prodotto scalare stan-
dard e fissiamo
  la base canonica e come base di riferimento. Consideriamo la matrice A =
0 −1
. Essa è ortogonale: oltre alla verifica diretta, nei prossimi paragrafi troveremo che A
1 0
rappresenta, in base e, la rotazione di angolo π/2 attorno all’origine di R2 . Per Proposizione 0.6.1,
A definisce un operatore ortogonale F = FA su R2 . Però tale operatore F è privo di autovalori
reali, infatti il polinomio caratteristico di A e’ PA (T ) = T 2 + 1 che non ha soluzioni reali.
0.7. ORIENTAZIONE DI SPAZI VETTORIALI xxvii

0.7 Orientazione di spazi vettoriali


In questo paragrafo introduciamo la nozione di orientazione di un sistema di n vettori in uno
spazio vettoriale V di dimensione n ≥ 2. Supponiamo fissata, una volta per tutte, su V una base
e. Siano dati n vettori v 1 , v 2 , . . . , v n non nulli in V .

Definizione 0.7.1. Con notazioni come sopra si definisce l’orientazione del sistema ordinato di
vettori v = v 1 , v 2 , . . . , v n rispetto alla base e, denotata con Or(v 1 , v 2 , . . . , v n ), il segno del
determinante della matrice A, n × n, delle coordinate di v rispetto ad e.

In altre parole, se supponiamo che le coordinate di v i rispetto alla base e sono


 
a1i
 a2i 
 
 ·  , 1 ≤ i ≤ n,
vi =  (13)

 · 
ani

allora:
(i) Or(v 1 , v 2 , . . . , v n ) = 0, se v non è una base;
(ii) se invece v è una base, la matrice A := (aij ), 1 ≤ i, j ≤ n, ha per i-esima colonna le
coordinate di v i come in (13). Pertanto essa non è altro che la matrice cambiamento di base Mev .
Denotato con
det A
ǫA := = ±1
|det A|
il segno del determinante di A, allora

Or(v 1 , v 2 , . . . , v n ) = ǫA . (14)

Notiamo che l’orientazione di e (rispetto ad e) è Or(e1 , e2 , . . . , en ) = 1, dato che in tal caso


A = In . Notiamo inoltre che l’orientazione di una qualsiasi base dipende strettamente dall’ordine
scelto dei vettori della base. Ad esempio, se v = v 1 , v 2 , . . . , v n è una qualsiasi base per V , si ha

Or(v 1 , v 2 , . . . , v i , . . . , v j , . . . , v n ) = − Or(v 1 , v 2 , . . . , v j , . . . , v i , . . . , v n )

per ciascun 1 ≤ i 6= j ≤ n. Pertanto, ogni volta che scambiamo di posto a due vettori della base,
bisogna moltiplicare per −1 il precedente valore di orientazione.
In particolare, abbiamo anche:

Definizione 0.7.2. Sia v = v 1 , v 2 , . . . , v n una base per V . Se Or(v 1 , v 2 , . . . , v n ) è uguale a:

(i) 1, la base v si dirà orientata positivamente (od equiorientata con la base e);

(ii) −1, la base v si dirà orientata negativamente (o non equiorientata con la base e);
xxviii MATRICI ORTOGONALI

Date ora due basi v e w di V , se sia v che w sono (rispettivamente, non sono) equiorientata con e,
allora diremo che v e w sono equiorientate fra loro. In effetti, questa definizione è naturale dato
che è compatibile con il fatto che, in tale situazione, si ha:

Mvw = Mve Mew .

Pertanto, dal Teorema di Binet,


det Mew
det Mvw = (det Mve )(det Mew ) = ,
det Mev
che è sempre positivo. In definitiva, l’equiorientazione di basi è una relazione di equivalenza
sull’insieme BV delle basi di V . Precisamente, V possiede esattamente due orientazioni, cioè
BV è ripartito in due insiemi disgiunti B+ −
V , contenente tutte le basi equiorientate con e, e BV ,
+
contenente tutte quelle non equiorientate con e. Per ogni coppia di basi v e w prese in BV (rispet-
tivamente, B− V ) esse sono equiorientate fra loro.

Esempio 0.7.1. Nei capitoli successivi, utilizzeremo queste nozioni principalmente nel caso V =
Rn ed e la base canonica. Se ad esempio v = v 1 , v 2 , . . . , v n è una qualsiasi base ortonormale di
Rn , rispetto al prodotto scalare standard, se A = Mev allora

Or(v 1 , v 2 , . . . , v n ) = det A

dato che in tal caso A è una matrice ortogonale, quindi il suo determinante è ±1. Il fatto che
v stia in B+
Rn o meno dipenderà dal fatto che A sia una matrice ortogonale speciale o meno (cf.
Definizione 0.5.3).
Vediamo ora come varia la proprietà di orientazione rispetto alla base e quando applichiamo
delle trasfromazioni lineari ai vettori della base v. Il seguente risultato è immediata conseguenza
del Teorema di Binet e di Definizione 0.7.1.
Proposizione 0.7.1. Siano V , e e v come sopra. Sia B una qualsiasi matrice n × n invertibile.
det B
Allora, detto ǫB = |det B| = ±1 il segno del determinante di B, si ha:

Or(Bv 1 , Bv 2 , . . . , Bvn ) = ǫB Or(v 1 , v 2 , . . . , v n ).

Il precedente risultato in altri termini stabilisce il fatto che se abbiamo una base v di uno spazio
vettoriale e consideriamo i trasformati dei vettori della base v per mezzo di un’affinità lineare B
che opera su V , allora si ottiene una nuova base w = Bv 1 , . . . , Bvn che sarà equiorientata a v o
meno a seconda che il determinante di B sia positivo o negativo.
√ ! √ !
2 2

Esempio 0.7.2. Siano dati v 1 = √22 e v 2 = √2
2
due vettori di R2 espressi rispetto
2 2 √ √ !
2 2

alla base canonica e = e1 , e2 di R2 . Notiamo che det √2
2
√2
2
= 1 > 0; pertanto
2 2
anche Or(v 1 , v 2 ) = 1. In altri termini, v = v 1 , v 2 è una base ortonormale equiorientata con
0.8. TRASFORMAZIONI ORTOGONALI DI R2 xxix

e. Anticipando alcune cose che verranno discusse in dettaglio nei paragrafi successivi, possiamo
dare una giustificazione geometrica di quanto asserito. In effetti, la base v e’ ottenuta da e facendo
ruotare sia e1 che e2 di 45 gradi (i.e. π/4) in modo antiorario attorno a 0. Se R è la matrice che
rappresenta in base e questa rotazione (cf. Proposizione 0.8.1) abbiamo che det R = 1 (come
ogni rotazione, cf. Corollario 0.8.2).
√ ! √ ! √ √ !
2 2 2 2
Se invece prendiamo w1 = √2 e w2 = 2√ abbiamo che det √2 2√ =
2
2 − 22 2
− 22
2
Or(w1 , w2 ) = −1, cioè w = w1 , w2 è una base ortonormale non equiorientata con e. In effetti,
come otteniamo la base w dalla base canonica e, per mezzo di un’isometria lineare? Ad esempio,
compiamo prima la rotazione R in senso antiorario di angolo π/4 portando la base canonica e
nella base v, come sopra. Poi, alla base v applichiamo la trasformazione S di riflessione rispetto
al vettore v 1 . In particolare avremo w1 = S(v 1 ) = v 1 mentre w2 = S(v 2 ) = −v 1 . Perciò
w è ottenuta da e prima per mezzo della rotazione R e poi applicando alla base intermedia v la
riflessione S. È facile verificare che det S = −1 (come ogni riflessione ha, cf. Corollario 0.8.5).
Pertanto la trasformazione composta che porta e in w è la trasformazione S ◦R che, per il Teorema
di Binet, ha determinate −1.

Osservazione 0.7.1. Abbiamo una visualizzazione geometrica del concetto di orientazione. Per
semplicita’ ci focalizziamo sui casi di R2 e di R3 .
• Se abbiamo una base ortonormale v 1 , v 2 di R2 , facendo ruotare v 1 , in direzione di v 2 , fino a
farlo arrivare sulla retta vettoriale Span(v 2 ), se su tale retta vettoriale il vettore cosı̀ ottenuto da
v 1 ed il vettore v 2 hanno lo stesso verso, allora vuol dire che Or(v 1 , v 2 ) = 1, se invece hanno
verso opposto, allora Or(v 1 , v 2 ) = −1.
• Se abbiamo una base ortonormale v 1 , v 2 , v 3 di R3 , allora:
(a) Or(v 1 , v 2 , v 3 ) = 1 si ha quando i vettori della base sono disposti in maniera tale da poter
identificare v 1 con il dito medio, v 2 con il dito pollice e v 3 con il dito indice della mano destra;
(b) Or(v 1 , v 2 , v 3 ) = −1 si ha quando i vettori della base sono disposti in maniera tale da poter
identificare v 1 con il dito medio, v 2 con il dito pollice e v 3 con il dito indice della mano sinistra.

0.8 Alcune trasformazioni ortogonali fondamentali dello spazio vet-


toriale euclideo R2 standard
In tutto questo paragrafo, considereremo lo spazio vettoriale R2 munito di base canonica e e
prodotto scalare standard.

Operatori di rotazione attorno al vettore nullo 0. Introduciamo adesso le rotazioni attorno al


vettore nullo 0 in R2 .

Definizione 0.8.1. Sia θ ∈ R. Denotiamo con Rθ = Rθ,O l’applicazione di R2 in sè che ad un


arbitrario vettore x ∈ R2 associa il vettore y ∈ R2 , vettore ottenuto ruotando il vettore x di
angolo θ attorno al vettore nullo 0. Rθ si chiama rotazione attorno al vettore nullo 0 di angolo θ.
xxx MATRICI ORTOGONALI
 
x1
Proposizione 0.8.1. Sia x = ∈ R2 arbitrario. Allora
x2
    
x1 cos θ − sin θ x1
Rθ = . (15)
x2 sin θ cos θ x2
 
y1
In altri termini, se y = Rθ (x) = , le equazioni per la rotazione Rθ sono date da:
y2

y1 = cos θ x1 − sin θ x2
(16)
y2 = sin θ x1 + cos θ x2 .

In particolare,
• se θ = 0, allora Rθ = Id;
• se θ > 0, la rotazione di x è in senso antiorario rispetto al vettore e1 ;
• se θ < 0, la rotazione di x è in senso orario rispetto al vettore e1 .

Dimostrazione. Sia α l’angolo convesso fra il vettore x e l’asse delle x1 . Precisamente, se x si


trova nel I o IV quadrante, allora α è l’angolo convesso fra i vettori x ed e1 ; se x si trova invece
nel II o III quadrante, allora α è l’angolo convesso fra i vettori x e −e1 . In ogni caso, si ha che

x1 = ||x|| cos α, x2 = ||x|| sin α.

Il vettore y = Rθ (x) è tale che ||y|| = ||x|| e forma con l’asse delle x1 un angolo pari a α + θ.
Pertanto
y1 = ||x|| cos(α + θ), y2 = ||x|| sin(α + θ).
Per le formule di addizione delle funzioni trigonometriche e per le precedenti relazioni, abbiamo
quindi:
y1 = ||x||(cos α cos θ − sin α sin θ) = x1 cos θ − x2 sin θ,
y2 = ||x||(sin α cos θ − cos α sin θ) = x1 sin θ + x2 cos θ
onde l’asserto.

Corollario 0.8.2. Per ogni θ ∈ R, le rotazioni Rθ attorno al vettore nullo sono traformazioni la
cui matrice rappresentativa come in (15) è speciale ortogonale.

Dimostrazione. La matrice rappresentativa di Rθ nella base canonica (ortonormale) è manifesta-


mente ortogonale. Infine, il determinate della matrice rappresentativa di Rθ è dato da cos2 θ +
sin2 θ = 1.

Osservazione 0.8.1. Da quanto dimostrato in Proposizione 0.7.1 e dal Corollario 0.8.2-(ii), no-
tiamo subito che le rotazioni Rθ attorno all’origine in particolare conservano l’orientazione di
basi dello spazio vettoriale R2 , i.e. Or(v, w) = Or(Rθ (v), Rθ (w)), per ogni coppia di vettori
linearmente indipendenti v, w di R2 e per ogni θ ∈ R.
0.8. TRASFORMAZIONI ORTOGONALI DI R2 xxxi

Concludiamo osservando che le rotazioni attorno all’origine godono delle seguenti ovvie pro-
prietà che discendono immeditamente da (15).

Proposizione 0.8.3. (i) Per θ, ϕ ∈ R, si ha Rθ ◦ Rϕ = Rϕ ◦ Rθ = Rθ+ϕ .


(ii) Per ogni θ ∈ R, R−1
θ = R−θ .

In particolare, la composizione di rotazioni attorno all’origine è ancora una rotazione attorno


all’origine e l’inversa di una rotazione attorno all’origine è una rotazione attorno all’origine.

Operatori di riflessione rispetto a rette vettoriali: consideriamo adesso altre trasformazioni


fondamentali: le riflessioni (o simmetrie) rispetto a rette vettoriali.

Definizione 0.8.2. Sia r una retta vettoriale di R2 orientata in modo tale che formi con il vettore
e1 un angolo convesso 0 ≤ ϕ ≤ π/2. Denotiamo con Sϕ = Sϕ,0 l’applicazione di R2 in sè che
ad un arbitrario vettore x ∈ R2 associa il vettore y ottenuto per riflessione di x rispetto ad r. Sϕ
viene detta riflessione (o simmetria) definita dalla retta vettoriale (orientata) r.
 
x1
Proposizione 0.8.4. Sia x = ∈ R2 arbitrario. Allora
x2
    
x1 cos 2ϕ sin 2ϕ x1
Sϕ = . (17)
x2 sin 2ϕ − cos 2ϕ x2
 
y1
In particolare, se y = Sϕ (x) = , le equazioni per la riflessione rispetto alla retta vettoriale
y2
r sono: 
y1 = cos 2ϕ x1 + sin 2ϕ x2
(18)
y2 = sin 2ϕ x1 − cos 2ϕ x2 .

Dimostrazione. Costruiamo in modo vettoriale tale riflessione. A meno di normalizzare il vettore


direttoredi r, dalle ipotesi fatte, possiamo supporre che il vettore direttore di r sia il versore u =

cos ϕ
. Denotiamo con n un vettore ortogonale ad u in modo che la base ortonormale {u, n} sia
sin ϕ
 
2 − sin ϕ
equiorientata con la base canonica e di R . Pertanto, n := . Utilizzando Proposizione
cos ϕ
0.5.6, possiamo scrivere x come somma dei due vettori ottenuti per proiezione ortogonale di x su
u e su n; precisamente avremo:

x = hx, ui u + hx, ni n. (19)

Applicando la regola del parallelogramma, abbiamo immediatamente Sϕ (x) = hx, ui u−hx, ni n,


dove S(x) = Sϕ (x) e φ = ϕ).
Da (19), abbiamo che hx, ui u = x − hx, ni n. Quindi l’equazione vettoriale per la riflessione
Sϕ e’:
Sϕ (x) = x − 2hx, ni n. (20)
xxxii MATRICI ORTOGONALI

Osserviamo che hx, ni = −  sinϕ x1+ cos


 ϕ x2 . Passando in coordinatenell’equazione
 vet-
x1 x1 − sin ϕ
toriale (20), otteniamo Sϕ = − 2(− sin ϕ x1 + cos ϕ x2 ) . Quindi
x2 x2 cos ϕ
(1 − 2 sin2 ϕ) x1 + 2 sin ϕ cos ϕ x2
   
x1
Sϕ = . Ricordando che 2 sin ϕ cos ϕ = sin(2ϕ),
x2 2 sin ϕ cos ϕ x1 + (1 − 2 cos2 ϕ) x2
cos2 ϕ − sin2 ϕ = cos(2ϕ), sin2 ϕ + cos2 ϕ = 1 otteniamo (18).

Corollario 0.8.5. Per ogni ϕ ∈ R, le riflessioni Sϕ rispetto a rette vettoriali sono trasfromazioni
la cui matrice rappresentativa come in (17) è ortogonale non speciale.

Dimostrazione. La dimostrazione è simile a quella di Corollario 0.8.2. La sola differenza è che il


determinate di Sϕ è dato da − cos2 (2ϕ) − sin2 (2ϕ) = −1.

Osservazione 0.8.2. Differentemente da quanto discusso in Osservazione 0.8.1, da Proposizione


0.7.1 e dal Corollario 0.8.5-(ii) notiamo subito che le riflessioni Sϕ in particolare non conservano
l’orientazione di basi dello spazio vettoriale R2 , i.e. Or(Sϕ (v), Sϕ (w)) = −Or(v, w), per ogni
coppia di vettori linearmente indipendenti v, w di R2 e per ogni ϕ ∈ R.

Le riflessioni rispetto a rette vettoriali godono di ovvie proprietà che discendono immedita-
mente da (17).

Proposizione 0.8.6. (i) S0 è la riflessione rispetto all’asse x1 mentre Sπ/2 è la riflessione rispetto
       
x1 x1 x1 −x1
all’asse x2 . In altri termini S0 = e Sπ/2 = .
x2 −x2 x2 x2
(ii) Per ogni ϕ ∈ R, Sϕ è involutoria i.e. Sϕ ◦ Sϕ = Id. In particolare, S−1
ϕ = Sϕ .
(iii) Per ϕ 6= ψ ∈ R, si ha Sϕ ◦ Sψ = R2(ϕ−ψ) . In particolare, se ϕ = ψ + k π, k ∈ Z, allora
Sϕ ◦ Sψ = Id.

In altri termini:
• a differenza delle rotazioni attorno all’origine, la composizione di riflessioni non gode della
proprietà commutativa, i.e. in generale si ha Sϕ ◦ Sψ 6= Sψ ◦ Sϕ .
• La composizione di due riflessioni rispetto a rette vettoriali distinte è una rotazione. Il fatto che
una tale composizione venga un’isometria lineare diretta (e non più inversa) è chiaro dal Teorema
di Binet e dal fatto che ogni riflessione rispetto ad una retta vettoriale, essendo un’isometria lineare
inversa, ha determinante −1.

Riflessioni rispetto all’origine: questo sarà un caso particolare di quanto discusso prima.

Definizione 0.8.3. Denotiamo con S0 l’applicazione lineare di R2 in sè che ad un arbitrario


vettore x associa il vettore −x. S0 è detta riflessione rispetto al vettore nullo.

È chiaro dalla definizione che S0 non è altro che la rotazione attorno al vettore nullo, di angolo
θ = π. Pertanto, S0 è una trasformazione ortogonale speciale (come tutte le rotazioni), quindi
0.9. TRASFORMAZIONI ORTOGONALI DI R3 xxxiii

conserva l’orientazione di basi dello spazio vettoriale R2 , come ciascuna rotazione fa. Inoltre, le
sue equazioni sono chiaramente:
    
x1 −1 0 x1
S0 = . (21)
x2 0 −1 x2

0.9 Alcune trasformazioni ortogonali fondamentali dello spazio vet-


toriale euclideo R3 standard
Come nel paragrafo precedente, qui consideriamo R3 come spazio vettoriale euclideo, munito di
base canonica e e prodotto scalare standard.

Equazioni di rotazioni attorno a rette vettoriali: come fatto per R2 , cominciamo con il le
rotazioni attorno ad una retta vettoriale. Diamo la seguente:

Definizione 0.9.1. Sia θ ∈ R. Denotiamo con Rθ = Rθ,e1 l’applicazione di R3 in sè che ad


un arbitrario vettore x ∈ R3 associa il vettore y ottenuto ruotando il vettore x di un angolo θ
attorno al vettore e1 della base canonica e. Rθ si chiama rotazione di angolo θ attorno alla retta
vettoriale (orientata) Span(e1 ).
 
x1
Proposizione 0.9.1. Sia x = x2  ∈ R3 arbitrario. Allora
x3
    
x1 1 0 0 x1
Rθ x2  =  0 cos θ − sin θ  x2  . (22)
x3 0 sin θ cos θ x3
 
y1
In particolare, se y = Rθ (x) = y2 , le equazioni per la rotazione Rθ sono date da:

y3

 y1 = x1
y2 = cos θ x2 − sin θ x3 (23)
y3 = sin θ x2 + cos θ x3 .

In particolare,
• se θ = 0, allora Rθ = Id;
• se θ > 0, la rotazione indotta sul piano vettoriale (x2 , x3 ) è in senso antiorario rispetto al
vettore e2 ;
• se θ < 0, la rotazione indotta sul piano vettoriale (x2 , x3 ) è in senso orario rispetto al vettore
e2 .
xxxiv MATRICI ORTOGONALI

Dimostrazione. Osserviamo che la rotazione Rθ per costruzione fissa il vettore e1 della base e,
mentre sul piano vettoriale (x2 , x3 ) si comporta come una rotazione di R2 attorno al vettore nullo.
Pertanto, le formule precedenti discendono immediatamente da questa osservazione e dalla di-
mostrazione di Proposizione 0.8.1.

Abbiamo le ovvie conseguenze della precedente proposizione, le cui dimostrazioni sono iden-
tiche a quelle svolte per le rotazioni in R2 attorno all’orgine.
Corollario 0.9.2. Per ogni θ ∈ R, le rotazioni Rθ attorno al vettore e1 sono trasformazioni (od
operatori)di angolo θ la cui matrice rappresentativa come in (22) è speciale ortogonale.
Osservazione 0.9.1. Da quanto dimostrato in Proposizione 0.7.1 e dal Corollario 0.9.2-(ii), noti-
amo subito che le rotazioni Rθ attorno a e1 in particolare conservano l’orientazione di basi dello
spazio vettoriale R3 , i.e. Or(u, v, w) = Or(Rθ (u), Rθ (v), Rθ (w)), per ogni terna di vettori lin-
earmente indipendenti u, v, w di R3 e per ogni θ ∈ R.
Proposizione 0.9.3. (i) Per θ, ϕ ∈ R, si ha Rθ ◦ Rϕ = Rϕ ◦ Rθ = Rθ+ϕ .
(ii) Per ogni θ ∈ R, R−1
θ = R−θ .

In particolare, osserviamo che la composizione di rotazioni attorno a e1 è ancora una rotazione


attorno a e1 e l’inversa di una rotazione attorno a e1 è una rotazione attorno a e1 .

Non tutte le rotazioni lineari coinvolte in possibili problemi di geometria in R3 saranno neces-
sariamente attorno al vettore e1 . Vogliamo quindi determinare le formule di rotazione attorno ad
una retta vettoriale qualsiasi utilizzando quanto dimostrato in Proposizione 0.9.1.
Supponiamo dunque di avere una retta vettoriale r di R3 ; vogliamo determinare le formule
della rotazione di angolo θ attorno a r. Prima di tutto, affinchè il problema sia ben posto, dobbiamo
avere un’orientazione di retta r: se r non è orientata, non è chiaro in quale direzione si deve fare la
rotazione nel piano vettoriale r⊥ . Pertanto, fissiamo su r un vettore direttore v. Per fissare il senso
della rotazione parleremo quindi di rotazione di angolo θ attorno al vettore v e la denoteremo
con Rθ,v . Un modo naturale per ottenere le formule di una tale rotazione è descritta nel seguente
procedimento.
v
(1) In primo luogo, sia f 1 il versore direttore di r associato a v, i.e. f 1 = ||v|| . Scegliamo poi due
altri versori f 2 e f 3 , di modo che f := f 1 , f 2 , f 3 sia una base ortonormale di R3 ed equiorientata
con la base canonica e (cf. Definizione 0.7.2-(i)). Trovare una tale base f è molto semplice:
• il secondo versore f 2 di f si determina prendendo un qualsiasi vettore non nullo w scelto ad
arbitrio tra tutti quei vettori di R3 ortogonali a v e poi si considera il versore associato a w, i.e.
w
f 2 = ||w|| ;
• il terzo ed ultimo versore di f è dato direttamente da f 3 = f 1 ∧f 2 , ove ∧ e’ il prodotto vettoriale
in R3 . Notiamo quindi che basi siffatte possono essere scelte in infiniti modi.
 
y1
(2) Siano ora y2  le coordinate di un arbitrario vettore x di R3 espresse rispetto alla base f

y3
precedentemente determinata. In tale base, la rotazione Rθ,v è la rotazione di angolo θ attorno a
0.9. TRASFORMAZIONI ORTOGONALI DI R3 xxxv

f 1 . Quindi, nelle notazioni di Proposizione 0.9.1, questa non è altro che la rotazione Rfθ = Rfθ,f ,
1
dove l’apice in alto sta a ricordare che stiamo vedendo tutto relativamente alla base f . Abbiamo
quindi da Proposizione 0.9.1:
    
y1 1 0 0 y1
f  
Rθ y2 =  0 cos θ − sin θ   y2  . (24)
y3 0 sin θ cos θ y3
 
1 0 0
In altre parole, la matrice rappresentativa di Rθ,v in base f è Af :=  0 cos θ − sin θ .
0 sin θ cos θ
(3) L’obiettivo finale è quello di determinare la matrice A := Ae della rotazione cercata, espressa
rispetto alla base e di partenza. Per fare questo, sia M := Me f la matrice cambiamento di base
dalla base e alla base f . Poiché e ed f sono ambedue basi ortonormali, da Teorema 0.5.5, M è
una matrice 3 × 3 ortogonale, i.e. t M M = I3 (cf. Definizione 0.5.2). Sia
   
x1 y1
x = (e1 e2 e3 ) x2  = (f 1 f 2 f 3 ) y2 
x3 y3

un vettore arbitrario di R3 espresso nelle sue coordinate sia rispetto alla base e che alla base f , e
sia    
x1 y1
z = Rθ,v (x) = (e1 e2 e3 )(A x2 ) = (f 1 f 2 f 3 )(Af y2 )
x3 y3
il vettore trasformato mediante la rotazione considerata, espresso nei diversi sistemi di coordinate.
Ricordiamo che, per definizione di M = Me f si ha

(e1 e2 e3 )M = (f 1 f 2 f 3 ).

Pertanto, dalla precedente eguaglianza vettoriale abbiamo:


   
x1 y1
z = Rθ,v (x) = (e1 e2 e3 )(A x2 ) = (e1 e2 e3 )M (Af y2 ). (25)
x3 y3
   
x1 y1
Poiché x2  è la colonna delle coordinate del vettore x rispetto ad e e y2  è la colonna delle
x3 y3
coordinate del medesimo vettore rispetto ad f , dalla formula del cambiamento di coordinate e
dalla definizione di matrice cambiamento di base M = Me f , abbiamo
     
y1 x1 x1
y2  = M −1 x2  = t M x2  ,
y3 x3 x3
xxxvi MATRICI ORTOGONALI

dato che M −1 = t M visto che M e’ ortogonale. Da (25), otteniamo quindi l’eguaglianza


      
x1 x1
f t
(e1 e2 e3 ) A x2
   = (e1 e2 e3 )M A
 M x2  ,
 (26)
x3 x3

valida per ogni x ∈ R3 . Pertanto, (26) induce la seguente equaglianza fra matrici:

A = M Af tM, (27)

che determina l’espressione della matrice di rotazione Rθ,v in base e come voluto.
Osservazione 0.9.2. La relazione 27 dipende anche dal fatto che rappresentiamo l’operatore ro-
tazione in due basi differenti entrambi ortogonali
Utilizzando Corollario 0.9.2 e Proposizione 0.9.3, abbiamo il seguente risultato immediato:
Corollario 0.9.4. Per ogni θ ∈ R, le rotazioni Rθ,v di angolo θ attorno ad una qualsiasi retta
vettoriale orientata r = Span(v) sono operatori la cui matrice rappresentativa e’ ortogonale
speciale. In particolare, tali rotazioni conservano l’orientazione di basi dello spazio vettoriale R3
e godono delle seguenti proprietà:
(i) Se θ = 0, allora R0,v = Id;
(ii) Per θ, ϕ ∈ R, si ha Rθ,v ◦ Rϕ,v = Rϕ,v ◦ Rθ,v = Rθ+ϕ,v .
(iii) Per ogni θ ∈ R, R−1
θ,v = R−θ,v .

Dimostrazione. Notiamo che, da (27), per il Teorema di Binet, si ha

det A = (det M ) (det Af ) (det tM ) = (det M ) (det Af ) (det M )−1 = det Af ,

dove la penultima eguaglianza discende direttamente dal fatto che M è ortogonale e dalla proprietà
del determinante della matrice inversa. Pertanto, per concludere basta applicare Corollario 0.9.2,
Osservazione 0.9.1 e Proposizione 0.9.3.

Esempio 0.9.1. A titolo di esempio, scriviamo le formule di rotazione R π2 ,v di angolo π2 attorno


 
1
al vettore v =  1 . Da quanto descritto sopra, vogliamo determinare f = f 1 , f 2 , f 3 una
1
 √ 
1/√3
base ortonormale di R3 positivamente orientata e con f 1 = v/||v|| =  1/√3 . Per prendere
1/ 3
un vettore w ortogonale a f 1 , notiamo ad esempio che le coordinate di f 1 sono tutte uguali;
 
1
perciò una scelta possibile e naturale è prendere w =  −1 , almeno avremo sicuramente
0
0.9. TRASFORMAZIONI ORTOGONALI DI R3 xxxvii
 √   √ 
1/ √2 1/√6
hf 1 , wi = 0. Con tale scelta, abbiamo f 2 =  −1/ 2 , f 3 = f 1 ∧ f 2 =  1/ √6 . In
0 −2/ 6
 
1 0 0
base f , la matrice della rotazione Rπ/2,v è Af =  0 0 −1 . Percio’, visto che M = Me f
0 1 0
ha come  √colonne le coordinate
√ dei
√  vettori della base f espresse in funzione della base e, si ha
1/√3 1/ √2 1/√6
M =  1/√3 −1/ 2 1/ √6  , che è una matrice ortogonale. Pertanto, la matrice della
1/ 3 0 −2/ 6
rotazione Rπ/2,v in base e è:
 √ √ 
1/3 (1 − 3)/3 (1 +√ 3)/3
A = M Af t
M = 1/3
√ 1/3
√ − 3/3  .
(1 − 3)/3 (1 + 3)/3 1/3

Riflessioni rispetto a rette vettoriali: consideriamo adesso le riflessioni (o simmetrie) rispetto a


rette vettoriali.
Definizione 0.9.2. Sia r una retta vettoriale di R3 . Denotiamo con Sr,0 l’applicazione lineare di
R3 che ad un arbitrario vettore x ∈ R3 associa il vettore y ottenuto per riflessione di x rispetto a
r.
Notiamo subito che la riflessione rispetto ad una retta vettoriale r è un particolare tipo di rotazione
lineare, precisamente è la rotazione di angolo π intorno a r. In questo caso, è immediato osservare
che il risultato non dipende dall’orientazione di r.
Da ultimo, per ogni retta vettoriale r, Sr,0 conserva l’orientazione di basi di R3 .

Riflessioni rispetto all’origine:


Definizione 0.9.3. Denotiamo con S0 l’applicazione lineare di R3 in sè definita in modo che, ad
ogni x ∈ R3 si associa il vettore −x. S0 è detta riflessione rispetto all’origine.
Le equazioni di questa riflessione sono chiaramente:
      
x1 −1 0 0 x1 −x1
S0 x2  =  0 −1 0  x2  = −x2  . (28)
x3 0 0 −1 x3 −x3

Pertanto, S0 non conserva l’orientazione di basi dello spazio vettoriale R3 .


Matrici simmetriche ed operatori
autoaggiunti

In questo capitolo studiamo alcune proprietà fondamentali delle matrici simmetriche definite su
uno spazio vettoriale euclideo V . Assoceremo a tali matrici degli opportuni operatori lineari su
V , detti operatori autoaggiunti. Questo permetterà di dimostrare due risultati fondamentali (cf.
Teoremi 0.11.1 e 0.12.2): il primo stabilisce che le matrici simmetriche ammettono sempre spettro
reale, il secondo assicura che tali matrici sono sempre diagonalizzabili su R e che la diagonaliz-
zazione avviene in una base ortonormale per V .

0.10 Operatori autoaggiunti e matrici simmetriche


Definizione 0.10.1. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n. Sia F un o-
peratore lineare su V . Allora, F si dice operatore autoaggiunto (rispetto a h , i) se, per ogni
x, y ∈ V , vale:
hF (x), yi = hx, F (y)i. (29)
A volte un tale operatore viene chiamato anche operatore simmetrico, per via della simmetria in
(29). Tuttavia, come vedremo in seguito (cf. Esempio 0.10.1), il termine simmetrico potrebbe
generare confusione. Pertanto, in tale testo preferiamo utilizzare la terminologia di opertatore
autoaggiunto.
Come per gli operatori ortogonali, vogliamo stabilire come si rappresentano gli operatori autoag-
giunti rispetto ad opportune basi. Per fare questo, dobbiamo considerare alcune questioni prelim-
inari.
Ricordando Lemma 0.5.4 e Corollario 0.6.2, possiamo stabilire come si presentano gli opera-
tori autoaggiunti in opportune basi.
Proposizione 0.10.1. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n e sia F un
opertatore autoaggiunto.
(i) Sia f una qualsiasi base ortonormale di (V, h, i). Sia A = Mf (F ). Allora A è una matrice
simmetrica, i.e. A = t A.
(ii) Se f ′ è un’altra base ortonormale, sia B = Mf ′ (F ). Allora, B è essa stessa una matrice sim-
metrica, che è inoltre congruente ad A. Precisamente, se M = Mf f ′ è la matrice cambiamento
di base da f a f ′ , allora B = tM AM .

xxxix
xl MATRICI SIMMETRICHE

Dimostrazione. (i) Sia f j un qualsiasi vettore della base f , 1 ≤ j ≤ n. Se A = (aij ), 1 ≤ i, j ≤


n, abbiamo per definizione che

F (f j ) = a1j f 1 + a2j f 2 + . . . + anj f n , ∀ 1 ≤ j ≤ n. (30)

Il fatto che f è ortonormale, determina Bf (h , i) = In (cf. Proposizione 0.5.1). Pertanto, da (30)


vediamo subito che

hF (f j ), f i i = haij f i , f i i = aij , ∀ 1 ≤ i, j ≤ n.

D’altra parte, sempre da (30) dove utilizziamo l’indice i al posto dell’indice j, abbiamo

hf j , F (f i )i = hf j , aji f j i = aji ∀ 1 ≤ i, j ≤ n.

Dalla condizione (29) che stabilisce che F è autoaggiunto, abbiamo quindi che aij = aji , ∀ 1 ≤
i, j ≤ n. Pertanto A è simmetrica.
(ii) Poiché la base f ′ è ortonormale, per (i) B = Mf ′ (F ) è simmetrica. Ora, dato che A e B sono
due matrici (simmetriche) che rappresentano lo stesso operatore F in due basi diverse, allora esse
sono coniugate mediante la matrice cambiamento di base M := Mf f ′ , i.e. vale B = M −1 AM .
Poiché f e f ′ sono inoltre ortonormali, da Teorema 0.5.5 M è una matrice ortogonale. Pertanto,
da Corollario 0.6.2, B = t M AM , i.e. A e B sono congruenti per mezzo di M .

Osservazione 0.10.1. Notiamo che il fatto che B sia simmetrica discende automaticamente dalla
relazione di congruenza tra A e B e dal fatto che A è simmetrica; infatti abbiamo:
t
B = t ( t M AM ) = t M t A t ( t M ) = t M t A t ( t M ) = t M AM = B. (31)

Osservazione 0.10.2. Possiamo invertire la corrispondenza precedentemente descritta. Infatti,


se A è una matrice simmetrica di ordine n, possiamo considerare A come la matrice associata
ad un operatore autoaggiunto in un’opportuna base ortonormale f di (V, h , i), che determina
l’identificazione dello spazio vettoriale euclideo V con Rn . Tale operatore autoaggiunto F = FAf
sarà definito estendendo per linearità le relazioni (30) valide per i versori della base ortonormale
f . In altri termini, parlare di operatori autoaggiunti su V , spazio euclideo di dimensione n, o di
matrici simmetriche reali di ordine n, relativamente a basi ortonormali di V , sono cose equiva-
lenti. Inoltre, poiché l’operatore cosı̀ determinato è autoaggiunto, da Proposizione 0.10.1-(ii), in
differenti basi dovrà valere la relazione di congruenza fra le varie matrici rappresentative.
In particolare, abbiamo dimostrato quindi:
Corollario 0.10.2. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n.
(i) Un operatore F su V è autoaggiunto se, e solo se, la matrice rappresentativa di F in ciascuna
base ortonormale di V è una matrice simmetrica.
(ii) Due matrici simmetriche A e B, n × n, rappresentano lo stesso operatore autoaggiunto
rispetto a due diverse basi ortonormali di V se, e solo se, sono congruenti.
0.11. AUTOVALORI DI UNA MATRICE SIMMETRICA xli

Il rango dell’operatore autoaggiunto F è il rango della matrice simmetrica A = Mf (F ) che lo


rappresenta in una qualsiasi base ortonormale f di V .
Osserviamo che Proposizione 0.10.1 e quanto discusso in Osservazione 0.10.2 valgono sotto
le ipotesi che la base f sia ortonormale. Precisamente, non è vero in generale che un operatore
autoaggiunto ha, in ciascuna possibile base di V , una matrice rappresentativa che è simmetrica.
Viceversa, non è vero che una matrice simmetrica rappresenti, in ciascuna base di Rn , un operatore
autoaggiunto. Vediamo i seguenti esempi.
Esempio 0.10.1. Sia R2 lo spazio vettoriale euclideo, con prodotto scalare h , i standard
 come
 in
1 2
Esempio 0.2.2 e con base canonica e come base ortonormale fissata. Sia A := . Tale
2 1
matrice definisce l’operatore F = FAe che, in base e, è determinato dalle condizioni

F (e1 ) = e1 + 2e2 , F (e2 ) = 2e1 + e2 .

Tale operatore è definito su tutto lo spazio vettoriale R2 per le proprietà di linearità di F . Da


Osservazione 0.10.2, poiché A è simmetrica ed e è ortonormale, l’operatore F è  autoaggiunto.
  Sia

1 2
ora g la base data dai vettori g 1 e g 2 , le cui coordinate rispetto ad e sono g 1 = , g2 = .
1 1
La base g è manifestamente non ortonormale. Pertanto, se denotiamo con M = Me g la matrice
cambiamento di base da e a g, l’operatore autoaggiunto F ha in base g matrice rappresentativa
     
−1 −1 2 1 2 1 2 3 6
B = M AM = =
1 −1 2 1 1 1 0 −1

che non è simmetrica.


Esempio 0.10.2. Sia R2 lo spazio vettoriale euclideo munito di prodotto scalare standard, con
base canonica e fissata. Sia g la base definita in Esempio 0.10.1. Sia S l’operatore di R2 definito
in base g dalle condizioni S(g 1 ) = g 1 + g 2 , S(g 2 ) = g 1 − g 2 . In base g, l’operatore S ha matrice
 
1 1
rappresentativa C := Mg (S) = , che è simmetrica. Però, S non è un operatore
1 −1
autoaggiunto. Infatti

hS(g 1 ), g 2 i = hg 1 , g 2 i + hg 2 , g 2 i, e hg 1 , S(g 2 )i = hg 1 , g 1 i − hg 1 , g 2 i;

utilizzando le coordinate dei vettori di g rispetto ad e, notiamo che hS(g 1 ), g 2 i = 8 6= hg 1 , S(g 2 )i =


−1. Si può verificare (lasciamo il compito al lettore) che in effetti Me (S) non è simmetrica, come
ci si doveva aspettare da Corollario 0.10.2.

0.11 Autovalori di una matrice simmetrica


Abbiamo visto in § 0.6 che le matrici ortogonali possono non ammettere autovalori reali (in par-
ticolare possono non essere diagonalizzabili). In questo paragrafo dimostriamo che una tale si-
tuazione non capita mai per gli autovalori di matrici simmetriche. Precisamente, dimostreremo
xlii MATRICI SIMMETRICHE

che una qualsiasi matrice simmetrica n × n ha esclusivamente autovalori reali. Questo avrà con-
seguenze fondamentali sugli operatori autoaggiunti in uno spazio vettoriale euclideo (cf. § 0.12).
Una breve nota su come sarà organizzato questo paragrafo. Per le conseguenze sugli opera-
tori autoaggiunti in uno spazio euclideo di dimensione n, avremo bisogno di dimostrare che una
qualsiasi matrice simmetrica n × n ammette esclusivamente autovalori reali, per ogni n ≥ 1. Il
modo più breve per dimostrare questo risultato utilizza i numeri complessi (cf. Teorema 0.11.1).
Invece, per n ≤ 3 intero positivo, si possono utilizzare tecniche più elementari, che non ricorrono
ad i numeri complessi. Pertanto, per facilitare il lettore eventualmente poco avvezzo ad i numeri
complessi, in Teorema 0.11.2 tratteremo per via elementare i casi particolari con n ≤ 3.
Teorema 0.11.1. Sia n ≥ 1 un intero. Sia A una matrice simmetrica n × n. Allora A ha
esclusivamente autovalori reali.

Dimostrazione. Se n = 1, non c’è nulla da dimostrare. Pertanto, assumiamo d’ora in poi n >
1. Se A è la matrice nulla, essa ha tutti gli autovalori uguali a zero, i.e. 0 è un autovalore di
molteplicità algebrica n. Assumiamo quindi che A sia una matrice non identicamente nulla.
Sia T un’indeterminata e sia

P (T ) = PA (T ) = an T n + an−1 T n−1 + · · · + a1 T + a0

il polinomio caratteristico di A, con an = ±1 e aj ∈ R opportuni, per 0 ≤ j ≤ n − 1. Tale


polinomio è non nullo ed a coefficienti reali perché A è una matrice reale, non nulla.
Ora, sia C l’insieme dei numeri complessi. È ben noto che R ⊂ C. Pertanto il polinomio P (T ) si
può vedere come un particolare polinomio a coefficienti complessi: precisamente i coefficienti di
tale polinomio sono tutti numeri complessi della forma cj := aj + i · 0, dove i l’unità immaginaria;
in altri termini i cj hanno parte immaginaria nulla, per ogni 0 ≤ j ≤ n. Ricordiamo che per
C vale il Teorema fondamentale dell’Algebra, i.e. ogni polinomio in una indeterminata T ed a
coefficienti in C ha tutte le sue radici in C. Pertanto, il polinomio P (T ) ha sicuramente tutte le
sue radici in C. Si tratta di dimostrare che, per ogni radice λ di P (T ), si ha λ ∈ R.
Come fatto per il polinomio caratteristico, possiamo considerare la matrice A come una par-
ticolare matrice n × n su C: gli elementi della matrice A sono particolari numeri complessi che
hanno la parte immaginaria nulla, dato che per ipotesi A era una matrice reale. In tal modo, pos-
siamo considerare F = FA l’operatore lineare sullo spazio vettoriale complesso Cn associato alla
matrice A rispetto alla base canonica eC di Cn . Poiché λ è un autovalore di A, e quindi di F ,
esiste un autovettore z ∈ Cn di F tale che F (z) = Az = λz. Moltiplichiamo a sinistra l’ultima
eguaglianza per t z, dove z è il vettore coniugato di z, i.e. il vettore le cui coordinate rispetto ad
eC sono le coordinate coniugate di quelle di z (ricordiamo che il coniugato a + i · b del numero
complesso a + i · b è il numero complesso a − i · b). Si ha pertanto
t
zAz = t zλz = λ t z z.
 
z1
·
Se, rispetto ad eC , abbiamo coordinate z = 
 · , dove zj = aj +i·bj , aj , bj ∈ R per 1 ≤ j ≤ n,

zn
0.11. AUTOVALORI DI UNA MATRICE SIMMETRICA xliii

allora
n
X n
X
t
z z= z j zj = (a2j + b2j ) ∈ R \ {0},
j=1 j=1

per ogni z ∈ Cn . Perciò, poiché


t zAz
λ= tz
,
z
è sufficiente dimostrare che anche t zAz ∈ R. Ricordiamo che un numero complesso a + i · b è
reale se, e solo se, a + i · b = a + i · b e che il coniugio di numeri complessi è involutorio, i.e.
a + i · b = a + i · b. Perciò, poiché A è una matrice reale e simmetrica, si ha:
t zAz = t zAz = t z tAz = t ( t zAz) = t zAz

dove l’ultima eguaglianza discende dal fatto che, essendo t zAz uno scalare, l’operazione di
trasposizione opera come l’identità.

Osservazione 0.11.1. Se A è una matrice simmetrica n × n, il suo polinomio caratteristico PA (T )


è un polinomio di grado n. Se λ1 , . . . λk , k ≤ n, sono tutti gli autovalori distinti di A il precedente
risultato afferma che
Xk
n= a(λi ).
i=1

Pertanto, PA (T ) ha n radici distinte se, e solo se, tutti gli autovalori di A sono semplici.
Esempio 0.11.1. Consideriamo la matrice simmetrica
 
0 0 2
A =  0 2 0 .
2 0 0

Il polinomio caratteristico di A è PA (T ) = (2 − T )(T 2 − 4). Vediamo subito che A ha tutti


autovalori reali: l’autovalore λ1 = 2 è semplice mentre l’autovalore λ2 = −2 è di molteplicità
algebrica 2. Pertanto, il numero di autovalori distinti di A è k = 2, ma se ciascuno di essi viene
contato con la relativa molteplicità algebrica otteniamo che il numero delle radici (non distinte) di
Pa (T ) è 3, come il grado di PA (T ).
Come specificato all’inizio di questo paragrafo il precedente risultato, per i casi 2 ≤ n ≤ 3, si può
dimostrare con tecniche più elementari e senza invocare i numeri complessi.
Teorema 0.11.2. Sia n ≤ 3 un intero positivo. Sia A una matrice simmetrica n × n reale. Allora
A ha esclusivamente autovalori reali.

Dimostrazione. Se n = 1 non c’è nulla da dimostrare. Pertanto, assumiamo d’ora in poi 2 ≤


n ≤ 3. Se A è la matrice nulla, essa ha tutti gli autovalori uguali a zero, i.e. 0 è un autova-
lore di molteplicità algebrica n, con n = 2 o 3. Assumiamo quindi che A sia una matrice non
identicamente nulla.
xliv MATRICI SIMMETRICHE

• Vediamo prima
 il cason = 2. Dalle ipotesi su A, esistono a, b, c ∈ R, con (a, b, c) 6= (0, 0, 0),
a b
tali che A = . Il polinomio caratteristico è PA (T ) = T 2 − (a + c)T − (b2 − ac).
b c
Notiamo subito che, il discriminante dell’equazione di secondo grado data da PA (t) = 0 e’

∆ = (a + c)2 + 4(b2 − ac) = a2 + c2 + 2ac + 4b2 − 4ac = (a − c)2 + 4b2 .

L’unica possibilità per avere ∆ = 0 è b = a − c = 0: in tal caso, necessariamente si deve avere


a 6= 0; ma allora A = aI2 , che pertanto ha due autovalori reali e coincidenti.
In tutti gli altri casi si ha necessariamente ∆ > 0, dato che ∆ è somma di due quadrati dove
almeno uno tra a − c e b è diverso da zero. In tale eventualità, PA (T ) ha due soluzioni reali e
distinte.
• Supponiamo ora n = 3. Data A simmetrica non nulla 3 × 3, il suo polinomio caratteristico
ha grado tre. È ben noto che un qualsiasi polinomio cubico ammette almeno una radice reale.
Pertanto, nella nostra situazione, A ammette almeno un autovalore reale λ. Sia v un autovettore
v
di A relativamente a λ. Sia ev il versore ad esso associato, i.e. ev = ||v|| .
Sia ora v ⊥ il complemento ortogonale in R3 della retta vettoriale Span(v). Prendiamo una qualsi-
asi base ortonormale di v ⊥ , sia essa b = f , f ′ . Pertanto, g := ev , f , f ′ è una base ortonormale per
R3 . Sia M = Me g la matrice cambiamento di base dalla base canonica e a g. Poiché e e g sono
basi ortonormali, M è ortogonale. Pertanto, in base g la matrice A si trasforma in B = t M AM
che è quindi una matrice simmetrica (cf. e.g. (31)).
 
λ x y
Il fatto che ev è un autovettore di A relativo all’autovalore λ implica che B =  0 a b ,
0 d c
con x, y, a, b, c, d ∈ R. Poiché però, per quanto osservato, B deve essere simmetrica allora neces-
sariamente x = y = 0 e b = d, i.e. B è della forma
 
λ 0 0
B =  0 a b .
0 b c

Ricordiamo che il polinomio caratteristico di una matrice è invariante per la relazione di simili-
tudine (equiv. coniugio). Poiché e e g sono basi ortonormali, da Corollario 0.6.2, in tal caso il
polinomio caratteristico è invariante pure rispetto alla congruenza tra A e B, quindi

PA (T ) = PB (T ) = (λ − T ) (T 2 − (a + c)T − (b2 − ac)).

Dalla fattorizzazione precedente del polinomio, vediamo che il fattore lineare (λ − T ) fornisce la
radice λ ∈ R considerata in precedenza, per il fattore quadratico si ragiona esattamente come nel
caso n = 2, discusso in precedenza. In particolare, anche per n = 3, tutti gli autovalori di A sono
reali.
0.12. TEOREMA SPETTRALE DEGLI OPERATORI AUTOAGGIUNTI xlv

0.12 Teorema spettrale degli operatori autoaggiunti


In questo paragrafo consideriamo il problema dell’esistenza di basi diagonalizzanti per operatori
autoaggiunti in uno spazio vettoriale euclideo (V, h , i). Ricordiamo che queste basi diagonaliz-
zanti sono basi in cui la matrice associata all’operatore autoaggiunto sarà una matrice diagonale.
Abbiamo bisogno preliminarmente del seguente:
Lemma 0.12.1. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n ≥ 1. Sia F un
operatore autoaggiunto su V e sia u un suo autovettore, relativo ad un autovalore λ ∈ R. Allora,
denotato con u⊥ il complemento ortogonale in V di Span(u), si ha:

F (u⊥ ) ⊆ u⊥ . (32)

Dimostrazione. Per ipotesi, F (u) = λu. Per ogni v ∈ u⊥ , poiché F è autoaggiunto, si ha


hF (v), ui = hv, F (u)i = hv, λui = λ hv, ui = 0, cioè F (v) ∈ u⊥ .

Possiamo finalmente dimostrare il seguente:


Teorema 0.12.2. (Teorema spettrale degli operatori autoaggiunti) Sia (V, h , i) uno spazio
vettoriale euclideo di dimensione n ≥ 1. Sia F un operatore autoaggiunto su V . Allora esiste
una base f , ortonormale per V , che è costituita da autovettori di F .

Dimostrazione. Si procede per induzione su n = dim V . Se n = 1, non c’è nulla da dimostrare:


un qualsiasi f ∈ R tale che f = ±1 è la base voluta.
Supponiamo n ≥ 2 e assumiamo vero l’asserto per n − 1. Se F è l’operatore nullo, non c’è niente
da dimostrare perché la sua matrice associata è la matrice nulla. Sia pertanto F non identicamente
nullo. Sia e una qualsiasi base ortonormale per V . Poiché F è autoaggiunto, da Proposizione
0.10.1, A := Me (F ) è una matrice simmetrica. Da Teorema 0.11.1, la matrice A ha tutti autovalori
reali. Gli autovalori dell’operatore F coincidono con quelli di A, quindi sono tutti reali. Sia λ1
uno di tali autovalori e sia f 1 un autovettore ad esso associato. A meno di normalizzare, si può
supporre che ||f 1 || = 1.
Osserviamo che, con notazioni come in Lemma 0.12.1, f ⊥ 1
è un sottospazio vettoriale di V di
⊥ ⊥
dimensione n − 1. In base a (32), F (f 1 ) ⊆ f 1 , cioè la restrizione dell’operatore F al sottospazio
f⊥1
definisce un operatore F1 : f ⊥ 1
→ f⊥ 1
che è ovviamente ancora autoaggiunto, in quanto
F1 = F |f ⊥ , quindi esso agisce come F sui vettori di f ⊥ 1
.
1
Per ipotesi induttiva, esiste una base ortonormale di f ⊥ 1
che è costituita da autovettori di F1 .
Denotiamo tale base con f 2 , . . . , f n . Per come è costruito il tutto, f := f 1 , f 2 , . . . , f n è una base
ortonormale di V perché i vettori sono a due a due ortogonali fra loro e ciascuno di norma unitaria.
Inoltre essi sono, per costruzione, tutti autovettori di F .

Osservazione 0.12.1. Il termine spettrale è collegato allo spettro dell’operatore lineare F . Il


precedente teorema determina delle condizioni più forti di quelle discusse in Osservazione 0.11.1.
Infatti, dato F autoaggiunto, fissiamo una base ortonormale per V , sia essa e. Otteniamo una
xlvi MATRICI SIMMETRICHE

matrice simmetrica A = Me (F ) di ordine n. Per il Teorema 0.11.1, A ammette tutti autovalori


reali, ciascuno contato con la propria molteplicità algebrica; il precedente risultato ci assicura
inoltre che, per ogni autovalore λ di A, a(λ) = g(λ). Pertanto, A nella base f del Teorema
spettrale si diagonalizza.

Corollario 0.12.3. Sia f una base di V come nella dimostrazione di Teorema 0.12.2. Allora
Mf (F ) è una matrice diagonale D, i cui elementi diagonali sono tutti gli autovalori distinti
λ1 , . . . , λk di F , k ≤ n, e dove ciascun λi comparirà sulla diagonale principale di D tante volte
quanto è la sua molteplicità algebrica (equiv. geometrica), 1 ≤ i ≤ k.

Dimostrazione. Il fatto che la matrice D = Mf (F ) sia diagonale discende direttamente da Teo-


rema 0.12.2. La seconda parte dell’enunciato discende direttamente dalla definizione di base di
autovettori di F e di molteplicità geometrica di un autovalore.

Dal Corollario 0.12.3, abbiamo quindi la seguente:

Definizione 0.12.1. Una siffatta base f di V viene chiamata base ortonormale diagonalizzante
F.

Osservazione 0.12.2. (a) Osserviamo che, nella dimostrazione di Teorema 0.12.2, A e D sono
simili per mezzo della matrice cambiamento di base M = Me f . Poiché però le basi e ed f sono
ortonormali, allora M è ortogonale. In particolare, da Lemma 0.5.4, A e D sono congruenti; in
altri termini la diagonalizzazione di A si ha in una base ortonormale di V ed avviene per mezzo
di una matrice ortogonale M . Per cui, al livello computazionale, per passare da A a D basta
calcolare solo la trasposta di una matrice, che è un calcolo molto più rapido di quello necessario
per determinare una matrice inversa.
(b) Non esiste un Teorema spettrale per gli operatori ortogonali. Ricordiamo infatti che ad esempio
in Osservazione 0.6.1-(c) abbiamo visto operatori ortogonali non diagonalizzabili, poiché privi di
autovalori reali.

Abbiamo diverse formulazioni equivalenti del Teorema spettrale degli operatori autoaggiunti.
Precisamente:

Teorema 0.12.4. (i) Per ogni matrice simmetrica reale A, n × n, esiste una matrice ortogonale
M , n × n, tale che t M AM è diagonale.
(ii) Il rango della matrice simmetrica A come in (i) è uguale al numero di elementi λi non nulli
che sono sulla diagonale principale della matrice D come in Corollario 0.12.3.

Dimostrazione. (i) Se A è simmetrica, da Corollario 0.10.2, essa è la matrice di un operatore


autoaggiunto F = FAe rispetto alla base canonica e di Rn . La conclusione segue direttamente da
Corollario 0.12.3 e da Osservazione 0.12.2.
(ii) Per A, discende direttamente da (i) e dal fatto che il rango è una nozione invariante la relazione
di similitudine e quindi, con matrici ortogonali, anche per congruenza.
0.12. TEOREMA SPETTRALE DEGLI OPERATORI AUTOAGGIUNTI xlvii

Concludiamo osservando che, come diretta conseguenza della dimostrazione di Teorema 0.12.2,
abbiamo il seguente risultato che suggerirà una procedura operativa per determinare una base
ortonormale diagonalizzante come nel Teorema spettrale e quindi la forma precisa della matrice
diagonale D.
Proposizione 0.12.5. Sia (V, h , i) uno spazio vettoriale euclideo di dimensione n ≥ 1 e sia F un
operatore autoaggiunto su V . Se x e y sono due autovettori di F relativi a due autovalori distinti
di F allora x e y sono ortogonali. Ne segue che, gli autospazi di F sono a due a due ortogonali.

Dimostrazione. Sia F (x) = λx e F (y) = µy, con λ 6= µ i relativi autovalori reali. Ora
hF (x), yi = λhx, yi e hx, F (y)i = µhx, yi. Poiché F è autoaggiunto, allora deve valere λhx, yi =
µhx, yi. Dal fatto che λ 6= µ, segue che hx, yi = 0.

Osservazione 0.12.3. Data una matrice simmetrica A n × n (equivalentemente, una forma qua-
dratica Q di ordine n), il precedente risultato fornisce un metodo operativo per calcolare la base f
ortonormale che diagonalizza A e la matrice M che rende A congruente ad una matrice diagonale
D. Questo permetterà inoltre di precisare ulteriormente quanto dimostrato in Corollario 0.12.3. Si
procede nel modo seguente:
(a) Si calcola il polinomio caratteristico di A e tutte le sue radici reali, contate con la relativa
molteplicità algebrica;
(b) Si sceglie una fra queste radici come primo autovalore di A; sia esso λ1 e sia a(λ1 ) la sua
molteplicità algebrica. L’autospazio Vλ1 ha anche esso dimensione a(λ1 ) (cf. Osservazione
0.12.1). Determiniamo le equazioni che rappresentano Vλ1 considerando le equazioni che rap-
presentano il sottospazio Ker (A − λ1 In ), i.e. risolviamo il sistema lineare omogeneo scritto in
forma vettoriale (A − λ1 In )X = 0.
(c) Scegliamo una qualsiasi base per Vλ1 e la ortonormalizziamo mediante il procedimento di
Gram-Schmidt applicato nel sottospazio Vλ1 (cf. Teorema 0.4.4). Otteniamo una base ortonormale
per Vλ1 della forma f λ1 1 , . . . , f λa(λ
1
)
.
1
(d) Tra gli autovalori residui di A (i.e. distinti da λ1 ) ne prendiamo un secondo, sia esso λ2 di
molteplicità algebrica a(λ2 ). Per esso, ripercorriamo i punti (b) e (c). Alla fine, otteniamo una
base ortonormale per Vλ2 della forma f λ1 2 , . . . , f λa(λ
2
2)
(e) Procedendo cosı̀ come in (b), (c) e (d) per tutti gli autovalori distinti di A, esauriamo il calcolo
di tutti gli autospazi di A, Vλ1 , Vλ2 , . . ., Vλk , per qualche k ≤ n, e di tutte le loro rispettive basi
ortonormali calcolate come nel punto (c).
(f) L’unione della base ortonormale di Vλ1 , di quella di Vλ2 , . . ., di quella di Vλk determina una
base ortonormale

f := f λ1 1 , . . . , f λa(λ
1
, f λ2 , . . . , f λa(λ
) 1
2
)
, . . . , f λ1 k , . . . , f λa(λ
k
1 2 k)

come nel Teorema spettrale. Infatti, n = ki=1 a(λi ), quindi f è una base di Rn . Tale base è, per
P
costruzione, di autovettori di A ed inoltre è ortonormale, dato che gli autospazi determinati sono
a due a due ortogonali fra loro (cf. Proposizione 0.12.5) e dato che in ciascun autospazio abbiamo
xlviii MATRICI SIMMETRICHE

usato nel punto (c) il procedimento di Gram-Schmidt per avere una base ortonormale in ciascuno
degli autospazi.
(g) Per costruzione e dalla teoria generale, senza dover quindi fare alcun calcolo, sappiamo che la
matrice A nella base f diventa la matrice D.
(h) Da ultimo, la matrice M che determina la congruenza tra la matrice A e la matrice D come in
(g), i.e. D = tM AM , è la matrice M = Me f cambiamento di base dalla base canonica e alla
base (ordinata) f come nel punto (f).
Esempio 0.12.1. Sia data la matrice simmetrica
 √ 
7√ −5 3
A= .
−5 3 −3
Vogliamo determinare esplicitamente una base ortonormale di autovettori di A data dal Teorema
spettrale per portare A in forma diagonale. Notiamo che il polinomio caratteristico di A è

PA (T ) = det (A − T I) = T 2 − 4T − 96.

Le soluzioni di PA (T ) = 0 sono λ1 = 12 e λ2 = −8. L’autovettore, relativo al primo autovalore


λ1 = 12, si determina considerando il sistema
 √
−5α√ − 5 3β = 0
−5 3α − 15β = 0
√ 
3
che fornisce l’autovettore v = , le cui coordinate sono espresse rispetto alla base canonica
−1
e. Poiché λ2 6= λ1 , da Proposizione 0.12.5, l’autovettore relativo all’altro autovalore λ2 = −8
è sicuramente ortogonale a v. Quindi, senza bisogno di calcolare direttamente l’autospazio V−8 ,
basta prendere un qualsiasi vettore w ortogonale a v: questo sarà automaticamente un generatore
di V−8 . La base ortonormale di R2 costituita da autovettori di A è ad esempio la base f formata
da √   
v 3/2 −1/2

f1 = = , f2 = .
||v|| −1/2 3/2
La matrice cambiamento di base M = Me f è pertanto
 √ 
3/2 √1/2
M := ,
−1/2 3/2
che è una matrice ovviamente ortogonale. Dalla teoria generale, senza dover fare necessariamente
il calcolo fra matrici, in base f la matrice A sarà congruente per mezzo di M alla matrice
 
12 0
D := ,
0 −8
dato che il primo versore di f era stato scelto a partire dall’autovettore relativo a λ1 = 12 ed il
secondo versore di f a partire dall’autovettore relativo a λ1 = −8.
SPAZI VETTORIALI QUOZIENTI. DUALI

FLAMINIO FLAMINI

1. Esercizi Svolti
Esercizio 1 Sia V := R[x]≤3 lo spazio vettoriale dei polinomi a coefficienti reali, nell’indeterminata x, di
grado al piu’ 3. Sia h(x) = x3 + x2 ∈ V e si consideri il sottospazio
U := Span{h(x)} ⊂ V.
(i) Calcolare dim(V /U ).
(ii) Dati p(x) = 2x3 − x + 3, q(x) = 9x3 + 5x2 − 2x + 6 ∈ V , determinare
dim (Span{p(x), q(x)}) .
(iii) Detta π : V → V /U la proiezione canonica associata al sottospazio U , siano [p(x)] := π(p(x)) e
[q(x)] := π(q(x)) le classi in V /U corrispondenti ai polinomi p(x) e q(x) in (ii); stabilire se
[q(x)] ∈ Span{[p(x)]}
in V /U .
(iv) Dedurre che
dim (π(Span{p(x), q(x)})) = dim (Span{p(x), q(x)}) − 1
e che
U ⊂ Span{p(x), q(x)}.
Svolgimento. (i) Notiamo che dim(V ) = 4; la proiezione canonica π : V → V /U associata al sottospazio
U e’ un’applicazione lineare di spazi vettoriali; inoltre e’ suriettiva. Per definizione di proiezione canonica
associata ad U , si ha inoltre
Ker(π) = U.
Dal Teorema di Nullita’ piu’ Rango si ha dunque
dim(V /U ) = dim(Im(π)) = dim(V ) − dim(Ker(π)) = dim(V ) − dim(U ) = 4 − 1 = 3.
(ii) Poiche’ i due polinomi non sono proporzionali, si ha
dim (Span{p(x), q(x)}) = 2.
(iii) Notiamo che, in V si ha
q(x) − 2p(x) = 5x3 + 5x2 = 5(x3 + x2 ) ∈ U.
Pertanto, in V /U si ha
[q(x)] = [2p(x)] = 2[p(x)],
i.e. [q(x)] ∈ Span{[p(x)]} ⊂ V /U .
(iv) Da (ii) e (iii) otteniamo immediatamente che π contrae il piano vettoriale Span{p(x), q(x)} ad una
retta vettoriale in V /U . Notiamo inoltre che
1 2
q(x) − p(x) = x3 + x2 ∈ Span{p(x), q(x)},
5 5
quindi U ⊂ Span{p(x), q(x)}.

1
2 FLAMINIO FLAMINI

Esercizio 2 Sia data l’applicazione lineare


Φ : R 4 → R2
definita da  
x1  
 x2  x4 − 2x1
Φ
  = ,
x3  x1
x4
 
x1
 x2  4
 x3  sono le coordinate in R rispetto alla base canonica e = {e1 , e2 , e3 , e4 }. Sia
ove  

x4
W := Ker(Φ).
4

(i) Verificare che dim R /W = 2.
(ii) Posti
u1 = −e1 + e2 , u2 = e1 + 2e3 ∈ R4
stabilire se in R4 /W si ha
[u1 ] = [u2 ],
ove [ui ] = π(ui ), 1 ≤ i ≤ 2, con
π : R4 → R4 /W
la proiezione canonica associata a W .
(iii) Determinare una base per R4 /W .
(iv) Detto U = Span{u1 , u2 }, stabilire se
π|U : U → R4 /W
e’ un isomorfismo.
Svolgimento. (i) L’applicazione lineare Φ ha matrice rappresentativa (nelle basi canoniche di dominio e
codominio)  
−2 0 0 1
A :=
1 0 0 0
che ha manifestamente rango 2. Per il Teorema
 di Nullita’ piu’ Rango, si ha dunque dim(W ) = 2. Come
nel punto (i) di Esercizio 1, dim R4 /W = 2.
(ii) Notiamo che
u1 − u2 = −2e1 + e2 − 2e3 ∈ / W.
Dunque in V /W si ha [u1 ] 6= [u2 ].
(iii) Una base per W e’ data da
{w1 = e2 , w2 = e3 }.
Essa ovviamente si completa ad esempio alla base per R4 data da
{w1 = e2 , w2 = e3 , w3 = e1 , w4 = e4 }.
Posto
W 0 := Span{w3 , w4 }
si ha che
R4 = W ⊕ W 0 .
Visto che R4 /W ∼
= W 0 , una base per R4 /W e’ data da
{[w3 ], [w4 ]}.
(iv) Notiamo che la matrice che ha per colonne i vettori
w1 , w2 , u1 , u2 ,
SPAZI VETTORIALI QUOZIENTI. DUALI 3

espressi in coordinate rispetto alla base e, e’ la matrice


 
0 0 −1 1
 1 0 1 0 
 
 0 1 0 2 
0 0 0 0
che ha manifestamente rango 3. Pertanto
 U ∩ W 6= {0}; piu’ precisamente dim(U ∩ W ) = 1. Dunque
dim(π(U )) = 1 mentre dim R4 /W = 2; questo comporta che π|U non puo’ essere un isomorfismo.


Esercizio 3 Si consideri V := (R3 , h, i) spazio vettoriale euclideo, munito di base canonica e = {e1 , e2 , e3 }
e prodotto scalare standard h, i. Sia V 0 ilo spazio vettoriale duale di V e sia
e0 = {Fe1 , Fe2 , Fe3 }
la base duale della base e (e’ per definizione la base di V 0 per cui
Fei (ej ) = δij , 1 ≤ i, j ≤ 3,
dove δi,j il delta di Kronecher). Siano dati i vettori
v1 = e1 + e3 , v2 = e3 , v3 = e1 − e2 ∈ V.
(i) Preso φ := 2Fe1 + Fe2 + 3Fe3 ∈ V 0 , determinare φ(v3 ).
(ii) Verificare che v = {v1 , v2 , v3 } costituisce una base per V .
(iii) Determinare
v 0 = {Fv1 , Fv2 , Fv3 }
la base duale della base v, esprimendo i vettori Fv1 , Fv2 , Fv3 come combinazioni lineari dei vettori della
base duale e0 .
(iv) Scrivere i funzionali lineari Fv1 , Fv2 , Fv3 secondo la rappresentazione di Riesz.
Svolgimento. (i) Si ha φ(v3 ) = 2 − 1 = 1 6= 0.
(ii) La matrice rappresentativa dei vettori v1 , v2 , v3 in base canonica e ha manifestamente rango
massimo, pertanto v e’ una base per V .
(iii) Poniamo Fv1 = α1 Fe1 + β1 Fe2 + γ1 Fe3 . Imponiamo ora la condizione che Fv1 sia il primo vettore
della base duale della base v. Questa condizione e’ equivalente ad imporre
Fv1 (v1 ) = 1 ⇔ α1 + γ1 = 1
Fv1 (v2 ) = 0 ⇔ γ1 = 0
Fv1 (v3 ) = 0 ⇔ α1 − β1 = 0.
Il precedente sistema non omogeneo di tre equazioni e tre indeterminate e’ compatibile, con unica soluzione
α1 = β1 = 1, γ1 = 0.
In altri termini
Fv1 = Fe1 + Fe2 .
Con conti esattamente analoghi ai precedenti, si trova
Fv2 = −Fe1 + Fe2 + Fe3 e Fv3 = −Fe2 .
(iv) Utilizzando il teorema della rappresentazione di Reisz, si ottiene
Fv1 = he1 + e2 , i
Fv2 = h−e1 + e2 + e3 , i
Fv3 = h−e2 , i

4 FLAMINIO FLAMINI

Esercizio 4 Sia V := R[x]≤4 lo spazio vettoriale dei polinomi a coefficienti reali, nell’indeterminata x, di
grado al piu’ 4. Sia
U := {p(x) ∈ V | p(1) = p(2) = 0} ⊂ V.
(i) Verificare che U e’ un sottospazio di V . Calcolarne la dimensione.
(ii) Stabilire se puo’ esistere un’applicazione lineare suriettiva
φ : V /U → R3 .
(iii) Detta π : V → V /U la proiezione canonica associata ad U , siano
[x] := π(x), [x2 + 2] := π(x2 + 2).
Stabilire se le classi [x] e [x2 + 2] di V /U sono linearmente indipendenti.
Svolgimento. (i) U soddisfa gli assiomi di sottospazio. Inoltre
p(x) ∈ U ⇔ p(x) = (x − 1)(x − 2)(b0 + b1 x + b2 x2 ).
Pertanto dim(U ) = 3.
(ii) Come nel punto (i) di Esercizio 1, si ha dim(V /U ) = dim(V ) − dim(U ) = 5 − 3 = 2. Pertanto non
puo’ esistere alcuna applicazione lineare φ come richiesta.
(iii) Notiamo che, in V /U si ha
α[x] + β[x2 + 2] = [0]
se e solo se
αx + β(x2 + 2) ∈ U.
Il polinomio 
2 α + β + 2β = 0
αx + βx + 2β ∈ U ⇔
2α + 4β + 2β = 0
Il sistema e’ compatibile, e.g. α = 3, β = −1. Pertanto le due classi [x] e [x2 + 2] di V /U sono linearmente
dipendenti. 

Esercizio 5: Con notazioni ed assunzioni come in Esercizio 3, sia


U = Span{v1 , v2 } ⊂ U.
Definiamo
Ann(U ) := {φ ∈ V 0 | φ(u) = 0, ∀ u ∈ U } ⊆ V 0 .
Il precedente sottoinsieme viene chiamato annullatore del sottospazio U .
(i) Verificare che Ann(U ) e’ un sottospazio dello spazio vettoriale duale V 0 di V e calcolarne la dimensione.
(ii) Preso U ⊥ ⊂ V , dove l’ortogonalita’ e’ rispetto al prodotto scalare standard h, i, verificare che
Ann(U ) ∼
= (U ⊥ )0 .
(iii) Stabilire se V /U ∼
= U ⊥.
(iv) Stabilire se (V /U )0 ∼
= (U ⊥ )0 .
Svolgimento. (i) Ann(U ) verifica banalmente gli assiomi di sottospazio. Notiamo ora che U = Span{e1 , e3 }
pertanto
φ ∈ Ann(U ) ⇔ φ(e1 ) = 0 = φ(e3 ).
Scrivendo pertanto
φ = αFe1 + βFe2 + γFe3 ,
si ha che
φ ∈ Ann(U ) ⇔ α = γ = 0.
In altre parole
Ann(U ) = Span{Fe2 }.
Pertanto dim(Ann(U )) = 1.
SPAZI VETTORIALI QUOZIENTI. DUALI 5

(ii) Dal punto (i), abbiamo che


U ⊥ = Span{e2 }.
Quindi
(U ⊥ )0 = Span{Fe2 } ∼
= Ann(U ).

(iii) Poiche’ V = U ⊕ U , si ha che
V /U ∼
= U ⊥.
(iv) Per dualita’,
(V /U )0 ∼
= (U ⊥ )0 .

ESAME DI GEOMETRIA 2. 11-06-2013,
SOLUZIONI

ESERCIZIO 1 S
1 1
Per ogni n ∈ N, n > 0 sia Bn = ( 2n+1 , 2n ) e sia A = n Bn . Sia X il sottoinsieme di R2
ottenuto facendo il cono di A × {1} sull’origine; ossia
X = {(x, y) ∈ R2 : x = ay, a ∈ A}
(1) Determinare la parte interna di X.
(2) Determinare la chiusura X̄ di X in R2 .
(3) Determinare la frontiera di X.
(4) Si dica se X è connesso.
(5) Si dica se X̄ è localmente connesso.
(6) Si dica se lo spazio Y ottenuto da R2 collassando X a un punto è Hausdorff.
(7) Si dica se lo spazio Z ottenuto da R2 collassando X̄ a un punto è Hausdorff.

SOLUZIONE
(1) Sia f : R2 \ (R × {0}) → R data da f (x, y) = x/y. La f è continua perché stiamo
considerando punti con y 6= 0. D’altronde, l’unico punto di X con la y = 0 è
l’origine. Per definizione X \ {0} = f −1 (A). Siccome A è aperto in quanto unione
di intervalli aperti, X \{0} è aperto. Dunque la parte interna di X contiene X \{0}.
D’altronde l’origine non è un punto interno di X perchè ogni intorno dell’origine
contiene punti del tipo (0, y), che non stanno in X. Ne segue che la parte interna
di X è esattamente X \ {0}.
(2) Sia f come sopra. Se Ā indica la chiusura di A in R, posto W = f −1 (Ā) si ha che W
è un chiuso di R2 \(R×{0}). Se (x, y) è un punto di W allora a = x/y ∈ Ā e dunque
ogni intorno di (x, y) contiene punti (p, q) tali che p/q sta in A. Quindi W ⊂ X̄.
Siccome A ⊂ (0, 1), X è contenuto in C = {(x, y) : x ≥ 0} ∩ {(x, y) : x ≤ y},
che è intersezione di chiusi e quindi chiuso. Quindi X̄ ⊂ C. Siccome W ⊂ C e
C ∩ (R × {0}) contiene solo l’origine resta da vedere se l’origine stia in X̄ e ció è
vero perché per definizione si ha (0, 0) ∈ X ⊂ X̄. In conclusione X̄ è costituito da
W ∪ {(0, 0)}.
(3) La frontiera di X è data dalla differenza tra chiusura e parte interna, quindi è
l’unione delle rette {y = nx, n ∈ N, n > 0} ∪ {x = 0}
(4) X è connesso per archi in quanto è unione di rette per l’origine. Quindi è connesso.
(5) X̄ non è localmente connesso. Infatti, sia p = (0, 1) ∈ X̄ e sia U = X̄ ∩ {(x, y) : y ∈
(1/2, 3/2)}. Per ogni intorno V ⊂ U di p, la restrizione di f a V ha immagine in un
intorno di zero di Ā, che non è mai connesso. Quindi V non può essere connesso.
(6) In un Hausdorff i punti son chiusi, siccome X non è chiuso, Y non è Hausdorff.
(7) Siccome X̄ è chiuso, se x ∈ / X̄ allora esiste ε > 0 tale che B(x, ε) ∈
/ X. Ne segue
2
che B(x, ε/3) e R \ B(x, ε/2) sono aperti disgiunti, l’uno che contiene x le l’altro
X̄. Dunque sono due aperti saturi le cui immagini sono aperti disgiunti in Z, l’uno
che contiene [x] e l’altro [X]. Dunque Z è Hausdorff.
1
2

ESERCIZIO 2 (punti 2+2+2+4+4) Per ogni vettore v di R2 sia Tv la traslazione


lungo v:
Tv (x) = x + v.
√ √
Siano v1 = (1, 0), v2 = ( 21 , 23 ), v3 = (− 12 , 23 ) e sia G il gruppo di omeomorfismi di R2
generato da Tv1 , Tv2 , Tv3 . Sia X il quoziente di R2 per la relazione di equivalenza
x ∼ y ⇐⇒ ∃g ∈ G : g(x) = y
(1) X è connesso?
(2) X è compatto?
(3) Dimostrare che la classe di equivalenza di (0, 0) contiene solo punti isolati.
(4) Dimostrare che la classe di equivalenza di ogni (x, y) ∈ R2 contiene solo punti
isolati.
(5) Dimostrare che X è omeomorfo al toro R2 /Z2 .

SOLUZIONE Siccome v2 − v3 = (1, 0), il gruppo G è generato dai soli v2 , v3 , oppure dai
soli v1 , v2 . Sia π : R2 → X la proiezione naturale.
(1) X è connesso perché immagine di R2 , che è connesso, tramite la proiezione naturale
che è continua. √
(2) Le tralsazioni lungo (1, 0) = v1 e (0, 3) = v2 + v3 appartengono a G. Ne segue
che ogni punto di R2 può essere traslato tramite √ elementi di G sino ad avere la
componente
√ x in [0, 1] e la componente
√ y in [0, 3]. Ne segue che X = π([0, 1] ×
[0, 3]). Siccome [0, 1] × [0, 3] è compatto in quanto prodotto di compatti e
siccome π è continua, X è compatto.
(3) Siccome G è generato dalle traslazioni lungo v2 e v3 , le ascisse degli √ elementi di
[(0, 0)] sono multipli di 1/2, mentre le ordinate sono multipli di 3/2. Ne segue
che [(0, 0)] è costituita da punti isolati.
(4) Se (x, y) ∼ (x′ , y ′ ) allora (x − x′ , y − y ′ ) ∼ (0, 0). Ne segue che [(x, y)] = (x, y) +
[(0, 0)] e quindi per il punto precedente è il traslato di un insieme di punti isolati e
quindi ha solo punti isolati.
(5) Come detto sopra, G è generato da v2 e v3 . Sia F l’isomorfismo lineare di R2
che manda v2 in (1, 0) e v3 in (0, 1). Tale isomorfismo esiste perchè v2 e v3 sono
linearmente indipendenti. Sia T = R2 /Z2 il toro ottenuto come quoziente di R2 per
la relazione x ∼′ y ⇔ x − y ∈ Z2 e sia π ′ : R2 → T la proiezione naturale. Per
definizione di F , la mappa π ′ ◦F : R2 → T è costante sulle classi di equivalenza. Per
la proprietà universale del quoziente discende a una mappa continua f : X → T .
Allo stesso modo, l’inversa di F produce l’inversa di f che quindi risulta essere un
omeomorfismo.
3

ESERCIZIO 3 (punti 3+3+3+3) Per ogni sottoinsieme X di R2 , sia X c il suo comple-


mentare. Dimostrare o trovare un controesempio per ciascuna delle seguenti affermazioni.
(1) Se f : R2 → R2 è un omeomorfismo allora X c è omeomorfo a f (X)c .
(2) Esiste X ⊂ R2 tale che X è omeomorfo a X c .
(3) Se X e Y sono omeomorfi allora lo sono anche X c e Y c .
(4) Se X c e Y c sono omeomorfi allora lo sono anche X e Y .

SOLUZIONE
(1) Vera. La restrizione di f a X c è continua. Siccome f è iniettiva, anche la sua
restrizione a X c lo è. In oltre, sempre per l’iniettività, f (X c ) = f (X)c . Lo stesso
ragionamento applicato a f −1 fornisce l’inversa di f |X c che quindi risulta essere un
omeomorfismo tra X c e f (X)c .
(2) Vera. Basta prendere X = {(x, y) ∈ R2 : x ∈ [2n, 2n + 1), n ∈ Z}, la traslazione
(x, y) → (x + 1, y) fornisce l’omeomorfismo tra X e X c .
(3) Falsa. Sia X un semipiano aperto e Y = R2 . X e Y sono omeomorfi ma il
complementare di Y è vuoto mentre quello di X no.
(4) Falsa. Basta prendere X c e Y c con X e Y come sopra.
ESAME DI GEOMETRIA 2. 11-02-2013,
Soluzioni

ESERCIZIO 1, punti 2+2+2+2+2+2


Sia X lo spazio topologico che si ottiene da R mediante la relazione di equivalenza:

{x ≃ y se y = 2n x per qualche n ∈ Z}

Dire se:

1. X è di Hausdorff

2. X è connesso

3. X è compatto

SOLUZIONE. Indichiamo con π la proiezione naturale sul quoziente.

1. Sia U ⊂ X un qualsiasi intorno aperto di [0]. π −1 (U ) è un aperto saturo di R


contenente 0. Essendo aperto contiene un intervallo del tipo (−a, a). Per ogni x ∈ R
esite n ∈ Z tale che 2n x ∈ (−a, a), per cui [x] ∈ U . Da cui U = X. Avendo X
almeno due elementi, X non è Hausdorff.

2. X è connesso in quanto immagine di un connesso (R) tramite un’applicazione con-


tinua (π).

3. X è compatto perchè se {Ui } è un ricoprimento di aperti di X, allora esiste i0 tale


che [0] ∈ Ui0 , per quanto detto sopra, Ui0 = X costituisce un sottoricoprimento
finito.

Sia ora Y lo spazio topologico che si ottiene da R \ {0} mediante la stessa relazione di
equivalenza
Dire se:

1. Y è di Hausdorff

2. Y è connesso

3. Y è compatto

SOLUZIONE. Indichiamo con π la proiezione naturale sul quoziente.

1. Il grafico della relazione di equivalenza è costituito dal sottoinsieme di R2 \ {xy = 0}


formato dalle rette rn a pendenza 2n con n ∈ Z. Tale insieme è un chiuso di
R2 \ {xy = 0} in quanto gli unici punti di accumulazione delle rette rn stanno o
sulle rette stesse o sugli assi coordinati (cioè {xy = 0}). In oltre, la relazione di
equivalenza proviene da un’azione del gruppo Z: gn (x) = x2n , quindi π è aperta. Ne
segue che Y è Hausdorff.

1
2. x ∼ y implica xy > 0 per cui R+ ed R− sono aperti saturi non vuoti e disgiunti e
quindi A = π(R+ ) e B = π(R− ) sono aperti disgiunti e non vuoti. Chiaramente
Y = A ∪ B quindi Y non è connesso.
3. Per ogni x > 0 esiste y ∈ [1, 2] tale che x ∼ y. Per ogni x < 0 esiste y ∈ [−2, −1]
tale che x ∼ y. Quindi Y = π([−2, −1] ∪ [1, 2]). [1, 2] e [−2, −1] sono entrambi
compatti e l’unione finita di compatti è compatta, quindi [−2, −1]∪[1, 2] è compatto.
L’immagine di un compatto tramite una funzione continua è compatto quindi Y è
compatto.
Si noti che usando il logaritmo si dimostra agilmente che Y è omeomorfo a l’unione
disgiunta di due cerchi, mentre X è costituito da due cerchi piú un punto che ha come
unico intorno X stesso.

ESERCIZIO 2, punti 4+4+4


Siano τ e σ due topologie su un isieme X. Dimostrare o trovare un controesempio per
ciascuna delle seguenti affermazioni.
1. σ è piú fine di τ se per ogni spazio topologico Y e per ogni f : X → Y , se f è
continua rispetto a τ allora lo è anche rispetto a σ.
2. σ è piú fine di τ se per ogni spazio topologico Y e per ogni f : X → Y , se f è
continua rispetto a σ allora lo è anche rispetto a τ .
3. σ è piú fine di τ se esiste uno spazio Y tale che per ogni f : X → Y , se f è continua
rispetto a τ allora lo è anche rispetto a σ.
SOLUZIONE
1. VERA. Se per ogni spazio topologico Y e per ogni f : X → Y , se f è continua rispetto
a τ allora lo è anche rispetto a σ, ció sarà vero anche per f = id : (X, τ ) → (X, τ ).
Ne segue che id è continua anche come funzione (X, σ) → (X, τ ) e dunque ogni
aperto di τ è anche aperto di σ.
2. FALSA. Come controesempio consideriamo uno spazio X con almeno tre elementi,
usando come τ la topologia discreta (ogni insieme è aperto) e come σ la banale (solo
il vuoto e X sono aperti). Ogni funzione è continua rispetto a σ lo è anche rispetto
a τ ma σ non è piú fine di τ .
3. FALSA. Siano τ e σ due topologie non equivalenti su uno spazio X e sia Y un insieme
con un solo elemento. Ogni funzione a valori in Y è continua indipendentemente dalla
topologia dello spazio di partenza.

ESERCIZIO 3, punti 5+5+5


Sia X = Q2 ⊂ R2 con la topologia indotta e sia A ⊂ X il seguente sottospazio

A = {(x, y) ∈ X : x2 + y 2 < π} \ {(x, y) ∈ X : y = 0, x > 0}

2
1. Determinare chiusura, frontiera e parte interna di A in X.

2. Dire se la chiusura di A in X è uno spazio compatto.

3. Dire se la chiusura di A in X è omeomorfa a Q2 .

SOLUZIONE

1. La chiusura di A è l’intersezione con X della chiusura B di A in R2 . Infatti B ∩ X è


chiuso in X e contiene A; se C è un chiuso di X contenente A allora esiste D chiuso
di R2 tale che A ⊂ C = D ∩ X e dunque D contiene B, ergo C contiene B ∩ X. La
chiusura di A in R2 è chiaramente {(x, y) ∈ R2 : x2 + y 2 ≤ π}. Quindi

Ā = {(x, y) ∈ X : x2 + y 2 ≤ π} = {(x, y) ∈ X : x2 + y 2 < π}.

La parte interna di A è A \ {(0, 0)}. Tale insieme è aperto perchè {(x, 0) : x ≥ 0} è


chiuso in R2 e quindi {(x, y) ∈ R : x2 + y 2 < π} \ {(x, 0) : x ≥ 0} è aperto in R2 e
la sua intersezione con X è A \ {(0, 0)}. In oltre, (0, 0) non è un punto interno di A
perché ogni intorno di (0, 0) contiente punti di {(x, 0) : x > 0, x ∈ Q} (che sta nel
complementare di A in X.)
Ne segue che la frontiera di A in X è l’insieme {(x, 0) : 0 ≤ x < π, x ∈ Q}.

2. Ā NON è compatto. Sia {an }n∈N una successione monotona crescente che tende a π.
Sia Un = {(x, y) ∈ X : x2 + y 2 < an }. Un è aperto e per ogni (x, y) ∈ Ā esiste n tale
che x2 + y 2 < an perchè an → π e π non è razionale. Quindi {Un } è un ricoprimento
di aperti di Ā. Sia ora Ui1 , . . . , UiN una sotto famiglia finita e sia m = max{in }.
Allora l’unione degli Uin è esattamente Um . Siccome Q è denso in R esiste xm ∈ Q
√ √
appartenente all’intervallo (− π, − am ). Il pundo (xm , 0) sta quindi in Ā ma non
in Um . Ne segue che nessuna sottofamiglia finita di {Un } è un ricoprimento di Ā.

3. La risposta è SI. Dimostriamo prima che un qualsiasi intervallo aperto di Q è omeo-


morfo a Q. Sia I = (a, b) un intervallo di Q. Sia {an }n∈Z ⊂ I una successione
strettamente monotona crescente tale che an converge ad a per n → −∞ ed a b per
n → ∞.
Definiamo una funzione da Q a I come segue. Su Z poniamo f (m) = am . Sull’intervallo
(m, m + 1) poniamo f (m + t) = (1 − t)am + tam+1 ; si noti che se t ∈ Q allora
f (m + t) ∈ Q. Si verifica facilmente che f è un omeomorfismo.
√ √
In particolare ció vale per a = − π e b = π. Possiamo quindi costruire un
√ √
omeomorfismo ϕ tra (− π, π) × Q e Q2 ponendo ϕ(x, y) = (f −1 (x), y). Sia Y =
ϕ(A) ⊂ Q2 . L’insieme Y è chiaramente omeomorfo ad A ed è meglio descritto da
q q
Y = {(x, y) ∈ Q2 : − π − f (x)2 < y < π − f (x)2 }

3
Mostriamo adesso che Y è omeomorfo a Q2 ed avremo finito. Sia g(x) =
p
π − f (x)2 ,
cosı́ che
Y = {(x, y) ∈ Q2 : −g(x) < y < g(x)}

Adesso sia {αn }n∈Z una successione di funzioni αn : R → R con le seguenti proprietà.

(a) {αn } è strettamente monotona crescente (∀x, αn (x) < αn+1 (x));
(b) per ogni n ∈ Z, αn (Q) ⊂ Q;
(c) αn (x) tende a g(x) per n → ∞;
(d) αn (x) tende a −g(x) per n → ∞;

Tale successione si costruisce facilmente usando delle funzioni lineari a tratti.


Definiamo adesso F : Q2 → Y come segue. Su Q × Z poniamo F (x, n) = (x, αn (x))
e poi procediamo come prima ponendo, per t ∈ [0, 1] ∩ Q e m ∈ Z

F (x, m + t) = (x, (1 − t)αn (x) + tαn+1 (x)).

Si verifica che F è un omeomorfismo.

4
Complementi di Geometria Proiettiva

Questa breve nota è rivolta agli studenti del II modulo del corso di Geometria per Scienze
dei Media. Affianca [6] (si veda la pagina web del corso) ed è divisa in 4 brevi paragrafi:
§ 1. Richiami sugli spazi proiettivi;
§ 2. Una conica nel piano proiettivo;
§ 3. Qualche osservazione sui sottospazi di uno spazio proiettivo;
§ 4. Proiettività.

Come prerequisiti, si assume un minimo di confidenza con l’insiemistica di base, col


concetto di funzione, la nozione di relazione d’equivalenza, l’algebra lineare insegnata nel
I modulo di un corso di geometria (48 ore frontali).

§ 1. Richiami sugli spazi proiettivi.

Definizione 1.1. Sia V uno spazio vettoriale. Il proiettivizzato di V è lo spazio


.
P(V ) = V r {~0} ∼

dove “ ∼ ” è la relazione d’equivalenza che identifica vettori proporzionali.

• Gli elementi di P(V ) si chiamano punti;


• dato un vettore ~v ∈ V r {~0}, si denota con [~v ] la sua classe d’equivalenza in P(V );
• si dice che il punto p = [~v ] ∈ P(V ) è rappresentato dal vettore ~v .

Definizione 1.2. Uno spazio proiettivo è il proiettivizzato di uno spazio vettoriale.

Definizione 1.3. Si definisce la dimensione dello spazio proiettivo P(V ) ponendo

dim P(V ) = dim V − 1 .

• Gli spazi proiettivi di dimensione 1 si chiamano rette;


• Gli spazi proiettivi di dimensione 2 si chiamano piani.

Osservazione 1.4. Se V è uno spazio vettoriale e W ⊆ V è un suo sottospazio vettoriale,


allora c’è l’inclusione naturale

P(W ) ⊆ P(V ) , ~ ] 7→ [ w
[w ~]

~ ∈ P(W ), che è la classe del vettore w


che alla classe d’equivalenza [w] ~ considerato come
~ ∈ P(V ), che questa volta è la classe
vettore in W , associa la classe d’equivalenza [w]
di w~ considerato come vettore in V . La funzione appena descritta risulta ben posta nonché
iniettiva (convincersene).

Definizione 1.5. Un sottospazio proiettivo di uno spazio proiettivo P(V ) è uno spazio
proiettivo P(W ) dove W è un sottospazio vettoriale di V .

Avvertenza 1.6. Per indicare i punti di uno spazio proiettivo si usano i vettori che li
rappresentano, quando si scrive una definizione o anche una qualsiasi formula che li coinvolge
si deve sempre controllare che quello che si sta scrivendo abbia senso, cioè che non dipenda
2

dai rappresentati utilizzati. Ad esempio, dati due punti p = [~v ] e q = [ w


~ ] di uno spazio
spazio proiettivo,

scrivere p + q = [~v ] + [ w
~ ] := [~v + w
~] è semplicemente privo di senso.

Questo perché cambiando il rappresentate usato per indicare il punto p, ad esempio usando
il vettore 2~v (essendo ~v e 2~v proporzionali, le corrispondenti classi [~v ] e [2~v ] coincidono,
sono entrambe il punto p, lo ribadiamo, sono lo stesso identico punto), la formula in corsivo
darebbe p + q = [2~v ] + [ w ~ ] = [2~v + w
~ ] che, in generale, non è il punto [~v + w~ ] ottenuto
usando i rappresentati considerati inizialmente. Infatti, per l’esercizio 1.8 proposto sotto, se
p 6= q i vettori 2~v + w
~ e ~v + w~ non sono proporzionali, quindi rappresentano punti distinti
del nostro spazio proiettivo, detto in formule risulta [2~v + w ~ ] 6= [~v + w
~ ].

Nota 1.7. Gli spazi proiettivi non sono dotati di una operazione di somma.

Esercizio 1.8. Sia V uno spazio vettoriale, ~v e w


~ due vettori non nulli. Provare che se
~v e w
~ non sono proporzionali, allora 2~v + w
~ e ~v + w
~ non sono proporzionali.

Definizione 1.9. Dato uno spazio proiettivo P = P(V ) e dei punti p1 , ..., pk diremo che
i) p1 , ..., pk sono allineati se esiste una retta r ⊆ P che li contiene;
ii) p1 , ..., pk sono complanari se esiste un piano H ⊆ P che li contiene.

Proposizione 1.10. Sia P = P(V ) uno spazio proiettivo. Si ha che


• dati due punti distinti c’è un’unica retta che li contiene;
• dati tre punti non allineati c’è un unico piano che li contiene.

Dimostrazione. Siano p = [~v ], q = [~u ] ∈ P(V ) due punti. Vista la Definizione 1.1, dire
che p e q sono distinti equivale a dire che i due vettori che li rappresentano ~v e ~u sono
indipendenti. Dire che c’è un’unica retta contenente p e q è come dire che c’è un unico
sottospazio vettoriale W ⊆ V tale che
dim W = 2 e ~v , ~u ∈ W .
Ciò riduce la prima affermazione alla seguente affermazione concernente gli spazi vettoriali:
dato uno spazio vettoriale e due suoi vettori indipendenti, c’è un unico sottospazio
vettoriale di dimensione 2 che li contiene
(affermazione che assumiamo ben nota a chi ha studiato gli spazi vettoriali).
La seconda affermazione può essere dimostrata in modo simile: dire che tre punti p = [~v ],
q = [~u ], m = [~z ], non sono allineati equivale a dire che i loro rappresentanti ~v , ~u, ~z
sono indipendenti. Dire che c’è un unico piano contenente p, q , m è come dire che c’è
unico sottospazio vettoriale W ⊆ V tale che
dimW = 3 e ~v , ~u, ~z ∈ W .
Di nuovo, ciò riduce la nostra affermazione ad una affermazione sugli spazi vettoriali:
dato uno spazio vettoriale e tre vettori indipendenti, c’è un unico sottospazio
vettoriale di dimensione 3 che li contiene
(affermazione, di nuovo, ben nota).


Come si può immaginare il risultato si generalizza.

Proposizione 1.10 bis . Sia P = P(V ) uno spazio proiettivo. Dati k + 1 punti non con-
tenuti in alcun sottospazio proiettivo di dimensione k − 1 , si ha che c’è un unico sottospazio
proiettivo di dimensione k che li contiene.
3

Dimostrazione. Dire che i punti p1 = [~v1 ] , ... , pk+1 = [~vk+1 ] non sono contenuti in alcun
sottospazio proiettivo di P(V ) di dimensione k−1 equivale a dire che i vettori ~v1 , ... , ~vk+1
non sono contenuti in alcun sottospazio vettoriale di V di dimensione k , ovvero che sono
indipendenti. Da ciò che abbiamo imparato studiando gli spazi vettoriali, il sottospazio
Span{~v1 , ... , ~vk+1 } è l’unico sottospazio vettoriale di V , di dimensione k + 1 , contenente
i nostri vettori. Di conseguenza, lo spazio proiettivo

P Span {~v1 , ... , ~vk+1 }
è l’unico sottospazio proiettivo di P(V ) contenente i nostri punti.


Ogni spazio vettoriale di dimensione n + 1 è isomorfo ad Rn+1 , ciò ci porta a studiare


lo spazio proiettivo 
n
PR := P Rn+1 .

n t
Notazione 1.11. Il punto di PR rappresentato dal vettore ( X0 , . . . , Xn ) ∈ Rn+1
viene denotato  
X0 , . . . , Xn .
Inoltre, X0 , . . . , Xn vengono chiamate coordinate proiettive.

Nota 1.12. Vista la Definizione 1.1, le coordinate proiettive sono definite a meno di un
fattore di proporzionalità non nullo, infatti

[ X0 , . . . , Xn ] = λX0′ , . . . , λXn′ ] (λ 6= 0) .

Osservazione 1.13. Le coordinate proiettive, essendo definite a meno di un fattore di


proporzionalità non nullo, “ prese singolarmente” non hanno senso. D’altro canto,
• l’annullarsi o meno di una coordinata ha senso;

• i vari quozienti Xi Xj (se Xj 6= 0), hanno perfettamente senso.
Infatti, una coordinata Xi è nulla se e solo se uno (ogni) suo multiplo λXi (con λ 6= 0)
′ ′
è nullo. Inoltre, se (X0 , ..., Xn ) e (X0 , ..., Xn ) rappresentano
 lo stesso
 punto, ovvero
′ ′
risulta (X0 , ..., Xn ) = λ · (X0 , ..., Xn ), allora risulta Xi Xj = Xi ′ Xj ′ .
n 
Esempio. Nello spazio proiettivo PR = P R4 , risulta
[3, 1, 0, 4] = [5, 53 , 0, 20 3 ]
(quelli indicati sono due modi differenti, tra gli infiniti modi possibili, di dare sono lo stesso
identico punto). Sottolineiamo che qualsiasi vettore del tipo t (3 λ, 1 λ, 0 λ, 4 λ), con λ 6= 0,
rappresenta il punto dato (si noti che avrà necessariamente la terza coordinata nulla).
4

Carte Affini
n 
Consideriamo lo spazio proiettivo PR = P Rn+1 . L’uso delle coordinate proiettive
consente una visione “ globale” del nostro spazio proiettivo (usiamo il termine globale per
sottolineare il fatto che ogni punto ha le sue coordinate proiettive), questo è utile. D’altro
canto il fatto che le coordinate proiettive siano definite a meno di un fattore di proporzio-
nalità le rende meno comode e intuitive. Per questa ragione, ma non solo, si introducono le
carte affini (dette anche locali). Queste hanno il vantaggio di identificarsi con Rn , oggetto
a noi familiare. Il prezzo da pagare è lo svantaggio di non essere definite globalmente ma
solo su un aperto del nostro spazio proiettivo (cosı̀ come, per fare un’analogia, una carta
geografica rappresenta solo una porzione della nostra terra), precisamente ognuna di esse è
definita sul complementare di un iperpiano (l’iperpiano di equazione Xi = 0, cfr. sotto).

n
Proposizione 1.14. Consideriamo PR , fissiamo un indice 0 ≤ i ≤ n. La funzione

ϕi : Ai := [X0 , ..., Xn ] Xi 6= 0 −−−−→ Rn
 
X0 Xn
[X0 , ..., Xn ] 7→ Xi , ..., Xi =: (y1 , ..., yn )
| {z }
qui saltiamo l’indice i

è biunivoca. La sua inversa è la funzione (y1 , ..., yn ) 7→ [y1 , ..., yi , 1 , yi+1 , , yn ] .

Nota. L’enunciato formulato ha perfettamente senso (cfr. Osservazione 1.13).

Dimostrazione. Per ragioni tipografiche, e di chiarezza, concentriamoci sulla carta A0 . Il


generico punto di A0 , il punto p = [X0 , ..., Xn ], con X0 6= 0 , ha un unico rappresentante
con X0 = 1 (ottenuto dividendo per X0 il rappresentante [X0 , ..., Xn ]), chiamiamolo
[ 1 , y1 , ..., yn ]. Ciò premesso possiamo scrivere ϕ0 nella forma

ϕ0 : A0 := [ 1 , y1 , ..., yn ] −−−−→ Rn
p = [ 1 , y1 , ..., yn ] 7→ ( y1 , ..., yn )
che, per l’unicità del rappresentante del tipo [ 1 , y1 , ..., yn ], è una funzione biunivoca. Ciò
conclude la dimostrazione (naturalmente, il caso delle altre carte locali è assolutamente
identico, cambia solo la posizione dove compare “ 1”).


n
Definizione 1.15. Consideriamo lo spazio proiettivo PR .
• Le varie funzioni

ϕi : Ai := [X0 , ..., Xn ] Xi 6= 0 −−−−→ Rn
 
X0 Xi−1 Xi+1 Xn
[X0 , ..., Xn ] 7→ Xi , ..., Xi , Xi , ..., Xi

vengono chiamate carte affini (sono dette anche carte locali);


• per abuso di linguaggio, il termine carta affine può riferirsi anche all’insieme Ai ;
• le coordinate y1 , ..., yn di Rn vengono chiamate coordinate affini della carta Ai ;
n
• i punti [X0 , ..., Xn ] ∈ PR con Xi = 0 vengono chiamati punti all’infinito di Ai
n
(n.b.: sono esattamente i punti di PR che non appartengono ad Ai ).

Nota. Visto com’è definita ϕi si ha


 
X0 Xi−1 Xi+1 Xn
(y1 , ..., yn ) = Xi , ..., Xi , Xi , ..., Xi .
5

Esempio 1.16. Nel caso della retta proiettiva P1R := P(R2 ) abbiamo due carte affini:

ϕ0 : A0 := [X0 , X1 ] X0 6= 0 } −−−−→ R
X1
[X0 , X1 ] 7→ X0 =: z

ϕ1 : A1 := [X0 , X1 ] X1 6= 0 } −−−−→ R
X0
[X0 , X1 ] 7→ X1 =: w

Osserviamo che risulta z = 1/w . Osserviamo peraltro quanto segue:


• il punto [0, 1 ] è l’origine per la carta A1 ed il punto all’infinito per la carta A0 ;
• il punto [1, 0 ] è l’origine per la carta A0 ed il punto all’infinito per la carta A1 .

Infine osserviamo che avremmo potuto (e possiamo) scrivere



A0 = [ 1, z ] z ∈ R , ϕ0 : A0 −→ R , [ 1, z ] 7→ z ;
e 
A1 = [ w, 1 ] w ∈ R , ϕ1 : A1 −→ R , [ w, 1 ] 7→ w .

Esempio 1.17. Nel caso del piano proiettivo P2R := P(R3 ) abbiamo tre carte affini:

ϕ0 : A0 := [X0 , X1 , X2 ] X0 6= 0 } −−−−→ R2
 
X1 X2
[X0 , X1 , X2 ] 7→ X0 , X0 =: (x, y)


ϕ1 : A1 := [X0 , X1 , X2 ] X1 6= 0 } −−−−→ R2
 
X0 X2
[X0 , X1 , X2 ] 7→ X1 , X1 =: (h, k)


ϕ2 : A2 := [X0 , X1 , X2 ] X2 6= 0 } −−−−→ R2
 
X0 X1
[X0 , X1 , X2 ] 7→ X2 , X2 =: (z, w)

Di nuovo, possiamo scrivere



A0 = [ 1, x, y ] x, y ∈ R2 , ϕ0 : A0 −→ R2 , [ 1, x, y ] 7→ (x, y) ;

A1 = [ h, 1, k ] h, k ∈ R2 , ϕ0 : A0 −→ R2 , [ h, 1, k ] 7→ (h, k) ;

A2 = [ z, w, 1 ] z , w ∈ R2 , ϕ0 : A0 −→ R2 , [ z, w, 1 ] 7→ (z, w) .
6

Inciso. A lezione abbiamo introdotto l’ampliamento proiettivo P di Rn come l’unione


insiemistica dello spazio affine Rn e le “direzioni” nello stesso Rn , queste ultime le abbiamo
chiamate punti all’infinito (mentre i punti di Rn li chiamiamo punti al finito di P).
Va detto che, limitandosi a questa visione, lo spazio proiettivo P appare come una unione astratta di due
cose che sembra c’entrino poco o nulla l’una con l’altra.
Poi abbiamo osservato che i punti di P sono in corrispondenza biunivoca con le rette per
l’origine di Rn+1 , la corrispondenza è quella indicata:

caso n = 2
Consideriamo R3 , con coordinate X0 , x, y .
Il piano R2 lo identifichiamo col piano X0 = 1 (il
asse X0 nostro piano proiettivo è l’ampliamento proiettivo di
piano X0 = 1 questo piano, lo chiameremo P).
Ad ogni retta di R3 (passante per l’origine) vogliamo
1 • p = (1, a, b) associare un punto di P, distinguiamo due possibilità:
i) alla retta r generata dal vettore t (1, a, b) asso-
r ciamo la sua intersezione con il piano X0 = 1 (il punto
p della figura);
asse y
ii) alla retta r generata dal vettore t (0, α, β) (con
0•
α, β non entrambi nulli), che è una retta parallela al
piano X0 = 1 (non lo interseca), associamo la sua
asse x
“ direzione”, cioè la classe di proporzionalità [α, β ]
(che è un elemento di P, cfr. Inciso sopra).

La retta r è la retta passante per l’origine o di R3 ed il punto p = (1, a, b) ∈ R3 . Ora,


invece del punto p, consideriamo il punto
pλ := (1 , a + λα , b + λβ ) ∈ R3
La corrispondente retta rλ passante per o e pλ converge1, per λ che va all’infinito, alla
retta r∞ passante per o ed il punto (0, α, β) . Si osservi che per λ molto grande, essendo
α e β non entrambi nulli, rλ è quasi orizzontale. Ciò dà un senso geometrico alla scelta ii).

In termini di coordinate omogenee di P2R , abbiamo la seguente chiave di lettura (e, forse
semplificazione) di quanto detto. Il punto
 
Pλ := 1 , a + λα , b + λβ ∈ P2R ,
che nel piano A0 ∼ = R2 ha coordinate (a + λα , b + λβ ), coincide (per λ 6= 0) con il
punto 1 a 
Pλ = b
λ , λ + α, λ + β ∈ P2R
e, per λ che va all’infinito, converge al punto
 
P∞ = 0 , α , β ∈ P2R

(va detto che fare un limite usando dei rappresentanti di una classe di proporzionalità è un po’ nascondere
la polvere sotto il tappeto, ma lo accettiamo).
1 Giustifichiamo l’affermazione secondo la quale lim rλ = “ retta per o e (0, α, β) ”. La retta rλ è la
λ→∞
retta di equazioni parametriche 
( X0 , x , y ) = t , t · ( a + λ α) , t · (b + λ β)
e, almeno per λ 6= 0 , è la retta di equazioni parametriche
τ τa τb

(♣) ( X0 , x , y ) = λ
, λ
+ τ α, λ
+τβ
τ
(abbiamo sostituito il parametro t col parametro λ ). Dall’equazione (♣) si evince che per λ che va
all’infinito la retta rλ converge alla retta r∞ di equazioni parametriche

( X0 , x , y ) = 0, τ α, τ β
che è esattamente la retta passante per o e (0, α, β) .
7

n
Secondo la Definizione 1.5, i sottospazi proiettivi di PR := P(Rn+1 ) sono i proiettificati
P(W ) dei sottospazi vettoriali di W ⊆ Rn+1 . Questi ultimi possono essere descritti da
equazioni cartesiane o parametriche:
 a X + ... + a X = 0
 0, 0 0 0, n n

 ..
(1.18) . (equazioni cartesiane)



am, 0 X0 + ... + am, n Xn = 0


 X0 = c0, 0 t0 + ... + c0, k tk

 .
(1.18′ ) .. (equazioni parametriche)



X
n = cn, 0 t0 + ... + cn, k tk
n
Interpretando le coordinate X0 , ..., Xn di Rn+1 come coordinate omogenee di PR ,
abbiamo quanto segue:
equazioni del tipo indicato, descrivendo un sottospazio vettoriale di W di Rn+1 ,
descrivono il corrispondente proiettificato P(W ).
Sottolineiamo che un vettore non nullo X~ = t(X , ..., X ) soddisfa le equazioni cartesiane,
0 n
ovvero quelle parametriche (per opportuni valori dei parametri), se e solo se le soddisfa
ogni suo multiplo. Ciò segue dal fatto che le equazioni sono omogenee. Detto in termini
~ appartiene a W se e solo se ogni suo multiplo vi
equivalenti, ciò segue dal fatto che X
appartiene.

Esempio. Nel piano proiettivo P2R , l’equazione


2 X0 − 3 X1 + 5 X2 = 0
definisce una retta r (il proiettificato di un piano in R3 ). Osserviamo che intersecando r
con la carta A0 otteniamo

r ∩ A0 = [X0 , X1 , X2 ] X0 6= 0 , 2 X0 − 3 X1 + 5 X2 = 0

= [1, x, y ] 2 − 3 x + 5 y = 0
che è una comunissima retta nel piano affine A0 (identificato con R2 , con coordinate x, y ).
Naturalmente se ci fosse stata data la retta r0 ⊆ A0 ∼= R2 di equazione 2 − 3 x + 5 y = 0
2
avremmo potuto considerare la retta r in PR di cui sopra ed osservare che r ∩ A0 = r0 .
Osserviamo che r ha esattamente un punto in più di r0 , infatti
r = r0 ∪ {[0, 5, 3 ]}
n p 6∈ A nX = 0
0 0
dove p = [0, 5, 3 ] è stato ricavato dal sistema , cioè ,
p ∈ r 2 X0 − 3 X1 + 5 X2 = 0
(si noti che p è il punto all’infinito di r0 ).

L’esempio della retta in P2R non ha nulla di speciale, potremmo considerare un sottospazio
n
proiettivo arbitrario di PR . Giusto per dare un altro esempio, il piano in P4R di equazioni

2 X0 − 3 X1 + 5 X2 − 4 X3 + X4 = 0
X0 − 7 X1 − 2 X2 + 3 X3 − X4 = 0
interseca la carta A0 (identificato con R4 con coordinate y1 , y2 , y3 , y4 ) nel piano dato
dal sistema 
2 − 3 y1 + 5 y2 − 4 y3 + y4 = 0
1 − 7 y1 − 2 y2 + 3 y3 − y4 = 0
e valgono considerazioni analoghe a quelle viste nel caso della retta.
8

Di seguito, discutiamo il caso generale (più che altro per fissare degli enunciati precisi).
n
Sia P(W ) un sottospazio proiettivo di PR . Assumiamo che sia definito dalle equazioni
cartesiane (1.18). Vogliamo vederlo in una carta locale Ai , ovvero intersecarlo con Ai
(che, lo ricordiamo, è un oggetto a noi familiare: si identifica con Rn ), ciò significa imporre
la condizione Xi 6= 0 . Per comodità di notazione trattiamo il caso i = 0 (la nostra carta
affine è la carta A0 ). Vista la definizione di A0 abbiamo

P(W ) ∩ A0 = [X0 , X1 , ..., Xn ] X0 6= 0 , “ valgono le equazioni (1.18)”

= [1, y1 , ..., yn ] “ (1, y1 , ..., yn ) soddisfa le equazioni (1.18)”

D’altro canto sostituendo (1, y1 , ..., yn ) nelle equazioni (1.18) si ottengono le equazioni
a
 0, 0 + a1, n y1 + ... + a0, n yn = 0

.
(♠) ..



am, 0 + a1, n y1 + ... + am, n yn = 0
che sono le equazioni del generico sottospazio affine di A0 (ogni sottospazio affine di A0 è
descritto da equazioni di tale tipo e viceversa). Questo dimostra quanto segue.
n
Lemma 1.19. Le intersezioni dei sottospazi proiettivi di PR con una carta affine fissata
sono (tutti e soli) i sottospazi affini di quella carta affine.

Tornando al sistema (♠), osserviamo che la sua matrice completa ha lo stesso rango della
matrice del sistema (1.18), di conseguenza, se è compatibile, si deve avere2

(1.20) dim P(W ) ∩ A0 = dim P(W )
Può anche accadere che non sia compatibile, dire ciò equivale a dire che il sistema (1.18)
non ha soluzioni del tipo “ (1, y1 , ..., yn )”, ovvero non ha soluzioni in A0 , ovvero che
P(W ) ∩ A0 è l’insieme vuoto. Riassumiamo quanto appena stabilito:
n n
Lemma 1.21. Se Ai è una carta affine fissata di PR e P(W ) ⊆ PR è un sottospazio
proiettivo, abbiamo la seguente dicotomia:
i) P(W ) ∩ Ai = ∅ (l’insieme vuoto);
ii) P(W ) ∩ Ai è un sottospazio affine di Ai della stessa dimensione di P(W ).
Il caso i) si verifica se P(W ) è contenuto nell’iperpiano all’infinito per la carta Ai , cioè
nell’iperpiano {Xi = 0}.

Corollario 1.22. Dato un sottospazio affine non vuoto L di Ai , esiste un unico sottospazio
n
proiettivo L ⊆ PR tale che
L ∩ Ai = L .

Dimostrazione. Poter passare dal sistema (♠) al sistema (1.18) garantisce l’esistenza di
n
un sottospazio proiettivo L ⊆ PR che interseca A0 esattamente in L . Due sottospazi
n
proiettivi L , L ′ ⊆ PR che incontrano A0 in L hanno la stessa dimensione di L (per il
Lemma 1.21), d’altro canto l’intersezione L ∩ L ′ incontra anch’essa A0 in L e, anch’essa,
deve avere la stessa dimensione di L . Ciò consente di concludere:
dim L = dim L ′ = dim L ∩ L ′ =⇒ L = L ′ .

n
Definizione 1.23. Dato L ⊆ Ai (sottospazio affine), il sottospazio proiettivo L ⊆ PR
indicato nel Corollario 1.22 si chiama
chiusura proiettiva di L .
2 Nella (1.20) “ dim ” ha due significati differenti: a sinistra indica la dimensione di un sottospazio affine di
n
A0 ∼= Rn , a destra indica la dimensione di un sottospazio proiettivo di PR (cfr. Definizione 1.3).
9

§ 2. Una conica nel piano proiettivo.

Consideriamo il piano proiettivo


P2R := P(R3 )
e, seguendo la Notazione 1.11, denotiamo con X0 , X1 , X2 le coordinate proiettive. Consi-
deriamo altresı̀ le tre carte affini introdotte nell’esempio 1.17. Mantenendo le stesse notazioni
ivi utilizzate consideriamo le tre carte affini

A0 = [ 1, x, y ] x, y ∈ R2 , ϕ0 : A0 −→ R2 , [ 1, x, y ] 7→ (x, y) ;

A1 = [ h, 1, k ] h, k ∈ R2 , ϕ0 : A0 −→ R2 , [ h, 1, k ] 7→ (h, k) ;

A2 = [ z, w, 1 ] z , w ∈ R2 , ϕ0 : A0 −→ R2 , [ z, w, 1 ] 7→ (z, w) .

Esempio 2.1. Consideriamo, nel piano proiettivo P2R , la conica


n 2 2 o

C := [X0 , X1 , X2 ] ∈ P2R X1 − 2 X0 X1 + X2 = 0

questo significa che C è il luogo dei punti p = [X0 , X1 , X2 ] ∈ P2R per i quali la terna
(X0 , X1 , X2 ) soddisfa l’equazione indicata.

Va osservato che per l’omogeneità dell’equazione che definisce C , che di seguito denotiamo con f , se
′ ′ ′
due terne (X0 , X1 , X2 ) e (X0 , X1 , X2 ) rappresentano lo stesso punto p , ovvero (X0 , X1 , X2 ) =
′ ′ ′ ′ ′ ′
λ · (X0 , X1 , X2 ) , si ha f (X0 , X1 , X2 ) = λ2 · f (X0 , X1 , X2 ) (si verifichi quanto appena affermato). Di
conseguenza, essendo λ 6= 0 , risulta
′ ′ ′
f (X0 , X1 , X2 ) = 0 ⇐⇒ f (X0 , X1 , X2 ) = 0 ,
sebbene non abbia senso scrivere “f (p)” (perché dipende dalla terna scelta per rappresentare il punto p ),
l’annullarsi o meno di f in p ha perfettamente senso.

Intersecando C con la carta affine A0 otteniamo


n X1
2
− 2 X0 X1 + X2
2 o

A0 ∩ C = [X0 , X1 , X2 ] ∈ P2R X0 6= 0 , 2 = 0
X0

2
(l’aver diviso tutta l’equazione per X0 è una scelta arbitraria, avremmo potuto dividere per 75318 o
2
per qualsiasi espressione mai nulla, dividiamo per X0 per ragioni di convenienza: al fine di ottenere
X1 X2
un’equazione in e , che sono le coordinate della nostra carta locale A0 ).
X0 X0

L’equazione indicata la possiamo riscrivere nella forma


 2  2
X1 X
X0
−1 + X2 = 1
0

di conseguenza ricordando la definizione della carta affine ϕ0 otteniamo


 
ϕ0 A0 ∩ C = (x, y) ∈ R2 (x − 1)2 + y 2 = 1

equivalentemente

A0 ∩ C = [1, x, y ] (x − 1)2 + y 2 = 1 , x, y ∈ R2 .

Analogamente otteniamo
n 2 2 o
X1 − 2 X0 X1 + X2
A1 ∩ C = [X0 , X1 , X2 ] ∈ P2R X1 6= 0 , 2 = 0
X1
10

e, di conseguenza,
 
ϕ1 A1 ∩ C = (h, k) ∈ R2 1 − 2 h + k 2 = 0 ,
equivalentemente

A1 ∩ C = [h, 1, k ] 1 − 2 h + k 2 = 0 , h, k ∈ R2 .

Infine
n 2 2 o
X1 − 2 X0 X1 + X2
A2 ∩ C = [X0 , X1 , X2 ] ∈ P2R X2 6= 0 , 2 = 0
X2

e, di conseguenza,
 
ϕ2 A2 ∩ C = (z, w) ∈ R2 w2 − 2 z w + 1 = 0 .
equivalentemente

A2 ∩ C = [z, w, 1 ] w2 − 2 z w + 1 = 0 , z , w ∈ R2 .

Osserviamo che le equazioni che rappresentano C nelle tre carte affini sono rispettivamente
(x − 1)2 + y 2 = 1 che è l’equazione di una ellisse,
1 − 2 h + k 2 = 0 che è l’equazione di una parabola,
w2 − 2 z w + 1 = 0 che è l’equazione di una iperbole
(ciò non deve sorprendere troppo, in fin dei conti si tratta di tre oggetti diversi, le tre
intersezioni A0 ∩ C , A1 ∩ C e A2 ∩ C , ognuna delle quali peraltro espressa nelle
coordinate della carta locale che la riguarda). La ragione di quanto accade si può spiegare
con una figura, disegnando C nella carta affine A0 , e disegnando i punti dove X0 = 0
come punti all’infinito di questa carta affine (retta tratteggiata), abbiamo la seguente figura

Nella carta A1 il punto o non c’è


retta X0 = 0 (la retta X1 = 0 è la retta all’infinito
per la carta A1 ), per questa ragione
nella carta A1 vediamo tutta la co-
retta X1 = 0 nica C tranne un punto, questa ci
appare come una parabola. Nel caso
C in esame si tratta della parabola di
equazione
h = 12 k 2 + 21
(oggetto che “si richiude” in o , il
retta X2 = 0 o p punto all’infinito dell’asse k = 0 ).

Nella carta A2 i punti o e p non


ci sono (la retta X2 = 0 è la retta
all’infinito per la carta A2 ), nella
o = [1, 0, 0] carta A2 vediamo tutta la conica C
p = [1, 2, 0] tranne due punti, questa ci appare
come una iperbole (i cui due rami
sono, nella figura, le due semicircon-
ferenze rispettivamente sopra e sotto
la retta X2 = 0 ).

Torniamo a ciò che vediamo nella carta A1 , cioè all’espressione



A1 ∩ C = [h, 1, k ] 1 − 2 h + k 2 = 0 , h, k ∈ R2 ,
11

che riscriviamo nella forma



A1 ∩ C = [ 21 k 2 + 12 , 1 , k ] k ∈ R .

Per k 6= 0 abbiamo
2
[ 12 k 2 + 12 , 1 , k ] = [ k2 k+1
2 ,
1
k2 , 1
k ]

che per k che va all’infinito ci restituisce il punto [ 21 , 0 , 0 ] = [1 , 0 , 0 ], che è il punto o .

Questo dovrebbe convincervi, al di là dei conti formali, quelli fatti sopra nelle varie carte locali per intenderci,
che la parabola che vediamo nella carta A1 si richiude all’infinito nel punto o (si riguardi la figura tenendo
presente che l’asse verticale, cioè la retta X1 = 0 , è la retta all’infinito per la carta A1 ).

Analogamente

A2 ∩ C = [z, w, 1 ] w2 − 2 z w + 1 = 0 , z , w ∈ R2 ,

da questa ricaviamo3 w = z ± z 2 − 1 , ovvero abbiamo i punti del tipo

[ z , z ± z2 − 1 , 1 ] , z ∈ R ,

questi sono i punti del tipo (dividiamo per z )



z± z 2 −1 1
[1, z , z ] , z ∈ R.

Per z che va all’infinito quanto scritto ci restituisce (si calcolino i due limiti) i punti che già
conoscevamo:
p = [1, 2, 0] e o = [1, 0, 0] .

Terminiamo con un’ultima osservazione che ci sembra interessante. Nella carta A0 , le rette
tangenti a C nei punti o e p sono rispettivamente le rette r ed s di equazioni
r : {x = 0} e s : {x = 2}
(nella figura, sono le due rette verticali passanti per o e p). In coordinate omogenee, queste
due rette hanno equazioni
X X
r : { X1 = 0 } e s : { X1 = 2 }
0 0

2
pertanto corrispondono alle rette in P di equazioni
r : { X1 = 0 } e s : { X1 = 2 X0 } .
Queste, nella carta A2 hanno equazioni
X X X
r : { X1 = 0 } e s : { X1 = 2 X0 } .
2 2 2

ovvero equazioni
r : {w = 0} e s : { w − 2z = 0 } .
Questi sono esattamente gli asintoti dell’iperbole di equazione
w2 − 2 z w + 1 = 0 ,
infatti w2 − 2 z w = w · (w − 2z ). I punti o e p (che non appartengono ad A2 ) sono
i punti all’infinito dell’iperbole ed i due asintoti sono le tangenti all’iperbole nei suoi due
punti all’infinito.

2
3 Potremmo ricavare z = w2 w +1
, ma ciò ci costringerebbe ad assumere w 6= 0 , cosa che non vogliamo fare
per “ non perderci per strada” il punto o !
12

§ 3. Qualche osservazione sui sottospazi di uno spazio proiettivo.

In questa sezione vogliamo esportare in ambito proiettivo alcuni risultati di algebra


lineare. Fissiamo una volta per tutte uno spazio proiettivo di dimensione n

P = P(V )

(quindi dim V = n+1 ).



Lemma 3.1. Se Si = P(Wi ) è una famiglia di sottospazi proiettivi di P (n.b.: i Wi
sono sottospazi vettoriali di V ), allora
T T 
(3.1′ ) Si = P Wi .
Questo insieme è un sottospazio proiettivo di P.

Dimostrazione. Iniziamo con una premessa. L’intersezione di sottospazi vettoriali è un


sottospazio vettoriale, nel nostro caso l’intersezione ∩Wi è un sottospazioTvettoriale
 di V .
Di conseguenza, ha senso considerare il corrispondente proiettivizzato P Wi (che è un
sottospazio proiettivo di P).
Resta da provare l’uguaglianza (3.1′ ). Se A è un punto che appartiene all’insieme a sinistra,
cioè a tutti gli Si , allora un qualsiasi vettore ~v che lo rappresenti appartiene a tutti i Wi ,
quindi A ∈ P(∩Wi ). Viceversa, se [~v ] ∈ P(∩Wi ) si ha che [~v ] appartiene ad ogni P(Wi ),
cioè appartiene ad ogni Si .


Sottolineamo che il Lemma 3.1 ci dice, in particolare, che


“ l’intersezione di sottospazi proiettivi è un sottospazio proiettivo”.

Sintetizzando: sappiamo che l’intersezione di sottospazi vettoriali è un sottospazio vettoriale, cioè che la
prerogativa di essere un sottospazio vettoriale è “ stabile rispetto all’intersezione”, se si cava l’origine e si
quozienta con la relazione di proporzionalità ciò continua a valere (quindi vale in ambito proiettivo).

Nota. Naturalmente può accadere che l’intersezione degli Si sia vuota, equivalentemente
che l’intersezione dei Wi sia il sottospazio costituito esclusivamente dal vettore nullo.

Definizione 3.2. Dato un sottoinsieme Ω ⊆ P, poniamo


\
hΩi = S,
S ∈ {sottospazi di P contenenti Ω}

Osservazione. Per il Lemma 3.1 si ha che h Ω i è un sottospazio proiettivo di P. Inoltre,


poiché h Ω i è definito intersecando tutti i sottospazi di P contenenti Ω, è il “ più piccolo ”
sottospazio proiettivo di P contenente Ω nel senso che segue:
h Ω i è contenuto in ogni sottospazio proiettivo contenente Ω.

Il lemma che segue ci dà una descrizione esplicita di h Ω i .

Lemma 3.3. Dato un sottoinsieme Ω ⊆ P, posto



e :=
Ω ~v ∈ V ~v rappresenta un qualche punto A ∈ Ω
si ha che 
hΩi = e
P Span{Ω}

è un sottospazio proiettivo di P contenente Ω (ed è contenuto in ogni altro sottospazio


proiettivo di P contenente Ω).
13

Dimostrazione. Posto J = e
sottospazi vettoriali di V contenenti Ω abbiamo
T
e
Span {Ω} = W
W ∈J

(risultato noto di algebra lineare). Proiettivizzando si ottiene


   
T T
P Span{Ω} e = P W = P(W ) = hΩi
W ∈J W ∈J
(Lemma 3.1)

e ovvero i vari P(W ) i


dove, essendo i vari W i sottospazi vettoriali di V contenenti Ω,
sottospazi di P contenenti Ω, l’ultima uguaglianza segue dalla definizione di h Ω i. 

Definizione 3.4. Il sottospazio h Ω i si chiama sottospazio proiettivo generato da Ω.

Esercizio 3.5. Siano S1 = P(W1 ) e S2 = P(W2 ) sottospazi proiettivi di P. Provare che


h S1 ∪ S2 i = P(W1 + W2 )

Suggerimento. Si verifichi che W1 + W2 = Span{W1 ∪W2 } , quindi si utilizzi il Lemma 3.3.

Esercizio 3.6. Si provi che dati un sottoinsieme Ω ⊆ P ed un punto A ∈ P si ha la


seguente dicotomia:
• A ∈ h Ω i , in questo caso h {A} ∪ Ω i = h Ω i ;
• A 6∈ h Ω i , in questo caso dim h {A} ∪ Ω i = dimh Ω i + 1 .

Un altro risultato che possiamo mutuare immediatamente dai risultati di algebra lineare
è la formula di Grassmann:

Proposizione 3.7. Dati S1 ed S2 sottospazi proiettivi di P si ha

(♣) dim h S1 ∪ S2 i = dimS1 + dim S2 − dim (S1 ∩ S2 ) .

Dimostrazione. Siano S1 = P(W1 ) e S2 = P(W2 ) , per i risultati precedenti abbiamo


 
S1 ∪ S2 = P W 1 + W 2 e S1 ∩ S2 = P W 1 ∩ W 2
D’altro canto, per la formula di Grassmann in ambito vettoriale abbiamo
 
dim W1 +W2 = dim W1 + dim W2 − dim W1 ∩ W2 ,
quindi h i h i h i h i
 
dim W1 +W2 − 1 = dim W1 − 1 + dim W2 − 1 − dim W1 ∩ W2 − 1 .

Poiché, in generale,
dim P(W ) = dim W − 1 ,
(cfr. Def. § 1, 3) i quattro valori tra parentesi quadre sono le dimensioni che compaiono nella formula (♣).


Praticamente, la formula di Grassmann in ambito proiettivo segue da quella nota nel caso degli spazi
vettoriali e dalla Definizione 1.3. Se W ha dimensione 0 (cioè W è costituito solamente dal vettore nullo),
allora P(W ) è l’insieme vuoto. Vista la centralità della Definizione 1.3 nella dimostrazione precedente, se
si vuole che la Proposizione (3.7) valga anche quando S1 ed S2 sono sghembi, cioè non hanno punti in
comune, si deve assumere (e si assume) la seguente convenzione:
Convenzione 3.8. L’insieme vuoto ha dimensione −1 .

Nota 3.9. Come sappiamo, l’unione di due sottospazi vettoriali di V è un sottospazio vettoriale di V se
e solo se uno dei due sottospazi contiene l’altro. Lo stesso risultato vale in ambito proiettivo: l’unione di due
sottospazi proiettivi di P è un sottospazio proiettivo di P se e solo se uno dei due sottospazi contiene l’altro.
(Giusto per ribadire il concetto, sia in ambito vettoriale che proiettivo abbiamo che l’unione di sottospazi
14

non è mai un sottospazio, eccetto che nel caso banale dove “ uno dei due contiene l’altro”).

Dato Ω ⊆ P, di fatto abbiamo introdotto h Ω i come il più piccolo sottospazio di P


contenente Ω (Lemma 3.1 e Lemma 3.3). Naturalmente vale ciò che ci si aspetta :
dati tre punti non allineati4 A, B, C , due rette distinte r ed s con A 6∈ r , si ha che
• h {A, B} i è la retta per A e B ;
• h {A, B, C} i è il piano per A, B e C ;
• h {A} ∪ r i è il piano contenente r passante per A ;

un piano , se r ed s sono incidenti ;
• h r ∪ s i è
un sottospazio di dimensione 3 , se r ed s sono sghembe .

Esercizio 3.10. Si determinino dimensioni e equazioni sia parametriche che cartesiane dei sottospazi
proiettivi, dello spazio proiettivo P, generati dall’insieme Ω nei seguenti casi:
3
a) P = PR , Ω = { [ 3, 0, 2, 1 ] , [ 0, 0, 0, 1 ] } ;
3
b) P = PR , Ω = { [ 1, 0, 1, 0 ] , [ 2, 0, 2, 1 ] , [ 1, 0, 1, 1 ] } ;
3
c) P = PR , Ω = { [ 1, 1, 0, 1 ]} ∪ r , dove r è la retta x0 + x2 = x0 + x1 − x3 = 0 ;
4
d) P = PR , Ω = { r ∪s } , dove r è la retta x0 = x1 = x2 = x4 ed s è la retta x0 = x2 = x0 +x1 = x3 .
9 
e) P = PR , Ω = {p} ∪ H , dove p è un punto della carta locale A0 , H è l’iperpiano all’infinito di A0 .

4 Quindi, in particolare, distinti.


15

Proiettività.
n n
Consideriamo lo spazio proiettivo PR = P(Rn+1 ), ricordiamo che un punto in PR è
una classe di equivalenza  
A = X0 , . . . , Xn
di vettori non nulli
t 
X0 , . . . , Xn ∈ Rn+1 r {~0} ,

dove due tali vettori t ( X0 , . . . , Xn ) e t ( X0′ , . . . , Xn′ ) sono equivalenti se sono pro-
porzionali, cioè se esiste una costante λ ∈ R tale che
t  t 
X0 , . . . , Xn = λ X0′ , . . . , Xn′

(essendo i due vettori non nulli, la costante λ sarà anch’essa necessariamente non nulla).

Avvertenza. In algebra lineare i vettori di Rk vengono sempre indicati per colonna, noi rispettiamo
questa regola (la piccola t a sinistra di una matrice riga indica la trasposizione, cosa che la rende una
matrice colonna). D’altro canto, cosı̀ come abbiamo sempre fatto e com’è consuetudine, i punti dello spazio
n
proiettivo PR li indichiamo per riga (e tra parentesi quadre). Va da sé che, per convenzione, “ le parentesi
quadre di un vettore in Rk ” includono questo passaggio, per intenderci
[2, 3] = [ 23 ] = “ classe di equivalenza del vettore 23 ” .
 

Osservazione 4.1. Se M ∈ Mh, k (R) è una matrice (h righe, k colonne) e ~v ∈ Rk è un


vettore, si ha
M ·(λ~v ) = λ M ~v , ∀ λ ∈ R.

Per l’Osservazione 4.1, data una matrice invertibile M ∈ Mn+1, n+1 (R) , la funzione
n n
f : PR −−−−→ PR
(4.2)  
A 7→ M · ~v
è ben definita, essendo A come sopra e ~v il vettore t(X0 , . . . , Xn ) ∈ Rn+1 .

Osservazione 4.3. Le matrici M e λM (con λ 6= 0) definiscono la stessa funzione f .


Viceversa, se due matrici invertibili M e M ′ definiscono la stessa funzione, allora si deve
avere M ′ = λM (per un qualche valore λ).

Esercizio 4.4. Si dimostri quanto affermato nell’osservazione precedente.


Suggerimento. [M ~v ] = [M ′ ~v ] =⇒ M −1 M ′ ~ v = λ ~v (per qualche λ 6= 0 , che a priori dipende da ~v ). Si
v . A tal fine si confrontino le tre uguaglianze M −1 M ′ ~
deve provare che in effetti λ non dipende da ~ v = λ1 ~
v,
M −1 M ′ w
~ = λ2 w ~ , M −1 M ′ (~
v + w)
~ = λ3 (~ v + w)
~ e si deduca che si deve avere λ1 = λ2 .

Definizione 4.5. Due matrici M e M ′ le dichiariamo equivalenti se esiste λ 6= 0 tale


che M ′ = λM , la classe di equivalenza di una matrice M la denotiamo con [M ].

Definizione 4.6. Una funzione come nella (4.2) si chiama proiettività.



In altri termini, una funzione f : P n −→ P n è una proiettività se esiste una matrice M
R R
per la quale risulti

n
f ([~v ]) = [M ~v ] , ∀ [~v ] ∈ PR


(una tale M è invertibile, se non lo fosse f non sarebbe definita ovunque).

Naturalmente la definizione si può dare più in generale, per spazi proiettivi astratti (e
non serve che dominio e codominio coincidano):
16

Definizione 4.6bis . Siano P(V ) e P(W ) due spazi proiettivi, una funzione
[L] : P(V ) −−−−→ P(W ) , [~v ] 7→ [L(~v )]
indotta da un’applicazione lineare iniettiva L : V −→ W si chiama trasformazione proiettiva.

Avvertenza. Se L non è iniettiva, per ~v ∈ ker L abbiamo che [L(~ v )] non ha senso, di conseguenza,
almeno cosı̀ come l’abbiamo scritta, la stessa [L] non ha senso. In realtà la funzione [L] ha senso, ma a
condizione di escludere dal dominio il proiettificato del nucleo di L , cioè abbiamo una funzione
[L] : P(V ) r K −−−−−→ P(W ) , [~
v ] 7→ [L(~
v )]
dove K = P(ker L) , insieme che sappiamo essere un sottospazio proiettivo del nostro P(V ) .

Le proiettività (e più in generale le trasformazioni proiettive, def. 4.6bis ) conservano i


sottospazi proiettivi: mandano rette in rette, piani in piani eccetera. Infatti se P′ è un
n
sottospazio proiettivo di PR , assumendo che P′ sia il sottospazio di equazioni parametriche
[X] = [ t0~v0 + ... + tk~vk ] ,
′ n
ed f sia la proiettività (4.2), allora f (P ) è il sottospazio di PR di equazioni parametriche
[X] = [ t0 w
~ 0 + ... + tk w
~k ] , w
~ i = M ~vi
n
che, come P′ , è un sottospazio di PR di dimensione k .
Voglio insistere su questa proprietà da un punto di vista leggermente differente (ma nella sostanza equi-
valente). Dunque, se ad esempio in P3R abbiamo tre punti allineati, anche le loro immagini tramite f
sono punti allineati. Esempio: i punti [~ u ] = [1, 0, 5, 2] , [~
v ] = [2, 1, 0, 1] , [w
~ ] = [3, 1, 5, 3] sono
allineati (a livello di rappresentanti il terzo è la somma dei primi due), applicando f otteniamo i punti
[M ~u ] , [M~
v ] , [M w
~ ] , che sono anch’essi allineati a livello di rappresentanti il terzo continua ad essere la

somma dei primi due, infatti w ~ = ~
u+~ v =⇒ M w ~ = M~ u + M~ v .

Le trasformazioni lineari di Rn+1 , ovvero le matrici invertibili di ordine n + 1 , formano


un gruppo5 , che si denota con GLn+1 (R), quozientando con la relazione che identifica
matrici proporzionali tra loro si ottiene il cosiddetto gruppo lineare proiettivo

P GLn+1 (R) := [M ] M ∈ GLn+1 (R)
essendo [M ] come nella definizione (4.5).

Sottolineiamo che per l’osservazione (4.3) due matrici sono nella stessa classe di proporzionalità (cfr. Def. 4.5)
n
se e solo se definiscono la stessa proiettività di PR .

A questo punto si potrebbe pensare che la strada sia in discesa, che la risoluzione di
problemi concernenti le proiettività sia una mera applicazione di ciò che si conosce sulle
applicazioni lineari tra spazi vettoriali. Ad esempio si potrebbe erroneamente credere che,
essendo un’applicazione lineare determinata dalle immagini dei vettori di una base del do-
n
minio, per dare una proiettività di PR basta dare le immagini di n+1 punti “ indipendenti”.
Purtroppo non è cosı̀. Per illustrare il problema diamo un esempio.

Esempio 4.7. Consideriamo la retta proiettiva P1R ed i punti

A = [1 , 3 ] , B = [2 , −1 ] , C = [1 , 1 ] , D = [−1 , 2 ] .

Le funzioni
f: P1R −−−−→ P1R g: P1R −−−−→ P1R
h  i h  i
1 9 X0 5 −4 X0
[X0 , X1 ] 7→ [X0 , X1 ] 7→
10 6 X1 −13 2 X1
5 Chi non avesse studiato algebra astratta non si spaventi, non utilizzeremo nulla di teoria dei gruppi, neanche
la definizione di gruppo! ...vi basti sapere che si tratta di un insieme i cui elementi possono essere moltiplicati
tra loro (e, ai nostri fini, ciò che conoscete sul prodotto tra matrici è più che sufficiente).
17

mandano entrambe A e B rispettivamente in C e D , cioè

f (A) = g(A) = C , f (B) = g(B) = D

nonostante f e g siano funzioni diverse, ad esempio f (E) 6= g(E) per E = [1, 0 ]


(giusto per ribadire quanto osservato, si noti che le due matrici che abbiamo scritto sono
palesemente non proporzionali).

Naturalmente, come sappiamo, esiste un’unica applicazione lineare L : R2 −→ R2 che, posto

~a = 13 , ~b = −1 2 
, ~c = 11 , d~ = −1
  
2
soddisfa le condizioni
L(~a) = ~c e L(~b) = d~

che naturalmente ci dà anch’essa una proiettività l : P1R −→ P1R soddisfacente l(A) = C , l(B) = D .
Il problema che abbiamo nel caso proiettivo nasce dal fatto che dare una condizione sui rappresentanti è più
forte che darla sui punti dello spazio proiettivo.

Fortunatamente il Teorema Fondamentale sulle Proiettività (4.12) enunciato poco più


avanti ci dice quand’è che una proiettività che mandi certi punti in certi altri punti è univo-
camente determinata, come vedremo questo Teorema presenta anche il vantaggio di aprire
la strada a un piccolo trucco per determinare la proiettività in questione. Per procedere
abbiamo bisogno di una nozione.

Definizione 4.8. Consideriamo uno spazio proiettivo P di dimensione n. Diremo che i


punti
A1 , ... , Ak

sono in posizione generale se comunque si prende un sottoinsieme S ⊆ {A1 , ... , Ak } , si


ha che S non è contenuto in alcun sottospazio proiettivo di P di dimensione

(♣) d = min { n−1 , s−2 } ,

dove s denota il numero di punti di S (detto in altri termini, la dimensione del più piccolo
sottospazio contenente S deve essere la massima possibile, che è min { n , s−1 } ).

Osservazione 4.9. Stiamo considerando punti in uno spazio di dimensione n (il nostro ambiente).
D’altro canto, cosı̀ come due punti stanno sempre su una retta, tre punti in un piano, abbiamo che s punti
stanno sempre in uno spazio di dimensione s−1 . Quindi s dei nostri punti (il sottoinsieme S di cui sopra)
sono sicuramente contenuti in uno spazio di dimensione δ = min { n , s−1 } , noi richiediamo che non siano
contenuti in uno spazio più piccolo (si confronti con ♣).

Detto in termini più vaghi, l’idea di fondo è che dei punti presi a caso siano in posizione generale, vediamo
nel dettaglio cosa ci dice la definizione in alcuni casi:

P1R due o più punti sono in posizione generale se e solo se sono distinti;

P2R due punti sono in posizione generale se e solo se sono distinti,


tre o più punti sono in posizione generale se e solo se, tra essi, non ci sono terne di punti allineati;

P3R due punti sono in posizione generale se e solo se sono distinti,


tre punti sono in posizione generale se e solo se non sono allineati,
quattro o più punti sono in posizione generale se e solo se, tra essi,
non ci sono quaterne di punti contenute in un piano;

P4R due punti sono in posizione generale se e solo se sono distinti,


tre punti sono in posizione generale se e solo se non sono allineati,
quattro punti sono in posizione generale se e solo se non sono contenuti in un piano,
cinque o più punti sono in posizione generale se e solo se, tra essi,
non ci sono cinquine di punti contenute in un sottospazio di dimensione 3.
18

Esercizio 4.10. Si provino le affermazioni scritte nella lista.


Suggerimento. Si provi che aggiungendo un punto ad un insieme, il più piccolo spazio proiettivo che lo
contiene cresce, al più, di una dimensione.
n
Esercizio 4.11. Si provi che, nello spazio PR , i punti [~ v1 ] , ... , [~
vk ] sono in posizione generale se e solo
se qualsiasi sottoinsieme σ dell’insieme dei vettori ~
v1 , ... , ~
vk che li rappresentano genera un sottospazio
di Rn+1 la cui dimensione è la massima possibile (che è il minimo tra la dimensione dell’ambiente, cioè
n+1 , ed il numero s := “ numero dei vettori di σ ”).
n
Noi siamo interessati al caso dove si hanno n+2 punti in PR : i punti [~v1 ], ... , [~vn+2 ] sono in
posizione generale se e solo se comunque si scelgono n+1 punti (cioè se ne scarta uno), questi
non sono contenuti in un iperpiano (cioè in un sottospazio proiettivo di dimensione n−1 ).
A livello di rappresentanti la condizione data si traduce nella richiesta seguente: comunque
si scelgono n + 1 vettori tra i vettori ~vi dati, questi sono indipendenti (cioè non sono
contenuti in un sottospazio vettoriale di Rn+1 di dimensione n).

n
Teorema 4.12 (Fondamentale sulle Proiettività). Si considerino nello spazio proiettivo PR
due insiemi ordinati  
A1 , ... , An+2 e B1 , ... , Bn+2
ciascuno costituito da n+2 punti in posizione generale. Si ha che
n n
esiste un’unica proiettività f : PR −−−−→ PR tale che f (Ai ) = Bi , ∀ i .
n
Il teorema, che abbiamo voluto enunciare per PR , naturalmente vale anche nel caso astratto, ed in effetti
non è nemmeno necessario che dominio e codominio coincidano :
Teorema 4.12bis . Dati P e P ′ , spazi proiettivi di dimensione n , dati inoltre due insiemi ordinati
 
A1 , ... , An+2 ⊆ P e B1 , ... , Bn+2 ⊆ P′
ciascuno costituito da n+2 punti in posizione generale. Si ha che
esiste un’unica trasformazione proiettiva f : P −→ P ′ tale che f (Ai ) = Bi , ∀ i .

Questo Teorema lo dimostriamo più avanti (subito dopo l’inciso 4.16). Intanto vediamo
due sue importanti conseguenze, la prima delle due è che il Teorema giustifica la definizione
(4.13) che segue.

Definizione 4.13. Dato uno spazio proiettivo astratto P di dimensione n,


• un sottoinsieme costituito da n+2 punti in posizione generale

E0 , ... , En+1 , U
si chiama riferimento proiettivo;
• i punti Ei vengono detti punti fondamentali ed il punto U viene detto punto unità.

La ragione per la quale il Teorema precedente giustifica questa definizione è presto detta:
essendo un riferimento proiettivo costituito da n+2 punti in posizione generale, ci consente
n
di identificare il nostro spazio astratto P con lo spazio PR , l’identificazione sarà data dalla
trasformazione proiettiva
n
f : P −−−−→ PR
la cui esistenza e unicità sono garantite dal Teorema 4.12bis . Naturalmente si deve fissare
n n
un riferimento proiettivo anche su PR , è stato deciso una volta per tutte che su PR si
considera il riferimento proiettivo dove
Ei = [ 0, ..., 1 , ..., 0 ] , U = [ 1 , ... , 1 ]
(posto i ) (tutti 1 )

n
(che viene chiamato riferimento canonico di PR ).
19

Nota 4.14. Visto l’esercizio (4.10) e le definizioni appena date, abbiamo che
• un sistema di riferimento su una retta proiettiva è dato da 3 punti distinti, il riferimento
canonico di P1R è

RCan (P1R ) = [1, 0 ] , [0, 1 ] , [1, 1 ] ;
• un sistema di riferimento su un piano proiettivo è dato da 4 punti tra i quali non ci
sono terne di punti allineati, il riferimento canonico di P2R è

RCan (P2R ) = [1, 0, 0 ] , [0, 1, 0 ] , [0, 0, 1 ] , [1, 1, 1 ] ;
• un sistema di riferimento su uno spazio tridimensionale proiettivo è dato da 5 punti
senza quaterne di punti su uno stesso piano, il riferimento canonico di P3R è

RCan (P3R ) = [1, 0, 0, 0 ] , [0, 1, 0, 0 ] , [0, 0, 1, 0 ] , [0, 0, 0, 1 ] , [1, 1, 1, 1 ] .

Esercizio 4.15. Disegnare la retta proiettiva P1R come completamento proiettivo della retta affine R e
individuare i punti del riferimento canonico. Disegnare il piano proiettivo P2R come completamento proiettivo
del piano affine R2 e individuare i punti del riferimento canonico.
(In entrambi i casi ci saranno sia dei punti al finito che dei punti all’infinito).

A questo punto vediamo qual è la seconda conseguenza del Teorema 4.12 :


n
abbiamo un metodo, descritto sotto, per determinare una proiettività di PR che
manda n+2 punti in posizione generale in altri n+2 punti in posizione generale,
come conseguenza del Teorema 4.12 questo metodo ci dà la proiettività che soddisfa
la condizione richiesta.
Il metodo è il seguente: siano dunque dati due insiemi di n+2 punti in posizione generale
 
A1 , ... , An+2 e B1 , ... , Bn+2

Passo 1. fissiamo dei vettori ~a1 , ... , ~an+2 ∈ Rn+1 che rappresentano gli Ai ;
Pn+1
Passo 2. scriviamo ~an+2 come combinazione lineare dei precedenti i = 1 ci~
ai
(osserviamo che essendo gli Ai in posizione generale, i vettori ~a1 , ... , ~an+1 costituiscono
una base di Rn+1 ed inoltre i coefficienti ci sono tutti diversi da zero);
Passo 3. sostituiamo ~ai con ci~ai (per i = 1, ..., n+1);
Passo 4. ripetiamo i passi precedenti per l’insieme dei punti Bi .
Osserviamo che a questo punto abbiamo dei rappresentanti ~a1 , ... , ~an+2 e ~b1 , ... , ~bn+2
per i quali risulta
~an+2 = ~a1 + ... + ~an+1 e ~bn+2 = ~b1 + ... + ~bn+1
Passo 5. Troviamo una matrice M di ordine n+1 che manda i vettori ~a1 + ... + ~an+1 nei
vettori ~b1 + ... + ~bn+1 .
   
| | | |
Osserviamo che dovendo risultare M ·  ~a1 . . . ~an+1  =  ~b1 . . . ~bn+1  si ha
| | | |
   −1
| | | |
M =  ~b ~
. . . bn+1  ·  ~
a 1 . . . ~an+1 
1
| | | |

(la notazione è quella solita: le due matrici che abbiamo introdotto hanno per colonne i
vettori indicati al loro interno. Ricordiamo che sono matrici invertibili, essendo i vettori
~a1 + ... + ~an+1 , come pure i vettori ~b1 + ... + ~bn+1 , indipendenti).

La classe [M ] ∈ P GLn+1 (R) definisce la proiettività che cerchiamo.


20

Dimostrazione. Per costruzione risulta M ~ai = ~bi per i = 1, ..., n+1 . D’altro canto
Pn+1  Pn+1 Pn+1 ~ ~
M ~an+2 = M i=1~ai = i=1 M~ ai = i = 1 bi = bn+2 .

Di conseguenza la proiettività
n n
f : PR −−−−→ PR , f (~v ) = [M~v ]
soddisfa la condizione richiesta f (Ai ) = Bi , i = 1, ..., n+2 . Ribadiamo che l’unicità di
una proiettività che mandi gli Ai nei Bi è assicurata dal Teorema 4.12.


Inciso 4.16. Il metodo precedente è costruttivo, ci consente di scrivere la proiettività


che manda gli n + 2 punti del primo insieme negli n + 2 punti del secondo, in particolare
dimostra una parte del Teorema 4.12 : l’esistenza di una f che soddisfi le richieste.

Dimostrazione (del Teorema 4.12). Come già osservato nell’inciso 4.16,


esiste una proiettività f che manda gli Ai nei Bi , i = 1, ..., n + 2 .
resta da provare l’unicità di una tale proiettività.

Per provare l’unicità, come spesso accade in questo tipo di situazioni, possiamo ridurci al
caso dove sia gli Ai che i Bi sono i punti del riferimento canonico (in particolare coincidono),
ovvero a provare che l’identità Id è l’unica proiettività che manda i punti del riferimento
n
canonico di PR in se stessi. Infatti, indicando con α la proiettività che manda i punti del
riferimento canonico negli Ai , se g è un’altra proiettività che manda gli Ai nei Bi . la
composizione
n α n f n g−1 n α−1 n
h : PR −−−−→ PR −−−−→ PR −−−−→ PR −−−−→ PR ,
manda i punti del riferimento canonico in se stessi e, naturalmente,
h = Id =⇒ α−1 ◦ h ◦ α ◦ g = α−1 ◦ Id ◦ α ◦ g .
| {z } | {z }
(da provare)
(= f ) (= g)

Dunque, proviamo che l’identità Id è l’unica proiettività che manda i punti del riferi-
mento canonico in se stessi. Una matrice che rappresenti una tale proiettività h, essendo
h(Ei ) = Ei , deve mandare i vari vettori della base canonica di Rn+1 in loro multipli,
quindi deve essere una matrice diagonale non degenere, cioè deve essere una matrice del tipo
∆ = diag {λ1 , ..., λn } con i λi non nulli. D’altro canto posto ~u = t (1, ..., 1), vettore che
rappresenta il punto unità U del riferimento canonico, si deve avere h(U ) = U , ovvero
∆ ~u = λ~u per un qualche λ 6= 0 . Da questa relazione segue che i vari λi sono tutti uguali
a λ, in particolare sono uguali tra loro. Di conseguenza h = [∆] = Id .

21

Tornando ai riferimenti proiettivi, osserviamo che li incontriamo quando diamo un sot-


tospazio di uno spazio proiettivo in forma parametrica. Ad esempio, nell’ambiente P3R con
coordinate standard X0 , X1 , X2 , X3 , la retta r di equazioni parametriche
     
X0 1 1
X   5  0
 1
X  = t0  
 −1  + t1  

2 1
X3 3 1

è la retta in P3R data dal riferimento



R(r) = [1, 5, −1, 3] , [1, 0, 1, 1] , [2, 5, 0, 4]
(= E0 ) (= E1 ) (= U)

dove: E0 si ottiene per [t0 , t1 ] = [1, 0] ,


E1 si ottiene per [t0 , t1 ] = [0, 1] ,
U si ottiene per [t0 , t1 ] = [1, 1] .

Vale la pena sottolineare che il punto unità ha un suo ruolo, ad esempio la stessa retta
r parametrizzata dalle equazioni
     
X0 1 2
 X1   5  0
  = t0   + t1  
X2 −1 2
X3 3 2
3
è la retta in PR data dal riferimento

R(r) = [1, 5, −1, 3] , [1, 0, 1, 1] , [3, 5, 1, 5]
(= E0 ) (= E1 ) (= U ′ )

(n.b.: [2, 0, 2, 2] = [1, 0, 1, 1]) ...è cambiato solamente il punto unità ! (In un qualche
senso, fissati i punti fondamentali E0 , . . . , En di un riferimento, scegliere il punto unità è
un po’ come scegliere “q.b.”, quanto basta, vettori che rappresentano gli Ei ).
22

Torniamo alla Definizione 4.6bis e diamola in una forma leggermente più in generale. Dati
due spazi vettoriali V e V ′ , posto P = P(V ) e P′ = P(V ′ ) , un’applicazione lineare
L : V −−−−→ V ′ ,
induce una funzione
F := [L] : P r K −−−−→ P′
[~v ] 7→ [L(~v )]
dove K := P(kerL) è il proiettificato del nucleo di L (come già osservato nell’avvertenza
che segue l’osservazione 4bis siamo costretti a escludere K dal dominio di definizione perché
altrimenti come immagine di un punto in K otterremmo “ [~0 ′ ]” che non ha alcun senso).

Definizione 4.18. Una funzione come sopra la chiameremo applicazione proiettiva.

Definizione 4.19. Sia P = P(V ) , consideriamo una trasformazione proiettiva6


F := [L] : P −−−−→ P

[~v ] 7 → [L(~v )]
Diciamo che
• A ∈ P è un punto fisso di F se risulta F (A) = A ;
• Ω ⊆ P è un insieme invariante per F se risulta F (Ω) = Ω .

Avvertenza : un sottoinsieme di punti fissi è ovviamente invariante, il viceversa in generale non è vero :
possiamo avere una retta r che viene mandata in se stessa, quindi invariante, ma i cui punti vengono
spostati da F (pur rimanendo sempre in r ).

Osservazione 4.20.
• se S = P(W ) è un sottospazio proiettivo di P, allora S è invariante se e solo se W è
invariante per L , cioè risulta L(W ) = W ;
• la nostra F , come L del resto, è biunivoca;
• A = [~v ] è un punto fisso se e solo se [L(~v )] = [~v ], cioè se e solo se i vettori L(~v ) e
~v sono proporzionali. Detto in altri termini,
A = [~v ] è un punto fisso di F ⇐⇒ ~v è un autovettore per L
(di autovalore automaticamente non nullo).

Esercizio 4.21. Nelle ipotesi della Definizione 4.19 provare che se S è un sottospazio proiettivo di P
allora
F (S) = S se e solo se F (S) ⊆ S
(ovviamente il risultato non vale per sottoinsiemi arbitrari, ad esempio se F è la proiettività di P1R data
dalla matrice 10 02 ed Ω = {[t, 1] | t < 1} si ha F (Ω) ⊆ Ω , ma non vale l’uguaglianza).


Esercizio 4.22. Sempre nelle ipotesi della Definizione 4.19, provare che
i) se U1 e U2 sono due autospazi per L (distinti), allora P(U1 ) e P(U2 ) sono sottospazi
sghembi di P;
ii) l’insieme dei punti fissi per F è una unione finita di sottospazi proiettivi di P sghembi
tra loro.
Dalla ii), dedurre che se S1 ed S2 sono sottospazi di punti fissi per F aventi intersezione
non vuota, allora anche h S1 ∪ S2 i è un sottospazio di punti fissi.

Suggerimenti : ci si ricordi del fatto che autospazi distinti sono indipendenti; si usi l’Osservazione (4.20).

6 N.b.: qui P = P′ ed L : V −→ V è iniettiva.


23

Esercizio 4.23. Sempre nelle ipotesi della Definizione 4.19, provare che
i) se A e B sono due punti fissi (distinti), allora la retta passante per essi è invariante;
ii) se A, B, C sono tre punti fissi allineati (distinti), la retta passante per essi è costituita
da punti fissi;
iii) se r ed s sono due rette invarianti (distinte), il loro eventuale punto di intersezione è
un punto fisso.

Suggerimenti : ci si ricordi del fatto basilare che una proiettività porta rette in rette;
per la domanda ii), si consideri la restrizione di F alla retta in questione, diciamo r = P(H) quindi ci si
interroghi su cosa significa avere tre autovettori per una trasformazione lineare del piano H in se.
In alternativa, sempre per provare la ii) , si usi il Teorema Fondamentale 4.12 (ricordandosi che, se lo spazio
ambiente è una retta, tre punti distinti sono in posizione generale).

Esempio 4.24. La trasformazione proiettiva di P3R = P(R4 ) associata alla matrice


 
1 0 0 0
0 1 0 0
M =  0 0 2 0

0 0 0 2
ha due rette (sghembe) di punti fissi, le rette
r1 = { X2 = X3 = 0 } e r2 = { X0 = X1 = 0 } .
La prima è l’asse “ x ”, la seconda è la retta all’infinito del piano “ y, z ” (la notazione è quella solita:
consideriamo P3R come completamento proiettivo di R3 via [1, x, y, z] ↔ (x, y, z) ).
Infatti, gli autospazi della matrice M sono i due piani vettoriali rispettivamente di equazioni cartesiane
X2 = X3 = 0 e X0 = X1 = 0 (attenzione: qui vediamo M come trasformazione lineare dello spazio
vettoriale R4 , questo con coordinate X0 , X1 , X2 , X3 ). Proiettivizzando questi due piani si ottengono le
rette r1 ed r2 che, come dicevamo, sono pertanto costituite da punti fissi.

Esempio 4.25. Abbiamo introdotto le trasformazioni affini di Rn come composizione di trasformazioni


lineari (invertibili) e traslazioni, ovvero come funzioni del tipo
a1, 1 . . . a1, n
      
x1 x1 b1
f : Rn −→ Rn , 
 ..  7→  ..
  ..  . 
 
.  +  .. 
 
 .   . .  .   . 
xn an, 1 . . . an, n xn bn
dove la matrice (ai, j ) è invertibile. Queste si estendono, in modo unico, a trasformazioni proiettive
n
di PR (che vediamo come completamento proiettivo standard di Rn ). Quanto all’esistenza di una tale
estensione, è sufficiente scriverla esplicitamente:
1 0 ... 0
    
X0 X0
h X1 i
  h  b1 a1, 1 . . . a1, n   X1 
  
i
n n
F : PR −→ PR ,  . 
 .  →
7  .
 . .. ..   .. 
 
 .   . . .  . 
Xn bn a1, n . . . an, n Xn
n
dove, al solito, consideriamo Rn incluso in PR via (x1 , ..., xn ) 7→ [1, x1 , ..., xn ] e X0 , ... , Xn denotano
n
le coordinate omogenee standard su PR (come al solito xi = Xi /X0 , X0 6= 0 ).
L’unicità della nostra estensione è immediata: poiché F estende f e porta rette in rette, il punto all’infinito
di una retta r ⊆ Rn deve andare nel punto all’infinito dell’immagine di r, ciò dà l’unicità di F (ogni
punto all’infinito è il punto all’infinito di una qualche retta in Rn ).
Nota. Per il Teorema 4.12, ai fini dell’unicità di F basterebbe conoscere veramente molto meno, infatti
basterebbe conoscere le immagini di n + 2 punti in posizione generale, mentre noi conosciamo le immagini
di tutti i punti di Rn (date da f ).
n
Per come è stata costruita F si ha che l’aperto Rn ⊆ PR , come pure il suo complementare (l’iperpiano
all’infinito), è invariante per F . In effetti ciò si evince anche dall’espressione esplicita di F . Si osservi
peraltro che una trasformazione proiettiva che fissa l’iperpiano X0 = 0 deve essere necessariamente del
tipo indicato, ovvero le (estensioni delle) trasformazioni affini sono le uniche trasformazioni proiettive per
le quali l’iperpiano all’infinito è invariante.
24

Proposizione 4.26. Sia F : P −→ P una trasformazione proiettiva, siano inoltre


S1 = P(W1 ) ed S2 = P(W2 ) due sottospazi invarianti per F .
Allora,
S1 ∩ S2 e h S1 ∪ S2 i
sono anch’essi sottospazi invarianti.
Naturalmente anche S1 ∪ S2 è invariante (ma non è un sottospazio, è solamente un sottoinsieme invariante,
cosa che lo rende meno interessante).

Dimostrazione. L’invarianza di S1 ∩ S2 è immediata (e la geometria proiettiva non


c’entra nulla, è un fatto insiemistico, n.b.: la nostra F è biunivoca). L’invarianza di
h S1 ∪ S2 i segue dall’analoga invarianza di Span {W1 ∪ W2 } per L (si osservi che nella
notazione dell’osservazione 3.3, posto Ω = S1 ∪ S2 , si ha che il corrispondente insieme dei
rappresentanti è l’insieme Ωe = W1 ∪ W2 r {~0} ).


Come abbiamo visto, i punti fissi di una proiettività sono rappresentati da autovettori, per cui il problema
di determinarli è un problema di calcolo di autospazi. Quanto ai sottospazi invarianti, nella maggior parte
dei casi possono essere determinati da considerazioni concernenti i punti fissi. Vediamo qualche esempio.

Esempio 4.27. Sia f è una proiettività del piano P2R con 3 punti fissi isolati A, B, C . Le rette invarianti
per f sono le tre rette rA, B , rA, C , rB, C (ognuna passante per due dei nostri punti).

Dimostrazione. Tre punti fissi isolati non sono allineati, infatti una retta che li contenesse sarebbe una retta
di punti fissi (cfr. eser. 4.23, ii); le tre rette indicate sono rette invarianti (cfr. eser. 4.23, i); non possono
esserci altri punti fissi perché una matrice 3×3 non può avere più di 3 autospazi; non possono esserci altre
rette invarianti perché un’eventuale altra retta invariante s incontrerebbe rA, B in un quarto punto fisso.

Naturalmente il risultato visto si generalizza:
Esempio 4.28. Se f è una proiettività dello spazio P3R con 4 punti fissi isolati, allora i punti fissi sono
in posizione generale ed f ha esattamente 4 piani invarianti (i piani per le 4 terne di punti fissi) e 6 rette
invarianti (le rette per le 6 coppie di punti fissi).

Esempio 4.29. Una proiettività f del piano P2R ha sicuramente almeno un punto fisso.
Dimostrazione. Una matrice 3×3 ha almeno un autovalore, ovvero ha almeno un autovettore. 

Esempio 4.30. Sia f è una proiettività (diversa dall’identità) del piano P2R con una retta r di punti fissi
ed un punto fisso p 6∈ r . Le rette invarianti sono r e tutte le rette passanti per p .
Dimostrazione. Di nuovo per l’esercizio (4.23, i), le rette per p ed un punto di r sono invarianti (cioè tutte
le rette passanti per p ). D’altro canto per ragioni di autospazi non ci possono essere altri punti fissi e, di
conseguenza, non ci possono essere altre rette invarianti (un’eventuale retta invariante s non passante per
p incontrerebbe una generica7 retta m passante per p in un punto q 6∈ r distinto da p , ma un tale punto
sarebbe un punto fisso).


Esempio 4.31. Una rotazione di R2 di angolo θ 6= 0, π definisce su P1R = P(R2 ) una proiettività senza
punti fissi.

7 Il termine “generica” significa “qualsiasi, ma con qualche eccezione”, nello specifico ci basta prendere come
retta m una qualsiasi retta che non incontri r proprio nel punto r ∩ s .
GeoSup 2013. Schizzi degli argomenti di alcune dimostrazioni.

1. Caratteristica di Eulero e classificazione delle


superfici
S sará sempre una superficie orientabile compatta e senza bordo.
1.1. Caratteristica. Per ogni triangolazione τ di uno spazio topolo-
gico X definiamo
χ(τ ) = V − L + F
ove V, L, F denotano il numero dei vertici, lati e facce di τ . È un fatto
che tale numero non dipende da τ ma solo da X, quindi scriveremo
χ(X). È la caratteristica di Eulero-Poincaré di X.
Esempio. χ(S 1 ) = 0, χ(D2 ) = 1, χ(un punto) = 1, χ(un anello) = 0.
Esempio. Sia X il bouquet di k copie di S 1 , allora χ(X) = 1 − k.
Il seguente fatto è di immediata dimostrazione contando i simplessi
Fatto(Principio di inclusione esclusione).

χ(X ∪ Y ) = χ(X) + χ(Y ) − χ(X ∩ Y ).


Corollario(Taglio di un manico). Se S ′ è ottenuta tagliando S lungo
una curva chiusa semplice e tappando con dei dischi le due componenti
di bordo risultanti dal taglio, allora
χ(S ′ ) = χ(S) + 2.
L’operazione inversa a quella descritta corrisponde all’attaccamento di
un 1-manico a S ′ .
1.2. L’algoritmo del topo. Data una triangolazione di S pensiamo i
triangoli come fatti di formaggio ed inseriamo un topo famelico all’in-
terno di un triangolo. Il topo famelico segue le seguenti regole: Se sta
dentro un triangolo ne mangia tutto l’interno; si muove nello spazio che
si è liberato mangiando triangoli; finito un triangolo cerca un lato che
abbia un triangolo di formaggio pieno dall’altro lato, appena lo trova
ne mangia l’interno (lascia i vertici) ed entra nel triangolo adiacente e
ne mangia l’interno. Quando non è piú possibile continuare comincia
a mangiare le bucce: cerca un vertice a cui sia attaccato uno solo lato
e mangia quel vertice e quel lato. Ripete la ricerca. Quando non può
più mangiare nulla secondo le regole precedenti si ferma.
Il questo modo il topo ha ottenuto il risultato seguente: ad ogni
passo la parte mangiata è omeomorfa a un disco. Alla fine quello che
rimane è un grafo senza vertici di valenza uno oppure un singolo punto.
1
2

Fatto. Un grafo con almeno un lato e senza vertici di valenza uno ha


caratteristica ≤ 0.
Dimostrazione. Basta contare i simplessi
P ePnotare che, detta mi la
molteplicità del vertice i si ha 2L = mi e mi ≥ 2V . 
Corollario. χ(S) ≤ 2.
Dimostrazione. Per l’algoritmo del topo S è ottenuta attaccando un
disco a un grafo oppure a un punto, lungo un anello (intorno regolare
dei bordi). Se alla fine è rimasto un punto χ(S) = χ(punto)+χ(disco)−
χ(anello) = 1 + 1 − 0 = 2. Altrimenti χ(S) = χ(grafo) + χ(disco) ≤ 1.
1.3. Classificazione. Se in S esiste una curva chiusa semplice che
non la sconnette, allora procediamo al taglio di un manico lungo tale
curva. La caratteristica sale di 2. Siccome χ(S) ≤ 2 possiamo ripetere
questo step al più un numero finito di volte e ridurci al caso in cui ogni
curva chiusa semplice in S la sconnetta. In questo caso l’algoritmo del
topo finisce con un sol punto rimanente. Infatti, visto che quello che
togliamo è un disco, che è connesso, se rimanesse un grafo allora ogni
curva chiusa semplice del grafo non sconnetterebbe S. Dunque S è
ottenuta attaccando un disco ad un intorno regolare di un punto, che
è un disco. Quindi S = S 2 . Ne segue che
Teorema. Ogni superficie compatta connessa orientata è ottenuta
attaccando g manici ad S 2 . Da cui χ(S) = 2 − 2g.
Il numero g si chiama genere di S.
Fatto. dim(H1 (S)) = dim(H 1 (S)) = 2g.

2. indice di campi di vettori e formule d’indice


Il libro di riferimento per questa sezione è il Milonor: “Topology
from the differentiable viewpoint” noto anche come “Milnorino”. Si
trova in rete e in tutte le biblioteche (di solito).
Sia v un campo differenziabile di vettori tangenti su una varietà
M di dimensione n. Sia x uno zero isolato di v. Localmente V lo
si può vedere come una mappa da Rn a Rn . Quello che diremo sarà
invariante per diffeomorfismi (anche se qui non lo dimostriamo) per
cui ragioneremo sempre in carte locali. Localmente possiamo supporre
che x sia l’unico zero di v. Fuori da x possiamo definire il campo
normalizzato v̄ = v/||v||. La restrizione di v̄ a una sferetta di raggio
r centrata in x fornisce una mappa v̄r : S n−1 → S n−1 . Variando r
si ottiene un’omotopia tra le varie v̄r che quindi hanno tutte lo steso
grado.
3

Definizione. L’indice di v in x è il grado di v̄r .


Fatto. Se x è uno zero non degenere (cioè dv 6= 0 in x) allora dv :
Rn → Rn è un’applicazione lineare invertibile. In tal caso l’indice di v
in x è ±1 a seconda che det dv sia positivo o negativo.
Dimostrazione. Supponiamo x = 0. Allora F (x, t) = v(xt)/t fornisce
un’omotopia tra v e dv.
Lemma(Teorema di Hopf ). Se M ⊂ Rn è una sotto varieà con bordo
di dimensione n e v è un campo di vettori su M con zeri isolati e
tale che su ∂M punti sempre all’esterno di M , allora la somma degli
indici degli tali zeri di v è uguale al grado dell’applicazione di Gauss
∂M → S n−1 (quella che associa a un punto di ∂M il vettore normale
unitario uscente).
Dimostrazione. Sia M0 la varietà ottenuta da rimuovendo M delle pal-
lette disgiunte tra loro attorno ad ogni zero di v. Su M0 è ben definito
il campo v̄ = v/||v||, che è una applicazione v̄ : M0 → S n−1 se w è
un valore regolare di v̄ allora v̄ −1 (w) è una 1-sottovarietà di M0 con
bordo su ∂M0 . Ne segue che il grado di v̄ su ∂M è zero. Ma su ∂M v̄ è
omotopa alla mappa di Gauss mentre su ∂M0 \ ∂M la somma dei gradi
fornisce la somma degli indici degli zeri di v. La conclusione segue. 
Lemma. Ci si può sempre ricondurre al caso di zeri isolati.
Dimostrazione. basta perturbare un po’ il campo che è sempre suppo-
sto liscio e quindi per il lemma di Sard esistono valori regolari.
Lemma. ci si può sempre ricondurre al caso di zeri non degeneri: Sia
v un campo con uno zero isolato x. Per ogni U intorno di x esistono
intorni B1 ⊂ B2 ⊂ U di x ed un campo w tali che
• Fuori da B2 , w = v
• w non ha zeri in B2 \ B1
• in B1 w ha solo zeri non degeneri.
Dimostrazione. Ci si mette in coordinate locali in cui x = 0 sia l’unico
zero. Si prende una funzione f liscia a valori in [0, 1] che valga 1 in
B(0, 1) e zero fuori da B(0, 2). Si prende un valore regolare v0 (di
modulo che sceglieremo dopo) di v che esiste per il lemma di Sard. Si
costruisce il campo w = v−v0 f . Gli zeri di w soddisfano v(x) = f (x)v0 ,
se v0 è sufficientemente piccolo (più piccolo di inf B(0,2)\B(0,1) ||v||) ciò
implica che se x sta in B(0, 2) allora x ∈ B(0, 1), ergo f (x) = 1 e
w = v−v0 da cui dw(x) = dv(x). Siccome v0 è valore regolare v(x) = v0
implica dv invertibile e quindi dw invertibile in x. 
4

Corollario. La somma degli indici degli zeri di w in B2 è uguale


all’indice dello zero x di v.
Dimostrazione. Basta prendere U contenuto nella palletta P che si usa
per calcolare l’indice di v. Rimuovendo pallette Pi intorno agli zeri di
w in B1 si ha che il grado totale di w̄ su ∂(P \ {Pi }) è zero per cui
il grado su ∂P è uguale alla somma dei gradi sui ∂Pi (si noti che le
orientazioni di ∂P1 indotte da Pi e da P \ {Pi } sono opposte).
Lemma. Sia S ⊂ R3 una superficie compatta orientabile senza bordo
e sia v un campo liscio di vettori tangenti a S con zeri isolati non
degeneri. Sia N un intorno regolare di S. Allora la somma degli indici
degli zeri di v è uguale al grado della mappa di Gauss di ∂N . In
particolare tale somma non dipende de v.
Dimostrazione. Per x ∈ N sia r(x) la proiezione di x su S, ossia il
punto di S più vicino a x. Sia w = v(r(x)) + x − r(x) un campo su N .
Chiaramente w = v su S. In oltre se w(x) = 0 allora v(r(x)) = x−r(x),
ma x − r(x) è ortogonale a S mentre v è tangente per cui x ∈ S e
v(x) = 0. Cioè w e v hanno gli stessi zeri. Infine calcoliamo l’indice di
w in un suo zero. dw = dvdr + Id − dr. Quindi se mi muovo lungo T S
ho che dr = Id e dw = dv mentre se mi muovo in direzione ortogonale
ho che dr = 0 e dw = Id. Ne segue che dw è non degenere ed il
determinante di dw ha lo stesso segno di dv.
Il campo w̄ su ∂N punta fuori se N è sufficientemente piccolo per cui
la combinazione convessa con la mappa di Gauss fornisce un’omotopia
tra le due (entrambe puntano fuori quindi tw̄ + (1 − t)Gauss non può
mai essere nullo. Quindi w̄ ha lo stesso gradoP della mappa di Gauss
sul bordo di N P. Per il Teorema
P di Hopf ix (w) = deg(Gauss). e
sappiamo che ix (w) = ix (v). 
Si noti che la dimostrazione appena fatta in R3 vale per una qualsiasi
sottovarietà di Rn di qualsiasi dimensione.
Sia ora v un campo su S con zeri isolati.
P
Teorema(Poincaré-Hopf ). ix = χ(S).
Dimostrazione. Per la riduzione al caso non degenere P possiamo sup-
porre gli zeri non degeneri. Siccome per tali campi ix non dipende
dal campo di vettori è sufficiente esibire un campo di vettori con tali
proprietà. Su un triangolo sia f una funzione liscia che abbia: un mas-
simo nel baricentro, un minimo per ogni vertice e una sella nel punto
medio di ogni lato. Sia il campo gradiente di f . Per costruzione sia
f che il campo si estendono a una triangolazione qualsiasi di S. Si
controlla che nei massimi e nei minimi locali di una funzione, il campo
5

gradiente ha sempre indice 1, mentre nei punti di sella ha indice −1.


Ne segue che la somma degli indici degli zeri di v porta un contributo
1 per ogni triangolo, −1 per ogni lato e 1 per ogni vertice. Il totale fa
L − V + F = χ(S). 
Fatto. La stessa dimostrazione vale in dimensione qualsiasi.
Corollario. Se M ha dimensione dispari ed è senza bordo allora
χ(M ) = 0.
Dimostrazione. Sia v un campo su M con zeri isolati non degeneri.
Siccome la dimensione n di M è dispari l’antipodale di Rn inverte
l’orientazione1. Quindi −v ha zeri con indici di segno opposto a quelli
di v. Ne segue che
X X X
χ(M ) = ix (v) = ix (−v) = − ix (v) = −χ(M )

Corollario. Se M è una varietà compatta a bordo e se
Pv è un campo di
vettori tangente a M che punta fuori al bordo, allora ix non dipende
da v.
Dimostrazione. Si considera il doppio di M , ossia la varietà ottenuta
prendendo una copia M̄ di M , con l’orientazione opposta ed attaccan-
dola a M lungo il bordo comune. Su M̄ si considera il campo −v, che
punta dentro al bordo. L’unione dei campi v su M e −v su M̄ fornisce
un
P campoPsul doppio di M , che è una varietà senza bordo. Quindi
i(v) + i(−v) non dipende da v. Sia ora w un altro campo su M
che punta fuori al bordo. Siccome entrabi v e w puntano fuori la loro
combinazione convessa fornisce un’omotopia tra loro. In particolare
posso perturbare w in un intorno di ∂M senza intdoturre nuovi zeri in
modo che w = v sul bordo. Quindi posso fare il campo sul doppio di
M dato da w su M e −v su M̄ . Ne segue che
X X X X
i(w) + i(−v) = i(v) + i(−v).


3. Forme e campi olomorfi


Il libro di riferimento per questa sezione è il Donaldson: “Riemann
Surfaces”, capitoli 5,6,7. (Oxford graduate text in mathematcis n. 22;
c’è in biblioteca da noi.)
1come avete giustamente osservato a lezione!
6

3.1. Fibrato tangente. (Meglio tardi che mai) Data una varietà M
con atlante differenziabile (Uα , ϕα ) il fibrato tangente T M si costrui-
sce/definisce come segue. In carte locali, lo spazio tangente a Rn nel
punto x è Rn :
T Rnx = Rn .
Su un aperto coordinato Vα = ϕα (Uα ) si definisce il fibrato tangente
come V × Rn con (T Vα )x identificato con {x} × Rn . A questo punto un
atlante per T M è formato da aperti Vα × Rn e i cambi di carta sono
dati da
T Vα ∋ (x, v) 7→ (ϕβ ◦ (ϕα )−1 (x), d(ϕβ ◦ (ϕα )−1 )(x)[v]) ∈ T Vβ .
Lo spazio definito in questo modo è una famiglia continua di spazi
vettoriali (Rn ) parametrizzati con punti di M : T M = {T Mx , x ∈ M }.
M si chiama base e T Mx fibra. La proiezione naturale (x, v) → x da
T M → M che dimentica v e si ricorda solo del punto base si indica di
solito con π.
Questa definizione si generalizza alla definizione/costruzione di fi-
brato vettoriale qualsiasi ove invece di Rn si usa uno spazio vettoriale
qualsiasi e al posto dei differenziali dei cambi di carta si usano delle
opportune funzioni di transizione che di fatto caratterizzano il fibrato.
Una sezione di un fibrato è una mappa s : M → T M tale che
π(s(x)) = x. Cioè s(x) = (x, v(x)) con v ∈ T Mx .
Le sezioni del fibrato tangente si chiamano campi di vettori e so-
no identificate col modulo delle derivazioni sull’anello delle funzioni
differenziabili. In coordinate, {∂/∂xi } è una base di T Mx .

3.2. Forme olomorfe. Restringiamoci per semplicità al caso di su-


perfici. In due parole, si complessifica T S tensorizzando con C
TS ⊗ C
e se ne prende il duale complesso. Queste sono le forme complesse e
quelle olomorfe son quelle che trasformano la struttura complessa di
R2 (rotazione di π/2 di R2 ) nella moltiplicazione per i.

3.3. Forme olomorfe (e campi) step by step.


Disclaimer: La confusione può nascere dal fatto che C è R2 come
spazio reale ma il complessificato di R2 è C2 e quindi in un certo senso
uno si ritrova a complessificare C e gli viene C2 .
Hint: I fisici coi conti ci chiappano. Usare il formalismo e l’intuizione
alla “fisisco” aiuta. Parecchio.
7

3.3.1. Forme su R2 . Ci mettiamo in coordinate locali e identifichiamo


C con R2 tramite la mappa
z : R2 → C z(x, y) = x + iy
In coordinate locali, la moltiplicazione per i si legge come la rotazione
di π/2: i · 1 = i, i · i = −1 dunque i(1, 0) = (0, 1) e i(0, 1) = (−1, 0).
2
La struttura complessa
  indotta da z su R è quindi rappresentata  dalla
0 −1 x
matrice J = e cioè iz in coordinate reali si legge J . In
1 0 y
altri termini ancora z(J(x, y)) = iz(x, y). Cioè la funzione z trasforma
J nella moltiplicazione per i. Trasformare J nella moltiplicazione per
i è quello che richiederemo alle cose per chiamarle olomorfe.
Lo spazio delle 1-forme a valori complessi su R2 è Hom(R2 , C) con-
siderando C come spazio reale. Cioè funzionali ω tali che ω(av + bw) =
aω(v) + bω(w) e per ogni v, w ∈ R2 e a, b ∈ R. Si noti che ω(v) ∈ C è
un numero complesso. Hom(R2 , C) ha una struttura naturale di spazio
vettoriale su C data da
(aω + bη)(v) = aω(v) + bη(v)
per ogni ω, η ∈ Hom(R2 , C) e a, b ∈ C.
Le forme dx e dy sono una base su C di Hom(R2 , C). (In coordinate
dx è il vettore riga (1, 0) e dy il vettore (0, 1), sono i duali della base
canonica di R2 , complessificati.) Quindi una base di Hom(R2 , C) è
anche data da
dz = dx + idy
dz̄ = dx − idy
Si noti che dz è proprio il differenziale dell’applicazione z : R2 → C,
che vive per l’appunto in Hom(R2 , C).
Questa descrizione è puntuale. Succede come coi campi di vettori:
punto per punto ho una fibra che è uno spazio vettoriale, e le sezioni —
i campi di vettori — sono un modulo sull’anello delle funzioni differen-
ziabili. Quindi si può fare il fibrato delle 1-forme e prenderne sezioni,
queste sono propriamente le 1-forme su R2 : Una 1-forma complessa su
R2 è una applicazione ω : R2 → Hom(R2 , C). Il modulo delle 1-forme
su R2 si indica con Ω1 (R2 ) o semplicemente Ω1 (ed è un modulo libe-
ro). Le forme dx, dy continuano a essere una base per Ω1 , cosı́ come le
forme dz, dz̄.

3.3.2. Funzioni olomorfe su R2 . Sia ora f : R2 → C una funzione


differenziabile in senso reale, ossia con parte reale e immaginaria diffe-
renziabili. Che cosa vuol dire che f è olomorfa quando si identifica R2
8

con C? Il differenziale di f è una 1-forma complessa


∂f ∂f
df = dx + dy ∈ Hom(R2 , C).
∂x ∂y
Richiedere che f sia olomorfa è equivalente a chiedere che la sua
approssimazione al prim’ordine sia C-lineare e quindi abbia senso con-
siderare la derivata in senso complesso.
Questo si traduce con il fatto che df trasforma J nella moltiplicazione
per i.

df (JV ) = idf (V )
Se V = (Vx , Vy ) allora JV = (−Vy , Vx ) da cui
∂f ∂f ∂f ∂f
− Vy + Vx = i( Vx + Vy )
∂x ∂y ∂x ∂y
da cui
∂f ∂f
+i =0
∂x ∂y
Le cui componenti reale e immaginaria non sono altro che le solite
equazioni di Cauchy-Riemann.
Nel nostro formalismo ∂f∂y
= i ∂f
∂x
ci dice che df = ∂f
∂x
(dx + idy) = adz
con a = ∂f /∂x. Cioè f è olomorfa, o meglio J-olomorfa, se e solo se
df è un multiplo di dz.
Una forma olomorfa su R2 è il differenziale di una funzione olomorfa.
In particolare, le forme olomorfe vivono nel modulo generato da dz.
(Equivalentemente, una forma ω su R2 è olomorfa se esiste f olomorfa
tale che ω = f dz.)

3.3.3. Campi di vettori complessi. Se uno è un fisico complessifica il


tangente immaginando che un campo è un insieme di freccioline tan-
genti, ognuna delle quali ha una determinata lunghezza... complessa!
E questo in fin dei conti funziona bene.
Più formalmente si considera l’anello E delle funzioni R2 → C diffe-
renziabili in senso reale e il modulo D delle derivazioni complesse su E.
Ossia il modulo delle applicazioni X : E → E tali che
• X(f g) = X(f )g + f X(g),
• X(f + g) = X(f ) + X(g),
• X(λ) = 0
per ogni f, g ∈ E e λ ∈ C. Una base è data da ∂/∂x, ∂/∂y. (Anche
qui, punto per punto abbiamo uno spazio vettoriale che non è altro che
(T R2 )x ⊗ C, le sezioni sono un modulo.)
9

Una base alternativa è data da


∂ 1 ∂ ∂
= ( −i )
∂z 2 ∂x ∂y
∂ 1 ∂ ∂
= ( +i )
∂ z̄ 2 ∂x ∂y
Ove la condizione di olomorfia per f si legge ∂f /∂ z̄ = 0.
ATTENZIONE: ∂f /∂z 6= df /dz. Gli operatori ∂/∂z e ∂/∂ z̄ sono
operatori differenziali reali ed esistono sempre, per qualsiasi f che sia
differenziabile in senso reale, cioè tale che le sue componenti reale com-
plessa siano differenziabili. Mentre df /dz indica la derivata in senso
complesso, e questa per definizione esiste solo se f è olomorfa.
ATTENZIONE: Le derivazioni complesse sono sezioni del comples-
sificato del tangente, quindi punto per punto abbiamo tra le mani un
C2 di cui il nostro R2 di partenza rappresenta la parte reale. (An-
che se quando identifichiamo R2 con C la “y” rappresenta la parte
immaginaria.)
3.3.4. Gli operatori ∂ e ∂. ¯ Le forme dx e dy continuano ad essere dua-
li di ∂/∂x e ∂/∂y (anche se per ora formalmente le forme stanno in
Hom(R2 , C) e non in Hom(C2 , C), che è il duale del complessificato di
R2 ).
Si definiscono gli operatori ∂ e ∂¯ come
∂f
∂f = dz
∂z
¯ = ∂f dz̄
∂f
∂ z̄
Tale definizione si estende nel modo ovvio alle forme (tipo se ω = f dz
¯ = ∂f
allora ∂ω ¯ dz̄ ∧ dz).
Si ha
∂f ∂f ∂f ∂f ¯
df = dx + dy = dz + dz̄ = ∂f + ∂f
∂x ∂y ∂z ∂ z̄
da cui
d = ∂ + ∂¯
Si verifica che
∂f ∂ f¯
=
∂z ∂ z̄
da cui
∂f = ∂¯f¯
come i fisici sanno bene senza fare i conti. Infine, si vede subito che (a
livello di forme) ∂ 2 = ∂¯2 = 0 e che ∂ ∂¯ = −∂∂.
¯
10

3.3.5. Forme reloaded. A questo punto si complessifica anche in parten-


za: ogni elemento di Hom(R2 , C) definisce un elemento di Hom(C2 , C)
imponendo la C-linearità. Cioè ω(a, b) = aω(1, 0) + bω(0, 1) per ogni
a, b ∈ C. Una forma sarà J-olomorfa se trasforma J nella moltiplica-
zione per i. dx, dy continuano a essere base, cosı̀ come dz, dz̄. Questa
volta però dz, dz̄ è la base duale complessa di ∂/∂z, ∂/∂ z̄ nel senso
proprio del termine.
Definizione. Una 1-forma complessa ω è di tipo (1, 0) se è un multiplo
di dz, è di tipo (0, 1) se è un multiplo di dz̄. Una 1-forma ω di dice
olomorfa se è di tipo (1, 0) e ∂ω ¯ = 0. Il modulo delle forme di tipo
(1,0)
(1, 0) si indica con Ω e quello delle (0, 1) con Ω(0,1) .
Fatto. È immediato dalla definizione che se ω è olomorfa allora dω = 0.
Definizione. Una 1-forma complessa si dice meromorfa se è olomorfa
fuori da un insieme discreto di punti ove presenta dei poli. Localmente
ω = f dz con f meromorfa.
3.3.6. Cambi di coordinate e forme su superfici. La nozione di forma
complessa, di forma di tipo (1, 0) e di forma olomorfa, le nozioni degli
operatori ∂ e ∂¯ che abbiamo dato sin ora valgono in R2 munito di una
struttura olomorfa J. Se siamo in una superficie, possiamo dare queste
definizioni in carte locali, ma si deve assicurarci che siano ben poste
per cambi di carta. Mettiamoci quindi in questa situazione.
Sia ϕ : R2 → R2 un diffeomorfismo (reale) e sia w = ϕ(z). Cioè la
coordina complessa nel primo R2 è z e nel secondo w. Sia ω = adw+bdw̄
una forma complessa nella variabile w. Usando che w = ϕ(z), si verifica
che vale
ϕ∗ (dw) = dϕ ϕ∗ (dw̄) = dϕ̄
(un fisico direbbe w = ϕ quindi dw = dϕ e dw̄ = dϕ̄.) Quindi si ha
ϕ∗ (ω) = a(ϕ(z))dϕ + b(ϕ(z))dϕ̄ = adϕ + bdϕ̄
ora
¯ + b(∂ ϕ̄ + ∂¯ϕ̄)
adϕ + bdϕ̄ = a(∂ϕ + ∂ϕ)
da cui
∂ϕ ∂ ϕ̄ ∂ϕ ∂ϕ
adϕ + bdϕ̄ = (a + b )dz + (a + b )dz̄
∂z ∂z ∂ z̄ ∂z
ergo, se ω è di tipo (1, 0), cioè se b = 0, allora affinchè ϕ∗ (ω) sia di tipo
(1, 0) occorre che ∂ϕ¯ = 0. Si vede che questa condizione è necessaria e
sufficiente affinchè tutte le nozioni sopra descritte siano invarianti per
cambi di carta. In altre parole, se (e solo se) i cambi di carta sono
olomorfi allora funziona tutto bene.
11

Si definiscono quindi i moduli Ω1 (S), Ω(1,0) (S), Ω(0,1) (S) delle forme
complesse, su S e sono ben definiti gli operatori ∂, ∂,¯ d.
∗ ′
Se ω = a(w)dw quindi, φ ω = a(ϕ(z))ϕ dz e quindi in pratica quindi
una 1-forma olomorfa ω su S è il dato di un altante olomorfo (Uα , ϕα )
per S e, per ogni α, una 1-forma olomorfa fα dz con la proprietà che
fα /fβ = (ϕβ ◦ (ϕα )−1 )′ sull’intersezione. “Fisicamente” se w = ϕ allora
adw = adϕ = aϕ′ dz.
Si noti che la forma dz è ben definita nelle carte locali ma non in
tutta S. Questo sarà ancora più esplicito nella prossima sezione.
Si noti infine che le forme olomorfe non sono un modulo sull’anello
delle funzioni complesse perchè, localmente, se moltiplico una forma
olomorfa f dz per una funzione g, per ottenere una forma olomorfa
bisogna che g sia pure olomorfa. Quindi le forme olomorfe sono un
modulo sull’anello delle funzioni olomorfe. Se S è compatta, di funzioni
olomorfe globali c’è solo le costanti. Ne segue che le forme olomorfe
su S sono in realtà (solo) uno spazio vettoriale, che risulterà però — a
differenza del caso reale — di dimensione finita (si veda il seguito).

3.4. Zeri di forme, di forme olomorfe e meromorfe. Sia ω una


1-forma differenziabile reale su S e sia x uno zero isolato di ω. Local-
mente ω = adx + bdy ove (a, b) può essere interpretato come un campo
di vettori v con uno zero isolato in x. L’indice dello zero di ω è per
definizione l’indice del campo v = (a, b) in x. Se si cambiano coordina-
te con (x, y) = F (s, t) si ha (dx, dy) = (∂x/∂sds + ∂x/∂tdt, ∂y/∂sds +
∂y/∂tdt) = dF (ds, dt) e dunque ω = (a, b) · (dx, dy) = (a, b) · dF (ds, dt)
per cui il nuovo campo di vettori è w = dF t (a, b). Supponiamo per sem-
plicità il campo v non degenere, allora nello zero si ha dw = dF t dF dv
e quindi dw è invertibile e det dw ha lo stesso segno di dv. Il seguente
fatto è dunque immediato.
Fatto. Sia ix l’indice dello zero di ω in x. Allora
X
ix = χ(S).

Mettiamo su S una struttura complessa e consideriamo una forma


olomorfa ω. Localmente ω = f (z)dz ove possiamo supporre che 0 è
uno di ω. Si noti che siccome f è olomorfa lo zero è isolato a meno che
f non sia nulla ovunque. Se sviluppiamo f in zero si ottiene,
ω(z) = z n g(z)dz con g(0) 6= 0.
il numero n è detto ordine o molteplicità di ω. Se z è uno zero di ω
lo indichiamo con mz (ω). La forma reale α = ω + ω̄ ha gli stessi zeri
12

di ω e gli indici sono legati alle molteplicità da


iz (α) = −mz (ω)
Esempio. Per convincersi di questo fatto si fa l’esempio di ω = zdz. In
coordinate ω = (x+iy)(dx+idy) per cui α = 2(xdx−ydy) = d(x2 −y 2 )
che è il differenziale di una sella ed ha indice −1. Se ω = z n dz allora la
si perturba in modo da avere n zeri di ordine 1 e si usa che la somma
degli indici non cambia. Se ω = zg(z)dz con g(0) 6= 0 allora il campo
ottenuto è localmente omotopo a quello dato da zg(0)dz e siccome g(0)
è un numero complesso, la moltiplicazione per g(0) preserva l’orienta-
zione. Ossia, se in coordinate reali x + iy = (x, y), g(0) agisce per
moltiplicazione di A con det A > 0. Per cui il novo campo di vetto-
ri usatoper calcolare
  l’indice è (ℜ(g(0)(x + iy)),−ℑ(g(0)(x
 +  iy))) =
1 0 1 0 1 0 1 0
A (x, −y) e il determinate di A
0 −1 0 −1 0 −1 0 −1
è positivo.
P
Corollario. mz (ω) = −χ(S) = 2g − 2.
Osserviamo che la molteplicità mz è sempre per definizione un nu-
mero positivo (per cui l’indice è sempre negativo).
Corollario. In genere zero non ci sono forme olomorfe non banali. In
genere uno una forma olomorfa non banale non ha zeri.
Per le forme meromorfe, la molteplicità di ω rimane ben definita ed
è positiva negli zeri e negativa nei poli. Per legare sta roba agli indici si
fa cosı́. Si fissa una forma d’area su S. Sia h la funzione 1/x tagliata a
1 vicino a zero. Poi si considera β = h(||α||2 )α estendendo β a zero nei
poli. Per costruzione β ha zeri dove ω ha zeri e poli. Vicino agli zeri
non si è toccato nulla (la h vale 1) e quindi l’indice di β + β̄ negli zeri
di ω è l’opposto della molteplicità. Nei poli invece, se ω(z) = f (z)dz
1 1
β(z) = 2
(f dz) = ¯dz
||f || f
e si controlla che l’indice di β + β̄ è uguale all’ordine del polo.
Esempio. Se f (z) = 1/z allora β = z̄dz = (x − iy)(dx + idy) e
β + β̄ = 2(xdx + ydy) = d(x2 + y 2 ) che ha indice 1.
Rimane quindi valida, anche per forme meromorfe, la formula
X
mz (ω) = −χ(S) = 2g − 2.
Teorema(Formula di Riemann-Hurwiz). Sia f : S → R un rive-
13

stimento ramificato di grado d tra due superfici compatte orientabili


allora
X
χ(S) = dχ(R) − ram(x)

ove ram(x) è l’indice di ramificazione in x ∈ S meno uno (se x un punto


è di ramificazione con grado di ramificazione 3 allora ram(x) = 2).

Dimostrazione via triangolazioni. Si triangola R in modo che le imma-


gini dei punti di ramificazione siano vertici (se ne trova sempre una
cosı̀). Si solleva la triangolazione a S. Si fa il conto V − L + F e si
scopre che ogni simplesso di R è stato replicato d volte in S, tranne i
vertici di ramificazione, che sono stati replicati d − ram(x). 

Dimostrazione con le forme meromorfe. Si mette una struttura di su-


perficie di Riemann su R e si solleva tale struttura a S cosı̀ che f
diventa olomorfa. Si prende una 1-forma meromorfa α su R (se se ne
trova una in giro) e si fa il pull-back su S. I poli e gli zeri si replicano
d volte con le loro molteplicità fuori dal luogo di ramificazione. In un
punto di ramificazione, localmente la f è z 7→ z k . Se ω era h(z)dz il
suo pull back diventa h(z k )d(z k ) = kz k−1 h(z k )dz. Quindi se c’era uno
zero/polo di ordine n (ove n > 0 significa zero, n < 0 polo e n = 0
punto liscio) questo diventa uno zero/polo di ordine kn + k − 1. Si fa
la somma notando che k − 1 è ram(z). 

3.5. Esempi: curve in CP2 . Una curva è una varietà di dimensione


1, se siamo nel mondo complesso, una curva ha dimensione 1 su C, ergo
è una superficie. Consideriamo CP2 = (C3 \ {0})/C∗ con coordinate
omogenee [X0 , X1 , X2 ]. Se ci mettiamo nella carta locale {X2 6= 0} ci
ritroviamo in C2 con coordinate (z, w) corrispondenti a [z, w, 1] ∈ CP2 .
Un polinomio omogeneo P di grado d nelle variabili Zi corrisponde a
un polinomio p di grado d (in genere non omogeneo) su C2 .
Sia no P, p tali polinomi e sia S la curva determinata dall’equazione
P = 0. La prima domanda che ci si pone è “Che roba è S?”
Innanzi tutto S è liscia se il differenziale di P non si annulla mai sui
punti di S. Ci restringeremo a questo caso. Siccome abbiamo usato la
scrittura ∂/∂z per indicare operatori differenziali reali, indichiamo con
Px la derivata parziale — nel senso complesso — di P nella variabile
x. Quindi su S non possono annullarsi contemporaneamente pz e pw
mentre siccome P = 0 su S il differenziale di P si annulla “lungo” S
(S è una curva di livello di P ). Su S quindi in carte locali

pz dz + pw dw = 0 |pz | + |pw | 6= 0
14

Si noti che le coordinate z, w non sono altro che funzioni C2 → C (per


esempio z : (z, w) 7→ z) e quindi inducono funzioni su S per restrizione,
i cui differenziali sono forme olomorfe dz e dw.
Corollario. S ha obbligatoriamente punti all’infinito perché se S è
compatta nella carta locale C2 = {X2 6= 0} allora le funzioni z, w sono
olomorfe su tutta S e per compattezza avrebbero massimo e minimo,
cosa proibita alle funzioni olomorfe.
La forma dz si annulla ove la proiezione sulla prima componente
z : S → C ha un punto critico, ove cioè S ha una tangenza “verticale”,
ossia ove pw = 0. Quindi la forma dz/pw ha buone chances di essere
ben definita e olomorfa. E similmente per dw. In effetti, dall’equazione
sul differenziale di P si ottiene la condizione pdzw = − dw
pz
sui punti di S,
quindi possiamo definire la forma su S
dz dw
ω= =−
pw pz
che si vede essere olomorfa e senza zeri su S usando la prima scrittura
nei punti ove pw 6= 0 e la seconda ove pz 6= 0.
3.6. La formula grado-genere g = (d − 1)(d − 2)/2. Sia p un polino-
mio di grado d in CP2 e sia S la curva definita da p = 0. Supponiamo S
liscia. In carte locali {X2 6= 0} definiamo la forma olomorfa mai nulla
ω = pdzw = − dw
pz
.
Gli ordini degli zeri/poli di ω all’infinito ci diranno, attraverso la
formula dell’indice, qual’è la caratteristica di S (e dunque il genere).
Se in carte locali
X d X
p= anm z n wm
k=0 n+m=k

il suo omogeneizzato è
d
X X
P = ( anm X0n X1m )X2d−k
k=0 n+m=k

per cui l’intersezione di P = 0 con la retta all’infinito X2 = 0 si riduce


all’equazione X
anm X0n X1m = 0
n+m=d
che in carte locali X0 6= 0 diventa
d
X
Q(X1 ) = a(d−n)n X1n = 0
n=0
15

che ha quindi (al più) d radici. In effetti si vede che P ha esattamente


d radici (contate con molteplicità) all’infinito. A meno di cambi di
coordinate ci possiamo ridurre al caso in cui le radici siano tutte distinte
e nella stessa carta {X0 6= 0}. In particolare il Q ha grado d.
Sia x = [X0 , X1 , 0] un punto all’infinito di S. A meno di cambi di
coordinate lineari possiamo supporre che x = [1, 0, 0]. Essendo radice
semplice, PX1 [1, 0, 0] 6= 0. Considerando coordinate locali
X1 X2
(1, u, v) = (1, , ) ∈ {X0 6= 0}
X0 X0
si ha, su {X0 , X2 6= 0},
[1, u, v] = [X0 , X1 , X2 ] = [z, w, 1]
quindi
X0 X1 1 u
(z, w) = ( , )=( , )
X2 X2 v v
da cui dz = −(1/v 2 )dv. Ora, P = P (X0 , X1 , X2 ) è omogeneo di grado
d e siccome Q(X1 ) ha grado d, PX1 ha grado d − 1, da cui
 d−1
PX1 PX1 X0 pu
pu = d−1 pw = d−1 = pu = d−1 .
X0 X2 X2 v
Quindi pu (0, 0) 6= 0 perché PX1 [1, 0, 0] 6= 0 e
ω = dz/pw = −(1/v 2 )v d−1 dv/pu
Ha uno zero/polo di molteplicità d − 3 (zero se d ≥ 3, polo se d < 3)
e questo vale per ogni punto all’infinito di S (che sono d). La formula
di Riemann-Hurwiz ci dice allora che
χ(S) = −d(d − 3)
da cui
−χ(S) + 2 d(d − 3) + 2) (d − 1)(d − 2)
g(S) = = = .
2 2 2

4. La prime-degree conjecture
Sia π : X → Y una funzione olomorfa di grado topologico d tra
due superfici di Riemann compatte senza bordo. Abbiamo visto come
la formula di Riemann-Hurwiz lega le molteplicitá locali dei punti di
ramificazione e le caratteristiche di X e Y .
Infatti una applicazione olomorfa è sempre un rivestimento ramifica-
to, i punti di ramificazione sono dove il differenziale si annulla, e quello
16

che avevamo chiamato ram(x) non è altro che l’ordine con cui si an-
nulla dπ meno uno. La formula quindi si applica e nel contesto delle
mappe olomorfe si legge
X
χ(X) = dχ(Y ) − mp − 1
p

ove p varia nell’insieme dei punti di ramificazione di X. Per ogni punto


y ∈ Y la fibra π −1 (y) = {x1 , . . . , xk } è costituita da k punti distinti.
y si dice valore di ramificazione se almeno uno degli xi è un punto di
ramificazione. Se y non è un valore di ramificazione allora k = d e
mxi = 1 per ogni xi . Altrimenti, si avrá qualche mxi > 1, ma in ogni
caso
X k
mxi = d.
i=1
Alla mappa π si associa il dato di ramificazione, che consiste nella
lista dei valori y1 , . . . , yn di ramificazione e, per ogni i la partizione
dell’intero d nei valori mx
X
d= mix
x∈π −1 (yi )

La formula di Riemann-Hurwiz è dunque condizione necessaria af-


finché un rivestimento con un certo dato di ramificazione esista.
Definizione. Diremo che un rivestimento candidato è il dato di due
numeri del χX e χY della forma 2g − 2, di un grado intero d > 0 e di
n partizioni di d, ossia stringhe di numeri
{(m11 , . . . , m1k1 ), (m21 , . . . , m2k2 ), (mn1 , . . . , mnkn )}
P ki i
tali che per ogni i si ha d = j=1 mj e che valga la condizione di
Riemann-Hurwiz X
χX = dχY − mij − 1
i,j

Domanda: Dato un rivestimento candidato esistono X, Y e π : X →


Y tali che χ(X) = χX , χ(Y ) = χY , deg(π) = d e tali che le partizioni
di d corrispondano alle partizioni dei valori di ramificazione di π?
Teorema. Se χY ≤ 0 allora la risposta è SI: la Riemann-Hurwiz è
condizione necessaria e sufficiente.
Teorema. Se χY = 2 allora SE la risposta è si per n = 3 allora è si in
generale.
Teorema. Per χY = 2, d = 4 e n = 3 il dato (2, 2), (2, 2), (3, 1) non è
realizzabile.
17

Dimostrazione. Le monodromie sono incompatibili tra loro

CONGETTURA (Prime-degree conjecture) Se n = p è un numero


primo la risposta è SI.
In pratica si devono studiare i casi in cui Y = CP1 e n = 3 con
{yi } = {0, 1, ∞} e d primo.

Bibliografia:
Qui http://arxiv.org/abs/1010.2888 ci si trova una buona intro-
duzione al problema.

Questi son due articoli di riferimento:

D.H. Husemoller Ramified coverings of Riemann surfaces.


Duke Math. J. 29 (1962) 167—174
Link su mathschinet: http://www.ams.org/mathscinet/pdf/136726.
pdf?arg3=&co4=AND&co5=AND&co6=AND&co7=AND&dr=all&mx-pid=136726&pg4=
AUCN&pg5=TI&pg6=PC&pg7=ALLF&pg8=ET&r=1&review_format=html&s4=
Husemoller&s5=coverings&s6=&s7=&s8=All&vfpref=html&yearRangeFirst=
&yearRangeSecond=&yrop=eq

A. Edmonds, R. Kulkarni and R. Stong Realizability of branched co-


verings of surfaces. Trans. Amer. Math. Soc. 282 (1984), no. 2,
773—790.
Link su mathscinet: http://www.ams.org/mathscinet/pdf/732119.
pdf?arg3=&co4=AND&co5=AND&co6=AND&co7=AND&dr=all&mx-pid=732119&pg4=
AUCN&pg5=AUCN&pg6=PC&pg7=ALLF&pg8=ET&r=1&review_format=html&s4=
edmonds&s5=kulkarni&s6=&s7=&s8=All&vfpref=html&yearRangeFirst=
&yearRangeSecond=&yrop=eq

5. Spazi di funzioni (e forme) meromorfe


Materiale tratto dal Donaldson, capitoli 8 e 9. La(e) domanda(e)
che ci porremo per un po’ è(sono) “Esistono funzioni meromorfe su S?
Se si, come son fatte? Possiamo mettere i poli dove ci pare?”
Sia S una superficie di Riemann e sia p ∈ S. Sia ω una 1-forma
meromorfa avente un solo polo semplice in p. In coordinate locali in
cui p = 0, ω = f dz e a meno di multipli si ha f = z −1 + a0 + a1 z + . . . .
Sia U una palletta intorno a zero e ϕ : U → [0, 1] una funzione liscia
a supporto in U che vale 1 in un intorno di zero. Quindi g = f − ϕ/z
è ben definita e liscia anche in zero. Quindi, ponendo up = ϕ/z, che è
18

definita globalmente (è nulla fuori da U ), si ha


f = g + up
D’altronde, per ogni punto p si può definire up . Se ne deduce che
esiste una funzione meromorfa con un polo semplice in p se e solo se
esiste una funzione liscia g (ma non olomorfa) su S tale che g + up sia
olomorfa fuori da p. Generalizzando, esiste una funzione meromorfa con
poli semplici in p1 , . . . , pn se esiste una funzione liscia g su S tale che
g + λ1 up1 + · · · + λn upn sia olomorfa nel complementare di {p1 , . . . , pn }.
Essere olomorfa vuol dire avere ∂¯ nullo. Posto u = −(λ1 up1 + · · · +
λn upn ), ci si riduce a studiare il problema dell’esistenza di una funzione
liscia che soddisfi
¯ = ∂u
∂g ¯
¯ è un termine noto.
ove ∂u
Definizione. Si introducono gli spazi vettoriali complessi
H 0 (S) = {funzioni olomorfe su S} = ker ∂¯ (= C se S è compatta)
H 1,0 (S) = {1-forme olomorfe su S} = ker ∂¯ : Ω1,0 (S) → Ω2 (S)
H 0,1 (S) = Ω0,1 (S)/ Imm(∂¯ : Ω0 → Ω0,1 )(= {f dz̄}/{∂ϕ})
¯
H 1,1 (S) = Ω2 (S)/ Imm(∂¯ : Ω1,0 → Ω1,1 )
Il termine noto U = ∂u ¯ sta in Ω0,1 e dire che l’equazione ∂g
¯ = U ha
0,1
soluzione equivale a dire che [U ] = 0 ∈ H . La classe [U ] dipende dal
punto p e dalla scelta di ϕ/z come funzione test. Se prendiamo un’altra
funzione test ξ che sia liscia fuori da p e meromorfa in un intorno di p
con polo singolo in p allora esiste λ ∈ C tale che h = ϕ/z − λξ è liscia
¯ p − λ∂ξ
su S e quindi ∂u ¯ = ∂h¯ da cui
¯ p ] = λ[∂ξ]
[U ] = [∂u ¯ ∈ H 0,1
per cui la classe proiettiva di [U ] dipende solo da p.
In generale se abbiamo p1 , . . . , pn ricaviamo U1 , . . . , Un ed avremo
che esiste una funzione meromorfa su S con poli semplici nei pi se e
solo se [U1 ], . . . , [Un ] sono linearmente dipendenti in H 0,1 .
Corollario. Se la dimensione di H 0,1 è minore di n allora esiste sempre
una funzione meromorfa con poli semplici solo nei punti p1 , . . . , pn .
¯ = −∂ ∂f
Fatto. Se f è una funzione liscia su S allora ∂∂f ¯ = i ∆f dx ∧
2
dy.
Dimostrazione. ∂∂f ¯ = ∂(∂ ¯ x f −i∂y f )(dx+idy)/2 = [(∂x ∂x f +i∂y ∂x f )−
i(∂x ∂y f + i∂y ∂y f )](dx − idy)(dx + idy)/4 = (∂x ∂x f + ∂y ∂y f )(dx −
idy)(dx + idy)/4 = 2i ∆f dxdy
19

Per cui il problema induce a risolvere un’equazione di Poisson


∆g = ∆u
ove ∆u è il termine noto2.
Si noti che siccome non abbiamo una metrica, i nostri laplaciani sono
¯ cioè ∆f := i(∂ ∂f
2-forme. Ossia per noi ∆ := i[∂, ∂] ¯ − ∂∂f
¯ ).
2
Teorema (che il Donaldson chiama “Main Theorem”). Sia R b ∈ Ω (S).
Il problema di Poisson ∆g = b ha soluzione se e solo se S b = 0. La
soluzione è unica a meno di costanti additive.

5.1. Conseguenze. Sia S una superficie di Riemann chiusa di genere


g. Si introducono la mappa di coniugio
σ : H 1,0 → H 0,1 σ(ω) = ω̄;
la mappa che associa ad una forma armonica (che è chiusa) la sua classe
di coomologia
i : H 1,0 → H 1 (S) i(ω) = [ω] ∈ H 1 (S);
il prodotto di dualità
Z
1,0 0,1
h, i:H ×H →C hα, [β]i = α∧β
S

¯ allora α ∧ β ′ = α ∧ (β + ∂ϕ)
che è ben definito perché se β ′R= β + ∂ϕ ¯
¯ ¯
R
e α ∧ ∂ϕ = −d(ϕα) e quindi S α ∧ ∂ϕ = ∂S ϕα = 0; e la mappa di
inclusione
ν : H 1,1 → H 2 (S)
data dal fatto che tutte le 2-forme su una superficie son chiuse e
(Imm(∂)¯ : Ω1,0 → Ω1,1 ) ⊆ (Imm(d) : Ω1 → Ω2 ) (perché ∂¯ = d su
Ω1,0 )
Fatto (corollario del teorema e del fatto di cui sopra).
(1) σ è un isomorfismo
(2) i è un immersione
(3) H 0,1 = (H 1,0 )∗
(4) H 0,1 ⊕ H 1,0 = H 1 (S)
(5) dim(H 1,0 ) = dim(H 0,1 ) = g
(6) ν è un isomorfismo

2Si ¯ = ∂u
noti che ∆g = ∆u non implica che ∂g ¯ ma solo che ∂g
¯ = ∂u
¯ + α con
1,0
∂α = 0 ossia α ∈ H
20

Dimostrazione. (1) Iniettività: Sia ω tale che σ(ω) = 0. Per definizione


¯ = ω̄ da cui ∂ ∂ϕ
esiste ϕ ∈ Ω0 tale che ∂ϕ ¯ = ∂ ω̄ = ∂ω
¯ = 0 perché ω
è olomorfa. Quindi ∆ϕ = 0 ma siccome S è compatta per il principio
del massimo ϕ è costante, ergo ω = ∂ϕ ¯ = 0. (Per ora non si è usato il
teorema.) Surgettività: data [α] ∈ H 0,1 si cerca ω 1-forma olomorfa e
¯ Applicando ∂ si ottiene ∂ ω̄ − ∂α = ∂ ∂ϕ
ϕ ∈ Ω0 tale che ω̄ − α = ∂ϕ. ¯ =
−i∆ϕ/2 siccome ω è olomorfa ∂ ω̄ = 0, dunque dobbiamo risolvere
∆ϕ = −2i∂α
visto che α ∈ Ω0,1 si ha ∂α = dα ergo S ∂α = Z dα = ∂S α = 0 ed il
R R R
teorema garantisce l’esistenza della richiesta ϕ.

(2) Sia ω olomorfa tale che ω = dα = ∂α + ∂α. ¯ Essendo ω di tipo


¯
(1, 0) si ha ∂α = 0 e quindi α è olomorfa. Siccome S è compatta α è
costante, da cui ω = 0. (Qui non si è usato né il teorema né il fatto.)

(3) Usando il prodotto di dualità insieme a σ si ottiene


Z
hα, σ(β)i = α ∧ β̄
S
che è un prodotto hermitiano definito positivo. Ne segue che l’applica-
zione Z Z
β 7→ Lβ = · ∧ β̄, ossia Lβ (α) = α ∧ β̄
S A
è un isomorfismo tra H 1,0 e il suo duale. Essendo σ un isomorfismo
la tesi segue considerando θ → 7 Lσ−1 ([θ]) che associa a [θ] ∈ H 0,1 un
elemento di (H 1,0 )∗ .

(4) Siccome i è un immersione allora H 1,0 ha dimensione finita. Con-


sideriamo la mappa
ı : H 1,0 ⊕ H 0,1 → H 1 (S) (α, [θ]) 7→ i(α) + i(σ −1 ([θ]))
Siccome i è iniettiva e σ è un isomorfismo, allora anche [θ] 7→= i(σ −1 θ) è
iniettiva. Ne segue che anche ı è iniettiva. Per la surgettività, sia ω una
1-forma chiusa su S. Si cercano 1-forme α olomorfa e θ antiolomorfa
ed f ∈ Ω0 tali che
ω − α − θ = df = ∂f + ∂f ¯
Siccome Ω1 = Ω1,0 ⊕ Ω0,1 si ha ω = ω1,0 + ω0,1 . Per cui si deve cercare
¯ antiolomorfa. Quindi si
f tale che ω1,0 − ∂f sia olomorfa e ω0,1 − ∂f
deve risolvere
¯ 1,0 = i ∆f
∂ω ∂ω0,1 = − ∆f
i
2 2
21

siccome ω è chiusa 0 = dω = ∂ω + ∂ω ¯ = ∂ω ¯ 1,0 + ∂ω0,1 e le due


equazioni appena scritte sono compatibili. Siccome per le (1, 0)-forme
∂¯ = d, si deve risolvere
−2idω1,0 = ∆f
che ha soluzione per Stokes ed il main theorem.

(5) Per il punto (3) H 1,0 e H 0,1 hanno la stessa dimensione. La tesi
segue da punto (4) e dal fatto che dim(H 1 (S)) = 2g.

(6) La surgettività è immediata per definizione. Sia [ω] ∈ H 1,1 tale che
ω = dα con α ∈ Ω1 . Per Stokes S ω = 0 e per il main theorem esiste
R
¯ = ω. Ponendo β = ∂f si ha quindi ω = ∂β
f tale che ∂∂f ¯ e dunque
1,1
[ω] = 0 ∈ H . 
Corollario. Una superficie di Riemann S che è omeomorfa a S 2 è
biolomorfa a CP1 .
Dimostrazione. dim(H 0,1 ) = 0 quindi per ogni punto p di S esiste una
funzione meromorfa su S con un solo polo di ordine 1 in p e nient’altro
(vedi discussione a inizio sezione). Una tale funzione non è altro che
una funzione olomorfa da S a CP1 di grado 1, cioè iniettiva. Quindi è
un biolomorfismo. 
Corollario. Una superficie di Riemann S che è omeomorfa a un toro
è biolomorfa a C/Λ ove Λ è un sotto gruppo discreto di C isomorfo a
Z2 .
Dimostrazione. Siccome dim(H 1,0 ) = 1 esiste una forma olomorfa ω
non nulla su S. Per la formula delle molteplicità, ω non può avere zeri.
Integrando ω su cammini a partire da un punto base si ottiene una
funzione olomorfa iniettiva a valori in C modulo il gruppo generato dai
periodi. 
Corollario. Sia S una superficie di Riemann di genere g e siano {pi }
almeno g + 1 punti distinti su S. Allora esiste una funzione meromorfa
su S i cui poli stanno su qualcuno dei pi .
Dimostrazione. Viene direttamente dalla discussione a inizio sezione e
dal fatto che dim(H 0,1 ) = g. 

6. Periodi e Jacobiana
Testo di riferimento per questa sezione: J. Jost Compact Riemann
Surfaces, third edition Springer Universitext. (In biblioteca c’è.)
Sia S una superficie di genere g > 0. Fissiamo una volta per tutte
un modello topologico di S come segue.
22

Sia P un 4g-agono, ossia un poligono regolare con 4g lati. Etichet-


tiamo i lati del bordo di P in senso orario con i simboli

a1 b1 a−1 −1 −1 −1
1 b1 a2 b2 a2 b2 ... i = 1, . . . , g

(oppure i ∈ Z/gZ.) Avendo ai bi a−1 −1


i bi la scrittura di un commutatore,
possiamo scrivere ∂P = Πi [ai , bi ]. Sarà importante per i segni dei conti
che faremo che bi venga subito dopo ai , cosı́ come a−1 i venga dopo bi .
−1
Adesso per ogni i incolliamo tra loro i lati ai con ai badando a farlo
con le orientazioni inverse, quindi ai si incolla con −a−1 i . Stessa cosa
per i bi .
Il risultato di P modulo la relazione d’equivalenza degli incollamenti
è omeomorfo a S. D’ora in avanti lavoreremo su P considerando S =
P/ ∼.
I lati di P danno luogo a cammini chiusi in S, le cui classi di omologia
in H1 (S) denotiamo ancora con ai e bi . Tali classi costituiscono una
base di H1 (S), sia considerando lo spazio vettoriale H1 (S, C) che lo
Z-modulo (gruppo abeliano) H1 (S, Z).
Si ha H 1 ≃ (H1 )∗ e la dualità è data dall’integrazione hω, γi = γ ω.
R
1
Si
R noti Rche per stokes, se [ω] = [η] ∈ H e se [γ] = [δ] ∈ H1 , allora
γ
ω = δ η.

Sia z0 R∈ S un punto base e ω una 1-forma olomorfa. Localmente


z
f (z) = z0 ω è ben definito e df = ω. Globalmente, se γ e η sono
R R
due cammini tra z0 e z la differenza tra γ ω e ηω è l’integrale di ω
sul cammino chiuso γ ∗ η −1 . Un integrale di ω su un cammino chiuso
si chiama periodo di ω. L’insieme dei periodi è un gruppo abeliano
generato dai periodi di ω sugli ai ed i βi . Ne segue che f è ben definita
come funzione a valori in C modulo il gruppo dei periodi. Se g > 1 di
solito il gruppo dei periodi non è discreto come sottogruppo di C ed il
quoziente risulta quindi un troiaio3.
Si ovvia a questo inconveniente integrando contemporaneamente una
base di H 1,0 . Sia ω1 , . . . , ωg una base dello spazio delle forme olomorfe
su S. Definiamo la funzione
Z z Z z
F (z) = ( ω1 , . . . , ωg ) F : S → Cg /Λ
z0 z0

3Nonostante ciò, l’integrazione di ω da luogo ad una struttura di traslazione su


S. Le strutture di traslazione sono molto studiate.
23

ove Λ è il gruppo dei periodi, cioè il sottogruppo additivo di Cg generato


dai vettori:
R  R  R  R 
ω
a1 1 ag
ω 1 ω
b1 1
ω
bg 1
 ..   .   .   . 
R .  , . . . , R ..  , R ..  , . . . , R .. 
ω
a1 g ag g
ω ω
b1 g
ω
bg g

sia M la seguente matrice g × 2g a coefficienti in C


R R R R 
ω . . . ag ω1 b1 ω1 . . . bg ω1
a1 1
M =  ... .. .. .. 

R · · · R . R . · · · R . 
ω . . . ag ωg b1 ωg . . . bg ωg
a1 g

Teorema. Le colonne di M sono linearmente indipendenti su R.


Dimostrazione. Siccome H 1 = H 1,0 ⊕ H 0,1 e l’isomorfismo σ : H 1,0 →
H 0,1 è il coniugio, una base per H 1 è data da ω1 , . . . , ωg , ω̄1 , . . . , ω̄g . La
1
matrice dell’accoppiamento di dualità  tra H
 e H1 come spazi vettoriali
M
reali, è data quindi dalla matrice N = (che è una matrice 2g×2g).
M
Se le colonne di M fossero linearmente indipendenti su R allora lo
sarebbero anche quelle di N , che però ha determinante non nullo perché
l’accoppiamento di dualità è una forma bilineare non degenere. 
Corollario. Cg /Λ ≃ R2g /Z2g .
Dimostrazione. Siccome le colonne di M sono linearmente indipendenti
su R, le si possono usare come base su R di Cg R2g . Nelle coordinate
date dalla nuova base, Λ diventa il gruppo additivo generato dalla base
canonica, che è Z2g . 
Teorema. Le prime g colonne di M sono linearmente indipendenti su
C.
Per dimostrare questo teorema useremo le cosiddette Relazioni di
Riemann. Sia ω una 1-forma olomorfa su S. Ci mettiamo nel modello
del 4g-agono P con la relazione degli incollamenti del bordo. Sia z0 un
punto interno di P . Definiamo
Z z
f (z) = ω
z0

la f è ben definita sui punti interni di P e soddisfa df = ω per il


teorema fondamentale del calcolo integrale. Sul bordo compariranno
le ambiguità dei periodi. Sia z un punto del lato ai e sia z ′ ∈ a−1
i un

punto incollato a z. Ossia z e z sono diversi in P ma diventano lo
24

stesso punto in S. Sia x il punto iniziale di bi (che coincide col punto


finale di ai ) e sia x′ il punto finale di bi . Si ha
Z z′ Z z Z x Z x′ Z z′ Z

f (z ) = ω= ω+ ω+ ω+ ω = f (x) + ω
z0 z0 z′ x x′ bi
Rx R z′
perché z ω = − x′ ω (l’identificazione incolla il lato ai con il lato
a−1
i , ma con l’orientazione opposta!)
Un calcolo analogo, tenendo conto di come sono ordinati gli ai e i bi
sul bordo di P , mostra che se w ∈ bi e w′ ∈ b−1i sono incollati dalle
identificazioni allora
Z

f (w ) = f (w) − ω
ai

Poniamo Z Z
αi = ω βi = ω
ai bi
Sia ora η una 1-forma su S. Ci restringeremo ai casi in cui η sia
antiolomorfa oppure meromorfa. Andiamo a calcolare
Z
f (z)η.
∂P

Su ai abbiamo η(z) = η(z ) perché η è una forma definita su S.
Mentre per f abbiamo le relazioni appena dimostrate. Da cui
Z Z Z Z Z
fη + fη = f η − (f + βi )η = −βi η
ai a−1
i ai ai ai

e similmente otteniamo
Z Z Z
fη + f η = αi η.
bi b−1
i bi
R R
Se poniamo αi
η = γi e βi
η = δi abbiamo le relazioni di Riemann
Z X
fη = αi δi − βi γi
∂P i

che si legge anche


Z XZ Z Z Z
fη = ω η− ω η
∂P i ai bi bi ai

Dimostrazione del teorema. Specializziamo le relazioni al caso η = ω̄.


d(f ω̄) = df ∧ ω̄ + f dω̄
25

siccome ω è olomorfa, dω̄ = 0. D’altronde avevamo df = ω. Se


localmente ω = ϕ(z)dz si ha
d(f ω̄) = ω ∧ ω̄ = |ϕ|2 dz ∧ dz̄ = −2i|ϕ|2 dx ∧ dy.
Da cui
1 i
Z Z Z
f ω̄ = d(f ω̄) = |ϕ|2 dxdy > 0
−2i ∂P 2 P P
e quindi per ogni forma olomorfa ω non identicamente nulla si ha
X X
0 6= αi β̄i − ᾱi βi = 2iℑ(αi β̄i )
i i

ergo non può succedere che gli αi siano tutti nulli a meno che ω non
sia la forma nulla. Ma è chiaro che, se chiamiamo A la matrice g × g a
coefficienti
P complessi ottenuta trasponendo le prime g colonne di M e
se ω = xi ωi allora si ha
α1 x1
   
 ...  = A  ... 
αg xg
Siccome le ωi sono una base di H 1,0 e le relazioni valgono per ogni forma
olomorfa, abbiamo ottenuto che il sistema AX = 0 ha come unica
soluzione X = 0, ossia A è invertibile e le sue righe sono linearmente
indipendenti su C. 
Corollario. Due forme olomorfe sono uguali se e solo se hanno gli
stessi periodi sugli ai .
Corollario. L’integrazione sugli ai fornisce delle coordinate per H 1,0 .
Corollario. Esiste una base ω1 , . . . , ωg di H 1,0 tale che ai ωj = δij .
R

Tale base si chiama base normalizzata. Rispetto alla base normalizzata


la matrice M assume la forma M = (I, Z).

Adesso specializziamo le relazioni di Riemann al caso di η meromorfa


senza poli su ∂P e z0 , ma soprattutto senza residui. Verrà fuori un
formulazzo che ci servirà nella prossima sezione.
Dire che η non ha residui vuol dire che nello sviluppo in serie vicino
a un polo mancaR z il termine 1/z. In oltre l’assenza di residui garantisce
che l’integrale z0 dentro P è ben definito. Le relazioni di Riemann ci
dicono
X Z X
Res(f η) = fη = αi δi − βi γi .
∂P i
26

Adesso fissiamo una volta per tutte, e ciò sarà valido anche per la
prossima sezione, delle pallette intorno ai poli di η disgiunte tra loro
e delle coordinate locali intorno in tali pallette in modo che il polo in
questione sia lo zero.
Vicino al polo p, la ω avrà espansione locale ( k≥0 cpk z k )dz, ove
P
l’apice p è per ricordarsi che stiamo sviluppando vicino a p, per cui la
f sarà Z p X p 1
f (z) = ω+ ck−1 z k
z0 k≥1
k
Rp
(il fatto che z0 ω si porta dietro l’indeterminazione dei periodi sparirà
perché η non ha termini di ordine 1/z.) Chiamiamo epi i coefficienti
dello sviluppo di η vicino al punto p, per cui se il polo p è di ordine
mP , X
η=( epk z k )dz.
k≥mp ,k6=1
I residui di f η sono i coefficienti del termine 1/z nel prodotto. Local-
mente, il termine 1/z nel prodotto è dato dalla somma dei prodotti di
termini di tipo 1/z h+1 con termini di ordine z h . Quindi
|mp |
X 1
Resp (f η) = epk cpk−2
k=2
k−1
e dunque la formulazza
 
g |mp |
X X X X 1 
αi δi − βi γi = Resp (f η) =  epk cpk−2 .
i=1 p p polo di η k=2
k−1

7. Il teorema di Riemann-Roch
Questo è uno dei teoremi toghi della matematica. Per enunciarlo
servono un po’ di preliminari. Il testo di riferimento è il Jost.
Sia S una superficie di Riemann chiusa di genere g.
7.1. Divisori. Per i divisori ci sono due notazioni, quella additiva
(forse più standard) e quella moltiplicativa (che useremo nel seguito).
Definizione moltiplicativa. Il gruppo dei divisori di S è l’insieme dei
prodotti formali
Πpmp
con p ∈ S e mp ∈ Z con la convenzione che p0 = 1 e che mp 6= 0 solo
per un numero finito di punti. L’operazione di gruppo è quella indotta
dalla notazione moltiplicativa (Πpmp )(Πpnp ) = Πpmp +np . L’elemento
neutro si indica con 1.
27

Definizione additiva. Il gruppo dei divisori di S è l’insieme delle


somme formali X
mp p
con p ∈ S e mp ∈ Z con la convenzione che 0p = 0 e che mp 6= 0 solo
per un numero finito di punti.
P L’operazione
P di gruppo è quella indotta
P
dalla notazione additiva mp p + np p = (mp + np )p. L’elemento
neutro si indica con 0.
I due gruppi sono ovviamente isomorfi tramite il logaritmo formale.
Si indicano con Div(S).
Esempio-definizione. Data una funzione meromorfa f su S, il suo
divisore div(f ) è Πpmp ove mp indica la molteplicità di p come zero/polo
di f e mp = 0 se f non ha né zeri né poli P in p. In kaltre parole se lo
sviluppo locale di f vicino a p è del tipo k≥mp αk z .
Notazione: Chiameremo ordine di un polo/zero il numero positivo
|mp | e molteplicità il numero mp .
Detto M (S) l’insieme delle funzioni meromorfe su S si ha la mappa
div : M (S) → Div(S) f 7→ div(f )
che è chiaramente un omomorfismo di gruppi.
Definizione. Un divisore che sia il divisore di una funzione meromorfa
si chiama divisore principale.
Esempio-definizione. Data una 1-forma meromorfa ω su S, il suo
divisore div(ω) è Πpmp ove mp indica la molteplicità di p come zero/polo
di ω e mp = 0 se f non ha né zeri né poli in p. La mappa div è un
omomorfismo di gruppi.
Definizione. Un divisore che sia il divisore di una 1-forma meromorfa
si chiama divisore kanonico4.
Definizione. Il grado di un divisore è definito da
X
deg(Πpmp ) = mp .

Fatto. Un divisore principale ha grado zero.


Dimostrazione. Una funzione meromorfa è una funzione da S a CP1 .
Siccome le mappe meromorfe preservano l’orientazione, il grado topo-
logico di f è un numero positivo ed è il numero di preimmagini di
un valore qualsiasi, contate con molteplicità. Quindi 0 e ∞ hanno lo
4lo scrivo con la kappa perché si indica sempre con K
28
P
stesso numero di preimmagini. Tale numero è dato da mp >0 mp =
P
− mp <0 mp . La tesi segue. 
Fatto. Un divisore kanonico ha grado −χ(S).
Dimostrazione. Questa non è altro che la formula dell’indice.
Definizione Classi di equivalenza. Sull’insieme Div(S) si pone la
relazione di equivalenza modulo principali
A∼B ⇔ AB −1 = div(f )
con f funzione meromorfa su S.
Fatto. deg(AB) = deg(A) + deg(B).
Dimostrazione. Segue immediatamente dalle definizioni. 
Fatto. Il grado non dipende dalla classe di equivalenza.
Dimostrazione. Se A = B div(f ) allora deg(A) = deg(B div(f )) =
deg(B) + deg(div(f )) = deg(B) 
Fatto. Se A ∼ B e B è kanonico allora anche A lo è. Viceversa, se sia
A che B sono kanonici allora A ∼ B.
Dimostrazione. Se A = B div(f ) e B = div(ω) allora A = div(f ω).
Se A = div(ω) e B = div(θ) allora ω/θ è una ben definita funzione
meromorfa f su S 5. Da cui ω = f θ e dunque A = div(θ) div(f ) =
B div(f ). 
Spesso non faremo distinzione un divisore con la sua classe di equiva-
lenza. Il divisore kanonico si chiama cosı́ perché come abbiamo appena
visto ce n’è uno solo. Il divisore canonico si indica di solito con la
lettera K.
Definizione relazione d’ordine parziale. Dati A = Πpap e B = Πpbp ,
si dirá che A ≥ B se ap ≥ bp per ogni p. Diremo A > B se A ≥ B e
A 6= B.
Esempio. Si ha div(f ) ≥ div(g) se per ogni punto p, f ha un polo
di ordine al massimo uguale a quello di g oppure uno zero di ordine
almeno uguale a quello di g.
Definizione. Per ogni divisore A si definiscono
L(A) = {f ∈ M (S) t.c. div(f ) ≥ A}
Ω(A) = {ω 1-forma meromorfa t.c. div(ω) ≥ A}
5Usando il formalismo “fisico” se ω = hdz e θ = gdz allora i dz si semplificano
nel rapporto
29

Fatto. Sono entrambi sottospazi vettoriali.


Dimostrazione. Localmente se f = h≥n ah z h e g = h≥m bh z h allora
P P

λf + µg = h≥r ch z h con r ≥ min(m, n).


P

Fatto. Le dimensioni di entrambi dipendono solo dalla classe di equi-
valenza di A.
Dimostrazione. Se A = B div(f ) allora la moltiplicazione per f fornisce
isomorfismi tra L(A) e L(B) e tra Ω(A) e Ω(B). 
Fatto. dim(Ω(A)) = dim(L(A/K)).
Dimostrazione. Sia ω una forma meromorfa non identicamente nul-
la. Tale forma esiste perché per il main theorem esistono forme olo-
morfe e funzioni meromorfe. La divisione per ω fornisce un isomorfi-
smo tra Ω(A) e L(A/ div(ω)). Infatti, se η è una 1-forma meromorfa
con div(η) ≥ A allora η/ω è una ben definita funzione meromorfa e
div(η/ω) = div(η)/ div(ω) ≥ A/ div(ω). In oltre se uso ω ′ ho che
div(ω ′ )/ div(w) = div(ω ′ /ω) = div ϕ per cui A/ div(ω) ∼ A/ div(ω ′ ).
Dunque ha senso parlare di dim(L(A/K)).
Esempio. Se si definiscono gli Ωq usando i q-differenziali, con lo stesso
trucco si scala di ordine scaricando tutto su potenze di K. Per esempio
se si considera lo spazio dei differenziali quadratici si ha dim(Ω2 (A)) =
dim(Ω(A/K)) = dim(L(A/K 2 )).
Teorema (Riemann-Roch).
dim(L(A−1 )) − dim(Ω(A)) = deg(A) − g + 1
o, in notazione additiva:
dim(L(−A)) − dim(Ω(A)) = deg(A) − g + 1
o anche
dim(L(−A)) − dim(L(A − K)) = deg(A) − g + 1
o anche
dim(Ω(K/A)) − dim(Ω(A)) = deg(A) − g + 1
o anche
dim(L(A−1 )) − dim(Ω2 (KA)) = deg(A) − g + 1
In letteratura si trovano anche le seguenti notazioni: il divisore si
indica con D e si pone l(D) = h0 (D) = dim(L(−D)) per cui la formula
si legge
h0 (D) − h0 (K − D) = deg(D) − g + 1
l(D) − l(K − D) = deg(D) − g + 1.
30

Dimostrazione. Il primo passo è il caso A > 1 e divisori equivalenti,


da cui seguirà il caso generale. Ricordiamo che le dimensioni degli
spazi in gioco dipendono solo dalla classe di equivalenza del divisore
A. Sia quindi A > 1. Quindi A = Πpmp con mp > 0 ove p varia
in un insieme p1 , . . . , ps . Per non appesantire le notazioni ometteremo
quando possibile il pedice i e scriveremo p anziché pi .
X
deg(A) = mp .
p

Una funzione f ∈ L(1/A) è una funzione meromorfa con poli nei punti
p di ordine al piú mp . Il suo differenziale df ha le seguenti proprietà
(1) df non ha residui;
(2) l’integrale di df lungo ogni cammino chiuso è nullo;
(3) df è una 1-forma meromorfa con poli nei punti p di ordine al
piú mp + 1.
Siano quindi B = Πp−mp −1 , ai e bi le curve derivanti dalla descrizione
di S come 4g-agono coi lati incollati e V lo spazio vettoriale
Z
V = {ω ∈ Ω(B) senza residui e tale che ω = 0 ∀i = 1, . . . , g}
ai

Il differenziale è un’applicazione lineare da L(1/A) in V per cui


dim(L(1/A)) = dim(Imm(d)) + dim(ker(d))
ovviamente ker(d) è lo spazio delle funzioni costanti e quindi ha
dimensione 1. Quindi
dim(L(1/A)) = 1 + dim(Imm(d))
e dobbiamo solo calcolare la dimensione dell’immagine di d.
R
Lemma. Imm(d) è lo spazio {ω ∈ V : bi ω = 0 ∀i = 1, . . . , g}.

Dimostrazione. Ovviamente ImM (d) è contenuto in tale spazio per la


proprietà (2) di cui sopra. Viceversa, se ω sta in tale spazio, allora
l’integrale di ω lungo un qualsiasi cammino Rchiuso èRnullo (localmente
perché non ha residui, globalmente perché ai ω = bi ω = 0 per ogni
Rz
i). Quindi rimane ben definita f = z0 ω ed è chiaro che f ∈ L(1/A) e
che df = ω ∈ Imm(d). 
Quindi Imm(d) è ottenuto da V imponendo g equazioni lineari. C’è
dunque da calcolare la dimensione di V e quante di queste g equazioni
sono linearmente indipendenti.
31

Lemma. Sia ψ una funzione che sia localmente meromorfa vicino ai


pi e C ∞ (nel senso reale) sul resto di S. Allora esiste una 1-forma di
tipo (1, 0) η liscia su tutta S e tale che
¯ = ∂∂ψ.
∂η ¯
Dimostrazione. Siano Bi pallette disgiunte tra loro, intorno ai pi , tali
che ψ sia meromorfa su ogni Bi con unico polo in pi . Allora, essendo
¯ = 0 su Bi e dunque d∂ψ = 0 su Bi si ha, usando stokes,
∂ψ
Z XZ Z Z XZ
d∂ψ = d∂ψ + d∂ψ = d∂ψ = ∂ψ
S i Bi S\∪i Bi ∂(S\∪i Bi ) i ∂Bi

siccome ψ è meromorfa su Bi si ha ∂ψ = dψ, un’altra istanza di stokes


ci dice Z XZ XZ
d∂ψ = ∂ψ = ψ=0
S i ∂Bi i ∂∂Bi

Quindi per il main theorem esiste una funzione h liscia su S tale che
¯ = ∂∂ψ
∂∂h ¯
e ponendo η = ∂h si ha la tesi. 
Corollario. Per ogni n ≥ 2 e per ogni pi esiste una 1-forma meromorfa
θi,n su S con un solo polo nel punto pi di ordine
R esattamente n. In oltre,
tali forme possono essere scelte in modo che aj θi,n = 0 per ogni j, i, n.
Dimostrazione. Basta usare come ψ la funzione −ϕ/z n−1 con ϕ funzio-
ne di taglio opportuna che vale 1 vicino a pi . Se η è la (1, 0)-forma data
dal lemma allora la forma θi,n = η − ∂ψ soddisfa l’equazione ∂¯ = 0 e
quindi è meromorfa su S. L’unico polo è di ordine n per costruzione.
Si noti che per usare il lemma serve n ≥ 2 perché 1/z non è il dif-
ferenziale di nessuna funzione meromorfa. A questo punto dobbiamo R
ammazzare i periodi. Prendiamo una forma θ = θi,n e sia αj = aj θ.
Per
R le relazioni di Riemann esiste unica una forma olomorfa τ tale che
aj
τ = αj per j = 1, . . . , g. La forma θ − τ è meromorfa, ha i periodi
lungo gli aj nulli e gli stessi poli di θ, con gli stessi ordini. 
Corollario. dim(V ) = deg(A).
Dimostrazione. Chiaramente le forme θi,n con n = 2, . . . , mpi +1 stanno
in V e sono linearmente indipendenti tra loro (hanno poli di ordini
diversi in ognuno dei vari pi ). D’altronde, se ω ∈ V allora ha poli di
ordine al piú mpi + 1 in pi per cui sommando una combinazione lineare
delle θi,n si può cancellare
P il polo. Esistono quindi numeri complessi
λi,n tali che ω − λi,n θi,n sia una 1-forma olomorfa. Per P costruzione,
l’integrale di tale forma lungo ogni ai è nullo e quindi ω− i λi,n θi,n = 0
32

e dunque le θi,n oltre ad essere linearmente indipendenti generano e


quindi formano una base di V . Ne segue che
X
dim(V ) = mpi = deg(A)
i

Lemma. dim(Imm(d)) = deg(A) − g + dim(Ω(A))

Dimostrazione. Le g condizioni lineari che determinano Imm(d) sono


Z
ω=0 i = 1, . . . , g.
bi

Sia ωR ∈ V e ω1 , . . . , ωg una Rbase di H 1,0 normalizzata rispetto agli ai


z
(ossia ai ωj = δij ). Sia fj = z0 ωj la funzione definita per dimostrare
R
le relazioni di Riemann. Queste, insieme al fatto che ai ω = 0 per ogni
ai , traducono le condizioni di integrazione sui bi nelle seguenti
X
Res(fj ω) = 0 j = 1, . . . , g.
P
Siccome ω = λi,n θi,n si ottiene
X XX
Res(fj ω) = λi,n Resp (fj θi,n ) j = 1, . . . , g
i,n p

Sviluppiamo le ωj localmente vicino ai poli


!
X p,j
ωj = ck z k dz
k≥0

e usiamo la formulazza tenendo conto che localmente vicino a pi si ha


1
θi,n = (n − 1) piú un termine olomorfo.
zn
Per cui le condizioni lineari diventano
pi +1
s mX
X
λi,n cpn−2
i ,j
=0 j = 1, . . . , g
i=1 n=2

In termini matriciali ció si esprime come

HX = 0
33

ove
λ1,2
 
 .. 
 . 
λ 
 1,m1 +1 
 λ 
 2,2 
 . 
 .. 
X= 
λ2,m2 +1 
 .. 
 
 . 
 λs,2 
 
 . 
 .. 
λs,ms +1
e H è la matrice deg(A) × g formata dai coefficienti cpn−2
i ,j
.
 p ,1 p1 ,1

c0 1 . . . cm 1 −1
c0p2 ,1 . . . p2 ,1
cm 2 −1
... c0ps ,1 ... ps ,1
cm s −1
cp1 ,2 . . . cp1 ,2 p2 ,2 p2 ,2
c0ps ,2 ps ,2 
m1 −1 c0 ... cm ... ... cm
H =  0. 2 −1 s −1 

 .. .
.. .
.. .. .. .. 
... ... . ... . ... . 
p1 ,g p1 ,g p2 ,g
c0 . . . cm1 −1 c0 ... cpm22,g−1 ... cp0s ,g ... ps ,g
cms −1
Per cui
dim(Imm(d)) = dim(ker H) = deg(A) − rango(H).
Sia T la trasposta di H, chiaramente rango(T ) = rango(H) e si ha
g = rango(T ) + dim(ker T ).
Adesso basta osservare che ker(T ) non è altro che lo spazio Ω(A).
Da cui
rango(H) = g − dim(Ω(A))
e
dim(L(1/A)) = 1 + dim(Imm(d)) = 1 + deg(A) − g + dim(Ω(A))
e il primo passo è fatto. Gli altri casi seguono facilmente. Vediamoli.

Caso: Divisore equivalente al divisore 1. Siccome le dimensioni in


gioco dipendono solo dalla classe di equivalenza di A, basta considerare
il caso A = 1. Se A = 1 allora L(1/A) = L(1) è fatto di funzioni
olomorfe e quindi constanti, ergo dim(L(1)) = 1. mentre Ω(1) non è
altro che H 1,0 che ha dimensione g. Essendo deg(A) = 0 la formula
segue.
Caso: K/A equivalente ad un divisore B > 1. Applicando
Riemann-Roch a K/A si ottiene
dim(L(A/K) = deg(K/A) − g + 1 + dim(Ω(K/A))
34

da cui
dim(Ω(A)) = deg(K) − deg(A) − g + 1 + dim(L(1/A))
e la tesi segue da deg(K) = 2g − 2.
Caso finale: Quando né A né K/A sono equivalenti a un Divi-
sore B > 1.
Lemma. L(1/A) = 0
Dimostrazione. Se ci fosse f ∈ L(1/A) allora div(f ) > 1/A, ma allora
A div(f ) > 1 per cui A è equivalente a B = A div(f ) e B > 1. 
Lemma. Ω(A) = 0
Dimostrazione. Se ci fosse ω ∈ Ω(A) allora div(ω) > A ergo B =
div(ω)/A > 1 e per ogni η ∈ H 1,0 si ha che ω/η = f è una funzione
olomorfa e
div(ω) div(η)
div(f )K/A = =B>1
div(η) A

Corollario. In questo caso Riemann-Roch si riduce a dimostrare che
deg(A) = g − 1.
Sia A = A+ /A− con A+ > 1 e A− > 1. Per loro possiamo appli-
care Riemann-Roch del primo passo e otteniamo, tenendo conto che
deg(A) = deg(A+ ) − deg(A− ),

deg(A) = dim(L(1/A+ )) − deg(A− ) − dim(Ω(A+ )) + g − 1.


Lemma. dim(L(1/A)) − deg(A− ) ≤ 0.

Dimostrazione. 0 = L(1/A) è un sottospazio di L(1/A+ ) ottenuto im-


ponendo alle funzioni di avere zeri nei punti di A− , con ordine almeno
quanto A− . Tali condizioni sono lineari. Anche se non sono indi-
pendenti, si ha comunque che imponendo deg(A− ) condizioni lineari a
L(1/A+ ) si ottiene lo spazio 0. Quindi la dimensione di L(1/A+ ) non
puó eccedere deg(A− ). 
Corollario. deg(A) ≤ g − 1.
Dimostrazione. Immediata. 
Corollario. deg(K/A) ≤ g − 1.
Dimostrazione. Basta rifare il ragionamento sostituendo A con K/A.

Corollario. deg(A) ≥ g − 1.
35

Dimostrazione. Avendo deg(K/A) = deg(K) − deg(A) = 2g − 2 −


deg(A), si ha g − 1 ≥ deg(K/A) = 2g − 2 − deg(A) da cui deg(A) ≥
g − 1. 
Dunque
deg(A) = g − 1
ed il teorema è concluso.
ISSN: 2037-6367

MatematicaMente
Pubblicazione mensile della sezione veronese della MATHESIS – Società Italiana di Scienze Matematiche e
Fisiche – Fondata nel 1895 – Autorizzazione del Tribunale di Verona n. 1360 del 15 – 03 – 1999 – I diritti
d’autore sono riservati. Direttore: Luciano Corso – Redazione: Alberto Burato, Fabrizio Giugni, Michele Picotti,
Sisto Baldo – Via IV Novembre, 11/b – 37126 Verona – tel e fax (045) 8344785 – 338 6416432 – e-mail:
lcorso@iol.it – Stampa in proprio – Numero 197 – Pubblicato il 01 – 02 – 2015

Queste funzioni sono tali in quanto soddisfano la definizione stessa


Sulla definizione di funzione continua di funzione che impone che per ogni elemento del dominio corri-
sponda uno ed uno solo elemento del codominio.
Luciano Corso [1] Possiamo notare che le due funzioni non sono né iniettive, né suriet-
tive.
Verifichiamo se esse sono funzioni continue oppure no. Dalla defi-
Abstract: The mathematical concept of continuous (or disconti-
nizione di funzione continua (1.1), questa proprietà va verificata sul-
nuous) function is controversial. The different points of view have
le topologie TY e TX.
different interpretations when we have to decide if a function is
continuous at a point. To clear up this concept, we propose a topo- Tabella 1
logical approach to the question and our method is applicable to
both the analysis of functions on finite and discrete sets, and func-
f –1(GY) g –1(GY)
tions on continuous sets. The mathematical object that we consider
important for this kind of analysis is the triple {{X,TX}, {Y, TY}, f},
where {X, TX} is the topological space of the domain, {Y, TY} is the   TY   TX   TY   TX
topological space of codomain and f is a function from X to Y. {x}  TY   TX {x}  TY {a, b} TX
{y} TY {a}TX {y} TY  TX
1. Sulla Continuità di una funzione {x, y} TY {a}TX {x, y} TY {a, b}TX
{y, z, w}TY XTX {y, z, w}TY {c, d }TX
Consideriamo due spazi topologici {X, TX} e {Y, TY} e una fun- Y TY XTX Y TY X TX
zione f : X  Y. La funzione f è continua se e solo se la controimma-
gine (o immagine inversa) di ogni aperto GY di TY è un aperto GX di Dalla tabella 1 si osserva che con f –1 da aperti di TY si arriva sempre
TX. Formalmente si scrive: ad aperti di TX. Perciò f è continua in (occhio!) {{X, TX}, {Y, TY}, f

f: X  Y 
è continua   GY  TY , f 1 GY   G X  TX  (1.1)
}; mentre con g –1, a partire da {y, z, w} si arriva a {c, d}; questo in-
sieme, però, non appartiene a TX (non è un aperto nella topologia
TX). Perciò g non è continua in {{X, TX}, {Y, TY}, g}. Insomma, la
Sulla base di questa definizione, la continuità di una funzione è sem-
continuità di una funzione non dipende solo dalla funzione (non è
pre relativa a TX e TY. Perciò essa dipende da una terna di oggetti
cioè solo una proprietà della funzione), ma da una terna di enti ma-
matematici: {{X, TX}, {Y, TY}, f } ed è una proprietà globale del si-
tematici: lo spazio topologico del dominio, quello del codominio e
stema (la terna).
la funzione. Per quanto qui detto, se dovessimo cambiare la topolo-
Verifichiamo il significato di quanto espresso dalla definizione pri-
gia TX, potrebbe succedere che la stessa funzione f non sia più conti-
ma su uno spazio topologico con insiemi generatori X e Y costituiti
nua. A riprova di ciò, si consideri una diversa topologia di TY. Sia
da pochi punti (insiemi discreti e finiti) e poi su {R, TR}, cioè su R e
essa
la sua topologia usuale. Notiamo che
1) X e Y possono essere insiemi di natura qualsiasi e possono essere TY* = {, {x}, {z}, {x, z}, {x, z, w}, Y}.
In tal caso f –1({x, z}) = {b, c} che non è un aperto di TX. Perciò in
composti dagli stessi elementi; in tal caso X = Y. Anche TX e TY pos-
questa nuova topologia f non è più continua.
sono essere uguali.
2) La continuità di f va valutata sempre con riferimento alle due to-
2. Sulla continuità di una funzione in un punto
pologie (peraltro arbitrarie), TX e TY, prese in considerazione.
3) R ha una sua topologia, TR, che deve sempre essere presa in Ora valutiamo quando una funzione è continua in un punto x0.
considerazione, anche se spesso viene sottointesa. Una base per la Per quanto detto, non ha senso valutare la continuità di una funzione
topologia usuale TR è formata dagli intervalli aperti (, ), con  < in un punto in cui essa non è definita. Perciò, in x0 la funzione deve
. In altre parole, ogni insieme aperto G  TR è unione di intervalli esistere: altrimenti non è né continua, né discontinua; semplicemen-
te non c’è, non è definita.
aperti [B.4].
Occorre ora partire considerando, per analogia ristretta, quanto fin
Prendendo lo spunto da [B.3], sia {X, TX} uno spazio topologico
qui detto. Dalla (1.1) si può dedurre che per ogni y = f(x)  Y, f è
in cui X = {a, b, c, d} e TX = {, {a}, {a, b}, {a, b, c}, X}; sia, inol-
continua se ogni aperto GY TY tale che y GY ha come controim-
tre, {Y, TY} un secondo spazio topologico in cui Y = {x, y, z, w} e TY
magine f- –1( GY) aperti di TX che abbiano x X come elemento. Allo-
= {, {x}, {y}, {x, y}, {y, z, w}, Y}. Poiché | X | = 4 e | Y | = 4, il nu- ra si può dire che una funzione f : X  Y è continua in x0  X sse
mero di funzioni possibili da un 4-insieme a un 4-insieme è 44 = per ogni aperto GY di TY, tale che f(x0)  GY, la sua controimmagine,
256. Di queste, consideriamo le due funzioni da X a Y: f e g (Grafico f –1(GY), in X genera aperti GX TX che abbiano x0 come elemento. In
1). simboli:
( f : X  Y è continua in x0 ) 
( GY  TY , f(x0) GY, f –1(GY) = GX  TX, x0 GX) (2.1)
La funzione è discontinua in x0 sse esiste un aperto GY a cui f(x0)
appartiene la cui controimmagine f –1(GY), non è un aperto GX di TX
che abbia x0 come elemento.
Osserviamo che la (2.1) corrisponde esattamente alla definizione
classica, del tipo -, di continuità di una funzione in un punto x0 co-
sì come è riportata in (B.1) e altri autori; ma in questo nostro caso
essa risulta più generale. Infatti, implicitamente, in (B.1) si dà per
Grafico 1: le funzioni f e g da X a Y. scontato che x0 sia un punto di accumulazione.
Con riferimento al nostro esempio verifichiamo se x0 = c è un
punto di continuità per f e per g, negli spazi topologici TX e TY presi
in considerazione.
Per f, f(c) = w. L’elemento w, in TY, ammette solo due aperti che lo
contengono: {y, z, w} e Y. Peraltro, all’aperto {y, z, w} di TY corri-
sponde in TX l’unico aperto X che contiene c (inoltre f –1(Y) = X).
Perciò la funzione f è continua in x0 = c. Così si può dimostrare la
continuità di f in ogni altro punto di X. Se una funzione ha come
proprietà globale la continuità, allora essa vale anche come proprietà
puntuale. D’altra parte, se prendiamo la funzione g, c ha la sua im-
magine g(c) = z che appartiene all’aperto {y, z, w} e a Y di TY. Gli
insiemi corrispondenti in TX di questi due aperti sono {c, d} e X.
Grafico 3. La funzione (2.3) realizzata con Mathematica 5.1 e con BitMap
Quest’ultimo è un aperto cui appartiene c, ma {c, d} non è un insie-
me aperto appartenente a TX. Perciò in c la funzione g, secondo la
Analizziamo ora la funzione (2.4). La funzione è definita su tut-
terna {{X, TX}, {Y, TY}, g}, non è continua.
to R\{0}.
Quanto fin qui esposto è un metodo generale di studio della con-
tinuità di una funzione. Abbiamo preso insiemi discreti e finiti, cioè
sconnessi e irti di ostacoli, proprio per verificare la proprietà di con-
tinuità su funzioni con domini e codomini strani, certamente non u-
suali negli studi di analisi. Ora, sulla base di quanto qui espresso, sin  x 
verifichiamo l’utilità di questi metodi nel valutare la continuità delle g:x (2.4)
x
funzioni e delle funzioni in un punto quando lo spazio topologico è
R dotato dell’usuale topologia. Per ciò che abbiamo detto finora, la
terna che dobbiamo prendere in considerazione in questo caso è
{{XR, TR}, {YR, TR}, f }, dove f è una funzione generica, e analizzia-
mo la continuità (o la discontinuità) di f nella terna considerata, an- Grafico 4. Realizzato con Mathematica 5.1
che rispetto a un suo punto x0.
Cominciamo ad analizzare la funzione (2.2). Poiché in x = 0 la funzione non è definita, non ha senso valutare la
La funzione è definita su R\{0} e assume solo due valori: –1, +1. La continuità (o la discontinuità) in quel punto. Il codominio di g è an-
funzione per x0 = 0 non è definita e quindi non ha senso parlare di cora R esteso, anche se in realtà essa dà valori in un intervallo
continuità (o discontinuità) della funzione in questo punto. Per ogni limitato. Consideriamo la topologia usuale di R e verifichiamo se,
altro valore di R essa è definita. Perciò, in condizioni prive di vinco- data la terna {{XR, TXR}, {YR, TYR}, g}, la nostra g è continua. Per
li particolari, f ha dominio: XR = R\{0}. Scegliamo ora la topologia ogni x  XR, g(x) = y  YR, in TYR esiste una famiglia di aperti GY la
di XR, TXR che conviene che sia la topologia usuale di R\{0}. Essa è cui controimmagine g–1(GY) = GX  TXR contiene x. Perciò g è conti-
la topologia indotta data dalla classe di tutte le intersezioni di R\{0} nua su tutto XR. La variante a (2.4), che per x = 0 pone g(x) = 3, per
con sottoinsiemi aperti di R. Consideriamo, poi, il codominio di f, analogia di metodo, non è continua; il punto di discontinuità è pro-
YR. Ci conviene scegliere tutto R e la sua topologia usuale TYR. No- prio x = 0 (punto in cui la funzione è definita ed è uguale a 3). Se
tiamo che f manda da R\{0} a {–1, +1}. Ora abbiamo la terna {{XR, consideriamo, invece, la variante di (2.4) dove s’impone che per x =
TXR}, {YR, TYR}, f } che ci permette di verificare se f è continua. Ap- 0 la funzione sin(x) / x = 1, allora la funzione è continua in quel pun-
plichiamo la regola. Prendiamo un generico punto x di XR. La sua to. Infatti, per ogni aperto GY del codominio tale che g(x) = 1  GY,
immagine è f(x) e può essere solo o –1 o +1. In ogni caso, la contro- corrisponde, come controimmagine, un aperto GX del dominio cui x
immagine di ogni aperto GY, cui y = f(x) appartiene, è un aperto di = 0 appartiene.
TXR. Per esempio, se x = π, f(x) = +1. Nella topologia usuale di R, o- Riassumendo, sulla base di questo nostro punto di vista, definita
gni aperto cui f(x) = +1 appartiene, ha controimmagine R+\{0} op- la terna {{X,TX}, {Y,TY}, f }, f può essere solo o continua o discon-
pure R\{0}, entrambi aperti di TXR che contengono . Perciò la fun- tinua. Se prendiamo un’estensione X* del dominio di una funzione,
zione f è continua in ogni suo punto. con X  X*, in quei punti di X* in cui f non è definita, essa è sempli-
cemente non definita e si esclude così la possibilità di valutare sia la
continuità sia la discontinuità della funzione in quei punti.
Per completare il quadro dei diversi punti di vista sulla continuità si
considerino anche le tesi degli autori riportati nei riferimenti biblio-
grafici [B.3], [B.4], [B.5], [B.6], [B.7], [B.8], [B.9], [B.10], [B.11],
x
f :x (2.2) [B.12], [B.13], [B.14], [B.15].
x
Riferimenti bibliografici: [B.1] Robert A. Adams e Christopher Essex, Cal-
colo differenziale 1, Casa editrice Ambrosiana. [B.2] Tom Apostol, Analisi
matematica, Calcolo vol. 1, Boringhieri. [B.3] Lipschutz Seymour, Teoria e
problemi di TOPOLOGIA, collana SCHAUM, ETAS – Fabbri – Bompiani,
Sonzogno, 1979. [B.4] Zamansky Marc, Itroduzione all’algebra e all’analisi
moderna, Feltrinelli ed., Milano, 1976. [B.5] Rudin Walter, Principi di ana-
Grafico 2. Realizzato con Mathematica 5.1 e con Bitmap lisi matematica, McGraw-Hill, Milano, 1991. [B.6] Barozzi G. C., Matarasso
S., Analisi Matematica 1, Zanichelli, Bologna, 1990. [B.7] De Fabritiis C.,
Il grafico 2 fa notare che le fasce d’intervalli aperti GY di TYR gene- Petronio C., Esercizi svolti e complementi di topologia e geometria, Bollati
rano, con f –1, in TXR o il  o R+\{0} o R–\{0} o R\{0} e ciò confer- Boringhieri, Torino, 1997. [B.8] Smirnov V. I., Corso di matematica superio-
ma quanto sopra detto. La funzione (2.2) è continua. re I, Editori Riuniti, Mosca-Roma, 1976. [B.9] Keisler H. J., Elementi di ana-
La funzione (2.3) (Grafico 3) è la funzione segno e differisce da lisi matematica, Piccin Editore, Padova, 1982. [B.10] Giusti E., Analisi Ma-
(2.2) per essere definita su tutto R. tematica 1, Bollati-Boringhieri ed., Torino, 1983. [B.11] Prodi G., Analisi
Matematica, Bollati-Boringhieri, Torino, 1982. [B.12] Canuto C., Tabacco
x / | x |
sign  x   
x x  R \ 0 (2.3)
A., Analisi Matematica I, Springer, Milano, 2008. [B.13] James R. C., The
Mathematics Dictionary (Fifth Edition). [B.14] Murray Spiegel, Analisi Ma-
 0 x0 tematica, Schaum – Etas Libri, Milano, 1990. [B.15] Corso L., Laforgia A.,
A proposito della definizione di funzione continua e di proprietà lineare del-
In questo caso, la funzione presenta un punto di discontinuità. Infat- l’integrale, Periodico di Matematiche n. 3 Set-Dic 2014 Vol. 6 Serie XI An-
ti, applicando la (2.1) si osserva che la controimmagine di alcuni no CXXIV, edizioni Mathesis. [B.16] MATHEMATICA 5.1, S. Wolfram
Research Inc., University of Cambridge, 2010
aperti, cui f (x = 0) appartiene, è {x = 0} che, essendo complementare
di R\{0} in R, è un chiuso e quindi non appartiene a TXR. [1] Consigliere nazionale Mathesis, di Verona, e-mail: lcorso@iol.it
Quaternioni e Rotazioni nello Spazio

In questa nota vediamo il legame tra la coniugazione per un quaternione e le rotazioni


dello spazio vettoriale R3 .

§1. Quaternioni.

Definizione 1. Lo spazio dei quaternioni è lo spazio vettoriale reale H avente come base

B = i, j, k, 1 ,
dotato del prodotto “ · ” definito dalle regole che seguono:
i) “ · ” è bilineare;
ii) 1· q = q , ∀ q ∈ H;
iii) i2 = j2 = k2 = − 1 ;
iv) i · j = k = − j · i , i · k = − j = − k · i , j · k = i = −k· j .

Osservazione 2. Lo spazio dei quaternioni, in quanto spazio vettoriale avente B come


base, è l’insieme delle espressioni del tipo

αi + βj + γk + δ1, α, β, γ, δ ∈ R ,

dotato del prodotto per gli scalari e della somma



λ α i + β j + γ k + δ 1 = (λα) i + (λβ) j + (λγ) k + (λδ) 1 ,
 
αi + βj + γk + δ1 + ai + bj + ck + d1 =
(α + a) i + (β + b) j + (γ + c) k + (δ + d) 1 .

Si ha che
i) il prodotto di quaternioni è associativo (per esercizio).
ii) il prodotto di quaternioni non è commutativo. Infatti, ad esempio, i · j = − j · i .

Notazione 3. I numeri reali vengono visti (anche) come quaternioni tramite l’inclusione
naturale
R −−−−→ H , λ 7→ λ 1
Per abuso di notazione, scriveremo λ invece di λ 1 .

Osservazione 4. Viste le proprietà i) e ii) della Definizione 1, si ha


λq = (λ 1) · q , ∀ λ ∈ R, q ∈ H
(a sinistra abbiamo il prodotto dello scalare λ per il quaternione q , a destra abbiamo il
prodotto di due quaternioni).

Di conseguenza, l’abuso di notazione introdotto con la Notazione 3 non crea confusione


(possiamo scrivere λ q intendendolo sia come prodotto dello scalare λ per il quaternione q
che come prodotto dei due quaternioni λ e q ).
2

Definizione 5. Dato un quaternione q = α i + β j + γ k + δ si definiscono la sua parte


immaginaria Im q e la sua parte reale Re q ponendo

Im q := α i + β j + γ k , Re q := δ .

Se Re q = 0 diremo che q è immaginario puro, si definisce

Im H := “ spazio dei quaternioni immaginari puri”

Notazione 6. Identifichiamo il sottospazio dei quaternioni immaginari puri Im H con R3 ,


questo significa che
scriveremo v ∈ R3 intendendo (anche) a i + b j + c k ∈ H ,
t
dove v = (a, b, c) ed i, j, k denotano come sempre gli elementi della Definizione 1.

Indichiamo i vantaggi di questa convenzione.

Osservazione 7. Dato v = t(a, b, c) ∈ R3 e λ ∈ R,


possiamo scrivere il quaternione q = a i + b j + c k + λ come v + λ ,
cosı̀ facendo, dati q = v + λ e p = w + µ abbiamo
q ·p = ( v + λ) · ( w + µ)
(prodotto di quaternioni)
(♣)
= v ∧ w + λ w + v µ − h v, wi + λ µ
| {z } | {z }
parte immaginaria parte reale
3
dove v ∧ w ∈ R e h v, wi ∈ R denotano rispettivamente il prodotto vettoriale ed il
prodotto scalare di v con w (che, in quanto rispettivamente elementi in R3 ed R , tanto
per insistere sulla convenzione, interpretiamo rispettivamente come quaternione immaginario
puro e quaternione reale1 ).
Nota. In particolare, la (♣) ci dice che il prodotto di quaternioni immaginari puri è dato dalla formula
v· w = v ∧ w − h v, wi .
Di fatto questa è l’unica cosa da ricordare (tenendo presente la proprietà distributiva del prodotto ed il fatto
che la moltiplicazione di un quaternione per un numero reale avviene nella maniera ovvia, l’unico contributo
del prodotto p · q che non sappiamo scrivere a priori è appunto quello che viene dal prodotto v· w ).
Avvertenza. Il puntino centrale “ · ” denoterà sempre il prodotto di quaternioni. Il prodotto scalare (che
vista la nostra convenzione ha senso per quaternioni immaginari puri) come già fatto sopra lo indicheremo
sempre nella forma “h v, wi” per evitare che ci si possa confondere.

Si definiscono norma, coniugato e inverso di un quaternione in perfetta analogia con le


corrispondenti definizioni date per i numeri complessi. Valgono inoltre proprietà analoghe
(cfr. Lemma 10).

Definizione 8. Dato un quaternione q = α i + β j + γ k + δ si definiscono


p
||q || := α2 + β 2 + γ 2 + δ 2 (norma di q );

q∗ := −α i − β j − γ k + δ = Re q − Im q (coniugato di q );

q∗
q −1 := (se q 6= 0) (inverso di q ).
||q || 2
I quaternioni aventi norma 1 vengono detti unitari.
1 Un quaternione reale è un numero reale visto come quaternione tramite l’inclusione R ֒→ H (cfr. Notazione 3).
3

Nota 9. Si ha q · q ∗ = q ∗ · q = ||q || 2 (per esercizio). Di conseguenza, il quoziente



q −1 = q ∗
||q || 2 introdotto sopra (assumiamo q 6= 0), soddisfa la proprietà
q · q −1 = q −1 · q = 1,
ciò giustifica la notazione adottata. Inoltre, esso è l’unico elemento che moltiplicato a destra
(o a sinistra) per q restituisce 1. Infatti,
q · q′ = 1 =⇒ q −1 · (q · q ′ ) = q −1 =⇒ (q −1 · q) · q ′ = q −1 =⇒ q′ = 1

(il caso di un elemento q ′′ che soddisfi q ′′ · q = 1 è analogo).

Lemma 10. Siano p e q due quaternioni. Si ha


||q || 2 = ||Im q || 2 + ||Re q || 2 ;
||q · p || = ||q || · ||p|| (in particolare, ||λ q || = |λ| ||q || , ∀ λ ∈ R);
(q ∗ )∗ = q , (q + p)∗ = q ∗ + p∗ ;
(q · p)∗ = p∗ · q ∗ (si noti lo scambio dell’ordine dei fattori).

Dimostrazione. Per esercizio. 

Attenzione! In generale, ||q + p|| 2 6= ||q || 2 + ||p|| 2 .

Lemma 11. I quaternioni unitari sono i quaternioni del tipo


(♣) q = sen θ · n + cos θ , n ∈ Im H , || n || = 1
(osserviamo che, essendo q unitario, si ha q −1 = q ∗ := − sen θ · n + cos θ ).

Dimostrazione. Per il Lemma 10, prima uguaglianza, dato q come in (♣) si ha


||q || 2 = ||sen θ · n|| 2 + ||cos θ || 2 = sen 2 θ + cos 2 θ = 1.
Viceversa, dato un quaternione arbitrario q , scriviamo Im q = λ n (con n immaginario
puro di norma 1) e Re q = µ. Di nuovo per il Lemma 10, prima uguaglianza, abbiamo
||q || = λ2 + µ2 . Ciò consente di concludere:
se ||q || = 1 =⇒ λ2 + µ2 = 1 (e possiamo scrivere λ = sen θ , µ = cos θ ). 

Definizione 12. La coniugazione per un quaternione invertibile q è la funzione


ϕq : H −−−−→ H
p 7→ q · p · q −1

Proposizione 13. Sia q un quaternione, ϕq la coniugazione per q . Allora


(i) ϕq = ϕλ q , per ogni numero reale λ 6= 0
(in particolare ϕq = ϕq/ || q || , cioè la coniugazione per q coincide con la coniugazione per la sua
normalizzazione q/ || q || , di conseguenza non è restrittivo assumere che q sia unitario) ;
 
(ii) || ϕq (p) || = || p || , Re ϕq (p) = Re (p) , || Im ϕq (p) || = || Imp || ;
(ϕq conserva la norma) (ϕq conserva la parte reale) (ϕq conserva la la norma della
parte immaginaria)

(iii) dato v ∈ Im H si ha che ϕq ( v) ∈ Im H i.e. Im (q vq −1 ) = q vq −1 .
4

Dimostrazione # 1. In un certo senso non c’è nulla da dimostrare, come direbbero gli
americani la questione è straightforward: si scrivono
q = α i + β j+ γ k + δ e p = a i + b j + c k + d,
quindi si calcolano le espressioni indicate nelle varie uguaglianze. 

I conti sono molto lunghi, lo sviluppo di q · p · q −1 è di 43 = 64 termini! Di seguito


vediamo come questi conti possono essere evitati utilizzando il Lemma 10 e qualche piccolo
trucco.

Dimostrazione # 2. La (i) segue dal fatto che “ le costanti si possono portare fuori”:
ϕλ q (p) = (λq) · p · (λq)−1 = λλ−1 q · p · q −1 = q · p · q −1 = ϕq (p) .

Il fatto che ϕq conserva la norma segue dal fatto che la norma di un prodotto è uguale al
prodotto delle norme (cfr. Lemma 10), infatti:
|| ϕq (p) || = || q · p · q −1 || = ||q || · ||p|| · ||q −1 || = ||q || · ||p|| · ||q || −1 = ||p||
(il prodotto di norme, in quanto prodotto di numeri reali, commuta).
Proviamo che ϕq conserva la parte reale. Poiché q ha norma 1, si ha q −1 = q ∗ . D’altro
canto, dato un qualsiasi quaternione x si ha

(♠) Re x = 12 x + x∗ .
Abbiamo 
  ∗ 
Re ϕq (p) = Re q · p · q ∗ = 21 q · p · q ∗ + q · p · q ∗ =
   
1 ∗
2 q·p·q +q
∗∗
· p∗ · q ∗ = q · 21 p + p∗ · q ∗ = q · Re p · q ∗ = Re (p)

Le prime due uguaglianze e la quinta seguono dalle definizioni e da (♠). Terza e quarta
uguaglianza seguono dal Lemma 10. Quanto alla sesta e ultima uguaglianza, si ha che Re p
commuta con q (in quanto reale), d’altro canto q · q ∗ = 1 .
Poiché ϕq conserva sia la norma che la parte reale, per la prima uguaglianza del Lemma 10
deve conservare anche la norma della parte immaginaria.

La proprietà (iii) segue dalla (ii), infatti Re ϕq ( v) = Re ( v) = 0 . 
5

§2. Rotazioni in R3 .

Si vuole determinare la formula che esprime la rotazione di angolo θ intorno ad una retta
orientata passante per l’origine.

Notazione 1 (che fissiamo una volta per tutte).


• n denota un vettore unitario;
• dato ~v ∈ R3 , poniamo
~v// := h n, ~v i n , ~v⊥ := ~v − ~v//
(sono la proiezione di ~v su n e la proiezione di ~v sul piano ortogonale ad n)

Proposizione 2. Sia n un vettore unitario, sia

Rn, θ : R3 −−−−→ R3

la rotazione di angolo θ intorno alla retta orientata, passante per l’origine, avente versore
direttore n . Allora
Rn, θ (~v ) = (1 − cosθ) ~v// + cosθ · ~v + senθ · n ∧ ~v

dove ~v// e ~v⊥ sono come nella Notazione 1.

Inciso 3. Per convenzione, con “ rotazione di angolo θ ” si intende


la rotazione che per un osservatore orientato come l’asse di rotazione (cioè al quale l’asse di
rotazione appare diretto verso l’alto) avviene senso antiorario.
Naturalmente questa frase, senza una convenzione che colleghi il mondo astratto, o meglio R3 , col mondo
fisico nel quale siamo immersi, non ha alcun senso matematico. La convenzione che
~
e3
collega questi due mondi è quella di rappresentare la base canonica di R3 nel mondo
~
e2
reale cosı̀ come indicato in figura. Volendo evitare riferimenti al mondo fisico, la
matrice  
1 0 0
 0 cos θ −sen θ 
0 sen θ cos θ ~
e1

è, per definizione, la matrice di rotazione di angolo θ relativa ad una base ortonormale positivamente
orientata il cui primo vettore è l’asse di rotazione orientato.

Proponiamo due dimostrazioni della Proposizione 2, la prima è la stessa illustrata in [6],


che ricordiamo sotto per ragioni di confronto.

Notazione 4. Mantenendo le notazioni precedeni, fissiamo ~v ∈ R3 e poniamo


~v⊥
~b := n, ~b := , ~b := ~b ∧ ~b
1 2 3 1 2
||~v⊥ ||

(la definizione data ha senso solo se ||~v⊥ || = v⊥ 6= ~0 , volendo scrivere dei conti che
6 0 , equivalentemente ~
siano formalmente corretti per ogni scelta di ~v stabiliamo la seguente convenzione :
se ~v⊥ = ~0 , definiamo ~b2 := “ un qualsiasi versore ortogonale ad n ”,
naturalmente anche in questo caso definiamo ~b3 := ~b1 ∧ ~b2 ).

Inoltre poniamo
B = {~b1 , ~b2 , ~b3 }

(osserviamo che questa è una base ortonormale di R3 positivamente orientata).


6

Svolgimento #1 (cfr. [6]). Abbiamo

(5) Rn, θ (~v// ) = ~v// , Rn, θ (~v⊥ ) = cosθ · ~v⊥ + senθ · n ∧ ~v⊥

La prima uguaglianza è immediata : il vettore ~v// non viene spostato affatto in quanto si
trova sull’asse di rotazione.
Verifichiamo la seconda uguaglianza : assumendo ~v⊥ 6= ~0 (se è n ∧ ~v⊥
nullo l’uguaglianza in esame è banale) i due vettori
~v⊥ = ||~v⊥ || ~b2 e n ∧ ~v⊥ = ||~v⊥ || ~b3 R(~v⊥ )
hanno la stessa norma di ~v⊥ e costituiscono una base ortogonale
del piano ortogonale ad n , la rotazione su questo piano (orien- θ
tato da questa coppia di vettori) avviene in senso antiorario, ~v⊥
questo perché {~b2 , ~b3 , ~b1 } è orientata come B , cioè positiva-
mente, da tutto ciò segue la seconda uguaglianza (cfr. figura).
D’altro canto Rn, θ è lineare ed inoltre n ∧ ~v⊥ = n ∧ ~v (questo perché n ∧ ~v// = ~0 ). Di
conseguenza:
Rn, θ (~v ) = ~v// + cosθ · ~v⊥ + senθ · n ∧ ~v⊥

(6) = ~v// + cosθ · (~v − ~v// ) + senθ · n ∧ ~v


= (1 − cosθ) ~v// + cosθ · ~v + senθ · n ∧ ~v 

Svolgimento #2. Mantenendo la Notazione 4, poniamo


 
| | |
M =  b1 b2 b3  (matrice delle coordinate dei ~bi rispetto alla base canonica).
| | |
Si ha    −1
| | | 1 0 0 | | |
Rn, θ (~v ) =  b1 b2 b3  0 cosθ −senθ  b1 b2 b3  ~v
(i)
| | | 0 senθ cosθ | | |
   
| | | 1 0 0 ||~v// ||
=  b1 b2 b3  0 cosθ −senθ  ||~v⊥ || 
(ii)
| | | 0 senθ cosθ 0
  
| | | ||~v// ||
(7) =  b1 b2 b3  cosθ · ||~v⊥ || 
(iii)
| | | senθ · ||~v⊥ ||

= ||~v// || ~b1 + cosθ · ||~v⊥ || ~b2 + senθ · ||~v⊥ || ~b3


(iv)

= ~v// + cosθ · ~v⊥ + senθ · n ∧ ~v⊥


(v)

= (1 − cosθ) ~v// + cosθ · ~v + senθ · n ∧ ~v


(vi)

dove le varie uguaglianze si giustificano come segue:


(i) è la formula di cambiamento di base
(la matrice al centro è la matrice che esprime la rotazione di angolo θ , intorno al versore ~b1 , nel
sistema di coordinate associato alla base B , cfr. Inciso 3) ;
7

(ii) il prodotto M −1 ~v deve restituire le coordinate di ~v rispetto alla base B , essendo


~v = ~v// + ~v⊥ = ||~v// || ~b1 + ||~v⊥ || ~b2

||~v// ||
le coordinate di ~v rispetto a B sono appunto il vettore numerico  ||~v⊥ || ;
0
(iii) & (iv) abbiamo svolto il prodotto righe per colonne;
(v) segue dalle definizioni (cfr. Notazioni 1 e 4);
(vi) effettuiamo la sostituzione ~v⊥ = ~v − ~v// , tenendo presente che n ∧ ~v// = ~0 .

8

§3. Rotazioni in R3 e quaternioni.

Abbiamo visto che la rotazione dello spazio Euclideo R3 di angolo θ intorno alla retta
orientata, passante per l’origine, avente versore direttore n è data dalla formula

(1) R n, θ (~v ) = (1 − cos θ) ~v// + cos θ · ~v + senθ · n ∧ ~v


dove
~v// := h n, ~v i n , ~v⊥ := ~v − ~v//
sono rispettivamente la proiezione di ~v su n e sul piano ortogonale ad n
(n.b.: assumiamo || n|| = 1 ).

Convenzione 2. Identifichiamo Im H con R3 :


t
al quaternione α i + β j + γ k associamo il vettore (α, β, γ) e viceversa
(gli elementi di Im H , ovvero di R3 , li indicheremo in grassetto).

Teorema 3. Sia q = sen θ · n + cos θ un quaternione unitario (con n immaginario


puro di norma 1). Allora,
la restrizione ai quaternioni immaginari puri della coniugazione per q
è la rotazione di angolo 2θ intorno ad n .

In formule, dato v ∈ Im H si ha che q vq −1 ∈ Im H e che la funzione


R3 ≡ Im H −−−−→ R3 ≡ Im H
v 7→ q v q −1
è la rotazione di angolo 2θ intorno ad n .

Dimostrazione. Essendo q unitario, abbiamo


q −1 = q ∗ = − sen θ · n + cos θ .
Di conseguenza,
q vq −1 = (sen θ · n + cos θ) · v · (− sen θ · n + cos θ)

(3.1) = − sen 2 θ · n · v · n + sen θ · cos θ · n · v − v · n + cos 2 θ · v

= − sen 2 θ · n · v · n + sen θ · cos θ · 2 n ∧ v + cos 2 θ · v .
Definiti v// e v⊥ rispettivamente come la proiezione di v su n e la proiezione sul piano
ortogonale ad n (cfr. 1), abbiamo
 
n · v · n = n · v ∧ n − h v, n i = n ∧ v ∧ n − h n , v ∧ n i − v//

(3.2) = n ∧ v ∧ n − v//
= v⊥ − v//

La prima uguaglianza segue


 dalla formula v · n = v ∧ n − h v, n i (cfr. § 1, Oss. 7). La seconda segue
dalla formula n · v ∧ n = n ∧ v ∧ n − h n , v ∧ n i (di nuovo, § 1, Oss. 7) e dalla definizone di v// .
La terza dal fatto che h n , v ∧ n i = 0 (è il prodotto scalare di due vettori ortogonali). Infine, la quarta
segue dall’uguaglianza 
n∧ v∧ n = v⊥
v⊥
che, a sua volta, si giustifica come segue: se v⊥ 6= 0 , posto b1 = n , b2 = || v⊥ ||
, b3 = b1 ∧ b2 ,
che risulta essere una base ortonormale di R3 , essendo v// ∧ n = 0 si ha
n ∧ ( v ∧ n ) = n ∧ ( v⊥ ∧ n ) = || v⊥ || b1 ∧ ( b2 ∧ b1 ) = − || v⊥ || b1 ∧ b3 = || v⊥ || b2 = v⊥ ;

se v⊥ = 0 si ha anche n ∧ v ∧ n = 0 semplicemente perché v// ∧ n = 0 .
9

Sostituendo nella (3.1) il risultato trovato nella (3.2) otteniamo



q vq −1 = − sen 2 θ · v⊥ − v// + 2 sen θ · cos θ · n ∧ v + cos 2 θ · v

= − sen 2 θ · v⊥ − v// + sen (2θ) · n ∧ v + cos 2 θ · v

= − sen 2 θ · v − 2 v// + sen (2θ) · n ∧ v + cos 2 θ · v

= 2 sen 2 θ · v// + sen (2θ) · n ∧ v + cos 2 θ − sen 2 θ · v

= 1 − cos (2θ) · v// + sen (2θ) · n ∧ v + cos(2θ) · v

= R n, 2 θ (v)
cfr. (1)

Questo conto conclude la dimostrazione. 

Esempio 4.1. Calcoliamo la matrice che rappresenta la rotazione

R t
π
n = (1 , 0 , 0) , θ = 3

π t
di angolo θ = 3 intorno al versore n = (1 , 0 , 0) . A tal fine consideriamo il quaternione

π π 1 3
q = sen 6 · n + cos 6 = 2 i+ 2

Svolgendo i prodotti abbiamo


√  √ 
1 3 1 3
q · i · q∗ = 2 i+ 2 · i· − 2 i+
2 = i
√  √  √
1 3
q · j · q∗ = 2i + 2 · j· − 12 i + 23 = 1
2 j+ 2
3
k
√  √  √
1 3
q · k · q∗ = 2 i + 2 ·k · − 21 i + 23 = − 23 j + 21 k
 
1 0 0

Di conseguenza la matrice cercata è la matrice  0 1/2 − 3/2  .

0 3/2 1/2

Esempio 4.2. Calcoliamo la matrice che rappresenta la rotazione

R t
n = ( 13 , 2
3 , 2
3 ), θ= π
3

π t 1 2 2

di angolo θ = 3 intorno al versore n = 3 , 3 , 3 . A tal fine consideriamo il
quaternione

π π 1 1 1 3
q = sen 6 · n + cos 6 = 6 i+ 3 j+ 3 k+ 2

Svolgendo i prodotti abbiamo


√ √ 1  5/9


5 1+3 3 1−3 3 (1+3 3)/9
q · i · q∗ = 9 i+ 9 j+ 9 k =⇒ R 0
0
= √
(1+3 3)/9

q · j · q∗ = ...

q· k·q = ...
 
5/9 ... ...
Di conseguenza la matrice cercata è la matrice  (1+3√3)/9 ... ...  .

(1−3 3)/9 ... ...

Nota 4.3. Naturalmente gli stessi conti consentono di scrivere la matrice rappresentativa
di una rotazione generica R n, θ (cfr. [6], 15.4.2, p. 312).
10

Ulteriori considerazioni.

Il Teorema 3 ci dice che dato un vettore unitario n ∈ R3 ≡ Im H (cfr. Convenzione 2),


considerato un quaternione unitario
q = senθ · n + cos θ ,
la restrizione della coniugazione per q ai quaternioni immaginari puri è la rotazione di
angolo 2θ intorno ad n :

ϕq : R3 ≡ ImH −−−−→ R3 ≡ Im H
v 7→ q· v·q ∗ = R 2θ ( v)

Rimettendo in gioco la quarta componente, cioè la componente reale, scriviamo


p = v+λ
(dove v ∈ ImH, λ ∈ R). Si ha

ϕq (p) = ϕq ( v + λ) = ϕq ( v) + ϕq (λ) = ϕq ( v) + λ
(5)
= q· v·q ∗ + λ

D’altro canto
la somma v+λ ∈ H vista in R3 × R è l’elemento (v, λ)
e, naturalmente,
la somma q· v·q ∗ + λ ∈ H vista in R3 × R è l’elemento (q vq ∗ , λ) ,
di conseguenza possiamo riformulare il Teorema 3 nella forma seguente:

Teorema 6. Identificando H con R3 × R , la funzione

ϕq : H −−−−→ H
p 7→ ϕq (p) := q p q ∗
coincide con la funzione
ϕq : R3 × R −−−−→ R3 × R
(♠)
( v , λ) 7→ (R2θ ( v) , λ)

Questa funzione è un’applicazione lineare invertibile (perché p 6= 0 =⇒ ϕq (p) 6= 0 ),


di conseguenza induce una proiettività

[ ϕq ] : P3 ≡ P(H) −−−−→ P3 ≡ P(H)

[p] 7→ [ ϕq (p) ]

(cfr. “ nota sulle proiettività ” [1.2]).

L’applicazione ϕq (p) ha la peculiarità di conservare l’ultima coordinata, si veda (♠), per


questa ragione la sua classe [ ϕq ] manda la carta affine A := “ ultima coordinata 6= 0 ” in
se stessa. Naturalmente su questa carta affine2 [ ϕq ] è sempre la nostra vecchia rotazione
R2θ ( v), infatti, in (♠), il valore di λ non influisce sulla prima componente (ricordiamo
che A si identifica col sottospazio proiettivo di P(R3 × R) delle classi del tipo [ w, 1]).

2 N.b.: la nostra carta A in quanto identificata con R3 , ha una naturale struttura di spazio Euclideo.
11

Chi ha svolto gli esercizi (4.1) e (4.2), o trattato il caso generale (cfr. nota 4.3), avrà
notato che i conti sono abbastanza pesanti. Fortunatamente questi conti possono essere
scritti in termini di prodotti di matrici. Vediamo come. Tornando alla nostra convenzione,
l’identificazione di H con R3 × R , o meglio con R4 , è l’identificazione data dal sistema di
coordinate associato alla base canonica B = { i, j, k, 1 } dello spazio dei quaternioni:
Coord : H −−−−→ R4
p 7→ Coord (p)

D’altro canto la funzione che a p associa q · p · q è lineare e, in quanto tale, nel sistema
di coordinate associato alla base canonica B è rappresentata da una matrice. Conviene
scomporre la coniugazione per q come composizione di due applicazioni (anch’esse lineari),
la moltiplicazione a sinistra per q e la moltiplicazione a destra per q ∗ . Se
Coord (q) = t (a, b, c, d) e Coord (p) = t (x, y, z, w)
cioè q = a i + b j + c k + d e p = x i + y j + z k + w , si ha

q·p = (dx − cy + bz + aw) i + . . . (si svolga il conto)


quindi
  
d −c b a x
 c d −a b y 
Coord (q · p) =   
−b a d c z
−a −b −c d w
La matrice indicata la chiamiamo Lq (in quanto è la matrice rappresentativa della molti-
plicazione a sinistra per q ). Inoltre abbiamo
  
d −c b −a x
∗  c d −a −b   y 
Coord (p · q ) =   
−b a d −c z
a b c d w
La matrice indicata la chiamiamo Rq∗ (in quanto è la matrice rappresentativa della molti-
plicazione a destra per q ∗ ).

Esercizio 7. Scriviamo p~ al posto di Coord (p) e ~q al posto di Coord (q) per comodità
notazione. Verificare che risulta

Lq Rq∗ p~ = Rq∗ Lq ~p = Lq Lp q~∗

Naturalmente la matrice che rappresenta la coniugazione per q è la matrice


Mq := Lq Rq∗ = Rq∗ Lq .

Osserviamo che a prescindere dal calcolo esplicito, il fatto che le matrici Lq e Rq∗ commu-
tano segue dalla proprietà associativa del prodotto di quaternioni, infatti:
   
Lq Rq∗ p~ = Coord q · (p · q ∗ ) = Coord (q · p) · q ∗ = Rq∗ Lq p~

(uguaglianza che dovendo valere per ogni scelta di p implica quanto affermato).
SPAZI METRICI

Nel piano R2 o nello spazio R3 la distanza fra due punti è la lunghezza, o


norma euclidea, del vettore differenza di questi due punti.
Se p = (x, y, z) è un vettore in coordinate ortonormali, la sua lunghezza è:
p
|p| = x2 + y 2 + z 2
Se p1 = (x1, y1, z1) e p2 = (x2, y2, z2), la loro distanza è:
p
d(p1, p2) = |p2 − p1| = (x2 − x1)2 + (y2 − y1)2 + (z2 − z1)2
Questa distanza si chiama metrica euclidea o pitagorica, per distinguerla da
altre metriche.

Definizione 1 Uno spazio metrico è un insieme X fornito di una fun-


zione distanza (=metrica)
d : X × X → [0, +∞[
che verifica le seguenti tre condizioni (per ogni coppia di punti):
(D1) d(x, y) ≥ 0 e inoltre d(x, y) = 0 ⇐⇒ x = y.
(D2) d(x, y) = d(y, x)
(D3) d(x, z) ≤ d(x, y) + d(y, z).

Uno spazio metrico X con metrica d si indica con il simbolo (X, d).
Esercizio. Verificare che:
|d(x, y) − d(y, z)| ≤ d(x, z)

METRICI – 1
Esempi. Rn con la distanza euclidea:
d2(x, y) = |y − x| =
v
u n
uX
= t (yk − xk )2,
k=1
ove x = (x1, . . . , xn) e y = (y1, . . . , yn).
È difficile verificare la disuguaglianza triangolare.
R2 con la metrica del reticolato (o di Manhattan):
d1(x, y) = |x1 − y1| + |x2 − y2|, ove x = (x1, x2) e y = (y1, y2).
y
s
|x2 − y2 |

s
x (y1 , x2 )

|x1 − y1 |

R2 con la metrica del sup:


d∞(x, y) = max{|x1 − y1|, |x2 − y2|}, ove. . .

Distanza geodetica in S2, sfera dei versori di R3.


q
2 3
S = {u ∈ R : |u| = u21 + u22 + u23 = 1}

d(u, v) = arccos(u · v)
Si tratta della lunghezza del minore fra i due archi di cerchio massimo di
estremi u e v.

METRICI – 2
R2 con la distanza delle valli.
Se x = (x1, x2) e y = (y1, y2):
½
|y2 − x2| se x1 = y1
d(x, y) =
|x2| + |x1 − y1| + |y2| se x1 6= y1
6 6
xs
y x2
y2 s
y
y2 s

- -
x1 x1 y1
x2 s
x

R2 con la metrica del riccio:


½
|x − y| se x e y sono proporzionali,
d(x, y) =
|x| + |y| altrimenti.
s
B
B
B
B
B
B s
B ½½
½
Bspp ½
pp ½
pp ½
pp
pp ½
pp ½
pp ½
pp
O p½ XXX
XXXs

METRICI – 3
Metrica discreta su un insieme E.
Si fissa una costante α > 0 e si definisce per x 6= y:
d(x, y) = un qualsiasi numero ≥ α in modo che valga (D3)
Ad esempio: d(x, y) = α ∀ x 6= y.

Siano E un insieme e g : E → R una funzione iniettiva.


La posizione
dg (x, y) = |g(x) − g(y)|
definisce una metrica su E.

Definizione 2 Se S ⊆ X e d è una metrica su X, allora dS = d|S×S


è una metrica su S, detta metrica indotta, e (S, dS ) si dice sottospazio
metrico di (X, d).

Scriveremo sempre (S, d).


Esempi.
• La metrica indotta su Z2 dalla metrica euclidea di R2 è discreta, α = 1.
• La metrica indotta su S1 = {(x1, x2) : x21 + x22 = 1} dalla metrica del
riccio di R2 è discreta, α = 2.

Definizione 3 Dati uno spazio metrico (X, d), un punto a ∈ X e un


numero reale r > 0, si definiscono:
• palla aperta di centro a e raggio r:
B(a, r[= {x ∈ X : d(a, x) < r}

• palla chiusa di centro a e raggio r:


B(a, r] = {x ∈ X : d(a, x) ≤ r}

Se necessario si usa Bd in luogo di B.

METRICI – 4
Esercizio. Disegnare le palle in R2 con le metriche d2, d1 e d∞.

metrica d1 ¡@ metrica d∞
¡ @ r
¡ @
B(a, r] ¡ p @ p B(a, r]
@ a ¡ a
@ ¡
@ ¡

Esempio. Sia p ≥ 1 un numero reale. La funzione


1
dp(x, y) = (|x1 − y1|p + |x2 − y2|p) p
definisce una metrica su R2 (difficile!).
Vedere nella dispensa la forma delle palle.
Domande. Chi sono le palle (aperte e chiuse) nella metrica discreta?
Chi sono le palle nella metrica geodetica della sfera? Quali sono le palle (aperte
e chiuse) di raggio π?
Come sono fatte le palle nella metrica del riccio?
E nella metrica delle valli?
76
6
5
4 aq
3 q
2 q ¡q@ ¡@ ¡@
1 ¡@ ¡ @ ¡ q @ ¡@ ¡ @
¡@ ¡ @ ¡ @ ¡ @ ¡ q @ ¡q@ ¡ @ ¡@ -
@¡ @ ¡ @ ¡ @ ¡ @ ¡ @¡ @ q ¡ @¡
@¡ @ ¡ @ ¡ @¡ @ ¡ q
@¡ @¡ @¡ q

METRICI – 5
Spazi di funzioni.

Sia T un insieme e K indichi il corpo reale o il corpo complesso.


Con il simbolo KT indichiamo l’insieme delle funzioni da T a K.
KT diventa uno spazio vettoriale su K con le operazioni definite puntualmente:
(f + g)(t) = f (t) + g(t), (λf )(t) = λ(f (t))
Un sottospazio (vettoriale) interessante è:
B(T, K) = l∞(T, K)
insieme delle funzioni limitate da T a K.
Su di esso è definita la metrica della convergenza uniforme:
d∞(f, g) = kg − f k∞ = sup{|g(t) − f (t)| : t ∈ T }
Verifica della disuguaglianza triangolare:
|f (t) − h(t)| ≤ |f (t) − g(t)| + |g(t) − h(t)| ≤
≤ kf − gk∞ + kg − hk∞ (∗)
Siccome la disuguaglianza è vera per ogni t ∈ T , il termine
sup |f (t) − h(t)| = kf − hk∞
t∈T
è maggiorato da (∗).
Esercizio. Siano f ∈ B(T, R) con la metrica d∞ e r > 0 in R.
Allora:
B(f, r[⊆ {g ∈ B(T, R) : f (t) − r < g(t) < f (t) + r ∀ t ∈ T } ⊂ B(f, r]
Rendersi conto che la seconda inclusione è sempre stretta,
mentre la prima è un’uguaglianza ⇐⇒ T è finito.
p p p p p p p p pppppppp pppppppppppppppppppp p p p p p p p p p p
p p p pppppp p pp ppp
p p p p pppp pppppp pppppppppppppppp pppppppppppppp pppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppp
p
p p p p p ppp ppppppppppppppppp ppppppppppppppppp ppppppppppp p p p p p p p p p p p p ppppppppppppppppppppppppppp pp
p p p p p pp pppppppppp pppppppppp pp ppp pppp
p p pp p
p p p p p p p p p p p p p p p pp p p p p p p p p p
p
p p pppppppppppppppppppp pp ppppppp pppp p p p p
p p p p pp pppppp pppppp ppppppp pppppppppppppppppppppppp pppp p p
ppp p p
pp pp ppppppp p p
ppp
p p p p p p p pppppp pppppppp pppppp p p p p p
p p p p
p p ppp ppppppppppp p p p p p p p p p p p pp p p p
p p p p p p p p p pp p p p p p p p p p p p p p p p p p p p p p p p p p
pppppp p p p p p p p p p pp pppppppppppppppp ppppppppp ppp pppppppppppppppppppppp p p
pp p p p p p p p p p p p p pp p p p p p pppp
pppppppppppppppppppppppppppppppp ppppppppp ppp ppppp p p p p p p p
p p p p p p p p p pp p p p p p p p p p p p p
ppppppppp p
T

METRICI – 6
Consideriamo lo spazio X = C([a, b], K) delle funzioni continue su [a, b] con
valori in K.
Si ha X ⊆ B([a, b], K) per il teorema di Weierstrass.
Quindi X può essere munito della metrica d∞.
Esercizio. Siano f e g in C([0, 4], R) cosı̀ definite:
f (x) = x log x se x > 0, f(0)=0, g(x) = x
Calcolare d∞(f, g).
Un’altra distanza su X = C([a, b], K) è quella della media di ordine 1:
Z
d1(f, g) = kg − f k1 = |g(t) − f (t)| dt
[a,b]

Un’altra è quella della media di ordine 2:


Z
1
d2(f, g) = kg − f k2 = ( |g(t) − f (t)|2 dt) 2
[a,b]

o in generale della media di ordine p, con p ≥ 1 reale:


Z
1
dp(f, g) = kg − f kp = ( |g(t) − f (t)|p dt) p
[a,b]

Esercizio. Calcolare d1(f, g) e d2(f, g), dove f e g sono le funzioni


dell’esercizio precedente.

METRICI – 7
Spazi vettoriali normati

Definizione 4 Se X è un K-spazio vettoriale, una norma su X è una


funzione k · k : X → [0, +∞[ tale che:
(N1) kxk ≥ 0 per ogni x ∈ X; kxk = 0 ⇐⇒ x = 0.
(N2) kαxk = |α| kxk, per ogni α ∈ K e ogni x ∈ X.
(N3) kx + yk ≤ kxk + kyk, per ogni x, y ∈ X.

Un K-spazio vettoriale con una norma assegnata si chiama spazio normato.


Uno spazio normato diventa uno spazio metrico assegnando come distanza:
d(x, y) = kx − yk
La verifica delle proprietà (Di) si fa usando le (Ni).
(D1) e (D2) sono immediate. Verifichiamo la (D3):
N3

d(x, z) = kx−zk = k(x−y)+y−z)k ≤ kx−yk+ky−zk = d(x, y)+d(y, z)


Non ogni metrica su uno spazio vettoriale è indotta da una norma (v. metrica
del riccio). Sussiste anzi il seguente fatto:
Se la metrica d è indotta da una norma:
(1) d è invariante per traslazioni, cioè:
d(x + a, y + a) = d(x, y), ∀ x, y, a ∈ X

(2) d è assolutamente omogenea, cioè:


d(αx, αy) = |α| d(x, y), ∀ α ∈ K, x, y ∈ X

Viceversa, se una metrica d soddisfa (1) e (2), allora la posizione


kxk = d(x, 0)
definisce una norma su X che ha d come distanza associata.

METRICI – 8
Definizione 5 Se (X, k · k) è uno spazio vettoriale normato, si chiama
palla unitaria (chiusa) la palla chiusa di centro il vettore nullo e di
raggio 1:
BX = B(0, 1] = {x ∈ X : kxk ≤ 1}
La sfera unitaria è l’insieme dei versori:
SX = {x ∈ X : kxk = 1}
Esercizio. Siano (X, k · k) uno spazio vettoriale normato, a ∈ X e r > 0.
Dimostrare che B(a, r] = a + rBX .
Le distanze dp, con p ≥ 1, e d∞ definite precedentemente su R2 (oppure su
Rn o su Cn), sono indotte dalle seguenti norme:
à n ! p1
X
kxkp = |xk |p , ∀x ∈ Kn
k=1
kxk∞ = max{|xk | : k = 1, . . . , n}, ∀x ∈ Kn
La verifica della subadditività per k · kp per p > 1 è difficile. Comunque per
p = 2, se
Xn
(x|y) = xk yk è l’usuale prodotto scalare di Kn,
k=1
1
allora kxk2 = (x|x) 2 è una norma indotta da un prodotto scalare e quindi
soddisfa (N3) (ricordare le disuguaglianze di Schwarz e di Minkowski).
Su B(T, K) = l∞(T, K) la distanza d∞ è indotta dalla norma:
kf k∞ = sup{|f (t)| : t ∈ T }
Sottospazi vettoriali interessanti di B([a, b], K) sono:
C([a, b], K), C 1([a, b], K)
Su di essi si può ancora considerare la norma k · k∞.
Su X = C([a, b], K) la metrica della media di ordine p è indotta dalla norma:
Z
1
kf kp = ( |f |p) p
[a,b]

METRICI – 9
Esercizio. Sia l1 = l1(N, K) l’insieme delle successioni a valori in K che
formano serie assolutamente convergenti; cioè una successione x : N → K sta
in l1 se e solo se:
+∞
X
kxk1 = |xk | < +∞.
k=0
Dimostrare che l1 è spazio vettoriale e che k · k1 è una norma su di esso.

Definizione 6 Siano (X, d) e (Y, ρ) spazi metrici.


Una funzione f : X → Y si dice un’isometria se conserva le distanze,
cioè se:
ρ(f (x), f (y)) = d(x, y), ∀x, y ∈ X

Ogni isometria è iniettiva;


l’inversa di un’isometria (da f (X) → X) è un’isometria;
la composizione di due isometrie è un’isometria.
Due spazi metrici si dicono isometrici se fra essi esiste un’isometria biiettiva.

Proposizione 7 Ogni spazio metrico (X, d) è isometrico a un sottospa-


zio metrico di uno spazio vettoriale normato.

Dimostrazione. Sia Y = B(X, R) con k · k∞ e sia a ∈ X fissato.


Per ogni x ∈ X sia ϕx : X → R cosı̀ definito:
ϕx(t) = d(t, x) − d(t, a), ∀t∈X
ϕx ∈ Y (cioè è limitata) perché:
|ϕx(t)| = |d(t, x) − d(t, a)| ≤ d(x, a)
Inoltre la mappa x → ϕx è un’isometria da (X, d) a (Y, d∞).
Attenzione: per questo, con abuso di notazione, può essere comodo indicare
con kx − yk la distanza, anche in uno spazio metrico non normato (in generale
x − y non esiste in X).

METRICI – 10
Definizione 8 Siano (X, d) e (Y, ρ) spazi metrici.
Una funzione f : X → Y si dice lipschitziana se esiste una costante
l ≥ 0 tale che:
ρ(f (x), f (y)) ≤ l · d(x, y), ∀ x, y ∈ X
l è detta costante di Lipschitz.

Esercizio. L’estremo inferiore delle costanti di Lipschitz per una funzione


lipschitziana è ancora una costante di Lipschitz.
Essa si chiama la costante di Lipschitz.
Su R si considera sempre la metrica |t − s|.
Esercizi.
• Sia I un intervallo di R e f : I → R una funzione derivabile.
Dimostrare che f è lipschitziana ⇐⇒ f 0 è limitata.
• Sia (X, k · k) uno spazio vettoriale normato.
Allora x → kxk è una funzione lipschitziana da X in [0, +∞[
(segue da |kxk − kyk| ≤ kx − yk).

Definizione 9 Siano (X, d) uno spazio metrico e A un sottoinsieme non


vuoto di X.
Si consideri la funzione d(·, A) : X → [0, +∞[, detta distanza da A,
definita ponendo per ogni x ∈ X:
d(x, A) = inf{d(x, y) : y ∈ A}

Proposizione 10 Si ha:
|d(x, A) − d(y, A)| ≤ d(x, y)

Dimostrazione. Basta dimostrare che d(x, A) ≤ d(x, y) + d(y, A).


Poiché d(x, A) ≤ d(x, a) ≤ d(x, y) + d(y, a) ∀ a ∈ A, passando all’inf a∈A a
destra, si ottiene quanto voluto.

METRICI – 11
Definizione 11 Il diametro di un sottoinsieme A 6= ∅ di uno spazio
metrico (X, d) è:
diam A = sup{d(x, y) : x, y ∈ A}, dove il sup può essere anche +∞
Si pone diam ∅ = 0.
Un sottoinsieme si dice limitato se ha diametro finito (cioè ∈ R).

Esercizi.
• Il diametro di una palla di raggio r > 0 è ≤ 2r.
Dare un esempio in cui il diametro è strettamente < 2r.
Dimostrare che in uno spazio vettoriale normato tale diametro è esatta-
mente 2r.
• Un sottoinsieme è limitato ⇐⇒ è contenuto in una palla.
• Un’unione finita di sottoinsiemi limitati è un sottoinsieme limitato.
• Sia A = [a, b] × [c, d] ⊂ R2.
Trovare il diametro di A in d2, d1, d∞.
Sia E = {x ∈ R2 : |x| = kxk2 = r}.
Chi è il diametro di E in d∞? E in d1?

Topologia di uno spazio metrico

La topologia serve per dare nozioni di vicinanza e di convergenza.

Definizione 12 Siano (X, d) uno spazio metrico e A ⊆ X.


A si dice aperto se è vuoto oppure se è unione di palle aperte.
La topologia dello spazio metrico (X, d) è la famiglia τd, o più semplice-
mente τ , costituita da tutti i sottoinsiemi aperti.
La coppia (X, τ ) è detta spazio topologico metrizzabile.
Un insieme si dice chiuso se il suo complementare è un insieme aperto.

METRICI – 12
Esercizio. Se p ∈ B(a, r[ e s ≤ r − d(p, a), allora B(p, s[⊆ B(a, r[.
Se q 6∈ B(a, r] e t ≤ d(q, a) − r, allora B(q, t[∩B(a, r] = ∅.
Prima conseguenza: ogni palla chiusa è un insieme chiuso.
pppppppppp
pp ppppp ppp p p p p p p p ppp p p p p p p p p p p p p p p p p p p p p
ppp p
p p p p p pppp pppppp pp p p p p p p p p p p p p pp
pp p p ppp p p p p p pp p p p p pp p ppp
pp p p p p p p p p pp p p p p q pp
pp p ppp p qXq ppp p p p pppp pp p pppp pp ©q q ppp P
p p¶ p p pp ppp p ppp © pp
p p p pp pp
ppp ¶ pp pp
pp pp p ©©ppppp p p p p
pp ¶ © © pppp
pp p
pp
a¶q pp pppp a q ©
© ppp
pp
pp pp p
ppp
p pp
ppp p
pp
pp pp
p ppp
ppp p ppp
pp p p p pp pp
pp p p pp p p p p pp
pp pp pp p p p p
p p ppp
p p p
pp
ppp p pp p pp p p p p p
pppp p p p p p p p p p p p p p p p pp
ppp pp p p p p p p p p pp p p p p p p p p p p p p p p p p p p p p p p
pppppppppppppppp

Seconda conseguenza dell’esercizio precedente.


Proposizione 13 A è aperto ⇐⇒ per ogni p ∈ A esiste un numero
reale δ > 0 tale che B(p, δ[⊆ A.
Dimostrazione. Sufficienza: immediata.
Necessità. Sia p ∈ A con A insieme aperto.
Esiste una palla aperta B(a, r[ tale che p ∈ B(a, r[⊆ A.
Sia s ≤ r − d(p, a). Per l’esercizio precedente si ottiene:
B(p, s[⊆ B(a, r[⊆ A

Proposizione 14 La topologia τ di uno spazio metrico soddisfa le se-


guenti proprietà:
(A1) ∅, X ∈ τ ;
(A2) se Aλ ∈ τ per ogni λ ∈ Λ, allora:
[
Aλ ∈ τ
λ∈Λ
ogni unione arbitraria di aperti è un aperto.
(A3) se A1, . . . , Am ∈ τ , allora:
A1 ∩ · · · ∩ Am ∈ τ
ogni intersezione finita di aperti è un aperto.
METRICI – 13
Dimostrazione. (A1) ovvia.
(A2) unione di unioni di palle aperte. . .
(A3). Basta dimostrarlo per due insiemi aperti A1 e A2; useremo la prop. 13.
Sia p ∈ A1 ∩ A2. Esistono allora r1 > 0 e r2 > 0 tali che:
B(p, r1[⊆ A1, B(p, r2[⊆ A2
Supponiamo r1 ≤ r2. Allora ovviamente B(p, r1[⊆ A1 ∩ A2.
Esercizio. Mostrare con un esempio che un’intersezione arbitraria di
insiemi aperti non è in generale un insieme aperto.

Definizione 15 Un sottoinsieme C di X si dice chiuso se il suo com-


plementare
X \ C = {x ∈ X : x 6∈ C}
è un aperto.

Esercizio. I singoletti (insiemi del tipo {x}) sono insiemi chiusi.


Dalla dualità di De Morgan si ottengono le seguenti proprietà dei chiusi:
(C1) X, ∅ sono chiusi;
T
(C2) se Cλ è chiuso per ogni λ ∈ Λ, allora λ∈Λ Cλ è chiuso;
(C3) se C1, . . . , Cm sono chiusi, allora C1 ∪ · · · ∪ Cm è chiuso.
Esercizio. Mostrare con un esempio che un’unione arbitraria di insiemi
chiusi non è in generale un insieme chiuso.

Definizione 16 Un sottoinsieme U di X si dice intorno di un punto


p ∈ X se esiste un aperto A tale che:
p∈A⊆U
cioè U deve contenere un insieme aperto che contiene p.

Meditazione:
un insieme è aperto se e solo se è intorno di ogni suo punto

METRICI – 14
La famiglia Ip di tutti gli intorni di p si chiama filtro degli intorni di p.
Proprietà di Ip:
(I1) ∀ U ∈ Ip si ha p ∈ U ;
(I2) se U ∈ Ip e U ⊆ V ⊆ X, allora V ∈ Ip;
(I3) se U, V ∈ Ip, allora U ∩ V ∈ Ip;
(I4) se U ∈ Ip allora esiste A ⊆ U con p ∈ A e tale che A ∈ Ix per ogni
x ∈ A.

Definizione 17 Una famiglia Bp di sottoinsiemi di X si dice base per


il filtro degli intorni di p se:
i) per ogni U ∈ Bp si ha U ∈ Ip;
ii) per ogni V ∈ Ip si ha che esiste U ∈ Bp tale che U ⊆ V .

Esercizio. Verificare che in uno spazio metrico ciascuna delle seguenti


famiglie è base per gli intorni di p:
a) {B(p, δ[: δ > 0}
b) {B(p, δ] : δ > 0}
c) {B(p, n1 [: n = 1, 2, . . .}
Quando si parla di Rn si intende con la topologia usuale o euclidea, cioè quella
indotta dalla metrica euclidea |x − y|.
Esercizio.
• In R la famiglia degli intervalli aperti che contengono un punto p costi-
tuisce una base per il filtro degli intorni di p.
• Sia U aperto non vuoto di R.
Dimostrare che U contiene sia numeri razionali sia numeri irrazionali.
Generalizzare il risultato a Rn.

METRICI – 15
Sia A ⊆ X. Si dice chiusura di A in X, e si indica con A o con clX (A), il
seguente insieme:
\
A = {C : C ⊇ A, C chiuso in X}
È il più piccolo chiuso che contiene A.
Proprietà:
(Cl1) ∀ A ⊆ X si ha A ⊆ A;
(Cl2) se A, B ⊆ X allora A ∪ B = A ∪ B;
(Cl3) per ogni A ⊆ X si ha (A) = A.
Esercizio. Dopo aver osservato che in R ogni intervallo aperto non vuoto
contiene numeri razionali,
dedurre che Q = R.
È vero che R \ Q = R ?
Esercizio. Dimostrare che A ∩ B ⊆ A ∩ B,
e che l’inclusione può essere stretta.
Proposizione 18 Siano p ∈ X e A ⊆ X. Allora:
p ∈ A se e solo se per ogni intorno U di p si ha U ∩ A 6= ∅.
Importante Siano d la metrica che induce la topologia di X e A ⊆ X,
A 6= ∅. Allora:
A = {x ∈ X : d(x, A) = 0}

Si dice interno di A, indicato con A oppure intX (A):
◦ [
A= {U : U ⊆ A, U aperto in X}
È il massimo sottoinsieme aperto contenuto in A.

Se p ∈A, allora p si dice interno ad A.
Fatto: X \ A = int(X \ A).
Un punto p si dice di frontiera per A se p non è interno né ad A né a X \ A,
cioè se ogni intorno di p contiene punti di A e punti di X \ A.
Si chiama frontiera di A e si indica con frX (A) o ∂A l’insieme dei punti di
frontiera per A.
METRICI – 16
Fatti:
• fr(A) = A ∩ X \ A = fr(X \ A).
• A = A ∪ fr A.
• p ∈ fr A ⇐⇒ ∀ U ∈ Ip si ha U ∩ A 6= ∅ e U ∩ (X \ A) 6= ∅.
• fr A è un insieme chiuso.
• Un insieme è chiuso se e solo se contiene la propria frontiera.

Definizione 19 Un punto p ∈ X si dice punto di accumulazione


per un sottoinsieme A di X se ogni intorno U di p contiene punti di A
diversi da p.
Un punto p ∈ A si dice isolato in A se non è di accumulazione per A.

Fatti:
• L’insieme dei punti di accumulazione per A si chiama derivato di A e
si indica con A0. Si ha:
A = A ∪ A0
• Il punto p è di accumulazione per A se e solo se ogni intorno di p contiene
infiniti punti di A.
Esercizio. Trovare la chiusura, l’interno, la frontiera, il derivato e l’insieme
dei punti isolati dei seguenti insiemi:
A⊆R A = Q∩]0, 1[∪{2}
A⊆R A =] − ∞, 0[∪{1}
A ⊆ R2 A = Q2 ∩ ([0, 1] × [0, 1])
A⊆R A = {m + n1 : m ∈ Z, n ≥ 1, n ∈ N}
A⊆R×R A = Q × Q con la topologia della metrica del riccio

METRICI – 17
Definizione 20 Un sottoinsieme D ⊆ X si dice denso in X se una
delle seguenti condizioni equivalenti è soddisfatta:
1) D = X.
2) Ogni aperto non vuoto contiene punti di D.
Ad esempio, Q e R \ Q sono entrambi densi in R.
Esercizio. L’intersezione di due aperti densi è aperto e denso.
Definizione 21 Sia (xj )j∈N una successione di punti di X e sia p ∈ X.
Si dice che lim xj = p se per ogni intorno U di p esiste j̄ ∈ N tale che
xj ∈ U per ogni j ≥ j̄
cioè se la successione (xj )j∈N sta definitivamente in ogni intorno di p.
Osservazione. In B(X, R) con la norma della convergenza uniforme si con-
sideri una successione (fj )j∈N di funzioni.
Se lim fj = f ∈ B(X, R), allora per ogni x ∈ X si ha lim fj (x) = f (x) ∈ R.
Il viceversa non è vero.
6 6
1 1 p
ppp
¢A ppp ppp ¤C
¢ A pp pp ¤ C
¢ A ppp ppp¤ C
A f0 pp pp
¢ pp ¤ ppp C f1
p
¢ A p p
pp ¤ pp C
¢ A ppp ¤ ppp C
p p
¢ A
ppp ¤ ppp C
¢ A p
pp ¤ pp C
pp
0 ¢ A 1 0 p¤p p C 1
1 1
2 4
Morale:
la convergenza uniforme implica la convergenza puntuale, ma non viceversa.
Teorema 22 Sia (X, τ ) spazio metrizzabile e siano p ∈ X e A ⊆ X.
Allora:
• p ∈ A ⇐⇒ esiste una successione (xj )j∈N con xj ∈ A ∀ j tale che
lim xj = p.
• p ∈ A0 ⇐⇒ esiste una successione (xj )j∈N con xj ∈ A \ {p} ∀ j
tale che lim xj = p.
In questo caso la successione si può prendere iniettiva.

METRICI – 18
ESEMPI ed ESERCIZI
Le notazioni utilizzate sono quelle delle note.

1 Rivestimenti.

Esercizio 1. Provare le proprieta della nota (§1, 14.1) ̺: Xe −→ X un rivestimento, U ⊆ X :
i) se U è un aperto ben rivestito, allora ogni U e;
ei è aperto in X
ii) ̺ è un omeomorfismo locale, i.e.
∀x e, ∃U
e∈X e (intorno di x e → ̺(U
e) tale che ̺|Ue : U e ) è un omeomorfismo;
e −→ X è aperta, i.e. manda aperti in aperti;
iii) ̺ : X
e;
iv) ogni fibra ̺−1 (x) è un sottospazio discreto di X
v) la cardinalità di ̺−1 (x) è localmente costante.

Esercizio 2. Provare che se ̺ : W −→ R è un rivestimento connesso, allora ̺ è un omeomorfismo.

Esercizio 3. Sia ̺ : X e −→ S 1 un rivestimento. Provare che se X


e è connesso allora è omeomorfo
ad una retta oppure ad un cerchio.

Esercizio 4. Per ogni sottogruppo H < π1 (S 1 ) ∼ e −→ S 1 per il


= Z, trovare un rivestimento ̺ : X

e = H.
quale risulti ̺∗ π1 (X)

Esercizio 5. Provare che la proiezione ̺ : S 2 −→ S 2 / ∼ ∼= P2 (R) (dove ∼ denota l’equivalenza


2
antipodale) è un rivestimento. Dedurre che π1 P (R) è isomorfo al gruppo Z2 .

Esercizio 5 bis . Ripetere l’esercizio precedente con ̺ : S n −→ S n / ∼ ∼


= P n (R) per n ≥ 2.

Esercizio 6. Provare che π1 S 1 × S 1 è isomorfo al gruppo Z2 .

Suggerimento. Si usi il rivestimento ̺ : R2 −→ R2 Z2 ∼ = S 1 × S 1.

Esercizio 7.1. Provare che la funzione C r {0} −→ C r {0}, z 7→ z n , è un rivestimento.

Esercizio 7.2. Sia p(x) = xn + an−1 xn−1 + . . . + a1 x + a0 un polinomio complesso di grado n, sia
d
E := { x ∈ C dx p(x) = 0 } , D := p(E) .
Provare che la restrizione
p |Crp−1 (D) : C r p−1 (D) −−−→ C r D

è un rivestimento connesso di grado n.


Suggerimento: si osservi che C r D è l’insieme dei valori y0 per i quali la retta y = y0 incontra il
grafico di p in n punti distinti (il polinomio p(x) − y0 ha n radici distinte).

Esercizio 8. Provare che la funzione C −→ C r {0}, z 7→ ez , è il rivestimento universale di C r {0}.

Esercizio 9. Siano α : A −→ B e β : B −→ C rivestimenti. Provare che se β è finito (i.e. le sue


fibre sono finite), allora la composizione β ◦ α è un rivestimento.
Nota. Se non si assume che β sia finito il risultato è falso! (Cfr. [Hat], esercizio 6, pag. 79).

Esercizio 10 ([Hat], esercizio 9, pag. 79). Sia Y uno spazio connesso per archi e l.c.a.. Provare che
se il gruppo π1 (Y ) è finito, allora ogni funzione f : Y −→ S 1 è omotopicamente equivalente ad una
funzione costante. Suggerimento. Si usi il Teorema 21.

Esercizio 11. Si provi che il prodotto di due rivestimenti è anch’esso un rivestimento:


e −→ X e σ : Ye −→ Y rivestimenti
̺:X =⇒ e × Ye −→ X × Y è un rivestimento.
̺×σ :X
2

2 CW-Complessi.
Esercizio 1. Sia X un` CW-complesso finito, X 0 ⊆ X 1 ⊆ X 2 ⊆ X 3 ... la sua deconposizione
n n−1 n n n 0
cellulare, X = X φ Dα (i Dα sono copie del disco D ), x0 ∈ X
α α
un punto.
Stabilire quali delle seguenti affermazioni sono vere e quali false, dimostrare quelle vere
(di seguito, #(...) denota il numero delle componenti connesse dello spazio indicato, eventualmente infinito).
i.e., passando dallo 0-scheletro allo 1-scheletro il numero delle compo-
(1.1) #(X 0 ) ≥ #(X 1 )
nenti connesse non può aumentare, nei passi successivi resta necessa-
(1.2) #(X 1 ) = #(X k ) , ∀ k ≥ 1 riamente costante.

(1.3) Le componenti connesse di X coincidono con le componenti connesse per archi ed esiste una iden-
tificazione naturale di tali componenti con X 0 / ∼ dove ∼ è la relazione d’equivalenza generata
da p ∼ q se ∃ Dα1 | φα ({−1, 1}) = {p, q};
(1.4) π1 (X 0 , x0 ) = 0 ;
(1.5) i⋆ : π1 (X 1 , x0 ) −→ π1 (X k , x0 ) è suriettiva per ogni k ≥ 1 ;
(1.6) i⋆ : π1 (X 2 , x0 ) −→ π1 (X k , x0 ) è un isomorfismo per ogni k ≥ 2 ;
(1.7) ogni cammino γ in X , con estremi nello 0-scheletro, è omotopo ad un cammino in X 1 che
percorre 1-celle (in numero finito) a velocità costante, precisamente:

1
2t − 1
∃ γ1 , ..., γn | γ ∼{0, 1} γ1 ∗ ... ∗ γn , γi : I −→ Dα , γi (t) = oppure
1 − 2t
copia del disco
D1 = [−1, 1]

(dove i vari Dα1 sono copie del disco D 1 = [−1, 1], naturalmente sono ammesse ripetizioni: i
1
codomini Dα(i) dei vari γi possono essere non-distinti);
(1.8) X è uno spazio di Hausdorff.
Nota: alcuni autori definiscono i CW-complessi come spazi topologici soddisfacenti certe proprietà, inserendo tra queste
la richiesta di essere di Hausdorff. Noi, seguendo [Hatcher], abbiamo dato una definizione “costruttiva”, nel nostro caso
la separazione di Hausdorff non è tra le ipotesi, è una conseguenza della costruzione, va dimostrata.

(∗)
Esercizio 2. Sia X un CW-complesso (non necessariamente finito). Stabilire quali delle seguenti
affermazioni sono vere e quali false, dimostrare quelle vere.
(2.0) per ogni cammino γ esiste un sottocomplesso finito Z di X tale che Im γ ⊆ Z ;
(2.1) , (2.2) , (2.3) , (2.4) , (2.5) , (2.6) , (2.7) , (2.8) come nell’esercizio 1.

Esercizio 3. Ricordiamo la classificazione delle superfici topologiche compatte:


Cg , g ≥ 0 , P2 (R)#m , m ≥ 1
(rispettivamente, somma connessa di g tori e somma connessa di m piani proiettivi). Si considerino le
superfici
S(∅), S(aa), S(aa−1 ), S(aabb), S(abab), S(abab−1 ), S(aba−1 b−1 ),
S(aabbcc), S(aabccb), S(aabccb−1 ), S(aabcbc), S(aabcbc−1 ), S(aabcb−1 c−1 ),
S(abcabc), S(abcacb), S(abcabc−1 ), S(abcacb−1 ), S(abcab−1 c−1 ), S(abca−1 b−1 c−1 ),
S(a1 a2 a3 ...an a−1
1
a−1
2
a−1
3
...a−1
n
) , S(a1 a2 a3 ...am a1 a2 a3 ...am ),
(distinguere n pari o dispari)

dove S(...) denota il poligono con i lati identificati a coppie secondo l’etichettatura indicata tra le
parentesi. Per ognuna di esse, stabilire:
(3.1) di quale superficie si tratta calcolandone il gruppo fondamentale (o meglio il suo abelianizzato);
(3.2) di quale superficie si tratta utilizzando la tecnica del “cut & paste”.
3

Suggerimento (♣): per il calcolo del gruppo fondamentale si applichi il teorema di Seifert-Van Kampen
alla coppia di aperti
U = “2-cella aperta”, V = S r {o} , o ∈ U .

Esercizio 4. Sia, come al solito, S(...) il poligono con i lati identificati secondo l’etichettatura indicata
tra le parentesi.
(4.1) Si determini il gruppo fondamentale degli spazi topologici che seguono (n.b.: non sono superfici
topologiche):
S(aaa), S(aaaa), S(aaaaa), S(aaaaab), S(aaaaabbb);

(4.2) stabilire quale degli spazi che seguono è il cilindro e qual è il nastro di Möbius (con bordo):
S(abac), S(aba−1 c)
Inoltre, utilizzando il suggerimento (♣), ritrovare che entrambi hanno Z come gruppo fondamen-
tale.
4

3 Teorema di Hurewicz.
Esempio 1. Consideriamo il poligono in figura e la proiezione f sulla superficie C2 (somma connessa
di due tori), quest’ultina ottenuta identificando i lati dell’ottagono nella maniera indicata
τ e
̺ µ
d

τ
γ λ
f γ = C2
c

̺ µ
a b
λ

I cammini γ, λ, µ li vediamo in C2 via f , continuiamo a chiamarli usando gli stessi nomi. Nella
notazione fondamentale (Note §2, Notazione 13.1) abbiamo
(2) γ = [e, a]f , λ = [a, b]f = [d, c]f , µ = [b, c]f = [e, d]f
(ribadiamo che sono cammini in C2 ).

La classe di omotopia di γ non è nulla (cfr. nota 5 sotto), ciononostante risulta Υ(γ) = 0

dove Υ : π1 (X, x0 ) −→ H1 (X) denota il morfismo di Hurewicz .

Dimostrazione (del fatto che γ è omologicamente banale).


∂ [a, b, c]f − ∂ [a, d, c]f + ∂ [e, a, d]f = [b, c]f − [a, c]f + [a, b]f

− [d, c]f + [a, c]f − [a, d]f


(3)
+ [a, d]f − [e, d]f + [e, a]f

= γ
cfr. (2)


Seguendo quello che ci dice la parte finale della dimostrazione del teorema di Hurewicz (cfr. Note §2,
Teorema 21), cioè scrivendo i cammini corrispondenti ai perimetri dei tre 2-simplessi indicati, otteniamo1
  
(4) 0 ∼omotopo λ ∗ µ ∗ α− ∗ α ∗ λ− ∗ β − ∗ β ∗ µ− ∗ γ ,

dove α = [a, c]f , β = [a, d]f (cfr. figura, ottagono, tratteggio leggero). In definitiva, scopriamo
quello che già sapevamo dal disegno:
(4′ ) il cammino ω := λ ∗ µ ∗ λ− ∗ µ − ∗ γ è omotopicamente banale.
Come diciamo subito dopo la (21.1, Note §2):
i) il cammino ω è omotopo al cammino costante x0 ;
ii) l’espressione a destra in (4′ ), a meno di un riordino dei termini, è omotopa al cammino γ .

Infatti, la i) segue dal fatto l’espressione a destra della (4), ovvero della (4′ ), “percorre dei perimetri”,
la ii) segue dal fatto che i vari termini che vi compaiono, se non si tiene conto dell’ordine, si devono
semplificare come nella (3).

(Naturalmente possiamo decidere in che ordine scrivere i triangoli, ad esempio scambiando gli ultimi
due troviamo il cammino ω ′ = λ ∗ µ ∗ α− ∗ β ∗ µ− ∗ γ ∗ α ∗ λ− ∗ β − , anche questo è omotopicamente
banale e, sempre a meno di un riordino dei termini, è omotopo al cammino γ ).
1
  
Ogni parentesi graffa è un’espressione ξλ (0)
∗ λi ∗ ξλ− (1) ∗ ξµ (0)
∗ µi ∗ ξµ− (1) ∗ ξν (0)
∗ νi ∗ ξν−(1) della (§2, 21.1) nelle
i i i i i i
Note. Nel nostro caso i vari ξ sono sempre il cammino costante x0 = [a, a]f = [b, b]f = [c, c]f = [d, d]f = [e, e]f ;
visto che sono superflui, anzi dannosi in quanto appesantiscono la notazione, non li abbiamo scritti.
5

Nota 5: nel nostro esempio, effettivamente il cammino γ non è omotopicamente banale.

Dimostrazione. Per il teorema di Seifert-Van Kampen sappiamo che


Free(λ, µ, τ, ̺)
(♣) π1 (C2 , x0 ) =
.
λ µ λ−1 µ−1 τ ̺ τ −1 ̺−1
D’altro canto quanto visto sopra ci dice che γ è omotopo al cammino µ ∗ λ ∗ µ− ∗ λ− . Nella notazione
adatta al gruppo a destra della (♣) abbiamo
γ = µ λ µ−1 λ−1 .
Per ragioni di teoria dei gruppi questo elemento è non-nullo (nel quoziente a destra della ♣). 
6

4 Morfismi di complessi di catene

Esercizio 1. Verificare che i morfismi indicati negli esempi (1.1), (1.2) e (1.3) sono effettivamente
morfismi di complessi di catene. Per ognuno degli esempi, provare le affermazioni indicate.

Esempio (1.1).
·2
A• := 0 −−−−→ Z −−−−→ Z −−−−→ 0
  
  π
fy y y
C• := 0 −−−−→ 0 −−−−→ Z 2 −−−−→ 0
(grado 0)

• f induce isomorfismi in omologia


(che per entrambi i complessi è Z 2 in grado zero, nulla negli altri gradi);
• non esiste alcun morfismo ω : C• → A• che induca anch’esso isomorfismi in omologia;
• f non è un’equivalenza omotopica.

Esempio (1.2).
0• := 0 −−→ 0
 −−→ 0
 −−→ 0
 −−→ 0
y y y
·2
E• := 0 −−→ Z −−→ Z −−→ Z 2 −−→ 0
(grado 0)

• f (che è il morfismo nullo) induce isomorfismi in omologia;


• f non ha un inverso omotopico.
Id
Suggerimento: provare che i due morfismi E• −−→
−−→ E• non sono omotopi.
0

Esempio (1.3).
·2
A• := 0 −−−−→ Z −−−−→ Z −−−−→ 0
  
η
y
Id
y

y
C• := 0 −−−−→ Z −−−−→ 0 −−−−→ 0
(grado 0)

• H1 (A• ) = 0, mentre H1 (C• ) = Z;


• Il morfismo η induce il morfismo nullo in omologia;
• η 6∼omotopo 0 (nonostanti risulti η⋆ = 0).

Suggerimento: la domanda più difficile è l’ultima: ragionando per assurdo si dovrebbe avere
Id = η1 = J0 ◦ (·2) + 0 ◦ J1 = “pari”
(J denota l’eventuale omotopia di complessi di catene).

Esercizio 2. Si consideri il morfismo di successioni esatte corte di gruppi abeliani

0 −−→  −−→
B  −−→
C  −−→
D 0
β γ 
y y yδ
0 −−→ B′ −−→ C′ −−→ D ′ −−→ 0
(le righe sono esatte ed il diagramma commuta). Provare che
i) se γ è suriettiva e δ è iniettiva, allora β è suriettiva;
ii) se β è suriettiva e γ è iniettiva, allora δ è iniettiva.
7

Esercizio 3. Sia λ µ
A −−→ B −−→ C −−→ D −−→ E
una successione esatta di gruppi abeliani. Provare che c’è una successione esatta corta naturale
0 −−→ cokerλ −−→ C −−→ kerµ −−→ 0 .
Dedurre che λ è suriettiva e µ è iniettiva, allora risulta C = 0.

Proponiamo ora come esercizio guidato il caso particolare dove B• = 0 dell’esercizio delle Note (14.1, §A2).

Esercizio 4. Sia C• un complesso di catene libero aciclico (i.e. Hn (C• ) = 0, ∀ n). Si provi che
l’inclusione di complessi
0• −−−→ C• (0• denota il complesso nullo)
è un’equivalenza omotopica.

Innanzi tutto ricordiamo la notazione: dato un complesso, per ogni n ∈ Z, denotiamo con Zn il
sottogruppo degli n-cicli, i.e. Zn := ker∂n , e con Bn il sottogruppo degli n-bordi, i.e. Bn := Im∂n+1 .
(Essendo, nel nostro caso, C• aciclico si avrà Zn = Bn , ∀ n).

Suggerimento:
Passo 0. Stabilire che il nostro problema è equivalente al problema di trovare un’omotopia
IdC• ∼ 0 : C• −−−→ C• .

Passo 1. Si provi che esiste un’inversa destra dell’operatore di bordo, i.e. una funzione
sn−1 ∂n
sn−1 : Zn−1 −→ Cn la composizione Zn−1 −−−→ Cn −−− → Zn−1 è l’identità

(a tal fine, si utilizzi il fatto che ogni sottogruppo di un gruppo abeliano libero è anch’esso un gruppo
abeliano libero).

Passo 2. Si osservi che σ − sn−1 ∂n (σ) ∈ Zn (si calcoli ∂n di quest’espressione).

Passo 3. Si definiscano gli operatori


Jn : Cn −−−−→ Cn+1

σ 7→ sn σ − sn−1 ∂n (σ)

Passo 4. Si verifichi che l’operatore definito mettendo insieme i vari Jn


J• : C• −−−→ C•
è l’omotopia cercata.

8

5 Risultati di topologia e omologia


Esercizio 1. Sia {U, V } un ricoprimento aperto di uno spazio topologico X . Provare che
• se U e V sono connessi per archi e H1 (X) = 0 =⇒ U ∩ V è connesso per archi;
• se U ∩ V è connesso per archi e H1 (U ∩ V ) = 0 =⇒ H1 (X) = H1 (U ) ⊕ H1 (V );
• se U e V sono connessi per archi e H1 (U ) = H1 (V ) = 0 =⇒ H1 (X) è un gruppo abeliano libero;
• nelle ipotesi del punto precedente, caratterizzare il numero di generatori di H1 (X).

Esercizio 2. Per ciascuno degli spazi che seguono, si calcolino i gruppi di omologia utilizzando
• la successione di Mayer-Vietoris; • la successione esatta della coppia; • l’omologia cellulare.
i) S 1 ∨ S 3 (wedge sum); ii) S 2 ∨ S 2 ;
iii) T2 = R2 /Z2 ; iv) K = “bottiglia di Klein” v) Cg (superficie compatta di genere g).
vi) T3 = R3 /Z3 .
(Va da sé che tecniche e strumenti differenti devono condurre al medesimo risultato!)

Esercizio 2 b. Realizzare la bottiglia di Klein come ∆-complesso e calcolarne i gruppi di omologia


(cfr. Note, §2, esempi 40 e 41).

Esercizio 3. Determinare i gruppi di omologia di D 3 r (r ∪ s ∪ t) , dove r, s, t sono tre rette


(considerare i vari casi possibili).

Esercizio 4. Determinare i gruppi di omologia della somma wedge


(X, x0 ) ∨ (Y, y0 )
in funzione dei gruppi di omologia di X ed Y sapendo che x0 è un retratto di deformazione di un suo
intorno in X e che y0 è un retratto di deformazione di un suo intorno in Y .

Esercizio 5. Provare, usando l’omologia, quanto segue:


i) il nastro di Möbius non è omeomorfo al cilindro aperto S 1 × (0, 1) ;
ii) il nastro di Möbius con bordo non è omeomorfo al cilindro compatto S 1 × [0, 1] .

Esercizio 6 “poligoni modulo identificazioni”. Calcolare i gruppi di omologia dello spazio S(λn )
(spazio ottenuto da un poligono di n-lati, identificandone i lati di secondo la parola λn )
i) usando l’omologia cellulare (avendolo realizzato come CW-complesso con una sola 2-cella);
ii) usando i teoremi di Seifert-Van Kampen e Hurewicz (per l’H1 );
iii) usando una (opportuna) struttura di ∆-complesso.

Esercizio 7. Sia X ⊆ Rn un sottospazio arbitrario. Provare che2


Hk (Rn , X) ∼ = H e
k−1 (X) , ∀ k ∈ Z.

Esercizio 8. Sia ϕ : D k −→ Rn una funzione iniettiva.


• Calcolare i gruppi di omologia di Rn r Imϕ. • Provare che risulta k ≤ n.

Esercizio 9. Provare che un omeomorfismo ϕ : D n −→ D n manda la frontiera del disco in se.

Esercizio 10. Sia Pn lo spazio proiettivo reale di dimensione n, Pk ⊆ Pn un sottospazio (k ≤ n).


Calcolare i gruppi di omologia degli spazi topologici
Pn /Pk (quoziente insiemistico); Pn r Pk .

2 Se X è l’insieme vuoto, la sua omologia ridotta è Z in grado −1 e banele negli altri gradi (il risultato continua a valere).
versione preliminare
(20 - 12 - 2016)

Richiami di Topologia ed Esercizi

§ 1. Generalità.

In queste pagine propongo alcuni esercizi di topologia generale. Per ragioni di comodità e per fis-
sare linguaggio e notazioni sporadicamente inserisco definizioni e risultati teorici (questi inserti sono
contrassegnati da due barre alla loro sinistra).
Importante. Ci sono esercizi di tipi molto diversi tra loro, di conseguenza rivolti a pubblici distinti: alcuni esercizi
concernono proprietà elementari e/o riguardano questioni più complesse, comunque sono rivolti a studenti che seguono il
loro primo corso di topologia; altri, contrassegnati con un asterisco, sono di approfondimento e sono rivolti esclusivamente
a chi abbia già una buona confidenza con i concetti fondamentali. (Generalmente, ma non necessariamente, i secondi sono
più difficili dei primi, comunque possono -o meglio devono- essere saltati da chi rientra nella prima categoria di pubblico).

Notazione (che in questo paragrafo fisso una volta per tutte):


X ed Y denotano due spazi topologici, x ∈ X un punto.

Def. 1. N ⊆ X è un intorno di x in X ⇐⇒ N contiene un aperto contenente x;



Def. 2. Un sottospazio W ⊆ X è un sottoinsieme dotato della topologia indotta: gli aperti di W

sono le intersezioni degli aperti di X con W (idem per i chiusi).

Esercizio 3. Sia U un sottoinsieme di X. Si provi quanto segue:


U è aperto ⇐⇒ U è un intorno di ogni suo punto;

Esercizio 4. Sia W ⊆ X un sottospazio. Si provi quanto segue:


a. la definizione (2) è ben posta, i.e. la famiglia ivi indicata costituisce una topologia su W ;
b. se W è esso stesso aperto, allora i suoi aperti sono gli aperti di X contenuti in W ;
c. se W è chiuso, i suoi chiusi sono i chiusi di X contenuti in W ;
d. W ed X inducono la stessa topologia su un sottoinsieme Z ⊆ W (detto in altri termini, vedere
un tale sottoinsieme Z come sottospazio di W equivale a vederlo come sottospazio di X ).


Def. 5. Una funzione f : X −→ Y si dice


(5.1) continua ⇐⇒ la preimmagine (:= immagine inversa) di ogni aperto è un aperto;

(5.2) continua in x ⇐⇒ f −1 (M ) è un intorno di x, per ogni intorno M di f (x) .

Esercizio 6. Sia f : X −→ Y una funzione. Si provi quanto segue:


a. la composizione di funzioni continue è continua;
b. f è continua ⇐⇒ la preimmagine di ogni chiuso è un chiuso;
c. f è continua in x ⇐⇒ f −1 (M ) è un intorno di x, per ogni intorno aperto M di f (x);

Esercizio 7. Si provi che la continuità in un punto è una proprietà locale, precisamente:


data una funzione f : X −→ Y , fissato un intorno N di x ∈ X, si ha che

f è continua in x ⇐⇒ la restrizione f |N è continua x

Naturalmente, affinché abbia senso parlare di continuità della restrizione f |N , l’insieme N è da intendersi dotato della
topologia di sottospazio di X (cfr. def. 2).
2

Esercizio 8. Sia W un sottospazio di X . Si provi quanto segue:


a. l’inclusione W ֒→ X è una funzione continua;
b. la topologia di W è la topologia meno fine per la quale l’inclusione W ֒→ X è continua.
Per definizione, “meno fine” significa “meno ricca di aperti”. Quindi, al punto b si chiede di provare che se τW è la
topologia di W (quella indotta dall’ambiente X) ed ωW è un’altra topologia definita su W per la quale l’inclusione di
W in X è continua, allora ogni aperto di τW è un aperto di ωW .


Proposizione 9. f : X −→ Y è continua ⇐⇒ è continua in ogni punto x ∈ X ;


Dimostrazione. Proviamo “=⇒”: se x ∈ X e V è un intorno aperto di f (x), si ha che f −1 (V ), in quanto aperto

contenente x, è un intorno di x;

Proviamo “⇐=”: se V ⊆ Y è aperto ed x ∈ f −1 (V ), essendo f continua in x e V un intorno di f (x), si ha che
−1
f (V ) deve essere un intorno di x. Poiché ciò vale per ogni x ∈ f −1 (V ), lo stesso f −1 (V ) deve essere un intorno
di ogni suo punto. Ne segue che f −1 (V ) è aperto (cfr. esercizio 3).



Per quel che riguarda l’implicazione “⇐=”, andando al punto dell’argomento senza invocare l’esercizio (3), possiamo
scrivere:

f −1 (V ) = ∪ Ux , Ux aperto soddisfacente la condizione x ∈ Ux ⊆ f −1 (V )
x ∈ f −1 (V )

(V ⊆ Y è un aperto). Di conseguenza, in quanto unione di aperti, f −1 (V ) è anch’esso aperto.

Esercizio 10. Sia f : X −→ Y una funzione continua e W ⊆ X un sottospazio. Si provi che


(♣) la restrizione f |W : W −→ Y è anch’essa una funzione continua

usando direttamente le definizioni (2) e (5.1).


In alternativa, (♣) può essere provata usando il fatto che la composizione di funzioni continue è continua (esercizio 6.a):
la restrizione f |W si ottiene componendo l’inclusione W ֒→ X (continua per l’esercizio 8.a) con f (continua per ipotesi).


Prop. 11. Sia X = ∪ U un ricoprimento aperto, X = S n
Ci un ricoprimento finito chiuso.
α
i=1
Allora

f : X −→ Y è continua ⇐⇒ le restrizioni fα := f |Uα sono continue




⇐⇒ le restrizioni fi := f |C sono continue.
i

Un ricoprimento aperto è un ricoprimento in insiemi aperti. Un ricoprimento chiuso è un ricoprimento in insiemi

chiusi. L’aggettivo finito indica che gli insiemi del ricoprimento in questione sono in numero finito.


Dimostrazione. Se f è continua, le varie restrizioni sono tutte continue (cfr, esercizio 10).

Assumendo che le restrizioni f |Uα siano continue e che V ⊆ Y sia aperto, si ha che f −1 (V ) = ∪ fα−1 (V ) è aperto.

Infatti, per ogni α, si ha che fα−1 (V ) è aperto in Uα per la continuità di fα e, essendo Uα stesso aperto, è aperto in

X (ciò segue dall’esercizio 4.b). n
Analogamente, se le restrizioni f | sono continue e W ⊆ Y è chiuso, abbiamo che f −1 (W ) = S fi−1 (W ) è chiuso
Ci
i=1
(i vari f −1 (W ) sono chiusi nei rispettivi Ci , che siano chiusi in X segue dall’esercizio 4.c).
i 


Per quel che riguarda il primo dei due “⇐⇒”, una dimostrazione alternativa a quella appena vista è la seguente:


f è continua ⇐⇒ f è continua in x , ∀ x ∈ X ⇐⇒ fα è continua in x , ∀ x ∈ Uα , ∀ α ⇐⇒ fα è continua, ∀ α

(Prop. 9) (Eser. 7) (Prop. 9)

(si osservi che l’argomento proposto non funziona per il ricoprimento chiuso: nell’esercizio 7, utilizzato al centro, l’insieme

N deve essere un intorno di x, ovvero deve contenere un aperto contenente x).
3

Come corollario immediato della proposizione (11) si deduce il cosiddetto lemma di incollamento :



Lemma 12 (di incollamento). Se X = ∪ Uα è un ricoprimento aperto, fα : Uα → Y è una

collezione di funzioni che si raccordano bene, allora


∃ ! funzione continua f : X −→ Y f | Uα = fα , ∀ α .


Inoltre, un risultato analogo vale per i ricoprimenti finiti chiusi.


Nota. Richiedere che le funzioni si raccordino bene significa richiedere che risulti fα |U = fβ |U , ∀ α, β .
α ∩Uβ α ∩Uβ

Esercizio 13. Si provi, dando un controesempio, che la tesi del lemma di incollamento non vale per
ricoprimenti chiusi arbitrari.
Suggerimento: Si pensi ad un qualsiasi spazio infinito i cui punti sono chiusi.


Def. 14. Dato un sottoinsieme W ⊆ X si definiscono



T ◦ S
W = “chiusura di W ” = K , W = “interno di W ” = U .

Kchiuso U aperto

K⊇W U ⊆W




∂ W = “frontiera di W ” = W ∩ X r W

Esercizio 14.1. Sia W ⊆ X un sottoinsieme.


Provare che W ha frontiera vuota se e solo se è sia aperto che chiuso in X .

Esercizio 14.2. Sia W ⊆ X un sottoinsieme. Si provino le tre uguaglianze indicate di seguito

= W
z }| {
◦ S· S· ◦
(♣) X = W ∂W (X rW )
| {z }
= X rW

dove scrivere “... ∪· ... ∪· ... ” significa dire che l’unione è disgiunta, i.e. che gli insiemi indicati hanno
a due a due intersezione vuota (n.b. c’è un piccolo abuso di notazione e linguaggio!)
Nota. Come accennato, c’è un abuso di notazione nel nostro uso in (♣) del simbolo di unione disgiunta (che in genere
ha un significato differente: presi due insiemi A e B, con A ∪· B si intende l’insieme costituito da una copia di A −i cui
elementi saranno per questo etichettati− ed una copia di B, per cui, ad esempio, A ∪· A è l’insieme costituito da due
copie di A). ...d’altronde l’abuso concerne solo l’uso del simbolo (per definizione, diciamo che una unione è disgiunta se
l’unione usuale si identifica con l’unione disgiunta) ed il rischio di un’interpretazione errata della formula (♣) è nullo!

Esercizio 15. Sia f : X −→ Y una funzione. Provare quanto segue



f è continua ⇐⇒ f W ⊆ f (W ) , ∀ W ⊆ X

Nota 15.1. Questo esercizio è importante perché caratterizza la continuità in termini che a mio avviso
combaciano con l’idea intuitiva di continuità. Infatti, ci dice che la continuità di una funzione f è
caratterizzata dalla proprietà che segue:
se x è vicino a W , allora f (x) è vicino a f (W ) , ∀W ⊆ X
dove il significato formale di “è vicino a” è “appartiene alla chiusura di”.
4

Esercizio 15.2. Sia f : X −→ Y una funzione. Provare, sia dandone dimostrazioni dirette che
utilizzando l’esercizio (15), le affermazioni che seguono
• se X ha la topologia banale, allora f è continua se e solo se {y} ⊇ Imf , ∀ y ∈ Imf ;
• se X ha la topologia discreta, allora f è necessariamente continua;
• se Y ha la topologia banale, allora f è necessariamente continua;
• se Y ha la topologia discreta, allora f è continua se e solo se le sue fibre sono sia aperte che chiuse.
Ricordiamo che la topologia banale è quella dove gli unici aperti sono il vuoto e tutto lo spazio, la topologia discreta è
quella dove ogni sottoinsieme è aperto. Le fibre di una funzione sono le immagini inverse dei punti del codominio.

Esercizio 16. Sia f : X −→ Y una funzione, x ∈ X un punto. Si provi quanto segue:



f è continua in x ⇐==⇒ f (x) ∈ f (W ) , ∀ W x ∈ W

(i.e., nel linguaggio della nota 15.1, “f (x) è vicino a f (W ), ∀ W vicino ad x”).

Suggerimento: “=⇒”. Fissato un insieme W la cui chiusura contiene x, si consideri l’insieme I := Y r f (W ) (il
complementare della chiusura dell’immagine di W ). Se, per assurdo, f (x) 6∈ f (W ), si ha che I è un intorno di f (x)
e, essendo f continua in x per ipotesi, la sua immagine inversa dovrà essere un intorno di x. Da ciò si deduca una
contraddizione.
“⇐=”. Fissato un intorno aperto I di f (x), si ponga W := X r f −1 (I). A questo punto, se per assurdo f −1 (I)
non fosse un intorno di x, si avrebbe x ∈ W . Applicando l’ipotesi si deduca la condizione f (x) ∈ Y rI , condizione
incompatibile col fatto che I è un intorno di f (x).

Esercizio 17. Sia J un insieme e P(J) l’insieme delle parti di J . Si considerino funzioni

ι : P(J) −→ P(J)

soddisfacenti le proprietà che seguono:

0. ι(J) = J; 1. ι(A) ⊆ A, ∀ A ∈ P(J) ; 2. ι ◦ ι = ι ; 3. ι(A ∩ B) = ι(A) ∩ ι(B) , ∀ A, B ∈ P(J) .

Verificare che dare una funzione ι come sopra equivale a dare una topologia su J, precisamente:

i) la collezione τ := A ι(A) = A è la collezione degli aperti di una topologia su J ;

ii) se J è uno spazio topologico, l’operatore di interno ι(A) := A, ∀ A soddisfa le proprietà 0, 1, 2, 3;
iii) le funzioni “a ι si associa τ ” e “ad una topologia si associa l’operatore di interno” sono l’una
l’inversa dell’altra.

Nota. La i) può essere provata senza utilizzare la 2: data una funzione ι che soddisfi le proprietà 0, 1, 3, gli elementi
che sono fissati da ι cioè gli A ∈ P(J) per i quali risulta ι(A) = A sono gli aperti di una topologia. Ciononostante
la 2 non è ridondante, un esempio di funzione che soddisfa le proprietà 0, 1, 3 ma non soddisfa la 2 è il seguente:
J = {a, b, c}, ι(∅) = ∅, ι({a}) = ι({b}) = ∅, ι({a, b}) = {a}, ι({c}) = ι({a, c}) = ι({b, c}) = {c}, ι(J) = J
Gli insiemi fissati da ι, cioè gli aperti della topologia τ associata a ι, sono gli insiemi ∅, {c}, J. Naturalmente, l’operatore
di interno per questa topologia, che chiameremo ι̃, soddisfa anche la proprietà 2; pertanto ι ed ι̃ sono operatori distinti
(che definiscono la stessa topologia), in effetti ι({a, b}) = {a} mentre ι̃({a, b}) = ∅ (su tutti gli altri sottoinsiemi di J
coincidono). N.b.: schematizzando ι τ ι̃ 6= ι (“ ” := “associamo”), i.e. senza usare la 2 non vale la iii).

Esercizio 17.1. Provare quanto affermato nella nota, cioè provare la i) senza utilizzare la 2 e verificare che l’esempio
fornito soddisfa le proprietà 0, 1, 3 ma non soddisfa la 2.
Esercizio 17.2. Si provi un risultato analogo per l’operatore di chiusura: dare una topologia su un insieme J equivale
a dare una funzione
κ : P(J) −→ P(J)
soddisfacente le proprietà che seguono:
0. κ(∅) = ∅; 1. κ(A) ⊇ A, ∀ A ∈ P(J) ; 2. κ ◦ κ = κ ; 3. κ(A ∪ B) = κ(A) ∪ κ(B) , ∀ A, B ∈ P(J) .
5

Def. 18. Sia X uno spazio topologico, B una collezione di aperti. Diciamo che B è una base per

la topologia se ogni aperto di X è unione di aperti in B.

Esercizio 18.1. Sia J un insieme, B una collezione di sottoinsiemi. Provare che B è una base per
una qualche topologia su J se e solo se
B è un ricoprimento di J , ogni intersezione B1 ∩ B2 di elementi in B è unione di elementi in B.

Esercizio 18.2. Sia X uno spazio topologico, B una collezione di sottoinsiemi aperti. Provare che
B è una base per la topologia su X
per ogni aperto U e ogni punto x ∈ U , esiste B ∈ B tale che x ∈ U ⊆ B .


Def. 18.3. Sia X uno spazio topologico, p ∈ X un punto. Diciamo che


X è primo numerabile in p se p ammette un sistema di intorni numerabile, i.e.


∃ F = Vi i∈N tale che ∀ U ∃ i con Vi ⊆ U ;


famiglia di intorni di p
intorno di p


X è primo numerabile se è primo numerabile in ogni punto;


X è secondo numerabile se ammette una base numerabile.


Osserviamo che se X è secondo numerabile, è automaticamente anche primo numerabile. Il viceversa è

chiaramente falso: un qualsiasi spazio non numerabile avente la topologia discreta, è primo numerabile

ma non è secondo numerabile.

Esercizio 18.4. Sia X uno spazio topologico, p ∈ X un punto. Provare che sostituendo “intorno”
con “intorno aperto” la definizione rimane immutata, precisamente:
X è primo numerabile in p se e solo se

∃ F = Vi i∈N tale che ∀ U ∃ i con Vi ⊆ U ;
intorno aperto di p
famiglia di intorni aperti di p
6

§ 2. Spazi Metrici.

Assumiamo che lo studente abbia un minimo di familiarità con le nozioni di spazio metrico e di spazio vettoriale reale

normato. Per comodità e per fissare le notazioni facciamo un breve richiamo. Uno spazio metrico è un insieme X sul
quale è definita una distanza d, quest’ultima è una funzione che ad ogni coppia di punti di X associa un numero reale,

si richiede che sia simmetrica, assuma valori non negativi, che risulti d(a, b) = 0 se e solo se a = b ed infine che

valga la disuguaglianza triangolare d(a, b) + d(b, c) ≥ d(a, c), ∀ a, b, c ∈ X . Uno spazio vettoriale reale normato
è uno spazio vettoriale reale X sul quale è definita una norma, ovvero una funzione X −→ R, x 7→ ||x|| che sia

definita-positiva (||x|| ≥ 0, ||x|| = 0 ⇔ x = 0), omogenea (||λx|| = |λ|||x||, ∀ λ ∈ R, x ∈ X ), soddisfacente la

disuguaglianza triangolare (||x|| + ||y|| ≥ ||x + y|| , ∀ x, y ∈ X). Si ha che gli spazi vettoriali normati sono spazi metrici:
si pone d(x, y) = ||x − y|| (questa risulta essere una distanza, lo si verifichi per esercizio).



Per uno spazio metrico (X, d) usiamo le seguenti notazioni standard

Bo, r = “disco aperto di centro o e raggio r” := { x ∈ X | d(x, o) < r } (o ∈ X, r ∈ R) ;


Do, r = “disco (chiuso) di centro o e raggio r” := { x ∈ X | d(x, o) ≤ r } (o ∈ X, r ∈ R) ;


So, r = “sfera di centro o e raggio r” := { x ∈ X | d(x, o) = r } (o ∈ X, r ∈ R) .



In ambito metrico si danno le seguenti definizioni di continuità: dati due spazi metrici (X, d) e (Y, d′ )

f : X −→ Y si dice continua in x x0 ∈ X se ∀ ǫ > 0 ∃ δ | d(x, x0 ) < δ =⇒ d′ (y, y0 ) < ǫ

(dove y = f (x), y0 = f (x0 );

f : X −→ Y si dice continua se è continua in ogni punto.



Gli spazi metrici sono spazi topologici: se (X, d) è uno spazio metrico, lo si considera dotato della

topologia definita dall’affermazione che segue:

gli aperti di X sono le unioni di dischi aperti


(i.e. i dischi aperti costituiscono una base per la topologia).

Esercizio 21. Verificare che quella introdotta è effettivamente una topologia (i.e. soddisfa gli assiomi
di spazio topologico).

Esercizio 22. Provare che le definizioni di continuità e continuità in un punto date in ambito metrico
coincidono con le corrispondenti definizioni date in ambito topologico (def. 5.1 e def. 5.2).
Suggerimento: Alla luce della Proposizione (9) è sufficiente verificare che la definizione metrica di continuità in un punto
coincide con quella topologica (cfr. Def. 5.2).


Lo spazio Rn con la distanza Euclidea

p

d(x, y) := (x1 −y1 )2 + ... + (xn −yn )2 , x = (x1 , ..., xn ), y = (y1 , ..., yn )


è uno spazio metrico, la corrispondente topologia viene detta topologia naturale.

q
Nota. In effetti Rn è uno spazio vettoriale reale normato: si pone ||x|| = x2 + ... + x2 .
1 n

Esercizio 23. Si consideri Rn con la topologia naturale.


a. Si verifichino le uguaglianze che seguono
So, r = ∂ Do, r = ∂ Bo, r
dove ∂ denota la frontiera, o ∈ Rn è un punto, r > 0.

b. In generale, i.e. per uno spazio metrico (X, d) arbitrario, quali delle sei possibili inclusioni
So, r ⊆ ∂ Do, r , So, r ⊇ ∂ Do, r , So, r ⊆ ∂ Bo, r , So, r ⊇ ∂ Bo, r , ∂ Do, r ⊆ ∂ Bo, r , ∂ Do, r ⊇ ∂ Bo, r

si verificano sempre?
7

Chi ha svolto l’esercizio precedente avrà provato che le inclusioni ∂ Do, r ⊆ So, r e ∂ Bo, r ⊆ So, r sono le “uniche
che si verificano sempre”; inoltre, le due frontiere indicate sono sicuramente chiuse nel cerchio So, r . Dunque, in un certo
senso l’esercizio (23.1) seguente ci dice che fatte salve le condizioni menzionate, prendendo sottospazi del piano (cioè senza
scomodare spazi metrici strani), i tre insiemi So, r , ∂ Bo, r , ∂ Do, r possono essere “scelti” in modo del tutto arbitrario.

Esercizio 23.1. Si consideri R2 , sia o l’origine. Sia A un sottospazio arbitrario di S 1 (cerchio


unitario centrato in o), H e K due sottospazi chiusi di A. Si trovi un sottospazio X ⊆ R2 tale che
o ∈ X, per lo spazio metrico X risulti So, 1 = A , ∂ Bo, 1 = H , ∂ Do, 1 = K .

Esercizio 24. Sia (X, d) uno spazio metrico. Dati due sottoinsiemi A, B ⊆ X ed un punto x ∈ X ,
poniamo  
dist(A, x) := inf d(a, x) , dist(A, B) := inf d(a, b)
a ∈ A (a, b) ∈ A×B

Stabiliamo per convenzione che l’estremo inferiore su un insieme di valori vuoto sia uguale a +∞; in questo
 
modo le distanze introdotte sopra sono definite anche quando qualcuno dei nostri insiemi è vuoto.

Si verifichino le proprietà che seguono:


a. i punti sono chiusi;
b. due punti p e q distinti ammettono intorni Up ed Uq aventi intersezione vuota;
c. se C è un sottoinsieme chiuso e p ∈ X rC un punto, allora dist(C, p) > 0 ;
d. dato un sottoinsieme A di X , risulta A = {x ∈ X | dist(A, x) = 0} ;
e. trovare due chiusi disgiunti1 A , B ⊆ R2 aventi distanza nulla;
f. X è primo numerabile;
g. ∀ C, D chiusi disgiunti, ∃ UC e UD aperti disgiunti C ⊆ UC , D ⊆ UD .
Suggerimento (per g): si considerino gli insiemi
 
UC := x ∈ X d(x, C) < d(x, D) , UD := x ∈ X d(x, C) > d(x, D)
e si verifichi che: i) sono disgiunti; ii) UC ⊇ C e UD ⊇ D (cfr. punto c); iii) sono entrambi aperti.
Nota. La proprietà a ci dice che X è T1 (cfr. def. 57, esercizio 59.a), la proprietà b ci dice che X è T2 (cfr. def. 57),
la proprietà g ci dice che X separa i chiusi (cfr. def. 68). In definitiva, gli spazi metrici sono T4 (cfr. def. 68).

Esercizio 25. Sia X uno spazio topologico, f , g : X −→ R due funzioni continue (R dotato della
topologia naturale). Provare che il luogo dei punti
f >g 
L := x ∈ X f (x) > g(x)
f 6= g f ≥g f =g
è aperto in X . Definiti i luoghi L , L , L in modo analogo, dedurre che il primo di essi è
aperto in X , secondo e terzo sono chiusi in X . Infine, verificare l’inclusione
f ≥g
L ⊇ Lf > g
e dare un controesempio per il quale non vale “=”.
f 6= g f =g
Nota. I luoghi L e L hanno perfettamente senso anche quando il codominio delle nostre funzioni è uno spazio
topologico Y arbitrario.

Esercizio 26. Siano f, g : X −→ Y funzioni continue tra spazi metrici,


f 6= g f =g
verificare che il luogo L è aperto ed il luogo L è chiuso.

Esercizio 27. Esibire esempi di funzioni continue f , g : X −→ Y (tra spazi topologici) tali che
f =g
• L è aperto ma non è chiuso;
f =g
• L non è né aperto né chiuso.
Nell’ipotesi che i punti di Y siano chiusi, stabilire se sia possibile dare analoghi esempi.
1 Cioè aventi intersezione vuota.
8

§ 3. Spazi Quozienti.

Ricordiamo brevemente un fatto di insiemistica. Dato un insieme S , le tre nozioni che seguono

• relazioni d’equivalenza su S , • funzioni suriettive S −→ Z • partizioni di S ,


sono sostanzialmente la stessa cosa (di seguito, il simbolo ∪· denota che l’unione è disgiunta):

ad una relazione d’equivalenza ∼ si associa la proiezione π : S → S/ ∼ (S/ ∼ denota l’insieme delle classi d’equivalenza);
ad una funzione suriettiva f : S −→ Z si associa la partizione delle fibre di f (si scrive S = ∪· f −1 (z), z ∈ Z );

ad una partizione S = ∪· Ai si associa la relazione d’equivalenza ∼ definita dalla condizione a ∼ b ⇐⇒ ∃ i | a, b ∈ Ai .



Def. 31. Sia X uno spazio topologico, ∼ una relazione d’equivalenza su X , π : X −→ X/ ∼ la

proiezione naturale. Lo spazio topologico quoziente, denotato con X/ ∼, è l’insieme quoziente dotato

della topologia definita dalle proprietà che segue:


U ⊆ X/ ∼ è aperto ⇐⇒ π −1 (U ) è aperto in X




Nota 31.1. La topologia quoziente coincide con la topologia coindotta dalla proiezione (nozione più generale che verrà

introdotta in seguito).

Esercizio 32.1. Si verifichi che quella introdotta è effettivamente una topologia su X/ ∼ .

Esercizio 32.2. Si verifichi che X/ ∼ è dotato della topologia più fine (:= “più ricca di aperti”) per
la quale la proiezione π è continua.

Notazione 33. Sia A un sottospazio di uno spazio topologico X . Denotiamo con X/A lo spazio

ottenuto identificando tra loro i punti di A:


X/A := X/ ∼ , dove ∼ è la relazione d’equivalenza “p ∼ q ⇐⇒ p = q oppure p, q ∈ A”.

Esercizio 34. Verificare che gli aperti di X/A sono le immagini tramite la proiezione naturale
π : X → X/A degli aperti di X che non incontrano oppure contengono A, cioè verificare che
 
V V ⊆ X/A è aperto = π(B) B ⊆ X è aperto, B ∩ A = ∅ oppure B ⊇ A

Verificare inoltre che se B è un sottoinsieme di X, vale la caratterizzazione che segue:


(
( B ∩ A 6= ∅ e B ∪ A è aperto)
π(B) ⊆ X/A è aperto ⇐⇒ oppure
( B ∩ A = ∅ e B è aperto)

Esercizio 35. Provare che i seguenti spazi topologici sono omeomorfi tra loro

• Cerchio Unitario S 1 := x ∈ R2 ||x|| = 1 ;
• [0, 1]/{0, 1} (dove [0, 1] = {x ∈ R | 0 ≤ x ≤ 1});
• Retta Proiettiva reale P1R := R2 r{o} ∼ (o denota l’origine di R2 e ∼ la relazione di proporzionalità);

• Toro reale T1 := R/Z (quoziente di gruppi: si intende R/ ∼ , dove a ∼ b ⇐⇒ a − b ∈ Z).

Naturalmente, i vari R ed R2 si intendono dotati della topologia naturale, i loro sottoinsiemi della topologia indotta.

Attenzione! Il Toro reale T1 non va confuso col quoziente R/Z nel senso della notazione (33), spazio
che risulta essere omeomorfo ad un bouquet numerabile di cerchi (cfr. definizione 38 seguente).
9

Def. 36. Se {Xi } è una famiglia di spazi topologici, l’unione disgiunta X = ∪· Xi viene dotata

della topologia unione disgiunta, definita dalla proprietà che segue:


U ⊆ X è aperto se e solo se interseca ognuno degli Xi in un aperto di τi


(τi denota la collezione degli aperti di Xi ).

Esercizio 37. Siano {Xi } ed X come nella definizione (36). Si verifichino le proprietà che seguono:
i) quella introdotta è effettivamente una topologia su X ;
ii) gli Xi sono sia aperti che chiusi (come sottoinsiemi di X );
iii) ogni inclusione Xi ֒→ X è un omeomorfismo sull’immagine;
iv) X è dotato della topologia più fine per la quale le inclusioni Xi ֒→ X sono continue.

Esercizio 37.1. Verificare che la proprietà “ii) + iii)” caratterizza la topologia unione disgiunta.


Def. 38. Il bouquet di spazi topologici puntati {(Xi , xi )} è lo spazio topologico

W 
∪· Xi 
i (Xi , xi ) :=
∪ {xi }



(cfr. definizione 36 e notazione 33). Lo spazio introdotto si chiama anche “wedge sum”.



Uno spazio topologico puntato è una coppia “spazio topologico X, punto x ∈ X”. Nei casi in cui la scelta di xi ∈ Xi
è sostanzialmente ininfluente, ad esempio se X = S 1 (per ogni coppia di punti p, q ∈ S 1 esiste un omeomorfismo
i
di S 1 in se che manda il punto p nel punto q), per abuso di notazione il punto non viene indicato affatto (per cui,

ad esempio, S 1 ∨ S 1 è lo spazio ottenuto da due copie disgiunte di S 1 , identificando un punto dell’una con un punto
dell’altra).

Esercizio 38.1. Provare che il bouquet di due cerchi S 1 ∨ S 1 (cfr. sopra) è omeomorfo al sottospazio
di R2 costituito dall’unione di due cerchi che si toccano in un punto.
(∗) W
Esercizio 38.2. Provare che il bouquet di una famiglia numerabile di cerchi X = i∈N S 1 non è
omeomorfo ad alcun sottospazio di Rn .
Suggerimento: Si provi che X non è primo numerabile (cfr. def.;18.3) nel vertice2 del bouquet, mentre gli spazi metrici
sono primo numerabili (cfr. esercizio 24.f).

Esercizio 39. Provare che i seguenti spazi topologici sono omeomorfi tra loro

• Retta Proiettiva complessa P1C := C2 r{o}



(dove o denota l’origine di C2 e ∼ è la relazione di proporzionalità);

• retta complessa ampliata b := C ∪· {∞}


C
(il sostegno del nostro spazio è l’unione disgiunta di C ed un punto, detto punto all’infinito e denotato con “∞”, gli
aperti sono i sottoinsiemi U soddisfacenti le due propretà che seguono:
• U ∩ C è aperto; • se ∞ ∈ U , allora il complementare di U è limitato (come sottoinsieme di C).
b (i.e.
(Quella introdotta è una topologia, lo studente se ne convinca). In particolare, C è un sottospazio aperto di C
b
vale la quanto previsto dalla def. 2 ed inoltre C è aperto in C) ed una base di intorni del punto all’infinito è data
dai complementari in C b dei dischi chiusi in C; queste due proprietà caratterizzano la topologia di C).
b

• Sfera Unitaria S 2 := x ∈ R3 ||x|| = 1 ;

Naturalmente, i vari C, C2 , R3 si intendono dotati della topologia naturale, i loro sottoinsiemi della topologia indotta.

2 Nella notazione della definizione (38), il vertice del bouquet è il punto cui si contrae ∪{xi } .
10

§ 4. Prodotti di spazi topologici.



Sia {Xα }α ∈ S una famiglia di insiemi. Si definisce il prodotto cartesiano ponendo

 S•
x(α) ∈ Xα , ∀ α ∈ S
X = × Xα := funzioni x : S −→ Xα
α∈S

Ci sono delle proiezioni naturali


πα : X −→ Xα

x 7→ xα

( xα denota l’elemento x(α) ∈ Xα ).



Il prodotto di spazi topologici, è il prodotto insiemistico definito sopra dotato della topologia debole:



Def. 41. Sia {Xα }α ∈ S una famiglia di spazi topologici. Il prodotto cartesiano X = × Xα

α∈S
viene dotato della topologia meno fine per la quale le proiezioni πα : X −→ Xα sono continue.



Nota 41.1. Ricordiamo che “meno fine” significa meno ricca di aperti (da qui l’uso dell’aggettivo debole). Dando la

definizione implicitamente stiamo affermando che questa sia ben posta, cioè che esiste (unica) una topologia τ su X
soddisfacente la proprietà che segue: per ogni topologia τ ′ per la quale le proiezioni sono continue, si ha che τ ′ è più

fine di τ . Tutto ciò segue da un principio generale: data una famiglia S di sottoinsiemi di un insieme fissato si può

considerare la topologia generata da S (definita considerando unioni di intersezioni finite di elementi di S), questa sarà
la topologia meno fine contenente S. Tornando alla topologia prodotto, l’esercizio (42) seguente ce la descrive.


Nota 41.2. Quello della topologia prodotto è un esempio di topologia indotta: in generale, dato un insieme X ed una

famiglia di funzioni fα : X → Wα , dove i Wα sono spazi topologici, si può dotare X della topologia meno fine per
la quale le fα sono continue (questa, per definizione, è la topologia indotta dalla famiglia di funzioni data).

Esercizio 42. Sia X come sopra. Verificare che i sottoinsiemi del tipo

(♣) × Uj × × Xα con gli Uj aperti dei corrispondenti Xj
j ∈ J α ∈ SrJ
(finito)

costituiscono una base (cfr. def. 18) per la topologia prodotto.



Siamo interessati al caso del prodotto di due spazi topologici (o comunque a prodotti finiti).



Notazione. Consideriamo il prodotto X× Y di due spazi topologici X e Y . Un sottoinsieme del tipo A× B (A ⊆ X,
B ⊆ Y ) lo chiamiamo rettangolo. Se A e B sono aperti, il rettangolo A×B è aperto (ci si convinca di ciò), per questa

ragione lo chiamiamo rettangolo aperto; se A e B sono chiusi, A×B è chiuso e lo chiamiamo rettangolo chiuso.


Nel caso del prodotto X × Y di due spazi topologici X e Y , i rettangoli aperti costituiscono una

base per la topologia prodotto (ce lo dice l’esercizio 42):


gli aperti del prodotto X × Y sono le unioni di rettangoli aperti.


Nel caso di prodotti finiti X ×...×X di spazi topologici, i prodotti A ×...×A (A ⊆ X ) li chiamiamo plurirettangoli.
1 n 1 n i i
Naturalmente valgono risultati analoghi a quelli concernenti il prodotto di due spazi (e, all’occorrenza, parleremo di

plurirettangoli aperti, ovvero di plurirettangoli chiusi).


Le cose vanno diversamente nel caso di prodotti infiniti: può accadere che un prodotto di aperti non sia un aperto per
la topologia prodotto (cfr. esercizio 43).

(∗)
Esercizio 43. Sia X come nella def. (41). Provare che nel caso di un prodotto “davvero infinito, non banale” (cfr. sotto),
esistono prodotti di sottoinsiemi aperti che non sono aperti per la topologia prodotto. Dedurre che, in particolare, la
topologia generata dai prodotti di aperti non coincide con la topologia prodotto (naturalmente, la prima è sempre più fine
della seconda, pertanto nel caso in questione è strettamente più fine).
(Con la locuzione “davvero infinito, non banale” intendiamo “dove l’insieme degli α per i quali Xα non ha la topologia
banale è un insieme infinito”; n.b. ogni Xα che non ha la topologia banale deve contenere almeno due punti).
11

Esercizio 44. Verificare che la topologia naturale di Rn coincide con la topologia prodotto.

Esercizio 45. Verificare che Rn /Zn (quoziente di gruppi: è lo spazio Rn / ∼ dove a ∼ b se


a − b ∈ Zn , cfr. def. 9) è omeomorfo al prodotto di n copie del toro T 1 (cfr. eserc. 35).

Esercizio 46. Siano X, Y, Z, W spazi topologici, f : X −→ Y , g : Z −→ W funzioni continue.


Provare che se f e g sono aperte (mandano aperti in aperti), allora anche

f × g : X × Z −→ Y × W , (x, z) 7→ f (x), g(z)
è aperta.

Esercizio 47.1. Si considerino le funzioni I : R −→ R, x 7→ x e π : R −→ R, x 7→ 0. Verificare


che nonostante siano entrambe chiuse (convincersene), la funzione prodotto I × π non è chiusa.

Si può dare una variante con “f = g” dell’esempio dell’esercizio precedente:

Esercizio 47.2. Si consideri l’unione disgiunta R1 ∪· R2 di due copie di R (che abbiamo etichettato
al fine di distinguerle). Verificare che la funzione

· f (x) = x , se x ∈ R1
f : R1 ∪ R2 −→ R definita ponendo
f (x) = 0 , se x ∈ R2
è chiusa, ma la funzione prodotto f × f non lo è.
Nota. Naturalmente possiamo sostituire il dominio R1∪· R2 con (1, 2)∪(3, 4) (sottospazio di R, omeomorfo ad R1 ∪· R2 ),
il codominio R con l’intervallo (1, 2) ed infine definire f (x) = x, se x < 2 , f (x) = 3/2, se x > 3.

Modificando un po’ l’esempio della nota si ottiene l’esempio dell’esercizio che segue.

f (x) = x , se x ≤ 1
Esercizio 47.3. Verificare che la funzione f : (0, 2) −→ (0, 1] , è chiusa,
f (x) = 1 , se x ≥ 1
ma la funzione prodotto f × f non lo è.
12

§ 5. Compattezza, Separazione, Connessione.



Def. 51. Uno spazio topologico X si dice compatto se da ogni ricoprimento aperto è possibile

estrarre un sottoricoprimento finito.


Valgono le proprietà seguenti:


(51.1) X è compatto se e solo se da ogni famiglia chiusa avente intersezione vuota3 è possibile estrarre

una sottofamiglia finita avente intersezione vuota;

(51.2) l’immagine continua di un compatto è compatta;


(51.3) un sottoinsieme chiuso di un insieme compatto è compatto;

(51.4) il prodotto X × Y di spazi compatti è compatto.



Nota. La (51.2) ci dice che la (51.4) si inverte (a meno che uno dei due sia vuoto...):

X, Y non vuoti, X × Y compatto =⇒ X, Y compatti (in quanto immagini continue delle proiezioni).


Def. 52. Sia X un insieme, U = {Uα } un ricoprimento. Un raffinamento di U è un


ricoprimento V = {Vβ } soddisfacente la proprietà seguente: ∀ β ∃ α | Vβ ⊆ U α .



Nota. Non si fanno altre ipotesi (a priori, l’insieme dei β può avere cardinalità maggiore, ma anche minore, di
quello degli α). Esempi: il ricoprimento ottenuto considerando più copie di ogni Uα è un raffinamento di U ; ogni

sottoricoprimento di U è, in particolare, un suo raffinamento. L’esercizio (53.1) è un’utile applicazione del concetto di

raffinamento.

Esercizio 53. Provare che uno spazio topologico X è compatto se e solo se ogni ricoprimento aperto
ammette un raffinamento aperto dal quale è possibile estrarre un sottoricoprimento finito.

Esercizio 53.1. Usando il risultato dell’esercizio precedente, si provi la (51.4) secondo la linea indicata:
• modulo raffinamento, ci si riduca ad un ricoprimento U = {Aα × Bα }α ∈ S in rettangoli aperti;
 
• si passi al raffinamento U ′ = A(α, y) × B(α, y) A(α, y) := Aα , B(α, y) := Bα ;
(α, y) ∈ S×Y

• si passi ad un raffinamento V di U ′ dove i rettangoli con etichetta (∗, y) ricoprono X × {y}, sono
in numero finito (qui si usi la compattezza di X) e, per y fissato, hanno tutti la “stessa altezza” (si
intende “medesima proiezione su Y ”);
• si concluda la dimostrazione usando il fatto che le “altezze” ricoprono Y (che è compatto).

Esercizio 54. Sia Y uno spazio topologico, f : [0, 1] −→ Y una funzione (arbitraria). Provare che

f è continua ⇐⇒ il grafico Γf è compatto.


Naturalmente, il grafico Γf := {(t, f (t)}t ∈ [0, 1] ⊆ [0, 1] × Y , si intende dotato della topologia indotta dall’ambiente
[0, 1] × Y , quest’ultimo dotato della topologia prodotto.

Spesso può essere utile, ancorché non necessario, lavorare con ricoprimenti aperti numerabili (o meglio,
parametrizzati da N) e, all’occorrenza, nidificati (dove ogni aperto contiene i precedenti).

Esercizio 55. Sia X uno spazio topologico. Si provi che se X è 2o -numerabile (def. 18.3), allora
da ogni ricoprimento aperto è possibile estrarre un sottoricoprimento numerabile
Si osservi che ad un ricoprimento numerabile U = {Uα }α ∈ N si può associare il ricoprimento V = {Vα }α ∈ N dove i Vα
sono definiti ponendo Vα = U0 ∪ U1 ∪ ... ∪ Uα . Chiaramente V risulta nidificato (ed eredita molte proprietà di U , ad
esempio ammette un sottoricoprimento finito se e solo se ciò accade per U ).

Esercizio 56. Si verifichi che Rn (e, di conseguenza, ogni suo sottospazio) è 2o -numerabile.
3 Diciamo che una famiglia di insiemi ha intersezione vuota se l’intersezione di tutti gli insiemi della famiglia è vuota.
13

Ricordiamo gli assiomi di separazione T1 e T2 (meglio noto come “di Hausdorff ”).



Def. 57. Uno spazio topologico X si dice

• T1 se ∀ p, q ∈ X ∃ intorni Up di p e Uq di q tali che q 6∈ Up e p 6∈ Uq .



• di Hausdorff (o T2) se è possibile separare i punti, i.e.:

∀ p, q ∈ X ∃ intorni Up di p e Uq di q aventi intersezione vuota (i.e. con Up ∩ Uq = ∅).

Notazione. Dati degli insiemi X, Y, Z, W e funzioni f : X −→ Y , g : Z −→ W poniamo



• ∆X := (x, x) ∈ X × X x ∈ X

• ∆f := (x1 , x2 ) ∈ X × X f (x1 ) = f (x2 )
• f × g : X × Z −→ Y × W , (x, z) 7→ (f (x), g(z))

Esercizio 58. Siano X, Y ed f come nella notazione. Si verifichino le relazioni che seguono

a. ∆X = ∆IdX ; ∆f = (f × f )−1 ∆Y ; ∆X ⊆ ∆f ; (f × f ) ∆f ⊆ ∆Y ;
! !
vale “=” ⇐⇒ vale “=” ⇐⇒
f è iniettiva f è suriettiva

b. Dati A , B ⊆ X , A ∩ B = ∅ ⇐⇒ A×B ∩ ∆X = ∅ (i.e. A×B non incontra la diagonale).

Esercizio 59. Sia X uno spazio topologico. Provare le proprietà che seguono:

a. X è T1 ⇐⇒ ogni punto è chiuso;


⇐⇒ ogni sottoinsieme di X è intersezione di aperti;
b. X è di Hausdorff ⇐⇒ la diagonale ∆X è chiusa.

Nei punti che seguono, assumiamo che f : X −→ Y sia una funzione continua.
c. se Y è di Hausdorff =⇒ ∆f è chiuso;
d. se f è suriettiva ed aperta, ∆f è chiuso =⇒ Y è di Hausdorff;
e. se X è compatto e di Hausdorff, f è suriettiva, Y ha la topologia quoziente, allora
Y è di Hausdorff ⇐⇒ ∆f è chiuso ⇐⇒ f è chiusa
(dicendo che Y ha la topologia quoziente intendiamo che l’identificazione insiemistica naturale Y = X/ ∼ è un
omeomorfismo, dove ∼ denota la relazione d’equivalenza associata alla funzione suriettiva f ).


L’implicazione “f chiusa =⇒ Y di Hausdorff ” (nelle ipotesi del punto 59.e), è una proposizione che desideriamo

enunciare separatamente.


Proposizione 60. Sia X uno spazio topologico compatto di Hausdorff, ∼ una relazione d’equivalenza.


Se π : X −→ X/ ∼ è chiusa, allora X/ ∼ è di Hausdorff.

Più avanti vedremo che gli spazi compatti di Hausdorff sono T 4 (cfr. esercizio 68.3), i.e. soddisfano
la proprietà che segue:

(♣) ∀ C1 e C2 chiusi disgiunti, ∃ U1 e U2 aperti disgiunti Ui ⊇ Ci , i = 1, 2 .

Esercizio 60.1. Si dimostri la proposizione (60) utilizzando il risultato (♣) appena enunciato.
14

Def. 61. Uno spazio topologico X si dice connesso se non è unione disgiunta non banale4 di aperti

(equivalentemente, non ha sottoinsiemi sia aperti che chiusi eccetto l’insieme vuoto ed X stesso).



Valgono le proprietà seguenti:

(61.1) X è connesso ⇐⇒ E discreto, f : X −→ E continua =⇒ f è costante ;


(61.2) l’immagine continua di un connesso è connessa;


(61.3) il prodotto X × Y di spazi connessi è connesso


Nota. Analogamente al caso della (51.4), la (61.2) ci dice che la (61.3) si inverte (a meno che uno dei due sia vuoto):

X, Y non vuoti, X × Y connesso =⇒ X, Y connessi (in quanto immagini continue delle proiezioni).


Naturalmente, se S è un sottoinsieme di uno spazio ambiente X , allora S stesso è uno spazio topologico (con la topologia

indotta) ed ha senso parlare di connessione secondo la definizione data. In questo caso è utile avere una caratterizzazione
della connessione in termini degli aperti dell’ambiente. Una tale caratterizzazione ce la fornisce l’esercizio che segue.

Esercizio 62. Sia S un sottospazio di uno spazio ambiente X . Provare che


(
 i) sono disgiunti in S , i.e. U ∩ V ∩ S = ∅
S è connesso ⇐⇒ ∃ U, V aperti di X tali che ii) ricoprono S in modo non banale
(i.e. U ∪ V ⊇ S e nessuno dei due contiene S ).

Esercizio 63.1. Sia X uno spazio topologico, A e B suoi sottospazi. Provare quanto segue
a. se A è connesso, A ⊆ B ⊆ A =⇒ B è connesso;
b. se A è connesso, {Bi } è un ricoprimento aperto disgiunto5 di A =⇒ ∃ i | A ⊆ Bi ;
c. se A e B sono connessi, A ∩ B 6= ∅ =⇒ A ∪ B è connesso;
d. assumendo che A e B siano connessi non vuoti, si ha che
A ∪ B non è connesso ⇐⇒ A∩B = ∅ e A∩B = ∅
(si osservi che l’implicazione “=⇒” è più forte della proprietà c).

Suggerimento (per d, “=⇒”): dire che A e B sono connessi ma A ∪ B non è connesso, equivale a dire che esistono
CA ed CB chiusi in X tali che CA ⊇ A, CB ⊇ B , CA ∩ CB ∩ (A ∪ B) = ∅ (ci si convinca di ciò); a questo punto si
provi che si deve avere A ∩ B ⊆ CA ∩ B = ∅ e, analogamente, anche A ∩ B = ∅ .

Esercizio 63.2. Sia S un sottospazio di uno spazio ambiente X . Provare che



S non è connesso ⇐⇒ ∃ A e B non vuoti S = A ∪ B , A ∩ B = ∅ , A ∩ B = ∅ .


Def. 64. Una componente connessa di uno spazio topologico è un sottospazio connesso massimale6 .

Esercizio 65. Sia X uno spazio topologico. Provare che


a. le componenti connesse di X costituiscono una partizione di X (in particolare, esistono);
b. fissato x ∈ X la componente connessa che lo contiene è l’unione di tutti i connessi contenenti x:
S
Γx = C
C connesso ∋ x

c. le componenti connesse di X sono chiuse;


T 
d. Γx ⊆ Θx := W Γx denota la componente connessa contenente x ;
W sia aperto che chiuso,
contenente il punto x
(n.b.: la famiglia dei W che andiamo a intersecare contiene X).
4 Cioè, dove nessuno degli aperti è X .
5 Cioè, per definizione, dove gli insiemi del ricoprimento sono disgiunti (hanno a due a due intersezione vuota).
6 Cioè non strettamente contenuto in alcun sottospazio connesso dello spazio dato.
15

Notazione (che utilizziamo negli esercizi 66 e 67):


• clopen(X) = “famiglia dei sottospazi di X (spazio topologico) sia aperti che chiusi”
(osserviamo che clopen(X) contiene sempre almeno due elementi, l’insieme vuoto e lo stesso X).

• Q •• = retta razionale con due origini (che denoteremo con o ed o′ )


 
= Q 1 ∪· Q 2 ∼ “ ∼” generata da q ∼ q ′ se q ∈ Q 1 , q ′ ∈ Q 2 , q = q ′ 6= 0
i.e. si considerano due copie disgiunte di Q dotate della topologia indotta da R, quindi si quozienta con la relazione
d’equivalenza che identifica ogni numero q 6= 0 della prima copia col numero q (lo stesso numero) della seconda.

(∗)
Esercizio 66. Sia Q •• la retta razionale con due origini o ed o′ .

• Calcolare Γo (la componente connessa contenente o);


T
• Calcolare Θo := W
o ∈ W ∈ clopen(Q •• )

(∗)
Esercizio 67. Trovare l’errore nel ragionamento che segue:
“sia X uno spazio topologico e p ∈ X un punto. Denotiamo con Γp la componente connessa conte-
nente p e con Θp l’intersezione di tutti i clopen (sottoinsiemi sia aperti che chiusi) contenenti p. Se
A è un clopen contenente p e C è un sottospazio connesso contenente p, allora si deve avere C ⊆ A.
D’altro canto (se A è un clopen contenente p), B è un clopen in A contenente p, se e solo se B è un
clopen in X contenente p. Di conseguenza, per un clopen W contenente p vale la seguente dicotomia:
o W è connesso, ed in questo caso W = Γp , oppure W non è un clopen minimale (se non è connesso
è unione disgiunta non banale di clopen, cfr. def. 14). Questo dimostra che un clopen minimale deve
coincidere con Γp . D’altro canto Θp è contenuto in ogni clopen, quindi si deve avere Γp = Θp .”

...ma chi ha svolto correttamente l’esercizio (66) sa che si può avere Γp 6= Θp !


Def. 68. Uno spazio topologico X si dice


• T3 se è T1 (i punti sono chiusi) e separa i punti dai chiusi, i.e. per ogni punto p e chiuso C non

contenente p, è possibile trovare due aperti disgiunti U e V tali che p ∈ U , C ⊆ V .

• T4 se è T1 (i punti sono chiusi) e separa i chiusi, i.e. per ogni coppia chiusi disgiunti C1 e C2 è

possibile trovare due aperti disgiunti U1 e U2 tali che C1 ⊆ U1 , C2 ⊆ U2 .




Nota 68.1. Si osservi che T 4 =⇒ T 3 , T 3 =⇒ T 2 , T 2 =⇒ T 1 .



Proposizione 68.2. Gli spazi metrici sono T 4 .


Dimostrazione. I punti sono chiusi (esercizio 24.a) ed X separa i chiusi (esercizio 24.g).


Esercizio 68.3. Si provi che gli spazi compatti di Hausdorff sono T 4.


Suggerimento: Si cominci col provare che sono T 3.

Esercizio 68.4. Sia X uno spazio topologico T 4 ed A ⊆ X un sottospazio. Provare che


a. se A è chiuso, lo spazio quoziente X/A è T 4;
b. dati a < b ∈ R (la retta reale R dotata della topologia naturale),

R (a, b) non è T 1 , non separa i chiusi;

R (a, b] non è T 1 , separa i chiusi;

R (a, +∞) non è T 1 , separa i chiusi.
(In particolare, nessuno di essi è T 4 ).
16

Esercizio 69. Sia RSorg la retta reale con la topologia di Sorgenfrey:


una base di RSorg è data dagli intervalli del tipo [a, b) .

• verificare che la topologia di Sorgenfrey è più fine della topologia naturale;


• provare che RSorg è T4 (quindi, per la nota 68.1, anche T3, T2 e T1).

(∗)
Esercizio 70. Si consideri R2Sorg := RSorg × RSorg . Si provi che

a. R2Sorg è T3.

Con i punti successivi si vuole stabilire, tra altre cose, che R2Sorg non è T4. Fissiamo le notazioni:
• r := “retta di equazione x + y = 0”,
• R p = (x, y) := “rettangolo aperto del tipo [x, x + δ) × [y, y + δ) , δ > 0”,
• rraz := { (x, −x) ∈ r | x ∈ Q } , rirr := r r rraz (n.b. rraz e rirr sono disgiunti),
7
• ralg := { (x, −x) ∈ r | x è algebrico } , rirr&alg := rirr ∩ ralg (= ralg r rraz ).

b. R2Sorg induce su r la topologia discreta (in particolare, ogni sottoinsieme di r è chiuso in R2Sorg );

c. un aperto U contenente un sottoinsieme C ⊆ R2Sorg può essere “ricondotto” ad un aperto del tipo
S
(♠) U′ = Rp ,
p∈C

dove “ricondotto” significa “esiste un aperto U del tipo indicato soddisfacente C ⊆ U ′ ⊆ U ”;


d. dati C ⊆ r, po ∈ C ed U ′ come in (♠), il rettangolo R po è l’unico contenente po ;

e. esistono due aperti disgiunti U, V ⊆ R2Sorg tali che U ⊇ rraz , V ⊇ rirr&alg ;

f. dato un qualsiasi insieme numerabile C ⊆ r ,


si ha che esiste U ′ come in (♠) con gli R p a due a due disgiunti;

g. non esistono due aperti disgiunti U, V ⊆ R2Sorg tali che U ⊇ rraz , V ⊇ rirr
(quindi, essendo rraz e rirr chiusi per (b.), R2Sorg non è T4).

Indicazioni: per provare (g.), come suggeriscono (e.) ed (f.), il fatto che rirr non sia numerabile è
cruciale e deve essere usato (suggerisco di ragionare per assurdo e pensare all’insieme dei δRp dell’aperto
contenente rirr ). Comunque, onestamente provare (g.) mi sembra abbastanza difficile ...anche chi non
dovesse riuscire a rispondere resta in corsa per la lode all’esame! Come passo preliminare conviene fare
pratica con le difficoltà che si incontrano, per questa ragione ho inserito la richiesta di provare le già
citate affermazioni (e.) ed (f.). Dunque, passando a queste due affermazioni, si osservi che la (f.) è
molto più forte, ciononostante paradossalmente più facile da provare, della (e.) :
• assumendo di aver già acquisito la (f.), posto C = rraz ∪ rirr&alg = ralg , fissata una collezione di
aperti disgiunti {R p }p ∈ C , è sufficiente definire
S S
U = Rp e V = Rp .
p ∈ rraz p ∈ rirr&alg

La soluzione di tutto l’esercizio si trova nel file dei suggerimenti e soluzioni.

√ √
7 Cioè, esiste un polinomio P a coefficienti interi tale che P (x) = 0 . Ad esempio, ( 2 − 3 7 5) 3/19 è algebrico.
17

§ 6. Varie.

Notazione. Salvo diversamente specificato, i vari R, Rn , C sono dotati della topologia naturale.

Esercizio 81. Sia X un sottospazio di Rn (dotato della topologia naturale). Provare che
a. se X è discreto8 , allora è al più numerabile;
b. se X è infinito, allora ammette sottospazi discreti infiniti (per a, al più numerabili);
c. se X è discreto infinito e limitato, allora non è chiuso;
d. X non è compatto se e solo se ammette sottospazi chiusi discreti infiniti.


Def. 82. Sia X uno spazio topologico, poniamo I = [0, 1] ⊆ R .




Il cono astratto su X è lo spazio quoziente

Ca (X) = X ×I X ×{0} ,



il punto v ∈ Ca (X) corrispondente allo spazio che contraiamo lo chiameremo vertice.




Se X ⊆ Rn , il cono geometrico su X è lo spazio


Cgeom (X) := “luogo in Rn+1 dei segmenti x o , x = ξ(x), x ∈ X ” ,


dove ξ : Rn ֒→ Rn+1 è un’immersione iperpiana ed o ∈ Rn+1 r ξ(Rn ) è un punto fissato.

Esercizio 83. Sia X ⊆ Rn , consideriamo notazioni come nella definizione (82). Provare che

a. la funzione
ω : Ca (X) −−−−→ Cgeom (X)

(x, t) 7→ t x + (1−t) o
è biunivoca (come nella definizione 82, x denota l’immagine di x in Rn+1 );
b. ω è una funzione continua;
c. ω(v) = o , la restrizione ω ′ : Ca (X)r{v} −−→ Cgeom (X)r{o} è un omeomorfismo;
d. se X è compatto, allora ω è un omeomorfismo;
e. se X non è compatto, allora ω non è un omeomorfismo;
(∗) 
f. se X non è compatto, allora Ca (X) non è metrizzabile quindi non è omeomorfo a Cgeom (X) .
Suggerimento (per la domanda f, sicuramente la più difficile): denotiamo con

π : X ×I −−−→ Ca (X) := X ×I X ×{0}
la proiezione naturale. Per definizione di topologia quoziente, gli intorni aperti di v , vertice del cono astratto, corrispon-
dono via π −1 agli aperti, nel prodotto X × I , contenenti X × {0}. Di conseguenza, dire che Ca (X) non è primo
numerabile (def. 18.3) nel vertice v , equivale a dire (convincersene) quanto segue:
 non è possibile trovare una collezione numerabile di aperti in X ×I (che è un sottospazio di Rn+1 ) tale che:

(♣) i) ogni aperto della collezione contiene X ×{0} ;

ii) per ogni aperto U contenente X ×{0} c’è un aperto della collezione contenuto in U .
Si provi (♣) procedendo per assurdo: fissata una collezione come sopra, in particolare numerabile, si scelga un sottoin-
sieme discreto numerabile Z = {pi }i∈N ⊆ X , con Z chiuso in X (l’esistenza di un tale sottoinsieme segue dalla non
compattezza di X , cfr. esercizio 81.d), quindi, guardando come gli aperti della collezione intersecano Z×I , si costruisca
un aperto U contenente X ×{0} ma non contenuto in alcun aperto della collezione (cosa che dà un assurdo).

8 Diciamo che uno spazio è discreto se la sua topologia coincide con la topologia discreta.
18

Inciso 84. Consideriamo il cerchio unitario S 1 := x ∈ R2 ||x|| = 1 . Ad una funzione continua


f : S 1 −→ S 1


si associa un numero, detto grado di f e denotato con deg f che sostanzialmente misura il numero

di volte che il dominio si “avvolge” sul codominio. La teoria dell’omotopia ci dice che il grado soddisfa

le proprietà che seguono:

i) deg n = n , dove n denota, per n ∈ Z, la funzione n(cos θ, sen θ) = (cos nθ, sen nθ) ;


ii) se F : S 1 × I −→ S 1 è continua, allora F⋆ : I −→ Z , t 7→ deg F |S 1 ×{t} è continua


(dove I denota l’intervallo [0, 1], Z è dotato della topologia discreta).


La i) ci dice qual è il grado di alcune funzioni elementari, ad esempio ci dice che l’identità ha grado

uno, mentre la ii) ci dice che “deformando” f il grado non cambia.

Esercizio 85. Utilizzando i due risultati dell’inciso (84) e le indicazioni fornite sotto provare che

a. se f : S 1 −→ S 1 è costante, allora ha grado zero;


b. non esistono funzioni continue F : S 1 × I −→ S 1 tali che
F0 := F |S 1 ×{0} = “costante”, F1 := F |S 1 ×{1} = “Identità”
e, più in generale, non si può avere F0 = “costante” e F1 = n (con n 6= 0);
c. non esistono funzioni continue r : D 2 −→ S 1 tali che r|S 1 = “Identità”
(D 2 denota il disco unitario);
d. (teorema del punto fisso) una funzione continua
f : D 2 −→ D 2
ha almeno un punto fisso;

e. (teorema Fondamentale dell’Algebra)


un polinomio complesso p(z) di grado n ≥ 1 ha almeno una radice.

Indicazioni.
a. Dato q ∈ S 1 si definisca una funzione F : S 1 × I −→ S 1 tale che F |S 1×{0} = o , F |S 1×{1} = q (dove o denota il
punto (1, 0) ∈ S 1 ) e si osservi che, per la i), la prima ha grado zero.
b. Segue immediatamente dalla a e dalla proprietà ii).
c. Se, per assurdo, esistesse una tale funzione r, si potrebbe considerare la composizione
ω r
F : S1 × I ֒→ D2 × I −−→ D2 −−−→ S1 (con o ∈ S 1 punto fissato)
(p, t) 7→ tp + (1− t)o
L’esistenza di F contraddice quanto asserito al punto b.
d. Se per assurdo f non avesse punti fissi sarebbe possibile definire una funzione r come in c: per ogni x ∈ D2 , la
semiretta sx avente origine in f (x) passante per x sarebbe ben definita e intersecherebbe S 1 esattamente in un punto,
la funzione r : D2 −→ S 1 , x 7→ sx ∩ S 1 , sarebbe continua (lo si dimostri) e si avrebbe r|S 1 = “Identità”.
e. Naturalmente possiamo assumere che p sia un polinomio monico, sia p(z) = z n + an−1 xn−1 + ... + a1 z + a0 .
• Come passo preliminare si verifichi che esiste R > 0 tale che
per ||z|| ≥ R, il segmento di estremi z n e p(z) non contiene l’origine 0 ∈ C ;
• si assuma, per assurdo, che p(z) non abbia zeri e si consideri la funzione
π
F : S 1 × [0, R + 1] −−−−−→ C r {0} −−−−−→ S 1

(θ, t) 7→ p(z) (per t ≤ R)

(θ, t) 7→ λz n + (1−λ)p(z) (per t = R+λ, λ ∈ [0, 1])


dove z = t(cos θ + i sen θ) e π(w) := w/||w|| (θ denota un angolo, usiamo lo stesso simbolo per indicare il
ι
corrispondente punto di S 1 , consideriamo w/||w|| come punto di S 1 via l’identificazione C ←→ R2 );
• si verifichi che F è continua e che F |S 1 ×{0} = “costante”, F |S 1 ×{R+1} = n via ι (cfr. qui sopra e inciso 84);
• infine si osservi che l’esistenza di una tale F contraddice quanto asserito al punto b.
versione preliminare
(20 - 12 - 2016)
Suggerimenti per la soluzione degli esercizi proposti

Esercizio 14.2 (Soluzione).


Dato x ∈ X, ci sono solamente tre possibilità, ognuna delle quali esclude le altre,
i) esiste un intorno di x interamente contenuto in W (in particolare, x ∈ W );
ii) esiste un intorno di x interamente contenuto in X rW (in particolare, x ∈ X rW );
iii) ogni intorno di x ha intersezione non vuota sia con W che con X rW .
Infatti, negare la iii) significa dire esiste un intorno di x avente intersezione vuota con W o con XrW , ovvero
interamente contenuto in X rW o in W .
◦ ◦
D’altro canto la i) equivale a dire che x ∈ W e la ii) equivale a dire che x ∈ (X rW ). A questo punto è
sufficiente osservare che negare la i) equivale a dire che x ∈ X rW , mentre negare la ii) equivale a dire che
x ∈ W . Ciò prova le tre uguaglianze in (♣).


Esercizio 15 (Soluzione).

Proviamo l’implicazione “=⇒”: dato un sottoinsieme W ⊆ X si ha


W ⊆ f −1 f (W ) =⇒ W ⊆ f −1 f (W ) =⇒ f (W ) ⊆ f f −1 f (W ) ⊆ f (W )
che è chiuso applicando f vale sempre
perché f è continua

Proviamo l’implicazione “⇐=”: dato un chiuso Z ⊆ Y si ha


 
Z = Z ⊇ f f −1 (Z) ⊇ f f −1 (Z) =⇒ f −1 (Z) ⊇ f −1 f f −1 (Z) ⊇ f −1 (Z)
qui usiamo applicando f −1 vale sempre
l’ipotesi

di conseguenza f −1 (Z) è chiuso e, per l’arbitrarietà del chiuso Z , si ha che f è continua.




Esercizio 16 (Soluzione).
Proviamo “=⇒”. Seguiamo il suggerimento. Fissato W soddisfacente x ∈ W , consideriamo I := Y r f (W ).
Dire, per assurdo, che f (x) 6∈ f (W ) significa dire che f (x) ∈ I . D’altro canto I è aperto in quanto comple-
mentare di un chiuso. Pertanto I è un intorno di f (x). Essendo f continua in x per ipotesi, f −1 (I) è un
intorno di x. Poiché I ed f (W ) hanno intersezione vuota, anche le loro immagini inverse hanno intersezione
vuota, quindi: f −1 (I) ∩ W ⊆ f −1 (I) ∩ f −1 (f (W )) = ∅. Infine, poiché f −1 (I) è un inorno di x avente
intersezione vuota con W , si deve avere x 6∈ W , ma questo contraddice l’ipotesi iniziale.
Proviamo “⇐=”. Seguiamo il suggerimento. Fissato un intorno aperto I di f (x), poniamo W := Xr f −1 (I).
Se per assurdo f −1 (I) non fosse un intorno di x, si avrebbe1 x ∈ W e, per l’ipotesi iniziale, si avrebbe
f (x) ∈ f (W ). Di conseguenza,
 
f (x) ∈ f (W ) = f X r f −1 (I) = f f −1 (Y r I) ⊆ Y rI
Questo è incompatibile col fatto che I sia un intorno di f (x).


Esercizi 17 e 17.1 (Soluzioni e commenti).


Proviamo la i). Risulta X ∈ τ per la 0, ∅ ∈ τ per la 1. Resta da verificare che l’intersezione di due elementi
in τ è anch’essa in τ e che l’unione arbitraria di elementi in τ è in τ , in formule:
( 
ι(A) = A e ι(B) = B =⇒ ι(A ∩ B) = A ∩ B i.e. A, B ∈ τ =⇒ A ∩ B ∈ τ ;
(♣) 
ι(Ai ) = Ai =⇒ ι(∪Ai ) = ∪Ai i.e. Ai ∈ τ =⇒ ∪Ai ∈ τ .

Premesso che C ⊆ D =⇒ ι(C) ⊆ ι(D), infatti ι(C) = ι(C ∩ D) = ι(C) ∩ ι(D) ⊆ ι(D), si ha
(per la 3)

ι(A ∩ B) = ι(A) ∩ ι(B) = A ∩ B , ι(∪Ai ) ⊆ ∪ Ai , ι(∪Ai ) ⊇ ι(Ai ) = Ai , ∀ i


(per la 3) (per la 1) (per la premessa)

1 Se un punto non appartiene alla chiusura del complementare di un insieme, quell’insieme è un intorno di quel punto. Nel nostro
caso W è il complementare di f −1 (I), quindi: se per assurdo x 6∈ W , allora f −1 (I) è un intorno di x.
2

Cio prova (♣) e conclude la dimostrazione della i).


Proviamo la ii). L’interno di un insieme è l’unione degli aperti contenuti in esso, ed è aperto. Da ciò seguono
la 0 (X è aperto), la 1 e la 2. Proviamo la 3: ogni aperto contenuto nell’intesezione A ∩ B è contenuto sia
nell’nterno di A che in quello di B, ciò prova l’inclusione “⊆”; l’inclusione “⊇” segue dal fatto che l’intersezione
dell’interno di A con l’interno di B è un aperto contenuto in A ∩ B (perciò contenuto nell’interno di A ∩ B).
Proviamo la iii). Prima di procedere introduciamo una notazione e facciamo il punto della situazione. Poniamo
• T op(X) := “famiglia di tutte le possibili topologie su X ”;
• I 0, 1, 3 (X) := “famiglia delle funzioni ι : P(X) −→ P(X) soddifacenti le proprietà 0, 1, 3”;
• I 0, 1, 2, 3 (X) := “famiglia delle funzioni ι : P(X) −→ P(X) soddifacenti le proprietà 0, 1, 2, 3”.
La ii) ci dice che l’operatore di interno è una funzione ξ : T op(X) −→ I 0, 1, 2, 3 (X). La i) ci dice come
associare una topologia ad una funzione ι, avendola provata senza aver mai utilizzato la proprietà 2, ci dà una
funzione π : I 0, 1, 3 (X) −→ T op(X). Tutto ciò significa che abbiamo un diagramma
T op(X)


ξy տπ
I 0, 1, 2, 3 (X) ⊆ I 0, 1, 3 (X)

Provare la iii) significa verificare che la restrizione di π a I 0, 1, 2, 3 (X) inverte ξ, in formule:

π ◦ ξ = Id T op(X) e ξ ◦ π|I 0, 1, 2, 3 (X) = Id I 0, 1, 2, 3 (X)

(Id sta per “identità”). Verificare la prima uguaglianza significa provare che, data una topologia, gli insiemi che
coincidono con il proprio interno sono esattamente gli insiemi aperti (cosa che è evidente). Per quel che concerne
la seconda si deve provare che, data ι ∈ I 0, 1, 2, 3 (X) (i.e. come nel testo dell’esercizio), si ha
S
(♠) ι(W ) = A.
A ⊆ W | ι(A) = A

L’inclusione “⊇” segue dalla premessa (cfr. sopra): ι(W ) ⊇ ι(A) = A, ∀ A come in (♠). Per provare l’inclusione
“⊆” finalmente usiamo la proprietà 2 “ι ◦ ι = ι” : posto U := ι(W ), risulta U ⊆ W (per la 1) e ι(U ) = U (per
la 2), ovvero ι(W ) è uno degli insiemi che compaiono nell’unione a destra.

Quanto sopra conclude lo svolgimento dell’esercizio 15.


Ribadiamo di aver provato la i) senza utilizzare la 2 (esercizio 15.1, prima parte). Infine, che la funzione ι
dell’esempio non soddisfi la 2 è già stato osservato nella nota, che soddisfi le proprietà 0, 1, 3 è immediato.

Passiamo ai commenti.
Come visto nella nota, la proprietà 2 non è ridondante (i.e. esistono funzioni ι che soddisfano le proprietà 0, 1, 3 e,
come tali, definiscono una topologia2 , ma non soddisfano la 2). In altri termini, risulta I 0, 1, 2, 3 (X) 6= I 0, 1, 3 (X).
Alla luce del diagramma indicato sopra e di quanto abbiamo già provato, data una tale funzione ι si dovrà avere
ι 6= ι̃ := ξ ◦ π(ι) , π(ι) = π(ι̃) .
Si ha ι 6= ι̃ perché ι non soddisfa la 2 mentre ι̃ la soddisfa (in quanto nell’immagine di ξ) e risulta π(ι) = π(ι̃)
perché π ◦ ξ = Id T op(X) .
L’esempio della nota è un esempio di una tale funzione. Come ci aspettiamo alla luce dell’ultimo passaggio della
dimostrazione vista, si ha S
ι({a, b}) = {a} = 6 A = ∅
A ⊆ {a, b} | ι(A) = A

poiché ι e ι̃ fissano gli stessi insiemi,


 e poiché ι̃ soddisfa l’identità (♠) in quanto in I 0, 1, 2, 3 (X), l’unione a
destra deve coincidere con ι̃({a, b}) .


2 Ricordiamo che per provare la i) non si utilizza la proprietà 2.


3

Esercizi 23 e 23.1 (Soluzioni).

La parte dell’esercizio concernente Rn segue da considerazioni generali che, per questa ragione, vediamo prima.
Se (X, d) è uno spazio metrico e o ∈ X un punto, si ha che Bo, r è aperto (per definizione di topologia associata
alla metrica) e Do, r è chiuso (X rDo, r contiene un intorno di ogni suo punto: se x 6∈ Do, r , i.e. δ = d(x, o) > r,
X r Do, r contiene il disco aperto di centro x e raggio δ − r). Poiché Bo, r ⊆ Do, r si ha che
(♠) ∂ Bo, r ⊆ Do, r r Bo, r = So, r e ∂ Do, r ⊆ Do, r r Bo, r = So, r
Infatti, in generale, per A aperto ⊆ C chiuso, si ha quanto segue:
∂ A := A ∩ X r A = A ∩ (X rA) ⊆ C rA e ∂ C := C ∩ X rC = C ∩ X rC ⊆ C rA.
Le inclusioni in (♠) sono le uniche due inclusioni fra le sei dell’esercizio che valgono per ogni spazio metrico.
Iniziamo con un’osservazione banale:
se d è la metrica discreta, cioè d(x, y) = 1, ∀ x, y ∈ X, allora ∂ Bo, r = ∂ Do, r = ∅, ma So, 1 = X r{o}.
Volendo investigare più a fondo come possono essere fatti ∂ Bo, r e ∂ Do, r osserviamo quanto segue:
 
(⋆) ∂ Bo, r = x ∈ So, r | Ux ∩ Bo, r 6= ∅, ∀ Ux e ∂ Do, r = x ∈ So, r | Ux ∩ (XrDo, r ) 6= ∅, ∀ Ux
(intorno di x) (intorno di x)

Da ciò si evince che sono indipendenti: se pensiamo ad So, r come a un confine, ∂ Bo, r dipende solo da quello
che c’è dentro il confine, mentre ∂ Do, r dipende solo da quello che c’è fuori (in termini formali, vale (⋆) ). Per
esempio, se fissiamo H, K ⊆ A ⊆ So, 1 ⊆ R2 (con H e K chiusi in A), quindi definiamo

X = {o} ∪ A ∪ x ∈ R2 λx ∈ H per qualche λ ≥ 1 oppure µx ∈ K per qualche µ ≤ 1
(o = origine di R2 ), abbiamo So, 1 = A, ∂ Bo, 1 = H e ∂ Do, 1 = K . Questo perché i punti di H (ovvero i
punti di K ) sono esattamente i punti della descrizione (⋆) di ∂ Bo, r (ovvero quella di ∂ Do, r ).

H
X1 X := {o} ∪ A ∪ X1 ∪ X2
K X2
o
So, 1 = A , ∂ Bo, 1 = H , ∂ Do, 1 = K

(n.b.: l’ambiente è X, sono tutte uguaglianze in X).

Chiaramente, dalla descrizione (⋆) seguono anche le uguaglianze concernenti il caso X = Rn .




Nota. Nell’esempio descritto, se H non fossse chiuso in A, si avrebbe ∂ Bo, 1 = H (A può essere non-chiuso
in R2 , comuqnue è chiuso in X, il nostro ambiente, per cui le chiusure di H in A ed in X coincidono).

Esercizio 24 (Soluzione).
1
Posto r = q), i dischi aperti3 Up := Bp, r e Uq := Bq, r hanno intersezione vuota. Ciò prova b e, a
2 d(p,
maggior ragione, prova a (per p fissato, ogni punto q è interno a X r{p}).
Fissato A ⊆ X ed un punto p ∈ X , si ha che p è interno ad X r A se e solo se esiste un disco aperto
Bp, r (dove r > 0) interamente contenuto in X rA, ovvero se e solo se dist(A, p) ≥ r > 0. Cio prova la d e,
in particolare, prova anche la c.
Quanto alla e, l’iperbole xy −1 = 0 e l’asse y = 0 sono chiusi ed hanno distanza nulla.
Ai fini della f, dato x ∈ X, è sufficiente considerare i dischi aperti Bx, r con r ∈ Q (r > 0).
Proviamo la g (seguiamo il suggerimento). La i) è ovvia. Se x ∈ C , allora dist{x, C} = 0 e dist{x, D} > 0
(punto c), quindi x ∈ UC (analogamente, se x ∈ D, allora x ∈ UD ); ciò prova la ii). Se x ∈ UD , i.e.
c := dist{x, C} > d := dist{x, D}, allora il disco aperto centrato in x e raggio 21 (c − d) è interamente
contenuto in UD , di conseguenza UD è aperto (analogamente, anche UC è aperto). 

3 La notazione usata è quella introdotta all’inizio del paragrafo.


4

Esercizio 25 (Soluzione).
f >g
Dato x ∈ L , scelto y0 soddisfacente la condizione f (x) > y0 > g(x), si ha che g −1 (−∞, y0 ) ∩ f −1 (y0 , +∞)
f >g
è un intorno aperto di x contenuto in L . Di conseguenza questo luogo è aperto.
f≥g g>f f >g
Il luogo L è chiuso (in quanto complementare del luogo L , che è aperto), poiché contiene L , ne
contiene anche la chiusura.
Per dare il controesempio richiesto basta prendere f = g (o due qualsiasi funzioni che coincidono in un insieme
contenente un aperto non vuoto).


Esercizio 26 (Soluzione).
Se f (x) 6= g(x), i dischi aperti Bf (x), r e Bg(x), r sono loro intorni disgiunti per r = 21 d(f (x), g(x)). Le funzioni
 
f e g assumono valori distinti nell’intersezione f −1 Bf (x), r ∩ g −1 Bg(x), r . Questo è un intorno aperto x e,
f 6= g f =g
di conseguenza, il luogo L è un insieme aperto ed il suo complementare L è chiuso.


Esercizio 27 (Soluzione).
Se dotiamo Y della topologia banale, ogni funzione che ha Y come codominio è continua. Avendo effettuato
una tale scelta (con Y contenente almeno due punti) possiamo ottenere qualsiasi cosa: possiamo prendere un
f =g
qualsiasi spazio X ed un qualsiasi sottoinsieme A ⊆ X e fare in modo che risulti L = A.
Si, è possibile esibire gli esempi richiesti con Y avente punti chiusi, ma è più complicato. A tale fine, si può
••
prendere X = R (con la topologia naturale) ed Y = R “la retta con due origini” (introdotta più avanti nelle
•, • f =g
note). Per le due inclusioni naturali R ֒→ R si ha L = R r {0} (che è aperto ma non è chiuso), a
f =g
questo punto per dare un esempio dove L non è né aperto né chiuso la strada è in discesa: basterà modificare
un poco una delle due inclusioni, ad esempio, sostituendola con la funzione x2 nella semiretta x ≥ 1 si avrà
f =g
L = (−∞, 0) ∪ (0, 1].


Esercizio 34 (Soluzione).
Il sottoinsieme A viene contratto ad un punto. Quindi, se B ∩ A = ∅ si ha π −1 π(B) = B, se ciò non accade
si ha π −1 π(B) = A ∪ B. Questa considerazione implica le affermazioni dell’esercizio.


Esercizio 35 (Suggerimento).
Gli insiemi indicati nel testo dell’esercizio sono in corrispondenza biunivoca:
[0, 1]/{0, 1} ←−−→ R/Z −−−→ S1 ←−−→ P1R := R2 r{o}
 ∼
t 7→ cos(2πt), sin(2πt)
(la prima e la terza funzione sono quelle ovvie: ad un punto associano la sua classe di equivalenza). A questo
punto è sufficiente osservare che tramite queste funzioni gli aperti dei vari spazi si corrispondono.


Esercizio 37.1 (Soluzione).


Già sappiamo che la topologia “unione disgiunta” soddisfa le proprietà ii) e iii) (esercizio 37).
Assumiamo che valgano le proprietà ii) e iii) e proviamo che U è aperto in X se e solo se interseca ogni Xi
in un aperto per τi . Se U è aperto in X, interseca ogni Xi in un aperto per τi (in quanto omeomorfismo
sull’immagine, l’inclusione Xi ⊆ X è, in particolare, continua); viceversa, se U interseca ogni Xi in un aperto
per τi , allora U ∩ Xi è aperto in X per le proprietà ii) e iii) (cfr. esercizio 4.a), pertanto U è aperto in X
in quanto unione di aperti.

Nota. Naturalmente, la ii) e la iii) prese singolarmente non caratterizzano l’unione disgiunta: per una famiglia
banale {X1 } (un solo spazio), si ha X = X1 (insiemisticamente), affinché valga la ii) ma non la iii) basta
poter dotare X ed X1 di due topologie differenti (i.e. che X1 non sia un singoletto); d’altro canto, qualsiasi
spazio che non abbia la topologia discreta, come unione disgiunta dei suoi punti, soddisfa la iii) ma non la ii).
5

Esercizio 39 (Soluzione).
Proviamo che P1C ∼ b Consideriamo la proiezione naturale π e la funzione ϕ come nel diagramma indicato
= C.
π  
C2 r {o} −−−−→ P1C ∋ xy


ϕy ↓
b
C ∋ x/y (∞ se y = 0)
x
 2
 x
dove y ∈ C r{o} e y ne denota la classe d’equivalenza in P1C . La funzione ϕ è biunivoca:
   
la sua inversa è la funzione che manda t in 1t , ovvero in 10 se t = ∞.
In quanto funzione biunivoca, provare che è un omeomorfismo significa provare che fa corrispondere gli aperti
dei due spazi P1C e C b . D’altro canto, per definizione di spazio quoziente, un sottoinsieme A ⊆ P1 è aperto
C
se e solo se la sua immagine inversa π −1 (A) ∈ C2 r{o} è aperta. Pertanto, provare che ϕ è un omeomorfismo
equivale a provare quanto segue:
(♣) b
U ⊆C è aperto se e solo se la sua immagine inversa (ϕ ◦ π)−1 (U ) ∈ C2 r{o} è aperta.
Poniamo M := C2 r{o} e V := (ϕ ◦ π)−1 (U ). Ci sono due possibilità:
 x
i) ∞ 6∈ U (i.e. U ⊆ C), in questo caso V = y 6= 0, x/y ∈ U ;
y ∈ M
 x  
ii) ∞ ∈ U , in questo caso V = y 6= 0, x/y ∈ U ∩ C ∪ t ∈ M t 6= 0 .
y ∈ M 0

In ogni caso, V è un cono4 privato del vertice o (ricordiamo che siamo in M ) ed interseca il piano di equazione
y = 1 (che via C × {1} ∼ = C identifichiamo con C) in U ∩ C. Pertanto, denotando con M0 l’aperto {y 6= 0},
abbiamo quanto segue
V0 := V ∩ M0 è il cono (sempre privato del vertice o) su U ′ ×{1} , dove U ′ denota U ∩ C .
Di conseguenza,
(1) U ∩ C è aperto se e solo se V0 è aperto.
Ciò prova (♣) nel caso i) e, relativamente al caso ii), riduce il problema ad una questione locale nel punto
 sarà sufficiente provare che U è un intorno di ∞ se e solo se V è un
all’inifinito, precisamente ci dice che
intorno dei punti di M del tipo 0t , t 6= 0. (Questo perché un insieme è aperto se e solo se è un intorno di ogni
suo punto e, alla luce dell’osservazione (1), già sappiamo che U è un intorno di tutti i suoi punti in C se e solo
se V è un intorno di tutti i suoi punti in M0 ).
b
Vista com’è definita
 la topologia di C, dire che U è un intorno di ∞ equivale a dire che contiene l’insieme

I∞, r := {∞} ∪ t ∈ C |t| > r (per un qualche valore r > 0). D’altro canto, per r > 0,
 x
(ϕ ◦ π)−1 (I∞, r ) = x > 0, | y | < 1
y x r

Poiché questo è il cono sul disco {1} × {y | |y| < 1/r} e V è un intorno dei punti di M del tipo 0t , t 6= 0,
se e solo se contiene un tale cono, abbiamo concluso.
Un omeomorfismo C b ∼= S 2 è dato dalla proiezione stereografica: si fissa un punto N ∈ S 2 ed un piano H ⊆ R3
(con H 6∋ N ), quindi si definisce φ : S 2 −→ H b ∼
=C b (H b definito via H ∼ = R2 ∼
= C) come proiezione su H sui
punti in S 2 r{N } e ponendo φ(N ) = ∞. La proiezione in questione è un omeomorfismo, che lo sia anche φ
segue dal fatto che gli intorni di N corrispondo a sottoinsiemi di H ∼ = C avente complementare limitato.


Esercizio 42 (Soluzione).
T
L’insieme descritto in (♣) è l’intersezione πj−1 (Uj ) . Tenendo presente che J è finito, le intersezioni di
j∈J
questo tipo costituiscono una base per la topologia prodotto, cfr. nota (41.1).

Esercizio 43 (Soluzione).
Gli elementi non vuoti in (♣) suriettano su Xα quasi per ogni5 indice α, questa proprietà continua a valere
per le loro unioni, quindi per ogni aperto non vuoto della topologia prodotto. Di conseguenza, un prodotto di
aperti (non vuoti) che non soddisfi tale proprietà non è aperto per la topologia prodotto. Infine, esiste almeno
un tale prodotto di aperti esattamente quando ci sono infiniti Xα con la topologia non banale. 
4 Se contiene un punto contiene tutti i suoi multipli.
5 Dicendo “quasi per ogni” intendiamo “per ogni, eccetto che per una quantità finita di”.
6

Esercizi 44 e 45 (Soluzioni).
Che la topologia naturale di Rn coincida con la topologia prodotto segue dal fatto elementare che ogni disco
n
aperto è unione di plurirettangoli aperti e viceversa. I due spazi Rn /Zn e (T 1 ) = (R/Z)n si identificano in
modo naturale come insiemi, pertanto il fatto che siano o meno omeomorfi è una questione di topologia locale,
d’altro canto che siano localmente omeomorfi (via l’identificazione) segue dal risultato già acquisito (44).


Esercizi 47.1, 47.2 e 47.3 (Soluzioni).


Esercizio (47.1): il luogo {x · y = 1} (che è chiuso) ha come immagine tramite I × π l’asse delle ascisse privato
dell’origine (che invece non è chiuso).
Esercizio (47.2): il dominio di f × f è l’unione disgiunta dei quattro quadranti R1 ×R1 , R1 ×R2 , R2 ×R1 , R2 ×R2 ,
la restrizione di f × f sul secondo quadrante è la funzione I × π dell’esercizio (47.1), che non è chiusa.
Esercizio (47.3): il luogo dove la retta passante per i punti (1, 2) e (2, 1/2) interseca il dominio (0, 2) × (0, 2)
di f × f , ha come immagine {1} × (1/2, 1] (che non è chiuso nel codominio di f × f ).


Esercizi 53 e 53.1 (Soluzioni e commenti).


Esercizio (53): se U è un ricoprimento aperto e V un raffinamento aperto avente un sottoricoprimento V ′
finito, sarà sufficiente considerare un aperto di U contenente V ′ , ∀ V ′ ∈ V ′ ; il “solo se” è evidente (U è un
raffinamento di se stesso).
Quello che mi preme sottolineare è che l’esercizio mi sta dicendo che per quanto concerne le questioni di compat-
tezza, dato un ricoprimento aperto, posso ridurmi a lavorare con un suo raffinamento.
Esercizio (53.1): i punti indicati dimostrano la tesi. Quanto al terzo di essi, per y fissato, estratto un ricoprimento
T 
finito ∪ Ui di X × {y} dai rettangoli con etichetta (∗, y), basterà sostituire ogni Ui con Ui ∩ πY−1 πY (Ui )
(questa intersezione è finita perché l’indice i varia in un insieme finito).


Esercizio 54 (Suggerimenti).
Innanzi tutto si consideri il diagramma
γ i
[0, 1] −−−−→ Γf ֒→ [0, 1] × Y
t 7→ (t, f (t))
π[0, 1] πY
ւ ց

[0, 1] Y
e si verifichi che f è continua ⇐⇒ γ è continua. (Per l’implicazione “⇐=” si osservi che f = πY ◦ i ◦ γ ).
Da quanto sopra si deduca che se f è continua, allora Γf è compatto (si usi la 51.2).
• Per provare che “ Γf compatto =⇒ f continua” si può procedere in diversi modi:
I metodo. Si proceda per assurdo: se f non è continua, esiste un chiuso Z ⊆ Y la cui preimmagine non è chiusa,
quindi non compatta (in [0, 1] i compatti coincidono con i chiusi). Sia U = {Uα } un ricoprimento aperto di
f −1 (Z) dal quale non è possibile estrarre un sottoricoprimento finito. A questo punto sarà sufficiente verificare
che, posto A = Y r Z ,
{ [0, 1] × A , Uα × Y }
è un ricoprimento aperto di Γf dal quale non è possibile estrarre un sottoricoprimento finito. (l’insieme [0, 1]×A
non intercetta nessun punto del tipo (t, f (t)) con t ∈ f −1 (Z), per cui volendo ricoprire Γf siamo costretti, in
particolare, a prendere una sottocollezione degli Uα × Y in modo che la corrispondente sottocollezione degli Uα
ricopra f −1 (Z)).
II metodo. Sempre per assurdo, devono esistere τ ∈ [0, 1] e W ⊆ [0, 1] tali che τ ∈ W , f (τ ) 6∈ f (W )
(esercizio 8). A questo punto si consideri la famiglia

[0, 1] × f (W ), [τ − n1 , τ + n1 ] × Y n ≥ 1
e si verifichi che questa è una famiglia chiusa avente intersezione vuota in Γf (i.e. l’intersezione con Γf degli
insiemi della famiglia è vuota).
III metodo. La composizione ω := π[0, 1] ◦ i è continua (sempre! ...convincersene). Se Γf è compatto, allora ω
è anche chiusa (per la 51.2 e 51.3). D’altro canto ω è biunivoca, quindi è un omeomorfismo. A questo punto è
sufficiente osservare che l’inversa di ω è la funzione γ (la cui continuità equivale alla continuità di f ). 
7

Esercizio 55 (Soluzione).
Sia B = {Bi }i∈N una base numerabile della topologia di X ed U = {Uα }α∈A un ricoprimento aperto. Le
coppie (Bi , Uα ) soddisfacenti Bi ⊆ Uα definiscono una corrispondenza Γ ⊆ N × A. Prendendo, per ogni i
nell’immagine della proiezione Γ −→ N, un Uα (uno solo) corrispondente, si ottiene una sottofamiglia numer-
abile di U che ricoprire X perché per ogni punto x ∈ X esistono due indici i ed α tali che x ∈ Bi ⊆ Uα .


Esercizio 56 (Soluzione).
La famiglia dei cerchi di centro razionale (= avente coordinate razionali) e raggio razionale è una base per la
topologia naturale di Rn .


Esercizio 59 (Suggerimenti).

a. dopo aver provato il primo “⇐⇒” (che è facile), nell’ipotesi che X sia T1, dato A ⊆ X si consideri
l’intersezione degli aperti del tipo X r {q}, q 6∈ A ;
b. si usi l’esercizio (58.b) ed il fatto che la topologia prodotto è generata dai prodotti di aperti;

Quanto ai punti c, d ed e, innanzi tutto si provi che


se f è continua =⇒ f × f : X × X −→ Y × Y è continua.

c. si usi l’uguaglianza ∆f = (f × f )−1 ∆Y (cfr. esercizio 58.a);


d. • usando l’esercizio (58) e la suriettività di f , si verifichi che f × f (X × X r ∆f ) = Y × Y r ∆Y ,
• a questo punto si usi il fatto6 che “f aperta =⇒ f × f è aperta” (e la b per lo spazio Y );
e. nelle ipotesi assegnate, si provino le implicazioni seguenti (si noti che il cerchio si chiude):
Y è di Hausdorff =⇒ ∆f è chiuso =⇒ f è chiusa =⇒ Y è di Hausdorff
(1) (2) (3)

La (1) è stata già provata: è un caso particolare del punto c. La (3) è la proposizione (60) e verrà provata
più avanti, cfr. soluzione dell’esercizio (60.1).
Proviamo la (2). Si vuole provare che dato C chiuso in X, anche f (C) è chiuso. Poiché Y ha la topologia
quoziente, un suo sottoinsieme è chiuso se e solo se lo è la sua immagine inversa. Pertanto il nostro problema
è quello di provare che f −1 f (C) è chiuso. Si verifica facilmente che risulta

f −1 f (C) = π2 ∆f ∩ (C × X)
(dove π2 : X × X −→ X denota la proiezione sul secondo fattore). Poniamo K := ∆f ∩ (C × X).
Si ha che K è chiuso in quanto intersezione di due chiusi. D’altro canto X × X compatto (perché X è
compatto, cfr. 51.4). A questo punto possiamo concludere:
K chiuso =⇒ K compatto =⇒ π2 (K) compatto =⇒ π2 (K) chiuso
segue dalla (51.3) segue dalla (51.2)

(l’ultima implicazione segue dal fatto che un compatto in uno spazio di Hausdorff è chiuso).


Esercizio 60.1 (Soluzione).


Poniamo Y = X/ ∼ . I punti di X sono chiusi, essendo π chiusa lo sono anche le loro immagini, quindi Y è
T 1. Dati due punti distinti y1 , y2 ∈ Y , siano F1 = π −1 (y1 ) e F2 = π −1 (y2 ) le corrispondenti fibre. Queste
sono chiuse perché immagini inverse di chiusi (come abbiamo appena visto Y è T 1). Per la proprietà (♣)
(che assumiamo essere vera, verrà dimostrata più avanti, cfr. soluzione dell’esercizio 68.3), esistono due aperti
disgiunti U1 ⊇ F1 e U2 ⊇ F2 . A questo punto basterà considerare
 
V1 := Y r π X r U1 e V2 := Y r π X r U2
Questi sono aperti perché X r Ui è chiuso e π è chiusa, i = 1, 2. Inoltre, essendo U1 e U2 disgiunti, si ha
che X r U1 e X r U2 ricoprono X e, di conseguenza, essendo π suriettiva le loro immagini π(X r U1 ) e
π(X r U2 ) ricoprono Y , da ciò segue V1 e V2 sono disgiunti.
Infine, poiché Ui contiene tutta la fibra Fi = π −1 (pi ), si ha che Vi ∋ pi , i = 1, 2. In formule:
Ui ⊇ Fi = π −1 (pi ) =⇒ pi 6∈ π(X r Ui ) =⇒ pi ∈ Y r π(X r Ui ) = Vi .

6 Attenzione ! f chiusa non implica f × f chiusa. Gli esercizi (23.3) e (23.4) forniscono dei controesempi.
8

Esercizi 62, 63.1, 63.2 (Soluzioni).


Esercizio (62): c’è poco da dire, nello scrivere la caratterizzazione indicata nel testo ci siamo limitati a ripetere
la definizione di connessione tenendo presente che gli aperti di S sono le intersezioni degli aperti di X con S .

Esercizio (63.1, a): Nell’ambiente B, se B = U ∪ V con U e V sia aperti che chiusi, essendo A connesso, si
B B
ha che uno dei due, diciamo U , contiene A. Quindi U = U ⊇ A = B e, di conseguenza, B è connesso.
Esercizio (63.1, b): i Bi , in quanto aperti disgiunti, sono sia aperti che chiusi in ∪Bi , quindi lo sono anche in A
(che è contenuto in tale unione). Essendo A connesso, nell’ambiente A, per ogni i si deve avere Bi = ∅ oppure
Bi = A. Da ciò segue la tesi in quanto i Bi ricoprono A.

Esercizio (63.1, c e “d, =⇒”): se S := A ∪ B non è connesso, possiamo scrivere S = U ∪ V con U e V sia
aperti che chiusi nell’ambiente S . Essendo A e B connessi, si deve avere U = A e V = B (o viceversa). Ne
segue che A e B sono disgiunti (la proprietà c). D’altro canto

A chiuso in A ∪ B , A ∩ B = ∅ =⇒ A ∩ B = ∅ A := “chiusura di A in X ” .
Analogamente si deve avere A ∩ B = ∅.
Esercizio (63.1, “d, ⇐=” e 63.2, “⇐=”): Dire A ∩ B = ∅ e A ∩ B = ∅ significa dire che A e B sono disgiunti
ed entrambi chiusi in A ∪ B (=⇒ entrambi aperti, sempre in A ∪ B). Essendo A e B non vuoti seguono le tesi.

Esercizio (63.2, “=⇒”): Essendo S non connesso, possiamo scrivere S = U ∪ V con U e V aperti e chiusi
in S , entrambi non vuoti. Gli insiemi A = U e B = V (chiusure in X ) soddisfano le richieste della tesi.


Esercizio 65 (Soluzione).
Per l’esercizio (63.1, c), le componenti connesse, in quanto connessi massimali, sono disgiunte. La (63.1, c) vale
anche per unioni arbitrarie ∪ i Ci di sottospazi connessi aventi un punto p in comunue (nella dimostrazione data
sopra, l’aperto U contenente p deve contenere Ci per ogni Ci dell’unione), di conseguenza Γx è connesso.
D’altro canto Γx è massimale per ragioni tautologiche: un connesso che lo contenesse conterrebbe anche x e
sarebbe un membro dell’unione indicata. Questo prova sia l’affermazione b che la a (per l’arbitrarietà di x). La
c segue direttamente dalla (63.1, a). Proviamo la d: se W è sia aperto che chiuso e x ∈ W , allora W ∩ Γx è
non-vuoto, sia aperto che chiuso in Γx . Essendo Γx connesso si deve avere W ∩ Γx = Γx , i.e. Γx ⊆ W .


Esercizio 66 (Soluzione).
L’unico connesso contenente il punto o è l’insieme {o} , quindi Γo = {o}.
Iniziamo con un’osservazione preliminare riguardante la topologia dei razionali: si ha (a, b) ∩ Q = [a, b] ∩ Q, per
a e b non razionali (naturalmente, analoghe considerazioni valgono per il nostro spazio Q •• ).
In Q •• , ogni clopen contenente il punto o deve, in particolare, contenere un intorno di o e la sua chiusura, quindi
deve contenere un intervallo del tipo (−ǫ, ǫ), ǫ > 0, intervallo dei razionali compresi tra −ǫ ed ǫ comprensivo
di entrambe le origini o ed o′ (che nella chiusura di ogni intorno di o vi sia anche o′ è un fatto cruciale!).
D’altro
√ canto, per l’osservazione preliminare, gli intervalli di tale tipo sono clopen per ǫ non razionale (e.g. del

tipo 2/n, n intero positivo). Pertanto, intersecando tutti i clopen contenenti o si ottiene Θo = {o, o }.


Esercizio 67 (Soluzione).
È tutto corretto, eccetto la conclusione! Si può concludere che vale l’uguaglianza Γp = Θp a condizione che
esista davvero un clopen minimale contenente p. Nel caso dell’esempio Q •• (esercizio 34), per p = o un tale
clopen minimale non esiste affatto (a dirla tutta non esistono clopen minimali contenenti p per alcun p ∈ Q •• ,
però se p non è una delle due origini si ha comunque Γp = Θp = {p}).


Esercizio 69 (Soluzione).
S
La prima affermazione è immediata: (a, b) = [x, b) .
x ∈ (a, b)
S S
Proviamo la seconda. Dati due chiusi disgiunti C e K , consideriamo U = [c, c′ ), V = [k, k ′ ) dove
c∈C k∈K
ogni [c, c′ ) è un aperto di Sorgenfrey che non interseca K ed ogni [k, k ′ ) è un aperto di Sorgenfrey che non
interseca C . Gli aperti U e V risultano automaticamente disgiunti: se si avesse [c, c′ ) ∩ [k, k ′ ) 6= ∅, allora
[c, c′ ) intersecherebbe K (nel caso c < k), oppure [k, k ′ ) intersecherebbe C (nel caso k < c). 
9

Esercizio 70 (Soluzione).
Dati un punto p = (x, y) ed un chiuso C ⊆ R2Sorg , con p 6∈ C , esiste un aperto del tipo [x, x+2δ)×[y, y+2δ) che
non interseca C . A questo punto basta considerare U = [x, x+δ)×[y, y +δ) e V = R2Sorgr[x, x+δ]×[y, y +δ]
(sono aperti disgiunti, il primo contiene il punto p, il secondo il chiuso C ). Ciò prova l’affermazione (a.).
Le affermazioni (b.), (c.) e (d.) sono osservazioni evidenti.
Proviamo la (f.) (che, come stabilito nelle indicazioni che seguono il testo dell’esercizio, implica la (e.)). Si
fissi una numerazione dei punti di C , per il primo punto p1 si prenda un qualsiasi Rp1 , quindi si proceda
induttivamente prendendo un Rpn disgiunto dai precedenti (che sono in numero finito).
Chiaramente, l’argomento precedente non funziona con un insieme C non numerabile! ...dunque possiamo ancora
sperare di riuscire a provare la (g.).
Proviamo la (g.). Iniziamo con una premessa: vista la (c.), ricordando che r ha equazione x+y = 0, è sufficiente
provare che non esiste una collezione di retangoli R p = (x, −x) = [x, x + δ) × [−x, −x + δ) (con δ che dipende
da p) tali che
S S
(⋆) U ∩ V = ∅ , dove U := R p e V := Rp .
p ∈ rraz p ∈ rirr

Ribadiamo un aspetto, per quanto questa affermazione possa sembrare intuitivamente evidente, se si sostituisce

r
irr con rirr&alg , non solo risulta falsa, ma vale un risultato molto più forte (l’affermazione f) che va
esattamente nella direzione opposta!

Possiamo tradurre il nostro problema in un problema concernente la retta reale R:



(♣) ∄ δ : R −→ R+ , x 7→ δ(x) min{δ(x), δ(z)} ≤ |x − z| , ∀ x ∈ Q , z ∈ R r Q .

L’affermazione (♣) è equivalente alla (g.). Ciò segue dal fatto che due rettangoli R p = [x, x + α) × [−x, −x + α)
ed R q = [z, z + β) × [−z, −z + β) hanno intersezione vuota se e solo se min{α, β} ≤ |x − z| .

Non c’è una ragione “matematica” che mi ha spinto a scrivere la traduzione (♣) della (g.), ma il bisogno di

alleggerire la notazione. L’insieme R in (♣) corrisponde ad r tramite la funzione x 7→ (x, −x) ∈ r ⊆ R2 .
Sorg

Per provare (♣) ragioniamo per assurdo, assumiamo che esista una tale funzione δ. A questo punto
scegliamo x0 ∈ Q,

scegliamo z1 ∈ x0 , x0 + 21 δ(x0 ) ∩ (R r Q) (automaticamente, si avrà δ(z1 ) ≤ z1 − x0 < 12 δ(x0 )),

scegliamo x2 ∈ z1 − 12 δ(z1 ), z1 ) ∩ Q (si avrà δ(x2 ) ≤ z1 − x2 < 12 δ(z1 )),
1

scegliamo z3 ∈ x2 , x2 + 2 δ(x2 ) ∩ (R r Q) (si avrà δ(z3 ) ≤ z3 − x2 < 21 δ(x2 )),

scegliamo x4 ∈ z3 − 12 δ(z3 ), z3 ) ∩ Q (si avrà δ(x4 ) ≤ z3 − x4 < 12 δ(z3 )),
...

In termini del vecchio problema (g.), al passo n + 1 si prende un punto p
n+1 nella proiezione ortogonale su r
del rettangolo Rp relativo al punto p scelto al passo precedente, si effettuano le scelte alternando punti in
n n
Q e punti in R r Q, questo affinché ogni rettangolo R non possa intersecare il precedente (cfr. ⋆), inoltre
p
al passo n + 1 si sceglie p
n+1 a destra di pn per n pari (ovvero a sinistra, per n dispari).

Gli xi crescono (i pari) ed i zj decrescono (j dispari), ad ogni passo la distanza che separa un punto dal
successivo si dimezza (almeno). Per questa ragione la successione dei punti scelti deve convergere ad un punto ω.

x0 Rz1 è “interamente sotto” Rx0


Rx1 è “interamente a sinistra” di Rz1
Rz2 è “interamente sotto” Rx1
...
Il rettangolo Rω (non disegnato), se ω non è razionale
x1 non può intersecare i rettangoli con vertice negli xi ,
ω• se ω è razionale non può intersecare i rettangoli con
z2
vertice negli zi . Pertanto non può intersecare né i
1
primi né i secondi. Questo è assurdo perché come
d(z1 , x1 ) < 2 d(x0 , z1 ) z1
proviamo sotto li interseca entrambi (per i >> 0).

A questo punto siamo pronti a concludere: il punto ω non può appartenere né a Q né ad RrQ. Infatti, se ω
10

fosse razionale, per i sufficientemente alto si avrebbe δ(zi ) < δ(ω) e, di conseguenza, l’assurdo
1
δ(zi ) = min{δ(zi ), δ(ω)} ≤ zi − ω < zi − xi+1 < 2 δ(zi ) .
1
Analogamente, se ω ∈ RrQ , allora δ(xi ) = min{δ(xi ), δ(ω)} ≤ ω − xi < zi+1 − xi < 2 δ(xi ) (sempre
per i sufficientemente alto, precisamente che soddisfi δ(xi ) < δ(ω)).


Nota. Questa dimostrazione nasconde un po’ la questione cruciale della cardinalità (che in realtà viene usata
nella completezza di R). Gli insiemi Mξ := { p ∈ RrQ | δ(p) > ξ} non possono avere punti di accumulazione
in Q: se q ∈ Q fosse di accumulazione per Mξ , ci sarebbero degli Rp (p ∈ RrQ) aventi intersezione non vuota
con Rq . D’altro canto gli Mξ crescono al decrescere di ξ, risultano non numerabili per ξ minore di un qualche
valore ξ0 ed infine la loro unione è RrQ . Per quanto possa sorprendere tutte queste proprietà non costituiscono
una contraddizione (e gli Nξ := { q ∈ Q | δ(q) > ξ} ci aiutano ancora meno)!

Sembrerebbe che ragionare come nella nota non ci aiuti, comunque è possibile dare una dimostrazione alternativa
e per certi versi più generale, il fatto che R2Sorg non è T 4 segue dal lemma di F. B. Jones:
Lemma (di Jones). Sia X uno spazio topologico T 4. Se D ⊆ X è un sottoinsieme denso (i.e. D = X) ed E
è un sottospazio chiuso discreto, allora
(♠) cardinalità P(E) ≤ cardinalità P(D)
dove P(...) denota l’insieme delle parti dell’insieme tra parentesi.

L’idea della dimostrazione è la seguente: ad ogni sottoinsieme A di E si associa un aperto UA di X tale che
UA ⊇ A ed è disgiunto da un qualche aperto WA contenente E rA, qui si usa l’ipotesi che X è T 4 ed E è
chiuso e discreto (ogni suo sottoinsieme è chiuso in X), quindi vi si associa UA ∩ D. Questa funzione risulta
iniettiva e, di conseguenza, prova la disuguaglianza (♠).

Esercizio 70 (Soluzione # 2).


Se per assurdo R2Sorg fosse T 4, si potrebbe applicare il lemma di Jones con D = Q2 (insieme dei punti aventi
coordinate razionali) ed E = {x + y = 0}. Si ha che D è numerabile e denso (ogni aperto per la topologia
di Sorgenfrey contiene punti razionali) e la retta E ha la cardinalità del continuo ed è un sottospazio chiuso e
discreto: il rettangolo aperto R p = (x, −x) = [x, x+1) × [−x, −x+1) incontra E solamente in p. D’altro canto
cardinalità P(E) = cardinalità P(R) > cardinalità R = cardinalità P(D)
(questo contraddice il lemma di Jones).


Esercizio 81 (Soluzione).
a. Fissiamo una base B numerabile di Rn (cfr. esercizio 56). Se X è discreto, ad ogni x ∈ X possiamo associare
un elemento B ∈ B che ha interseca X esattamente in {x}. La funzione f : X −→ B cosı̀ definita è iniettiva,
ne segue che X è numerabile.
b. È sufficiente che sia possibile scegliere un punto x ∈ X ed un intorno U di x in modo che XrU sia ancora
infinito (si itera questa operazione con l’insieme che resta scartando U ). Ciò è possibile perché X è T 2: presi
due punti e loro intorni separati il complementare di uno dei due intorni è necessariaamente infinito.
c. Se fosse chiuso, in quanto limitato sarebbe anche compatto, quindi non potrebbe essere infinito e discreto.
d. L’implicazione “⇐=” segue da c (i compatti sono limitati). Proviamo la “=⇒”: se X non è compatto, o non
è limitato o non è chiuso, nel primo caso, per n ∈ N, si scelga un punto pn esterno al disco chiuso di raggio n,
1
nel secondo si fissi w ∈ XrX e si scelga un punto pn nel disco aperto di centro w e raggio n+1 . Si osservi che
in entrambi i casi l’insieme dei pn è discreto, ma anche chiuso in X .
11

Esercizio 83 (Soluzione).
Per ragioni esclusivamente grafiche consideriamo i coni astratto e geometrico sull’intervallo [−1, 1] per il caso
compatto, quelli sull’intervallo (−1, 1) per il caso non compatto (cfr. domande d ed e ).
Cominciamo col primo caso. Consideriamo dunque il cono astratto Ca (X) sull’intervallo X = [−1, 1]:

X = [−1, 1] , Ca (X) = X ×I X ×{0} (cono astratto)
Inoltre, consideriamo il cono geometrico:
0

Cgeom (X) := “ luogo (in R2 ) ottenuto unendo i punti di [−1, 1] × {1} con l’origine o = 0 ”.
  1
Si osservi che quello descritto è il triangolo di vertici 00 , −1
1 , 1 .
C’è una corrispondenza biunivoca naturale tra questi due oggetti, corrispondenza che illustriamo in figura

X ×I = x

∋ t

ω◦π
π

Ca (X) = ω = Cgeom (X)


−−−−→
v• o•
x
 xt

classe di t 7→ t

  
Osserviamo che la funzione ω è la stessa indicata nel testo dell’esercizio: xtt = t x1 + (1−t) 00 .
La corrispondenza ω è un omeomorfismo. Infatti, per t 6= 0 , i.e. fuori dal vertice, ω è un omeomorfismo perché
la funzione (x, t) 7→ (xt, t) si inverte. D’altro canto ω ◦ π è continua, quindi basterà provare che gli intorni
aperti di v vanno in intorni di o. Dunque, U è un aperto contenente v se e solo se, per definizione di topologia
quoziente, π −1 (U ) è un aperto contenente la base π −1 (v) = X × {0}, ma un tale insieme, essendo [−1, 1]
compatto, deve necessariamente contenere tutta una fascia del tipo [−1, 1] × [0, ǫ) il suo complementare avrà
distanza ǫ > 0 dalla nostra base X ×{0} e pertanto la sua immagine tramite ω è un intorno di o.
Quanto visto sopra di fatto utilizza esclusivamente la compattezza di X . In definitiva:
• se X ⊆ R
n
è compatto, allora ω è un omeomorfismo, in particolare Ca (X) ∼ = Cgeom (X) .

Nel caso del cono su un intervallo aperto X = (−1, 1) le cose vanno in maniera diversa, sebbene la figura sia
simile:

X ×I = γ x

∋ t
U

ω◦π
π

Ca (X) = α ω σ = Cgeom (X)


−−−−→
v• o•
x
 xt

classe di t 7→ t

In X ×I , la regione U che si trova sotto la curva γ è un aperto contenente X ×{0}, la base che contraiamo.
Pertanto π(U ) (costituita dalla regione interna al cappio α e dal vertice v) è un aperto del cono astratto Ca (X).
D’altro canto l’immagine ω ◦ π(R) (costituita dalla regione interna al cappio σ e dal vertice o) non è un intorno
di o (nella topologia del cono geometrico, che è la topologia indotta da R2 ).
Quanto sopra in realtà non prova molto7 , ci dice solamente che l’identificazione insiemistica naturale ω non è
7 Naturalmente, l’argomento esposto ci dà una buona evidenza del fatto che il cono astratto su un intervallo aperto non è omeomorfo
al corrispondente cono geometrico: un eventuale omeomorfsmo ω̃ dovrà portare v in o (provarlo non è difficile) e sembrerebbe
ragionevole dire che la figura non può cambiare molto e ω̃ ◦ π (U ) non può essere un intorno di o.
12

un omeomorfismo (domanda e). In effetti, ci suggerisce anche qualcosa: che il cono astratto su un intervallo
aperto X abbia molti più aperti. Ciò accade davvero:
(♣) Ca (X) non è primo numerabile nel vertice v , in particolare non è metrizzabile
(cfr. def. 18.3 e def. 28), mentre il cono geometrico è uno spazio metrico in quanto sottospazio di R2 . Questo
prova che il cono astratto Ca (X) ed il cono geometrico Cgeom (X) non possono essere omeomorfi.
Ora proviamo (♣). Per cominciare, osserviamo che la seconda condizione segue dalla prima: ogni spazio metrico
è primo numerabile (cfr. eser. 28.1). Proviamo che Ca (X) non è primo numerabile nel vertice v (cfr. eser. 18.4).
Per come è definita la topologia quoziente, gli aperti V di Ca (X) contenenti il vertice v sono in corrispondenza
biunivoca via π con gli aperti U di X ×I contenenti X ×{0}, pertanto sarà sufficiente provare quanto segue:
( 
nel prodotto X ×I non esiste una famiglia numerabile di aperti F := Ui i∈N tale che
(♠)
a. X ×{0} ⊆ Ui , ∀ i b. ∀ aperto U ⊇ X ×{0} , ∃ i Ui ⊆ U

Poiché X non è compatto, ammette un sottoinsieme discreto numerabile Z = pi i∈N , con Z chiuso in X
(cfr. esercizio 81.d). Fissata una famiglia F come in (♠.a), si ha che

∀ i , ∃ ǫi > 0 Ui ⊇ {pi }×[0, ǫi ) .
A questo punto, ragionando per assurdo, sarà sufficiente trovare un aperto U ⊆ X×I con le proprietà seguenti:
(⋆) X ×{0} ⊆ U , U ∩ {pi }×I = {pi }×[0, 12 ǫi )

(n.b.: nessuno degli Ui è contenuto in U , questo per come Ui ed U intersecano {pi }×I ). L’esistenza di un
tale aperto U segue dal fatto che Z è discreto e chiuso in X . Ad esempio, basterà prendere
 S 
U := X × I r {pi } × [ 12 ǫi , 1]
i∈N

Proviamo che U è aperto: poiché Z è chiuso in X , i punti del tipo (x, t) con x ∈ X rZ sono interni ad U ;
poiché Z è discreto, anche i punti del tipo (pi , t) con t < 21 ǫi sono interni ad U . Essendo i punti di U di uno
dei due tipi considerati, U è aperto in quanto intorno di ogni suo punto. Ciò conclude la dimostrazione.
Questa volta di fatto abbiamo utilizzato esclusivamente la non compattezza di X . In definitiva:
• se X ⊆ R
n
non è compatto, allora Ca (X) non è metrizzabile.


Nota. Quanto all’esistenza di un aperto U soddisfacente la condizione (⋆) ci sono varie alternative alla soluzione
proposta, una di queste è quella di prendere una funzione continua
1
f : X −→ I soddisfacente f (pi ) = 2 ǫi , f (x) > 0 , ∀ x ∈ X ,
quindi prenderne il sottografico, i.e. il luogo dei punti (x, t) ∈ X ×I | f (x) < t (ai fini dell’esistenza di una
tale funzione è cruciale il fatto che Z sia discreto e chiuso in X , questo perché sono assegnati i valori di f su
Z e vogliamo estendere la definizione a tutto X ).
TOPOLOGIA

ALBERTO SARACCO

Abstract. Le presenti note saranno il più fedeli possibile a quanto


detto a lezione. I testi consigliati sono Jänich [1], Kosniowski [2] e Singer-
Thorpe [3]. Un ottimo libro di esempi (e controesempi) di topologia è
Steen-Seebach [4].

Contents
1. Definizioni di base 1
1.1. Definizione di spazio topologico 2
1.2. Spazi metrici 3
1.3. Definizioni alternative di spazio topologico 5
1.4. Funzioni continue 6
1.5. Sottospazi, unioni disgiunte e prodotti di spazi topologici 8
1.6. Basi e sottobasi 10
2. Compattezza 11
2.1. Un’utile proprietà 15
2.2. La compattificazione di Alexandrov 16
3. Assiomi di separazione 17
4. Costruzione di funzioni continue su spazi topologici 22
4.1. Il lemma di Urysohn 22
4.2. Lemma di estensione di Tietze 23
4.3. Partizioni dell’unità e paracompattezza 24
5. Proprietà di connessione 27
5.1. Connessione 27
5.2. Connessione per archi 28
5.3. Versioni locali delle proprietà di connessione 30
6. Omotopia 30
7. Il gruppo fondamentale 32
7.1. Cammini 32
7.2. Il gruppo fondamentale 34
8. Rivestimenti 34
9. Il teorema di Seifert-Van Kampen 34
References 34

1. Definizioni di base
La nozione di spazio topologico è una naturale estensione di R, Rn , C,
Cn e del concetto di spazio metrico. È utile per dare in tutta generalità la
Date: February 4, 2012.
1
2 A. SARACCO

definizione di funzione continua, di successione convergente, di limite, e per


focalizzarsi sulle proprietà di base che rendono veri certi teoremi.

1.1. Definizione di spazio topologico.


Definizione 1.1. Uno spazio topologico è una coppia (X, O), dove X è un
insieme e O è una famiglia di sottoinsiemi di X (detti insiemi aperti, o
semplicemente aperti ) che verificano i seguenti assiomi:
A1 Un’unione qualsiasi di aperti è un aperto;
A2 L’intersezione di due (e quindi di un numero finito) aperti è un
aperto;
A3 ∅ e X sono aperti.
La famiglia O degli aperti è detta la topologia di X. Quando non ci sarà
bisogno di indicare esplicitamente la topologia indicheremo semplicemente
con X lo spazio topologico.
Esempio 1.1. Sia X un insieme qualsiasi. La topologia banale (o concreta
o indiscreta) su X è la topologia B = {∅, X}.
I tre assiomi degli aperti sono banalmente verificati. Questa è la topologia
su X con meno aperti.
Esempio 1.2. Sia X un insieme qualsiasi. La topologia discreta su X è la
topologia D = P(X) (insieme delle parti di X; tutti i sottoinsiemi di X sono
aperti).
I tre assiomi degli aperti sono banalmente verificati. Questa è la topologia
su X con più aperti.
Tranne che nei casi banali in cui X è l’insieme vuoto o un insieme con un
solo punto (sui quali esiste una sola topologia), queste due topologie sono
diverse.
Esempio 1.3. In R chiamiamo intervallo aperto un qualsiasi insieme della
forma
(a, b) = {x ∈ R | a < x < b} , a ∈ R ∪ {−∞}, b ∈ R ∪ {+∞}, a < b.
Diamo una topologia E (topologia standard o euclidea) definendo gli aperti
di R nel seguente modo: A ⊂ R è aperto se e soltanto se ∀x ∈ A ∃(a, b)
intervallo aperto tale che x ∈ (a, b) ⊂ A.
Verifichiamo che cosı̀ facendo si definisce una topologia:
A1 Siano Ai aperti di R. Allora ∀x ∈ ∪i Ai si ha che x ∈ Ai per un
qualche i. Pertanto esiste un intervallo aperto (a, b) tale che x ∈
(a, b) ⊂ Ai ⊂ ∪i Ai . Quindi ∪i Ai è aperto.
A2 Siano A1 e A2 aperti di R. Allora ∀x ∈ A1 ∩ A2 , x ∈ A1 aperto,
quindi esiste (a1 , b1 ) intervallo aperto tale che x ∈ (a1 , b1 ) ⊂ A1 .
Analogamente si ha x ∈ (a2 , b2 ) ⊂ A2 . Definendo a = max{a1 , a2 }
e b = min{b1 , b2 } si ha che (a, b) = (a1 , b1 ) ∩ (a2 , b2 ). Pertnato
x ∈ (a, b) ⊂ A1 ∩ A2 e A1 ∩ A2 è aperto.
A3 ∅ è aperto, dato che la condizione è vera a vuoto; R = (−∞, +∞) è
un intervallo aperto, quindi è aperto.
TOPOLOGIA 3

Esempio 1.4. In Rn chiamo palla aperta (di raggio r e centro x) un insieme


del tipo
Br (x) = {y ∈ Rn | k x − y k< r}, x ∈ Rn , r ∈ R+ .
Diamo una topologia E (topologia standard o euclidea) definendo gli aperti
di Rn nel seguente modo: A ⊂ Rn è aperto se e soltanto se ∀x ∈ A ∃Br (y)
palla aperta tale che x ∈ Br (y) ⊂ A.
La verifica che si tratti di una topologia (del tutto analoga alla precedente)
è lasciata al lettore.
Osserviamo che, siccome Cn = R2n come insiemi, la topologia appena
definita è anche una topologia per Cn , detta sempre topologia euclidea.
1.2. Spazi metrici. I due esempi precedenti, della topologia euclidea di R
e di Rn sono in realtà un caso particolare della definizione di topologia per
unoo spazio metrico.
Definizione 1.2. Uno spazio metrico è una coppia (X, d), dove X è un
insieme e d : X × X → R è una funzione reale (detta metrica o distanza)
tale che
M1 d(x, y) ≥ 0, ∀x, y ∈ X e d(x, y) = 0 se e solo se x = y;
M2 d(x, y) = d(y, x), ∀x, y ∈ X;
M3 d(x, y) + d(y, z) ≥ d(x, z), ∀x, y, z ∈ X (disuguaglianza triangolare).
La definizione di topologia su uno spazio metrico ricalca perfettamente la
definizione della topologia euclidea per R e Rn .
Definizione 1.3. Sia (X, d) uno spazio metrico. Si può definire una topolo-
gia Od su X, detta topologia indotta dalla metrica nel seguente modo.
Chiamo palla aperta (di raggio r e centro x) un insieme del tipo
Br (x) = {y ∈ Rn | d(x, y) < r}, x ∈ Rn , r ∈ R+ .
Un sottoinsieme A ⊂ X si dice aperto se e soltanto se ∀x ∈ A ∃Br (y)
palla aperta tale che x ∈ Br (y) ⊂ A.
Nuovamente la dimostrazione che questa è una topologia è lasciata al
lettore.
Osserviamo che due metriche differenti (d e d0 ) possono indurre la stessa
topologia su X. Questo avviene se e solo se ogni palla aperta nella metrica
d è aperta nella topologia indotta da d0 (ovvero contiene una palla aperta
nella metrica d0 e viceversa.
Ovvero Od = Od0 se e solo se
(1) ∀r > 0, ∃s > 0 Br (x) ⊂ Bs0 (x); Br0 (x) ⊂ Bs (x),
dove le B sono le palle nella metrica d e le B 0 le palle nella metrica d0 .
La topologia euclidea di R e Rn è quella indotta dalla metrica euclidea
d2 :
v
u n
uX
d2 (x, y) = t (xi − yi )2 , x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) .
i=1
4 A. SARACCO

La metrica d1 :
n
X
d1 (x, y) = |xi − yi |, x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ,
i=1

la metrica d∞ :

d∞ (x, y) = max |xi − yi |, x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ,


i=1,...,n

e più in generale la metrica dp , 1 ≤ p < +∞:


v
u n
uX
dp (x, y) = tp
(xi − yi )p , x = (x1 , . . . , xn ), y = (y1 , . . . , yn )
i=1

inducono sempre la topologia euclidea.


Se 0 < p < 1, allora dp non è una metrica perchè non rispetta la disug-
uaglianza triangolare.
La dimostrazione di queste affermazioni è lasciata per esercizio al lettore.
Bisogna sempre prestare molta attenzione alla relazione tra metrica e
topologia. Osserviamo che se (X, d) è uno spazio metrico qualsiasi, allora

d(x, y)
d0 (x, y) =
1 + d(x, y)

è una metrica limitata su X che induce la stessa topologia (perché? esercizio


per il lettore). Pertanto la limitatezza della metrica non induce nessuna
proprietà sulla topologia.

Definizione 1.4. Uno spazio topologico (X, O) si dice metrizzabile se esiste


una metrica d su X tale che O = Od .

Il problema di trovare condizioni necessarie e/o sufficienti affinché uno


spazio topologico sia metrizzabile è ovviamente di grande interesse.

Esempio 1.5. Sia (X, D) uno spazio dotato della topologia discreta. Allora
X è metrizzabile. Definendo infatti d(x, y) = 1 se x 6= y e d(x, x) = 0 si
ottiene che {x} = B 1 (x) è un insieme aperto. Tutti i singoletti sono aperti,
2
quindi (per l’assioma A1) tutti i sottoinsiemi di X sono aperti. Pertanto
Od = D.

Esempio 1.6. Sia (X, B) uno spazio con almeno due punti dotato della
topologia banale. Allora X non è metrizzabile. Siano infatti x 6= y ∈ X due
punti distinti e supponiamo che d sia una metrica su X. Allora d(x, y) =
δ > 0 e Bδ (x) contiene x ma non y. Pertanto la topologia indotta da d ha
almeno un aperto non vuoto diverso da tutto lo spazio. Quindi Od 6= B.

Osserviamo che se X ha un solo punto (X, B) = (X, D) e pertanto è


metrizzabile. Ovviamente non serve a molto mettere una metrica su uno
spazio con un solo punto...
TOPOLOGIA 5

1.3. Definizioni alternative di spazio topologico. Definiamo ora alcuni


concetti base per gli spazi topologici.

Definizione 1.5. Sia (X, O) uno spazio topologico.


(1) C ⊂ X si dice chiuso se e solo se X \ C è aperto;
(2) U ⊂ XX si dice intorno di x ∈ X se e solo se esiste un aperto V
tale che x ∈ V ⊂ U ;
(3) Sia B ⊂ X. x ∈ X si dice
(a) interno a B se B è un intorno di x;
(b) esterno a B se X \ B è un intorno di x;
(c) di frontiera per B altrimenti;

(4) l’insieme dei punti interni di B si indica con B e si dice l’interno di
B;
(5) l’insieme dei punti di frontiera per B si indica con bB (o dB o ∂B)
e si dice la frontiera di B;

(6) l’insieme dei punti non esterni a B si indica con B =B ∪bB e si dice
la chiusura di B.

Esercizio 1.1. Dimostrare che, per ogni B ⊂ X



(1) B è aperto se e solo se B =B ;

(2) B è aperto;

(3) B è l’unione di tutti gli aperti contenuti in B;
(4) B è chiuso se e solo se B = B;
(5) B è chiuso;
(6) B è l’intersezione di tutti i chiusi contenenti B;
(7) bB è chiuso.

Gli insiemi chiusi, gli intorni e le operazioni di chiusura e di fare l’interno


possono essere utilizzati per definire gli aperti. Infatti: A è aperto se e
soltanto se X \ A è chiuso, se e soltanto se A è intorno di ciascuno dei suoi
punti, se e soltanto se X \ B coincide con la sua chiusura, se e soltanto se
B coincide col suo interno.
Possiamo pertanto dare alcune definizioni alternative di topologia.

Definizione 1.6 (Assiomi per chiusi). Uno spazio topologico è una coppia
(X, C), dove X è un insieme e C è una famiglia di sottoinsiemi di X (i chiusi)
che verificano i seguenti assiomi:
C1 Un’intersezione qualsiasi di chiusi è un chiuso;
C2 L’unione di due (e quindi di un numero finito) apertichiusi è un
chiuso;
C3 ∅ e X sono chiusi.

Si dimostra che questa definizione è equivalente a quella data per gli


insiemi aperti sfruttando la seguente utilissima dualità, conseguenza delle
leggi di Morgan: ad ogni aperto si fa corrispondere il chiuso complementare;
ogni unione si trasforma in intersezione; ogni intersezione si trasforma in
unione.
6 A. SARACCO

Definizione 1.7 (Assiomi per intorni). Uno spazio topologico è una coppia
(X, U), dove X è un insieme e U = {Ux }x∈X è una famiglia di insiemi Ux di
sottoinsiemi di X (gli intorni di x) che verificano i seguenti assiomi:
I1 L’intersezione di due intorni di x è un intorno di x;
I2 Un insieme che contiene un intorno di x è un intonro di x;
I3 Ogni intorno di x contiene un intorno che è intorno di tutti i suoi
punti;
I4 Ogni intorno di x contiene x; X è intorno di tutti i suoi punti.
Definizione 1.8 (Assiomi per chiusura). Uno spazio topologico è una cop-
pia (X, ), dove X è un insieme e : X → X è un’applicazione (la chiusura)
che verifica i seguenti assiomi:
Ch1 A ⊂ A;
Ch2 A = A;
Ch3 A ∪ B = A ∪ B;
Ch4 ∅ = ∅.
Definizione 1.9 (Assiomi per interno). Uno spazio topologico è una coppia
(X, ◦), dove X è un insieme e ◦: X → X è un’applicazione (l’interno) che
verifica i seguenti assiomi:

In1 A ⊃A;

◦ ◦
In2 A=A;
◦ ◦ ◦
In3 (A ∪ B)=A ∪ B ;

In4 X = X.
Dimostrare, per esercizio, l’equivalenza di queste definizioni.
È interessante osservare che anche tra le operazioni di chiusura e di interno
esiste una sorta di dualità.
In seguito useremo (quasi) sempre la definizione di spazio topologico per
aperti, ma lavorare su queste definizioni alternative costituisce un utile es-
ercizio per familiarizzare con i termini.
1.4. Funzioni continue.
Definizione 1.10. Una funzione f : X → Y tra spazi topologici è detta
continua se e soltanto se ∀U aperto di Y la controimmagine f −1 (u) è un
aperto di X.
È bene osservare che questa definizione generalizza quella standard di
funzione f : R → R continua (“∀x0 ∈ R, ∀ε > 0 ∃δ > 0 t.c. |x − x0 | < δ
implica |f (x) − f (x0 )| < ε” e le altre definizioni nel caso x0 sia ±∞), nel
caso in cui R sia dotato della topologia euclidea. Perchè? Esercizio per il
lettore.
Esempio 1.7. La funzione identica idX : (X, O) → (X, O) è una funzione
continua. Infatti la controimmagine di un aperto U è l’aperto U stesso.
Esempio 1.8. La funzione costante y0 : X → Y che ad ogni punto di X
associa y0 è continua. Infatti la controimmagine di un aperto qualsiasi U di
Y è X (se y0 ∈ U ) o ∅ (se y0 6∈ U ).
TOPOLOGIA 7

Esercizio 1.2. Dimostrare che idX : (X, O) → (X, O0 ) è continua se e solo


se O0 ⊂ O.
La relazione di inclusione tra topologie è molto importante, e merita di
avere un nome.
Definizione 1.11. Siano O e O0 due topologie su X. O0 si dice meno fine
di O (o equivalentemente O si dice più fine di O0 ) se O0 ⊂ O (ovvero tutti
gli aperti di O0 sono aperti anche di O).
Per ricordarsi la definizione può essere utile pensare a “più fine” come
“con più aperti” e a “meno fine” come “con meno aperti”.
Ovviamente, se O è una qualsiasi topologia su X, si ha B ⊂ O ⊂ D,
ovvero la topologia banale è la topologia meno fine di tutte e la topologia
discreta è la topologia più fine di tutte.
Esercizio 1.3. Dimostrare che se (X, O) è tale che ogni funzione f : X →
Y è continua (per ogni spazio topologico Y ), allora O = D, la topologia
discreta.
Esercizio 1.4. Dimostrare che se (Y, O) è tale che ogni funzione f : X → Y
è continua (per ogni spazio topologico X), allora O = B, la topologia banale.
Esercizio 1.5. Dimostrare che f : (R, E) → (X, D) è continua se e soltanto
se è costante.
Teorema 1.1. Una funzione f : X → Y è continua se e solo se ∀C ⊂ Y
chiuso f −1 (Y ) è chiuso.
Dimostrazione. Segue immediatamente dal fatto che C è chiuso se e solo se
U = Y \ C è aperto e che f −1 (Y \ A) = X \ f −1 (A), per ogni sottoinsieme
A⊂Y. 
Teorema 1.2. Se f : X → Y e g : Y → Z sono funzioni continue, allora
g ◦ f : X → Z è continua.
Dimostrazione. Se U ⊂ Z è aperto, allora g −1 (U ) ⊂ Y è aperto e quindi
f −1 (g −1 (U )) ⊂ X è aperto. Osservando che f −1 (g −1 (U )) = (g ◦ f )−1 (U ) si
conclude che g ◦ f è continua. 
Definizione 1.12. Due spazi topologici (X, OX ) e (Y, OY ) si dicono omeo-
morfi se esiste una funzione f : X → Y biiettiva e bicontinua (ovvero
continua, con inversa continua). Scriveremo X ∼= Y e diremo che f è un
omeomorfismo tra X e Y .
Un omeomorfismo è quindi una biiezione tra i punti di X e Y e tra gli
aperti di OX e OY .
Le proprietà invarianti per omeomorfismi (ovvero dipendenti solo dalle
nozioni di punto e di aperto) saranno dette proprietà topologiche.
La nozione di omeomorfismo è una relazione d’equivalenza. La topologia
si occupa dello studio degli spazi topologici a meno di omeomorfismo.
Esempio 1.9. Sia X = [0, 1) con la topologia indotta dalla metrica che
eredita da R e Y = S1 = {e2πti ∈ C | t ∈ [0, 1)} con la topologia indotta
dalla metrica che eredita da C. Allora
f : X → Y, f (t) = e2πti
8 A. SARACCO

è una funzione biiettiva e continua. Osserviamo tuttavia che f −1 non è


continua. Infatti [0, a) ⊂ [0, 1) è aperto (qualunque sia 0 < a < 1), ma la
sua controimmagine f ([0, a)) non è aperta poiché f (0) = 1 non è un punto
interno all’arco f ([0, a)).
Esempio 1.10. Sia X uno spazio con due topologie differenti O e O0 idX :
(X, O) → (X, O0 ) è biiettiva. Se O ⊃ O0 allora è anche continua, ma non
ha inversa continua.
Vedremo in seguito un modo molto più semplice per dimostrare che quello
dell’esempio sopra non è un omeomorfismo.
Pertanto affinché una funzione f sia un omeomorfismo non è sufficiente
che sia biiettiva e continua.

1.5. Sottospazi, unioni disgiunte e prodotti di spazi topologici. Ora


siamo pronti a dare tre metodi per costruire nuovi spazi topologici a partire
da altri. Un quarto metodo (spazio quoziente) verrà introdotto in seguito.
Definizione 1.13. Se (X, O) è uno spazio topologico e Y ⊂ X un sottoin-
sieme, la topologia
O|Y = {U ∩ Y | U ∈ O}
si dice topologia di sottospazio o topologia indotta. Lo spazio topologico
(Y, O|Y ) si dice sottospazio (topologico) di (X, O).
Osserviamo che se Y ⊂ X è aperto, allora gli aperti di Y sono aperti di
X. Più in generale, gli aperti di Y sono le restrizioni degli aperti di X ad
Y.
Esercizio 1.6. Dimostrare che se f : (X, O) → (Z, O0 ) è continua, allora per
ogni sottospazio (Y, O|Y ) la restrizione f |Y : (Y, O|Y ) → (Z, O0 ) è continua.
Definizione 1.14. Siano A e B due insiemi. La loro somma o unione
disgiunta è l’insieme
X + Y = X × {0} ∪ Y × {1}.
Considereremo sempre X ⊂ X + Y e Y ⊂ X + Y .
L’unione disgiunta è semplicemente la giustapposizione dei due insiemi. Si
distingue dall’unione in tutti i casi in cui gli insiemi non siano a intersezione
vuota.
Definizione 1.15. Siano (X, OX ) e (Y, OY ) due spazi topologici. Su X + Y
si definisce la topologia OX+Y data da
OX+Y = OX + OY = {U + V |U ∈ OX , V ∈ OY } .
(X + Y, OX+Y ) si chiama unione disgiunta topologica di (X, OX ) e (Y, OY ).
Esercizio 1.7. Dimostrare che OX+Y è effettivamente una topologia.
Proposizione 1.3. f : X + Y → Z è continua se e solo se f |X e f |Y sono
entrambe continue.
Inoltre questa proprietà caratterizza la topologia OX+Y .
TOPOLOGIA 9

Dimostrazione. Sia W ⊂ Z un aperto. Allora f −1 (W ) = (f |X )−1 (W ) +


(f |Y )−1 (W ) è aperto se e solo se (f |X )−1 (W ) e (f |Y )−1 (W ) sono entrambi
aperti.
Vediamo ora che tale proprietà caratterizza la topologia dell’unione dis-
giunta. Sia O una qualsiasi topologia su X + Y tale che valga la proprietà
in questione.
Consideriamo la funzione idX+Y : (X + Y, O) → (X + Y, O). Questa è
continua. Pertanto idX+Y |X e idX+Y |Y sono continue.
Siano ora O1 e O2 due topologie per cui vale la proprietà.
Consideriamo la funzione idX+Y : (X +Y, O1 ) → (X +Y, O2 ). Le funzioni
idX+Y |X e idX+Y |Y sono continue per quanto appena visto. Pertanto idX+Y
è continua, e quindi O2 ⊂ O1 .
Invertendo i ruoli delle due topologie si prova l’inclusione inversa, e quindi
O1 = O2 . Pertanto l’unica topologia con tale proprietà è la topologia
dell’unione disgiunta. 
Definizione 1.16. Siano (X, OX ) e (Y, OY ) due spazi topologici. Sul
prodotto cartesiano X × Y si definisce la topologia prodotto OX×Y in questo
modo. Un sottoinsieme A ⊂ X × Y è aperto se e soltanto se ∀p ∈ X × Y
∃U aperto in X, ∃V aperto in Y tali che p ∈ U × V ⊂ A.
Esercizio 1.8. Dimostrare che quella appena definita è una topologia.
I sottoinsiemi aperti della forma U × V , con U aperto in X e V aperto in
Y , si dicono rettangoli aperti. Dato che l’unione di rettangoli aperti non è
necessariamente un rettangolo aperto questi non sono i soli insiemi aperti.
Proposizione 1.4. Sia O una topologia su X × Y . Sono equivalenti:
(1) f = (f1 , f2 ) : Z → (X × Y, O) è continua se e solo se f1 : Z → X e
f2 : Z → Y sono entrambe continue;
(2) O è la topologia meno fine per cui le proiezioni πX : (X ×Y, O) → X
e πY : (X × Y, O) → Y sono continue;
(3) O = OX×Y
Osservazione 1.5. Pertanto le proprietà (1) o (2) possono essere prese
come definizioni alternative di topologia prodotto.
Dimostrazione. (3) ⇒ (1): osserviamo innanzitutto che poiché l’unione di
aperti è aperta, e poiché gli aperti di X × Y sono unione di rettangoli aperti,
dire che una funzione a valori in X × Y è continua è equivalente a dire che
le controimmagini dei rettangoli aperti sono aperte.
Supponiamo che f sia continua. Dato che f1−1 (U ) = f −1 (U × Y ), allora
f1 è continua. Analogamente per f2 .
Viceversa se f1 e f2 sono continue, basta osservare che f −1 (U × V ) =
f (U × Y ) ∩ f −1 (X × V ) = f1−1 (U ) ∩ f2−1 (V ) per concludere che f è
−1

continua.
(1) ⇒ (2): idX×Y = (πX , πY ) : (X × Y, OX×Y ) → (X × Y, OX×Y ) è
continua. Quindi sono continue le proiezioni πX e πY .
Inoltre, sia O0 la topologia meno fine che rende continue le proiezioni.
Allora
idX : (X × Y, O0 ) → (X × Y, O)
10 A. SARACCO

è continua. Ma ciò implica che O ⊂ O0 . Poichè abbiamo dimostrato che O


rende continue le proiezioni O = O0 .
−1
(2) ⇒ (3): basta osservare che gli insiemi πX (U ) (U ⊂ X aperto) e
πY−1 (V ) (V ⊂ Y aperto) sono aperti di O. Inoltre U × V = πX−1
(U ) ∩ πY−1 (V )
è aperto per O. Quindi O ⊃ OX×Y . Ma per quanto già dimostrato, le
proiezioni sono continue per la topologia OX×Y . Pertanto O = OX×Y . 
Esercizio 1.9. Dimostrare che la topologia euclidea di R2 (e quindi di Rn )
è la topologia prodotto che si ottiene da (R, E).
1.6. Basi e sottobasi. Nel dare alcune topologie, quella euclidea di R,
quella euclidea di Rn e quella della topologia prodotto abbiamo usato uno
stesso metodo. Prima abbiamo definito una classe B di particolari insiemi
aperti e poi abbiamo detto: un insieme A è aperto se e solo se per ogni punto
a ∈ A esiste B ∈ B tale che a ∈ B ⊂ A. Ovvero gli insiemi aperti sono le
unioni1 degli insiemi di B. Questo permette rapidamente di dimostrare che
valgono gli assiomi di topologia, posto che
[
(2) B = X;
B∈B
e che
(3) ∀B1 , B2 ∈ B B1 ∩ B2 ∈ B ∪ {∅} .
Esercizio 1.10. Dimostrare dalle condizioni (2) e (3) gli assiomi di topolo-
gia.
Definizione 1.17. Sia X uno spazio topologico. Un insieme B di insiemi
aperti si dice base per la topologia se ogni aperto è unione di elementi di B.
Proposizione 1.6. Sia X un insieme, e B una famiglia di sottoinsiemi di
X che verifica (2) e (3). Allora B è una base per una topologia su X.
Dimostrazione. Segue da quanto osservato prima della definizione di base.
Per quale topologia? Lasciamo la risposta al lettore. 
Abbiamo trovato cosı̀ un metodo per fornire una topologia facendo solo
poche verifiche. Ma possiamo fare di meglio.
Definizione 1.18. Sia (X, O) uno spazio topologico. Una famiglia S ⊂ O
di insiemi aperti si dice sottobase per la topologia se ogni aperto è unione di
intersezioni finite2 di insiemi in S.
Ovvero S è una sottobase se e solo se le intersezioni finite dei suoi elementi
sono una base per la topologia.
1Consideriamo anche la possibilità di fare un’unione vuota, ponendo
[
B = ∅.
B∈∅

2Analogamente a prima considereremo anche le intersezioni di una famiglia vuota di


insiemi: \
S = X.
S∈∅
TOPOLOGIA 11

Proposizione 1.7. Data una qualsiasi famiglia S di insiemi di X questa


è una sottobase per una topologia di X, indicata con O(S).
Dimostrazione. Definiamo O(S) come tutte le unioni di intersezioni finite
di elementi di S. Verifichiamo gli assiomi di topologia.
(A1) Siano Oα aperti in O(S). Allora sono tutti unione di intersezioni
finite di elementi di S. Pertanto la loro unione è anch’essa unione di inter-
sezioni finite di elementi di S, ovvero un aperto.
(A2) Siano O1 , O2 ∈ O(S). Allora
 
n(αi )
[ \
Oi =  Sj,αi  , i = 1, 2.
αi ∈Ai j=1

Usando le leggi di De Morgan segue che


 
n(α1 ) n(α2 )
[ \ \
O1 ∩ O2 =  Sj,α1 ∩ Sk,α2  ,
α1 ∈A1 ,α2 ∈A2 j=1 k=1

ovvero anche O1 ∩ O2 è unione di intersezioni finite di elementi di S, ovvero


un aperto.
(A3) L’insieme vuoto e X sono aperti, dato che
[ \
∅= S, X = S.
S∈∅ S∈∅

Osservazione 1.8. La topologia O(S) appena definita è la topologia meno
fine per cui gli elementi di S sono aperti.

2. Compattezza
Definizione 2.1. Sia X uno spazio topologico e S ⊂ X un sottoinsieme.
Un ricoprimento di S è una famiglia di sottoinsiemi {Uj }j∈J di X tali che
[
Uj ⊃ S .
j∈J

Un ricoprimento viene detto


• aperto se tutti gli insiemi Uj sono aperti di X;
• finito se |J| < +∞.
Non è richiesto nella definizione di ricoprimento di S che l’unione di tutti
gli insiemi sia esattamente S. L’unione può essere un soprainsieme proprio.
Questo per far sı̀ che possano esistere ricoprimenti aperti anche di insiemi
che aperti non sono.
Esempio 2.1. La famiglia Un = (1/n, 1), n ∈ N, è un ricoprimento aperto
di (0, 1) ⊂ R (con la topologia euclidea), cosı̀ come la famiglia Vn = (1/n, 2).
Esempio 2.2. La famiglia {(0, 2), (1, 3), (2, 4)} è un ricoprimento aperto
finito di [1, 3] ⊂ R con la topologia euclidea.
Esempio 2.3. La famiglia Un = (−n, n), n ∈ N, è un ricoprimento aperto
di (R, E).
12 A. SARACCO

Esempio 2.4. La famiglia {(−∞, 0), [0, +∞)} è un ricoprimento finito di


(R, E).
Esempio 2.5. Sia Y un sottoinsieme non vuoto dello spazio topologico
(X, B). Allora {X} e {X, ∅} sono gli unici ricoprimenti aperti di Y .
Definizione 2.2. Siano {Uj }j∈J e {Vk }k∈K due ricoprimenti di S ⊂ X.
Diciamo che {Uj }j∈J è un sottoricoprimento di {Vk }k∈K se ∀j ∈ J ∃k ∈ K
tale che Uj = Vk .
Esempio 2.6. La famiglia V(n,m) = (−n, m), (n, m) ∈ N2 , è un ricoprimento
aperto di (R, E), e Un = (−n, n), n ∈ N, è un suo sottoricoprimento.
Definizione 2.3. Sia X uno spazio topologico. S ⊂ X si dice compatto se
ogni ricoprimento aperto di S ammette un sottoricoprimento finito.
Teorema 2.1. S ⊂ (X, O) è compatto se e solo se S ⊂ (S, O|S ) è compatto.
Dimostrazione. La dimostrazione, basata sul fatto che gli aperti di O|S sono
della forma U ∩ S, con U ∈ O, è lasciata per esercizio al lettore. 
Definizione 2.4. Una famiglia qualsiasi F = {Sλ }λ∈Λ di insiemi ha la
proprietà dell’intersezione finita (o p.i.f.) se
\ n
\
Sλ = ∅ ⇒ ∃λ1 , . . . , λn : S λi = ∅ .
λ∈Λ i=1

Proposizione 2.2. Uno spazio topologico X è compatto se e solo se ogni


famiglia di chiusi di X ha la proprietà dell’intersezione finita.
Dimostrazione. (⇒) Supponiamo che X sia compatto e sia C = {Cλ }λ∈Λ
una famiglia di chiusi di X. Se
\
Cλ = ∅ ,
λ∈Λ

(se coı̀ non è, l’implicazione è vera poichè l’ipotesi è falsa) allora, definendo
Aλ = X \ Cλ , gli Aλ sono aperti tali che
[
Aλ = X ,
λ∈Λ

ma poichè X è compatto, esistono un numero finito di indici λ1 , . . . , λn tali


che
n
[
A λi = X ,
i=1
e di conseguenza
n
\
C λi = ∅ ,
i=1
ovvero C ha la p.i.f.
(⇐) La dimostrazione del viceversa è del tutto analoga. I dettagli vengono
lasciati al lettore. 
TOPOLOGIA 13

Corollario 2.3. Sia X uno spazio compatto e C = {Cn }n∈N una famiglia
numerabile di chiusi non vuoti di X tali che Cn+1 ⊂ Cn per ogni n ∈ N.
Allora \
Cn 6= ∅ .
n∈N

Dimostrazione. Ogni sottofamiglia finita di tali chiusi ha evdentemente in-


tersezione non vuota. Siccome X è compatto, C ha la p.i.f. e ciò implica la
tesi. 
Teorema 2.4. Sia X uno spazio compatto, e C ⊂ X un suo chiuso. Allora
C è compatto.
Dimostrazione. Sia C una famiglia di chiusi di C. Siccome C è chiuso, C è
una famiglia di chiusi di X, e pertanto ha la p.i.f. 
Vedremo in seguito che con una piccola ipotesi su X tutti i compatti
sono necessariamente chiusi. Questo non è vero in generale, come mostra il
seguente banale esempio.
Esempio 2.7. Sia X un qualsiasi insieme con la topologia banale. Siccome
gli aperti di X sono in numero finito, allora X e tutti i suoi sottoinsiemi
sono compatti.
Esempio 2.8. R con la topologia euclidea non è compatto in quanto il rico-
primento aperto Un = (−n, n), n ∈ N, non ammette alcun sottoricoprimento
finito. Infatti Un ⊂ Um se m ≥ n, e se per assurdo esistesse un sottoricopri-
mento finito {Vk }k=1,...,l di {Un } allora esisterebbe un Vk = Un che contiene
tutti gli altri e quindi {Un è esso stesso un sottoricoprimento. Ma siccome
Un ( R per ogni n ∈ N, R non può essere ricoperta dal solo Un . Assurdo.
Esempio 2.9. Sia X un insieme con |X| < +∞ allora |P(X)| < +∞ e
quindi, qualunque sia la topologia O su X, |O| < |P(X)| < +∞, e X è
compatto.
Esercizio 2.1. Dimostrare per ognuno degli esempi precedenti la compat-
tezza o non compattezza dell’esempio usando la p.i.f.
Proposizione 2.5. Sia X un insieme qualsiasi. (X, D) è compatto se e
solo se |X| < +∞.
Dimostrazione. (⇐) per quanto osservato nell’essempio 2.9.
(⇒) {x}x∈X è un ricoprimento aperto di X, che ovviamente non ammette
sottoricoprimenti non banali. Siccome X è compatto, lui stesso è finito,
ovvero |X| < +∞. 
Teorema 2.6. L’intervallo chiuso [0, 1] ⊂ R (con la topologia euclidea) è
compatto.
Dimostrazione. Sia {Uj }j∈J un ricoprimento aperto di [0, 1]. Supponiamo
per assurdo che non esista un sottoricoprimento finito di {Uj }. Allora almeno
uno dei due intervalli [0, 1/2] e [1/2, 1] non potrà essere ricoperto con un
numero di finito di Uj . Chiamiamo tale intervallo [a1 , b1 ] (notiamo che b1 −
a1 = 1/2).
14 A. SARACCO

Induttivamente, se abbiamo trovato che l’intervallo [an , bn ] (per cui bn −


an = 1/2n ) non può essere ricoperto con un numero finito di Uj , lo stesso
avviene per almeno uno dei due intervalli
   
an + bn an + bn
an , , , bn .
2 2
Chiamiamo tale intervallo [an+1 , bn+1 e osserviamo che bn+1 −an+1 = 1/2n+1 .
Abbiamo quindi trovato una successione di intervalli chiusi {In = [an , bn ]}n∈N
tale che
(1) nessun In può essere risoperto da un numero finito di Uj ;
(2) In+1 ⊂ In per ogni n ∈ N, ovvero 0 ≤ an ≤ an+1 < bn+1 ≤ bn ≤ 1;
(3) bn − an = 1/2n .
La condizione (2) fa sı̀ che l’insieme {an } e l’insieme {bn } ammettano
rispettivamente un limite superiore a (poiché an è crescente e limitata dall’alto
da 1) e un limite inferiore b (poiché bn è decrescente e limitata dal basso da
0).
La condizione (3) fa sı̀ che a = b ∈ [0, 1].
Poiché {Uj }j∈J è un ricoprimento di [0, 1] esiste un U della famiglia tale
che a ∈ U . Poichè U è un aperto, conterrà un intervallo aperto (a − ε, a + ε)
per un qualche ε > 0. Fissato N ∈ N tale che 1/2N < ε si ha che a−ε < aN <
bN < a + ε, e quindi IN ⊂ U . Ma questo contraddice la (1). Assurdo. 
Teorema 2.7. Sia f : X → Y un’applicazione continua tra spazi topologici.
Se S ⊂ X è compatto, allora f (S) è compatto.
Dimostrazione. Sia {Uλ }λ∈Λ un ricoprimento aperto di f (S). Allora la
famiglia {f −1 (Uλ )}λ∈Λ è un ricoprimento aperto di S. Poichè S è compatto,
esistono un numero finito di indici λ1 , . . . , λn ∈ Λ tali che un sottoricopri-
mento finito di S sia {f −1 (Uλ1 , . . . , f −1 (Uλn )}. Pertanto {Uλ1 , . . . , Uλn } è
un sottoricoprimento finito di f (S). Ciò prova che f (S) è compatto. 

Otteniamo quindi, come corollari di immediata dimostrazione:


Corollario 2.8. Ogni intervallo chiuso [a, b] di R è compatto.
Corollario 2.9. Ogni sottoinsieme chiuso e limitato di R è compatto.
Corollario 2.10. Siano X e Y due spazi topologici omeomorfi. X è com-
patto se e solo se Y è compatto (ovvero la compattezza è una proprietà
topologica).
Teorema 2.11. Siano X e Y spazi topologici. Allora X e Y sono entrambi
compatti se e solo se X + Y è compatto, se e solo se X × Y è compatto.
Dimostrazione. X + Y compatto ⇒ X e Y compatti. X e Y sono chiusi di
X + Y . Pertanto per il teorema 2.4 sono compatti.
X, Y compatti ⇒ X + Y compatto. Sia F un ricoprimento di X + Y .
Allora è un ricoprimento di X e un ricoprimento di Y . Esistono pertanto
due sottofamiglie finite che ricoprono rispettivamente X e Y . La loro unione
è una sottofamiglia finita che ricopre X + Y .
TOPOLOGIA 15

X × Y compatto ⇒ X e Y compatti. Le proiezioni πX : X × Y → X e


πY : X × Y → Y sono continue. Pertanto per il teorema 2.7 X e Y sono
compatti.
X e Y compatti ⇒ X × Y compatto. Sia W un ricoprimento aperto di
X × Y . Siccome per ogni punto di X × Y esiste un rettangolo aperto U × V
contenuto in uno degli aperti di W tale che x ∈ U × V , basta dimostrare
che dai ricoprimenti di X× fatti di rettangoli aperti si può estrarre un sot-
toricoprimento finito per dimostrarlo anche per un ricoprimento qualsiasi.
Possiamo pertanto supporre che gli elementi di W siano tutti rettangoli
aperti: W = {Vλ × Uλ }λ∈Λ .
Sia x ∈ X fissato. La famiglia
Vx = {Vλ | λ ∈ Λ, x ∈ Uλ }
è un ricoprimento aperto di Y . Quindi esiste un numero finito di tali aperti,
diciamo V1,x , . . . , Vn(x),x che ricopre Y . Pertanto gli aperti Uj,x × Vj,x , al
variare di j = 1, . . . , n(x), ricoprono {x} × Y .
Se poniamo
n(x)
\
Ux = Uj,x ,
j=1
si ottiene che gli aperti Ux × Vj,x ⊂ Uj,x × Vj,x , al variare di j = 1, . . . , n,
ricoprono ancora {x} × Y .
Ovviamente gli aperti Ux ricoprono X, e poiché X è compatto, ne esistono
un numero finito Ux1 , . . . , Uxk che ricoprono X. Ma allora X × Y è ricoperto
da Uxi × Vj,xi al variare di i = 1, . . . , k e j = 1, . . . , n(xi ), e quindi a maggior
ragione dagli aperti Uj,xi × Vj,xi ∈ W al variare di i = 1, . . . , k e j =
1, . . . , n(xi ), che sono in numero finito. Pertanto X × Y è compatto. 
Segue immediatamente un corollario.
Corollario 2.12 (Teorema di Heine-Borel). Un sottoinsieme C ⊂ Rn (con
la topologia euclidea) chiuso e limitato è compatto.
In realtà vale il se e solo se. Lo vedremo dopo.

2.1. Un’utile proprietà.


Definizione 2.5. Uno spazio topologico X si dice di Hausdorff (o Haus-
dorff, o T2 ) se dati due punti distinti x, y ∈ X esistono due aperti U, V di
X disgiunti (U ∩ V = ∅) tali che x ∈ U , y ∈ V .
Osserviamo subito che uno spazio metrico è T2 . Infatti se x 6= y, d(x, y) =
d 6= 0 e le palle aperte di centri x e y di raggio d/2 soddisfano le proprietà
richieste grazie alla disuguaglianza triangolare.
Teorema 2.13. Sia X uno spazio T2 , e K ⊂ X un compatto. Allora K è
chiuso.
Dimostrazione. Dobbiamo dimostrare che X \ K è aperto. Sia x ∈ X \ K
e p ∈ K. Siccome X è T2 , esistono due aperti Up e Vp disgiunti tali che
x ∈ Up , p ∈ Vp . Pertanto la famiglia di aperti Vp è un ricoprimento di K al
16 A. SARACCO

variere di p ∈ K. Ma K è compatto, ed esiste quindi un sottoricoprimento


finito Vp1 , . . . , Vpn . Allora
n
\
Upj = Ux
j=1

è un aperto che contiene x e non interseca K. Pertanto X \ K è aperto. 

Attenzione: alcuni autori definiscono quasi compatti gli spazi che noi
abbiamo chiamato compatti, e definiscono compatto come quasi compatto
di Hausdorff. In questo modo i compatti sono sempre chiusi.
Purtroppo in topologia è molto comune che non ci sia accordo sul signi-
ficato esatto di un certo termine. In ogni occasione cercate di chiarire qual
è la definizione usata.
Corollario 2.14. I compatti di Rn sono tutti e soli i chiusi limitati.
Dimostrazione. Un chiuso e limitato di Rn è contenuto nel prodotto di n
intervalli chiusi (che è compatto). Quindi è un chiuso in un compatto e
pertanto compatto.
Un compatto di Rn è chiuso per il teorema appena dimostrato.
Un compatto di Rn è limitato perchè se non lo fosse le palle di centro
l’origine e raggio n, Bn (0), costituirebbero un suo ricoprimento aperto che
non ammette sottoricoprimenti finiti. 
Corollario 2.15. Sia K un compatto. Una funzione f : K → R continua
ammette massimo e minimo.
Dimostrazione. L’immagine di K è un compatto di R, ovvero un chiuso
limitato. Poiché è limitata supK f e inf K f sono limitati, poiché è chiusa
sono valori assunti da f . 
Teorema 2.16. Una biiezione continua f : X → Y da uno spazio X com-
patto a uno spazio Y di Hausdorff è un omeomorfismo.
Dimostrazione. Dobbiamo dimostrare che f −1 : Y → X è continua o –
equivalentemente– che le immagini degli aperti di X sono aperti di Y o
–ancora– che le immagini dei chiusi di X sono chiusi di Y .
Sia C ⊂ X un chiuso. Allora è un compatto (teorema 2.4), e la sua
immagine f (C) ⊂ Y è un compatto (teorema 2.7) in uno spazio T2 , quindi
è un chiuso (teorema 2.13). 

2.2. La compattificazione di Alexandrov. Dato uno spazio topologico


non compatto X, sono di grande interesse le sue compattificazioni, ovvero
gli spazi topologici Y compatti tali che X è omeomorfo ad un sottospazio
denso di Y . Ne esistono di vari tipi. Vediamo qui la compattificazione più
piccola possibile, ovvero quella che si ottiene aggiungendo un solo punto
(detto punto improprio, o all’infinito) ad X.
Teorema 2.17. Sia (X, O) uno spazio topologico non compatto. Esiste uno
spazio topologico compatto (X̂, Ô) tale che X è omeomorfo a X̂ meno un
punto. Tale spazio si dice compattificazione di Alexandov di X.
TOPOLOGIA 17

Dimostrazione. Definiamo X̂ = X + {∞}. Per definire la topologia di X̂,


consideriamo come base
B̂ = O ∪ {A ∪ {∞} | X \ A chiuso e compatto di X} .
Questa è una base, poichè X̂ = X + {∞} ∈ B̂ e l’intersezione di due aperti
di B̂ è o un aperto di X o il complementare di un chiuso compatto di X (e
pertanto è in B̂.
Inoltre la restrizione della base a X è O. Pertanto la topologia O è la
restrizione della topologia Ô.
Resta da dimostrare che X̂ è compatto. Sia U un ricoprimento aperto di
X̂. Un aperto di U, diciamo U0 , è un intorno di ∞, pertanto contiene un
aperto di base della forma X̂ \ K, con K compatto (chiuso) di X. Estraiamo
un sottoricoprimento finito di K, U1 , . . . , Un . Allora U0 , U1 , . . . , Un ricopre
X̂. 
Osservazione 2.18. Se X è di Hausdorff gli intorni di ∞ sono semplice-
mente i complementari dei compatti di X (dato che sono chiusi).
Esercizio 2.2. Dimostrare che la compattificazione di Alexandrov di Rn è
(omeomorfa a) Sn .

3. Assiomi di separazione
L’assioma di Hausdorff fa parte di una vasta famiglia di assiomi, detti di
separazione, che hanno tutti la seguente struttura: Se due oggetti topologici
di X sono separati in questo senso debole, allora sono separati anche in
quest’altro senso più forte.
Gli assiomi di separazione prendono questo nome dal fatto che storica-
mente alcuni matematici includevano alcuni di essi nella definizione di cos’è
uno spazio topologico. Ad esempio Hausdorff, nella sua definizione di spazio
topologico, richiedeva che fosse soddisfatto l’assioma T2 . Ora si preferisce
dare una definizione più generale di spazio topologico e poi avere spazi che
verificano o meno certe proprietà di separazione.
Noi ci limiteremo a trattare alcuni degli assiomi di separazione.
Definizione 3.1. Uno spazio topologico X viene detto3:
T0 se per ogni coppia di punti distinti di X esiste un aperto che contine
uno di essi, ma non l’altro.
T1 se per ogni coppia x1 , x2 di punti distinti di X esistono due aperti
U1 e U2 tali che xi ∈ Ui , xj 6∈ Ui , i, j = 1, 2, i 6= j.
T2 se per ogni coppia x1 , x2 di punti distinti di X esistono due aperti
U1 e U2 disgiunti tali che xi ∈ Ui , i = 1, 2.
regolare se per ogni chiuso F ⊂ X e ogni punto x ∈ X \ F esistono due aperti
UF e Ux disgiunti tali che F ⊂ UF , x ∈ Ux .
3Purtroppo questa nomenclatura non è universalmente accettata: alcuni autori (ad
esempio [4]) invertono le definizioni di T3 e regolare, e quella di T4 e normale. Altri (ad
esempio [3]) considerano T3 e regolare sinonimi (di ciò che noi chiamiamo T3 ) e cosı̀ anche
T4 e normale. Occorre sempre prestare molta attenzione a cosa intende l’interlocutore
quando usa uno di questi termini.
I termini T0 , T1 , T2 sono universali (e a volte tali spazi vengono chiamati rispettivamente
Kolmogorov, Fréchet e Hausdorff).
18 A. SARACCO

T3 se è regolare e T1 .
normale se per ogni coppia di chiusi F1 , F2 disgiunti di X esistono due aperti
disgiunti U1 e U2 tali che Fi ⊂ Ui , i = 1, 2.
T4 se è normale e T1 .
Esercizio 3.1. Dimostrare che le definizioni date sono topologiche (ovvero
dati due spazi omeomorfi o soddisfano entrambi una delle condizioni o nes-
suno dei due la soddisfa).
Teorema 3.1. Uno spazio X è T0 se e solo se i suoi punti hanno famiglie
di intorni distinte (i punti sono topologicamente distinguibili).
Dimostrazione. Siano x1 e x2 due punti distinti di X.
Supponiamo che X sia T0 . Allora esiste un aperto U che è intorno di
uno dei due ma non dell’altro. Pertanto i punti sono topologicamente dis-
tinguibili.
Viceversa, supponiamo che i punti di X siano topologicamente distin-
guibili. Allora esiste un intorno I di uno dei due (diciamo x0 ) che non è
intorno dell’altro. Per definizione di intorno, esiste un aperto A ⊂ I intorno
di x0 che non contiene x1 . 
Teorema 3.2. Uno spazio X è T1 se e solo se i punti di X sono chiusi.
Dimostrazione. Supponiamo che i punti di x siano chiusi. Allora i punti
distinti x1 e x2 appartengono rispettivamente agli aperti X \ {x2 } e a X \
{x1 }.
Viceversa, sia X T1 e x ∈ X un punto. Dimostrare che {x} è chiuso è
equivalente a dimostrare che X \{x} è aperto. Sia x2 ∈ X \{x}. Allora esiste
un suo intorno aperto U2 che non contiene x, e pertanto x2 ∈ U2 ⊂ X \ {x}.
Siccome x2 era generico, ciò vuol; dire che X \ {x} è aperto. 
Corollario 3.3. Uno spazio topologico X con un numero finito di elementi
che sia T1 ha la topologia discreta. Pertanto è T2 , T3 , T4 .
Dimostrazione. I punti di X sono chiusi. Un sottoinsieme qualsiasi di X
è unione di un numero finito di punti e pertanto è chiuso. Quindi ogni
sottoinsieme di X è chiuso e aperto, ovvero la topologia di X è discreta. 
Teorema 3.4. Uno spazio X è T2 se e solo se la diagonale di X × X
∆ = {(x, x) ∈ X × X | x ∈ X}
è chiusa in X × X.
Dimostrazione. (⇒) Sia X T2 . Dimostrare che ∆ è chiuso è equivalente a
dimostrare che X × X \ ∆ è aperto. Sia pertanto (x, y) ∈ X × X \ ∆. Ciò
vuol dire x, y ∈ X, x 6= y. Poiché X è T2 , esistono due aperti disgiunti
U 3 x, V 3 y. Ma allora (x, y) ∈ U × V e (U × V ) ∩ ∆ = ∅. Pertanto
X × X \ ∆ è aperto.
(⇐) Sia ∆ chiuso in X × X. Ciò è equivalente a X × X \ ∆ aperto. Siano
x, y ∈ X, x 6= y. Allora (x, y) ∈ X × X \ ∆. Poichè tale insieme è aperto,
esiste un aperto della base U × V intorno di (x, y) contenuto in X × X \ ∆.
Ma ci‘o vuol dire che U 3 x e V 3 y sono disgiunti. Pertnato X è T2 . 
Osservazione 3.5. Banalmente si ha T2 ⇒ T1 ⇒ T0 .
TOPOLOGIA 19

Vediamo che i viceversa non valgono.


Esempio 3.1. Sia X = {x1 , x2 } con la topologia O = {∅, {x1 }, X}. X è
T0 (l’aperto {x1 } contine x1 ma non x2 ), ma non T1 (l’unico aperto che
contiene x2 è X, che contiene anche x1 ).
Esempio 3.2. Sia X un insieme infinito con la topologia cofinita (gli aperti
sono tutti e soli —a parte l’insieme vuoto— gli insiemi a complementare
finito). Allora X è T1 (perchè i punti sono chiusi), ma non è T2 , dato che
due qualsiasi aperti non banali non sono disgiunti.
O se vogliamo dato che ogni sottoinsieme (anche non chiuso) di X è
compatto, e in uno spazio T2 i compatti sono necessariamente chiusi.
Teorema 3.6. Le proprietà T0 , T1 e T2 passano ai sottospazi.
Dimostrazione. Lasciata per esercizio. 
Teorema 3.7. Siano X e Y spazi topologici non vuoti. X e Y sono Ti
(i = 0, 1, 2) se e solo se X × Y è Ti .
Dimostrazione. Sia x ∈ X, y ∈ Y . Se X × Y è Ti , allora i sottospazi X × {y}
e {x} × Y sono T2 , e cosı̀ X e Y , a cui sono omeomorfi.
Viceversa, siano X e Y Ti , e siano (x1 , y1 ), (x2 , y2 ) punti distinti di X ×Y .
Allora almeno una delle coordinate è distinta. Supponiamo sia x1 6= x2 .
Poichè X è Ti , esiste un aperto U o due aperti U1 , U2 con la proprietà
voluta per i punti x1 e x2 . L’aperto U × Y o gli aperti U1 × Y e U2 × Y
hanno la stessa proprietà per i punti (x1 , y1 ), (x2 , y2 ). 
Passiamo ora a considerare gli ultimi quattro assiomi.
Teorema 3.8. T4 ⇒ T3 ⇒ T2 ⇒ T1 ⇒ T0 .
Dimostrazione. Osserviamo innanzitutto che grazie all’assioma T1 i punti
degli spazi T3 o T4 sono chiusi.
Sia X T4 . Usando l’assioma di normalità con F1 = F , F2 = {x} si ottiene
l’assioma di regolarità. Insieme all’assioma T1 questo implica che X è T3 .
Sia X T3 . Usando l’assioma di regolarità con F = {x1 }, x = x2 si ottiene
l’assioma T2 . 
Osserviamo che l’assioma T1 serve a far sı̀ che si abbiano le catene di
implicazioni illustrate sopra.
Esempio 3.3. Uno spazio topologico X con almeno due punti e la topologia
banale è banalmente regolare e normale, ma non è T0 e pertanto non può
essere T2 .
Teorema 3.9. Uno spazio regolare e T0 è T3 .
Proof. Basta dimostrare che T0 e regolare implicano T1 .
Siano x1 e x2 punti distinti. Per l’assioma T0 uno dei due (diciamo x1 ) ha
un intorno aperto U che non contiene l’altro. Alora x1 e F = X \ U sono un
punto e un chiuso disgiunti e per l’assioma di regolarità li possiamo separare
con due aperti U1 3 x1 e U2 ⊃ X \ U 3 x1 . Quindi X è T1 .

Mostriamo con un esempio che vi sono spazi topologici T2 ma non T3 .
20 A. SARACCO

Esempio 3.4. Sia


X = R × R+ 2
0 = {(x, y) ∈ R | y ≥ 0}
il semipiano superiore chiuso di R2 .
Indichiamo con R = R × {0} e con X+ = X \ R il semipiano superiore
aperto. Definiamo una base B per la topologia di X nel seguente modo:
B = B1 ∪ B2 , dove
B1 = {Bx (r) | x = (x, y) ∈ X+ , r < y} ,
B2 = {(Bx (r) ∩ X+ ) ∪ {x} | x ∈ R} ,
dove Bx (r) sono le palle della metrica euclidea di R2 . La verifica che B è
una base è diretta ed è lasciata al lettore.
X è T2 . Infatti dati due punti x1 e x2 distinti, sono ad una distanza 2r,
e pertanto le palle euclidee centrate in essi di raggio r li separano. Pertanto
vi sono due elementi della base (di tipo B1 o B2 a seconda se i punti siano
in X+ o in R) di raggio r che separano nel modo voluto i due punti.
X non è T3 . Sappiamo già che X è T2 e quindi T1 . Dobbiamo pertanto
dimostrare che non è regolare. Osserviamo innanzitutto che la topologia di
S induce su R la topologia discreta, dato che per ogni punto (x, 0) ∈ R
((Bx (r) ∩ X+ ) ∪ {(x, 0)}) ∩ R = {(x, 0)} è un aperto, e che R è chiuso in X
(dato che X+ è unione degli elementi di B1 ). Pertanto ogni sottoinsieme di
R è chiuso.
Siano allora 0 = (0, 0) e F = R \ {0} un punto e un chiuso disgiunto.
Supponiamo che esistano due aperti U 3 0, V ⊃ R \ {0}. Siccome U è
aperto, allora esiste un elemento della base (B0 (r) ∩ X+ ) ∪ {0} contenuto
in U . Ogni aperto contenente (x, 0) (con |x| ≤ r) interseca tale aperto, e
quindi anche U . Pertanto U e V non sono disgiunti e X non è regolare.
Teorema 3.10. Sia X uno spazio topologico regolare, e siano F un chiuso
di X e x 6∈ F . Allora esistono due aperti U1 ⊃ F e U2 3 x a chiusura
disgiunta.
Dimostrazione. Poichè X è regolare, esistono due aperti disgiunti V1 ⊃ F e
V2 3 x. Allora C = X \ V2 e x sono un chiuso e un punto di X disgiunti.
Applicando di nuovo la regolarità di X troviamo due aperti disgiunti W1 ⊃ C
e W2 3 x.
Poniamo allora U1 = V1 e U2 = W2 . Si ha che U1 ⊃ C = X \ V2 ⊃ V1 ⊃ F
e U2 3 x. Inoltre W1 ⊃ C = X \ V2 ⊃ U1 . Siccome C è chiuso, C ⊃ U 1 .
Analogamente U 2 ⊂ X \ W1 e pertanto U 1 ∩ U 2 = ∅. 
Teorema 3.11. Sia X uno spazio topologico normale, e siano F1 e F2 due
chiusi disgiunti di X. Allora esistono due aperti Ui ⊃ Fi (i = 1, 2) a chiusura
disgiunta.
Dimostrazione. Analoga alla precedente. Lasciata per esercizio al lettore.

Vediamo ora alcuni esempi di spazi T4 .
Teorema 3.12. Uno spazio topologico metrizzabile X è T4 .
TOPOLOGIA 21

Dimostrazione. Sia d la metrica che induce la topologia di X.


Osserviamo innanzitutto che X è T1 : infatti, dati due punti distinti x1 e
x2 si ha d(x1 , x2 ) = δ. Allora le palle aperte U1 = Bx1 (δ) e U2 = Bx2 (δ)
sono tali che xi ∈ Ui , xi 6∈ Uj , i 6= j ∈ {1, 2}.
Dimosriamo ora che X è normale. Dato un qualsiasi sottoinsieme C ⊂ X
definiamo la funzione distanza da C nel seguente modo:
dC (x) = inf d(c, x) .
c∈C

Siano F1 e F2 due chiusi disgiunti di X. Poniamo di = dFi , i = 1, 2.


Definiamo gli insiemi U+ e U− nel seguente modo:
U± {x ∈ X | ± (d1 (x) − d2 (x)) < 0} .
È evidente che U+ ∩ U− = ∅. Dimostreremo che F1 ⊂ U+ , F2 ⊂ U− e che
U± sono aperti.
Supponiamo x ∈ F1 . Allora d1 (x) = 0. Per dimostrare che x ∈ U+ basta
far vedere che d2 (x) > 0. Se per assurdo fosse d2 (x) = 0, per ogni ε > 0
esisterebbe xε ∈ F2 tale che d(x, xε ) < ε. Ma allora x ∈ F 2 = F2 , contro
l’ipotesi che F1 e F2 siano disgiunti.
Pertanto F1 ⊂ U+ , e con la stessa dimostrazione F2 ⊂ U− .
Dimostriamo che U+ è aperto (anche questa volta la dimostrazione per U−
è identica). Sia x+ ∈ U+ . Allora d1 (x+ ) − d2 (x+ ) = −3a < 0. Dimostrando
che Bx+ (a) ⊂ U+ dimostriamo che U+ è aperto.
Sia x ∈ Bx+ (a). Allora d(x, x+ ) < a.

d1 (x) − d2 (x) = (d1 (x) − d1 (x+ )) + (d1 (x+ ) − d2 (x+ )) + (d2 (x+ ) − d2 (x))
= (d1 (x) − d1 (x+ )) − 3a + (d2 (x+ ) − d2 (x))
Per ogni fi ∈ Fi (i = 1, 2) si ha
d(x, fi ) ≤ d(x, x+ ) + d(x+ , fi ) < a + d(x+ , fi )
e passando all’estremo inferiore su Fi :
di (x) ≤ a + di (x+ ) , di (x) − di (x+ ) ≤ a , i = 1, 2 ,
da cui segue
d1 (x) − d2 (x) ≤ a − 3a + a = −a < 0 ,
ovvero che x ∈ U+ . Pertanto U+ è aperto.

Teorema 3.13. Sia X uno spazio T2 compatto. Allora X è T4
Dimostrazione. Poiché X è T2 , è T1 . Basta pertanto dimostrare che è nor-
male.
Siano F e G due chiusi disgiunti di X. Poichè X è compatto, F e G sono
compatti. Fissiamo due punti f ∈ F e g ∈ G. Poiché X è T2 , esistono due
aperti disgiunti Uf,g 3 f e Vf,g 3 g.
Fissato f ∈ F , gli aperti Vf,g , al variare di g ∈ G, sono un ricoprimento
aperto di G. Pertanto possiamo estrane un sottoricoprimento finito, fatto
22 A. SARACCO

dagli aperti Vf,gi , i = 1, . . . , n. Allora


n
\ n
[
Uf = Uf,gi 3 f Vf = Vf,gi ⊃ G
i=1 i=1
sono aperti disgiunti.
Gli aperti Uf , al variare di f ∈ F , sono un ricoprimento aperto di F .
Pertanto possiamo estrarne un sottoricoprimento finito, fatto dagli aperti
Ufi , i = 1, . . . , k. Allora gli aperti
k
[ k
\
U = U fi ⊃ F V = Vfi ⊃ G
i=1 i=1
sono disgiunti. 

4. Costruzione di funzioni continue su spazi topologici


Gli spazi normali sono l’ambiente giusto in cui è possibile costruire fun-
zioni continue a valori in R con determinate proprietà, del tutto simili a
quelle che si riescono a costruire in R, Rn e più in generale negli spazi
metrici.
4.1. Il lemma di Urysohn. Un problema fondamentale nella costruzione
di funzioni continue a valori in R è quello di, dati due insiemi disgiunti A e
B di uno spazio topologico X, trovare una funzione continua f : X → [0, 1]
tale che f |A ≡ 1, f |B ≡ 0.
Siccome f −1 (0) e f −1 (1) sono chiusi, il problema è risolvibile per A e B
se e solo se è risolvibile per A e B. Pertanto si può direttamente chiedere
che A e B siano chiusi disgiunti.
È condizione evidentemente necessaria alla risoluzione del problema che
X sia normale, dato che f −1 ([0, 12 )) e f −1 (( 21 , 1]) sono aperti disgiunti che
separano A e B. Questa condizione
‘e anche sufficiente. Si ha infatti:
Lemma 4.1 (di Urysohn). Sia X uno spazio topologico normale. Allora
per ogni coppia di insiemi chiusi disgiunti esiste una funzione continua f :
X → [0, 1] che assume il valore 0 su uno e il valore 1 sull’altro.
Dimostrazione. Costruiremo f : X → [0, 1] come limite di funzioni costanti
a tratti.
Siano A e B due chiusi disgiunti di X. Diremo che una catena crescente
di lunghezza r di aperti Ai di X
A ⊂ A0 ⊂ A1 ⊂ · · · ⊂ Ar−1 ⊂ Ar = X \ B
è ammissibile se Aj ⊂ Aj+1 per ogni j ∈ {0, . . . , r − 1}.
La funzione f{Ai } : X → [0, 1], costante sui gradini, che assume il valore 0
su A0 , il valore kr su Ak \ Ak−1 e il valore 1 su B è detta funzione uniforme
a gradini della catena {Ai }ri=1 .
Data una catena ammissibile di lunghezza r, un suo raffinamento è una
catena ammissibile di lunghezza 2r del tipo
A ⊂ A0 ⊂ A01 ⊂ A1 ⊂ · · · ⊂ Ar−1 ⊂ A0r ⊂ Ar = X \ B .
Vogliamo innanzitutto dimostrare due cose:
TOPOLOGIA 23

(1) esiste una catena ammissibile;


(2) ogni catena ammissibile può essere raffinata.
(1) A e B sono due chiusi di X. Poiché X è normale, per il teorema 3.11,
esistono due aperti a chiusura disgiunta V ⊃ A, U ⊃ B. La catena
A ⊂ A0 = V ⊂ A1 = X \ B ,
poiché A0 = V ⊂ X \U ⊂ X \B = A1 , è una catena ammissibile di lunghezza
1.
(2) Data una catena ammissibile, per raffinarla bisogna inserire tra ogni
due suoi aperti Aj ⊂ Aj+1 (con Aj ⊂ Aj+1 ) un nuovo aperto Aj ⊂ A0j+1 ⊂
0
Aj+1 (con Aj ⊂ A0j+1 e Aj+1 ⊂ Aj+1 ). Osserviamo che Aj e X \ Aj+1
sono due chiusi disgiunti di X. Applicando nuovamente il teorema 3.11 e
ragionando come nel punto (1) sopra si trova l’aperto A0j+1 voluto.
Chiamiamo ora U0 la catena di lunghezza 20 = 1 trovata al punto (1) e
sia Un+1 un raffinamento di Un per ogni n. Un è una catena ammissibile di
lunghezza 2n per ogni n. Sia fn la funzione uniforme a gradini della catena
Un . Allora la successione di funzioni fn : X → [0, 1] è monotona decrescente
e limitata dal basso da 0, quindi converge punto per punto ad una funzione
limite f = lim fn : X → [0, 1]. Sicomme fn |A ≡ 0 e fn |B ≡ 1 per ogni n si
ha che f |A ≡ 0 e f |B ≡ 1.
Bisogna ora dimostrare la continuità di f . Osserviamo che

X 1 1
|f (x) − fn (x)| ≤ j
= n
2 2
j=n+1

e che su ogni gradino aperto Aj+1 \ Aj−1 fn varia al più di 21n , si ottiene
1
che f non varia più di 2n−1 sul gradino Aj+1 \ Aj−1 (intorno aperto di x), e
pertanto è continua. 

4.2. Lemma di estensione di Tietze. Vediamo ora una generalizzazione


del lemma di Urysohn.
Lemma 4.2 (di estensione di Tietze). Sia X uno spazio topologico nor-
male. Ogni funzione continua f : A → [a, b] definita su un chiuso A di X è
restrizione di una funzione continua F : X → [a, b].
Osservazione 4.3. Il lemma di estensione di Tietze è effettivamente una
generalizzazione del lemma di Urysohn. Infatti, siano F0 e F1 due chiusi
disgiunti di X. Allora la funzione f : F0 ∪ F1 → [0, 1] definita come f |F0 ≡ 0
e f |F1 ≡ 1 è una funzione continua definita su un chiuso. Estendendola con
Tietze, si trova la funzione data dal lemma di Urysohn.
Dimostrazione. Se ϕ : A → [−3s, 3s] è una funzione continua limitata tale
che supA |ϕ| = 3s una funzione continua Φ : X → [−s, s] si dice estensione
approssimata 13 -chiusa di ϕ se |ϕ(a) − Φ(a)| ≤ 2s per ogni a ∈ A. Tale Φ è
dunque un’approssimazione grossolana del problema di estensione. L’idea è
quella di quasi approssimare f , poi quasi approssimare l’errore, e cosı̀ via.
L’esistenza di estensioni approssimate 31 -chiuse è garantito dal lemma
di Urysohn: gli insiemi A+ = ϕ−1 ([s, 3s]) e A− = ϕ−1 ([−3s, −s]) sono
disgiunti e chiusi in A, dunque in X. Pertanto esiste una funzione continua
24 A. SARACCO

Φ : X → [−s, s] che assume il valore s su A+ e il valore −s su A− . Tale


funzione è banalmente una estensione approssimata 13 -chiusa di ϕ.
Cerchiamo ora di estendere f : A → [a, b]. Senza perdere di generalità,
possiamo supporre che [a, b] = [−1, 1]. Sia F1 una estensione approssimata
1 1
3 -chiusa di f e Fn+1 una estensione approssimata 3 -chiusa di
n
X
f− Fj |A .
j=1

Allora si ha
n  n
X 2
|f (a) − Fj (a)| ≤ , ∀a ∈ A, ∀n ∈ N ,
3
j=1

1 2 n
 
|Fn+1 (x)| ≤ , ∀x ∈ X, ∀n ∈ N ,
3 3
e ciò garantisce la sommabilità della serie F (x) = ∞
P
n=1 Fn (x) e il fatto che
F : X → [−1, 1] è un’estensione continua di f . 
Corollario 4.4. Sia X uno spazio topologico normale. Ogni funzione con-
tinua f : A → R definita su un chiuso A di X è restrizione di una funzione
continua F : X → R.
Dimostrazione. Consideriamo la funzione
 π π
ϕ = arctan(f ) : A → − ,
2 2
e estendiamola ad una funzione
h π πi
Φ:X→ − , .
2 2
La funzione Φ potrebbe assumere i valori ± π2 , su cui non è definita la
tangente (obbligatoriamente su un chiuso B disgiunto da A). Sia allora
λ : X → [0, 1] una funzione tale che λ|A ≡ 1, λ|B ≡ 0, che esiste per il
lemma di Urysohn. Allora
 π π
λΦ : X → − ,
2 2
estende anch’essa la funzione ϕ, e F = tan(λΦ) è la funzione cercata. 
4.3. Partizioni dell’unità e paracompattezza. Vediamo ora uno stru-
mento, la partizione dell’unità, che sarà di grande utilità nei successivi corsi
di analisi e di geometria. Vedremo esattamente quali sono le ipotesi minimali
che permettono di avere partizioni dell’unità.
Definizione 4.1. Sia X uno spazio topologico. Data una funzione continua
f : X → C, il supporto di f , Supp(f ), è
Supp(f ) = {x ∈ X | f (x) 6= 0} .
Definizione 4.2. Sia X uno spazio topologico. Una famiglia di sottoinsiemi
di X, {Aλ }λ∈Λ è detta localmente finita se per ogni punto x ∈ X esiste un
intorno V di x tale che V ∩ Aλ 6= ∅ per un numero finito di λ ∈ Λ.
Definizione 4.3. Sia X uno spazio topologico. Una famiglia {τλ }λ∈Λ di
funzioni continue τλ : X → [0, 1] è detta partizione dell’unità se:
TOPOLOGIA 25

(1) i supporti {Supp(τλ )}λ∈Λ sono una famiglia localmente finita;


(2) per ogni x ∈ X
X
τλ (x) = 1 .
λ∈Λ
Una partizione dell’unità è detta subordinata a un dato ricoprimento U di
X se per ogni λ esiste U ∈ U tale che Supp(τλ ) ⊂ U .
Le partizioni dell’unità hanno molti scopi. Fra questi passare da soluzioni
locali note di un problema a soluzioni globali, incollando fra loro le varie
soluzioni. Oppure lo spezzare un integrale definito su una varietà in più
pezzi definiti su carte locali per poter poi comodamente integrare i vari
pezzi su aperti di Rn .
L’esistenza di partizioni dell’unità subordinate a un dato ricoprimento
aperto è collegata alla nozione di paracompattezza.
Definizione 4.4. Uno spazio topologico X di Hausdorff è detto paracom-
patto se ogni ricoprimento aperto U ammette un raffinamento V (ovvero V
è un ricoprimento aperto di X tale che ogni suo aperto è contenuto in un
aperto di U) localmente finito.
Osservazione 4.5. Uno spazio topologico compatto di Hausdorff è banal-
mente paracompatto, dato che come raffinamento localmente finito di U si
può scegliere direttamente un suo sottoricoprimento finito.
Osservazione 4.6. Un sottospazio chiuso di uno spazio paracompatto è
paracompatto.
Teorema 4.7. Sia X paracompatto. Allora X è T4 .
Dimostrazione. Siano A e B due chiusi disgiunti di X. Siano a ∈ A, b ∈ B
fissati. Poichè X è T2 possiamo scegliere due aperti Ua,b 3 a e Va,b 3 b
disgiunti.
Fissato a ∈ A, gli aperti Va,b sono un ricoprimento di B. Poiché B è
chiuso, è paracompatto e quindi esiste un raffinamento localmente finito di
{Va,b }, {Wa,λ }. Definiamo
[
Va = Wa,λ ⊃ B .
λ

Per la finitezza locale di {Wa,λ }, esiste un intorno Ia 3 a che interseca solo


un numero finito di questi Wa,λ . Siano tali insiemi contenuti in ∪ni=1 Va,bi .
Allora
\n
Ua = Ia Ua,bi 3 a
i=1
è disgiunto da Va .
Gli aperti Ua sono un ricoprimento di A. Poiché A è chiuso, è para-
compatto e quindi esiste un raffinamento localmente finito di {Ua }, {Wλ }.
Sia
[
U = Wλ .
λ
26 A. SARACCO

Se per ogni b ∈ B troviamo un intorno aperto Ob 3 b che non interseca


U , allora [
V = Ob ⊃ B
b∈B
è l’aperto desiderato.
Per la finitezza locale di Wλ , esiste un intorno Ib 3 b che interseca solo un
numero finito di questi Wλ . Siano tali insiemi contenuti in ∪ki=1 Uai . Allora
k
\
Ob = Ib Vai 3 b
i=1
è disgiunto da U . 
Teorema 4.8. Sia X uno spazio di Hausdorff. X è paracompatto se e
solo se ogni ricoprimento aperto di X ammette una partizione dell’unità
subordinata.
Dimostrazione. (⇐) Sia U un ricoprimento di X e {τλ } una partizione
dell’unità subordinata a U. Allora gli aperti Vλ = {τλ 6= 0} formano un
raffinamento localmente finito di U. Poichè X è di Hausdorff, X è paracom-
patto.
(⇒) Sia U = {Uλ }λ un ricoprimento di X. Senza perdere di generalità,
poichè X è paracompatto, possiamo supporre che sia localmente finito.
Supponiamo che esista un ricoprimento aperto V = {Vλ }λ tale che per
ogni λ V λ ⊂ Uλ . Allora, poiché X è T4 , per il lemma di Urysohn scegliamo
σλ : X → [0, 1] con σλ |V λ ≡ 1 e σλ |X\U λ ≡ 0. Poiché Supp σλ ⊂ Uλ , la
P
somma λ σλ (x) è ben definita ovunque. Poiché V è un ricoprimento di
X tale somma è maggiore o uguale a 1 ovunque. Quindi si può definire la
partizione dell’unità voluta come
σλ (x)
τλ (x) = P , x ∈ X, .
λ σλ (x)
Bisogna provare che un tale V esiste. Sia x ∈ X. x ∈ Uλ per un qualche
λ. Poiché X è T3 possiamo separare x e X \ Uλ con intorni aperti Yx 3 x e
Zx ⊃ X\Uλ . Di conseguenza x ∈ Yx ⊂ Y x ⊂ Uλ . {Yx }x∈X è un ricoprimento
aperto di X. Sia W = {Wα }α un suo raffinamento localmente finito. Sia
[
Vλ = Wα .
W α ⊂Uλ

Allora V = {Vλ }λ è un raffinamento di U. Dobbiamo dimostrare che, per


ogni λ, V λ ⊂ Uλ .
Sia x ∈ V λ . Allora ogni intorno di x interseca un qualche Wα la cui
chiusura è contenuta interamente in Uλ . Poichè W è localmente finito, un
aperto sufficientemente piccolo di x interseca solo un numero finito di tali
aperti, Wα1 , . . . , Wαn e x appartiene alla chiusura di almeno uno di essi.
Quindi
[n [n
x∈ W αi = W αi ⊂ U λ ,
i=1 i=1
provando che V λ ⊂ Uλ . 
TOPOLOGIA 27

5. Proprietà di connessione
Vedremo ora una proprietà elementare degli spazi topologici che ci per-
mette di distinguere tra spazi tutti di un pezzo e spazi divisi in più pezzi.
5.1. Connessione.
Definizione 5.1. Uno spazio topologico X si dice connesso se non è unione
di due aperti disgiunti non vuoti.
Teorema 5.1. Uno spazio topologico X è connesso se e solo se ∅ e X sono
gli unici sottoinsiemi di X aperti e chiusi.
Dimostrazione. (⇒) Supponiamo per assurdo che A ⊂ X sia un sottoinsieme
aperto e chiuso A 6= X, A 6= ∅. Allora B = X \ A è anch’esso aperto e non
vuoto. Quindi X = A ∪ B con A e B aperti disgiunti e non vuoti, cioè X
non è connesso.
(⇐) Supponiamo per assurdo che X non sia connesso, ovvero che X =
A ∪ B con A e B aperti disgiunti e non vuoti. Allora A 6= X (perché B non
è vuoto), A 6= ∅, A è aperto e chiuso (perché X \ A = B è aperto). 
Esempio 5.1. Lo spazio topologico con un solo punto è connesso, in quanto
due suoi aperti non possono essere non vuoti e disgiunti.
Esempio 5.2. Sia (X, D) uno spazio topologico con almeno due punti con
la topologia discreta. Allora sappiamo che tutti i suoi punti sono aperti e
chiusi. Pertanto X non è connesso.
Esempio 5.3. Sia (X, Px0 ) uno spazio topologico con la topologia del punto
particolare: un insieme non vuoto A ⊂ X è aperto se e solo se contiene il
punto particolare x0 . Allora due aperti non vuoti hanno sempre in comune
il punto x0 e pertanto non possono essere disgiunti. Quindi X è connesso.
Esempio 5.4. Sia F la topologia su R che ha come base di aperti gli inter-
valli della forma [t, s). Allora un qualsiasi sottoinsieme di (R, F) con almeno
due punti non è connesso. Siano infatti x < y ∈ S. Allora A = (−∞, y) ∩ S
e B = [y, +∞) ∩ S sono due aperti non vuoti disgiunti tali che A ∪ B = S.
Esempio 5.5. Sia Q ⊂ R l’insieme dei numeri razionali con la topologia
indotta dalla topologia euclidea. Sia S ⊂ Q un qualsiasi insieme con almeno
due punti. Allora S non è connesso. Infatti, siano x, y ∈ Q due punti
distinti. Allora fra essi vi è un numero irrazionale α: x < α < y. Gli insiemi
A = (−∞, α) ∩ S e B = (α, +∞) ∩ S sono aperti non vuoti disgiunti tali che
A ∪ B = S.
Teorema 5.2. L’intervallo [0, 1] ⊂ R (con la topologia euclidea) è connesso.
Dimostrazione. Supponiamo per assurdo che [0, 1] non sia connesso, ed es-
istano pertanto due aperti disgiunti non vuoti U e V tali che [0, 1] = U ∪ V
(quindi U e V sono anche chiusi). Supponiamo che 0 ∈ U .
Sia s = inf x∈V x. s ∈ V poichè V è chiuso. Ma per definizione di s, o
s = 0 (e allora s ∈ U ) oppure [0, s) ⊂ U . Poichè U è chiuso, s ∈ U . Assurdo,
poichè U e V sono disgiunti. 
Teorema 5.3. L’immagine di uno spazio connesso attraverso una funzione
continua è connesso.
28 A. SARACCO

Dimostrazione. Sia f : X → Y una funzione continua e X connesso. Sia


A ⊂ f (X) aperto e chiuso in f (X). Allora f −1 (U ) è aperto e chiuso in X.
Poiché X è connesso f −1 (U ) o è vuoto o è X. Riapplicando f , si ottiene
che U o è vuoto o è f (X). Pertanto f (X) è connesso. 
Corollario 5.4. La proprietà di connessione è topologica, ovvero se X e Y
sono spazi omeomorfi, X è connesso se e solo se Y è connesso.
Esempio 5.6. Poiché S1 è immagine continua di [0, 1] tramite la funzione
t 7→ exp(2πit), S1 è connesso.
Esempio 5.7. [a, b] è connesso.
Teorema 5.5. Sia {Yλ }λ∈Λ una famiglia di sottospazi connessi di uno spazio
X. Se ∩λ Yλ 6= ∅, allora Y = ∪λ Yλ è connesso.
Dimostrazione. Sia U ⊂ Y aperto e chiuso non vuoto. Allora Uλ = U ∩Yλ 6=
∅ per un qualche λ. Allora Uλ è aperto e chiuso non vuoto in Yλ . Poichè
Yλ è connesso, Uλ = Yλ , e pertanto Yλ ⊂ U . Quindi U interseca ogni Yλ
e, ripetendo il ragionamento precedente, si ottiene che contiene ogni Yλ .
Pertanto U = Y , e Y è connesso. 
Corollario 5.6. Gli insiemi [a, b), (a, b), (a, b], [a, +∞), (a, +∞), (−∞, b],
(−∞, b), R sono connessi.
Dimostrazione. Tutti quegli intervalli possono essere scritti come unione
crescente di intervalli chiusi, e il risultato segue dal teorema precedente.
I dettagli al lettore. 
Teorema 5.7. Siano X e Y due spazi topologici non vuoti. X e Y sono
connessi se e solo se X × Y è connesso.
Osservazione 5.8. L’ipotesi X e Y non vuoti è fondamentale. Infatti,
qualunque sia X, anche non connesso, X × ∅ = ∅ è connesso.
Dimostrazione del teorema 5.13. (⇐) Le proiezioni su X e su Y sono fun-
zioni continue, pertanto se X × Y è connesso, anche X e Y lo sono.
(⇒) Se X e Y sono connessi, anche le “fette” X × {y} e {x} × Y (a loro
omeomorfe) lo sono. Poichè (X × {y}) ∩ ({x} × Y ) = {x} × {y}, per il
teorema 5.5 gli insiemi Cx,y = (X × {y}) ∪ ({x} × Y ) sono connessi, per ogni
x ∈ X, y ∈ Y . Fissato x ∈ X, si ha che
[
X ×Y = Cx,y .
y∈Y

Poiché \
Cx,y = {x} × Y 6= ∅
y∈Y
nuovamente per il teorema 5.5, X × Y è connesso. 

5.2. Connessione per archi. Vediamo ora una nozione collegata a quella
di connessione: la connessione per archi.
Da qui in avanti utilizzeremo molto spesso l’intervallo [0, 1] ⊂ R con la
topologia euclidea. Per brevità, lo indicheremo con I.
TOPOLOGIA 29

Definizione 5.2. Sia X uno spazio topologico. Un arco (o cammino) in X


è un’applicazione continua α : I → X.
Come notazione, α(0) è detto inizio dell’arco e α(1) fine dell’arco, e α è
detto un arco da α(0) a α(1).
La variabile t ∈ I viene spesso interpretata come tempo, α(t) rappresenta
la posizione al tempo t, e α(0) e α(1) le posizioni iniziale e finale.
Definizione 5.3. Uno spazio topologico X è detto connesso per archi se
per ogni coppia di punti x, y ∈ X esiste un arco in X con inizio in x e fine
in y.
Ovviamente I è connesso per archi.
Teorema 5.9. Uno spazio X connesso per archi è connesso.
Proof. Supponiamo per assurdo che X = A ∪ B, con A e B aperti disgiunti
non vuoti. Sia a ∈ A e b ∈ B. Consideriamo un arco α con inizio in a e fine
in b (esiste perché X è connesso per archi). Allora I = α−1 (A) ∪ α−1 (B),
con 0 ∈ α−1 (A), 1 ∈ α−1 (B). Inoltre A e B sono aperti poiché α è continua
e banalmente disgiunti. Quindi I non è connesso. Assurdo. 

Il viceversa non è vero:


Esempio 5.8. (la pulce e il pettine) Consideriamo i seguenti sottoinsiemi
di R2 : il pettine
  
1 2
P = , y ∈ R | n ∈ N∗, y ∈ I ∪ I × {0}
n
e la pulce
p = {(0, 1)}.
Lo spazio topologico X = p ∪ P (la pulce e il pettine) è connesso, ma non
connesso per archi. Il pettine è connesso per archi, ma la pulce non può
essere collegata a nessun punto del pettine tramite un arco. Tutti gli intorni
aperti della pulce intersecano però il pettine.
Valgono per la connessione per archi i seguenti teoremi, del tutto analoghi
a quelli dimostrati per la connessione. Le dimostrazioni, molto semplici, sono
lasciate per esercizio al lettore.
Teorema 5.10. L’immagine di uno spazio connesso per archi attraverso
una funzione continua è connesso per archi.
Corollario 5.11. La proprietà di connessione per archi è topologica, ovvero
se X e Y sono spazi omeomorfi, X è connesso per archi se e solo se Y è
connesso per archi.
Teorema 5.12. Sia {Yλ }λ∈Λ una famiglia di sottospazi connessi per archi
di uno spazio X. Se ∩λ Yλ 6= ∅, allora Y = ∪λ Yλ è connesso per archi.
Teorema 5.13. Siano X e Y due spazi topologici non vuoti. X e Y sono
connessi per archi se e solo se X × Y è connesso per archi.
30 A. SARACCO

5.3. Versioni locali delle proprietà di connessione. Data una pro-


prietà topologica P, si dice che uno spazio X verifica localmente la proprietà
P se per ogni punto x ∈ X e per ogni intorno U 3 x esiste un intorno V
(x ∈ V ⊂ U ) tale che V ha la proprietà P.
In particolare, consideriamo le seguenti definizioni.
Definizione 5.4. Uno spazio topologico X si dice localmente connesso se
per ogni punto x ∈ X e per ogni intorno U 3 x esiste un intorno V (x ∈
V ⊂ U ) connesso.
Definizione 5.5. Uno spazio topologico X si dice localmente connesso per
archi se per ogni punto x ∈ X e per ogni intorno U 3 x esiste un intorno V
(x ∈ V ⊂ U ) connesso per archi.
Come per le proprietà locali, anche in questo caso si ha che
Teorema 5.14. Sia X uno spazio topologico localmente connesso per archi.
Allora X è localmente connesso.
Dimostrazione. È una conseguenza immediata delle definizioni e del teo-
rema 5.9. 
Anche in questo caso “la pulce e il pettine”costituisce un controesempio
al viceversa.
È importante osservare che non c’è alcun legame tra la proprietà di con-
nessione (per archi) globale e la sua versione locale, come mostrato dai
seguenti esempi.
Esempio 5.9. Sia X 6= ∅ connesso (per archi). Allora X + X è banalmente
non connesso (per archi), mentre è localmente connesso (per archi).
Esempio 5.10. La pulce e il pettine è connesso ma non localmente connesso
(vicino alla pulce).
Esempio 5.11. Aggiungendo alla pulce e il pettine un “filo” che colleghi la
pulce alla costa del pettine si ottiene uno spazio connesso per archi, ma non
localmente connesso per archi (vicino alla pulce).
L’analisi dettagliata degli esempi è lasciata per esercizio al lettore.

6. Omotopia
Definizione 6.1. Siano X e Y spazi topologici e f0 , f1 : X → Y funzioni
continue. f0 e f1 sono dette omotope se esiste un’applicazione continua
F : X × I → Y tale che F (x, 0) = f0 (x) e F (x, 1) = f1 (x) per ogni x ∈ X.
L’applicazione F si dice omotopia tra f0 e f1 .
Scriveremo f0 ≈ f1 o F : f0 ≈ f1 .
Si può pensare un’omotopia F come una famiglia di funzioni ft che varia
con continuità da f0 a f1 .
Osservazione 6.1. Se X = I, ogni arco è omotopo a un arco costante (al
cammino costante nel punto finale, nel punto iniziale, o in un qualsiasi suo
punto). Lasciamo al lettore la dimostrazione di questo fatto.
Pertanto se Y è connesso per archi tutti gli archi in Y sono omotopi tra
loro.
TOPOLOGIA 31

Onde evitare questo fenomeno, introduciamo una nozione più generale di


omotopia.
Definizione 6.2. Siano X e Y spazi topologici, A ⊂ X e f0 , f1 : X → Y
funzioni continue. f0 e f1 sono dette omotope relativamente ad A se esiste
un’applicazione continua F : X ×I → Y tale che F (x, 0) = f0 (x) e F (x, 1) =
f1 (x) per ogni x ∈ X, e F (a, t) = f0 (a) per ogni t ∈ I.
L’applicazione F si dice omotopia relativa ad A tra f0 e f1 .
Scriveremo f0 ≈A f1 o F : f0 ≈A f1 .
Osservazione 6.2. Ovviamente affinché f0 e f1 siano omotope relativa-
mente ad A è condizione necessaria che f0 (a) = f1 (a) per ogni a ∈ A.
Se A = ∅, ritroviamo il concetto di omotopia.
Per dimostrare che l’omotopia realtiva ad A è una relazione d’equivalenza,
ci serve dimostrare il seguente lemma di incollamento (glueing o pasting
lemma, in inglese).
Lemma 6.3 (d’incollamento). Siano X, Y spazi topologici e A, B sottoin-
siemi di X, entrambi aperti (o entrambi chiusi). Se f : A → Y e g : B → Y
sono funzioni continue tali che f (x) = g(x) per ogni x ∈ A ∩ B, allora la
funzione h : X → Y 
f (x) x ∈ A
h(x) =
g(x) x ∈ B
è continua.
Dimostrazione. Grazie all’ipotesi f (x) = g(x) per ogni x ∈ A ∩ B, h è ben
definita.
Sia D ⊂ Y un aperto (un chiuso). Allora
h−1 (D) = h−1 (D)∩(A∪B) = (h−1 (D)∩A)∪(h−1 (D)∩B) = f −1 (D)∪g −1 (D).
Poichè f è continua f −1 (D) è aperto (chiuso) in A, e poichè A è aperto
(chiuso) in X, è aperto (chiuso) anche in X. Analogamente per g −1 (D).
Pertanto h−1 (D) è aperto (chiuso), e h è continua. 
Lemma 6.4. La relazione ≈A è una relazione d’equivalenza sull’insieme
delle funzioni continue da X a Y .
Dimostrazione. La relazione è riflessiva: F (x, t) = f (x) è un’omotopia rela-
tiva ad A fra f e f .
La relazione è simmetrica: se F : f0 ≈A f1 , allora G : f1 ≈A f0 , G(x, t) =
F (x, 1 − t).
La relazione è transitiva: siano F : f0 ≈A f1 e G : f1 ≈A f2 . Allora
H : X × I → Y definita come
t ∈ 0, 21 
  
F (x, 2t)
H(x, t) =
G(x, 2t − 1) t ∈ 12 , 1
è continua per il lemma di incollamento ed è quindi un’omotopia relativa ad
A tra f0 e f2 , come voluto. 
Definizione 6.3. Due spazi topologici X e Y sono detti omotopicamente
equivalenti (X ≈ Y ) se esistono due funzioni continue f : X → Y e g : Y →
X tali che
g ◦ f ≈ idX : X → X, f ◦ g ≈ idY : Y → Y.
32 A. SARACCO

L’equivalenza omotopica è una relazione d’equivalenza nell’insieme negli


spazi topologici.
La nozione di equivalenza omotopica generalizza quindi quella di omeo-
morfismo. Due spazi omeomorfi sono infatti banalmente omotopicamente
equivalenti, dato che f ◦ g = idX e f ◦ g = idY . Il viceversa non è vero, come
mostrato dal seguente esempio.
Esempio 6.1. Rn ≡ {0}. Infatti, definiamo f (x) = 0 per ogni x ∈ Rn
e g(0) = 0. Allora f ◦ g = id{0} , mentre g ◦ f (x) = 0 per ogni x ∈ Rn .
Ma la funzione costantemente 0 e la funzione costante in Rn sono omotope:
l’omotopia è data da F (x, t) = tx.
Osserviamo che l’esempio precedente mostra anche che un qualsiasi aperto
stellato di Rn è omotopicamente equivalente a un punto.
Definizione 6.4. Uno spazio topologico X omotopicamente equivalente a
un punto si dice contraibile.

7. Il gruppo fondamentale
Lo scopo di questa sezione sarà quello di introdurre un’operazione tra cam-
mini ed una relazione d’equivalenza in modo tale da far diventare l’insieme
dei cammini un gruppo, che sarà un invariante topologico, utile a studiare
gli spazi topologici.
7.1. Cammini.
Lemma 7.1. Siano α e β due archi (o cammini) nello spazio topologico X,
tali che α(1) = β(0), ovvero la fine di α coincide con l’inizio di β. Allora è
definito un cammino in X, α ∗ β detto prodotto di α e β, nel seguente modo:
t ∈ 0, 12 
  
α(2t)
(α ∗ β)(t) =
β(2t − 1) t ∈ 21 , 1
Dimostrazione. È un’immediata conseguenza del lemma d’incollamento. 
Definizione 7.1. Due cammini in X, α e β, si dicono omotopi (come cam-
mini) se sono funzioni omotope relativamente ad A = {0, 1}.
Scriveremo α ' β.
Teorema 7.2. Se α0 ' α1 , β0 ' β1 e α0 ∗ β0 è ben definito, allora anche
α1 ∗ β1 è ben definito e α1 ∗ β1 ' α0 ∗ β0 .
Dimostrazione. Per definizione, due cammini omotopi hanno stesso inizio e
stessa fine. Pertanto α1 ∗ β1 è ben definito.
Siano F : α0 ' α1 e G : β0 ' β1 le omotopie di cammini. Un’omotopia
di cammini tra α0 ∗ β0 e α1 ∗ β1 è data da
t ∈ 0, 21 
  
F (s, 2t)
H(s, t) =
G(s, 2t − 1) t ∈ 12 , 1
H è continua per il lemma d’incollamento. 
Definizione 7.2. Sia α un cammino in X. Il cammino inverso α−1 è definito
da α−1 (t) = α(1 − t).
L’inizio di α−1 è la fine di α e viceversa. Inoltre (α−1 )−1 = α.
TOPOLOGIA 33

Teorema 7.3. Se α0 ' α1 , allora α0−1 ' α1−1 .


Dimostrazione. Se F : α0 ' α1 , allora un’omotopia tra α0−1 e α1−1 è
H(s, t) = F (s, 1 − t) .


Sia X uno spazio topologico e α un cammino in X. Con hαi denotiamo


la classe di '-equivalenza di α, ovvero l’insieme di tutti i cammini omotopi
ad α. Poiché cammini omotopi hanno lo stesso inizio e la stessa fine, l’inizio
e la fine di hαi sono ben definiti.
Definizione 7.3. Siano α e β due cammini in X tali che α ∗ β sia ben
definito. Allora definiamo
hαihβi = hα ∗ βi ,

hαi−1 = hα−1 i .
Le definizioni sono ben date grazie ai teoremi appena dimostrati.
Teorema 7.4. Per ogni x ∈ X, sia ex il cammino costante in X: ex (t) = x
per ogni t ∈ I. Allora
(1) se hαi ha origine in x0 , hex0 ihαi = hαi;
(2) se hαi ha fine in x1 , hαihex1 i = hαi;
(3) se hαi ha origine in x0 e fine in x1 , allora hαihαi−1 = hex0 i e
hαi−1 hαi = hex1 i;
(4) se (hαihβi)hγi è definito, allora (hαihβi)hγi = hαi(hβihγi).
Dimostrazione. (1) Un’omotopia di cammini tra ex0 ∗ α(s) e α(s) è data da
1−t
(
F (s, t) =
x0  s≤ 2
α 2s+t−1
1+t s ≥ 1−t
2

(2) Per dimostrare che α ∗ ex1 e α sono omotopi, osserviamo che x1 è il


punto iniziale di α−1 e che (α ∗ ex1 )−1 = ex1 ∗ α−1 e α−1 sono omotopi per
il punto (1). La tesi segue dal teorema 7.3.
(3) Basta dimostrare che α ∗ α−1 (s) è omotopo a ex0 (s) (per l’altra parte,
si scambiano i ruoli di α e α−1 . Un’omotopia è data da
s ∈ 0, 2t  ∪ 1 − 2t , 1
    
 x0
F (s, t) = α (t − 2s) s ∈  2t , 12
α (2 − 2s − t) s ∈ 21 , 1 − 2t
 

(4) Per dimostrare (α ∗ β) ∗ γ ' α ∗ (β ∗ γ), scriviamo esplicitamente i due


cammini
s ∈ 0, 14 
  
 α(4s)
(α ∗ β) ∗ γ(s) = β (4s − 1) s ∈  14 , 12
γ (2s − 1) s ∈ 21 , 1

s ∈ 0, 12 
  
 α(2s)
α ∗ (β ∗ γ)(s) = β (4s − 2) s ∈  12 , 34
γ (4s − 3) s ∈ 43 , 1

34 A. SARACCO

Un’omotopia tra i due cammini è data da


  
4s
 α t+1

 t ∈ [4s − 1, 1]
F (s, t) = (4s − t −
β  1) t ∈ [4s − 2, 4s − 1]
4s−t−2

 γ t ∈ [0, 4s − 2]

2−t


7.2. Il gruppo fondamentale. Siamo ora in grado, data una coppia spazio
topologico / punto (X, x), di definire un gruppo di cammini.
Corollario 7.5. Sia X uno spazio topologico e x0 ∈ X. L’insieme delle
classi di '-equivalenza di cammini con inizio e fine in x0 , π1 (X, x0 ), forma
un gruppo con le operazioni di prodotto e inverso definite prima. Si chiama
gruppo fondamentale o primo gruppo d’omotopia di (X, x0 ).
Dimostrazione. Segue immediatamente dal teorema 7.4. 
Dato uno spazio topologico X qualsiasi e due punti distinti x0 6= x1 ∈ X,
non possiamo aspettarci che ci siano relazioni tra π1 (X, x0 ) e π1 (X, x1 ). Ad
esempio se non esiste alcun cammino tra x0 e x1 (in particolare X non è
connesso per archi) c’è da immaginare che i due gruppi non abbiano niente
a che fare l’uno con l’altro.
Esempio 7.1. Consideriamo X = S1 ∪ {(0, 0)} ⊂ R2 . Allora π1 (X, (0, 0)) =
{he(0,0) i}, mentre il cammino α(t) = (cos(2πt), sin(2πt)) è un cammino non
omotopicamente equivalente al cammino costante4 in π1 (X, (1, 0)).
Se invece X è connesso per archi, le cose cambiano:
Teorema 7.6. Sia X uno spazio topologico connesso per archi, x0 , x1 ∈ X.
Esiste un isomorfismo di gruppi tra π1 (X, x0 ) e π1 (X, x1 ).
Dimostrazione. 

8. Rivestimenti
9. Il teorema di Seifert-Van Kampen
References
[1] K. Jänich: Topologia, viii+200. Zanichelli, 1994.
[2] C. Kosniowski: Introduzione alla topologia algebrica, vi+314. Zanichelli, 1988.
[3] I.M. Singer e J.A. Thorpe: Lecture notes on elementary topology and geometry,
viii+232. Springer, 1967.
[4] L.A. Steen e J.A. Seebach, Jr.: Counterexamples in topology. Second edition, xi+244.
Springer, 1978.

Dipartimento di Matematica, Università di Parma, Parco Area delle Scienze


53/A, I-43124 Parma, Italy
E-mail address: alberto.saracco@unipr.it

4Intuitivamente perché, facendo un giro intorno al buco, non può essere deformato con
continuità in un cammino che non gira intorno al buco. Dimostreremo rigorosamente
questo fatto in seguito
Stefano Francaviglia

TOPOLOGIA
Seconda Edizione
2020
c di Stefano Francaviglia. Tutti i diritti riservati.
ISBN: 978-1658028929
Indice

Prefazione alla seconda edizione 7

Prefazione 9

Capitolo 0. Preliminari 11
0.1. Uno spazio familiare: R2 11
0.2. La nozione di distanza in matematica 12
0.3. Uno spazio ordinato: R 15
0.4. La nozione d’ordine in matematica 16
0.5. Logicamente! 17
0.6. Insiemistica spicciola 20

Capitolo 1. Spazi topologici 25


1.1. Topologie: aperti, chiusi e compagnia bella 25
1.2. Basi. Topologia di Zariski e altri esempi 31
1.3. Intorni e convergenza di successioni 35
1.4. Sottospazi 37
1.5. Assiomi di numerabilità 39
1.6. Spazi di Hausdorff 41
1.7. Continuità, funzioni aperte e omeomorfismi 42
1.8. Esercizi 48

Capitolo 2. Costruzioni con spazi topologici 53


2.1. Prodotti di spazi topologici 53
2.2. Quozienti 56
2.3. Varietà topologiche, superfici e grafi 60
2.4. Esercizi 63

Capitolo 3. Compattezza 67
3.1. Ricoprimenti e compattezza 67
3.2. Il Teorema del Compatto-Hausdorff 72
3.3. Il Teorema di Tychonoff 73
3.4. Compattezza vs compattezza per successioni 74
3.5. Locale compattezza e compattificazioni 76
3.6. Esercizi 81

Capitolo 4. Connessione 85
4.1. Connessione 85
4.2. Componenti connesse 89
4.3. Connessione per archi 89
4.4. Locale connessione 91
4.5. Una piccola digressione: connessione di insiemi totalmente ordinati 94
3
4 INDICE

4.6. Esercizi 96

Capitolo 5. Topologia degli Spazi metrici 101


5.1. Spazi metrici, omotetie e isometrie 101
5.2. Proprietà di separazione degli spazi metrici e metrizzabilità 104
5.3. Cammini, lunghezze e geodetiche 105
5.4. Successioni di Cauchy e completezza 107
5.5. Completamento metrico 109
5.6. Compattezza in spazi metrici 112
5.7. Teorema di Ascoli-Arzelà 114
5.8. Esercizi 115

Capitolo 6. Topologia dal vivo 119


6.1. Riconoscere spazi diversi attraverso la connessione 119
6.2. Taglia e cuci 120
6.3. La topologia compatto-aperta 126
6.4. Gruppi topologici 128
6.5. Azioni di gruppi 130
6.6. Azioni continue, proprie e propriamente discontinue 134
6.7. La topologia degli spazi proiettivi 140
6.8. RP2 e la chiusura proiettiva di sottoinsiemi di R2 143
6.9. CP1 e la compattificazione di Alexandroff di sottoinsiemi di R2 145
6.10. Birapporto 146
6.11. Esercizi 147

Capitolo 7. Un pizzico di topologia algebrica: il gruppo fondamentale e i suoi amici 151


7.1. Omotopie e deformazioni 151
7.2. Gruppo fondamentale 155
7.3. Rivestimenti 159
7.4. Sollevamenti di cammini e omotopie 162
7.5. Fibre, grado e monodromia 165
7.6. Prime conseguenze importanti, Teorema del punto fisso di Brouwer e Teorema di
Borsuk-Ulam 165
7.7. Rivestimenti di grafi 168
7.8. Automorfismi di rivestimento 169
7.9. Esistenza del rivestimento universale e altre questioni 174
7.10. G-spazi 177
7.11. Il teorema di Van Kampen 181
7.12. Esercizi 184

Appendice A. Minicorso di aritmentica ordinale 189


A.1. La classe degli ordinali 189
A.2. Gli ordinali di Von Neumann 193
A.3. Aritmetica ordinale 194
A.4. Esercizi 195

Appendice B. Successioni generalizzate 199


B.1. Insiemi diretti e successioni generalizzate 199
B.2. Convergenza di successioni generalizzate e continuità 200
B.3. Sottosuccessioni generalizzate e compattezza 201
B.4. Filtri, convergenza e continuità 203
INDICE 5

B.5. Ultrafiltri e compattezza 205


B.6. Ultralimiti di successioni classiche 206
B.7. Esercizi 208
Prefazione alla seconda edizione

La seconda edizione è, per sua natura, una versione rivista e corretta della prima. In primo luogo,
sono stati corretti tutti gli errori scovati nella prima edizione (ma, ahimé! è certo che ne siano rimasti
alcni). Per quanto riguarda i contenuti, i capitoli che più hanno subito una ristrutturazione sono tre:
Il capitolo introduttivo (Capitolo 0), il Capitolo 6 (che ha pure cambiato nome) e il Capitolo 7 sulla
topologia algebrica.
Molta attenzione è stata data agli esempi ed esercizi proposti. Quantitativamente, essi sono quasi
raddoppiati: la seconda edizione conta infatti 444 esempi e 614 esercizi.

Stefano Francaviglia

Pianoro, Li 10/01/2020

7
Prefazione

Questo libro è pensato come libro di testo di un corso universitario di topologia per la laurea
triennale in matematica. Contiene nozioni di topologia generale, un assaggio di topologia alge-
brica (gruppo fondamentale e rivestimenti) e due appendici: un minicorso di aritmetica ordinale e
un’introduzione alla teoria delle successioni generalizzate e gli ultrafiltri.
Se non ci si vuole addentrare nella topologia algebrica, i primi sette capitoli (dal Capitolo 0 al Ca-
pitolo 6) costituiscono un corso completo di topologia generale. Le due appendici trattano argomenti
— spesso ingiustamente tralasciati per limiti di tempo o perché considerati a torto troppo complicati
— che ho voluto includere per la loro eccezionale bellezza e incredibile semplicità.
Di ogni teorema (tranne due: il Teorema dell’invarianza del dominio e il Teorema di metrizzabilità
di Uryshon) vi è una dimostrazione completa. La topologia è per sua natura famelica di esempi e
foriera di domande “ma se non fosse cosı̀...”. A testimonianza di ciò, questo libro contiene più di 600
tra esempi ed esercizi

Questo libro non ha una vera e propria bibliografia. Questo perché da studente ero uno che stu-
diava sugli appunti e quello che so di topologia me l’ha insegnato principalmente il mio professore
Fulvio Lazzeri. Non posso comunque fare a meno di citare, in ordine sparso e sicuro di scordarmene
qualcuno, i testi e gli autori che preferisco: Il meraviglioso Kosniowski (C. Kosniowski Introduzione
alla topologia algebrica); il classico Kelley (J. Kelley General Topology) con la sua famosa appendice sulla
teoria degli insiemi; il moderno, anzi contemporaneo, Manetti (M. Manetti Topologia); il buon vecchio
Sernesi (E. Sernesi Geometria 2); e il Fulton (W. Fulton Algebraic Topology, a first course) (da cui ho im-
parato una delle dimostrazioni del Teorema di Van Kampen); poi c’è la bibbia della logica (Handbook
of mathematical logic, J. Barwise editore); e quella della topologia algebrica dell’Hatcher (A. Hatcher
Algebraic Topology); l’imperdibile libro degli esempi (L.A. Steen and J.A. Seebach, Jr Counterexamples
in topology); lo Schaum di topologia (S. Lipschutz Topologia, collana Schaum teoria e problemi) con i suoi
650 esercizi risolti; infine il mitico, talvolta illeggibile ma sempre presente, Bourbaki (N. Bourbaki
serie Éléments de mathématique, in particolare Topologie générale e Topologie algébrique).
Nell’era del web e dei social non può mancare un cenno alle risorse online. Prima di tutto Wi-
kipedia. Oggi come oggi rappresenta uno strumento fondamentale per lo studio e la ricerca. Per la
matematica è fatto particolarmente bene. In un click si hanno definizioni (in mille varianti) note bi-
bliografiche e spesso dimostrazioni dei teoremi. È una specie di libro universale. Con in più il pregio
che nulla è garantito: chiunque può modificarlo e ciò forza (o almeno dovrebbe) ad una lettura iper-
critica e al controllo di ogni singolo passaggio, cosa che non si fa mai sulle dispense del professore.
Infine, voglio spezzare una lancia in favore di due siti di domande/risposte:
mathoverflow.net e math.stackexchange.com; se avete una curiosità basta chiedere.

Stefano Francaviglia

Pianoro, 17/02/2018

9
CAPITOLO 0

Preliminari

0.1. Uno spazio familiare: R2


Con ogni probabilità il lettore che inizia lo studio della topologia ha già incontrato nel suo cam-
mino il piano cartesiano R2 . Tale spazio è comunemente dotato della distanza Euclidea:
p
se P1 = (x1 , y1 ) e P2 = (x2 , y2 ) si ha dist(P1 , P2 ) = (x1 − x2 )2 + (y1 − y2 )2 .

R2
P1

xn+1

P2 xn
dist(P1 , P2 )
x

F IGURA 1. La distanza di Euclidea in R2

La distanza tra P1 e P2 corrisponde alla lunghezza del segmento che li congiunge. Si dice che una
successione (xn ) converge a x se la distanza tra xn e x tende a zero al crescere di n.
Attraverso la distanza si possono definire insiemi o luoghi classici, come la circonferenza di centro
P = (x0 , y0 ) e raggio R:
p
C(P, R) = {(x, y) ∈ R2 : (x − x0 )2 + (y − y0 )2 = R} = {(x, y) ∈ R2 : dist((x, y), P ) = R}
oppure la palla di centro P raggio R (indicata con B, da ball):
p
B(P, R) = {(x, y) ∈ R2 : (x − x0 )2 + (y − y0 )2 < R} = {(x, y) ∈ R2 : dist((x, y), P ) < R}
La definizione di palla ammette anche la variante “chiusa”, cioè con il “≤” al posto del “<”.

P R P R P R
C(P, R) = B(P, R) = B(P, R) =

F IGURA 2. Cerchi e palle in R2

11
12 0. PRELIMINARI

Spesso, la palla chiusa si indica con D, come disco, oppure con una B sormontata da un trattino:
p
D(P, R) = B(P, R) = {(x, y) ∈ R2 : (x − x0 )2 + (y − y0 )2 ≤ R} = {(x, y) ∈ R2 : dist((x, y), P ) ≤ R}.
Chiaramente B(P, R) = B(P, R) ∪ C(P, R).
La distanza Euclidea di R2 esprime un concetto di vicinanza quantificata: un punto che sta dentro
la palla di centro P e raggio 1 è più vicino a P di quanto lo sia un punto sul cerchio di centro P e raggio
25. Ancora, quando diciamo che “(xn ) converge a x” intendiamo dire semanticamente che i punti xn
si fanno sempre più vicini a x al crescere di n. Usando la terminologia delle palle, possiamo dire che
(xn ) converge a x se, per quanto piccolo sia il raggio R, la successione (xn ) sta dentro la palla B(x, R)
da un certo n in poi.
Diciamo che una funzione f è continua se, ogni qual volta che xn → x, si ha f (xn ) → f (x). Ciò
formalizza la nostra idea intuitiva di funzione continua come una funzione che “manda punti vicini
in punti vicini”.
La distanza serve anche a misurare la lontananza/vicinanza tra sottoinsiemi del piano. In gene-
rale, se A è un sottoinsieme di R2 e x ∈ R2 diciamo che la distanza tra x e A è
dist(x, A) = inf dist(x, a)
a∈A
2
e se B è un altro sottoinsieme di R poniamo
dist(A, B) = inf dist(a, b)
a∈A,b∈B

In questo modo, la distanza tra la palla di centro (0, 0) e raggio 1 e quella di centro (3, 0) e raggio
1, è esattamente 1, come ci si aspetterebbe.

B((0, 0), 1) B((3, 0), 1)


1

F IGURA 3. Distanza tra insiemi in R2

Per ogni punto a ∈ A, la distanza tra a e A è zero. Non vale però il viceversa: La distanza tra
B(P, R) e C(P, R) è esattamente zero. I punti di C(P, R) non stanno dentro la palla B(P, R), ma ne
sono infinitamente vicini, aderenti come la pellicola protettiva al display di uno smartphone.

0.2. La nozione di distanza in matematica


Quello che abbiamo visto per R2 lo possiamo fare in ogni spazio ove sappiamo misurare la
distanza tra punti. Tali spazi si chiamano spazi metrici. Ma andiamo con ordine.
Definizione 0.2.1. Sia X un insieme. Una distanza è una funzione d : X × X → R tale che, quali
che siano x, y, z ∈ X si abbia:
(1) d(x, y) ≥ 0 (Positività);
(2) d(x, y) = 0 ⇔ x = y (Distinzione dei punti);
(3) d(x, y) = d(y, x) (Simmetria);
(4) d(x, y) ≤ d(x, z) + d(z, y) (Disuguaglianza triangolare).
Un insieme X dotato di una funzione distanza d si dice spazio metrico, e spesso le parole “metrica”
e “distanza” sono sinonimi.
0.2. LA NOZIONE DI DISTANZA IN MATEMATICA 13

Questa definizione merita qualche commento:


Sulla positività. Innanzi tutto, notiamo che misuriamo le distanze con numeri non negativi.
In alcuni contesti si accettano anche distanze a valori in [0, ∞], cioè si ammettono punti a distanza
infinita! Visto che lavoriamo con numeri positivi, ciò non crea troppi scompigli, se si sta attenti
all’aritmetica. Porremo x + ∞ = ∞, ma un’espressione del tipo ∞ − ∞ richiederà più attenzione.
Un altro modo di trattare tali “distanze” è quello di restringere l’insieme in zone in cui la distanza è
finita. Se d è una distanza su X a valori in [0, ∞], per ogni x ∈ X si pone Mx = {y ∈ X : d(x, y) < ∞}.
La restrizione di d a Mx è una distanza vera e propria.
Sulla distinzione dei punti. La distinzione dei punti ci dice che se due punti sono a distanza
zero tra loro, allora sono invero lo stesso punto. Quando questa condizione viene meno, si suole
parlare di pseudo distanza. In matematica se ne incontrano spesso di pseudo distanze. Un modo per
ottenere una vera distanza da una pseudo distanza è quella di quozientare lo spazio per la relazione
d’equivalenza data dall’avere distanza nulla. Se d è una pseudo distanza su X, si dichiara x ∼ y se e
solo se d(x, y) = 0. A questo punto d induce una distanza vera e propria sul quoziente X/ ∼.
Sulla simmetria. La simmetria è una condizione naturale sotto certi punti di vista ma non da
altri. Se si pensa al piano R2 è chiaro che la lunghezza del segmento che unisce due punti non dipende
dall’ordine in cui i punti son presi. D’altronde, si pensi alla distanza del viaggiatore: quanto ci vuole
per andare da A a B? Non è detto che la strada che usiamo per andare da A a B sia la stessa che usiamo
per tornare (per esempio se ci sono dei sensi unici in circolazione) e quando usiamo i programmi
di navigazione satellitare questa situazione è quotidiana. Quando una funzione soddisfa tutte le
condizioni per essere una distanza, tranne la simmetria, si parla di distanza asimmetrica e in questo
caso la disuguaglianza triangolare va scritta nel verso giusto! Di distanze asimmetriche in matematica
ce ne sono molte. Anche queste non creano molti problemi e si può sempre ottenere una distanza
da una distanza asimmetrica per simmetrizzazione: se d è una distanza asimmetrica la funzione
δ(x, y) = d(x, y) + d(y, x) è una distanza vera e propria.
La disuguaglianza triangolare è il nòcciolo del concetto matematico di distanza. Non se ne può
fare a meno. La disuguaglianza triangolare asserisce che un lato di un triangolo è sempre minore
della somma degli altri due. Questa condizione è naturale anche dal punto di vista del viaggiatore:
Per andare da A a B, se passo da C, nel migliore dei casi ci metto lo stesso tempo, ma di sicuro non ho
un guadagno netto. Succede spesso in matematica di trovarsi di fronte a una distanza moltiplicativa
in cui la disuguaglianza triangolare diventa d(x, y) ≤ d(x, z)d(z, y). Nelle distanze moltiplicative di
solito si richiede d(x, y) ≥ 1 e d(x, y) = 1 se e solo se x = y. In questo caso, se d è una distanza
moltiplicativa allora log(d) è una distanza vera e propria.

Vediamo adesso alcuni semplici ma importanti esempi di spazi metrici.


Esempio
√ 0.2.2. La metrica Euclidea (o standard) su R è data da d(x, y) = |x − y|. (Si noti che
2
|a| = a .)
Esempio 0.2.3. La metrica Euclidea (o standard) su Rn è data da
sX
d(v, w) = (xi − yi )2
i

(ove v = (x1 , . . . , xn ) e w = (y1 , . . . , yn )).


Definizione 0.2.4. Le sfere S n e i dischi Dn sono per convenzione i seguenti insiemi
S n = {(x1 , . . . , xn+1 ) ∈ Rn+1 : x21 + · · · + x2n+1 = 1} Dn = {(x1 , . . . , xn ) ∈ Rn : x21 + · · · + x2n ≤ 1}.
Si noti che S 1 altro non è che il cerchio unitario di R2 e che S 2 è la sfera unitaria di R3 (che presta il
nome “sfera” a tutte le altre dimensioni). Dn non è altro che la palla chiusa di Rn , centrata nell’origine
e di raggio unitario.
14 0. PRELIMINARI

Esempio 0.2.5. Su S 2 si possono mettere varie metriche naturali, per esempio la distanza dR3 in-
dotta da R3 e quella angolare: dang (x, y) è la lunghezza minima di un arco di cerchio che connette x
e y. Tali distanze sono diverse in quanto, per esempio, le distanze tra polo nord N = (0, 0, 1) e polo
sud S = (0, 0, −1) sono:
dR3 (N, S) = 2 dang (N, S) = π
Esempio 0.2.6 (La metrica della città.). Sia X una città. Si definisce d(P, Q) come la distanza
minima per andare a piedi da P a Q.
Esempio 0.2.7 (I raggi di bicicletta). In R2 , la cui origine chiamiamo O, sia X l’insieme formato da
36 rette equidistribuite angolarmente:
kπ kπ
X = {λ(cos , sin ) : λ ∈ R, k ∈ N}.
36 36
La metrica dei raggi di su X è definita come

 d 2 (P, Q)
R se P e Q giacciono sulla stessa retta
d(P, Q) = .
 d 2 (P, O) + d 2 (O, Q) altrimenti
R R

La metrica dei raggi di bicicletta è simile a quella della città: la distanza tra P e Q infatti è la
distanza che si deve percorrere per andare da P a Q senza uscire da X.
Esempio 0.2.8. Su R2 definiamo la metrica dei raggi come

 d 2 (P, Q)
R se ∃λ ∈ R : P = λQ
d(P, Q) = .
 d 2 (P, O) + d 2 (O, Q) altrimenti
R R

La metrica dei raggi è simile a quella di una ruota di bicicletta con infiniti raggi: per andare da P
a Q, se essi non sono sullo stesso raggio, si deve per forza passare dall’origine.

F IGURA 4. Rappresentazione visiva della metrica dei raggi su B(O, 1)

Esempio 0.2.9 (Distanza 0/1). La distanza 0/1 su un insieme X è definita come



 1 x 6= y
d(x, y) =
 0 x=y

Negli spazi metrici le nozioni di palla, di successione convergente e funzione continua si danno
come in R2 .
Definizione 0.2.10. Sia (X, d) uno spazio metrico. Per ogni x ∈ X e 0 < ε ∈ R la palla di centro
x e raggio ε è definita come
B(x, ε) = {y ∈ X : d(x, y) < ε}.
0.3. UNO SPAZIO ORDINATO: R 15

Tale definizione ammette anche la versione “chiusa” con il “≤” al posto di “<”. È comodo usare la
notazione “D” per le palle chiuse

D(x, ε) = {y ∈ X : d(x, y) ≤ ε}.

Esercizio 0.2.11. Dimostrare che tutte le distanze sopra descritte rispettano le condizioni della
Definizione 0.2.1. Descrivere le palle di ognuna di esse.

Definizione 0.2.12. Sia (X, d) uno spazio metrico. Una successione (xn ) in X converge a x ∈ X,
e si scrive xn → x, se e solo se d(xn , x) → 0.

Definizione 0.2.13. Siano X, Y due spazi metrici. Una funzione f : X → Y si dice continua se
ogni qual volta xn → x, si ha f (xn ) → f (x).

Esempio 0.2.14. Sia X = R2 e sia xn = (1, n1 ). La successione (xn ) converge a (1, 0) per la metrica
standard di R2 ma non per la metrica dei raggi.

0.3. Uno spazio ordinato: R


Dati due punti distinti x, y ∈ R è possibile dire qual è il più grande. Cosı̀ 1 è minore di 2 che è
minore di e che è minore di π. La cosa vale anche se i numeri sono negativi: −4 è minore di −2 che è
minore di 0. Si noti che la stessa cosa non la possiamo fare con C: chi è il più grande tra 1 e i?
Attraverso l’ordine di R si possono definire gli intervalli, che possono essere aperti, chiusi o semi
aperti/chiusi a destra/sinistra:

(a, b) = {x ∈ R : a < x < b} [a, b] = {x ∈ R : a ≤ x ≤ b}

[a, b) = {x ∈ R : a ≤ x < b} (a, b] = {x ∈ R : a < x ≤ b}


Si suole fare uso anche dei simboli ±∞, volendo semanticamente indicare quantità che sono rispetti-
vamente la più grande di tutti (∞), e la più piccola di tutti (−∞). Si noti che malgrado l’uso comune,
±∞ non sono numeri reali. Si definiscono gli intervalli infiniti

(−∞, +∞) = R (−∞, b) = {x ∈ R : x < b} (a, ∞) = {x ∈ R : x > a}

(−∞, b] = {x ∈ R : x ≤ b} [a, ∞) = {x ∈ R : x ≥ a}
Talvolta si possono usare anche intervalli “chiusi all’infinito”, tipo (0, ∞], quando il significato ne sia
chiaro dal contesto.
Nel caso di R le nozioni di distanza e di ordine coesistono senza entrare in competizione. Si noti
infatti che le palle metriche aperte/chiuse non sono altro che intervalli aperti/chiusi e viceversa:

B(x, ε) = (x − ε, x + ε) B(x, ε) = [x − ε, x + ε]

a+b b−a
(a, b) = B( , ) (per a < b)
2 2
La nozione di successione convergente si può dare usando l’ordine: xn → x se per ogni ε >
0 si ha x − ε < xn < x + ε per ogni n sufficientemente grande. In R si possono anche definire
successioni “divergenti”, ossia convergenti a ±∞: xn → +∞ se per ogni M ∈ R si ha xn > M per
ogni n sufficientemente grande (e similmente per −∞). Si noti che in R2 non ha senso dire che una
successione converge a −∞.
16 0. PRELIMINARI

0.4. La nozione d’ordine in matematica


Per definire gli intervalli non abbiamo usato particolari proprietà di R, tranne l’ordine.
Definizione 0.4.1. Sia X un insieme. Una relazione d’ordine su X, o semplicemente ordine, è
una relazione binaria ≤ tale che:
(1) x ≤ x (Riflessività);
(2) (x ≤ y e y ≤ x) ⇒ x = y (Antisimmetria);
(3) (x ≤ y e y ≤ z) ⇒ x ≤ z (Transitività).
Si usa introdurre il simbolo di “minore stretto” x < y come abbreviazione di “x ≤ y e x 6= y”. Un
ordine si dice totale o lineare se per ogni x, y ∈ X si ha x ≤ y oppure y ≤ x. Spesso un ordine si dice
parziale per specificare che non è totale.
Esempio 0.4.2. L’ordine usuale di R è un ordine totale.
Esempio 0.4.3 (Insieme delle parti). Dato un insieme X, l’insieme P(X) delle sue parti (o sot-
toinsiemi) risulta parzialmente ordinato dalla relazione d’inclusione A ⊆ B. Tale ordine non è tota-
le in quanto due elementi di P(X) non sono necessariamente uno nell’altro, quindi P(X) contiene
elementi non confrontabili.
Esempio 0.4.4 (Ordine lessicografico). Dati due insiemi ordinati X, Y si definisce l’ordine lessico-
grafico sul prodotto X × Y ponendo

 x < x oppure
1 2
(x1 , y1 ) < (x2 , y2 ) ⇔
 x =x e y <y
1 2 1 2

In R2 l’ordine lessicografico asserisce che (1, 9) < (2, 1) < (3, 8) < (3, 9). L’ordine lessicografico è
quello con cui sono ordinate le parole di un vocabolario: prima vengono tutte le parole che iniziano
con a, poi quelle con b etc... Se due parole iniziano con la stessa lettera si guarda la seconda e cosi via.
L’ordine lessicografico è totale se e solo se lo sono entrambi gli ordini su X e Y .
Esempio 0.4.5 (Ordine prodotto). Dati due insiemi ordinati X, Y si definisce l’ordine prodotto su
X × Y ponendo
(x1 , y1 ) < (x2 , y2 ) ⇔ (x1 < x2 e y1 < y2 )
Esercizio 0.4.6. Dimostrare che R2 con l’ordine prodotto non è totalmente ordinato.
Definizione 0.4.7. Dato un insieme totalmente ordinato (X, ≤) si definiscono gli intervalli:
(a, b) = {x ∈ X : a < x < b} [a, b] = {x ∈ X : a ≤ x ≤ b}
[a, b) = {x ∈ X : a ≤ x < b} (a, b] = {x ∈ X : a < x ≤ b}
e, sempre che ∞ non denoti un preciso elemento di X, si suole definire
(−∞, b) = {x ∈ X : x < b} (a, ∞) = {x ∈ X : x > a}
(−∞, b] = {x ∈ X : x ≤ b} [a, ∞) = {x ∈ X : x ≥ a}
Tali definizioni si usano talvolta anche su insiemi parzialmente ordinati.
Esercizio 0.4.8. Si visualizzino gli intervalli di R2 munito dell’ordine lessicografico e di quello
prodotto. Si dica se le seguenti affermazioni sono vere o false (per entrambi gli ordini):
(1) ∀P, Q ∈ R2 , ∀X ∈ (P, Q)∃ε > 0 : B(X, ε) ⊆ (P, Q).
(2) ∀X ∈ R2 , ∀ε > 0∃P, Q ∈ B(X, ε) : (P, Q) ⊆ B(X, ε).
(3) ∀X ∈ R2 , ∀ε > 0∀P, Q ∈ B(X, ε), (P, Q) ⊆ B(X, ε).
0.5. LOGICAMENTE! 17

0.5. Logicamente!
Per affrontare serenamente lo studio della topologia è bene avere delle solide basi di logica ma-
tematica elementare. Il lettore che non si è spaventato di fronte all’Esercizio 0.4.8 (e lo ha saputo
risolvere) può stare tranquillo. Per gli altri, ecco un Bignami di logica basilare.
La logica matematica si discosta dalla logica comune in quanto la logica matematica deve essere
univoca. Per esempio, comunemente si può accettare che la frase “Mario ha gli occhi verdi” sia una
negazione di “Mario ha gli occhi neri”. In matematica invece, ciò è inaccettabile. La negazione di
una frase A deve essere una frase B che sia vera tutte e sole le volte in cui A è falsa. Mario potrebbe
non avere gli occhi, oppure averceli azzurri, ma in entrambi i casi non li avrebbe neri, né verdi. In
matematica la negazione di “Mario ha gli occhi verdi” suonerebbe semplicemente “Mario non ha gli
occhi verdi”.
In matematica (semplificando un po’ il discorso) le frasi possono avere un solo valore di verità:
vero o falso. I connettivi logici servono per costruire nuove frasi a partire da altre. La verità delle frasi
costruite dipenderà univocamente dai valori di verità delle frasi componenti. Un connettivo è quindi
identificato da quella che si chiama la sua tavola di verità. Vediamo i connettivi più comuni.
La negazione: Simbolo ¬. Ha il significato semantico di negare. È un connettivo unario, cioè ha
un solo argomento, dato A si scrive ¬A per indicare la negazione di A. La sua tavola di verità è
A V F
¬A F V
La congiunzione: Simbolo ∧. Ha il significato semantico della congiunzione “e”. È un connettivo
binario, date A e B si scrive A ∧ B. La sua tavola di verità è
A V V F F
B V F V F
A∧B V F F F
La disgiunzione: Simbolo ∨. Ha il significato semantico dell’ “o” non esclusivo. È un connettivo
binario, date A e B si scrive A ∨ B. La sua tavola di verità è
A V V F F
B V F V F
A∨B V V V F
Si noti che i simboli ∨, ∧ ricordano quelli di ∪, ∩ per l’unione e intersezione di insiemi. Ciò è
semanticamente coerente in quanto l’insieme dei casi in cui A ∨ B è vera è l’unione dei casi in cui A
è vera e dei casi in cui B lo è, e un discorso analogo vale per ∧. Similmente, il simbolo di negazione
corrisponde al passaggio al complementare: L’insieme dei casi in cui ¬A è vera è il complementare
dell’insieme dei casi in cui A lo è.
L’implicazione: Simbolo ⇒. Ha il significato semantico della causalità. È un connettivo binario,
date A e B si scrive A ⇒ B. La sua tavola di verità è
A V V F F
B V F V F
A⇒B V F V V
Si noti che se A è falsa allora A ⇒ B è vera. (Semanticamente la frase “se piove prendo l’ombrello”
è vera anche nei giorni in cui non piove.) A questo punto il lettore insoddisfatto dall’interpretazione
semantica del connettivo ⇒, non dovrebbe interrogarsi sul “perché” l’implicazione logica sia definita
18 0. PRELIMINARI

cosı̀, ma accettare il fatto compiuto: La matematica è fatta di convenzioni e questa è una di quelle.
Durante le dimostrazioni e gli esercizi ci si deve attenere alla tavola di verità di ⇒, non alla propria
interpretazione personale della parola “implica”!
L’equivalenza: Simbolo ⇔. Ha il significato semantico dell’equivalenza. È un connettivo binario,
date A e B si scrive A ⇔ B. La sua tavola di verità è
A V V F F
B V F V F
A⇔B V F F V
I connettivi si possono concatenare, per esempio ¬(A ∨ B) ha il valore opposto a (A ∨ B) quindi

A V V F F
B V F V F
¬(A ∨ B) F F F V
Si noti che ¬(A ∨ B) ha la stessa tavola di verità di (¬A) ∧ (¬B)

A V V F F
B V F V F
¬A F F V V
¬B F V F V
¬(A) ∧ (¬B) F F F V
Possiamo quindi dire che ¬(A ∨ B) = ¬A ∧ ¬B. La lista seguente raccoglie le equivalenze più usate
in matematica. Tali equivalenze possono essere facilmente verificate scrivendo le tavole di verità.
• ¬(A ∨ B) = ¬A ∧ ¬B;
• ¬(A ∧ B) = ¬A ∨ ¬B;
• ¬¬A = A;
• A ⇔ B = (A ⇒ B) ∧ (B ⇒ A);
• A ⇒ B = B ∨ (¬A);
• A ⇒ B = (¬B) ⇒ (¬A);
• ¬(A ⇒ B) = (¬B) ∧ A;
• ¬(A ⇔ B) = (A ∧ (¬B)) ∨ ((¬A) ∧ B);
• A ⇔ B = (¬B) ⇔ (¬A).
In matematica (come nelle vita) la verità di un’affermazione può dipendere da vari parametri.
Si scrive A(x) quando una frase A dipende da un parametro x. Quando si asserisce A(x) si deve
specificare se ciò sia vero solo per qualche valore di x o se invece la verità di A(x) non dipende da x.
Per esempio “x è un numero pari” è vera solo se x è pari, mentre x + 1 > x è vera sempre. Per questo
in matematica si introducono i quantificatori.
Quantificatore universale: Simbolo ∀. Ha il significato semantico di “per ogni”
∀xA(x)
è vera se la frase A(x) è vera per ogni valore di x. Volendo, si può specificare un insieme di valori per
cui si richiede che A(x) sia vera
∀x ∈ N, 2x è un numero pari
è una frase vera, ma certamente 2 21 = 1 non è pari quindi la frase “∀x, 2x è pari” è falsa.
0.5. LOGICAMENTE! 19

Quantificatore esistenziale: Simbolo ∃. Ha il significato semantico di “esiste almeno un parametro


tale che...”
∃xA(x)
è vera se esiste almeno un valore di x per cui la frase A(x) sia vera. Volendo, si può restringere la
richiesta di esistenza ad un insieme specifico di valori
∃x ∈ N : 2x = π
è una frase falsa, ma ovviamente 2 π2
= π e quindi la frase “∃x : 2x = π” è vera.
Valgono le seguenti utili regole
¬(∀xA(x)) = ∃x¬A(x) ¬(∃xA(x)) = ∀x¬A(x).
Infine, i quantificatori possono essere concatenati e usati insieme ai connettivi, per esempio:
∀x∃y(A(y) ⇒ B(x, y))
che, negata, diventa
 
∃x∀y¬ A(y) ⇒ B(x, y) = ∃x∀y A(y) ∧ ¬(B(x, y)) .
Come avrete notato spesso, (ma non sempre) si fa seguire il ∀x da una virgola e il ∃x da due
punti. La virgola in questo caso ha il significato semantico di “si ha che”. I due punti dopo l’∃x hanno
il significato semantico di “tale che”. Le parentesi, che si possono omettere se non necessarie, servono
per fugare eventuali dubbi: ¬A ⇒ B significa ¬(A ⇒ B) oppure (¬A) ⇒ B?
Cocludiamo questa breve carrellata sulla logica dei predicati con qualche commento sull’uso del
simbolo “!” in matematica. Messo dopo l’∃ serve a indicare l’unicità.
∃!xA(x)
Significa che esiste un unico valore del parametro x tale che A(x) sia vera. Quindi
 
∃!x : A(x) = ∃x A(x) ∧ ∀y(A(y) ⇒ x = y)

Esercizio 0.5.1. Negare ∃!xA(x).


Esercizio 0.5.2. Negare e scrivere la tavola di verità di (A ∨ (B ∧ C)).
Esercizio 0.5.3. Scrivere la tavola di verità di (A ∧ B) ∨ (¬(¬B ⇒ A)).
Esercizio 0.5.4. Scrivere la tavola di verità di (A ∧ B) ⇒ (C ∨ D) e della sua negazione.
Esercizio 0.5.5. Negare (A ∨ B) ⇔ (A ∧ ¬C).
Esercizio 0.5.6. Negare ∀x(∃y(∀z(A(y) ⇒ B(x, z)))).
Esercizio 0.5.7. Negare ∀x ∈ A, P (x).
Esercizio 0.5.8. Negare ∃x ∈ A : P (x).
Esercizio 0.5.9. Negare ∀x ∈ A(∃y ∈ B : N (x, y)).
Esercizio 0.5.10. Negare ∀x ∈ A∀y ∈ B∃z : C(x, y, z).
Esercizio 0.5.11. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Interpretare seman-
ticamente e negare la proposizione P (A), dipendente da A cosı́ definita:
P (A) = ∀x ∈ X∃A ∈ A : x ∈ A.
Esercizio 0.5.12. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Interpretare seman-
ticamente e negare la proposizione Q(A), dipendente da A cosı́ definita:
Q(A) = ∃n ∈ N : ∃A1 , . . . , An ∈ A : ∀x ∈ X∃k ∈ {1, . . . , n} : x ∈ Ak .
20 0. PRELIMINARI

Esercizio 0.5.13. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Siano P (A) e Q(A)
come negli Esercizi 0.5.11 e 0.5.12. Interpretare semanticamente e negare P (A) ⇒ Q(A).
Esercizio 0.5.14. Sia X un insieme e siano P (A) e Q(A) come negli Esercizi 0.5.11 e 0.5.12. Inter-
pretare semanticamente e negare
∀A, P (A) ⇒ Q(A).
Esercizio 0.5.15. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “L’intersezione di tutti gli elementi di A è non vuota”.
Esercizio 0.5.16. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “L’intersezione di un numero finito di elementi di A è non vuota”.
Esercizio 0.5.17. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “Esiste un numero finito di elementi di A la cui intersezione è non vuota”.
Esercizio 0.5.18. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “Se l’intersezione di ogni sottofamiglia finita di A è non vuota, allora esiste un
elemento di X comune a tutti gli elementi di A”.
Esercizio 0.5.19. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “L’intersezione di un numero finito di elementi di A sta in A”. Si dia un esempio
concreto di insieme X e A ⊆ P(X) per cui tale frase risulti vera.
Esercizio 0.5.20. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “Unione di elementi di A sta in A”. Si dia un esempio concreto di insieme X e
A ⊆ P(X) per cui tale frase risulti vera.
Esercizio 0.5.21. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “Il complementare di ogni elemento di A sta in A”. Si dia un esempio concreto di
insieme X e A ⊆ P(X) per cui tale frase risulti vera.
Esercizio 0.5.22. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule e
negare la frase: “A contiene un elemento il cui complementare sta in A”. Si dia un esempio concreto
di insieme X e A ⊆ P(X) per cui tale frase risulti vera.
Esercizio 0.5.23. Sia X un insieme e sia A una famiglia di sottoinsiemi di X. Tradurre in formule
e negare la frase: “Il complementare di nessun elemento di A sta in A”. Si dia un esempio concreto
di insieme X e A ⊆ P(X) per cui tale frase risulti vera.

0.6. Insiemistica spicciola


Ci sono alcune cosette basilari di teoria degli insiemi che a volte creano scompiglio, spesso an-
che perché si usano espressioni ricche di significato semantico — come “funzione da X a Y ” — di-
menticando la definizione matematica. L’uso di queste abbreviazioni semantiche è indispensabile,
altrimenti per esempio questo libro sarebbe di 3000 pagine, ma non si deve mai scordare la vera
definizione di ciò di cui stiamo parlando.
Mettiamo dei puntini su qualche i. Spesso, quando si ha a che fare con insiemi di sottoinsiemi di
un insieme dato, per non attorcigliarsi la lingua si usa parlare di famiglie di sottoinsiemi. Per quanto
riguarda gli scopi di questo libro, le parole “famiglia” e “insieme” sono sinonimi. Un insieme per noi
sarà caratterizzato dagli elementi che esso contiene, in particolare vi sarà un unico insieme vuoto, de-
notato con ∅. Adotteremo la notazione delle parentesi graffe: dentro le parentesi graffe si (de)scrivono
gli elementi di un insieme. Si noti che la scrittura {x, x} denota l’insieme che contiene solo l’elemento
x (anche se esso appare ripetuto) esattamente come la scrittura {x}. Le due scritture denotano quindi
0.6. INSIEMISTICA SPICCIOLA 21

lo stesso insieme. I simboli ∈, ⊆, ⊂ denotano l’appartenenza, l’inclusione e l’inclusione stretta rispet-


tivamente. Li useremo anche da destra verso sinistra: “X 3 x” è equivalente a “x ∈ X”. Mentre
l’appartenenza viene insieme alla definizione di insieme, l’inclusione si può definire da essa:
A⊆B ⇔ ∀x, x ∈ A ⇒ x ∈ B.
Dato un insieme X, l’insieme delle parti di X, denotato P(X), è l’insieme di tutti i sottoinsiemi
di X: P(X) = {A : A ⊆ X}.
Esempio 0.6.1. Se X = {a, b, c} allora P(X) = {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, X}. Si noti che
∅ ∈ P(X) e anche ∅ ⊆ P(X). Si noti che X ∈ P(X) ma X 6⊆ P(X).
Esempio 0.6.2. Se X = ∅, allora P(X) = P(∅) = {∅} = {X}. In questo caso X è sia un elemento
che un sottoinsieme di P(X).
Esempio 0.6.3. Se X = P(∅) = {∅}, allora P(X) = P({∅}) = {∅, {∅}} = {∅, X}. Anche in questo
caso X è sia un elemento che un sottoinsieme di P(X).
Come abbiamo visto, X è un elemento di P(X) ma non necessariamente un suo sottoinsieme. Vi
è però una “fotocopia” di X in P(X). Per ogni x ∈ X, il singoletto {x} è il sottoinsieme di X che
ha x come unico elemento. L’insieme dei singoletti di X è in corrispondenza biunivoca con X e, per
definizione, è un sottoinsieme di P(X). Con abuso di linguaggio, succede spesso di trattare i punti di
un insieme X anche come elementi di P(X): è bene sapere che quello che si sta facendo non è altro
che associare ad ogni elemento x ∈ X il suo singoletto {x} ∈ P(X).
Attraverso gli insiemi si definiscono le nozioni di base. Per esempio, la coppia ordinata (x, y)
si può definire alla Kuratowski come l’insieme {{x}, {x, y}} (si noti che (x, x) = {{x}}). Il prodotto
cartesiano X × Y di due insiemi è l’insieme di tutte le coppie ordinate il cui primo elemento sta in X
e il secondo in Y :
X × Y = {(x, y) : x ∈ X, y ∈ Y }.
L’unione e l’intersezione di due insiemi sono definite in modo naturale da
x∈A∪B ⇔ (x ∈ A) ∨ (x ∈ B) x∈A∩B ⇔ (x ∈ A) ∧ (x ∈ B)
equivalentemente,
A ∪ B = {x : x ∈ A ∨ x ∈ B} A ∩ B = {x : x ∈ A ∧ x ∈ B}
La differenza è data da
A \ B = {x : x ∈ A ∧ x ∈
/ B}
e, se A ⊆ B, il complementare di A in B è definito come
Ac = B \ A.
Si noti che la scrittura Ac non menziona B, ma il complementare è di A in B. In particolare, nel caso
in cui A ⊂ B ⊂ C il complementare di A in B è diverso dal complementare di A in C. Di solito è
chiaro dal contesto in quale ambiente si faccia il complementare, altrimenti si dovrà specificare. Il
complementare del vuoto è il tutto, il complementare del tutto è il vuoto e (Ac )c = A.
Capita di voler fare quella che si chiama l’unione disgiunta di due insiemi A, B, che comune-
mente è denotata A t B. Con questo si intende che si fa l’unione di A e di B, ma gli elementi comuni
si considerano diversi. È come se dipingessimo A di verde e B di rosso e poi se ne facesse l’unione:
di ogni elemento di A ∩ B avremmo la copia verde e quella rossa. In matematica, per dipingere le cose,
basta fare il prodotto cartesiano con un insieme di etichette, come si fa in informatica per taggare le
cose. L’unione disgiunta di A e B si può quindi formalmente definire (se A e B sono diversi) come
A t B = (A × {A}) ∪ (B × {B}) ⊆ (A ∪ B) × {A, B}
22 0. PRELIMINARI

Esempio 0.6.4. Se A = [0, 2] e B = [1, 3] sono comuni intervalli di R, allora A ∪ B = [0, 3] mentre
A t B è fatto di elementi del tipo (x, A) o (x, B). Per esempio il punto (1, A) e il punto (1, B) indicano
il punto 1 taggato una volta con A e una volta con B.
Se si vuol fare l’unione disgiunta di due o più copie dello stesso insieme, basta avere l’accortezza
di usare come insieme di etichette un insieme opportuno di indici.
Esempio 0.6.5. L’unione disgiunta di due copie di R può essere definita, usando etichette nell’in-
sieme {0, 1}, come
R t R = {(x, e) : x ∈ R, e = 0, 1}.
Un altro concetto con un nome semanticamente intuitivo, ma la cui definizione formale spesso
sfugge, è quello di relazione. Una relazione su un insieme X è semplicemente un sottoinsieme R di
X ×X. Si dice che “x è in relazione con y”, e si scrive usualmente xRy, come sinonimo di “(x, y) ∈ R”.
Esempio 0.6.6. Una relazione di equivalenza su X è una relazione che sia:
Riflessiva: per ogni x ∈ X si ha xRx, cioè (x, x) ∈ R. Graficamente si sta chiedendo che R contenga la
diagonale di X × X.
Simmetrica: per ogni x, y ∈ X si ha xRy ⇔ yRx, cioè (x, y) ∈ R ⇔ (y, x) ∈ R. Graficamente, si chiede
che R coincida con il suo simmetrico rispetto alla diagonale.
Transitiva: per ogni x, y, z ∈ X si ha (xRy ∧ yRz) ⇒ xRz, cioè ((x, y) ∈ R) ∧ ((y, z) ∈ R) ⇒ (x, z) ∈ R.
Esercizio 0.6.7. Si cerchi di visualizzare graficamente il significato della proprietà transitiva.
Esempio 0.6.8. La relazione di equivalenza banale è quella definita da: xRy se e solo se x = y. In
termini di sottoinsiemi, è la diagonale di X × X.
Esempio 0.6.9. La relazione di equivalenza totale, cioè quella per cui ogni x è equivalente ad ogni
y, corrisponde a tutto X × X.
Per le relazioni di equivalenza si usa solitamente la notazione x ∼ y per indicare che x è equi-
valente a y. Dato una qualsiasi relazione R su X, la relazione di equivalenza generata da R è la più
piccola relazione d’equivalenza contenente R. Ciò ha senso perché le relazioni sono insiemi e le con-
dizioni di simmetria, riflessività e transitività sono chiuse per intersezione; in particolare la relazione
d’equivalenza generata da R è l’intersezione di tutte le relazioni di equivalenza contenenti R (si noti
che la relazione di equivalenza totale contiene R).
Una relazione si può dare anche su più copie di X e anche su collezioni di insiemi diversi tra loro.
Per esempio una relazione binaria su X e Y sarà un sottoinsieme di X × Y .
Veniamo adesso al concetto di funzione. Matematicamente, una funzione f : X → Y è un
sottoinsieme F ⊆ X × Y tale che per ogni x ∈ X esiste un unico y ∈ Y tale che (x, y) ∈ F . La frase
“f (x) = y” è un perfetto sinonimo di (x, y) ∈ F . In pratica F è quello che comunemente si chiama il
grafico di f . (Nel linguaggio delle relazioni, le funzioni si chiamano anche relazioni funzionali).
Esempio 0.6.10. La funzione identità da un insieme X in sé, cioè f (x) = x per ogni x ∈ X,
corrisponde alla diagonale di X × X.
Anche se la definizione di funzione è data attraverso il grafico e nonostante le confusioni che
possono derivare dal loro uso, il familiare formalismo f : X → Y e la corrispondente scrittura f (x) =
y sono troppo comodi per abbandonarli, e anche noi ci atterremo a quest’usanza.
Si noti che una funzione f : X → Y è definita per ogni elemento x ∈ X. In alcune materie, per
esempio l’analisi, a volte si parla di funzioni da R in R anche se non sono definite ovunque. Non è un
problema, basta saperlo.
Esempio 0.6.11. La funzione f (x) = 1/x è comunemente considerata una funzione f : R → R non
definita in x = 0. Sarebbe più preciso dire che è una funzione f : R \ {0} → R.
0.6. INSIEMISTICA SPICCIOLA 23

Una funzione si dice iniettiva se f (x) = f (y) ⇒ x = y. In termini di grafici, F ⊆ X × Y


rappresenta una funzione iniettiva se (oltre a essere una funzione) per ogni y ∈ Y esiste al massimo
un x ∈ X tale che (x, y) ∈ F . Volendo visualizzare, l’iniettività corrisponde al fatto che F interseca le
rette “orizzontali” di X × Y in al più un punto.
Una funzione si dice suriettiva se per ogni y ∈ Y esiste x ∈ X tale che f (x) = y. In termini di
grafici, F ⊆ X × Y rappresenta una funzione suriettiva se (oltre a essere una funzione) per ogni y ∈ Y
esiste almeno un x ∈ X tale che (x, y) ∈ F . Cioè, f è suriettiva se F interseca ogni retta orizzontale.
Una funzione si dice biunivoca se per ogni y ∈ Y esiste un unico x tale che f (x) = y. In termini
di grafici, F ⊆ X × Y rappresenta una funzione biunivoca se (oltre a essere una funzione) per ogni
y ∈ Y esiste un unico x ∈ X tale che (x, y) ∈ F . Si noti la somiglianza tra la condizione di biunivocità
e la definizione di funzione.
Una funzione biunivoca si dice anche invertibile, l’inversa di f si denota con f −1 ed è una funzio-
ne f −1 : Y → X. In termini di grafici F è praticamente lo stesso sottoinsieme, solo che lo si considera
come sottoinsieme di Y × X.
Se f : X → Y e g : Y → Z la composizione di f con g, denotata da g ◦ f : X → Z è definita come
g ◦ f (x) = g(f (x)). In termini di grafici, (x, z) ∈ G ◦ F se esiste y ∈ Y tale che (x, y) ∈ F e (y, z) ∈ G.
Esempio 0.6.12. La fuzione (1 + x)2 è la composizione di f (x) = 1 + x e g(y) = y 2 .
Un buon trucco per ricordarsi che nella composizione g ◦f si applica prima la f e poi la g, è quello
di leggere il simbolo ◦ come dopo. Cosı̀, leggendo g ◦ f si dice g dopo f . Sembra una bazzecola, ma
risulta comodissimo.
Esempio 0.6.13. Se f : X → Y è invertibile, allora f ◦ f −1 è l’identità di Y . La funzione f −1 ◦ f è
invece l’identità di X.
Esercizio 0.6.14. Dimostrare che f : X → Y è invertibile se e solo se esiste una funzione g : Y → X
tale che f ◦ g = IdY e g ◦ f = IdX . Dimostrare che in tal caso si ha g = f −1 .
Esercizio 0.6.15. Dimostrare che f : X → Y è iniettiva se e solo se esiste una funzione g : Y → X
tale che g ◦ f = IdX . (Una tale g si chiama inversa sinistra).
Esercizio 0.6.16. Dimostrare che f : X → Y è suriettiva se e solo se esiste una funzione g : Y → X
tale che f ◦ g = IdY . (Una tale g si chiama inversa destra).
Esercizio 0.6.17. Trovare un esempio di funzione f : X → Y che ammetta un’inversa destra ma
non un’inversa sinistra e viceversa.
Adesso che abbiamo chiarito un po’ le cose, ricomplichiamole. Non per masochismo, ma perché
a volte ci sono notazioni che, pur imprecise, sono estremamente comode da usare.
Ogni funzione f : X → Y induce una funzione, sempre chiamata f , ma questa volta
f : P(X) → P(Y )
definendo naturalmente, per ogni A ⊆ X,
f (A) = {f (x) : x ∈ A}.
In altre parole, f (A) è l’insieme di tutti gli elementi del tipo f (x) al variare di x in A. Tale insieme si
chiama comunemente l’immagine di A o l’immagine di A tramite f , o anche la f -immagine di A.
Allo stesso modo si definiscono le preimmagini (dette talvolta controimmagini) di insiemi in Y ,
usando la notazione
f −1 : P(Y ) → P(X)
e definendo
f −1 (B) = {x ∈ X : f (x) ∈ B}.
In altre parole, f −1 (B) è l’insieme degli elementi di X la cui f -immagine appartiene a B.
24 0. PRELIMINARI

Usando la “fotocopia” di X in P(X) data dai singoletti, possiamo dire che f : P(X) → P(Y )
estende f : X → Y in quanto f ({x}) = {f (x)}. Ma f −1 : P(Y ) → P(X) non estende l’inversa di
f : X → Y : essa infatti esiste sempre, anche quando f non è invertibile!!!
Ci sono un paio di trappole a cui si deve stare moooooooolto attenti quando si maneggiano
funzioni e loro inverse, che elenchiamo qui in forma di esercizio:
Esercizio 0.6.18.
(1) Dimostrare che vale sempre f (A ∪ B) = f (A) ∪ f (B).
(2) Dimostrare che non è sempre vero che f (A ∩ B) = f (A) ∩ f (B). (Suggerimento, si consideri
una funzione non iniettiva, tipo f (x) = x2 ).
(3) Dimostrare che vale sempre f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B).
(4) Dimostrare che vale sempre f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B).
Un ritornello da ricordare è dunque: L’inversa commuta con unione e intersezione, la f invece lo fa
solo con l’unione.
Esercizio 0.6.19. Sia f : X → Y e siano A, B ⊆ X. Dimostrare che f (A ∩ B) ⊆ f (A) ∩ f (B).
Esercizio 0.6.20. Dimostrare che se f : X → Y è iniettiva allora f (A ∩ B) = f (A) ∩ f (B) per ogni
A, B ⊆ X.
E ancora:
Esercizio 0.6.21. Sia f : X → Y . Dimostrare che per ogni B ⊆ Y si ha f −1 (B c ) = (f −1 (B))c .
Esercizio 0.6.22. Dimostrare che non è sempre vero che f (Ac ) = (f (A))c (si provi con f (x) = x2 ).
Esercizio 0.6.23. Sia f : X → Y e sia B ⊆ Y . Dimostrare che f (f −1 (B)) ⊆ B.
Esercizio 0.6.24. Dimostrare che se f : X → Y è suriettiva allora f (f −1 (B)) = B per ogni B ⊆ Y .
Esercizio 0.6.25. Sia f : X → Y e sia A ⊆ X. Dimostrare che f −1 (f (A)) ⊇ A.
Esercizio 0.6.26. Dimostrare che se f : X → Y è iniettiva allora f −1 (f (A)) = A per ogni A ⊆ X.
CAPITOLO 1

Spazi topologici

1.1. Topologie: aperti, chiusi e compagnia bella


Definizione 1.1.1. Una topologia su un insieme X è una famiglia di insiemi τ ⊆ P(X) tale che
(1) ∅, X ∈ τ ;
(2) τ è chiusa per unione qualsiasi: Per ogni famiglia {Ai }i∈I ⊆ τ si ha
[
Ai ∈ τ ;
i∈I

(3) τ è chiusa per intersezioni finite: Per ogni A1 , . . . , An ∈ τ si ha


A1 ∩ · · · ∩ An ∈ τ.
Se τ è una topologia su X allora (X, τ ) si chiama spazio topologico. Se non ci sono fraintendimenti
possibili si dirà spesso che X è uno spazio topologico, senza menzionare τ . Gli elementi di τ si
chiamano aperti.
Si noti che la condizione (3) può essere sostituita dalla chiusura per intersezioni semplici (cioè
∀A, B ∈ τ si richiede A ∩ B ∈ τ ).
Teorema 1.1.2. Sia X un insieme. Una famiglia τ ⊆ P(X) è una topologia su X se e solo se ∅, X ∈ τ , è
chiusa per unioni qualsiasi e per intersezioni semplici.
D IMOSTRAZIONE . La dimostrazione è immediata usando il principio di induzione. 

Esempio 1.1.3. La topologia banale su un insieme X è τ = {∅, X}: Gli unici aperti sono quindi il
vuoto e X.
Esempio 1.1.4. La topologia discreta su un insieme X è τ = P(X). Ogni insieme è aperto.
Definizione 1.1.5. Sia (X, τ ) uno spazio topologico, un sottoinsieme A ⊆ X si dice chiuso (o
chiuso di τ ) se il suo complementare è un aperto:
A è chiuso ⇔ Ac ∈ τ.
Esempio 1.1.6. Il vuoto e tutto lo spazio sono entrambi sia aperti che chiusi in ogni topologia.
Esempio 1.1.7. Nella topologia banale gli unici chiusi sono il vuoto e X (che sono anche aperti).
Esempio 1.1.8. Nella topologia discreta ogni insieme è chiuso (ed è anche aperto).
Vi sono ovviamente topologie in cui ci sono dei chiusi che non sono aperti.
Esempio 1.1.9. Sia X un insieme e sia A ( X non vuoto. La famiglia τ = {∅, X, A} è una topologia
su X; A è l’unico aperto non banale e il suo complementare è l’unico chiuso non banale.
Si noti che ci sono insiemi che non sono né aperti né chiusi; e.g. se nell’Esempio 1.1.9 poniamo
X = R e A = [0, 1], allora (2, 3) non è né aperto né chiuso.
25
26 1. SPAZI TOPOLOGICI

Esempio 1.1.10 (Topologia delle palle annidate in R2 ). In R2 sia τ = {∅, R2 } ∪ {B(O, 2n ) : n ∈ Z}.
Essa è una topologia in quanto l’intersezione di un numero finito di palle centrate nell’origine è la più
piccola di esse e l’unione di palle centrate nell’origine è la più grande
p di esse o tutto R2 . I chiusi di τ
sono il vuoto, il tutto e gli insiemi del tipo Cn = {(x, y) ∈ R2 : x2 + y 2 ≥ 2n }. In particolare non ci
sono insiemi contemporaneamente aperti e chiusi tranne il vuoto e il tutto.
Esercizio 1.1.11. Sia X un insieme e sia x ∈ X. Sia τx la famiglia ti tutti i sottoinsiemi di X
contenenti x, più il vuoto. Si dimostri che τx è una topologia. Si descrivano i chiusi di τx . Tale
topologia viene denotata talvolta come topologia del punto particolare.
Teorema 1.1.12 (Degli aperti metrici). Sia (X, d) uno spazio metrico. Sia τ la famiglia dei sottoinsiemi
A di X che soddisfano la seguente condizione:
∀a ∈ A∃ε > 0 : B(a, ε) ⊆ A.
Allora τ è una topologia su X.
D IMOSTRAZIONE . Chiaramente il vuoto e X stanno in τ . Vediamo che τ è chiusa per unione
qualsiasi. Sia {Ai }i∈I ⊆ τ , dobbiamo far vedere che ∪i Ai ∈ τ . Sia x ∈ ∪i Ai ; allora esiste j ∈ I tale che
x ∈ Aj . Quindi esiste ε > 0 tale che B(x, ε) ⊆ Aj ma siccome Aj ⊆ ∪i Ai si ha B(x, ε) ⊆ ∪i Ai .
Passiamo alle intersezioni finite. Siano A1 , A2 elementi di τ e sia x ∈ A1 ∩ A2 . Allora x ∈ A1 e
x ∈ A2 , quindi esistono ε1 , ε2 > 0 tali che B(x, εi ) ⊆ Ai , i = 1, 2. Sia ε = min{ε1 , ε2 }. Siccome ε è il
minimo di due numeri strettamente positivi, esso è strettamente positivo. Inoltre, per ogni i = 1, 2,
siccome ε ≤ εi , si ha B(x, ε) ⊆ B(x, εi ) ⊆ Ai e dunque B(x, ε) ⊆ A1 ∩ A2 . 

Definizione 1.1.13 (Topologia indotta da una metrica). Sia (X, d) uno spazio metrico. La topolo-
gia indotta da d su X è la famiglia τ descritta nel Teorema 1.1.12. Se non specificato diversamente,
uno spazio metrico si intende sempre dotato della topologia indotta dalla distanza.
Distanze diverse sullo stesso insieme possono (o no) indurre topologie diverse.
Esempio 1.1.14. Sia X = R2 , siano A = {(x, 0) : 1 < x < 5} e B = {(x, 0) : −1 < x < 5}.
L’insieme A è aperto per la topologia indotta dalla metrica dei raggi, mentre non è aperto per la
topologia Euclidea. L’insieme B non è aperto in nessuna delle due topologie (lo zero non è interno).
Esercizio 1.1.15. Trovare due metriche su S 1 che inducono la stessa topologia.
Un errore comune è pensare che gli aperti e i chiusi di R (o Rn ) standard siano tutti semplici, per
esempio intervalli.
Esempio 1.1.16. L’insieme di Cantor è un sottoinsieme di R definito ricorsivamente come segue.
Si parte da [0, 1]; lo si divide in tre parti uguali e si toglie la parte interna del terzo centrale; ad ogni
passo si divide ogni intervallo superstite in tre e si toglie l’interno del terzo centrale: Ciò che resta è

0 1

F IGURA 1. L’insieme di Cantor

l’insieme di Cantor.
1.1. TOPOLOGIE: APERTI, CHIUSI E COMPAGNIA BELLA 27

Il complementare del Cantor è formato da un’unione di intervalli aperti e dunque è aperto. Quin-
di il Cantor è un chiuso. L’insieme di Cantor si può anche descrivere come l’insieme dei numeri deci-
mali in [0, 1] che si possono scrivere in base 3 senza usare il simbolo 1 (si noti che 1/3 = 0, 1 ma anche
0, 02222222222222 . . . ).
Esempio 1.1.17. Il tappeto di Sierpinski è un sottoinsieme di R2 definito ricorsivamente, tipo il
Cantor, come segue: Si parte dal quadrato [0, 1] × [0, 1]. Si divide il quadrato in nove quadratini
uguali e si comincia col togliere la parte interna del quadratino centrale. Ad ogni passo si divide ogni
quadrato superstite in nove e si toglie l’interno del quadratino centrale:

F IGURA 2. Il tappeto di Sierpinski.

Esempio 1.1.18. Il Sierpinski gasket (in italiano “guarnizione”, meglio noto come triangolo di
Sierpinski) è costruito come il tappeto, ma usando triangoli al posto dei quadrati. (Figura 3.)

F IGURA 3. Il triangolo di Sierpinski.

Come il Cantor, il tappeto e la guarnizione di Sierpinski sono chiusi perché il complementare è


aperto in quanto unione di aperti.
Teorema 1.1.19 (Della famiglia dei chiusi). Sia (X, τ ) uno spazio topologico. Detta σ ⊆ P(X) la
famiglia dei chiusi di τ , si ha:
(1) ∅, X ∈ σ;
(2) σ è chiusa per intersezione qualsiasi: Per ogni famiglia {Ai }i∈I ⊆ σ l’intersezione ∩i Ai è un
elemento di σ;
(3) σ è chiusa per unioni finite: Per ogni A1 , . . . , An ∈ σ si ha A1 ∪ · · · ∪ An ∈ σ.
Viceversa, se σ è una famiglia di sottoinsiemi di X che soddisfa le condizioni (1), (2), (3) allora la famiglia
τ = {Ac : A ∈ σ} dei complementari degli elementi di σ è una topologia su X.
D IMOSTRAZIONE . Segue immediatamente dalla definizione di topologia per passaggio al com-
plementare. 
Come nel Teorema 1.1.2, la condizione (3) puè essere rimpiazzata dalla chiusura per unione
semplice.
Esempio 1.1.20 (La topologia cofinita). Sia X un insieme. La topologia cofinita è quella i chiusi
sono X e tutti i sottoinsiemi di X con un numero finito di elementi. Cioè
τ = {A ⊆ X : ](Ac ) < ∞} ∪ {∅}.
28 1. SPAZI TOPOLOGICI

Che la cofinita sia effettivamente una topologia segue dal Teorema 1.1.19. Infatti è immediato
verificare che i chiusi, cioè gli insiemi finiti, costituiscono una famiglia chiusa per unione finita e
intersezione qualsiasi.
Esercizio 1.1.21. Sia X = {a, b, c, d, e} e sia
τ = {{a}, {b}, {b, c}, {d, e}, {a, d, e}, {b, d, e}, {a, b, c}, {b, c, d, e}, {a, b, d, e}, {a, b, c, d, e}, ∅}
Si dica se τ sia o meno una topologia. In caso contrario, si dica se si può rendere τ una topologia
aggiungendo dei sottoinsiemi di X. Se si, qual è il numero minimo di insiemi da aggiungere a τ
affinché diventi una topologia?
Teorema 1.1.22. Sia {τi }i∈I una famiglia di topologie su X. Allora ∩i τi è una topologia su X.
D IMOSTRAZIONE . Siccome la relazione di appartenenza è stabile per intersezione, si ha:
• ∀i(∅, X ∈ τi ) ⇒ ∅, X ∈ ∩i τi .
• Per ogni {Aj }j∈J ⊆ ∩i τi , si ha ∀i∀j(Aj ∈ τi ) ⇒ ∀i(∪j∈J Aj ∈ τi ) ⇒ ∪j∈J Aj ∈ ∩i τi .
• A, B ∈ ∩i τi ⇒ ∀i(A, B ∈ τi ) ⇒ ∀i(A ∩ B ∈ τi ) ⇒ A ∩ B ∈ ∩i τi .

Esempio 1.1.23. Sia X un insieme e per ogni x ∈ X sia τx la topologia del punto particolare
(Esercizio 1.1.11). Per il Teorema 1.1.22 si ha dunque che per ogni A ⊂ X la famiglia τA = ∩a∈A τa è
una topologia su X.
Esercizio 1.1.24. Dimostrare che τA , definita come nell’Esempio 1.1.23, non è altro che la famiglia
dei sottoinsiemi di X che contengono A, più il vuoto. Dimostrare che essa è una topologia senza fare
uso del Teorema 1.1.22).
Esercizio 1.1.25. Dimostrare che l’intersezione di tutte le topologie su R è la topologia banale.
Esercizio 1.1.26. Sia F la famiglia di tutte le topologie su R che hanno un numero finito di aperti.
Dimostrare che ∩τ ∈F τ è la topologia banale.
Esercizio 1.1.27. Sia F la famiglia di tutte le topologie su R che hanno un numero infinito di aperti.
Dimostrare che ∩τ ∈F τ è la topologia banale.
Si noti che l’unione di due topologie non è necessariamente una topologia.
Esempio 1.1.28. Sia X un insieme e siano x, y, z tre elementi distinti di X. Allora τx ∪ τy non è una
topologia (ove τx è definita come in 1.1.11). Infatti l’insieme A = {x, z} sta in τx e quindi in τx ∪ τy ,
l’insieme B = {y, z} sta in τy , dunque in τx ∪ τy , ma la loro intersezione A ∩ B = {z} non sta né in τx
né in τy , ergo nemmeno in τx ∪ τy .
Definizione 1.1.29. Sia (X, τ ) uno spazio topologico e sia A ⊆ X.
• x ∈ X si dice interno ad A se esiste B ∈ τ tale che x ∈ B ⊆ A;
• x ∈ X è un punto di aderenza di A se per ogni B ∈ τ , se x ∈ B allora B ∩ A 6= ∅. In altre
parole x è di aderenza se non è un punto interno di Ac .
• x ∈ X è un punto di accumulazione di A se per ogni B ∈ τ contenente x esiste y 6= x tale
che y ∈ A ∩ B. In altre parole, x è di accumulazione se è un punto di aderenza di A \ {x}. (Si
noti che i punti di accumulazione sono anche di aderenza.)
• Un punto di aderenza di A che non sia di accumulazione si dice punto isolato.
Dalla definizione si evince immediatamente che i punti interni di A sono punti di A. I punti di
aderenza di A invece possono non essere punti di A, ma tutti i punti di A sono di aderenza. Se A
è aperto, tutti i suoi punti sono interni. Se A è chiuso, esso contiene tutti i suoi punti di aderenza
(perché tutti i punti di Ac sono interni ad Ac ). Si noti che se A = X, un punto x ∈ A è isolato se e solo
se {x} è aperto (e diverso da X).
1.1. TOPOLOGIE: APERTI, CHIUSI E COMPAGNIA BELLA 29

Esempio 1.1.30. In R2 con la metrica Euclidea sia B la palla di centro l’origine e raggio 1 e sia D
la palla chiusa di centro l’origine e raggio 1. B è aperto e D è chiuso; l’origine è un punto interno di
entrambi; (0, 1) è un punto di aderenza di entrambi. Si noti che (0, 1) ∈ D ma (0, 1) ∈ / B. In entrambi
i casi tutti i punti di aderenza sono anche di accumulazione.
Esempio 1.1.31. In R Euclideo sia A = {1/n : n ∈ N} ∪ {0}. Tutti i punti di A tranne lo zero sono
isolati. Lo zero è l’unico punto di accumulazione di A.
Esempio 1.1.32. In R2 con la metrica dei raggi l’insieme A = {(x, 0) : 1 < x < 3} è aperto in quanto
è la palla di centro (2, 0) e raggio 1, mentre Y = {(x, 0) : −1 < x < 1} no perché l’origine non è un
punto interno di Y . Il punto (1, 0) è di aderenza per entrambi.
Esempio 1.1.33. In R2 Euclideo, sia Cn il cerchio di raggio 1/2n centrato nell’origine e sia X =
∪n∈N Cn . Se B è una palla di raggio ε > 0 centrata nell’origine, allora per 2−n < ε il cerchio Cn è
contenuto in B. Ne segue che l’origine è un punto di aderenza di X. Si noti che l’origine appartiene
a X c ma non ne è punto interno.
Esercizio 1.1.34. Sia X come nell’Esempio 1.1.33. Si dimostri che tutti i punti di X c diversi
dall’origine sono interni a X c .
Definizione 1.1.35. Sia (X, τ ) uno spazio topologico e sia A un sottoinsieme di X.
• La parte interna di A è l’unione di tutti gli aperti contenuti in A. Si denota con Int(A) o Å.
• la chiusura di A è l’intersezione di tutti i chiusi contenenti A. Si denota con Ā.
• La frontiera di A è ∂A = Ā \ Å.
Teorema 1.1.36. Sia (X, τ ) uno spazio topologico e sia A ⊆ X. Allora
• Int(A) è il più grande aperto contenuto in A;
• Ā è il più piccolo chiuso contenente A.
D IMOSTRAZIONE . Vediamo la prima affermazione. Per definizione Int(A) è unione di aperti
contenuti in A, ergo è aperto e contenuto in A. Se B ∈ τ è contenuto in A, allora B ⊆ Int(A) per
definizione quindi Int(A) è il più grande di tali insiemi.
Vediamo la seconda. Per definizione Ā è intersezione di chiusi contenenti A, ergo è chiuso e
contiene A. Se C è un chiuso che contiene A allora C ⊇ Ā per definizione. 

Si noti che A è aperto in (X, τ ) se e solo se Int(A) = A ed è chiuso se e solo se Ā = A. Possono


essere utili le seguenti caratterizzazioni di parte interna, chiusura e frontiera.
Teorema 1.1.37. Sia (X, τ ) uno spazio topologico e A ⊆ X. Allora
• Int(A) = (Ac )c e coincide con l’insieme dei punti interni di A;
• Ā = (Int(Ac ))c e coincide con l’insieme dei punti di aderenza di A;
• ∂A = ∂Ac = (Int(Ac ) ∪ Int(A))c .
D IMOSTRAZIONE . Siccome Ac ⊆ Ac , che è un chiuso, (Ac )c è un aperto contenuto in A; per cui
(1) Int(A) ⊇ (Ac )c .
Siccome Int(Ac ) è un aperto contenuto in Ac allora (Int(Ac ))c è un chiuso contenente A, per cui
(2) (Int(Ac ))c ⊇ Ā.
Sostituendo A con Ac nelle formule (1) e (2), si ottengono le altre inclusioni.
I punti interni di A stanno in Int(A) per definizione di parte interna. Viceversa, essendo Int(A)
una aperto contenuto in A, tutti i punti di Int(A) sono interni ad A. Quindi Int(A) coincide con
l’insieme dei punti interni di A.
30 1. SPAZI TOPOLOGICI

Sia ora Ad(A) l’insieme dei punti di aderenza di A. Per definizione esso è il complementare
dell’insieme dei punti interni di Ac , quindi
Ad(A) = (Int(Ac ))c = Ā.
Per quanto riguarda la frontiera si ha
∂A = Ā \ Å = Ā ∩ (Å)c = (Int(Ac ))c ∩ Int(A)c = (Int(Ac ) ∪ Int(A))c
e tale espressione è simmetrica in A e Ac (cioè applicando lo stesso ragionamento ad Ac si ottiene
∂Ac = (Int(A) ∪ Int(Ac ))c = (Int(Ac ) ∪ Int(A))c = ∂A.) 
Esempio 1.1.38. In R2 Euclideo la chiusura di B(P, R) è B(P, R) (la notazione è quindi coerente).
La parte interna di B(P, R) è B(P, R). La frontiera di entrambi è il cerchio C(P, R).
Esempio 1.1.39. L’insieme di Cantor, il tappeto e la guarnizione di Sierpinski non hanno parte
interna. Né punti isolati. In quanto chiusi, tutti i loro punti sono di aderenza (e di accumulazione).
Esempio 1.1.40. Sia f : [0, ∞) → R2 la funzione f (x) = (arctan(x) cos(x), arctan(x) sin(x)) e sia
X l’immagine di f . X è una spirale che parte dall’origine e si accumula sul cerchio C di raggio π/2
centrato nell’origine. La chiusura di X è l’unione di X e C. La parte interna di X è il vuoto e la
frontiera di X coincide quindi con la sua chiusura.
Esercizio 1.1.41. Sia X come nell’esempio precedente. Trovare la parte interna, la chiusura e la
frontiera del complementare di X.
Definizione 1.1.42. Sia X uno spazio topologico. Y ⊆ X si dice denso in X se Ȳ = X.
Esempio 1.1.43. Ogni insieme non vuoto è denso nella topologia banale, nessun sottoinsieme che
non sia il tutto è denso nella topologia discreta.
Esempio 1.1.44. In R2 Euclideo, B(x, r) è denso in B(x, r).
Esempio 1.1.45. In R2 Euclideo, B(x, r) \ B(x, r) non è denso in B(x, r).
Esempio 1.1.46. Q è denso in R Euclideo (per definizione di R tramite le sezioni di Dedekind, ogni
numero reale è approssimabile con numeri razionali).
Esempio 1.1.47. Il complementare di Q è denso in R Euclideo.
Esempio 1.1.48. L’insieme Q è numerabile. Sia q1 , q2 , . . . una sua numerazione. L’insieme dei
razionali cioccioni è definito come
1
∪i∈N B(qi , i )
2
Tale insieme è un sottoinsieme aperto (perché unione di aperti) e denso in R (perché contiene Q che è
denso). Cosa meno banale è dimostrare che non è tutto R.
Esercizio 1.1.49. Dimostrare che Q2 è denso in R2 Euclideo.
Esempio 1.1.50. In R con la topologia cofinita, consideriamo Y = [0, 1]. Siccome i chiusi della
cofinita sono gli insiemi finiti e tutto R, l’unico chiuso che contiene Y è R. Quindi Ȳ = R e dunque
[0, 1] è denso in R per la cofinita. Chiaramente [0, 1] è chiuso per la topologia Euclidea e quindi non è
denso in R Euclideo.
Esercizio 1.1.51. Dimostrare che Z è denso in R con la topologia cofinita. Dimostrare che Z non è
denso in R Euclideo.
Definizione 1.1.52. Siano τ, σ due topologie su un insieme X. Diciamo che τ è più fine di σ se
σ ⊆ τ.
1.2. BASI. TOPOLOGIA DI ZARISKI E ALTRI ESEMPI 31

In altre parole, τ è più fine di σ se ogni aperto di σ è anche aperto di τ . In pratica possiamo dire
che τ è più fine se “ha più aperti”. La topologia banale è la meno fine di tutte le topologie, la discreta
è la più fine.
Esercizio 1.1.53. Siano X un insieme e τ, σ due topologie su X. Dimostrare che τ è più fine di σ se
e solo se ogni chiuso di σ è anche un chiuso di τ .
Esempio 1.1.54. La topologia cofinita è meno fine della topologia Euclidea di R2 . Infatti per la
toplologia Euclidea i punti son chiusi e quindi un numero finito di punti, in quanto unione di chiusi,
è un chiuso.
Esempio 1.1.55. La topologia Euclidea su R2 è meno fine della topologia indotta dalla metrica
dei raggi. Sia infatti B una palla Euclidea e sia x ∈ B. Mostriamo che x è interno a B rispetto alla
metrica dei raggi (e ciò implicherà che ogni aperto Euclideo è anche aperto per la metrica dei raggi).
Se x è l’origine allora esiste ε > 0 tale che B(x, ε) ⊂ B (si noti che le palle centrate nell’origine
coincidono per le due metriche). Altrimenti esiste ε > 0 tale che O ∈ / BEucl (x, ε) ⊂ B. Il raggio Rx
passante per x interseca BEucl (x, ε) in un segmento aperto rispetto alla metrica dei raggi. Quindi
x ∈ Rx ∩ BEucl (x, ε) ⊂ BEucl (x, ε) ⊂ B risulta punto interno (per la metrica dei raggi) di B.
Due topologie non sono necessariamente confrontabili.
Esempio 1.1.56. Siano x, y due punti distinti di R. Allora le topologie del punto particolare τx e τy
(Esercizio 1.1.11) non sono confrontabili. Infatti {x} è aperto in τx ma non in τy e vice versa.
Esempio 1.1.57. Sia x ∈ R2 . La topologia del punto particolare τx non è confrontabile con la
topologia Euclidea. Infatti {x} è aperto in τx ma non nella Euclidea, mentre una qualsiasi palla metrica
B(P, r) che non contiene x è aperta nella Euclidea ma non in τx .
Esempio 1.1.58. Dati due spazi topologici (X, τ ) e (Y, σ), la topologia unione disgiunta τ t σ,
definita sull’unione disgiunta X t Y è
τ t σ = {A ⊆ X t Y : A ∩ X ∈ τ e A ∩ Y ∈ σ}
(verificare che è una topologia) Siano ora X = R e Y = R. X t Y non è altro che un insieme formato
da due copie disgiunte di R. Siano σ la topologia standard su R e τ quella cofinita. Sia α = τ t σ e
β = σ t τ . Nessuna tra α e β è più fine dell’altra.
Esercizio 1.1.59. Sia X = R2 . Sia τ la topologia Euclidea e sia σ = {A ∈ τ : O ∈ / A} ∪ {X}.
Dimostrare che σ è una topologia, si dica se τ e σ sono confrontabili, se sono uguali o se una è più
fine dell’altra.
Esercizio 1.1.60. In R sia τ = {A ⊆ R : ∀x ∈ A∃ε > 0 : [x, x + ε) ∈ A}. Si dimostri che τ è una
topologia e che è strettamente più fine di quella Euclidea.

1.2. Basi. Topologia di Zariski e altri esempi


Definizione 1.2.1. Sia (X, τ ) uno spazio topologico. Una base di τ è una famiglia B ⊆ τ tale che
ogni elemento di τ sia unione di elementi di B.
Esempio 1.2.2. In uno spazio metrico (X, d), le palle B(x, ε) al variare di x ∈ X e ε > 0 formano
una base per la topologia indotta da d.
Lemma 1.2.3. Sia X un insieme e sia B ⊆ P(X). Per ogni A ⊆ X le seguenti condizioni sono equivalenti:
a) Per ogni x ∈ A esiste B ∈ B tale che x ∈ B ⊆ A.
b) A è unione di elementi di B.
32 1. SPAZI TOPOLOGICI

D IMOSTRAZIONE . Supponiamo a). Per ogni x ∈ A sia Bx ∈ B tale che x ∈ Bx ⊆ A. Allora


A = ∪x∈A Bx risulta essere unione di elementi di B. Viceversa, supponiamo b). Sia x ∈ A. Siccome
A è unione di elementi di B, ne esiste almeno uno, che chiamiamo Bx , che contiene x. Ovviamente
x ∈ Bx ⊆ A. 
Teorema 1.2.4. Sia X un insieme e sia B ⊆ P(X). Allora B è base per una topologia su X se e solo se
(1) ∪B∈B B = X;
(2) ∀B1 , B2 ∈ B e per ogni x ∈ B1 ∩ B2 esiste B3 ∈ B tale che x ∈ B3 ⊆ B1 ∩ B2 .
Inoltre, in tal caso la topologia τ di cui B è base è la famiglia delle unioni qualsiasi di elementi di B.
D IMOSTRAZIONE . Supponiamo che B sia base per una topologia τ su X. Allora ogni aperto è
unione di elementi di B, in particolare X lo è e τ = {∪i∈I Bi : Bi ∈ B}. Inoltre, gli elementi di B sono
aperti e quindi B1 ∩ B2 è aperto, ergo unione di elementi di B e il Lemma 1.2.3 conclude.
Viceversa, supponiamo che B goda delle due proprietà (1) e (2) e sia τ = {∪i∈I Bi : Bi ∈
B, I insieme di indici qualsiasi}. Se dimostriamo che τ è una topologia allora abbiamo finto perché in
tal caso B ne è una base tautologicamente. ∅ ∈ τ perché per convenzione l’unione vuota è vuota e
X ∈ τ per la proprietà (1). Osserviamo che τ è chiusa per unioni qualsiasi per come è definita.
Vediamo che τ è chiusa per intersezione. Siano A1 , A2 ∈ τ . Esistono quindi I1 , I2 insiemi di indici
e Bij ∈ B tali che Aj = ∪i∈Ij Bij , j = 1, 2. Da cui
[
A1 ∩ A2 = ∪i∈I1 Bi1 ∩ ∪i∈I2 Bi2 = Bi11 ∩ Bi22 .
 

i1 ∈I1 ,i2 ∈I2

Per la proprietà (2), e per il Lemma 1.2.3, Bi11 ∩ Bi22 è unione di elementi di B. Quindi A1 ∩ A2 =
∪(Bi11 ∩ Bi22 ) è anch’esso unione di elementi di B e dunque sta in τ . 
Esempio 1.2.5. Per ogni x, a ∈ Z sia S(x, a) la successione aritmetica che parte da x con passo a:
S(x, a) = {x + Za} = {x + na : n ∈ Z}.
L’insieme delle successioni aritmetiche soddisfa le condizioni (1) e (2) del Teorema 1.2.4. Infatti la
(1) è ovvia e per la (2) basta osservare che se c ∈ S(x, a) ∩ S(y, b) allora, detto d il minimo comune
multiplo tra a e b, si ha S(c, d) ⊆ S(x, a) ∩ S(y, b). Quindi l’insieme delle successioni aritmetiche è
base di una topologia su Z, detta topologia delle successioni aritmetiche.
O SSERVAZIONE 1.2.6. La topologia delle successioni aritmetiche è stata inventata nel 1955 da
Furstenberg, che la usò per dare una dimostrazione topologica dell’esistenza di infiniti numeri primi.
Infatti, usando questa topologia si può arguire come segue. Siccome S(x, a)c è l’unione di S(x + i, a)
con i = 1, ..., a − 1, ogni S(x, a) è chiuso (oltre che aperto). Sia A l’unione di tutti gli insiemi S(0, p) al
variare di p primo (1 non è un primo). Chiaramente Ac = {−1, 1}. Ma se i primi fossero in numero
finito, A sarebbe unione finita di chiusi e dunque chiuso. Quindi Ac sarebbe aperto, ergo unione
di elementi della base. Ma Ac contiene solo due elementi, mentre ogni aperto della base è infinito.
Assurdo.
Piuttosto che il Teorema 1.2.4, nella vita capita spesso di usare il seguente corollario, le cui ipotesi
sono generalmente semplici da verificare.
Corollario 1.2.7. Sia X un insieme e sia B ⊆ P(X) una famiglia chiusa per intersezione e tale che
∪B∈B B = X. Allora τ = {∪i∈I Bi : Bi ∈ B, I insieme qualsiasi} è una topologia su X di cui B è base.
D IMOSTRAZIONE . Siccome B è chiusa per intersezione, la condizione (2) del Teorema 1.2.4 è
tautologicamente verificata (ponendo B3 = B1 ∩ B2 ). 
Vediamo ora, come esempio di applicazione del Corollario 1.2.7, una topologia molto importante
in matematica, specialmente in geometria algebrica: La topologia di Zariski.
1.2. BASI. TOPOLOGIA DI ZARISKI E ALTRI ESEMPI 33

Esempio 1.2.8. Sia K un campo (per esempio R). Per ogni polinomio p ∈ K[x1 , . . . , xn ] poniamo
Z(p) = {x ∈ Kn : p(x) = 0} e A(p) = {x ∈ Kn : p(x) 6= 0} = Z(p)c .
Si noti che
Z(1) = ∅ Z(0) = Kn Z(pq) = Z(p) ∪ Z(q) A(pq) = A(p) ∩ A(q).
In particolare la famiglia degli insiemi A(p), al variare di p ∈ K[x1 , . . . , xn ], è chiusa per intersezione
e quindi per il Corollario 1.2.7 è una base per una topologia su Kn , detta topologia di Zariski.
Gli insiemi Z(p) sono chiusi e gli A(p) aperti. Per questa topologia i chiusi sono gli zeri di sistemi
di polinomi. Cioè per ogni insieme di polinomi S ⊆ K[x1 , . . . , xn ] si pone
Z(S) = ∩p∈S Z(p) = {x ∈ Kn : p(x) = 0∀p ∈ S}
gli insiemi Z(S) sono tutti i chiusi della topologia di Zariski 1.
La topologia di Zariski è una buona palestra per allenare il cervello al fatto che al mondo non
esiste solo la topologia Euclidea.
Esempio 1.2.9. In R2 con la topologia di Zariski, la parte interna della palla B(P, R) è vuota. Que-
sto perché un polinomio, in quanto funzione analitica, se si annulla su un aperto Euclideo di R2 , allora
è il polinomio nullo. Quindi la chiusura del complementare di B(P, R), per la topologia di Zariski, è
tutto R2 . (Stiamo usando Int(X) = (X c )c ).
Esercizio 1.2.10. Sia X ⊆ Kn con la topologia di Zariski. Sia I(X) l’insieme dei polinomi che si
annullano su X, cioè I(X) = {f ∈ K[x1 , . . . , xn ] : x ∈ X ⇒ f (x) = 0}. Si dimostri che la chiusura di
X è Z(I(X)).
Esercizio 1.2.11. Si dimostri che la topologia di Zariski su R coincide con la topologia cofinita.
Le basi sono spesso utili per confrontare due topologie.
Teorema 1.2.12. Siano τ, σ due topologie su un insieme X. Allora σ è meno fine di τ se e solo se ammette
una base Bσ fatta di aperti di τ , se e solo se ogni base di σ è fatta di elementi di τ . In particolare se Bσ , Bτ sono
basi di σ e τ rispettivamente, allora σ è meno fine di τ se e solo se ogni elemento di Bσ è unione di elementi di
Bτ se e solo se
∀x ∈ A ∈ Bσ ∃B ∈ Bτ : x ∈ B ⊆ A.
D IMOSTRAZIONE . Se σ ⊆ τ allora in particolare gli elementi di ogni base di σ sono anche ele-
menti di τ . Viceversa, se σ ha una base Bσ ⊆ τ , allora ogni aperto di σ, in quanto unione di elementi
di Bσ , è anche unione di elementi di τ e quindi è in τ . Le altre affermazioni dell’enunciato seguono
dal fatto che ogni aperto è unione degli elementi di base. 
Esempio 1.2.13. La topologia di Zariski è meno fine della Euclidea di Rn . Infatti i polinomi sono
funzioni continue Rn → R per la metrica Euclidea, quindi per ogni polinomio p, il teorema della per-
manenza del segno per funzioni continue a valori reali implica che l’insieme A(p) è aperto Euclideo.
Quindi la Zariski ha una base fatta di aperti Euclidei.
Esempio 1.2.14. Sia F ⊂ P(R) la famiglia degli insiemi “chiusi a sinistra e aperti a destra”, cioè
del tipo [a, b). Essa soddisfa le condizioni del Corollario 1.2.7. La topologia τ di cui F è base è talvolta
chiamata topologia degli intervalli semiaperti a destra o topologia del limite destro (questo secondo
nome sarà più chiaro in seguito). Essa è più fine della Euclidea. Infatti (a, b) = ∪x∈(a,b) [x, b) quindi
la topologia Euclidea ha una base fatta di elementi di τ . R dotato della topologia del limite destro si
chiama anche retta di Sorgenfrey.
Esercizio 1.2.15. Dimostrare che la topologia del limite destro è quella dell’Esercizio 1.1.60.
1In generale S può a priori essere infinito, ma siccome K è un campo, per il Teorema della base di Hilbert, possiamo
sempre ridurci al caso di S finito.
34 1. SPAZI TOPOLOGICI

Definizione 1.2.16. Sia X un insieme e sia A ⊆ P(X). La topologia generata da A è l’intersezione


di tutte le topologie contenenti A. (Si noti che la discreta contiene A.)
Teorema 1.2.17. Sia X un insieme e sia A ⊆ P(X). La topologia generata da A è la meno fine di tutte le
topologie contenenti A. Esplicitamente, i suoi aperti sono tutte e sole le unioni qualsiasi di intersezioni finite di
elementi di A:
τA = {∪j∈J ∩ki=1 Aji : Aji ∈ A, k ∈ N, J insieme qualsiasi} ∪ {X}
e una sua base è formata dalle intersezioni finite di elementi di A:
B = {∩ki=1 Ai : Ai ∈ A, k ∈ N} ∪ {X}.
D IMOSTRAZIONE . La topologia generata da A è la meno fine delle topologie contenenti A perché
ogni topologia contenente A è usata nell’intersezione che la definisce.
La famiglia B è chiusa per intersezione finita e contiene X. Per il Corollario 1.2.7 τA è una topo-
logia e B ne è una base. Ovviamente τA contiene A. Quindi la topologia generata da A è contenuta in
τA .
D’altra parte, siccome ogni topologia è chiusa per unioni qualsiasi e intersezioni finite, la famiglia
τA è contenuta in ogni topologia che contiene A e quindi è contenuta nella topologia generata da
A. 

Esempio 1.2.18 (Topologia dell’ordine). Sia X un insieme totalmente ordinato. La topologia del-
l’ordine è quella generata dagli intervalli illimitati, ossia insiemi del tipo {x ∈ X : x < b} o
{x ∈ X : a < x}. Si noti che gli intervalli in generale non sono una base per la topologia dell’ordine.
Per esempio, in [0, ∞) con l’ordine usuale, l’intervallo (1, 2) non è unione di intervalli illimitati.
Si noti che se Y = ∪A∈A A non è tutto X, allora la topologia generata da A non distingue i punti
di X \ Y , nel senso che per ogni z ∈ X \ Y l’unico aperto che contiene z è X. Quindi in realtà la
topologia generata da A fornisce informazioni solo su ∪A A.
Esempio 1.2.19 (Falsa topologia dell’ordine). Sia X un insieme totalmente ordinato. Sia τ la topo-
logia generata dagli intervalli limitati, ossia insiemi del tipo (a, b) = {x ∈ X : a < x < b}. Dimostrare
che in generale tale topologia non è quella dell’ordine. (Suggerimento: Provare con X = [0, 1]. Chi
sono gli intorni di 0?) Si diano almeno due esempi in cui τ coincide con la topologia dell’ordine.
Esempio 1.2.20. Sia Y uno spazio topologico, sia Y X = {f : X → Y } e sia K ⊆ P(X) una famiglia
di sottoinsiemi di X. Per ogni K ∈ K e per ogni aperto U di Y sia AK,U = {f ∈ Y X : f (K) ⊆ U }. La
topologia generata dagli insiemi AK,U si chiama topologia K-aperta, detta talvolta anche topologia
dello slalom. (Figura 4.)

U2

U3

U1

K1 K2 K3

F IGURA 4. Una funzione in AK1 ,U1 ∩ AK2 ,U2 ∩ AK3 ,U3


1.3. INTORNI E CONVERGENZA DI SUCCESSIONI 35

1.3. Intorni e convergenza di successioni


In matematica accade spesso di voler studiare uno spazio topologico localmente, interessandosi
solamente a cosa succede vicino a un punto dato, per esempio se si vuole capire se una successione
converge o meno a un certo limite. Per questo si formalizza il concetto di intorno, o vicinanza, di un
punto.
Definizione 1.3.1. Sia (X, τ ) uno spazio topologico e sia x ∈ X. Un intorno di x è un qualsiasi
sottoinsieme N di X tale che x sia un punto interno di N .
Si noti che nella definizione di intorno non si richiede che l’intorno sia aperto.
Esempio 1.3.2. Un aperto è un intorno di ogni suo punto.
Esempio 1.3.3. In R standard l’insieme [0, 2] è un intorno di 1 ma non lo è di 0 né di 2.
Il disegno classico che si fa per spiegare gli intorni è il seguente:

P A è intorno di P ma non di Q

Q A

Questo disegno, che va benissimo per R2 Euclideo, va interpretato cum grano salis altrimenti po-
trebbe risultare fuorviante. Per esempio, se si considera la topologia di Zariski su R2 , la palla metrica
di centro P e raggio R non è un intorno di P . (Si veda l’Esempio 1.2.9).
Teorema 1.3.4. Sia X uno spazio topologico, sia x ∈ X e siano A, B due intorni di x. Allora A ∩ B è un
intorno di x. Se C ⊇ A allora C è un intorno di x.
D IMOSTRAZIONE . Siccome x è interno sia ad A che a B, esistono aperti U, V tali che
x∈U ⊆A x ∈ V ⊆ B.
L’insieme U ∩ V è aperto e x ∈ U ∩ V ⊆ A ∩ B. Quindi x è interno a A ∩ B. La seconda affermazione
discende tautologicamente dalla definizione di punto interno e di intorno. 
La famiglia di tutti gli intorni di x si indica con I(x) (tipicamente nei testi italiani) o V(x) (dal
francese voisinage) o N (x) (dall’inglese neighborhood). Essa ha la proprietà di filtro (Teorema 1.3.4):
Definizione 1.3.5. Dato un insieme X, un filtro di sottoinsiemi di X è una famiglia non vuota
F ( P(X) chiusa per intersezione e passaggio a soprainsiemi:
∀A, B ∈ F si ha A ∩ B ∈ F ∀A ⊆ B, (A ∈ F) ⇒ (B ∈ F).
Definizione 1.3.6. Sia (X, τ ) uno spazio topologico e sia x ∈ X. Un sistema fondamentale di
intorni di x (detta anche base locale) è una famiglia Fx di intorni di x tale che per ogni A ∈ I(x) esiste
B ∈ Fx tale che B ⊆ A.
Tautologicamente, la famiglia I(x) è un sistema fondamentale di intorni di x.
Esempio 1.3.7. Sia (X, d) uno spazio metrico. Per ogni x definiamo Bx = {B(x, ε) : 0 < ε ∈ Q}.
Per ogni x ∈ X, la famiglia Bx è un sistema fondamentale di intorni (aperti) di x.
Esempio 1.3.8. Se B è una base per una topologia su X, allora per ogni x ∈ X la famiglia Bx =
{B ∈ B : x ∈ B} è un sistema fondamentale di intorni aperti di x.
36 1. SPAZI TOPOLOGICI

Definizione 1.3.9. Un insieme diretto è un insieme ordinato (X, ≤) tale che per ogni x, y ∈ X
esiste z ∈ X tale che x ≤ z e y ≤ z.
N è un insieme diretto, ed è questo il punto chiave per definire le successioni (xn ) e i loro limiti2.
I sistemi fondamentali di intorni, ordinati con l’inclusione inversa A ≤ B ⇔ B ⊆ A, sono insiemi
diretti e si usano per dare la nozione di convergenza in spazi topologici.
Definizione 1.3.10 (Convergenza di successioni). Sia (X, τ ) uno spazio topologico. Una succes-
sione (xi )i∈N in X converge a x ∈ X se per ogni intorno A di x si ha xi ∈ A definitivamente in i.
Equivalentemente, dato un sistema fondamentale di intorni Nx di x, si ha xi → x se per ogni A ∈ Nx
si ha xi ∈ A definitivamente in i.
Se (X, τ ) è uno spazio metrico allora la nozione di convergenza topologica coincide con quella
metrica. In topologie strane però, le successioni possono avere comportamenti assai bizzarri.
Esempio 1.3.11. Sia X un insieme e sia τ la topologia generata da una famiglia A ⊂ P(X) tale che
∪A∈A A 6= X. Sia x ∈ X \ ∪A∈A A. Allora ogni successione converge a x. (L’unico intorno di x è X).
Esempio 1.3.12. In R con la topologia di Zariski (che coincide con la cofinita) la successione xn =
1/n converge a qualsiasi punto: dato un qualsiasi insieme aperto A non vuoto, essendo A cofinito
si ha che xn ∈ A definitivamente. Lo stesso dicasi per una qualsiasi successione di punti distinti tra
loro.
Esempio 1.3.13. In Z con la topologia delle successioni aritmetiche, la successione xn = n! conver-
ge a zero. Infatti, per ogni successione S(0, a) si ha che xn ∈ S(0, a) definitivamente.
Esempio 1.3.14. Consideriamo su R la topologia del limite destro (Esempio 1.2.14). Allora una
successione xn converge a x se e solo se converge a x “da destra” per la topologia Euclidea. Infatti,
xn → x se e solo se per ogni intorno U di x si ha xn ∈ U definitivamente. In particolare ciò vale per
gli intorni Uε = [x, x + ε) (che sono aperti per la topologia del limite destro). Quindi dal fatto che
xn ∈ Uε definitivamente si deduce che xn → x “da destra” per la topologia Euclidea.
Teorema 1.3.15. Sia (X, τ ) uno spazio topologico e supponiamo di aver fissato, per ogni x, un sistema
fondamentale di intorni Fx . Sia F = ∪x Fx ⊆ P(X). Allora ogni aperto di τ è unione di elementi di F. In
particolare, se tutti gli elementi degli Fx sono aperti, allora F è una base di τ .
D IMOSTRAZIONE . Sia A aperto. Allora esso è intorno di ogni suo punto. Per ogni a ∈ A esiste
quindi Ua ∈ Fa tale che Ua ⊆ A. Ne segue che A = ∪a∈A Ua . 

Viceversa, una topologia si può descrivere dando un sistema fondamentale di intorni per ogni
punto. Questo è un procedimento standard, specialmente in Analisi Funzionale.
Teorema 1.3.16. Sia X un insieme e per ogni x ∈ X sia data una famiglia non vuota Fx ⊆ P(X) di
insiemi contenenti x e diretti per l’inclusione inversa, cioè:
∀A, B ∈ Fx ∃C ∈ Fx : C ⊆ A ∩ B.
Allora la famiglia
τ = {A ∈ P(X) : ∀x ∈ A ∃B ∈ Fx : B ⊆ A}
è una topologia su X; per ogni x ∈ X la famiglia Fx è un sistema fondamentale di intorni di x, e se ogni
Fx ⊆ τ allora F = ∪x Fx è una base di τ .

2La teoria delle successioni si generalizza infatti rimpiazzando il ruolo di N con insiemi diretti qualsiasi. Si veda a tal
proposito l’Appendice B.
1.4. SOTTOSPAZI 37

D IMOSTRAZIONE . La famiglia τ contiene X ed il vuoto per come è definita, cosı̀ come è evidente
dalla definizione che τ sia chiusa per unioni qualsiasi. Vediamo l’intersezione. Siano A1 , A2 ∈ τ e sia
x ∈ A1 ∩ A2 . Per definizione esistono B1 , B2 ∈ Fx con Bi ⊆ Ai , i = 1, 2. Siccome Fx è diretto, esiste
C ∈ Fx tale che C ⊆ B1 ∩ B2 ⊆ A1 ∩ A2 e quindi A1 ∩ A2 ∈ τ .
Sia ora x ∈ X e N un suo intorno. Essendo x interno a N , esiste un aperto A ∈ τ con x ∈ A ⊆ N
e per definizione di τ esiste B ∈ Fx tale che B ⊆ A. Quindi Fx è un sistema fondamentale di intorni
di x. Se ogni Fx ⊆ τ allora F ⊆ τ e l’ultima affermazione segue dal Teorema 1.3.15. 
Esempio 1.3.17 (Topologia della convergenza puntuale). Sia (Y, d) uno spazio metrico (per esem-
pio R) e sia A un insieme (per esempio R). Sia X = Y A = {f : A → Y }. Per ogni f ∈ X definiamo
un sistema fondamentale di intorni. Per ogni k ∈ N, per ogni a = (a1 , . . . , ak ) ∈ Ak , per ogni
ε = (ε1 , . . . , εk ) ∈ (0, ∞)k definiamo
Na,ε (f ) = {g ∈ X : d(f (ai ), g(ai )) < εi : ∀i = 1, . . . , k}
La topologia che ha gli insiemi Na,ε (f ) come sistema fondamentale di intorni è la topologia della
convergenza puntuale. Secondo questa topologia infatti fn → f se e solo se per ogni x ∈ A la
successione fn (x) converge in Y a f (x).
Esempio 1.3.18 (Topologia della convergenza uniforme). Sia (Y, d) uno spazio metrico e sia A un
insieme. Sia X = Y A = {f : A → Y }. Per ogni f ∈ X, per ogni ε > 0, definiamo
Nε (f ) = {g ∈ X : d(f (a), g(a)) < ε : ∀a ∈ A}
La topologia che ha gli insiemi Nε (f ) come sistema fondamentale di intorni è la topologia della con-
vergenza uniforme. Secondo questa topologia infatti fn → f se e solo se per ogni la successione
supa∈A d(fn (x), f (x)) converge a zero in R.
Esercizio 1.3.19. Si dimostri che la topologia della convergenza puntuale su RA è la topologia
K-aperta se K è la famiglia dei singoletti K = {{a}, a ∈ A}.
Esercizio 1.3.20. Si dimostri che la topologia della convergenza uniforme sullo spazio delle fun-
zioni continue da [0, 1] a R è la topologia K-aperta se K è la famiglia degli intervalli chiusi di [0, 1].

1.4. Sottospazi
Teorema 1.4.1. Sia (X, τ ) uno spazio topologico e sia Y ⊆ X. La famiglia τ |Y ⊆ P(Y ) definita da
τ |Y = {B ∩ Y : B ∈ τ }
è una topologia su Y . Inoltre, se B è una base di τ allora l’insieme
BY = {B ∩ Y : B ∈ B}
è una base di τ |Y .
D IMOSTRAZIONE . Siccome τ contiene il vuoto e X, allora τ |Y contiene il vuoto e Y = Y ∩ X. Se
{Ai } ⊆ τ |Y è una famiglia di elementi di τ |Y , allora esistono Bi ∈ τ tali che Ai = Bi ∩ Y . Siccome τ
è una topologia allora ∪i Bi ∈ τ . Ma allora ∪i (Bi ∩ Y ) = (∪i Bi ) ∩ Y ∈ τ |Y . Un discorso analogo vale
per l’intersezione.
Sia ora A ∈ τ |Y . Allora esiste B ∈ τ tale che A = B ∩ Y . Esistono quindi Bi ∈ B tali che B = ∪i Bi .
Quindi A = B ∩ Y = (∪i Bi ) ∩ Y = ∪i (Bi ∩ Y ) è unione di elementi di BY . 
Definizione 1.4.2 (Sottospazio). Sia (X, τ ) uno spazio topologico e sia Y ⊆ X. La topologia τ |Y
si chiama restrizione di τ ad Y , oppure topologia indotta da X su Y , oppure topologia di Y come
sottospazio di X. Lo spazio topologico (Y, τ |Y ) si dice sottospazio di (X, τ ). Se non ci sono ambiguità
si può indicare τ |Y anche semplicemente con τ .
Teorema 1.4.3. Sia Y un sottospazio di (X, τ ) allora:
38 1. SPAZI TOPOLOGICI

(1) I chiusi di Y sono le intersezioni con Y dei chiusi di X.


(2) Se un sottoinsieme di Y è aperto (o chiuso) in X, allora lo è anche in Y .
(3) Se Y è aperto (risp. chiuso) in X allora gli aperti (risp. chiusi) di Y sono anche aperti (risp. chiusi)
di X.
D IMOSTRAZIONE . (1) Dire che C ⊆ Y è chiuso in τ |Y equivale a dire che Y \ C è un aperto di τ |Y
e cioè che esiste B ∈ τ tale che Y \ C = B ∩ Y . Siccome Y = (B ∩ Y ) ∪ (B c ∩ Y ) si ha che C = B c ∩ Y .
Ma per definizione B è aperto se e solo se B c è un chiuso di τ .
(2) Se A ⊆ Y è aperto in X allora A = A ∩ Y è aperto in Y per definizione di topologia indotta.
Stessa cosa, per il punto (1), se A è chiuso.
(3) Per definizione A ⊆ Y è aperto in τ |Y se e solo se esiste U ∈ τ d tale che A = U ∩ Y . Ma se
Y è aperto in X, allora U ∩ Y è un aperto di X. Per il punto (1), lo stesso ragionamento vale se Y è
chiuso e A è chiuso in Y . 
ATTENZIONE: a parte i casi elencati nel Teorema 1.4.3 in generale può succedere di tutto ed è
bene ricordare che la nozione di essere aperto/chiuso ha una natura relativa.
Esempio 1.4.4. Sia (X, τ ) uno spazio topologico e sia A ⊆ X. Non importa se A sia aperto, chiuso
o nessuno dei due, ma A è sempre sia aperto che chiuso per τ |A .
Esempio 1.4.5. [0, 1) non è né aperto né chiuso in R, ma è chiuso in (−1, 1) ed è aperto in [0, ∞).
Esempio 1.4.6. Sia Y = {(x, y) ∈ R2 : y > 0}. L’insieme {(x, y) ∈ R2 : x2 + y 2 ≤ 1, y > 0} non è un
chiuso di R2 , ma è un chiuso di Y con la topologia indotta.
Esempio 1.4.7. Sia Y = {(x, y) ∈ R2 : y = 0}. L’insieme {(x, y) ∈ R2 : 1 < x < 2, y = 0} non è un
aperto di R2 ma è un aperto di Y con la topologia indotta.
Allo stesso modo, quando si parla di parte interna e chiusura in una situazione A ⊆ Y ⊆ X, si
deve sempre specificare se si sta considerando la topologia di X o quella indotta su Y . Lo si può fare
Y X
usando le notazioni apicali e pedicali A , A e IntY (A), IntX (A).
Esempio 1.4.8. Il punto 2 non è interno a [2, 3) rispetto alla topologia di R ma è un punto interno
di [2, 3) con la topologia indotta da R su [2, ∞).
Y X
Teorema 1.4.9. Sia Y un sottospazio di (X, τ ). Per ogni A ⊆ Y si ha A = A ∩ Y .
X Y X
D IMOSTRAZIONE . Per definizione A ∩ Y è un chiuso di τ |Y contenente A quindi A ⊆ A ∩ Y .
Y
D’altronde A è un chiuso di τ |Y contenente A quindi esiste un chiuso C di τ , contenente A, tale che
Y X X Y
A = C ∩ Y . Siccome A ⊆ C si ha A ∩ Y ⊆ C ∩ Y = A . 
Corollario 1.4.10. Sia A un sottoinsieme di uno spazio topologico X. Allora A è denso in Ā rispetto alla
topologia indotta da X su Ā.
D IMOSTRAZIONE . Per il Teorema 1.4.9, ponendo Y = Ā, si ha che la chiusura di A per la topolo-
gia di Ā non è altro che Ā ∩ Ā = Ā. 
Y X
Bisogna però usare cautela ché in generale non è vero che A ∩ Y =A ∩Y:
Esempio 1.4.11. In R2 sia Y la palla chiusa di centro l’origine e raggio 1 e sia A = Y c . Chiaramente
A∩Y =¯∅ = ∅; ma A ∩ Y è la circonferenza di centro l’origine e raggio 1.
Con la parte interna le cose non vanno meglio e in generale IntY (A) 6= IntX (A) ∩ Y :
Esempio 1.4.12. In R2 sia Y = {(x, y) : y = 0} e sia A = Y . Chiaramente IntY (A) = Y ; ma
IntR2 (A) ∩ Y = ∅ ∩ Y = ∅.
1.5. ASSIOMI DI NUMERABILITÀ 39

Non ci sono problemi invece con le catene di inclusioni.


Teorema 1.4.13. Sia (X, τ ) uno spazio topologico e siano B ⊆ A ⊆ X. Allora
τ |B = (τ |A )|B .
D IMOSTRAZIONE . Per definizione C ∈ τ |B se e solo se esiste D ∈ τ tale che C = B ∩ D. Ma
B ∩ D = B ∩ (A ∩ D) quindi (ponendo E = A ∩ D) si ha che C ∈ τ |B se e solo se esiste E ∈ τ |A tale
che C = B ∩ E, che per definizione equivale a dire che C ∈ (τ |A )|B . 
Il passaggio a sottospazio mantiene le distanze...
Teorema 1.4.14. Sia (X, d) uno spazio metrico e sia τd la topologia indotta da d su X. Sia Y ⊆ X. Sia
dY la restrizione della funzione distanza a Y e sia τdY la topologia che essa induce su Y . Allora
(τd )|Y = τdY .
D IMOSTRAZIONE . Una base per entrambe le topologie è data dalle palle metriche. 
... ma non rispetta gli ordini!
Esempio 1.4.15. Sia X = (−∞, 0] ∪ (1, +∞) ⊆ R. L’ordine naturale ≤ di R induce un ordine ≤X
su X. (La topologia indotta su R da ≤ è quella Euclidea.) l’intervallo (−1, 0] è un aperto di X per
la topologia indotta da R su X perché (−1, 0] = (−1, 1) ∩ X. Ma rispetto alla topologia dell’ordine
≤X , ogni intervallo aperto contenente 0 deve contenere anche qualche punto in (1, 1 + ε). Quindi
0 non è interno a (−1, 0] che quindi non è aperto per la topologia indotta da ≤X . Ne segue che la
topologia indotta da R su X è diversa dalla topologia indotta su X da ≤X . In versione scioglilingua:
la topologia indotta dall’ordine indotto non è la topologia indotta dalla topologia indotta dall’ordine.
Esercizio 1.4.16. Nell’esempio precedente, quale topologia induce ≤X su X?

1.5. Assiomi di numerabilità


Definizione 1.5.1 (Assiomi di numerabilità). Uno spazio topologico (X, τ ) si dice a base nume-
rabile se τ ammette una base numerabile; si dice localmente numerabile se ogni x ∈ X ammette un
sistema fondamentale di intorni numerabile. È in uso la seguente terminologia:
• Primo assioma di numerabilità: X è localmente numerabile. (In inglese X si dice First
countable, in riferimento al primo assioma, ma in italiano rende proprio male);
• Secondo assioma di numerabilità: X è a base numerabile. (In inglese Second countable. Come
sopra, “secondo numerabile” suona da far ribrezzo).
Chiaramente il secondo implica il primo.
Esempio 1.5.2. Se τ è numerabile, allora è ovviamente a base numerabile. Per esempio la topologia
della palle annidate su R2 lo è (Esempio 1.1.10).
Esempio 1.5.3. La topologia delle successione aritmetiche (Esempio 1.2.5) è a base numerabile
perché l’insieme delle successioni aritmetiche {S(x, a), x, a ∈ Z} è numerabile.
Esempio 1.5.4. R2 è localmente numerabile, cosı̀ come ogni spazio metrico: basta considerare le
palle di raggio razionale. (Come nell’Esempio 1.3.7).
Esempio 1.5.5. La topologia discreta è localmente numerabile, infatti ogni punto ha un sistema
fondamentale di intorni fatto da un solo elemento: il singoletto di sé stesso.
Non tutti gli spazi localmente numerabili hanno base numerabile.
Esempio 1.5.6. La topologia discreta su R non è a base numerabile. Infatti ogni base della topologia
discreta deve contenere la famiglia dei singoletti {{x}, x ∈ R}, che non è numerabile perché R non lo
è. La stessa cosa vale per la discreta su un qualunque insieme non numerabile.
40 1. SPAZI TOPOLOGICI

Ci sono alcune proprietà degli spazi topologici che, pur suonando come “intuitivamente vere”
non lo sono in generale. Ciò dipende dal fatto che spesso si è abituati a pensare che tutto funzioni
come in R2 Euclideo. I seguenti teoremi ci dicono che, per quanto riguarda il comportamento delle
successioni, negli spazi localmente numerabili le cose funzionano come ci si aspettava.
Teorema 1.5.7 (Degli intorni inscatolati). Sia X uno spazio topologico localmente numerabile. Allora
ogni x ∈ X ha un sistema fondamentale di intorni (numerabile) (Bn )n∈N inscatolati, cioè
n > m ⇒ Bn ⊆ Bm .
D IMOSTRAZIONE . Sia (Ni )i∈N un sistema fondamentale di intorni di x numerabile. Per ogni n
definiamo Bn = N1 ∩ · · · ∩ Nn . In quanto intersezione finita di intorni, Bn è intorno di x. Inoltre
se A ∈ I(x) esiste Ni tale che Ni ⊆ A. Ma per ogni n > i si ha Bn ⊆ Ni . Quindi la famiglia
numerabile (Bi )i∈N è un sistema fondamentale di intorni di x. Per come sono definiti, se n > m allora
Bn ⊆ Bm . 
Teorema 1.5.8. Sia X uno spazio topologico localmente numerabile (per esempio uno spazio metrico) e sia
A ⊆ X. Allora x ∈ X è un punto di aderenza di A se e solo se è il limite di una successione in A.
D IMOSTRAZIONE . Se x è il limite di una successione (ai )i∈N ⊆ A allora non è interno ad Ac e
quindi è di aderenza per A. Viceversa, se x ∈ Ā, allora per ogni intorno N di x esiste a ∈ N ∩ A. Sia
(Ni )i∈N un sistema fondamentale di intorni inscatolati di x e sia ai ∈ Ni ∩ A. Per ogni intorno B di x
esiste Ni ⊆ B e quindi an ∈ Nn ⊆ Ni ⊆ B per ogni n > i. Quindi ai → x. 
Definizione 1.5.9. Uno spazio topologico (X, τ ) si dice separabile se contiene un sottoinsieme
denso numerabile.
Esempio 1.5.10. Ogni spazio numerabile è separabile in quanto esso è denso in sé stesso.
Esempio 1.5.11. R è separabile perché Q è numerabile e denso in R. Rn è separabile perché Qn è
numerabile e denso in Rn .
Esempio 1.5.12. Sia τ la topologia delle palle annidate di R2 (Esempio 1.1.10). Sia x l’origine di R2 .
La chiusura di {x} è R2 perché ogni aperto non vuoto contiene x. In particolare R2 con tale topologia
è separabile perché {x} — che è numerabile perché contiene un solo elemento — è denso in R2 .
Teorema 1.5.13. Sia X uno spazio topologico a base numerabile. Allora X è separabile.
D IMOSTRAZIONE . Sia B = {Bi } una base numerabile per la topologia di X. Non è restrittivo
supporre ogni Bi non vuoto. Sia bi ∈ Bi . L’insieme B = {bi } è un insieme numerabile perché B
lo è. Vediamo che è denso. Sia x ∈ X e sia U un intorno di x. Esiste quindi un aperto A tale che
x ∈ A ⊆ U . Siccome A è unione di aperti della base esiste almeno un Bi ∈ B tale che Bi ⊆ A, in
particolare bi ∈ U . 
Teorema 1.5.14. Sia (X, d) uno spazio metrico separabile. Allora X ha una base numerabile.
D IMOSTRAZIONE . Sia Q ⊆ X un insieme denso numerabile e sia Bq,n = B(q, n1 ). Dimostriamo
che B = {Bq,n : q ∈ Q, n ∈ N} è una base della topologia generata da d. Sia A un aperto di X e sia
x ∈ A. Per definizione esiste ε > 0 tale che B(x, ε) ⊆ A. Sia n tale che 1/n < ε e sia q ∈ Q ∩ B(x, 1/2n).
Con queste scelte si ha x ∈ Bq,2n ⊆ A. Ne segue che A è unione di elementi di B. 
Teorema 1.5.15. Sia (X, τ ) uno spazio topologico. Se τ contiene una famiglia non numerabile A di aperti
non vuoti a due a due disgiunti, allora X non è separabile (e non può quindi avere una base numerabile).
D IMOSTRAZIONE . Sia Q ⊆ X un insieme numerabile. Siccome gli elementi di A sono disgiunti,
ogni q ∈ Q appartiene al più ad un A ∈ A. Siccome A non è numerabile esiste un aperto A ∈ A che
non interseca Q. Quindi Q non è denso in X. 
1.6. SPAZI DI HAUSDORFF 41

Esempio 1.5.16. In R2 con la topologia dell’ordine lessicografico l’insieme Rx = {x} × R è aperto


per ogni x. Quindi la famiglia R = {Rx }x∈R è una famiglia più che numerabile di aperti disgiun-
ti. Quindi R2 con la topologia dell’ordine lessicografico non è separabile e quindi non ha una base
numerabile.
Esercizio 1.5.17. Si dica se R2 con la topologia dell’ordine lessicografico è localmente numerabile.
Esercizio 1.5.18. Si dimostri che R2 con la metrica dei raggi non è separabile. (In particolare è un
esempio di spazio metrico senza basi numerabili.)
Esempio 1.5.19. La topologia cofinita su R non è a base numerabile. Infatti, sia B = {Bi }i∈N una
famiglia numerabile di aperti. Allora Bi = Cic con Ci insieme finito. Allora C = ∪i Ci è unione
numerabile di insiemi finiti e quindi è numerabile. Siccome R non è numerabile esiste x ∈ / C. Se
l’aperto A = {x}c fosse unione di elementi di B avremmo {x}c = A = ∪i∈I⊆N Bi = ∪i (Cic ) = (∩Ci )c e
quindi {x} = ∩Ci ⊆ C contraddicendo x ∈ / C.
Esercizio 1.5.20. Dimostrare che la topologia cofinita su R non è localmente numerabile.
Esempio 1.5.21. R con la topologia cofinita è separabile. Infatti N̄ = R in quanto essendo i chiusi
gli insiemi finiti e il tutto, l’unico chiuso che contiene N è il tutto. (In particolare tale topologia è
separabile ma non ha una base numerabile. In particolare non è indotta da una metrica.)
Esempio 1.5.22. Sia ω1 il primo ordinale non numerabile3, dotato della topologia dell’ordine. Esso
non è separabile. Infatti ogni sottoinsieme numerabile di ω1 è limitato. Quindi non può essere denso.
Esempio 1.5.23. ω1 è localmente numerabile, infatti ogni intervallo limitato di ω1 è numerabile e
per ogni x ∈ ω1 una base locale di intorni di x è formata dai sottointervalli di [0, x + 1) contenenti x.
Esercizio 1.5.24. Dimostrare che ω1 non è a base numerabile.

1.6. Spazi di Hausdorff


Definizione 1.6.1. Uno spazio topologico X si dice T2 o di Hausdorff se per ogni x 6= y ∈ X
esistono aperti U, V con x ∈ U, y ∈ V e U ∩ V = ∅.
In generale esistono nozioni di spazi T0 , T1 , T3 , T3/2 , . . . . Sono tutte proprietà dette di separazione
(note anche come assiomi di separazione) e si esprimono in genere con formule del tipo “oggetti di
tipo tale si separano attraverso insiemi di tipo tal altro”. La nozione T2 ad esempio si può parafrasare
dicendo che i punti si separano con aperti. Malgrado il nome, le proprietà di separazione non c’en-
trano nulla con la separabilità. In questo testo ci occuperemo solo della proprietà T2 (e un po’ di T3 ,
in seguito).
Esempio 1.6.2. La topologia banale su un insieme con almeno due elementi non è T2 .
Esempio 1.6.3. La topologia discreta è sempre T2 .
Esempio 1.6.4. R2 e gli spazi metrici in generale sono T2 . Infatti se a 6= b, detto R = d(a, b)/10, le
palle B(a, R) e B(b, R) sono disgiunte. (Si noti che anche le palle di raggio d(a, b)/2 sono disgiunte.)

a d(a, b) b
R R

Esempio 1.6.5. R con la topologia cofinita non è T2 . Infatti due aperti non vuoti della topologia
cofinita si intersecano sempre.
Esercizio 1.6.6. Dimostrare che la topologia di Zariski su Rn non è T2 .
3Si veda l’Appendice A per una breve introduzione all’aritmetica ordinale.
42 1. SPAZI TOPOLOGICI

Esempio 1.6.7. La topologia della palle annidate di R2 (Esempio 1.1.10) non è T2 . Infatti per ogni
x, y ∈ R2 , per ogni coppia di aperti U, V x ∈ U e y ∈ V l’origine è contenuta in U ∩ V che quindi non
è vuota.
Esercizio 1.6.8. Si dimostri che la topologia del punto particolare (Esercizio 1.1.11) su un insieme
con almeno due elementi non è T2 .
Esempio 1.6.9. La topologia delle successioni aritmetiche su Z (Esempio 1.2.5) è T2 . Infatti se
n, m ∈ Z sono diversi, allora le successioni S(n, 100(m − n)) e S(m, 100(m − n)) sono disgiunte.
Esercizio 1.6.10. Si dimostri che la topologia dello slalom (Esempio 1.2.20) sullo spazio delle fun-
zioni da R2 in R, usando come K la famiglia dei singoletti, è T2 . (Se due funzioni f, g sono diverse,
allora esiste almeno un x ∈ R2 tale che f (x) 6= g(x) e siccome R è T2 . . . )
Teorema 1.6.11 (Unicità del limite). Sia X uno spazio T2 e sia xi → x una successione convergente. Se
xi → y allora x = y.
D IMOSTRAZIONE . Se X è T2 e x 6= y allora esistono U, V intorni di x, y rispettivamente, tali che
U ∩ V = ∅. Ne segue che se xi → x allora (xi ) non può convergere a y. 
Teorema 1.6.12. I punti di uno spazio T2 sono chiusi.
D IMOSTRAZIONE . Sia X uno spazio T2 e sia x ∈ X. Dimostriamo che il complementare di x è
/ Uy . In particolare {x}c = ∪y6=x Uy
aperto in X. Se y 6= x allora esiste Uy intorno aperto di y tale che x ∈
è aperto. 
Il viceversa non è vero in generale (gli spazi i cui punti son chiusi sono i T1 ).
Esempio 1.6.13. La topologia cofinita su R ha la proprietà che i punti sono chiusi ma non è T2 .
Esercizio 1.6.14. Dimostrare che nella topologia di Zariski i punti sono chiusi.
Esercizio 1.6.15. Si dia un esempio di spazio topologico X (non T2 ) tale che esista una succes-
sione xn convergente a due limiti diversi contemporaneamente. (Eventualmente si guardi l’Esem-
pio 1.3.12).

1.7. Continuità, funzioni aperte e omeomorfismi


In topologia la definizione di continuità non si dà tramite le successioni ma tramite gli aper-
ti. Questo perché gli spazi topologici sono in genere più complicati di R2 e se uno volesse usa-
re il linguaggio delle successioni dovrebbe usare le successioni generalizzate definite tramite gli
insiemi diretti. Il lettore interessato ad approfondire questo punto di vista può dare un’occhiata
all’Appendice B.
Definizione 1.7.1. Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzione f : X → Y si dice
continua se per ogni A ∈ σ si ha f −1 (A) ∈ τ .
In altre parole, una funzione è continua se le preimmagini degli aperti sono aperte. Quella appena
data è la definizione classica di continuità per spazi topologici. Il Teorema 1.7.10 qui sotto fornisce una
formulazione equivalente che è forse più aderente all’intuizione nutrita dalla definizione di continuità
tramite successioni (ma che risulterà inesorabilmente meno naturale al topologo adulto).
Esempio 1.7.2. Se X ha la topologia discreta, ogni funzione da X a un qualsiasi spazio è continua.
Esempio 1.7.3. Se Y ha la topologia banale, ogni funzione da qualsiasi spazio verso Y è continua.
Esempio 1.7.4. Siano τ e σ due topologie su X. Allora τ è più fine di σ se e solo se l’identità da
(X, τ ) a (X, σ) è continua.
La continuità può essere controllata solo su una base.
1.7. CONTINUITÀ, FUNZIONI APERTE E OMEOMORFISMI 43

Teorema 1.7.5. Siano (X, τ ) e (Y, σ) spazi topologici e sia B una base di σ. Una funzione f : X → Y è
continua se e solo se per ogni B ∈ B si ha f −1 (B) ∈ τ .
D IMOSTRAZIONE . Siccome B ⊆ σ, se f è continua e B ∈ B allora f −1 (B) ∈ τ . Viceversa, sia
A ∈ σ. Esistono Bi ∈ B tali che A = ∪i Bi . Quindi f −1 (A) = f −1 (∪i Bi ) = ∪i f −1 (Bi ) è unione di
aperti e quindi è aperto. 
Teorema 1.7.6. Siano X e Y due spazi topologici. Allora una funzione f : X → Y è continua se e solo se
per ogni C chiuso in Y si ha che f −1 (C) è chiuso in X.
D IMOSTRAZIONE . La dimostrazione è un facile esercizio lasciato al lettore (si passi ai comple-
mentari nella definizione di continuità). 
Definizione 1.7.7 (Continuità in un punto). Siano (X, τ ) e (Y, σ) due spazi topologici e sia x ∈ X.
Una funzione f : X → Y si dice continua in x se per ogni intorno A di f (x) si ha che f −1 (A) è un
intorno di x.
Le due definizioni sono coerenti:
Teorema 1.7.8. Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzione f : X → Y è continua se e solo
se è continua in ogni punto di X.
D IMOSTRAZIONE . Supponiamo f continua e sia x ∈ X. Sia A un intorno di f (x). Allora per
definizione f (x) è interno ad A e quindi esiste un aperto B tale che f (x) ∈ B ⊆ A. In particolare
x ∈ f −1 (B) ⊆ f −1 (A). Siccome f è continua f −1 (B) è un aperto. Ne segue che f −1 (A) è un intorno
di x.
Viceversa, supponiamo f continua in ogni punto. Sia A un aperto di Y , dunque esso è un intorno
di ogni suo punto. Sia x ∈ f −1 (A). Siccome f è continua in x e A è un intorno di f (x), si ha che
f −1 (A) è un intorno di x. Quindi ogni punto di f −1 (A) è interno, ergo f −1 (A) è aperto. 
Teorema 1.7.9 (Continuità vs successioni). Sia f : X → Y una funzione continua tra spazi topologici
e sia xn → x in X. Allora f (xn ) → f (x) in Y .
D IMOSTRAZIONE . Siccome f è continua, per ogni intorno A di f (x) in Y , f −1 (A) è un intorno di
x. Siccome xn → x, allora definitivamente xn ∈ f −1 (A). Quindi f (xn ) ∈ A definitivamente. 
Teorema 1.7.10 (Continuità per chiusura). Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzione
f : X → Y è continua se e solo se per ogni sottoinsieme A ⊆ X si ha
x ∈ Ā ⇒ f (x) ∈ f (A)
ossia se
f (Ā) ⊆ f (A).
In altre parole, f è continua se e solo se l’immagine di un punto di aderenza è di aderenza per l’immagine.
Prima della dimostrazione, un commento su quest’enunciato è d’uopo. Per il Teorema 1.5.8, in
spazi localmente numerabili un punto è di aderenza di A se e solo se è limite di una successione xn ∈
A, e la stessa cosa vale per f (A). Ci troviamo quindi di fronte a una generalizzazione dell’abituale
“xn → x implica f (xn ) → f (x)”. E infatti vale il seguente, rassicurante
Corollario 1.7.11. Negli spazi metrici le nozioni di continuità topologica e metrica coincidono.
D IMOSTRAZIONE . Siano X, Y due spazi metrici e sia f : X → Y una funzione. Se f è topologi-
camente continua allora per il Teorema 1.7.9 è anche metricamente continua.
Viceversa supponiamo che f sia metricamente continua, sia A ⊆ X e sia x un punto di aderenza
di A. Per il Teorema 1.5.8, i punti di aderenza di A (o di f (A)) sono i limiti di successioni a valori in
A (o in f (A)). In particolare esiste xn → x con xn ∈ A. Siccome f è metricamente continua allora
(xn → x) ⇒ f (xn ) → f (x). Ne segue che f (x) = lim f (xn ) è un punto di aderenza di f (A). Abbiamo
quindi dimostrato che f (Ā) ⊆ f (A) e quindi f è topologicamente continua. 
44 1. SPAZI TOPOLOGICI

Si noti che la dimostrazione di questo risultato usa solo il fatto che gli spazi metrici sono spazi
localmente numerabili e quindi vale anche per tali spazi.
D IMOSTRAZIONE DEL T EOREMA 1.7.10. Supponiamo f continua; sia A ⊆ X e x ∈ X. Se f (x)
non è un punto di aderenza di f (A) allora esiste un intorno N di f (x) con N ⊆ f (A)c . Quindi f −1 (N )
è un intorno di x contenuto in Ac e dunque, in quanto interno ad Ac , x non è di aderenza per A.
Viceversa, supponiamo che per ogni A si abbia f (Ā) ⊆ f (A) e dimostriamo che f è continua in
ogni punto. Sia x ∈ X e sia N un intorno di f (x). Per definizione f (x) non è di aderenza per N c .
Ergo x non è di aderenza per f −1 (N c ) = (f −1 (N ))c . Dunque x è interno a f −1 (N ), che quindi è un
intorno di x. 
Il Corollario 1.7.11 fornisce un buon metodo per dimostrare che certi sottoinsiemi di Rn Euclideo
sono aperti o chiusi.
Corollario 1.7.12. Sia X uno spazio topologico e sia F : X → R continua. Allora gli insiemi di livello
F −1 ((a, b)) sono aperti e gli insiemi di livello F −1 ([a, b]) sono chiusi (in entrambi i casi sono ammesse le
possibilità a = −∞ e b = ∞; nel secondo caso è ammesso a = b).
D IMOSTRAZIONE . Segue dal fatto che (a, b) è aperto e [a, b] è chiuso. 
Esempio 1.7.13. In R2 l’insieme A = {1 < 3x2 + 5y 2 < 2} è aperto perché f (x, y) = 3x2 + 5y 2 è
continua e A = f −1 ((1, 2)).
Esempio 1.7.14. In R2 l’insieme A = {1 ≤ 3x2 + 5y 2 ≤ 2} è chiuso perché f (x, y) = 3x2 + 5y 2 è
continua e A = f −1 ([1, 2]).
Esempio 1.7.15. In R2 l’insieme, A = {xy < 1} è aperto perché f (x, y) = xy è continua e A =
−1
f ((−∞, 1)).
Esempio 1.7.16. In R2 l’insieme A = {x2 − y 2 > −2} è aperto perché f (x, y) = x2 − y 2 è continua
e A = f −1 ((−2, ∞)).
Esempio 1.7.17. In R2 l’insieme A = {x2 − y 2 = −2} è chiuso perché f (x, y) = x2 − y 2 è continua
e A = f −1 (−2).
Esempio 1.7.18. In R2 l’insieme, A = {xy ≥ 1} è chiuso perché f (x, y) = xy è continua e A =
−1
f ([1, ∞]).
Esempio 1.7.19. In R2 l’insieme A = {x2 − y 2 ≤ −2} è chiuso perché f (x, y) = x2 − y 2 è continua
e A = f −1 ([−∞, −2]).
Esempio 1.7.20. In R l’insieme A = {cos(x) > sin(x)} è aperto perché la funzione F (x) = cos(x) −
sin(x) è continua e A = F −1 (0, ∞).
Esempio 1.7.21. In R2 l’insieme A = {(x, y) : y > x sin(1/x)} è aperto (la funzione x sin 1/x si
considera estesa in zero con continuità). Infatti la funzione F : R2 → R data da F (x, y) = y − x sin 1/x
è continua e A = F −1 (0, ∞).
Esempio 1.7.22. In R2 l’insieme A = {(x, y) : cos(x) ≤ sin(y)} è chiuso perché la funzione F :
R2 → R data da F (x, y) = cos(x) − sin(y) è continua e A = F −1 ([−∞, 0]).
Teorema 1.7.23. La composizione di funzioni continue è continua.
D IMOSTRAZIONE . Siano (X, τ ), (Y, σ), (Z, η) tre spazi topologici e siano f : X → Y e g : Y → Z
continue. Per ogni A ∈ η si ha (g ◦ f )−1 (A) = f −1 (g −1 (A)). Siccome g è continua g −1 (A) ∈ σ e
siccome f è continua f −1 (g −1 (A)) ∈ τ . 
Definizione 1.7.24. Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzione f : X → Y si dice
omeomorfismo se è invertibile e se sia f che f −1 sono continue.
1.7. CONTINUITÀ, FUNZIONI APERTE E OMEOMORFISMI 45

Esempio 1.7.25. Sia X = {(x, y) ∈ R2 : sup{|x|, |y|} = 1} e sia Y la circonferenza unitaria di R2 ,


entrambi con la topologia indotta da R2 . X è un quadrato e Y un cerchio, ma la funzione f : X → Y
definita da !
x y
f (x, y) = p ,p
x2 + y 2 x2 + y 2
è un omeomorfismo tra X e Y . (Controllare per esercizio che sia f che f −1 sono continue.)
Esempio 1.7.26. Sia X = [−1, 0]∪(1, 2] e Y = [0, 2] entrambi con la metrica Euclidea. Sia f : X → Y
definita da f (x) = |x|. Chiaramente f è invertibile con inversa

 x x ∈ (1, 2]
f −1 (x) =
 −x x ∈ [0, 1]
La funzione f è continua perché restrizione di una funzione continua, ma la sua inversa non è
continua. Infatti xn = 1 + n1 → 1 ma f −1 (xn ) = xn non converge a −1 = f −1 (1).
Due spazi omeomorfi sono equivalenti dal punto di vista topologico. Infatti un omeomorfismo
f : (X, τ ) → (Y, σ) non solo è una biiezione tra X e Y , ma trasforma τ in σ. Due spazi omeomorfi però,
possono essere anche visibilmente diversi tra loro. Per dimostrare che due spazi sono omeomorfi, non
c’è modo più convincente che esibire un omeomorfismo esplicito. Mentre l’inverso, cioè dimostrare
che due spazi non sono omeomorfi, è un problema ben più complicato. Per distinguere due spazi
diversi si usano i cosiddetti invarianti topologici.
Definizione 1.7.27 (Invarianti). Una proprietà P si dice invariante topologico, o invariante per
omeomorfismi, se ogni qual volta X è omeomorfo a Y si ha che X gode di P se e solo se Y gode di P .
Esempio 1.7.28. L’essere a base numerabile è un invariante topologico.
Esempio 1.7.29. L’essere localmente numerabile è un invariante topologico.
Esempio 1.7.30. L’essere T2 è un invariante topologico.
Esempio 1.7.31. R2 con la topologia di Zariski non gode di nessuna di queste proprietà e non è
quindi omeomorfo a R2 Euclideo, che gode di tutte e tre queste proprietà.
Esempio 1.7.32. R2 con la topologia delle palle annidate 1.1.10 non è T2 e quindi non è omeomorfo
2
a R Euclideo che è T2 . (Entrambi sono a base numerabile, ergo localmente numerabili).
Esempio 1.7.33. R2 con la metrica dei raggi non è a base numerabile. Non è quindi omeomorfo a
2
R che lo è. (Entrambi sono metrici, ergo T2 e localmente numerabili).
Esempio 1.7.34. La cardinalità è un invariante topologico.
Esempio 1.7.35. La cardinalità di τ è un invariante topologico: se f : X → Y è un omeomorfismo
tra spazi topologici essa induce una relazione biunivoca tra le loro topologie.
Esempio 1.7.36. R con la topologia discreta, che ha un’infinità di aperti, non è omeomorfo a R
con la topologia banale, che ha solo due aperti. (Ma tautologicamente R ha la stessa cardinalità di sé
stesso.)
Definizione 1.7.37. Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzione f : X → Y si dice
aperta se manda aperti in aperti (cioè se per ogni A ∈ τ , si ha f (A) ∈ σ). Si dice chiusa se manda
chiusi in chiusi.
Esempio 1.7.38. La proiezione da R2 a R definita da f (x, y) = x è aperta. Infatti per ogni aperto A
di R2 e per ogni P ∈ A esiste ε > 0 tale che B(P, ε) ⊆ A. Ne segue che B(f (x), ε) ⊆ f (A) e quindi
ogni punto di f (A) è interno.
46 1. SPAZI TOPOLOGICI

Esempio 1.7.39. La proiezione da R2 a R definita da f (x, y) = x non è chiusa. Infatti l’insieme


{xy = 1} è un chiuso di R2 ma la sua proiezione è R \ {0}, che non è un chiuso di R.
Esercizio 1.7.40. La funzione f (x) = x2 non è aperta da R in R. Lo è da R a [0, ∞).
Esercizio 1.7.41. L’inclusione da R in R2 data da f (x) = (x, 0) è chiusa ma non è aperta.
Teorema 1.7.42. Una funzione f : X → Y tra spazi topologici è un omeomorfismo se e solo se è continua,
biunivoca e aperta.
D IMOSTRAZIONE . Se f è un omeomorfismo allora è biunivoca e continua. Inoltre, siccome f −1 è
continua, per ogni aperto A di X si ha f (A) = (f −1 )−1 (A) è aperto in Y e dunque f è anche aperta.
Viceversa se f è continua e biunivoca, dire che f è aperta equivale a dire che f −1 è continua. 
Teorema 1.7.43. Una funzione f : X → Y tra spazi topologici è un omeomorfismo se e solo se è continua,
biunivoca e chiusa.
D IMOSTRAZIONE . La dimostrazione è uguale alla precedente ed è lasciata per esercizio. 
Il seguente è un teorema importante, la cui dimostrazione esula dagli scopi di questo libro.
Teorema 1.7.44 (Teorema dell’invarianza del dominio). Una funzione f : Rn → Rn continua e
iniettiva è aperta. (Si intende che Rn sia dotato della usuale topologia Euclidea.)
Corollario 1.7.45. Se n 6= m allora Rn non è omeomorfo a Rm . (Con le usuali topologie Euclidee.)
D IMOSTRAZIONE . Se n 6= m possiamo supporre m > n. L’inclusione i : Rn → Rm data da
(x1 , . . . , xn ) → (x1 , . . . , xn , 0, . . . , 0)
è continua rispetto alle topologie Euclidee ed inoltre è ovviamente iniettiva. Se esistesse un omeo-
morfismo f : Rm → Rn , allora la composizione g = i ◦ f : Rm → Rm sarebbe continua e iniettiva
e dunque aperta. Ma l’immagine di g è contenuta in Rn ⊆ Rm che ha parte interna vuota in Rm e
quindi g non può essere aperta. Ciò contraddirebbe il teorema di invarianza del dominio. 
Data una funzione f , la si può sempre rendere continua nel modo più economico possibile. Il
seguente enunciato è una Definizione/Teorema che rende precisa tale affermazione.
Teorema 1.7.46 (Definizione di topologia indotta da f ). Siano X, Y insiemi qualsiasi e sia f : X → Y
una funzione qualsiasi.
(1) Se τ è una topologia su X allora
σ = {A ⊆ Y : f −1 (A) ∈ τ }
è una topologia su Y . Essa rende continua f ed è la più fine tra le topologie che rendono continua f .
Tale topologia si chiama topologia indotta da f su Y .
(2) Se σ è una topologia su Y allora la topologia pull-back su X, o topologia indotta da f su X è la
topologia τ meno fine che rende la f continua. Esplicitamente, τ è l’intersezione di tutte le topologie
che rendono continua la f , e si ha
τ = {f −1 (A) : A ∈ σ}.
D IMOSTRAZIONE . Se Ai è una famiglia di sottoinsiemi di Y si ha
f −1 (∪i Ai ) = ∪i f −1 (Ai ) f −1 (∩i Ai ) = ∩i f −1 (Ai ).
Ne segue che, nel primo caso σ e nel secondo τ , entrambe sono topologie. Esse rendono continua f
per come sono definite. Dalla definizione di continuità segue che, nel primo caso, σ contiene ogni
topologia che rende continua f ; nel secondo, τ è contenuta in ogni topologia che rende continua
f. 
1.7. CONTINUITÀ, FUNZIONI APERTE E OMEOMORFISMI 47

Esempio 1.7.47. Se (X, τ ) è uno spazio topologico e Y ⊂ X, allora la topologia indotta da X su Y


è la topologia indotta dall’inclusione i : Y → X.
Definizione 1.7.48. Una funzione f : X → Y tra spazi topologici si dice immersione topologica
(in inglese embedding4) se è un omeomorfismo tra X e f (X) (ove f (X) è dotato della topologia indotta
da Y ).
Lemma 1.7.49. Un’immersione topologica è continua.
D IMOSTRAZIONE . Sia f : X → Y un’immersione topologia e sia A ⊆ Y un aperto. Dobbiamo
mostrare che f −1 (A) è aperto in X. Sia B = A ∩ f (X), esso è un aperto di f (X) per la topologia
indotta da Y su f (X). Siccome f è un omeomorfismo tra X e f (X) allora f −1 (B) è aperto in X.
Chiaramente f −1 (A) = f −1 (B) per come è definito B. 
In altre parole un’immersione f da (X, τ ) in uno spazio topologico Y è una funzione continua,
iniettiva e tale che la topologia indotta da f su X coincida con τ .
Esempio 1.7.50. L’inclusione di R in R2 con le topologie standard è un’immersione.
Esempio 1.7.51. Sia X = (−∞, π) con la topologia standard e sia

 (x, 0) x < −π
f (x) =
 π(cos x, sin x) x ∈ [−π, π)

f (X)

X f
)
−π π f (−π)

F IGURA 5. La funzione f

La funzione f non è un’immersione da X in R2 standard perché gli intorni di −π con la topologia


indotta contengono tutti insiemi del tipo (π − ε, π). Si noti che f è continua e iniettiva, quindi è una
biiezione continua tra Y e la sua immagine.
Esempio 1.7.52. Sia f : R → R2 l’inclusione f (x) = (x, 0). Se R è dotato della topologia Euclidea e
2
R di quella di Zariski, allora f è continua e iniettiva, ma non è un’immersione.
Teorema 1.7.53 (Teorema dell’immersione aperta). Sia f : X → Y una funzione continua e iniettiva
tra spazi topologici. Se f è aperta allora è un’immersione.
D IMOSTRAZIONE . Siccome f è aperta f (X) è un aperto di Y e chiaramente f è una biiezione tra
X e f (X). In particolare, la topologia di X coincide con quella indotta da f e quindi X è omeomorfo
a f (X) tramite f . 
Esercizio 1.7.54 (Teorema dell’immersione chiusa). Dimostrare che se f : X → Y è una funzione
continua, iniettiva e chiusa tra spazi topologici, allora è un’immersione.
4Vale la pena ricordare che spesso, e specialmente in topologia differenziale, il termine “immersione” si usa con una valen-
za locale (l’iniettività viene richiesta solo localmente). In inglese tale differenza è resa esplicita attraverso i termini “embedding”
e “immersion”.
48 1. SPAZI TOPOLOGICI

Definizione 1.7.55 (Immersioni aperte/chiuse). Un’immersione topologica aperta si dice immer-


sione aperta. Un’immersione topologica chiusa si dice immersione chiusa.
Visto che le immersioni sono parametrizzazioni di sottospazi topologici, le immersioni aperte
corrispondono a sottospazi aperti, quelle chiuse a sottospazi chiusi.
Esempio 1.7.56. L’immersione R2 → R3 data da (x, y) → (x, y, 0) è un’immersione chiusa.
Esempio 1.7.57. L’immersione R2 \ {0} → R2 data da (x, y) → (x, y) è un’immersione aperta.
Esempio 1.7.58. L’immersione C∗ → C data da f (z) = 1/z è un’immersione aperta.
Esempio 1.7.59. La funzione f (x, y) = (ex , ey ) è un’immersione aperta da R2 → R2 .

1.8. Esercizi
Esercizio 1.8.1. In R Euclideo sia X = {x ∈ R : ∃0 6= n ∈ Z : |x − 1/n| < 1/n2 }. Si dica se X è
aperto. Si dica se X è chiuso. Si determini la frontiera di X.
Esercizio 1.8.2. In R Euclideo sia X = {x ∈ R : ∃0 6= n ∈ Z : |x − 1/n| < 1/2n }. Si dica se X è
aperto. Si dica se X è chiuso. Si determini la frontiera di X.
Esercizio 1.8.3. Dimostrare che Q non è né aperto né chiuso in R, che Q̄ = R e Int(Q) = ∅.
Esercizio 1.8.4 (non banale). Si provi che i razionali ciccioni (Esempio 1.1.48) non sono tutto R.
Esercizio 1.8.5. Sia X = {1/n : n ∈ N} ⊂ R. Si calcoli la chiusura di X e la sua frontiera.
Esercizio 1.8.6. Sia X = {1/n : n ∈ N} ⊂ (0, ∞). Si calcoli la chiusura di X e la sua frontiera.
Esercizio 1.8.7. In R2 Euclideo sia X = {(x, 2n x2 ), x ∈ R, n ∈ Z}. Si determinino X e ∂X.
Esercizio 1.8.8. In R2 Euclideo sia X = {x2 + y 2 ≥ 1, y ≥ 0} ∪ {x2 + y 2 < 1, y < 0}. Si determinino
parte interna, chiusura e frontiera di X.
Esercizio 1.8.9. Per n ∈ Z sia Cn il cerchio di R2 centrato nell’origine e di raggio 2n . Sia X =
∪n≥0 Cn . Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.10. Per n ∈ Z sia Cn il cerchio di R2 centrato nell’origine e di raggio 2n . Sia X =
∪n≤0 Cn . Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.11. Per n ∈ Z sia Cn il cerchio di R2 centrato nell’origine e di raggio 2n . Sia Y =
∪n∈Z Cn e sia X = Y c il suo complementare. Si dica se X è aperto e/o chiuso, si determinino
X, X̊, ∂X.
Esercizio 1.8.12. In R2 Euclideo siano A = {(x, y) : sup(|x|, |y|) ≤ 1} e B = {(x, y) : |x| + |y| ≤ 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.13. In R2 Euclideo siano A = {(x, y) : sup(|x|, |y|) ≤ 1} e B = {(x, y) : |x| + |y| < 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.14. In R2 Euclideo siano A = {(x, y) : sup(|x|, |y|) < 1} e B = {(x, y) : |x| + |y| ≤ 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.15. In R2 Euclideo siano A = {(x, y) : sup(|x|, |y|) < 1} e B = {(x, y) : |x| + |y| < 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.16. In R2 Euclideo siano A = {(x, y) : x2 + (y − 1)2 ≤ 4} e B = {(x, y) : x2 + y 2 ≤ 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
1.8. ESERCIZI 49

Esercizio 1.8.17. In R2 Euclideo siano A = {(x, y) : x2 + (y − 1)2 ≤ 4} e B = {(x, y) : x2 + y 2 < 1}.


Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.18. In R2 Euclideo siano A = {(x, y) : x2 + (y − 1)2 < 4} e B = {(x, y) : x2 + y 2 ≤ 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.19. In R2 Euclideo siano A = {(x, y) : x2 + (y − 1)2 < 4} e B = {(x, y) : x2 + y 2 < 1}.
Sia X = A \ B. Si dica se X è aperto e/o chiuso, si determinino X, X̊, ∂X.
sin x
Esercizio 1.8.20. In R2 Euclideo sia X = {(x, y) : x > 0 e 0 ≤ y ≤ x } Si dica se X è aperto e/o
chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.21. In R2 Euclideo sia X = {(x, y) : cos x ≤ y < sin x}. Si dica se X è aperto e/o
chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.22. In R2 Euclideo sia X = {(x, y) : cos x ≤ y ≤ sin x}. Si dica se X è aperto e/o
chiuso, si determinino X, X̊, ∂X.
Esercizio 1.8.23. In R2 Euclideo sia X = {(x, y) : 1 ≤ y < sin x}. Si dica se X è aperto e/o chiuso,
si determinino X, X̊, ∂X.
Esercizio 1.8.24. In R2 Euclideo sia X = {(x, y) : 1 ≤ y ≤ sin x}. Si dica se X è aperto e/o chiuso,
si determinino X, X̊, ∂X.
Esercizio 1.8.25. Sia f : (0, ∞) → R2 la funzione f (t) = arctan t(cos t, sin t), sia G la sua immagine
(G = {f (t), t ∈ (0, ∞)}) e sia X = Gc il suo complementare. Si dica se X è aperto e/o chiuso, si
determinino X, X̊, ∂X.
Esercizio 1.8.26. Sia f : [0, ∞) → R2 la funzione f (t) = t(cos t, sin t), sia G la sua immagine
(G = {f (t), t ∈ (0, ∞)}) e sia X = Gc il suo complementare. Si dica se X è aperto e/o chiuso, si
determinino X, X̊, ∂X.
Esercizio 1.8.27. In R2 Euclideo sia X il grafico di f : (0, ∞) → R definita da f (x) = sin(1/x). Si
dica se X è aperto o chiuso, si determinino X̄, X̊ e ∂X.
Esercizio 1.8.28. In R2 Euclideo sia X il complementare del grafico di f : (0, ∞) → R definita da
f (x) = sin(1/x). Si dica se X è aperto o chiuso, si determinino X̄, X̊ e ∂X.
Esercizio 1.8.29. In R2 Euclideo sia X il complementare della chiusura del grafico di f : (0, ∞) → R
definita da f (x) = sin(1/x). Determinare X̄, X̊ e ∂X.
Esercizio 1.8.30. In R2 Euclideo, sia A = {(x, 0) : 1 < x < 2}. Dimostrare che A non è né aperto né
chiuso in R2 .
Esercizio 1.8.31. In R2 Euclideo sia X la striscia verticale X = (1, 2) × R e sia A = {(x, 0) : 1 < x <
2}. Dimostare che A è chiuso in X ma non è aperto in X.
Esercizio 1.8.32. In R2 Euclideo sia X l’insieme X = (1, 2) × Z e sia A = {(x, 0) : 1 < x < 2}.
Dimostrare che A è aperto e chiuso in X.
Esercizio 1.8.33. Sia X uno spazio topologico e A ⊆ X. Dimostrare che ∂A è un chiuso.
Esercizio 1.8.34. Sia X uno spazio topologico e siano A ⊆ B sottoinsiemi di X. Dimostrare che se
A è denso in X allora anche B lo è. Si discuta la validità del viceversa.
Esercizio 1.8.35. Sia f : X → Y una funzione continua e suriettiva tra spazi topologici. Dimostrare
che se A è denso in X allora f (A) è denso in Y .
Esercizio 1.8.36. Descrivere gli insiemi di R2 che sono aperti per la metrica dei raggi.
50 1. SPAZI TOPOLOGICI

Esercizio 1.8.37. Descrivere gli aperti di R2 per topologia indotta dall’ordine lessicografico.
Esercizio 1.8.38. Descrivere gli aperti di R2 per topologia indotta dall’ordine prodotto.
Esercizio 1.8.39. Sia X = R2 con la metrica dei raggi. Sia A = {(x, 0) : x ∈ 1 < x < 2)}. Dimostrare
che A è aperto in X.
Esercizio 1.8.40. Sia X = R2 con la metrica dei raggi. Sia A = {(x, 0) : x ∈ 1 < x < 2)}. Dimostrare
che A non è chiuso in X.
Esercizio 1.8.41. Sia X = R2 con la metrica dei raggi e sia O l’origine. Dimostrare che l’insieme
C = DEuclid (O, 1) \ {(x, 0) : 0 < x < 1}
è chiuso. Dimostrare che l’insieme
C = DEuclid (O, 1) \ {(x, 0) : −1 < x < 1}
non lo è.
Esercizio 1.8.42. Sia τ la topologia su R2 indotta dall’ordine lessicografico. Si descriva un sistema
fondamentale di intorni dell’origine per τ . Si dica se τ e quella Euclidea sono una più fine dell’altra.
Si dica se esiste una metrica su R2 che induce τ e nel caso se ne esibisca una.
Esercizio 1.8.43. Sia τ la topologia su R2 indotta dall’ordine prodotto. Si descriva un sistema
fondamentale di intorni dell’origine per τ . Si dica se τ e quella Euclidea sono una più fine dell’altra.
Si dica se esiste una metrica su R2 che induce τ e nel caso se ne esibisca una.
Esercizio 1.8.44. Dimostrare che l’insieme (−∞, 0] ∪ (53, ∞) con la topologia dell’ordine (indotto
da R) è omeomorfo a R Euclideo.
Esercizio 1.8.45. In R2 con la topologia di Zariski sia X = {xy > 0}. Si dica se X è aperto. Si
determini la chiusura di X.
Esercizio 1.8.46. In R2 con la topologia di Zariski sia X = {xy 6= 0}. Si dica se X è aperto. Si
determini la chiusura di X.
Esercizio 1.8.47. In R2 con la topologia di Zariski sia X = {y − ex 6= 0}. Si dica se X è aperto. Si
determini la chiusura di X.
Esercizio 1.8.48. Sia X = R con la topologia di Zariski. Sia {An , n ∈ N} una famiglia numerabile
di chiusi ognuno dei quali diverso da X. Dimostrare che ∪n An 6= X.
Esercizio 1.8.49. Sia X = R2 con la topologia di Zariski. Sia {An , n ∈ N} una famiglia numerabile
di chiusi ognuno dei quali diverso da X. Dimostrare che ∪n An 6= X.
Esercizio 1.8.50. Sia X = R2 con la topologia Euclidea. Trovare una famiglia {An , n ∈ N}
numerabile di chiusi ognuno dei quali diverso da X e tali che ∪n An = X.
Esercizio 1.8.51. Trovare un insieme X con due topologie τ e σ. Con σ che non sia a base numera-
bile ma τ più fine di σ (e quindi con più aperti) e a base numerabile.
Esercizio 1.8.52. Siano τ, σ due topologie su un insieme X tali che σ < τ . È vero che se τ è
localmente numerabile allora anche σ lo è? È vero che se σ è localmente numerabile allora anche τ lo
è?
Esercizio 1.8.53. Sia X un insieme, sia x ∈ X e sia τx la topologia del punto particolare (Eserci-
zio 1.1.11). Si dimostri che x è denso in X per τx . Se ne deduca che la topologia del punto particolare
è sempre separabile.
1.8. ESERCIZI 51

Esercizio 1.8.54. Sia τ la topologia dell’ordine lessicografico su R2 e sia X = [0, 1] × [0, 1] ⊆


R . L’ordine lessicografico di R2 induce l’ordine lessicografico su X. Sia σ la topologia dell’ordine
2

lessicografico su X. Dimostrare che τ |X 6= σ.


Esercizio 1.8.55. Dimostrare che un sottospazio di uno spazio a base numerabile ha base numera-
bile.
Esercizio 1.8.56. Dimostrare che un sottospazio di uno spazio di Hausdorff è Hausdorff.
Esercizio 1.8.57. Siano σ, τ due topologie su un insieme X tali che σ ⊆ τ . Si dimostri che se σ è T2
allora anche τ lo è. È vero il viceversa?
Esercizio 1.8.58. È vero che un sottospazio di uno spazio separabile è separabile?
Esercizio 1.8.59. Sia (X, τ ) uno spazio topologico, sia ∗ un nuovo punto e sia Y = X ∪ {∗} con la
seguente topologia σ = {A ∪ {∗}, A ∈ τ } ∪ {∅}. Si dimostri che σ è una topologia e che ∗ è denso in
Y . (Si noti che X potrebbe non essere separabile).
Esercizio 1.8.60. Siano (X, τ ) e (Y, σ) spazi topologici e sia B una base di τ . Dimostrare che una
funzione f : X → Y è aperta se e solo se per ogni B ∈ B si ha f (B) ∈ σ. (Si veda il Teorema 1.7.5).
Esercizio 1.8.61. Dimostrare che la topologia del limite destro su R (Esempio 1.2.14) è localmente
numerabile.
Esercizio 1.8.62. Dimostrare che la topologia del limite destro su R (Esempio 1.2.14) non ha una
base numerabile. (Suggerimento: si consideri per assurdo una base numerabile e per ogni x si tenti
di scrivere [x, ∞) come unione degli aperti di base).
Esercizio 1.8.63. Dimostrare che la topologia del limite destro su R (Esempio 1.2.14) è separabile.
Se ne deduca che non è indotta da una metrica.
Esercizio 1.8.64. Sia X = R dotato della topologia del limite destro (Esempio 1.2.14) e sia Y = R
Euclideo. Dimostrare che una funzione f : X → Y è continua se e solo se è continua da destra per la
topologia Euclidea su X.
Esercizio 1.8.65. Sia X ⊆ R2 (Euclideo) il grafico della funzione ex e sia f : X → R la restrizione
della proiezione R2 → R. Si dica se f è aperta/chiusa.
Esercizio 1.8.66. Sia S 1 ⊆ R2 (Euclideo) la circonferenza unitaria e sia f : S 1 → R la restrizione
della proiezione R2 → R. Si dica se f è aperta/chiusa.
Esercizio 1.8.67. La funzione f (x) = x2 è chiusa da R in R (Euclidei)?
Esercizio 1.8.68. Si dimostri che R e (0, 1) (Euclidei) sono omeomorfi.
Esercizio 1.8.69. Si dimostri che R2 e {x2 + y 2 < 1} sono omeomorfi (topologie Euclidee).
Esercizio 1.8.70. Q e R con le topologie standard sono omeomorfi?
Esercizio 1.8.71. Esiste una topologia su R che lo rende omeomorfo a Q?
Esercizio 1.8.72. Esiste una topologia su R che lo rende omeomorfo a R2 Euclideo?
Esercizio 1.8.73. Q e Z con le topologie standard sono omeomorfi?
Esercizio 1.8.74. Esiste una topologia su Q che lo rende omeomorfo a Z con la topologia standard?
Esercizio 1.8.75. Siano τ e σ due topologie su X. Se τ è meno fine di σ si dimostri che ogni
successione σ-convergente è anche τ -convergente.
Esercizio 1.8.76. Siano τ e σ due topologie su X e sia Y uno spazio topologico. Se τ è meno fine
di σ si dimostri che ogni funzione f : X → Y che sia τ -continua è anche σ-continua.
52 1. SPAZI TOPOLOGICI

Esercizio 1.8.77. Siano τ e σ due topologie su X e sia Y uno spazio topologico. Se τ è meno fine
di σ si dimostri che ogni funzione f : Y → X che sia σ-continua è anche τ -continua.
Esercizio 1.8.78. Su R sia τ la topologia generata dagli intervalli del tipo (a, b]. (1) Si descrivano gli
aperti di τ . (2) Si dica se τ è più fine della topologia Euclidea. (3) Si dica se la topologia Euclidea è più
fine di τ . (4) Si descrivano le successioni τ -convergenti. (5) Si caratterizzino le funzioni τ -continue.
Esercizio 1.8.79. In R2 Euclideo, dimostrare che un quadrato, un cerchio e un triangolo sono
sempre omeomorfi tra loro (considerati come figure unidimensionali).
Esercizio 1.8.80. In R2 Euclideo, dimostrare che un quadrato, un cerchio e un triangolo sono
sempre omeomorfi tra loro (considerati come figure bidimensionali).
Esercizio 1.8.81. In R2 Euclideo, dimostrare che due poligoni qualsiasi sono omeomorfi.
Esercizio 1.8.82. In R2 Euclideo sia X l’immagine di (0, ∞) tramite la funzione
2
f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Si dica se X è omeomorfo a R Euclideo. Si dica se la chiusura di X è omeomorfa a R Euclideo.
Esercizio 1.8.83. Sia X = R2 dotato della topologia delle palle annidate (Esempio 1.1.10). Dimo-
strare che la funzione f : X → X data da f (x) = 2x è un omeomorfismo.
Esercizio 1.8.84. Sia X = R2 dotato della topologia delle palle annidate (Esempio 1.1.10) e sia
Y = R2 Euclideo. Dimostrare che la funzione f : Y → X data da f (x) = 2x è continua, biunivoca,
ma non è un omeomorfismo.
Esercizio 1.8.85. Sia X = R2 , sia O l’origine e sia τ = {B(O, 2−n ), n ∈ N} ∪ {∅, X}. Dimostrare che
τ è una topologia.
Esercizio 1.8.86. Sia X = R2 e τ come nell’Esercizio 1.8.85. Dimostrare che f : X → X definita da
f (x) = 2x è continua e biunivoca, ma non è un omeomorfismo.
Esercizio 1.8.87. Si esibisca uno spazio topologico X tale che esista un punto x ∈ X tale che
nessuna successione non costante possa convergere a x.
Esercizio 1.8.88. Si esibisca uno spazio topologico X, con la proprietà che i punti non siano aperti,
tale che esista un punto x ∈ X tale che nessuna successione non costante possa convergere a x.
Esercizio 1.8.89. Sia (X, <) un insieme ben ordinato e sia x ∈ X. Sia τ = {[t, x], t < x} ∪ {∅, X}. Si
dimostri che τ è una topologia su X. La si confronti con la topologia dell’ordine.
Esercizio 1.8.90. Sia X = [0, 1], sia x = 1 e sia τ definita come nell’esercizio 1.8.89. Si dica se τ è
una topologia.
Esercizio 1.8.91. Sia X = N, sia x = 51 e sia τ come nell’esercizio 1.8.89. Si dica se τ è T2 . Si dica
se τ soddisfa gli assiomi di numerabilità.
Esercizio 1.8.92. Sia X un insieme ben ordinato avente un elemento massimale x. Sia τ come
nell’esercizio 1.8.89. Si dica se i punti di X sono aperti.
Esercizio 1.8.93. Sia X un insieme ben ordinato avente un elemento massimale x. Sia τ come
nell’esercizio 1.8.89. Si discuta l’esistenza di successioni convergenti a x.
Esercizio 1.8.94. Sia X = ω1 + 1 = ω1 ∪ {ω1 } e sia x = ω1 il suo massimo. Sia τ come nell’eserci-
zio 1.8.89. Si discutano le proprietà di τ .
CAPITOLO 2

Costruzioni con spazi topologici

2.1. Prodotti di spazi topologici


Cominciamo col caso facile del prodotto di due spazi.
Definizione 2.1.1 (Topologia prodotto). Siano (X, τ ) e (Y, σ) due spazi topologici. Sia X × Y il
prodotto cartesiano dei due, ossia X × Y = {(x, y) : x ∈ X, y ∈ Y }. Siano πX : X × Y → X e
πY : X × Y → Y le proiezioni naturali πX (x, y) = x e πY (x, y) = y. La topologia prodotto τ × σ è la
topologia meno fine che rende continue πX e πY .
Teorema 2.1.2. Siano (X, τ ) e (Y, σ) due spazi topologici. Allora
(1) La topologia prodotto è generata dagli insiemi A × B con A ∈ τ e B ∈ σ, che ne costituiscono una
base.
(2) Se A = (Ai )i∈IX è una base di τ e B = (Bi )i∈IY lo è di σ, allora la famiglia C = {Ai × Bj : i ∈
IX , j ∈ IY } è una base di τ × σ. In particolare, se X, Y sono a base numerabile anche X × Y lo è.
D IMOSTRAZIONE . In generale, per ogni A, B, C, D vale
(A × B) ∩ (C × D) = {(x, y) ∈ X × Y : x ∈ A, y ∈ B, e x ∈ C, y ∈ D} = (A ∩ C) × (B ∩ D).
Ne segue che la famiglia F = {A × B, A ∈ τ, B ∈ σ} è chiusa per intersezione. Per il Corollario 1.2.7,
−1
F è la base di una topologia ρ. Vediamo che ρ = τ × σ. Se A è un aperto di X allora πX (A) = A × Y
è un prodotto di aperti e quindi sta in ρ. Quindi πX è continua per ρ. Stesso discorso per πY .
Sia ora η una qualsiasi topologia che rende continua le proiezioni. Siccome πX è continua, allora
per ogni A ∈ τ si ha che A × Y è un aperto di η. Similmente, per ogni B ∈ σ si ha X × B ∈ η. Ne
segue che A × B = (A × Y ) ∩ (X × B) ∈ η. Quindi η è più fine di ρ.
Veniamo ora al secondo punto. Siccome A è una base di τ e B lo è di σ
[ [
∀A ∈ τ ∃SA ⊆ IX : A = Ai , ∀B ∈ σ ∃SB ⊆ IY : B = Bi .
i∈SA i∈SB

Ne segue che
[
A×B = Ai × B j
i∈SA j∈SB

dunque ogni elemento di F è unione di elementi di C, che è quindi una base di ρ = τ × σ. 

Esercizio 2.1.3. Si dimostri che la topologia Euclidea di R2 è il prodotto delle topologie Euclidee
su R.
È bene non dimenticare che gli aperti della topologia prodotto non sono necessariamente dei
prodotti. Per esempio B(0, 1) ⊆ R2 è aperto ma non è un prodotto.
Teorema 2.1.4. Uno spazio topologico X è T2 se e solo se la diagonale
∆ = {(x, x) : x ∈ X} ⊆ X × X
è chiusa in X × X per la topologia prodotto.
53
54 2. COSTRUZIONI CON SPAZI TOPOLOGICI

D IMOSTRAZIONE . Dire (x, y) ∈ / ∆ equivale a dire x 6= y e dire A ∩ B = ∅ equivale a dire (A ×


B) ∩ ∆ = ∅. La diagonale ∆ è chiusa se e solo se il suo complementare ∆c è aperto, se e solo se ogni
(x, y) ∈ ∆c è interno a ∆c , se e solo se esiste U intorno di (x, y) tale che U ⊆ ∆c . Siccome la topologia
prodotto è generata dai prodotti di aperti, ciò è equivalente a dire che esistono A, B aperti tale che
(x, y) ∈ A × B ⊆ ∆c , ma ciò è equivalente a chiedere che x ∈ A, y ∈ B e A ∩ B = ∅. 

Esempio 2.1.5. La topologia di Zariski su R2 è diversa dal prodotto delle topologie di Zariski di R.
Infatti R con la Zariski non è T2 , ma la diagonale di R × R è chiusa per la topologia di Zariski. (Posto
p(x, y) = x − y si ha ∆ = {(x, x) : x ∈ R} = {(x, y) ∈ R2 : x − y = 0} = Z(p).)
Teorema 2.1.6. Siano X, Y spazi di Hausdorff non vuoti. Allora X × Y è di Hausdorff se e solo se
entrambi X, Y lo sono.
D IMOSTRAZIONE . Supponiamo X, Y di Hausdorff. Siano (x, y) 6= (x0 , y 0 ) due punti diversi di
X × Y . Se x 6= x0 allora esistono A, A0 aperti di X tali che x ∈ A e x0 ∈ A0 con A ∩ A0 = ∅. Quindi
A × Y e A0 × Y separano (x, y) e (x0 , y 0 ). Stesso discorso se y 6= y 0 .
Viceversa, supponiamo X × Y di Hausdorff. Sia x 6= x0 ∈ X e sia y ∈ Y . I punti (x, y) e (x0 , y)
sono diversi in X × Y . Esistono quindi aperti A, A0 in X × Y tali che (x, y) ∈ A e (x0 , y) ∈ A0 con
A ∩ A0 = ∅. Siccome la topologia prodotto è generata dai prodotti di aperti, esistono U, U 0 aperti di
X con x ∈ U e x0 ∈ U 0 e V aperto di Y con y ∈ V tali che U × V ⊆ A e U 0 × V ⊆ A0 . Ne segue che
U ∩ U 0 = ∅. Quindi X è T2 . Stesso discorso per Y . 

Il prodotto si può fare di una quantità di spazi qualsiasi.


Esempio 2.1.7. Il toro classico è T = T 2 = S 1 × S 1 . Per ogni n si definisce il toro n-dimensionale
come

T n = S1 × · · · × S1
n volte

Ça va sans dire, la definizione di topologia prodotto si estende per induzione a tutti i prodotti finiti
(cioè prodotti di un numero finito di spazi).
Esercizio 2.1.8. Siano (X, τ ), (Y, σ), (Z, ρ) tre spazi topologici, dimostrare su X ×Y ×Z le topologie
(τ × σ) × ρ e τ × (σ × ρ) coincidono.
In generale quindi, se (Xi )i∈I è una famiglia finita di spazi topologici, il loro prodotto può es-
sere definito ricorsivamente. Più in generale ancora, se (Xi )i∈I è una famiglia qualsiasi di insiemi,
assumendo l’assioma di scelta si può definire il prodotto
Πi∈I Xi
come l’insieme delle I-uple (xi )i∈I ove xi ∈ Xi per ogni i ∈ I. (L’assioma di scelta ci dice che tale
insieme di I-uple è non vuoto.) Nel caso particolare in cui gli Xi siano copie di uno stesso insieme X,
allora
Πi∈I X = X I = {f : I → X}
(e questo è sempre non vuoto perché una funzione da I a X è un sottoinsieme di I × X).
Definizione 2.1.9 (Topologia prodotto infinito). Sia (Xi , τi )i∈I una famiglia qualsiasi di spazi
topologici e siano πi : Πi∈I Xi → Xi le proiezioni naturali. La topologia prodotto Πi∈I τi è la meno
fine che rende continue tutte le proiezioni.
Anche se le definizioni sono uguali, quando si fanno prodotti infiniti c’è una piccola sottigliezza
a cui stare attenti.
2.1. PRODOTTI DI SPAZI TOPOLOGICI 55

Teorema 2.1.10. Sia (Xi , τi )i∈I una famiglia qualsiasi di spazi topologici. Allora la topologia prodotto è
generata dagli insiemi Πi∈I Ai ove Ai ∈ τi e
Ai 6= Xi solo per un numero finito di indici.
Inoltre, la famiglia F di tali insiemi è una base di Πi τi .
D IMOSTRAZIONE . Sia ρ la topologia generata dagli elementi di F. La famiglia F è chiusa per
intersezione finita e dunque è una base di ρ. (Corollario 1.2.7 e Teorema 1.2.17).
Per come è definita, ρ rende continue le proiezioni. Sia ora η una topologia che rende continue
le proiezioni. Siccome πi è continua, allora per ogni Ai ∈ τi , ponendo Aj = Xj per j 6= i, si ha
che Πi∈I Ai deve essere aperto. Quindi ogni intersezione finita di tali insiemi deve essere un aperto.
Quindi η ⊇ ρ. 

Teorema 2.1.11. Sia (Xi , τi )i∈I una famiglia di spazi topologici e per ogni i sia Bi una base di τi . Allora
una base della topologia prodotto è formata dalla famiglia
C = {Πi∈I Ai : Ai 6= Xi solo per un numero finito di indici e Ai ∈ Bi }.
D IMOSTRAZIONE . Per il Teorema 2.1.10, una base della topologia prodotto è la famiglia F degli
insiemi del tipo ΠAi con τi 3 Ai 6= Xi solo per un numero finito di indici. Basta quindi far vedere che
ogni elemento di F è unione di elementi di C.
Sia A = Πi Ai ∈ F. Per ogni Ai 6= Xi esistono elementi (Bij )j∈Si ⊆ Bi tali che Ai = ∪j∈Si Bij .
Quindi, ponendo Si = {1} se Ai = X e Bi1 = Xi ; per ogni scelta di ji ∈ Si , si ha che Πi Biji è un
elemento di C. Chiaramente [
Πi Ai = Πi Biji .
(ji )∈Πi Si

Teorema 2.1.12 (Le proiezioni sono aperte). Sia (Xi , τi )i∈I una famiglia qualsiasi di spazi topologici e
sia X = ΠXi con la topologia prodotto. Allora ogni proiezione naturale πi : X → Xi è aperta.
D IMOSTRAZIONE . Sia C la base della topologia prodotto data dal Teorema 2.1.11. Per come è
definita C, per ogni A ∈ C, è ovvio che πi (A) sia aperto. La tesi segue (si veda l’Esercizio 1.8.60). 

Occhio! Ché in generale le proiezioni non son chiuse (si veda a tal proposito l’Esempio 1.7.39).
Teorema 2.1.13. Sia (Xi , τi )i∈I una famiglia di spazi topologici e sia X = ΠXi con la topologia prodotto.
Sia (xn ) una successione in X. Allora xn → x ∈ X se e solo se per ogni i ∈ I si ha πi (xn ) → πi (x).
D IMOSTRAZIONE . Per il Teorema 1.7.9, siccome le proiezioni sono continue, se xn → x allora
πi (xn ) → πi (x) per ogni i ∈ I. Vediamo il viceversa. Usiamo la base della topologia prodotto data dal
Teorema 2.1.10. Per ogni intorno U di x in X esiste un elemento A della base tale che x ∈ A. L’aperto
A sarà della forma
A = Πi Ai ]({i : Ai 6= Xi }) < ∞.
Siccome per ogni i si ha πi (xn ) → πi (x) e siccome Ai 6= Xi solo per un numero finito di indici, esiste
n0 > 0 tale che per ogni n > n0 e ogni i ∈ I si ha
πi (xn ) ∈ Ai .
Dunque xn ∈ A definitivamente e quindi xn → x. 
Corollario 2.1.14. La topologia della convergenza puntuale su X Y è quella prodotto.
D IMOSTRAZIONE . Ricordiamo che X Y è l’insieme delle funzioni da Y a X. Usando il Teore-
ma 2.1.13 ponendo I = Y e Xi = X per ogni i ∈ Y si ha la tesi. 
56 2. COSTRUZIONI CON SPAZI TOPOLOGICI

Teorema 2.1.15. Sia (Yi , τi )i∈I una famiglia qualsiasi di spazi topologici e sia Y = ΠYi con la topologia
prodotto. Sia X uno spazio topologico e per ogni i ∈ I sia fi : X → Yi una funzione. Sia f : X → Y la
funzione definita da
f (x) = (fi (x))i∈I
essa è continua se e solo se ogni fi lo è.
D IMOSTRAZIONE . Se f è continua, siccome le proiezioni sono continue, allora ogni fi = πi ◦ f
è continua. Viceversa, supponiamo che ogni fi sia continua. Usiamo la base C del Teorema 2.1.11.
Per il Teorema 1.7.5 ci basta dimostrare che f −1 (A) è aperto per ogni elemento A ∈ C. Sia A = Πi Ai .
Siccome gli Ai sono aperti e le fi sono continue, fi−1 (Ai ) è aperto. In otre fi−1 (Yi ) = X. Chiaramente
f −1 (A) = ∩i fi−1 (Ai ) e siccome solo un numero finito degli Ai è diverso da Yi , ne segue che ∩i fi−1 (Ai )
è di fatto un’intersezione finita di aperti, ergo aperto. 
Corollario 2.1.16. Sia Y uno spazio topologico T2 e sia X uno spazio topologico. Siano f, g : X → Y
funzioni continue. Allora l’insieme {x ∈ X : f (x) = g(x)} è chiuso in X.
D IMOSTRAZIONE . Siccome f, g sono continue, allora la funzione f × g : X → Y × Y data da
(f (x), g(x)) è continua per il Teorema 2.1.15. Per il Teorema 2.1.4 la diagonale di Y × Y è chiusa e per
continuità la sua preimmagine, che coincide con {x ∈ X : f (x) = g(x)}, è un chiuso di X. 

2.2. Quozienti
Cominciamo con un po’ di terminologia. Se ∼ è una relazione di equivalenza su un insieme X,
si denota con [x] = {y ∈ X : x ∼ y} la classe di equivalenza di x ∈ X; con X/ ∼= {[x] : x ∈ X} il
quoziente di X e con π : X → X/ ∼ la proiezione naturale x 7→ [x].
Un sottoinsieme A ⊆ X si dice saturo se x ∈ A, y ∼ x ⇒ y ∈ A. In altre parole A è saturo se è
unione di classi di equivalenza. Ancora, A è saturo se A = π −1 (π(A)).
Il saturato sat(A) di un sottoinsieme A è il più piccolo saturo contenente A, esso coincide con
l’intersezione di tutti i saturi contenenti A o, equivalentemente, con l’unione di tutte le classi di
equivalenza di elementi di A o, in formule, sat(A) = π −1 (π(A)).
Una relazione ∼ può essere identificata col sottoinsieme R di X × X dato dalle coppie R =
{(x, y) : x ∼ y}. Non tutte le relazioni, e quindi sottoinsiemi di X × X, sono d’equivalenza: per
esempio, la simmetria impone che R contenga la diagonale. Dato un sottoinsieme qualsiasi R, la rela-
zione d’equivalenza da esso generata è la più piccola relazione d’equivalenza contenente R. (Vedasi
Sezione 0.6.)
Esempio 2.2.1 (Collasso di un sottoinsieme). L’operazione intuitiva di “collassare un sottoinsieme
a un punto” si formalizza con il linguaggio dei quozienti. Sia X un insieme e A ⊆ X. Sia ∼ la relazione
d’equivalenza generata da x ∼ y se x, y ∈ A (come insieme in X × X si considera quindi A × A e la
relazione d’equivalenza da esso generata). Esplicitamente, la relazione d’equivalenza generata è:

 x = y oppure
x∼y⇔
 x, y ∈ A

In questo caso il quoziente X/ ∼ si denota solitamente con X/A. Le classi d’equivalenza sono [x] =
{x} se x ∈
/ A e [x] = A se x ∈ A. Per ogni B ⊆ X si ha sat(B) = B se B ∩ A = ∅ e sat(B) = B ∪ A se
B ∩ A 6= ∅. (Figura 1.)

Lemma 2.2.2. Sia ∼ una relazione d’equivalenza su un insieme X e sia A ⊆ X. Allora A è saturo se e
solo se Ac lo è.
D IMOSTRAZIONE . X è unione disgiunta delle classi di equivalenza. Per definizione A è saturo se
e solo se è unione di classi di equivalenza, se e solo se il suo complementare è unione delle rimanenti
classi di equivalenza. 
2.2. QUOZIENTI 57

X X/A

A [A]

F IGURA 1. Il collasso di un sottoinsieme a un punto

Definizione 2.2.3 (Topologia quoziente). Sia ∼ una relazione di equivalenza su un insieme X.


Per ogni topologia su X, la topologia quoziente è quella indotta da π su X/ ∼ (cioè la più fine che
rende π continua. Si veda il Teorema 1.7.46).
Se ∼ è una relazione d’equivalenza su uno spazio topologico (X, τ ), allora la topologia quoziente
si descrive esplicitamente:
{A ⊆ X/ ∼ t.c. π −1 (A) ∈ τ }.
Gli aperti di X/ ∼ corrispondono quindi agli aperti saturi di X. La topologia pull-back tramite π,
della topologia quoziente, è la topologia su X formata da tutti gli aperti saturi di τ . Tale topologia si
chiama talvolta la saturata di τ ed è chiaramente meno fine di τ .
Similmente, i chiusi di X/ ∼ corrispondono ai chiusi saturi di X. (Ciò dipende dal fatto che
π −1 (Ac ) = (π −1 (A))c e dal Lemma 2.2.2).
Esempio 2.2.4. Sia (X, τ ) uno spazio topologico, sia A ⊆ X e sia ∼ la relazione d’equivalenza
che definisce il collasso di A a un punto. La topologia saturata su X (che corrisponde alla topo-
logia quoziente di X/A) è formata dagli elementi di τ che, se intersecano A allora lo contengono
interamente.
Definizione 2.2.5. Sia X uno spazio topologico, sia Y = X × [0, 1] e sia A = X × {0} ⊂ Y . Il cono
su X è lo spazio Y /A. (Figura 2.)

X X × [0, 1]
cono su X

F IGURA 2. Cono su uno spazio topologico X

Esempio 2.2.6. Il cono su S 1 è D2 . (L’identificazione di D2 col cono su S 1 è data dalle coordinate


polari.)
I quozienti servono anche per formalizzare l’operazione intuitiva di “incollamento”: si dichiarano
equivalenti i punti che si vorrebbero incollare.
Esempio 2.2.7 (Nastro di Moebius chiuso). Sia X = [0, 2π] × [−1, 1] e sia ∼ la relazione d’equiva-
lenza generata da (0, t) ∼ (2π, −t) per ogni t ∈ [−1, 1]. Lo spazio quoziente è il nastro di Moebius.
(Figura 3.)
58 2. COSTRUZIONI CON SPAZI TOPOLOGICI

F IGURA 3. Nastro di Moebius

La costruzione del nastro di Moebius appena descritta è in realtà un caso particolare di un proce-
dimento generale, noto in inglese come mapping torus, traducibile con “toro dell’applicazione”, noto
anche come “toro di sospensione di una funzione”. Poco importa il nome, vediamone la sostanza.
Dato uno spazio topologico X e un omeomorfismo f : X → X, si considera il prodotto X × [0, 1]
e poi si incolla (x, 1) con (f (x), 0). Cioè si forma la relazione d’equivalenza generata da
(x, 1) ∼ (f (x), 0)
e si definisce il toro di f come il quoziente Tf = (X × [0, 1])/ ∼. Il nastro di moebius è omeomorfo al
toro dell’omeomorfismo di [−1, 1] dato da f (x) = −x.

X × {1} x
f (x)
f x
f (x)
X × {0}

F IGURA 4. Il toro di sospensione di un omeomorfismo f : X → X

Esempio 2.2.8. Sia X = S 1 . Se f = Id allora Tf è omeomorfo al toro T 2 = S 1 × S 1 . Se f è


una riflessione rispetto ad un diametro di S 1 (per esempio considerando S 1 ⊆ R2 , possiamo usare
f (x, y) = (x, −y)) allora Tf è la famosa Bottiglia di Klein (un curioso contenitore in cui il “dentro” e
il “fuori” coincidono).
I quozienti si usano in generale anche per definire strutture matematiche.
Esempio 2.2.9 (Il proiettivo). In R3 privato dell’origine si pone la relazione d’equivalenza v ∼ w
se e solo se ∃λ ∈ R tale che v = λw. Il quoziente R3 / ∼ è il piano proiettivo RP2 . La topologia del
proiettivo è quella quoziente.
Con in quozienti si possono produrre molti esempi interessanti.
2.2. QUOZIENTI 59

Esempio 2.2.10 (La retta con due zeri). Sia X = R × {0, 1} ⊂ R2 con la relazione d’equivalenza
generata da
(x, y) ∼ (x0 , y 0 ) ⇔ x = x0 6= 0.
(x, 0) è identificato con (x, 1) per ogni x 6= 0, ma (0, 0) non è equivalente a (0, 1). Quindi X/ ∼
assomiglia a una retta con due zeri: [(0, 0)] e [(0, 1)]. Gli insiemi saturi sono fatti cosı̀: se contengono
(x, 0) con x 6= 0 allora contengono anche (x, 1) e viceversa. Quindi due intorni saturi qualsiasi di
(0, 0) e (0, 1) non sono mai disgiunti. In particolare, X/ ∼ non è T2 e la successione [(1/n, 0)] converge
simultaneamente sia a [(0, 0)] che a [(0, 1)].
Esempio 2.2.11. Sia Z l’insieme dei numeri interi di R. Lo chiamiamo Z e non Z perché vogliamo
enfatizzare che lo consideriamo solo come un insieme. Sia X = R/Z (inteso come collasso di Z a
un punto); visivamente è formato da infiniti cerchi che passano per un punto. Sia z = [Z] il punto
comune a tutti i cerchi. Se x 6= z allora una base di intorni di x è fatta come in R. Altrimenti, affinché
un insieme U contenente z sia aperto, è necessario che π −1 (U ) sia un aperto che contenga Z. In
particolare, per ogni successione E = (εn )n∈Z di numeri positivi, l’insieme UE = π(∪n B(n, εn )) è
un intorno di z e la famiglia {UE : E successione di numeri positivi }, è un sistema fondamentale
di intorni di z. Tale famiglia è chiaramente non numerabile, ma c’è di più: z non ha un sistema
fondamentale di intorni numerabile (e quindi X non ha una base numerabile). Vediamolo.
Sia {Un }n∈Z una famiglia numerabile di intorni di z. Consideriamo An = π −1 (Un ) ⊆ R. Ogni
k ∈ Z è interno ad An per ogni n. Quindi esiste 0 < εkn tale che la palla B(k, εkn ) ⊆ An . Per ogni n ∈ Z
scegliamo 0 < δn < εnn . Sia A = ∪k∈Z B(k, δk ). A è un aperto saturo e quindi π(A) è un aperto. Inoltre
nessuno degli An è contenuto in A per come è definito δn . Quindi nessuno degli Un è contenuto in
π(A) e dunque {Un } non è un sistema fondamentale di intorni di z.
Si noti che questo esempio fornisce una topologia su R, quella saturata, meno fine di quella
Euclidea (che ha base numerabile) ma che non è a base numerabile.
La proiezione naturale π : X → X/ ∼ in generale non ha motivi di essere aperta/chiusa. (Lo sarà
in casi particolari, come quello del Teorema 6.5.28.)
Esempio 2.2.12. In R2 sia ∼ la relazione d’equivalenza generata da (x, y) ∼ (x, y 0 ). Le classi d’equi-
valenza sono le rette verticali, il quoziente è omeomorfo a R e la proiezione naturale è la proiezione
canonica π : R2 → R data da π(x, y) = x. Che non è chiusa (Esempio 1.7.39).
Esempio 2.2.13. Sia A = [−2, 2] ⊂ R e sia X = R/A. La proiezione π : R → R/A non è aperta
perché (−1, 1) è un aperto ma π(−1, 1) = [A], no.
Esempio 2.2.14. Sia X = [−2, 2] × [−2, 2] ⊆ R2 e sia ∼ la relazione d’equivalenza generata da
(x, y) ∼ (x, y 0 ) per ogni x ∈ Q. Sia U la palla centrata nell’origine e di raggio 1. U è un aperto, ma
il suo saturato, che è U ∪ ((Q ∩ (−1, 1)) × [−2, 2]), non contiene nessun aperto saturo. In particolare
π(U ) non solo non è aperto, ma addirittura ha parte interna vuota in X/ ∼.
Teorema 2.2.15. Sia (X, τ ) uno spazio topologico e sia ∼ una relazione di equivalenza su X. Se X è a
base numerabile e la proiezione π è aperta, allora anche X/ ∼ è a base numerabile.
D IMOSTRAZIONE . Sia Bn una base numerabile di τ e siano An = π −1 (π(B)) i saturati di Bn .
Siccome π è aperta, allora π(Bn ) è aperto e, per continuità, An è aperto. Vediamo che gli An formano
una base per la topologia saturata di τ . Sia A un aperto saturo. In quanto aperto, è unione di elementi
della base
A = ∪i∈IA Bi .
Siccome A è saturo, è unione dei saturati dei Bi cioè A = ∪i Ai . Quindi ogni aperto saturo è unione
degli An . 
Teorema 2.2.16. Siano X, Y insiemi qualsiasi e sia ∼ una relazione d’equivalenza su X. Sia f : X → Y
una funzione. Allora esiste [f ] : X/ ∼→ Y tale che f = [f ] ◦ π se e solo se f è costante sulle classi di
equivalenza.
60 2. COSTRUZIONI CON SPAZI TOPOLOGICI

π f

X/ ∼ Y
[f ]

Inoltre se X, Y sono spazi topologici e X/ ∼ è dotato della topologia quoziente, allora [f ] è continua se e solo se
f lo è.
D IMOSTRAZIONE . Se f = [f ] ◦ π allora f (x) = [f ](π(x)). Se x ∼ y allora π(x) = π(y) e quindi
f (x) = [f ](π(x)) = [f ](π(y)) = f (y). Viceversa, se f è costante sulle classi, ponendo [f ]([x]) = f (x) si
ha una ben definita funzione su X/ ∼. Per come è definita, f (x) = [f ](π(x)).
Vediamo la continuità. Se [f ] è continua allora, siccome π è continua la composizione f = [f ] ◦ π
è continua. Viceversa, se f è continua e A è un aperto di Y allora f −1 (A) è un aperto di X e siccome f
è costante sulle classi di equivalenza, esso è saturo. Quindi π(f −1 (A)) = [f ]−1 (A) è aperto e dunque
[f ] è continua. 

Corollario 2.2.17. Siano X, Y due insiemi e siano ∼X e ∼Y relazioni d’equivalenza su X, Y rispettiva-


mente. Sia f : X → Y una funzione. Allora esiste [f ] : X/∼X → Y /∼Y tale che [f ] ◦ πX = πY ◦ f se e solo se
x ∼X x0 ⇒ f (x) ∼Y f (x0 ).

f
X Y

πX πY ◦ f πY

X/∼X Y /∼Y
[f ]

Inoltre, se X, Y sono spazi topologici e i quozienti sono dotati delle topologie quoziente; se f è continua, allora
[f ] è continua.
D IMOSTRAZIONE . Basta applicare il Teorema 2.2.16 con πY ◦ f al posto di f . 

Esempio 2.2.18 (Coordinate polari). Sia X = [0, 1] × [0, 2π] e sia Y = D2 = {(x, y) ∈ R2 : x2 +
2
y ≤ 1}. La funzione f : X → Y data da f (ρ, θ) = ρ(cos θ, sin θ) è continua. Se mettiamo su X la
relazione d’equivalenza generata da (0, θ) ∼ (0, θ0 ) e (ρ, 0) ∼ (ρ, 2π) allora f è costante sulle classi
d’equivalenza e induce quindi una funzione continua [f ] : X/ ∼→ Y . Questa non è altro che l’usuale
parametrizzazione del disco in coordinate polari.
Se inoltre su Y collassiamo ∂Y a un punto, abbiamo una funzione continua tra X/ ∼ e Y /∂Y . Se
infine in X poniamo la relazione ∼0 generata da ∼ e (1, θ) ∼0 (1, θ0 ) (cioè identifichiamo anche (1, θ)
con (1, θ0 )), otteniamo una funzione continua [f ] : X/ ∼0 → Y /∂Y (stiamo parametrizzando una sfera
con coordinate polari).

2.3. Varietà topologiche, superfici e grafi


Definizione 2.3.1. Una varietà topologica di dimensione n è uno spazio topologico X di Hau-
sdorff, a base numerabile e che sia localmente omeomorfo a Rn , cioè tale che per ogni x ∈ X esista un
intorno aperto U di x e un omeomorfismo f tra U e un aperto V di Rn . Una superficie è una varietà
topologica di dimensione due. Gli aperti U , insieme alle loro identificazioni, si chiamano carte locali.
(Figura 5).
2.3. VARIETÀ TOPOLOGICHE, SUPERFICI E GRAFI 61

f
X Rn

U V

F IGURA 5. Carta locale in una varietà

Esempio 2.3.2. Sia f : Rn → R una funzione continua. Allora il grafico di f è una varietà topo-
logica di dimensione n. L’omeomorfismo locale è dato dalla proiezione Rn+1 → Rn . Le proprietà di
essere T2 e a base numerabile sono ereditate da Rn+1 .
Esempio 2.3.3. Per ogni n, la sfera n-dimensionale S n è una varietà topologica di dimensione n.
Infatti per il teorema del Dini è localmente un grafico e dunque localmente omeomorfa a Rn . Essendo
un sottoinsieme di Rn+1 l’essere T2 e a base numerabile sono ovvi. In particolare, S 2 è una superficie.
Esempio 2.3.4. In R3 sia C = {z 2 = x2 + y 2 }. Esso non è una superficie in quanto nell’origine non
è localmente omeomorfo a R2 . (Questa cosa è intuitiva, ma per formalizzarla bene serve la nozione
connessione. Si veda a tal proposito la Sezione 6.1.)
Esempio 2.3.5. La retta con due zeri (Esempio 2.2.10) è localmente omeomorfa a R, ha base nume-
rabile, ma non è T2 . Quindi non è una varietà.
Esempio 2.3.6 (La retta lunga). Sia ω1 il primo ordinale non numerabile e sia X lo spazio ω1 × [0, 1)
dotato della topologia dell’ordine lessicografico e privato dello zero. X è localmente omeomorfo a R.
Per vederlo, Pper ogni α < ω1 , siccome α è numerabile basta scegliere una successione {εβ }β∈α tale
che εβ > 0 e εβ = 1. La funzione X
f (β, t) = tεβ + εη
η<β
fornisce un omeomorfismo locale tra X e R. Siccome ω1 non è numerabile, X non è a base numerabile
e quindi non è una varietà.
Se X è una varietà topologica, e f1 : U1 → V1 , f2 : U2 → V2 sono carte locali (cioè, gli Ui sono
aperti di X, i Vi sono aperti di Rn e le fi sono omeomorfismi) la mappa ϕ2,1 = f2 ◦f1−1 : f1 (U1 ∩U2 ) →
f2 (U1 ∩ U2 ) si chiama cambio di carta; essa è un omeomorfismo tra aperti di Rn . Se F : X → Y è
una funzione, essa può essere letta in carte locali come F ◦ f1−1 : f1 (U1 ) → Y (nella carta U1 ). Si
noti che F ◦ f1−1 è una funzione definita su un aperto di Rn , quindi usualmente più facile da trattare
per fare i calcoli. La terminologia deriva dalle cartine geografiche. Una mappa non è altro che un
omeomorfismo locale tra il mondo (S 2 ) e un foglio di carta. Le funzioni come latitudine, longitudine,
altezza etc. . . si possono leggere in carte locali sulle pagine di un atlante. (Figura 6).
Teorema 2.3.7. Sia X una varietà topologica di dimensione n e sia Y una varietà topologica di dimensione
k. Allora X × Y è una varietà topologica di dimensione n + k.
D IMOSTRAZIONE . I Teoremi 2.1.2 e 2.1.6 garantiscono che X × Y è T2 e a base numerabile. Sia
(x, y) ∈ X × Y . Sia Ux un intorno aperto di x ∈ X e sia fx : Ux → Vx un omeomorfismo tra Ux e un
aperto Vx di Rn . Similmente definiamo fy : Uy → Vy . L’insieme Vx × Vy è un aperto di Rn × Rk , che è
omeomorfo a Rn+k . La funzione Ux × Uy → Vx × Vy data da
(a, b) 7→ (fx (a), fy (b))
62 2. COSTRUZIONI CON SPAZI TOPOLOGICI

X U1
U2 F Y
U1 ∩ U2

F ◦ f1−1
f2 f1
ϕ2,1

V2 V1

F IGURA 6. Cambi di carta e lettura in carte locali

fornisce un omeomorfismo locale tra X × Y e Rn+k . 


2 1 1 1
Esempio 2.3.8. Il toro T = S × S è una superficie perché S è una varietà topologica unidimen-
sionale.
Definizione 2.3.9. Una varietà topologica di dimensione n con bordo è uno spazio topologico
X di Hausdorff, a base numerabile e tale che sia localmente omeomorfo a Rn+ = {(x1 , . . . , xn ) ∈ Rn :
x1 ≥ 0}, cioè tale che per ogni x ∈ X esista un intorno aperto U di x e un omeomorfismo tra U e
un aperto di Rn+ . Il bordo di X è l’insieme dei punti che corrispondono, nelle carte locali, a punti
di {x1 = 0}. (Si noti che il bordo è ben definito per il teorema dell’invarianza del dominio, vedasi
l’Esercizio 2.4.11).
Esempio 2.3.10. Il disco D2 è una superficie a bordo, il suo bordo è S 1 = ∂D2 .
Le varietà sono spazi topologici particolarmente buoni, perché localmente sono spazi che assomi-
gliano ai rassicuranti Rn . In generale, si trattano bene anche spazi singolari, a patto che le singolarità
siano controllate. In dimensione uno, ciò porta alla definizione di grafo topologico.
Definizione 2.3.11 (Grafi topologici). Un grafo è uno spazio topologico omeomorfo allo spazio
ottenuto identificando tra loro alcuni vertici di un’unione disgiunta di segmenti. Più precisamente,
sia {Li }i∈I una famiglia di spazi topologici omeomorfi a [0, 1], detti lati. I punti corrispondenti a
{0} e {1} sono detti vertici. Sia ∼ una relazione d’equivalenza le cui classi d’equivalenza, qualora
contengano almeno due punti, siano costituite solo da vertici. Il quoziente di tLi per tale relazione
è un grafo. Un grafo si dice simpliciale se ogni lato ha vertici distinti e se per ogni coppia di vertici
passa al più un lato. Un grafo si dice planare se è omeomorfo a un sottoinsieme del piano Euclideo.
La valenza di un vertice è il numero di lati che contengono tale vertice (un lato conta doppio se
ha entrambi gli estremi sul vertice). Un grafo si dice finito se ha un numero finito di lati, si dice
localmente finito se ogni vertice ha valenza finita.
Esercizio 2.3.12. Sia G = tLi / ∼ un grafo e sia [v] un suo vertice. Dimostrare che la valenza di v è
il numero di elementi di [v] (come sottoinsieme di tLi ).
Esempio 2.3.13. S 1 è un grafo finito planare. Lo si può infatti vedere come due segmenti incollati
lungo i vertici.
Esempio 2.3.14. Se {Li }i∈I è una famiglia di spazi omeomorfi a [0, 1], identificando tra loro tutti i
vertici “0” si ottiene un grafo a stella. Tale grafo è finito, e localmente finito se e solo se I è finito.
Esempio 2.3.15. Sia X lo spazio topologico omeomorfo a una lettera “ics”. Esso è un grafo finito
planare.
2.4. ESERCIZI 63

Esempio 2.3.16. R è un grafo planare infinito ma localmente finito: Esso è il quoziente dei segmenti
[n, n + 1] ove il punto n ∈ [n, n + 1] è identificato col punto n ∈ [n − 1, n]. Ogni vertice ha valenza 2.
Esempio 2.3.17. In R2 sia X = (R × Z) ∪ (Z × R) (un foglio a quadretti infinito). Esso è un grafo
planare infinito ma localmente finito, i cui vertici han tutti valenza 4.
Teorema 2.3.18. Sia (X, τ ) un grafo. Allora esiste una metrica d su X tale che τd ⊆ τ . In particolare X
è T2 . Se inoltre X è localmente finito allora τd = τ (ergo τ è indotta da una metrica).
D IMOSTRAZIONE . Sia {Li }i∈I l’insieme dei lati e sia ∼ la relazione d’equivalenza che definisce
X = tLi / ∼. Su ogni Li mettiamo la metrica Euclidea. Per ogni x, y ∈ X definiamo d(x, y) come la
lunghezza del più piccolo cammino da x a y in X, se ve n’è almeno uno; d(x, y) = ∞ altrimenti. È
immediato verificare che la funzione d è positiva, simmetrica, distingue i punti e soddisfa la disugua-
glianza triangolare. Le palle metriche sono aperte nella topologia quoziente che definisce X. Quindi
τd è meno fine di τ . Se X è localmente finito, ogni punto ha un sistema fondamentale di intorni fatto
di palle metriche e quindi τd = τ . 
In generale quindi la situazione è questa: i grafi per definizione son dotati della topologia quo-
ziente, che coincide con quella metrica per grafi localmente finiti. Per grafi non localmente finiti la
topologia quoziente e quella metrica son diverse e si deve fare attenzione a quale usare.
Si noti che l’Esempio 2.2.11 fornisce l’esempio di un grafo non metrizzabile (non è localmente
numerabile). L’unico vertice di tale spazio è lo stereotipo di un vertice di valenza infinita.
Teorema 2.3.19. Sia X un grafo simpliciale finito. Allora X è omeomorfo a un sottoinsieme di Rn
(Euclideo) i cui lati siano segmenti Euclidei.
D IMOSTRAZIONE . Siccome X è finito, ha un numero finito di vertici v1 , . . . , vn , che identifichia-
mo con gli elementi della base canonica di Rn . Se L è un lato tra vi e vj esso è identificato al seg-
mento che congiunge ei , ei . Siccome X è simpliciale ciò definisce un omeomorfismo di X con un
sottoinsieme di Rn come richiesto. 
Esercizio 2.3.20. Dimostrare che in un grafo ogni punto ha un intorno omeomorfo al cono su un
insieme discreto.

2.4. Esercizi
Esercizio 2.4.1. Sia τ la topologia discreta su R e σ quella banale. Chi sono gli aperti di τ × σ?
Esercizio 2.4.2. Sia τ la topologia dell’ordine lessicografico su R2 . Su R siano σ la topologia discreta
ed ε quella Euclidea. Si dimostri che τ = σ × ε.
Esercizio 2.4.3. Siano (X, d) e (Y, δ) due spazi metrici e sia D((x, y), (x0 , y 0 )) = max(d(x, x0 ), δ(y, y 0 ))
Verificare che D sia una metrica su X × Y . Dimostrare che la topologia indotta da D su X × Y è il
prodotto delle topologie τd su X e τδ su Y .
Esercizio 2.4.4. Si dimostri che S 1 × [0, 1] è omeomorfo a {(x, y) ∈ R2 : 1 ≤ x2 + y 2 ≤ 4}.
Esercizio 2.4.5. Si dimostri che [0, 1] × D2 è omeomorfo a D3 .
Esercizio 2.4.6. Si dimostri che [0, 1]3 è omeomorfo a D3 .
Esercizio 2.4.7. Si dimostri che S 2 × [0, 1] è omeomorfo a {(x, y, z) ∈ R3 : 1 ≤ x2 + y 2 + z 2 ≤ 4}.
Esercizio 2.4.8. Si dimostri che S 2 × D2 non è omeomorfo a {(x, y, z) ∈ R3 : 1 ≤ x2 + y 2 + z 2 ≤ 4}.
Esercizio 2.4.9. Si dimostri che T 2 × S 1 è omeomorfo a T 3 .
Esercizio 2.4.10. Si dimostri che T 2 × [0, 1] è una varietà topologica con bordo. Chi è il bordo?
64 2. COSTRUZIONI CON SPAZI TOPOLOGICI

Esercizio 2.4.11. Sia X uno spazio topologico e sia x ∈ X. Siano U1 , U2 intorni aperti di x tali che
esistano aperti V1 , V2 di Rn+ = {(x1 , . . . , xn ) ∈ Rn : x1 ≥ 0} e omeomorfismi fi : Ui → Vi , i = 1, 2.
Dimostrare che se f1 (x) appartiene al piano {x1 = 0} allora anche f2 (x) vi appartiene. (Suggerimento:
usare il teorema dell’invarianza del dominio).
Esercizio 2.4.12. Sia X = {(x, y) ∈ R2 : xy = 0}. Dimostrare che X × R non è omeomorfo a R2 .
Esercizio 2.4.13. Siano (X, τ ) e (Y, σ) due spazi topologici. Siano η1 e η2 due topologie su X ×Y che
rendono continue le proiezioni naturali πX e πY . Si dimostri che η1 ∩ η2 rende continue le proiezioni
naturali. Se ne deduca che la Definizione 2.1.1 è ben posta.
Esercizio 2.4.14. Sia X uno spazio topologico e sia I un insieme. Dimostrare che la topologia
prodotto su X I è la topologia K-aperta se K è la famiglia dei singoletti di I.
Esercizio 2.4.15. Generalizzare il Teorema 2.1.6 al caso di prodotti infiniti. Cioè dimostrare che il
prodotto di una famiglia qualsiasi di spazi T2 è T2 e viceversa (se son tutti non vuoti).
Esercizio 2.4.16. Dimostrare che il prodotto di una quantità numerabile di spazi a base numerabile
ha base numerabile.
Esercizio 2.4.17. Sia X = R la retta di Sorgenfrey (Esempio 1.2.14) e sia Y = X × X dotato della
topologia prodotto (Y si chiama anche piano di Sorgenfrey). Dimostrare che Y è T2 e separabile. Sia
Z = {(x, y) ∈ Y : y = −x}. Dimostrare che Z, dotato della topologia indotta da Y , non è separabile.
Che spazio è Z?
Esercizio 2.4.18. Dimostrare che il prodotto di due spazi separabili è separabile. Ciò rimane vero
per prodotti infiniti? (Quest’ultima domanda è tutt’altro che banale).
Esercizio 2.4.19. Sia (Xi , τi ) una famiglia finita di spazi topologici e sia X il loro prodotto, dotato
della topologia prodotto τ = Πi τi . Dimostrare che se ogni τi è la topologia discreta su Xi allora τ è la
topologia discreta su X. Ciò rimane vero per prodotti infiniti?
Esercizio 2.4.20. Siano X, Y spazi topologici non vuoti. Dimostrare che se X × Y ha la topologia
cofinita allora almeno uno tra X e Y ha cardinalità finita.
Esercizio 2.4.21. Siano X, Y spazi topologici con almeno due punti ciascuno. Dimostrare che se
X × Y ha la topologia cofinita allora entrambi X e Y hanno cardinalità finita.
Esercizio 2.4.22. Sia ∼ una relazione d’equivalenza su un insieme X e siano A, B ⊆ X. Dimostrare
che se A ⊆ B allora sat(A) ⊆ sat(B).
Esercizio 2.4.23. Sia ∼ una relazione d’equivalenza su uno spazio topologico separabile X. Dimo-
strare che X/ ∼ è separabile.
Esercizio 2.4.24. Dimostrare che nell’Esempio 2.2.11 la successione xn = [n + n1 ] non converge a z.
Esercizio 2.4.25. Dimostrare che nell’Esempio 2.2.11 la proiezione π : R → R/Z non è aperta.
Esercizio 2.4.26. Sia X = [0, 2π] × [−1, 1] e sia ∼ la relazione d’equivalenza generata da (0, t) ∼
(2π, −t) per ogni t ∈ [−1, 1]. Lo spazio quoziente è il nastro di Moebius. Chi è il saturato di [0, 2π] ×
{1}? Chi è il saturato di {0} × [−1, 0]? Se S 1 = {z ∈ C : |z| = 1}, la funzione f : S 1 → X/ ∼ data da
f (z) = (arg(z), −1) è ben definita e continua? E f (z) = (arg(z), 0)?
Esercizio 2.4.27. Siano X = R2 , A = B(O, 1), Y = X/A e sia y0 = [A]. Si dimostri che il comple-
mentare di y0 è chiuso. Si dimostri che y0 non è chiuso e se ne calcoli la chiusura. Si dimostri che Y
non è T2 .
Esercizio 2.4.28. Siano X = R2 , A = B(O, 1), Y = X/A e sia y0 = [A]. Si dimostri che y0 è chiuso.
Si dimostri che y0 non è aperto e se ne calcoli la parte interna. Si dimostri che Y è omeomorfo a R2 .
2.4. ESERCIZI 65

Esercizio 2.4.29. Si dimostri che [0, 1]/{0, 1} è omeomorfo a S 1 .


Esercizio 2.4.30. Sia X = [0, 1] × [0, 1] e sia A = {0} × [0, 1] dimostrare che X/A è omeomorfo a un
triangolo. Dimostrare che X/A è omeomorfo a X.
Esercizio 2.4.31. Sia X = [0, 1] × [0, 1] e sia ∼ la relazione generata da (x, 0) ∼ (x, 1). Dimostrare
che X/ ∼ è omeomorfo al cilindro S 1 × [0, 1].
Esercizio 2.4.32. Sia X = S 1 × [0, 1] un cilindro e sia A = S 1 × {0}. Dimostrare che X/A è
omeomorfo a D2 = B(0, 1) ⊂ R2 .
Esercizio 2.4.33. Sia X = D2 ⊂ R2 sia A = S 1 = ∂D2 . Dimostrare che X/A è omeomorfo a
S = {x ∈ R3 : ||x|| = 1}.
2

Esercizio 2.4.34. Dimostrare che per ogni n il cono su S n è Dn+1 .


Esercizio 2.4.35. Sia X = {a, b, c} con la topologia discreta e sia Y il sottospazio di R2 corrispon-
dente al simbolo ipsilon (carattere maiuscolo, senza grazie). Dimostrare che il cono su X è omeomorfo
aY.
Esercizio 2.4.36. Siano A, B due grafi. Si dimostri che se A × B è una varietà topologica allora ogni
vertice di A e B ha valenza esattamente due.
Esercizio 2.4.37. Si dica se il nastro di Moebius è una varietà topologica (con bordo, se si considera
il nastro chiuso).
Esercizio 2.4.38. Si dica se RPn è una varietà topologica.
Esercizio 2.4.39. Si dica se CPn è una varietà topologica.
Esercizio 2.4.40. Si dimostri che due varietà topologiche omeomorfe hanno la stessa dimensione.
Esercizio 2.4.41. Si dimostri che se un grafo è localmente numerabile allora è localmente finito.
Esercizio 2.4.42. Sia X = S 1 con la topologia discreta. Si dica se il cono su X è omeomorfo a R2
con la topologia indotta dalla metrica dei raggi, o a un suo sottoinsieme.
Esercizio 2.4.43. In R2 con la metrica dei raggi, sia X la palla unitaria chiusa centrata nell’origine.
Dimostrare che X, con la topologia indotta dalla metrica dei raggi, non è un grafo topologico.
Esercizio 2.4.44. Dimostrare che se X e Y sono omeomorfi, allora i loro coni lo sono.
Esercizio 2.4.45. Sia X = S 1 × [0, 1] un cilindro e sia ∼ la relazione generata da (x, 0) ∼ (x, 1).
Dimostrare che X/ ∼ è omeomorfo a T 2 .
Esercizio 2.4.46. Sia X = S 1 × [0, 1] un cilindro e sia ∼ la relazione generata da (x, 0) ∼ (−x, 1).
Dimostrare che X/ ∼ è omeomorfo a T 2 .
Esercizio 2.4.47. Sia C il cerchio di centro (2, 0) e raggio 1 nel piano Y Z di R3 : C = {(0, y, z) ∈ R2 :
||(y, z) − (2, 0)|| = 1} e sia T la superficie di rotazione di R3 ottenuta ruotando C attorno all’asse Z.
Dimostare che T è omeomorfo a T 2 . Siano A il cerchio più interno di T e B quello più esterno:
A = {(x, y, 0) : x2 + y 2 = 1} B = {(x, y, 0) : x2 + y 2 = 9}
Dimostrare che T /A, T /B, T /C sono tutti omeomorfi tra loro.
Esercizio 2.4.48. Sia X un n-pode regolare in R2 . In coordinate polari X = {(ρ, θ) : 0 ≤ ρ ≤ 1, θ =
2kπ
n ,k = 1, . . . , n}. Sia f la rotazione di angolo 2π
n e sia Tf il toro di sospensione di f . Consideriamo
ora S = {(x, y) ∈ R2 : x2 + y 2 = 1}. Sia A = S 1 × [0, 1] e sia ∼ la relazione d’equivalenza su A
1

generata da (x, 1) ∼ (f (x), 1). Dimostrare che A/ ∼ è omeomorfo a Tf .


66 2. COSTRUZIONI CON SPAZI TOPOLOGICI

Esercizio 2.4.49. Sia X = [0, 1] × [0, 1] e consideriamo i seguenti quattro quozienti, dati dall’iden-
tificazione dei lati di bordo secondo le frecce disegnate.

A B C D

Dimostrare che A è omeomorfo al toro T 2 , B alla Bottiglia di Klein, C al piano proiettivo, D alla sfera
S2.
Esercizio 2.4.50. Dimostrare, usando solo gli strumenti sviluppati sinora, che la bottiglia di Klein
è ottenuta incollando due nastri di Moebius lungo i bordi.
Esercizio 2.4.51. Sia ∼ la relazione su R2 generata da x ∼ 2x. Si dica se R2 / ∼ è localmente
numerabile, a base numerabile, T2 .
2
Esercizio 2.4.52. In R2 sia X l’immagine di (0, ∞) tramite f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Si dica se X c è una varietà topologica.
2
Esercizio 2.4.53. In R2 sia X l’immagine di (0, ∞) tramite f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Si dica se R2 /X è una varietà topologica.
Esercizio 2.4.54. In R2 sia ∼ la relazione di equivalenza generata da (x, y) ∼ (x0 , y 0 ) se y/ex =
0 0
y 0 /ex (equivalentemente (x, y) ∼ (x0 , yex −x )). Descrivere le classi di equivalenza.
Esercizio 2.4.55. In R2 sia ∼ la relazione di equivalenza generata da (x, y) ∼ (x0 , y 0 ) se y/ex =
0 x0
y /e . Si dica se R2 / ∼ è T2 .
Esercizio 2.4.56. In R2 sia ∼ la relazione di equivalenza generata da (x, y) ∼ (x0 , y 0 ) se y/ex =
0 x0
y /e . Si dimostri che R2 / ∼ è omeomorfo a R.
Esercizio 2.4.57. In R2 sia ∼ la relazione d’equivalenza generata da (x, y) ∼ (x + 1, y). Dimostrare
che R2 / ∼ è omeomorfo a S 1 × R.
Esercizio 2.4.58. In R2 sia ∼ la relazione di equivalenza generata da (x, y) ∼ (x0 , y 0 ) se y/ex =
0 x0
y /e e da (x, y) ∼ (x + 1, y). Si dimostri che R2 / ∼ non è T2 .
Esercizio 2.4.59. Su R2 sia ∼ la relazione d’equivalenza generata da (x, y) ∼ (x+1, 2y). Si dimostri
che R2 / ∼ è omeomorfo a S 1 × R.
Esercizio 2.4.60. In R si consideri la relazione di equivalenza generata da x ∼ 2x. Sia X =
(−∞, 1) ∪ {0} ∪ (1, ∞) con la topologia indotta da R. Sia ∼X la relazione di equivalenza indotta
da ∼ su X. Si dica se l’immagine di X in R/ ∼ è omeomorfa a X/ ∼X .
CAPITOLO 3

Compattezza

3.1. Ricoprimenti e compattezza


Definizione 3.1.1 (Ricoprimenti). Sia X uno spazio topologico. Un ricoprimento di X è una
famiglia U = {Ui }i∈I di sottoinsiemi di X tali che
∪i∈I Ui = X.
Il ricoprimento si dice aperto se tutti gli Ui sono aperti. Si dice chiuso se tutti gli Ui lo sono.
Un sottoricoprimento di U è un ricoprimento della forma {Ui }i∈J con J ⊆ I. Un raffinamento
di U è un ricoprimento V = {Vα }α∈A tale che
∀α ∈ A∃i ∈ I : Vα ⊆ Ui .
Un ricoprimento si dice finito/numerabile se ha un numero finito/numerabile di elementi. Si
dice localmente finito se per ogni x ∈ X esiste un intorno V di x tale che il numero degli Ui che
intersecano V è finito.

F IGURA 1. Un ricoprimento di un sottoinsieme di R2 tramite palle Euclidee

Esempio 3.1.2. Sia X uno spazio topologico. Allora {X} è un ricoprimento (finito) di X.
Esempio 3.1.3. Sia (X, τ ) uno spazio topologico. Allora τ è un ricoprimento aperto di X. Ogni
ricoprimento aperto di X è un sottoricoprimento di τ .
Esempio 3.1.4. Sia X uno spazio topologico T2 con almeno due punti. Per ogni x ∈ X sia Ux =
{x}c . Siccome in un T2 i punti son chiusi, Ux è aperto. Siccome X ha almeno due punti la famiglia
{Ux }x∈X è un ricoprimento aperto di X.
Esempio 3.1.5. Sia X uno spazio metrico e sia x ∈ X. La famiglia U = {B(x, r)}0<r∈R delle
palle centrate in x è un ricoprimento aperto di X. Anche la famiglia di tutte le palle unitarie V =
{B(p, 1)}p∈X lo è. Inoltre, V è un raffinamento di U.
Definizione 3.1.6. Uno spazio topologico X si dice compatto se ogni ricoprimento aperto di X
ha un sottoricoprimento finito.
67
68 3. COMPATTEZZA

Esempio 3.1.7. R non è compatto poiché il ricoprimento {B(0, r)}0<r∈R non ha sottoricoprimenti
finiti.
Esempio 3.1.8. La topologia banale è sempre compatta.
Esempio 3.1.9. Ogni topologia finita è compatta. In particolare ogni spazio con un numero finito
di elementi è compatto.
Esempio 3.1.10. Se X ha un’infinità di elementi, allora la topologia discreta su X non è compatta:
basta prendere come ricoprimento aperto quello fatto dai singoletti {x} al variare di x ∈ X.
Esempio 3.1.11. Unione finita di compatti è compatta, cioè se K1 , . . . , Kn sono sottospazi compatti
di uno spazio X, allora la loro unione è compatta. Infatti un ricoprimento U di ∪Ki ricopre ogni
singolo Ki ; per compattezza esiste una famiglia finita Ui ⊆ U che ricopre Ki e l’unione ∪Ui è un
sottoricoprimento finito di ∪Ki .
Esempio 3.1.12. La topologia cofinita è compatta.
D IMOSTRAZIONE . Sia X uno spazio dotato della topologia cofinita e sia U un ricoprimento aper-
to di X. Sia U ∈ U. Per definizione esso è il complementare di un numero finito di punti x1 , . . . , xn .
Siccome U è un ricoprimento di X, per ogni i esiste Ui ∈ U tale che xi ∈ Ui . Ne segue che {U, U1 , . . . , Un }
è un sottoricoprimento finito di U. 
Teorema 3.1.13. Lo spazio [0, 1] con la topologia Euclidea è compatto.
D IMOSTRAZIONE . Sia U = {Ui } un ricoprimento aperto di [0, 1]. Sia
A = {x ∈ [0, 1] tale che [0, x] è contenuto nell’unione di un numero finito di Ui }
Dire che esiste un sottoricoprimento finito di U equivale a dire che 1 ∈ A.
Per prima cosa, 0 ∈ A perché U è un ricoprimento, il ché implica anche che un intero intorno di
zero sta in A. Sia t = inf Ac (ponendo t = 1 se Ac è vuoto). In particolare t > 0. Siccome U è un
ricoprimento, esiste i tale che t ∈ Ui . Siccome Ui è aperto esiste ε > 0 tale che (t − ε, t + ε) ∩ [0, 1] ⊆ Ui .
Siccome t > 0, esiste x ∈ (t − ε, t) ∩ [0, 1] e siccome t = inf Ac si ha x ∈ A. Per definizione esistono
i1 , . . . , ik tali che
[0, x] ⊆ Ui1 ∪ · · · ∪ Uik
e quindi
[0, t] ⊆ [0, 1] ∩ [0, t + ε) ⊆ (Ui1 ∪ · · · ∪ Uik ) ∪ Ui .
In particolare t ∈ A, e se t 6= 1 allora t non è l’estremo inferiore di Ac . 
Si noti che la compattezza (al contrario dell’essere chiuso/aperto) è un invariante topologico e
dunque una proprietà intrinseca degli spazi topologici. Per esempio, il fatto che un sottoinsieme A
di uno spazio topologico X sia compatto, non dipende da X ma solo dalla topologia indotta da X su
A. In particolare, se A ⊂ X ⊂ Y allora A è compatto come sottospazio di X, se e solo se lo è come
sottospazio di Y (perché X e Y inducono su A la stessa topologia.)
Esempio 3.1.14. [0, 1] e R Euclidei non sono omeomorfi perché uno è compatto e l’altro no.
Teorema 3.1.15. Sia X uno spazio topologico e sia U = {Uα } un ricoprimento aperto. Se esiste un
raffinamento V di U che ammette un sottoricoprimento finito, allora anche U ammette un sottoricoprimento
finito.
D IMOSTRAZIONE . Se X = V1 ∪ · · · ∪ Vk con Vi ∈ V, siccome per ogni Vi esiste α(i) tale che
Vi ⊆ Uα(i) allora
X = V1 ∪ · · · ∪ Vk ⊆ Uα(1) ∪ · · · ∪ Uα(k) .

3.1. RICOPRIMENTI E COMPATTEZZA 69

Lemma 3.1.16. Sia (X, τ ) uno spazio topologico e sia B una base di τ . Ogni ricoprimento aperto di X ha
un raffinamento fatto di elementi di B.
D IMOSTRAZIONE . Sia U = {Ui } un ricoprimento aperto di X. Per definizione di base, per ogni i
esistono elementi Bij ∈ B tale che Ui = ∪j Bij . Ne segue che la famiglia di tutti i Bij , al variare di i, j è
un ricoprimento di X che raffina U. 
Corollario 3.1.17. Sia (X, τ ) uno spazio topologico e sia B una base di τ . Allora X è compatto se e solo
se ogni ricoprimento di X fatto di elementi di B ha un sottoricoprimento finito.
D IMOSTRAZIONE . Per definizione se X è compatto ogni ricoprimento aperto, e in particola-
re quelli fatti di elementi di B, ha un sottoricoprimento finito. Viceversa, sia U un ricoprimento
aperto. Per il Lemma 3.1.16 U ha un raffinamento fatto di elementi di B, che per ipotesi ha un
sottoricoprimento finito. Per il Teorema 3.1.15 X è compatto. 
Teorema 3.1.18. La topologia di Zariski su X = Rn (o Cn , o Kn ) è compatta.
D IMOSTRAZIONE . Sia U = {Ui } un ricoprimento aperto di X. Per il Corollario 3.1.17 possiamo
supporre che ogni Ui appartenga alla base standard, ossia sia della forma Ui = {pi 6= 0} = A(pi ) =
Z(pi )c , per un polinomio pi . Passando ai complementari si ottiene facilmente
[ \
Ui = X ↔ Z(pi ) = ∅.
i i
Per il teorema della base di Hilbert esiste un numero finito di polinomi p1 , . . . , pn tali che l’ideale I
generato
Pn da tutti i polinomi pi è generato dai soli p1 , . . . , pn . Ne segue che per ogni p ∈ I si ha p =
i=1 i i e quindi p(x) = 0 per ogni x ∈ Z(p1 ) ∩ · · · ∩ Z(pn ). In altre parole Z(p) ⊇ Z(p1 ) ∩ · · · ∩ Z(pn ).
q p
Quindi Z(p) ∩ Z(p1 ) ∩ · · · ∩ Z(pn ) = Z(p1 ) ∩ · · · ∩ Z(pn ). In particolare
\
∅= Z(pi ) = Z(p1 ) ∩ · · · ∩ Z(pn );
i
ma ciò equivale a dire che U1 , . . . , Un coprono X. 
Teorema 3.1.19. Ogni sottoinsieme chiuso di uno spazio compatto è compatto.
D IMOSTRAZIONE . Sia X uno spazio compatto e A ⊆ X chiuso. Sia U = {Ui } un ricoprimento
aperto di A. Per ogni i esiste Vi aperto in X tale che Ui = Vi ∩ A. Dunque V = {Vi } è una famiglia
di aperti di X e, siccome A è chiuso, allora V ∪ {Ac } è un ricoprimento aperto di X. Esso ammette
per compattezza un sottoricoprimento finito {Vi1 , . . . , Vin , Ac }. Siccome A ∩ Ac = ∅, abbiamo che
{Ui1 , . . . , Uin } ricopre A e quindi U ha un sottoricoprimento finito. 
Per il viceversa serve un’ipotesi in più.
Teorema 3.1.20 (Compatto in T2 è chiuso). Sia X uno spazio di Hausdorff e sia A ⊆ X compatto.
Allora A è chiuso in X. Inoltre, per ogni x ∈
/ A esistono aperti disgiunti V, U tali che x ∈ V e A ⊆ U .
D IMOSTRAZIONE . Dimostriamo la seconda affermazione, che implica anche la prima perché ci
dice in particolare che il complementare di A è aperto.
Sia x ∈ Ac . Siccome X è T2 , per ogni a ∈ A esistono aperti Ua , Va disgiunti con a ∈ Ua e x ∈ Va .
La famiglia {Ua }a∈A ricopre A. Per compattezza, esiste k ∈ N e a1 , . . . , ak ∈ A tali che Ua1 , . . . , Uak
ricoprono A. L’insieme V = Va1 ∩ · · · ∩ Vak è aperto e contiene x. Inoltre V è disgiunto da Ua1 , . . . , Uak
e quindi dalla loro unione. Ponendo U = ∪Uai si ha la tesi. 
Esempio 3.1.21. Sia (X, τ ) uno spazio topologico compatto e sia Y = X ∪ {∞}. Sia σ la topologia
generata da τ su Y . Si ha σ = τ ∪ {Y } (perché?). Dunque {∞} non è aperto in Y . Quindi X ⊂ Y è un
sottospazio compatto di Y che però non è chiuso. Ciò non contraddice quanto detto sin ora in quanto
Y non è di Hausdorff.
70 3. COMPATTEZZA

Teorema 3.1.22 (In un T2 i compatti si separano con aperti). Sia X uno spazio T2 e siano A, B ⊆ X
compatti disgiunti. Allora esistono aperti disgiunti U, V tali che A ⊆ U e B ⊆ V .
D IMOSTRAZIONE . Per il Teorema 3.1.20, per ogni x ∈ B esistono aperti Ux , Vx disgiunti tali che
x ∈ Vx e A ⊆ Ux . La famiglia {Vx : x ∈ B} è un ricoprimento aperto di B. Per compattezza esistono
x1 , . . . , xk tali che B ⊆ V = Vx1 ∪ · · · ∪ Vxk . L’aperto U = Ux1 ∩ · · · ∩ Uxk contiene A ed è disgiunto da
V. 
Esempio 3.1.23. Sia X = R e sia N = {1/n, n ∈ N, n > 0}. N è una successione che si accumula
a zero. Sia τ la topologia Euclidea di R e σ la famiglia degli aperti di N c , rispetto alla topologia
Euclidea, ovvero σ = {A \ N, A ∈ τ }. La famiglia di insiemi τ ∪ σ è chiusa per intersezione e dunque
è base di una topologia η su X. Essa è più fine della Euclidea per come è definita, in particolare è
T2 . L’insieme N è chiuso perché il suo complementare è aperto per definizione. Ma non esistono due
aperti disgiunti contenenti l’uno 0 e l’altro N . Si noti che N non è un sottoinsieme compatto di (X, η).
Teorema 3.1.24 (Immagine continua di compatti è compatta). Sia f : X → Y una funzione continua
tra spazi topologici. Se X è compatto allora f (X) è compatto.
D IMOSTRAZIONE . Sia U = {Ui }i∈I un ricoprimento aperto di f (X). Allora Vi = f −1 (Ui ) for-
nisce un ricoprimento aperto di X che, siccome X è compatto, ammette un sottoricoprimento finito
Vi1 , . . . , Vik . Ne segue che Ui1 , . . . , Uik è un sottoricoprimento finito di f (X). 
Teorema 3.1.25 (Immagine continua e chiusa di un compatto T2 è T2 ). Sia f : X → Y una funzione
continua e chiusa tra spazi topologici. Se X è compatto e T2 , allora f (X) è T2 .
D IMOSTRAZIONE . Siccome X è T2 , i punti di X son chiusi (Teorema 1.6.12). Siccome f è chiusa,
i punti di f (X) son chiusi. Siano y1 6= y2 ∈ f (X). Siccome f è continua, f −1 (y1 ) è chiuso, ergo
compatto perché X è compatto (Teorema 3.1.19). Stessa cosa per f −1 (y2 ). Esistono quindi aperti
disgiunti U1 , U2 l’uno contenente f −1 (y1 ) e l’altro f −1 (y2 ) (Teorema 3.1.22). Per definizione, U1c è
chiuso e siccome f è chiusa, la sua immagine f (U1c ) è chiusa. Quindi f (U1c )c è aperto. Siccome
f −1 (y1 ) ∈ U1 allora y1 ∈
/ f (U1c ). Quindi y1 ∈ f (U1c )c . Stessa cosa per y2 . Definiamo V1 = f (U1c )c ∩f (X)
c c
e V2 = f (U2 ) ∩ f (X). Essi sono aperti di f (X) l’uno contenente y1 e l’altro y2 . Vediamo che son
disgiunti. Se x ∈ V1 allora x ∈ f (X) \ f (U1c ), in particolare ∅ = 6 f −1 (x) ⊆ U1 . Similmente se x ∈ V2
−1
allora f (x) ⊆ U2 . Siccome U1 ∩ U2 = ∅ non può esistere x ∈ V1 ∩ V2 . 
Corollario 3.1.26. I quozienti di spazi compatti sono sempre compatti. Se inoltre la proiezione naturale è
chiusa e lo spazio di partenza è T2 , allora il quoziente è T2 .
D IMOSTRAZIONE . Sia X uno spazio topologico e ∼ una relazione d’equivalenza su X. La proie-
zione naturale π : X → X/ ∼ è continua e π(X) = X/ ∼. Per il Teorema 3.1.24 X/ ∼ è compatto. Se
π è chiusa e X è T2 allora per il Teorema 3.1.25 X/ ∼ è T2 . 
Teorema 3.1.27. Siano A, B spazi topologici non vuoti. Allora A × B è compatto se e solo se A e B lo
sono.
D IMOSTRAZIONE . Se A×B è compatto, siccome le proiezioni sono continue e immagine continua
di un compatto è compatto (Teorema 3.1.24), allora sia A che B sono compatti. Vediamo il viceversa.
Sia {Ui } un ricoprimento aperto di A × B. Per il Corollario 3.1.17 possiamo supporre che gli Ui siano
prodotti di aperti: Ui = Vi × Wi .
−1
Prima, concentriamo la nostra attenzione sulle fibre πA (a). (Figura 2). Per ogni a ∈ A l’insieme
{a} × B è compatto perché omeomorfo a B, che è compatto per ipotesi. Consideriamo gli Ui che
intersecano {a} × B. Per compattezza, un numero finito Ui1 , . . . , Uik di questi, copre {a} × B. Sia
V (a) = Vi1 ∩ · · · ∩ Vik . Chiaramente V (a) è un aperto contenente A e
V (a) × B ⊆ Ui1 ∪ · · · ∪ Uik .
3.1. RICOPRIMENTI E COMPATTEZZA 71

Ui1
..
B .

Uik

( ) A
a

V (a)

F IGURA 2. Prodotto di compatti è compatto. La parte grigia rappresenta V (a) × B.

Adesso consideriamo il ricoprimento aperto di A formato dagli insiemi V (a). Siccome A è com-
patto esistono a1 , . . . , an tali che A è coperto da V (a1 ), . . . , V (an ). Ne segue che A × B è coperto da
V (a1 ) × B, . . . , V (an ) × B, che sono in numero finito. Siccome ogni V (a) × B è coperto da un numero
finito degli Ui , possiamo dedurre che tutto A × B è coperto da un numero finito degli Ui . 

Corollario 3.1.28. I compatti di R2 Euclideo sono tutti e soli i chiusi e limitati. (Idem per ogni Rn .)

D IMOSTRAZIONE . Se A è un limitato di R2 allora esiste N ∈ N tale che A ⊆ [−N, N ] × [−N, N ],


che è compatto per il Teorema 3.1.27. Se A è anche chiuso allora è un chiuso di un compatto, er-
go compatto per il Teorema 3.1.19. Viceversa, se K ⊆ R2 è compatto, allora il ricoprimento U =
{(−k, k) × (−k, k) : k ∈ N} ha un sottoricoprimento finito, quindi K è limitato. Per il Teorema 3.1.20
K è anche chiuso. (Per il caso di Rn basta rimpiazzare [−N, N ] × [−N, N ] con [−N, N ]n .) 

Corollario 3.1.29 (Weierstrass). Sia X uno spazio compatto non vuoto e f : X → R una funzione
continua. Allora f ha massimo e minimo su X.

D IMOSTRAZIONE . Per il Teorema 3.1.24 f (X) è un compatto di R. Per il Corollario 3.1.28 i


compatti di R son chiusi e limitati. Siccome f (X) è non vuoto, ha massimo e minimo. 

Per dimostrare il Teorema 3.1.27 in realtà non abbiamo tutte le ipotesi. In particolare, abbiamo
−1 −1
usato la compattezza di A, il fatto che πA (a) fosse compatto e che πA (V (a)) fosse contenuto in
Ui1 ∪ · · · ∪ Uik . Possiamo quindi generalizzare il Teorema 3.1.27 come segue.

Teorema 3.1.30. Siano X, Y spazi topologici. Se Y è compatto e f : X → Y è una qualsiasi funzione tale
che per ogni y ∈ Y

(1) l’insieme f −1 (y) è compatto;


(2) per ogni aperto U contenente f −1 (y) esiste un aperto V contenete y tale che f −1 (V ) ⊆ U .
72 3. COMPATTEZZA

f −1 (y) X

V y
f −1 (V )
Y
U

Allora X è compatto.
D IMOSTRAZIONE . Si procede esattamente come nella dimostrazione del Teorema 3.1.27, ove X
fa le veci di A × B, Y quelle di A ed f quelle della proiezione πA . Dato un ricoprimento aperto {Ui }
di X, per compattezza ogni fibra f −1 (y) è coperta da Ui1 , . . . Uik . Per ipotesi (2) esiste V (y) aperto
tale che f −1 (V ) ⊆ Ui1 ∪ · · · ∪ Uik . Per compattezza, Y è coperto da un numero finito di V (y). 
Definizione 3.1.31. Una funzione f : X → Y tra spazi topologici si dice propria se per ogni
compatto K ⊆ Y si ha che f −1 (K) è compatto.
Esistono funzioni che non sono proprie.
Esempio 3.1.32. Sia π : R2 → R la proiezione canonica. Per ogni {x} ⊂ R, che è compatto perché
finito, la sua preimmagine π −1 (x) non è compatta perché omeomorfa a R.
Si annoti che alcuni autori (per esempio il Bourbaki) includono la condizione che f sia chiusa
nella definizione di mappa propria.
Corollario 3.1.33. Sia f : A → B una applicazione chiusa tra spazi topologici tale che le preimmagini di
ogni punto siano compatte. Allora f è propria.1
D IMOSTRAZIONE . Usiamo il Teorema 3.1.30. Se y ∈ B e U è un aperto contenente f −1 (y) allora
U c è chiuso e quindi f (U c ) è un chiuso che non contiene y. Quindi V = f (U c )c è un aperto contenente
y. Siccome per ogni C ⊆ A si ha f −1 f (C) ⊇ C e siccome il passaggio al complementare ribalta le
inclusioni, si ha
f −1 (V ) = f −1 (f (U c )c ) = (f −1 (f (U c )))c ⊆ (U c )c = U
e quindi il Teorema3.1.30 si applica (con Y ⊆ B compatto e X = f −1 (Y )). 

3.2. Il Teorema del Compatto-Hausdorff


Il prossimo teorema, la cui dimostrazione è una diretta conseguenza dei teoremi fatti sinora, è
di immensa utilità quando si cerca di dimostrare che una certa funzione è un omeomorfismo: ci
risparmia infatti la fatica di capire se l’inversa sia continua o no.
Teorema 3.2.1 (Teorema del Compatto-Hausdorff). Siano X, Y spazi topologici. Supponiamo che X
sia compatto e Y di Hausdorff. Allora ogni funzione f : X → Y continua e biunivoca è un omeomorfismo.
D IMOSTRAZIONE . Siccome X è compatto, se A ⊆ X è chiuso, allora per il Teorema 3.1.19 è
compatto. Per il Teorema 3.1.24, siccome f è continua si ha che f (A) è compatto in Y . Siccome Y è T2 ,
f (A) è chiuso per il Teorema 3.1.20. Ergo f è chiusa. Per il Teorema 1.7.43, f è un omeomorfismo. 
Vediamo degli esempi classici di utilizzo del Teorema 3.2.1.
1La definizione del Bourbaki diventa quindi equivalente a “una funzione è propria se è chiusa e le preimmagini dei punti
sono compatte”.
3.3. IL TEOREMA DI TYCHONOFF 73

Esempio 3.2.2. Sia X = [0, 1]. Incolliamo 0 con 1 (usando la relazione d’equivalenza generata da
0 ∼ 1). Allora il quoziente X/ ∼ è omeomorfo S 1 .
D IMOSTRAZIONE . Sia f : X → S 1 la funzione definita da f (x) = (cos(2πx), sin(2πx)). Essa è
continua rispetto alla metrica Euclidea, inoltre f (0) = f (1). Per il Teorema 2.2.16 f induce una fun-
zione continua [f ] : X/ ∼→ S 1 , che è immediato verificare essere biunivoca. Siccome X è compatto,
per il Corollario 3.1.26 anche X/ ∼ lo è. Infine, S 1 è T2 perché è un sottoinsieme di R2 (che è T2 ) e il
Teorema 3.2.1 si applica. 

Esempio 3.2.3. Riprendiamo gli spazi dell’esempio delle coordinate polari (2.2.18). Sia X = [0, 1]×
[0, 2π] con la relazione d’equivalenza generata da (0, θ) ∼ (0, θ0 ) e (ρ, 0) ∼ (ρ, 2π). Allora X/ ∼ è
omeomorfo a D2 = {(x, y) ∈ R2 : x2 + y 2 ≤ 1}.
D IMOSTRAZIONE . Lo spazio X è compatto perché è prodotto di compatti; D2 è T2 perché sot-
toinsieme di R2 . Come abbiamo visto nell’Esempio 2.2.18, esiste una funzione continua e biunivoca
da X/ ∼ a D2 . Per il Teorema 3.2.1 tale funzione è un omeomorfismo. 

Esempio 3.2.4. Collassando il bordo del disco D2 a un punto si ottiene S 2 .


D IMOSTRAZIONE . In coordinate polari sia f la parametrizzazione che manda l’origine nel polo
Sud e ∂D2 nel polo Nord. In formule, detto α = πρ − π2 , si ha f (ρ, θ) = (cos α cos θ, cos α sin θ, sin α).
La funzione f è continua e costante su ∂D2 . Per il Teorema 2.2.16 essa induce una funzione conti-
nua da D2 /(∂D2 ) a S 2 che è immediato verificare essere biunivoca. Siccome D2 è compatto (per il
Corollario 3.1.28) e S 2 è T2 , il Teorema 3.2.1 conclude. 

Esempio 3.2.5. Identificando il lati opposti di un quadrato mantenendo l’orientazione si ottiene il


toro T 2 .
D IMOSTRAZIONE . Sia Q = [0, 1] × [0, 1] un quadrato. Esso è compatto perché prodotto di com-
patti. Su Q identifichiamo i lati opposti tramite la relazione d’equivalenza generata da (x, 0) ∼ (x, 1) e
(0, y) ∼ (1, y). Per S 1 usiamo le coordinate complesse S 1 = {eiθ : θ ∈ [0, 2π]}. Definiamo la funzione
f : Q → T 2 data da f (x, y) = (e2πix , e2πiy ). Essa è continua, costante sulle classi d’equivalenza e
induce una biiezione [f ] tra Q/ ∼ e T 2 = S 1 × S 1 . Per il Teorema 2.2.16 e il Teorema 3.2.1 [f ] è un
omeomorfismo. 

Occhio che se uno si abitua a usare il Teorema del Compatto-Hausdorff alla leggera poi va a finire
che lo usa anche quando le ipotesi non son verificate.
Esempio 3.2.6. Sia X = R2 con la topologia dell’Esercizio 1.8.85 ovvero, detta O l’origine, si pone
τ = {B(O, 2−n ), n ∈ N} ∪ {∅, X}. (X, τ ) è compatto perché l’unico aperto che contiene punti di R2 di
modulo più grande di 1 è il tutto. Quindi ogni ricoprimento aperto di X deve contenere come aperto
il tutto, che tautologicamente ne costituisce un sottoricoprimento finito. La funzione f : X → X data
da f (x, y) = (2x, 2y) è continua e biunivoca. Ma non è un omeomorfismo! Ciò non contraddice il
Teorema 3.2.1 in quanto X non è T2 .

3.3. Il Teorema di Tychonoff


Il fatto che prodotto di compatti sia compatto, non vale solo per prodotti finiti, ma più in generale
per prodotti infiniti. La dimostrazione richiede l’assioma della scelta; più precisamente useremo il
Lemma di Zorn. (D’altronde, senza assioma di scelta i prodotti infiniti potrebbero essere vuoti!)
Cominciamo con una riformulazione equivalente della compattezza.
Definizione 3.3.1. Sia X un insieme. Una famiglia di sottoinsiemi F ⊆ P(X) gode della proprietà
delle intersezioni finite se ogni intersezione di un numero finito di elementi di F è non vuota.
74 3. COMPATTEZZA

Consideriamo un insieme X e una famiglia F ⊆ P(X) di sottoinsiemi di X. Allora ∩A∈F A = ∅


se e solo se la famiglia U = {Ac : A ∈ F} dei complementari di elementi di F è un ricoprimento di
X. Inoltre, la famiglia F gode della proprietà delle intersezioni finite se e solo se nessuna sottofami-
glia finita di U è un ricoprimento. Armati di queste osservazioni possiamo agilmente dimostrare il
seguente lemma.
Lemma 3.3.2. Sia X uno spazio topologico. Allora X è compatto se e solo se per ogni famiglia {Ai }i∈I di
chiusi che gode della proprietà delle intersezioni finite si ha ∩Ai 6= ∅.
D IMOSTRAZIONE . X non è compatto se e solo se esiste un ricoprimento aperto U = {Ui }i∈I senza
sottoricoprimenti finiti. Passando ai complementari, ciò è equivalente a dire che esiste una famiglia
di chiusi che gode della proprietà delle intersezioni finite, ma che ha intersezione vuota. 

Ora siamo pronti per dimostrare il Teorema di Tychonoff.


Teorema 3.3.3 (Tychonoff). Il prodotto di una famiglia qualsiasi di spazi compatti è compatto.
D IMOSTRAZIONE . Sia K = Πi∈I Ki un prodotto qualsiasi di spazi compatti e sia F ⊆ P(K)
una famiglia di chiusi che gode della proprietà delle intersezioni finiti. Dobbiamo dimostrare che
∩A∈F A 6= ∅.
Adesso usiamo il Lemma di Zorn. Sia (B, ≤) l’insieme di tutte famiglie di sottoinsiemi di K che
godono della proprietà delle intersezioni finite, ordinate per inclusione. Chiaramente ogni catena ha
un massimale (l’unione di tutti gli elementi della catena). Ne segue che F è contenuta in un elemento
massimale M. Per massimalità, M è chiusa per intersezioni finite.
Detta πi : K → Ki è la proiezione naturale, per ogni elemento A ∈ M poniamo Ai = πi (A).
Per ogni i la famiglia {Ai } ⊆ P(Ki ) è una famiglia di chiusi con la proprietà delle intersezioni finite.
Siccome Ki è compatto, ∩A∈M Ai 6= ∅. Sia xi ∈ ∩A∈M Ai . Il punto x = (xi )i∈I è un punto di K.
Facciamo vedere che x ∈ ∩A∈F A, che risulterà quindi diverso dal vuoto.
Per il Teorema 2.1.11 x ha un sistema fondamentale di intorni in K del tipo U = ΠUi con solo un
numero finito di Ui 6= Ki . Fissiamo uno di questi intorni. Per ogni i e per ogni A ∈ M, l’insieme Ui ,
essendo un intorno di xi ∈ πi (A), interseca πi (A). Ne segue che πi−1 (Ui ) interseca ogni A ∈ M.
Quindi, siccome M è chiusa per intersezioni finite, la famiglia M ∪ {πi−1 (Ui )} ha la proprietà
delle intersezioni finite. Per massimalità, πi−1 (Ui ) ∈ M. Siccome Ui 6= Ki solo per un numero finito
di indici e siccome M è chiusa per intersezioni finite, U ∈ M.
Abbiamo quindi dimostrato che x ha un sistema fondamentale di intorni che stanno in M. Ma
allora per ogni A ∈ F ⊆ M e ogni intorno U di x si ha U ∩ A 6= ∅. Siccome gli elementi di F son
chiusi, si ha x ∈ A. Siccome ciò vale per ogni A ∈ F, abbiam finito. 

Corollario 3.3.4. Sia X uno spazio compatto allora l’insieme X A = {f : A → X} è compatto per la
topologia della convergenza puntuale. In particolare [0, 1]R = {f : R → [0, 1]} è compatto per la topologia
della convergenza puntuale.
D IMOSTRAZIONE . Per il Corollario 2.1.14, la topologia della convergenza puntuale è la topolo-
gia prodotto. Quest’ultima è compatta per il Teorema di Tychonoff perché [0, 1] è compatto (Teore-
ma 3.1.13). 

3.4. Compattezza vs compattezza per successioni


Diciamo subito come va a finire: in generale le successioni non bastano a descrivere la compat-
tezza e se uno vuole usarle deve andare a sporcarsi le mani con le successioni generalizzate (nell’Ap-
pendice B si mostra che la compattezza è equivalente alla compattezza per successioni generalizzate).
Gli spazi a base numerabile — per esempio R2 — si salvano. (Anche tutti gli spazi metrici in generale,
come vedremo nella Sezione 5.6 del Capitolo 5, hanno buona sorte.)
3.4. COMPATTEZZA VS COMPATTEZZA PER SUCCESSIONI 75

Definizione 3.4.1 (Compattezza per successioni). Uno spazio topologico X si dice compatto per
successioni se ogni successione in X ha una sottosuccessione convergente.
Esempio 3.4.2 (Compatto ma non per successioni). L’insieme [0, 1][0,1] è compatto per il Teorema
di Tychonoff ma non è compatto per successioni.
D IMOSTRAZIONE . Vi è una corrispondenza biunivoca tra sottoinsiemi di N e funzioni da N in
{0, 1}: Ad ogni X ⊆ N è associata la sua funzione caratteristica e ad ogni f : N → {0, 1} corrisponde
il sottoinsieme X = f −1 (1).
P x ∈ [0, 1] definiamo la successione (en (x))n∈N data dalla sua rappresentazione binaria,
Per ogni
cioè x = n en (x)2−n , con en (x) ∈ {0, 1}. Per ogni x fissato, la successione en (x) può essere vista
come funzione e(x) : N → [0, 1].
Per ogni n fissato, come funzione della variabile x, en (x) definisce una funzione en : [0, 1] → [0, 1],
cioè un elemento di [0, 1][0,1] . In particolare (en )n∈N è una successione in [0, 1][0,1] . Sia (nk )k∈N una
qualsiasi sottosuccessione di N. Consideriamo adesso l’insieme Y = {n2k : k ∈ N}. Esso corrispon-
−n2k
P
de al numero y = k∈N 2 e la successione enk (y) vale 1 per k pari e 0 per k dispari. Quindi
la sottosuccessione enk non converge nel punto y. Ne segue che (en ) ⊂ [0, 1][0,1] non ha nessuna
sottosuccessione convergente2. 

Esempio 3.4.3 (Compatto per successioni ma non compatto). Il primo ordinale non numerabile ω1 ,
dotato della topologia dell’ordine, è compatto per successioni ma non è compatto.
D IMOSTRAZIONE . La non compattezza di ω1 dipende dalla sua illimitatezza: per ogni x ∈ ω1 sia
Ux = [0, x). Chiaramente U = {Ux }x∈ω1 è un ricoprimento aperto che non ammette sottoricoprimenti
finiti. D’altronde, se (xn )n∈N è una successione in ω1 , essa è limitata perché ω1 non ha cofinalità
numerabile. Quindi il limsup di xn è un suo punto di accumulazione ed esiste xnk che tende al
lim sup xn . 

Esempio 3.4.4. Un esempio di spazio compatto per successioni ma non compatto, che non usi gli
ordinali è lo spazio dei sottoinsiemi al più numerabili di R, dotato della topologia prodotto indotta
dall’identificazione P(R) = {0, 1}R . (Si vedano gli esercizi guidati 3.6.57 e 3.6.58.)
Il busillis sta da un lato in questioni di cardinalità (come ben evidenzia il secondo esempio) dal-
l’altro in una sottile differenza tra le frasi “(xn ) ha un punto di accumulazione” e “(xn ) ha una sot-
tosuccessione convergente”, differenza che dipende dal tipo d’ordine dei sistemi fondamentali di
intorni dei punti: esistono spazi i cui punti non sono accessibili con successioni numerabili.
Definizione 3.4.5. Sia (xn ) una successione in uno spazio topologico X. Diciamo che:
• x ∈ X è un punto di ricorrenza di (xn ) se per ogni intorno U di x, la successione xn sta
frequentemente in U (cioè se per ogni n esiste m > n con xm ∈ U ).
• x ∈ X è un punto limite di (xn ) se esiste una sottosuccessione (xnk ) che converge a x.3
I punti limite sono chiaramente di ricorrenza, mentre un punto di ricorrenza di una successione
non è necessariamente un punto limite. Ciò però è vero negli spazi localmente numerabili.
Teorema 3.4.6 (Ricorrenza vs limiti). Sia (xn ) una successione in uno spazio topologico X e sia x un
punto di ricorrenza di (xn ). Se x ha un sistema fondamentale di intorni numerabile, allora esso è un punto
limite di (xn ). In particolare, negli spazi localmente numerabili, le nozioni di punto limite e di punto di
ricorrenza coincidono.

2La topologia prodotto è quella della convergenza puntuale.


3Alcuni autori usano la terminologia “punto di aderenza” per punto di ricorrenza e “punto di accumulazione” per punto
limite. In inglese si usa spesso “cluster point” per punto di ricorrenza.
76 3. COMPATTEZZA

D IMOSTRAZIONE . Sia {Ui }i∈N un sistema fondamentale di intorni di x. Definiamo Vn = U1 ∩


· · · ∩ Un . Chiaramente se m > n allora Vm ⊆ Vn e {Vn }n∈N è un sistema fondamentale di intorni
inscatolati di x. Siccome x è di ricorrenza per (xn ), esiste n1 tale che xn1 ∈ V1 . Per induzione esistono
numeri nk tali che nk+1 > nk , e tali che xnk ∈ Vk . Ne segue che xnk → x. 

Teorema 3.4.7 (Compatto vs ricorrenza di successioni). Sia (X, τ ) uno spazio topologico compatto.
Allora ogni successione in X ha un punto di ricorrenza.
D IMOSTRAZIONE . Sia
An = {xm : m ≥ n} ⊆ X.
Dire che esiste un punto di ricorrenza per (xn ) equivale a dire che ∩n An 6= ∅ (segue per esempio dal
Teorema 1.1.37). Siccome per m > n si ha ∅ 6= Am ⊆ An , la famiglia {An } è una famiglia di chiusi
con la proprietà delle intersezioni finite. Per compattezza (Lemma 3.3.2) l’intersezione dei An è non
vuota. 

Corollario 3.4.8. Uno spazio topologico localmente numerabile compatto è compatto per successioni.
D IMOSTRAZIONE . È un’immediata conseguenza dei Teoremi 3.4.7 e 3.4.6. 

Teorema 3.4.9. Sia X uno spazio topologico a base numerabile (per esempio uno spazio metrico separabile).
Allora X è compatto se e solo se è compatto per successioni.
D IMOSTRAZIONE . Essendo X a base numerabile, è anche localmente numerabile. Per il Corolla-
rio 3.4.8 se X è compatto allora è anche compatto per successioni. Vediamo il viceversa. Dimostriamo
che se X non è compatto allora esiste una successione senza sottosuccessioni convergenti. Sia U un
ricoprimento aperto di X che non ammette un sottoricoprimento finito. Per il Corollario 3.1.17, pos-
siamo supporre che U sia formato da aperti di una base e siccome X è a base numerabile, ci si può
sempre ricondurre al caso in cui U = {Un : n ∈ N} sia numerabile.
Per ogni n sia Vn = U1 ∪ · · · ∪ Un . Siccome U non ha sottoricoprimenti finiti, per ogni n ∈ N esiste
xn ∈/ Vn . Mostriamo ora che la successione (xn )n∈N non ha sottosuccessioni convergenti.
Sia x ∈ X. Siccome U è un ricoprimento, esiste m tale che x ∈ Vm . Per ogni n > m si ha Vn ⊇ Vm
e quindi xn ∈ / Vm . Ne segue che nessuna sottosuccessione di (xn ) può convergere a x. 

3.5. Locale compattezza e compattificazioni


Definizione 3.5.1. Uno spazio topologico si dice localmente compatto se ogni suo punto ha un
intorno compatto.
Esempio 3.5.2. Ogni spazio compatto è localmente compatto: esso è infatti un intorno compatto
di ogni suo punto.
Esempio 3.5.3. R2 Euclideo è localmente compatto: per ogni (x, y) ∈ R2 l’insieme [x − ε, x + ε] ×
[y − ε, y + ε] è un intorno compatto (perché prodotto di compatti) di (x, y).
Teorema 3.5.4. Un chiuso Y di un localmente compatto X è localmente compatto.
D IMOSTRAZIONE . Sia y ∈ Y ⊆ X. Esso ha un intorno V compatto in X. Siccome Y è chiuso,
Y ∩ V è chiuso in V , ergo compatto per il Teorema 3.1.19, ed è un intorno di y in Y . 

Vediamo adesso un po’ di esempi, tutti varianti del cosiddetto orecchino hawaiano. In R2 sia
Cn = ∂B((0, 2n ), 2n ) = {p ∈ R2 : ||p − (0, 2n )|| = 2n }.
Ogni Cn è un cerchio nel semipiano superiore, centrato sull’asse delle Y e che è tangente all’asse X
nell’origine. Se n > 0 il cerchio è grande, se n < 0 il cerchio è piccolo.
3.5. LOCALE COMPATTEZZA E COMPATTIFICAZIONI 77

Esempio 3.5.5 (Modello numero 1: orecchino hawaiano). M1 = ∪n<0 Cn . M1 è chiuso perché il


complementare
M1c = (B((0, 1/2), 1/2))c ∪n B((0, 1/2n ), 1/2n ) \ B((0, 1/2n+1 ), 1/2n+1 )


è unione di aperti. Inoltre M1 è contenuto in [−100, 100] × [−100, 100] — che è compatto — ergo per
il Teorema 3.1.19 è compatto. Quindi è anche localmente compatto.
Esempio 3.5.6 (Modello numero 2). M2 = ∪n∈Z Cn . Per ogni intorno U dell’origine si trova una
successione xn ∈ Cn ∩ U tale che xn converga a un punto x dell’asse X che non sia l’origine. In
particolare x ∈
/ M2 e xn non ha sottosuccessioni convergenti in M2 . Per il Teorema 3.4.9, U ∩ M2 non
è compatto. Quindi l’origine non ha nessun intorno compatto e M2 non è localmente compatto. In
particolare M2 non è omeomorfo a M1 .
Esempio 3.5.7 (Modello numero 3). M3 = M2 ∪ (R × {0}), cioè M2 più l’asse X. Questo è un chiuso
di R2 e quindi è localmente compatto per il Teorema 3.5.4. Non è compatto perché il ricoprimento
indotto dalle palle di raggio n centrate nell’origine non ha sottoricoprimenti finiti. In particolare non
è omeomorfo né a M1 né a M2 .
Esempio 3.5.8 (Modello numero 4: Giuditta!). Sia X = M2 ∪ {∞} con la seguente topologia: A è
aperto se e solo se A ⊆ M2 e A è aperto in M2 , oppure se A = X. X è compatto. Infatti se U = {Ui }
è un ricoprimento aperto di X esiste un aperto Ui che contiene il nuovo punto ∞, quindi Ui = X in
quanto X è l’unico aperto che contiene ∞. Quindi Ui è un sottoricoprimento finito di U.
Ne segue che X è anche localmente compatto. Notiamo però, che la patologia vicino a zero è
ancora presente: Se U 6= X è un intorno dell’origine, non esistono intorni compatti contenuti in U .
Questo strano comportamento non succede se lo spazio è T2 :
Teorema 3.5.9. Sia X uno spazio di Hausdorff localmente compatto. Allora ogni x ∈ X ha un sistema
fondamentale di intorni compatti.
D IMOSTRAZIONE . Dobbiamo dimostrare che per ogni intorno A che contiene x, esiste un intorno
compatto di x che sia contenuto in A. La strategia è riassunta in Figura 3. Sappiamo che x ha un

UK
B
A x
Ux

F IGURA 3. Come trovare un compatto x ∈ Ux ⊆ A (UK è l’unione della parte


tratteggiata e della parte grigia K = V \ B)

intorno compatto, che chiamiamo V . V è un compatto T2 perché X è T2 . Siccome A ∩ V è un intorno


di x, esiste un aperto B tale che x ∈ B ⊆ A ∩ V . L’insieme K = V \ B = V ∩ B c è chiuso in V , ergo
78 3. COMPATTEZZA

compatto per il Teorema 3.1.19. Siccome x ∈ / K, per il Teorema 3.1.22 esistono aperti Ux ⊆ V e UK
disgiunti tali che x ∈ Ux e K ⊆ UK . In particolare Ux è un intorno di x in X. Sia U la chiusura di Ux in
X. Esso è un intorno di x. Siccome V è un compatto in un T2 , V è anche chiuso per il Teorema 3.1.20
e siccome Ux ⊆ V , si ha U = Ux ⊆ V = V . Quindi
U ⊆V
e in quanto chiuso in un compatto, è compatto. Resta da dimostrare che U è contenuto in A. Siccome
K ⊆ UK si ha K c ⊇ UK c c
. Siccome UK c
è chiuso e Ux ⊆ UK si ha
c
U = Ux ⊆ UK ⊆ K c = (V ∩ B c )c = V c ∪ B
ma siccome U ⊆ V allora U ⊆ B. La tesi segue dal fatto che B ⊆ A ∩ V ⊆ A. 

Una prima conseguenza di questo fatto è la versione del Teorema della categoria di Baire per
spazi topologici.
Teorema 3.5.10. Sia X uno spazio topologico T2 e localmente compatto. Sia F = {Ai }i∈N una famiglia
numerabile di chiusi, ognuno dei quali con parte interna vuota. Allora l’unione ∪i Ai ha parte interna vuota.
In particolare X non è unione numerabile di chiusi a parte interna vuota.
D IMOSTRAZIONE . Siccome An ha parte interna vuota, per ogni aperto non vuoto B di X si ha
che B ∩ Acn 6= ∅. Sia B un aperto non vuoto e sia U1 ⊆ B un aperto non vuoto a chiusura compatta.
Esso esiste per il Teorema 3.5.9. Per quanto appena detto, l’aperto U1 \ A1 è non vuoto. Esso contiene
un aperto non vuoto U2 con chiusura compatta e contenuta in U1 \ A1 . L’insieme U2 \ A2 è aperto, non
vuoto e contenuto in U1 \ A1 . Ragionando ricorsivamente, si trova una famiglia di aperti a chiusura
compatta tali che U k+1 ⊆ Uk \ Ak , in particolare
U1 ⊇ U2 ⊇ U3 . . .
Gli insiemi U i sono compatti in un T2 ergo chiusi (Teorema 3.1.20). Siccome son tutti non vuoti, la
famiglia {U i } è una famiglia di chiusi con la proprietà delle intersezioni finite. Per compattezza di
U 1 , esiste x ∈ ∩i U i (Lemma 3.3.2). Siccome U k+1 ⊆ Ack , si ha x ∈ Aci per ogni i ∈ N, in particolare
x ∈ (∪i Ai )c . Siccome U 1 ⊆ B, si ha che x ∈ B ∩ (∪i Ai )c . Si è quindi dimostrato che ogni aperto
non vuoto interseca (∪i Ai )c , che quindi risulta essere denso, ergo il suo complementare ∪i Ai ha parte
interna vuota. 

Definizione 3.5.11. Sia X uno spazio topologico. Uno spazio topologico Y è una compattifica-
zione di X se è compatto e se esiste una immersione X → Y con immagine densa in Y .
In altre parole, uno spazio Y compatto è una compattificazione di X se X è omeomorfo a un
sottospazio denso di Y .
Esempio 3.5.12. S 1 è una compattificazione di R.
Esempio 3.5.13. [0, 1] è una compattificazione di R.
Esempio 3.5.14. S 2 è una compattificazione di R2 .
Esempio 3.5.15. D2 è una compattificazione di R2 .
Esempio 3.5.16 (Compattificazione ad peram). È quella di Giuditta (3.5.8). Sia (X, τ ) uno spazio
topologico e sia ∗ un nuovo elemento che non era già in X. Su P = X ∪ {∗} mettiamo la topologia
generata da τ , cioè gli aperti sono quelli di τ più il tutto P . In altre parole l’unico intorno di ∗ è P .
Questa topologia non è ovviamente T2 e X è denso in P . Inoltre P è compatto perché se U = {Ui }
è un ricoprimento aperto di P , allora esiste Ui che contiene ∗ ma allora Ui = P ed esso costituisce
quindi un sottoricoprimento finito di U.
3.5. LOCALE COMPATTEZZA E COMPATTIFICAZIONI 79

In realtà, ogni spazio topologico si può compattificare aggiungendo un solo punto in modo non ad
peram. Vediamo come. Sia (X, τ ) uno spazio topologico. Se X è compatto la sua compattificazione X b
è X stesso. Altrimenti, si aggiunge ad X un nuovo punto, che chiamiamo ∞, e si pone X b = X ∪ {∞}.
Si definisce una topologia τb su X dichiarando A ⊆ X aperto se e solo se
b b
A∈τ oppure Ac ⊆ X è un compatto chiuso in X
In altre parole: gli intorni di infinito sono i complementari dei compatti chiusi di X. (Si noti che se X
è T2 allora la condizione di essere chiuso è automatica.)
Lemma 3.5.17. Se (X, τ ) è uno spazio topologico allora τb è una topologia su X,
b che induce τ su X.

D IMOSTRAZIONE . Notiamo in primis che se A ∈ τb allora Ac ∩ X è sempre un chiuso di X; in


particolare le intersezioni di elementi di τb con X sono aperti di τ , quindi τb induce τ su X. Vediamo
che τb è una topologia.
∅, Xb ∈ τb per come son definiti gli aperti di X.
b Dimostriamo che τb è chiusa per intersezione. Siano
A, B ∈ τb; se entrambi sono elementi di τ allora A ∩ B ∈ τ ⊆ τb. Se ∞ ∈ A ∩ B, allora i complementari
di A e B sono compatti chiusi e quindi anche (A ∩ B)c = Ac ∪ B c lo è. Infine se ∞ appartiene a solo
uno dei due allora A ∩ B = A ∩ B ∩ X è comunque un aperto di τ , ergo di τb.
Vediamo che τb è chiusa per unione qualsiasi. Sia {Ai } ⊆ τb. Se tutti gli Ai ∈ τ ovviamente
∪Ai ∈ τ ⊆ τb. Se esiste Ak che contiene ∞ allora Ack è un compatto contenuto in X. Per cui (∪Ai )c =
∩Aci = Ack ∩ (∩i6=k Ack ) è intersezione di un compatto chiuso e di una famiglia di chiusi in X. Quindi
è chiuso in X e, in quanto chiuso in un compatto, compatto (per il Teorema 3.1.19). Dunque il suo
complementare ∪i Ai sta in τb. 
Definizione 3.5.18. La compattificazione di Alexandroff di uno spazio topologico (X, τ ) è lo
b τb) appena descritto.4
spazio (X,
Teorema 3.5.19. Sia X uno spazio topologico. Allora X
b è compatto e X è denso in X.
b Inoltre, X
b è T2 se
e solo se e X è T2 e localmente compatto.
D IMOSTRAZIONE . Sia U un ricoprimento aperto di X. b Esiste U ∈ U che contiene ∞. Da cui segue
che U c è compatto. Chiaramente U ricopre U c e quindi ammette un sottoricoprimento finito V, come
ricoprimenti di U c . La famiglia V ∪ {U } è un sottoricoprimento (di X)
b finito di U.
Siccome un chiuso in un compatto è compatto, la chiusura di X è compatta. Se X non è compatto
allora X 6= X e quindi l’unica possibilità è che X contenga anche ∞ e quindi coincida con X. b
Supponiamo che X sia T2 . Allora per ogni x, y ∈ X esistono Ux , Uy aperti disgiunti in X
b b con
x ∈ Ux , y ∈ Uy . Gli insiemi Ux ∩ X, Uy ∩ X sono quindi aperti disgiunti in X che separano x, y.
Quindi X è T2 . Per dimostrare la locale compattezza, si osservi che ogni x è separato da ∞ in X; b in
c
particolare esiste un aperto U∞ che contiene ∞ e un intorno aperto Ux di x tale che Ux ⊆ U∞ . Ne
c
segue che U∞ — che per definizione è compatto — è un intorno compatto di x.
Viceversa se X è T2 e localmente compatto, mostriamo che X b è T2 . Dati x, y ∈ X essi sono separati
da aperti in X e quindi anche in X. Supponiamo quindi x ∈ X e y = ∞. Siccome X è localmente
b
compatto, x ha un intorno compatto K ⊆ X. Siccome X è T2 i compatti sono automaticamente chiusi.
Ne segue che Int(K) e K c sono aperti di X b che separano x da ∞. 
La compattificazione di Alexandroff è sostanzialmente unica.
Teorema 3.5.20. Sia (X, τ ) uno spazio topologico non compatto e sia (X, b τb) la sua compattificazione
di Alexandroff. Sia ora σ un’altra topologia compatta su X che coincida con τ su X. Se (X,
b b τb) è T2 allora
l’identità da (X,
b τb) a (X,
b σ) è continua. Se inoltre anche (X,
b σ) è T2 allora l’identità è un omeomorfismo.

4La notazione X
b non è standard. (Per esempio è diffusa anche la notazioneX ∗ .)
80 3. COMPATTEZZA

In altre parole, se X è T2 e localmente compatto, allora la compattificazione di Alexandroff è l’unica


compattificazione T2 di X in cui il complementare di X è un sol punto (a meno di omeomorfismi).
In altre parole ancora, se X è T2 e localmente compatto, allora τb è la topologia più fine su X
b tra quelle
compatte che contengono τ , e tra esse è l’unica T2 .

D IMOSTRAZIONE . L’identità da (X, b τb) in (X,


b σ) è continua se e solo se σ è meno fine di τb. Sia
A ∈ σ. Se A ⊆ X allora A ∈ τ ⊆ τb e siamo a posto. Altrimenti A contiene ∞. Il complementare di A,
che è contenuto in X, è quindi un chiuso di σ. Siccome (X, b σ) è compatto, Ac è compatto. Ma siccome
c
X è T2 allora A è anche chiuso in X, ergo A ∈ τb.
Se anche (X,
b σ) è T2 allora per il Teorema 3.2.1 (del Compatto-Hausdorff) l’indentità è automati-
camente un omeomorfismo. 

Esempio 3.5.21. La compattificazione di Alexandroff di R2 è S 2 . Infatti è una compattificazione T2


fatta aggiungendo un sol punto a R2 .
Esempio 3.5.22. La compattificazione di Alexandroff di C è CP1 . Infatti è una compattificazione
T2 fatta aggiungendo un sol punto a C.
Si noti che da ciò si deduce che, siccome C è omeomorfo a R2 , allora CP1 è omeomorfo a S 2 .
Esempio 3.5.23. La compattificazione di Alexandroff di Rn è S n .

Teorema 3.5.24. Sia X


b la compattificazione di Alexandroff di uno spazio topologico T2 localmente com-
patto ma non compatto. Sia Y ⊆ X chiuso. Allora Yb è la chiusura di Y in X b e se Y non è compatto,
Yb = Y ∪ {∞}.

D IMOSTRAZIONE . Y è compatto e quindi è una compattificazione di Y . Siccome X b è T2 anche


Y lo è. Siccome Y è chiuso in X, se Y non è compatto allora è diverso da Y e quindi Y = Y ∪ {∞}.
Quindi Y è una compattificazione T2 di Y in cui il complementare di Y è un punto. Ergo Y = Yb . 

Esempio 3.5.25. Le compattificazioni di sottoinsiemi chiusi A ⊆ R2 si possono fare in S 2 = CP1 .


Un altro modo di fare le compattificazioni di Alexandroff di sottoinsiemi di Rn è attraverso il
seguente teorema.
Lemma 3.5.26. Sia X uno spazio localmente compatto e sia Y uno spazio T2 . Allora ogni immersione
topologica f : X → Y con immagine densa è aperta.
D IMOSTRAZIONE . Siccome f è un’immersione, X è omeomorfo a f (X). Possiamo quindi limi-
tarci al caso in cui X sia un sottospazio denso di Y e f sia l’inclusione naturale. Ogni aperto di X è
l’intersezione con X di un aperto di Y . Ci basta quindi dimostrare che X è un aperto di Y .
Sia x ∈ X. Per locale compattezza, esistono un compatto K ⊆ X e un aperto U di X tali che
x ∈ U ⊆ K. Inoltre esiste un aperto V di Y tale che U = V ∩ X. In particolare V ∩ X ⊆ K ⊆ X.
Quindi U = V ∩ X = V ∩ X ∩ K = V ∩ K e da
(V ∩ X) t (V ∩ X c ) = V = (V ∩ K) t (V ∩ K c ) = U t (V ∩ K c ) = (V ∩ X) t (V ∩ K c )
si deduce che V ∩ K c = V ∩ X c ⊆ X c .
Siccome K è compatto in un T2 allora è chiuso, per cui V ∩ K c è un aperto di Y contenuto in X c .
Siccome X è denso il complementare ha parte interna vuota, dunque V ∩ K c = ∅ e V = V ∩ X = U è
aperto in Y . Ne segue che ogni x ∈ X è interno a X. 

Teorema 3.5.27. Sia X uno spazio localmente compatto e sia Y una sua compattificazione T2 . Allora
X = Y /X c . In altre parole la compattificazione di Alexandroff di X si ottiene collassando a un punto X c .
b
3.6. ESERCIZI 81

D IMOSTRAZIONE . Siccome X si immerge in Y possiamo supporre X ⊆ Y = X. Per il Lem-


ma 3.5.26 X è aperto in Y . In particolare X c = ∂X è un chiuso. Ne segue che la proiezione al
quoziente Y → Y /X c è chiusa (il saturato di un chiuso A è A oppure A ∪ ∂X, quindi è chiuso). Sic-
come Y è compatto, per il Corollario 3.1.26, Y /X c è un compatto T2 . Chiaramente esso contiene una
copia di X, il cui complementare è un punto (la classe di X c ). Per il Teorema 3.5.20 X
b = Y /X c . 

Corollario 3.5.28. Sia Y uno spazio T2 . Sia X un sottoinsieme localmente compatto di Y . Se X è


compatto, allora la compattificazione di Alexandroff di X è X/(X \ X).
D IMOSTRAZIONE . Segue dal Teorema 3.5.27 in quanto X è una compattificazione T2 di X. 
Esempio 3.5.29. Sia X = {(x, y) ∈ R2 : 1 < x2 + y 2 < 4}. X è una corona circolare aperta.
Esso è localmente compatto perché per ogni P ∈ X, per ε sufficientemente piccolo B(P, ε) ⊂ X
è un intorno compatto di P . Inoltre R2 è T2 . Quindi basta considerare la corona circolare chiusa
X = {(x, y) ∈ R2 : 1 ≤ x2 + y 2 ≤ 4} e X
b = X/∂X è una sfera con due punti identificati.

3.6. Esercizi
Esercizio 3.6.1. Si dimostri che RPn è compatto.
Esercizio 3.6.2. Dimostrare che R con la topologia di Zariski è compatto per successioni.
Esercizio 3.6.3. Si dimostri che R2 con la metrica dei raggi non è compatto.

Esercizio 3.6.4. Si dica se B (0, 0), 1 in R2 con la metrica dei raggi è compatto.

Esercizio 3.6.5. Si dica se B (10, 10), 1 in R2 con la metrica dei raggi è compatto.
Esercizio 3.6.6. Si dica se [0, 1]2 in R2 dotato della metrica dei raggi è compatto.
Esercizio 3.6.7. Si dica se R2 con la metrica dei raggi è localmente compatto.
Esercizio 3.6.8. Si dica se R2 con la topologia dell’ordine lessicografico è compatto.
Esercizio 3.6.9. Si dica se R2 con la topologia dell’ordine lessicografico è localmente compatto.
Esercizio 3.6.10. Si dica se [0, 1]2 con la topologia dell’ordine lessicografico è compatto.
Esercizio 3.6.11. [0, 1]2 con la topologia dell’ordine lessicografico è localmente compatto?
Esercizio 3.6.12. Si dica se la topologia del punto particolare (Esercizio 1.1.11) è compatta.
Esercizio 3.6.13. Sia X uno spazio topologico e sia K ⊆ X un sottospazio compatto di X. Si dica
se è sempre vero che la chiusura di K in X è compatta.
Esercizio 3.6.14. Sia X uno spazio compatto T2 e sia A ⊆ X chiuso. Dimostrare che X/A è T2 .
Esercizio 3.6.15. Siano K1 , K2 compatti di uno spazio T2 . Dimostrare che K1 ∩ K2 è compatto.
Esercizio 3.6.16. È sempre vero che intersezione di compatti è compatto?
Esercizio 3.6.17. Sia X uno spazio T2 e sia {Ki , i ∈ I} una famiglia di compatti di X. È vero che
∩i Ki è compatto?
Esercizio 3.6.18. Si dica se un aperto di uno spazio localmente compatto è sempre localmente
compatto.
Esercizio 3.6.19. Si dica se un aperto di uno spazio T2 e localmente compatto è sempre localmente
compatto.
82 3. COMPATTEZZA

Esercizio 3.6.20. È vero che l’intersezione di due spazi localmente compatti è localmente compat-
ta?
Esercizio 3.6.21. Dimostrare che il prodotto di due spazi localmente compatti è localmente com-
patto.
Esercizio 3.6.22. Sia A = {2n : n ∈ Z} e sia X = A × R ⊂ R2 . (X è una successione di rette
verticali che si accumulano sull’asse Y .) Si dimostri che X è localmente compatto.
Esercizio 3.6.23. Dimostrare che il quoziente di R2 per la relazione d’equivalenza generata da
v ∼ 2v è compatto.
Esercizio 3.6.24. In R2 sia ∼ la relazione d’equivalenza generata da (x, y) ∼ (2x, 2y) e (x, y) ∼
0
(x , y). Si dica se R2 / ∼ è compatto. Detto P = {(x, y) ∈ R2 : y > 0} si dica se P/ ∼ è compatto. Si
dimostri che R2 / ∼ non è una varietà topologica. Si dimostri che P/ ∼ è una varietà topologica e se
ne calcoli la dimensione.
Esercizio 3.6.25. Sia X un insieme e siano τ, σ due topologie T2 e compatte su X. Dimostrare che
se una è più fine dell’altra allora τ = σ.
Esercizio 3.6.26. Si dia un esempio di un insieme X con due topologie τ e σ, entrambe T2 e
compatte ma tali che (X, τ ) non sia omeomorfo a (X, σ).
Esercizio 3.6.27. Si dimostri che sugli insiemi finiti la discreta è l’unica topologia compatta e T2 .
Sugli insiemi finiti vi sono topologie non compatte?
Esercizio 3.6.28. Siano τ, σ due topologie su uno stesso insieme X. Supponiamo che τ ⊆ σ. Di-
mostrare che se X è compatto per σ allora è compatto anche per τ . Fornire un esempio per cui il
viceversa non vale.
Esercizio 3.6.29. Sia R con la topologia generata dagli intervalli del tipo [a, b). Si dica se [0, 1] è
compatto per tale topologia.
Esercizio 3.6.30. Sia X = R e sia {Kn } ⊂ P(R) una famiglia di chiusi tali che Kn+1 ⊆ Kn . È vero
che ∩n Kn 6= ∅? Lo si dimostri o si fornisca un controesempio.
Esercizio 3.6.31. Ripercorrere la dimostrazione del Lemma 3.3.2 con X = R e An = [n, ∞) per
vedere cosa va storto.
Esercizio 3.6.32. Provare a seguire passo passo la dimostrazione del Teorema 3.5.9 con Giuditta
(Esempio 3.5.8) per vedere dove falla.
Esercizio 3.6.33. Sia Q = {(x, y) ∈ R2 : |x|+|y| ≤ 1} e sia X = {(x, y) ∈ R2 : |x|+|y| ≤ 1, x+y < 1}
(Q è un quadrato pieno e X è Q meno un lato). Sia X b la compattificazione di Alexandroff di X. Si
dimostri che X = Q è omeomorfo a X. b

Esercizio 3.6.34. In R2 consideriamo il seguente “orecchino hawaiano modificato” (si veda l’Esem-
pio 3.5.5 per la definizione di M1 ): X = M1 ∪ (R × {0}) (cioè M1 più l’asse delle ascisse). Si dica se
X è omeomorfo a M1 , M2 , M3 o a nessuno di essi. Si dica se la sua compattificazione di Alexandroff
è omeomorfa a M1 .
Esercizio 3.6.35. Si descrivano le compattificazioni degli orecchini hawaiani modello due e tre. Si
dica se sono omeomorfe tra loro o no.
Esercizio 3.6.36. In R2 sia X = {x2 + y 2 < 1}. Se ne determini la compattificazione di Alexandroff.
Esercizio 3.6.37. In R2 sia X = {x2 +y 2 < 1}∪{(1, 0)}. Si studi la compattificazione di Alexandroff
di X.
3.6. ESERCIZI 83

Esercizio 3.6.38. In R2 sia X = {x2 + y 2 < 1} ∪ {x2 + y 2 = 1, y ≥ 0}. Si studi la compattificazione


di Alexandroff di X.
Esercizio 3.6.39. In R2 sia X = {x2 + y 2 < 1} ∪ {x2 + y 2 = 1, y > 0}. Si studi la compattificazione
di Alexandroff di X.
Esercizio 3.6.40. Si dimostri che lo spazio R/Z dell’Esempio 2.2.11 non è localmente compatto. Se
ne deduca che non è omeomorfo all’orecchino hawaiano.
Esercizio 3.6.41. Sia Cn = ∂B((0, 2n ), 2n ) la famiglia di cerchi usata per costruire l’orecchino ha-
waiano. Sia M1 = ∪n<0 Cn e sia X = ∪n>0 Cn . Sia f : M1 → X la funzione che manda Cn in C−n
tramite un’omotetia. Dimostrare che la restrizione di f a ogni Cn è continua ma f non è continua da
M1 a X. Di dimostri che l’inversa di f è continua da X a M1 .
2
Esercizio 3.6.42. In R2 sia X l’immagine di (0, ∞) tramite f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Si dimostri che la compattificazione di Alexandroff di X è omeomorfa a S 1 . Se ne deduca che non è
omeomorfa a X.
Esercizio 3.6.43. Dimostrare che si può ottenere una sfera come quoziente di un toro.
Esercizio 3.6.44. Dimostrare che si può ottenere un toro come quoziente di una sfera.
Esercizio 3.6.45. Si dimostri che ogni sottoinsieme aperto dell’insieme di Cantor è localmente
compatto.

Esercizio 3.6.46. È vero che ogni sottoinsieme dell’insieme di Cantor è localmente compatto?
Esercizio 3.6.47. Si dica se la proiezione canonica R3 \ {0} → RP2 è propria.
Esercizio 3.6.48. Sia X = GL(2, R) lo spazio delle matrici reali 2 × 2 invertibili, con la topologia
data dall’identificazione dello spazio delle matrici 2 × 2 con R4 . Si dimostri che la funzione f : X → R
data da f (M ) = det(M ) è continua. Se ne deduca che X non è compatto.
Esercizio 3.6.49. Sia X = O(2) lo spazio delle matrici reali 2 × 2 ortogonali. Si dimostri che X è
compatto.
Esercizio 3.6.50. Sia X lo spazio delle isometrie di R2 , con la topologia compatto-aperta (Esem-
pio 1.2.20 ove K è la famiglia dei compatti). Si dimostri che X non è compatto.
Esercizio 3.6.51. Sia X lo spazio delle isometrie di R2 , con la topologia compatto-aperta (Esem-
pio 1.2.20 ove K è la famiglia dei compatti). Si dimostri che l’applicazione ϕ : X → R2 data da
ϕ(g) = g(0, 0) è continua e propria.
Esercizio 3.6.52. Siano A, B ⊆ R compatti. Dimostrare che l’insieme AB = {ab : a ∈ A, b ∈ B} è
un compatto di R.
Esercizio 3.6.53. Siano A, B ⊆ R2 compatti. Dimostrare che l’insieme A−B = {a−b : a ∈ A, b ∈ B}
è un compatto di R2 .
Esercizio 3.6.54. Siano A, B ⊆ R3 compatti. Dimostrare che l’insieme S = {sin(||a||)b : a ∈ A, b ∈
B} è un compatto di R3 .
Esercizio 3.6.55. Sia X uno spazio T2 e sia K ⊆ X un sottospazio localmente compatto. Dimostrare
che K è aperto in K.
Esercizio 3.6.56. Si fornisca un esempio di un sottoinsieme A di R2 Euclideo tale che A non sia
aperto in A.
84 3. COMPATTEZZA

Esercizio 3.6.57. Sia D = {0, 1} dotato della topologia discreta. Consideriamo P(R) identificato
con DR = {f : R → {0, 1}}, dotato della topologia prodotto. Sia K la famiglia dei sottoinsiemi al più
numerabili di R. Per ogni a ∈ R sia Ua = {A ∈ P(R) : a ∈ / A}. Dimostrare che Ua è aperto in DR .
Dimostrare che U = {Ua }a∈R ricopre K. Dimostrare che U non ha sottoricoprimenti finiti e dedurne
che K non è compatto.
Esercizio 3.6.58. Sia K come nell’Esercizio 3.6.57. Sia (Xn )n∈N una successione in K. Dimostrare
che esiste X tale che Xn → X. Dedurne che K è compatto per successioni. (Suggerimento: l’insieme
S = ∪n Xn è al più numerabile. A questo punto, interpretando gli Xn come funzioni fn che valgono
zero fuori da S, e numerando S, si usi un argomento diagonale per trovare una sottosuccessione fnk
tale che per ogni x ∈ S si ha che fnk (x) sia definitivamente costante.)
CAPITOLO 4

Connessione

4.1. Connessione
Definizione 4.1.1. Uno spazio topologico X si dice connesso se gli unici suoi sottoinsiemi con-
temporaneamente aperti e chiusi sono il vuoto e tutto X.
Vale la pena osservare che dal Teorema 1.1.37 segue che un insieme è contemporaneamente aper-
to e chiuso se e solo se la sua frontiera è vuota. La connessione si può esprimere in molti modi
equivalenti:
• X è connesso se ∅ =
6 A ⊆ X è aperto e chiuso allora A = X.
• X è connesso se per ogni A ⊆ X, (∂A = ∅) ⇒ (A = X) ∨ (A = ∅).
• X è connesso se X = A t B con A non vuoto e aperto implica B non aperto o vuoto.
• X è connesso se X = A t B con A, B entrambi aperti implica A oppure B vuoto.
• X è connesso se X = A t B con A, B entrambi aperti implica A vuoto oppure A = X.
6 A ⊆ X con Ac 6= ∅ e ∂A = ∅.
• X non è connesso se esiste ∅ =
6 A ⊆ X aperto e chiuso con Ac 6= ∅.
• X non è conneso se esiste ∅ =
• X non è connesso se esiste A ⊆ X con A, Ac non vuoti ed entrambi aperti.
• X non è connesso se esiste A ⊆ X con A, Ac non vuoti ed entrambi chiusi.
• X non è connesso se X = A t B con A, B entrambi non vuoti e aperti.
• X non è connesso se X = A t B con A, B entrambi non vuoti e chiusi.
• X non è connesso se esiste ∅ =6 A ( X con con ∂A = ∅.
Si noti che la connessione, come la compattezza, è una proprietà topologica intrinseca di uno
spazio, cioè un invariante topologico: se X e Y sono omeomorfi e X è connesso allora anche Y lo
è. In particolare se A ⊂ X ma anche A ⊂ Y il fatto che A sia connesso o meno dipende solo dalla
topologia di A e non da quale sia lo spazio di cui è sottospazio.
Esempio 4.1.2. Un punto è sempre connesso: Gli unici suoi sottoinsiemi sono il vuoto e il tutto.
Esempio 4.1.3. In R Euclideo l’insieme X = (0, 1) ∪ (3, 4) è sconnesso. Infatti in X l’insieme (0, 1)
è aperto in X e il suo complementare (3, 4) pure.
Esempio 4.1.4. In R Euclideo l’insieme X = (0, 1] ∪ (3, 4] è sconnesso. Infatti in X l’insieme (0, 1]
è aperto in X e il suo complementare (3, 4] pure.
Esempio 4.1.5. Se X ha almeno due punti ed è dotato della topologia discreta allora non è connes-
so. Infatti in questo caso i punti sono aperti e chiusi.
Esempio 4.1.6. Sia X = {a, b} con la topologia τ = {∅, {a}, X}. (Si verifichi che questa è una
topologia.) Allora X è connesso. Infatti gli unici sottoinsiemi di X diversi dal vuoto e X sono i punti
{a}, {b}. {a} è aperto ma il suo complementare no. Ne segue che nessuno dei due è aperto e chiuso.
Esempio 4.1.7. Se X è dotato della topologia banale allora è connesso. Infatti gli unici suoi
sottoinsiemi aperti sono il vuoto e il tutto.
Esempio 4.1.8. R con la topologia cofinita è connesso. Infatti non ci sono sottoinsiemi di R che
siano contemporaneamente finiti e cofiniti.
85
86 4. CONNESSIONE

√ √
Esempio 4.1.9. Q ⊂ R non è connesso. Infatti Q = (−∞, 2) t ( 2, +∞) è unione di due aperti
non vuoti e disgiunti.
Esempio 4.1.10. Z ⊂ R non è connesso. Infatti Z = (−∞, 1/2) t (1/2, +∞) è unione di due aperti
non vuoti e disgiunti. Oppure perché la topologia indotta da R su Z è quella discreta, e Z ha almeno
due punti.
Esempio 4.1.11. R con la topologia del limite destro (Esempio 1.2.14) non è connesso. Infatti R =
(−∞, 0) ∪ [0, ∞) è unione disgiunta di due aperti non vuoti.
Teorema 4.1.12. R con la topologia Euclidea è connesso.
D IMOSTRAZIONE . Sia ∅ =6 A ⊆ R aperto e chiuso e dimostriamo che in tal caso A = R. Sia a ∈ A.
Introduciamo il seguente sottoinsieme di R+
X = {t ≥ 0 : [a − t, a + t] ⊆ A}.
Sia t0 l’estremo inferiore del complementare di X in R+ , ponendo t0 = ∞ se X = R+ . Si noti che
0 ∈ X. Inoltre, siccome A è aperto, per ogni x ∈ A esiste ε > 0 tale che (x − ε, x + ε) ⊂ A. Ne segue
che se t ∈ X allora esiste ε > 0 tale che t + ε ∈ X. Ciò implica che
0 < t0 ∈
/ X.
Per ogni s < t0 si ha [a − s, a + s] ⊂ A, in particolare (a − t0 , a + t0 ) ⊆ A. Siccome A è chiuso, se t0 < ∞
allora avremmo [a − t0 , a + t0 ] ⊆ A e quindi t0 ∈ X in contraddizione con quanto appena dimostrato.
Quindi t0 = ∞ e dunque A = R. 
Corollario 4.1.13. Ogni intervallo aperto (a, b) è connesso.
D IMOSTRAZIONE . (a, b) è omeomorfo a R. 
Teorema 4.1.14 (Immagine di un connesso è connesso). Sia f : X → Y una applicazione continua e
suriettiva tra spazi topologici. Se X è connesso allora anche Y lo è.
D IMOSTRAZIONE . Sia ∅ 6= A ⊆ Y aperto e chiuso. Si deve dimostrare che Y = A. L’insieme
f −1 (A) è aperto e chiuso perché f è continua. Inoltre, esso è non vuoto perché f è suriettiva. Siccome
X è connesso f −1 (A) = X e siccome f è suriettiva A = f (f −1 (A)) = f (X) = Y . 
Corollario 4.1.15. Sia f : X → Y un’applicazione continua tra spazi topologici. Se A ⊆ X è connesso
allora f (A) è connesso.
D IMOSTRAZIONE . Basta applicare il Teorema 4.1.14 con f |A : A → f (A). 
Corollario 4.1.16. I quozienti di spazi connessi sono connessi.
D IMOSTRAZIONE . Segue dal Teorema 4.1.14 perché la proiezione naturale sul quoziente è conti-
nua. 
Esempio 4.1.17. Sia ∼ la relazione di equivalenza su R data da
x ∼ ±x tranne 57 che non è equivalente a − 57
In pratica si è ripiegato in due R identificando x a −x tranne il punto 57 che rimane doppio: c’è
57 e −57. Questo spazio sembra non connesso perché sembra fatto da almeno due pezzi. Invece è
connesso perché quoziente di un connesso. Non è T2 . (Perché?)
Il Teorema 4.1.14 fornisce una caratterizzazione di insiemi connessi che può risultare utile.
Teorema 4.1.18. Uno spazio topologico X è connesso se e solo se ogni funzione continua da X in uno
spazio discreto è costante.
4.1. CONNESSIONE 87

D IMOSTRAZIONE . Supponiamo X connesso, sia D uno spazio discreto e sia f : X → D continua.


Per il Teorema 4.1.14, f (X) è connesso. Ma se D è discreto allora ogni suo sottoinsieme con almeno
due punti non è connesso. Ne segue che f (X) contiene un sol punto, i.e. f è costante.
Se invece X non è connesso, allora X = A t B con A, B entrambi aperti, chiusi e non vuoti. La
seguente funzione f : X → {0, 1} è continua e non costante:

 0 x∈A
f (x) =
 1 x∈B

Esempio 4.1.19. Sia X = GL(n, R) l’insieme delle matrici invertibili, con la topologia indotta dal-
2
l’identificazione dello spazio delle matrici n × n con Rn . Allora X è sconnesso. Infatti la funzione
f (A) = det(A)/| det(A)| è continua, non costante e a valori nel discreto {1, −1}.
Teorema 4.1.20 (Chiusura di un connesso è connesso). Sia X uno spazio topologico e sia A ⊆ X. Se
A è connesso allora la chiusura di A in X è connessa.
D IMOSTRAZIONE . Sia ∅ = 6 B ⊆ Ā aperto e chiuso in Ā. Si deve dimostrare che B = Ā. B ∩ A
è aperto e chiuso in A. Sicccome A è denso in Ā (Corollario 1.4.10) e siccome B è aperto in Ā, si ha
B ∩ A 6= ∅. Siccome A è connesso, si ha B ∩ A = A. Quindi A ⊆ B. Siccome B è chiuso in Ā che è
chiuso in X, per il Teorema 1.4.3 esso è chiuso in X. Quindi, contenendo A, contiene la sua chiusura.
Riassumendo
B ⊆ Ā ⊆ B
ergo B = Ā. 

Corollario 4.1.21. Se uno spazio topologico contiene un sottoinsieme denso e connesso, allora è connesso.
D IMOSTRAZIONE . Segue immediatamente dal Teorema 4.1.20. 

Corollario 4.1.22. Ogni intervallo chiuso [a, b] ⊆ R è connesso.


D IMOSTRAZIONE . (a, b) è denso in [a, b] ed è connesso (Corollario 4.1.13). Il Teorema 4.1.20 si
applica. 

Esercizio 4.1.23. Dimostrare che ogni intervallo (di qualsiasi tipo) di R è connesso.
Teorema 4.1.24. I connessi di R sono tutti e soli gli intervalli.
D IMOSTRAZIONE . Gli intervalli son connessi per l’esercizio precedente che è stato sicuramente
fatto. Se A ⊆ R non è un intervallo allora ha almeno due punti a, b tali che esista c ∈ (a, b) che non
stia in A. Ma allora A = (A ∩ (−∞, c)) t (A ∩ (c, ∞)) è unione di due aperti non vuoti e disgiunti. 

Corollario 4.1.25 (Teorema del valor intermedio). Sia X uno spazio connesso e sia f : X → R una
funzione continua. Per ogni x, y ∈ X con f (x) < f (y) esiste z ∈ X tale che f (x) < f (z) < f (y).
D IMOSTRAZIONE . Per il Corollario 4.1.15 l’immagine di f è un connesso di R, quindi un inter-
vallo, che contiene (f (x), f (y)). La tesi segue. 

Teorema 4.1.26 (Unione di connessi non disgiunti è connessa). Sia X uno spazio topologico e sia
{Ai }i∈I una famiglia di sottoinsiemi di X. Supponiamo che
(1) ogni Ai sia connesso;
(2) Ai ∩ Aj 6= ∅ per ogni i, j ∈ I.
Allora ∪i Ai è connesso.
88 4. CONNESSIONE

D IMOSTRAZIONE . Sia ∅ = 6 A ⊆ ∪Ai aperto e chiuso. Si deve dimostrare che A coincide con ∪Ai .
Per ogni i ∈ I si ha che A ∩ Ai è aperto e chiuso in Ai . Siccome Ai è connesso allora A ∩ Ai è vuoto
oppure e tutto Ai . Siccome A 6= ∅ esiste i ∈ I tale che A ∩ Ai 6= ∅ e dunque A ∩ Ai = Ai . Cioè Ai ⊆ A.
Per ogni altro j ∈ I si ha A ∩ Aj ⊇ Ai ∩ Aj . Ma Ai ∩ Aj 6= ∅ per ipotesi. Ne segue che per ogni j ∈ I
si ha A ∩ Aj = Aj e quindi A = ∪Ai . 
Corollario 4.1.27. Sia X uno spazio topologico e sia {Ai }i∈I una famiglia di sottoinsiemi connessi di X.
Se esiste i0 ∈ I tale che per ogni i ∈ I si ha Ai0 ∩ Ai 6= ∅, allora ∪i Ai è connesso.
D IMOSTRAZIONE . Si noti che le ipotesi implicano che Ai0 6= ∅. Per ogni i ∈ I sia Bi = Ai0 ∪
Ai . Per il Teorema 4.1.26 Bi è connesso. Inoltre per ogni i, j ∈ I si ha Bi ∩ Bj ⊇ Ai0 6= ∅. Per il
Teorema 4.1.26 ∪Bi è connesso e chiaramente ∪Bi = ∪Ai . 
Teorema 4.1.28. Siano A, B spazi topologici non vuoti. Allora A × B è connesso se e solo se A e B lo
sono.
D IMOSTRAZIONE . Se A × B è connesso, allora per il Teorema 4.1.14 sia A che B lo sono poiché le
proiezioni naturali sui fattori sono continue. Viceversa, supponiamo che sia A che B siano connessi.
Per ogni (a, b) ∈ A × B si definisca X(a,b) = ({a} × B) ∪ (A × {b}). Siccome {a} × B è omeomorfo a
B, esso è connesso e lo stesso dicasi per A × {b}; la loro intersezione è il punto (a, b) ergo non vuota.
Per il Teorema 4.1.26, X(a,b) è connesso. Si noti che (a, b) ∈ X(a,b) . (Intuitivamente, l’insieme X(a,b)
si può immaginare come un sistema di assi centrato in (a, b).) Per ogni (a, b), (c, d) ∈ A × B si ha
(c, b) ∈ X(a,b) ∩ X(c,d) 6= ∅. Ovviamente A × B = ∪(a,b)∈A×B X(a,b) e quindi per il Teorema 4.1.26 esso
risulta connesso. 
Corollario 4.1.29. R2 è connesso. Rn è connesso. Cn è connesso.
Anche se sembra una facile generalizzazione del Teorema 4.1.28, il seguente risultato richiede una
buona dose di lavoro extra.
Teorema 4.1.30. Sia {Xi }i∈I una famiglia di spazi topologici connessi. Allora il prodotto Πi Xi è connes-
so.
D IMOSTRAZIONE . Per induzione sul numero dei fattori — usando il Teorema 4.1.28 come passo
induttivo — sappiamo che ogni prodotto finito di Xi è connesso.
Se Πi Xi = ∅ allora non v’è nulla da dimostrare (e può succedere senza assioma di scelta!) Al-
trimenti sia O = (Oi )i∈I ∈ Πi Xi (quindi ogni Oi sta in Xi ). In analogia con la dimostrazione pre-
cedente consideriamo la famiglia dei sistemi di piani coordinati centrati in O. In termini rigorosi,
consideriamo
F = {J ⊆ I : J ha cardinalità finita}

 {O } i ∈ /J
i
∀J ∈ F sia AJ = Πi Yi ove Yi =
 X i∈J
i

In soldoni, Aj è l’insieme dei punti le cui coordinate differiscono da O solo per gli indici J. Per
esempio, se consideriamo R3 = Rx × Ry × Rz e O = (0, 0, 0), abbiamo che se J = {x}, allora AJ è
l’asse X; se J = {x, y} allora AJ è il piano XY , se J = {x, y, z} allora AJ = R3 .
Per definizione AJ contiene il punto O per ogni J ∈ F. Inoltre AJ è omeomorfo a Πi∈J Xi e
siccome J è finito, AJ è connesso in quanto prodotto finito di connessi. Per il Teorema 4.1.26 si ha che
[
AJ è connesso
J∈F

e se dimostriamo che ∪J∈F AJ è denso in Πi Xi , per il Corollario 4.1.21, abbiamo finito. (Si dimostri a
titolo di esercizio che se I non è finito e ogni Xi contiene almeno due punti, allora Πi Xi 6= ∪J∈F AJ .)
4.3. CONNESSIONE PER ARCHI 89

Per fare ciò dimostriamo che esso interseca ogni elemento di una base della topologia prodotto.
Una base della topologia prodotto è data dai prodotti V = ΠBi ove ogni Bi è aperto in Xi e solo un
numero finito di essi è diverso da Xi . Fissato un tale V diverso dal vuoto, sia
J = {i ∈ I : Bi 6= Xi }
e per ogni i ∈ J sia bi ∈ Bi . Consideriamo adesso il punto

 O i∈ /J
i
y = (yi ) con yi =
 b i∈J
i

è immediato verificare che y ∈ V e y ∈ AJ . Quindi y ∈ V ∩ (∪J AJ ) che dunque non è vuoto. 

4.2. Componenti connesse


Definizione 4.2.1. Sia X uno spazio topologico. Una componente connessa di X è un sottoinsie-
me connesso e massimale di X, ossia un A ⊆ X tale che:
(1) A è connesso;
(2) per ogni B ⊆ X, B connesso e B ⊇ A, implica B = A.
Esempio 4.2.2. Se X è connesso l’unica componente connessa di X è X stesso.
Siccome i punti son connessi, il vuoto non è una componente connessa (non è massimale). Altri-
menti detto, le componenti connesse di uno spazio non vuoto sono non vuote. Per il Teorema 4.1.26
le componenti connesse di uno spazio topologico sono disgiunte tra loro. Inoltre, sempre per il Teo-
rema 4.1.26, dato un sottoinsieme connesso A di uno spazio topologico X, l’unione di tutti i connessi
contenenti A è connesso e massimale, ergo una componente connessa di X.
Definizione 4.2.3. Sia X uno spazio topologico e sia x ∈ X. La componente connessa di x è
l’unica componente connessa di X che contiene x. (Essa è l’unione di tutti i connessi contenenti x).
Esempio 4.2.4. Le componenti connesse di Q sono i punti: infatti se A ⊆ Q contiene almeno due
punti a 6= b allora esiste un irrazionale r ∈ (a, b) e quindi A− = A ∩ (−∞, r) = A ∩ [−∞, r] è aperto e
chiuso in A, A− 6= ∅ perché a ∈ A− e A− 6= A perché b ∈ / A− .
Teorema 4.2.5. Le componenti connesse di uno spazio topologico X sono chiuse in X.
D IMOSTRAZIONE . Sia A una componente connessa di X. Ovviamente A ⊆ A. Per il Teore-
ma 4.1.20 A è connesso. Per massimalità A = A. 
Occhio che le componenti connesse in generale non sono aperte, e.g. in Q i punti non sono aperti.
Teorema 4.2.6. Siano X, Y spazi topologici con X connesso e sia f : X → Y continua. Allora l’immagine
di f è contenuta in una componente connessa di Y .
D IMOSTRAZIONE . Segue immediatamente dal corollario 4.1.15 e dalla massimalità delle compo-
nenti connesse. 

4.3. Connessione per archi


Definizione 4.3.1. Sia X uno spazio topologico e siano x, y ∈ X. Un arco, o cammino, da x a y è
una funzione continua f : [0, 1] → X tale che f (0) = x e f (1) = y.
Definizione 4.3.2. Uno spazio topologico X si dice connesso per archi se per ogni x, y ∈ X esiste
un arco da x a y.
Teorema 4.3.3. Sia X uno spazio topologico connesso per archi. Allora esso è connesso.
90 4. CONNESSIONE

D IMOSTRAZIONE . Sia x ∈ X. Per ogni y ∈ X sia αy un arco che connette x a y e sia Ay la sua
immagine. Per il Corollario 4.1.15 Ay è connesso. Inoltre esso contiene sempre x. Per il Teorema 4.1.26
l’unione ∪y∈X Ay è connessa. Siccome y ∈ Ay , l’unione ∪y∈X Ay è l’intero X. 
Il viceversa però non vale.
Esempio 4.3.4 (La sinusoide topologica). Sia G ⊂ R2 il grafico della funzione sin(1/x) con x ∈
(0, ∞). G è chiaramente connesso per archi e quindi è connesso. La chiusura G è dunque connessa
(Teorema 4.1.20). Ma lo spazio G non è connesso per archi.
D IMOSTRAZIONE . La chiusura di G è ottenuta aggiungendo a G il segmento I = {0} × [−1, 1].
Osserviamo che per ogni y ∈ [−1, 1], esiste sempre y0 ∈ [−1, 1] \ (y − 1, y + 1) e siccome sin(1/x) oscilla
vicino a zero, per ogni δ > 0 esiste 0 < x0 < δ tale che sin(1/x0 ) = y0 . Quindi l’insieme
Uy = G ∩ (R × (y − 1, y + 1))
è un aperto di G che è sconnesso dalla retta verticale {x0 } × R. Poiché δ può essere scelto piccolo a
piacere, si ha che la componente connessa di Uy che contiene (0, y) è ({0} × (y − 1, y + 1)) ∩ I ⊆ I.
Sia ora f : [0, 1] → G una funzione continua e poniamo f (t) = (xt , yt ). Sia C = f −1 (I). Esso è
chiuso perché I lo è ed f è continua. Per continuità di f , per ogni t ∈ C esiste ε > 0 tale f (t−ε, t+ε) ⊆
Uyt . Siccome (t − ε, t + ε) è connesso, la sua immagine è contenuta nella componente connessa di Uyt
che contiene f (t) = (0, yt ), che abbiamo visto essere contenuta in I. Quindi t è interno a C che risulta
aperto. Siccome [0, 1] è connesso, C è vuoto oppure [0, 1]. Ovvero, l’immagine di f sta tutta in I o
tutta fuori da I e quindi f non può connettere un punto di I a un punto di G. 
La connessione per archi, come la connessione, è un invariante topologico e può essere usata per
distinguere spazi diversi tra loro. Quello che segue è il più classico degli esempi di tale uso.
Esempio 4.3.5. R e R2 non sono omeomorfi tra loro (senza usare il teorema dell’invarianza del
dominio). Infatti se togliamo un punto a R esso si sconnette, mentre se rimuoviamo un punto da R2 ,
esso rimane connesso per archi, ergo connesso.
Teorema 4.3.6 (Unione di connessi per archi non disgiunti è connessa per archi). Sia X uno spazio
topologico e sia {Ai }i∈I una famiglia di sottoinsiemi di X connessi per archi. Se Ai ∩ Aj 6= ∅ per ogni i, j ∈ I,
allora ∪i Ai è connesso per archi.
D IMOSTRAZIONE . La dimostrazione è analoga a quella del Teorema 4.1.26 ma più semplice. Sia-
no x, y ∈ ∪i Ai . Per definizione esiste i tale che x ∈ Ai e j tale che y ∈ Aj . Sia z ∈ Ai ∩ Aj allora
dalla concatenazione di un arco da x a z in Ai con un arco da z a y in Ai si ottiene un arco in ∪i Ai che
unisce x a y. 
Corollario 4.3.7. Sia X uno spazio topologico e sia {Ai }i∈I una famiglia di sottoinsiemi di X connessi
connessi per archi. Se esiste i0 ∈ I tale che per ogni i ∈ I si ha Ai0 ∩ Ai =
6 ∅, allora ∪i Ai è connesso per archi.
D IMOSTRAZIONE . Si fa come per il Corollario 4.1.27 considerando insiemi Bi = Ai0 ∪ Ai . Essi
soddisfano le ipotesi del Teorema 4.3.6. 
Definizione 4.3.8. Sia X uno spazio topologico. Una componente connessa per archi di X è un
sottoinsieme connesso per archi che sia massimale rispetto all’inclusione.
Molti fatti che valgono per la connessione valgono per la connessione per archi. Per esempio i
seguenti, le cui dimostrazioni vengono lasciate al lettore per esercizio.
Teorema 4.3.9. L’immagine continua di un connesso per archi è connessa per archi. L’immagine continua
di un connesso per archi è contenuta in una componente connessa per archi.
Teorema 4.3.10. Se A e B sono spazi non vuoti, allora A × B è connesso per archi se e solo se entrambi
A, B lo sono.
4.4. LOCALE CONNESSIONE 91

Teorema 4.3.11. Sia X uno spazio topologico. Allora ogni x ∈ X è contenuto in un’unica componente
connessa per archi, caratterizzata dall’essere l’unione di tutti i connessi per archi che contengono x.
Quello che però NON vale per la connessione per archi è il passaggio alla chiusura, come si evince
dall’Esempio 4.3.4.
Esercizio 4.3.12. Nell’Esempio 4.3.4, determinare le componenti connesse per archi di G.
Nonostante il passaggio alla chiusura fosse cruciale nella dimostrazione del Teorema 4.1.30, esso
resta vero in versione connessione per archi, con una dimostrazione semplicissima.
Teorema 4.3.13. Sia {Xi }i∈I una famiglia di spazi topologici connessi per archi. Allora il prodotto Πi Xi
è connesso per archi.
D IMOSTRAZIONE . Siano (xi ), (yi ) ∈ Πi Xi . Per ogni i esiste una funzione continua fi : [0, 1] → Xi
tale che fi (0) = xi e fi (1) = yi . La funzione f : [0, 1] → Πi Xi definita da
f (t) = (fi (t))i∈I ∈ Πi (Xi )
connette (xi ) a (yi ) ed è continua per il Teorema 2.1.15. 

4.4. Locale connessione


Il concetto di connessione (per archi) può essere localizzato.
Definizione 4.4.1. Uno spazio topologico (X, τ ) si dice localmente connesso (per archi) se ogni
suo punto ammette un sistema fondamentale di intorni connessi (per archi).
Teorema 4.4.2. Sia X uno spazio topologico tale che per ogni aperto U di X, le componenti connesse (per
archi) di U sono aperte. Allora X è localmente connesso (per archi).
D IMOSTRAZIONE . Sia x ∈ X e sia A un intorno di x in X. Dobbiamo mostrare che A contiene
un intorno connesso (per archi) di x. Per definizione esiste un aperto U tale che x ∈ U ⊆ A. Sia Cx
la componente connessa (per archi) di U che contiene x. Essa è aperta per ipotesi ed è dunque un
intorno connesso (per archi) di x contenuto in A. 
Teorema 4.4.3. Gli aperti di spazi localmente connessi (per archi) sono localmente connessi (per archi).
D IMOSTRAZIONE . Sia (X, τ ) uno spazio localmente connesso (per archi), sia x ∈ U ∈ τ e sia V
un intorno di x in U . Siccome U ∈ τ , V è anche un intorno di x in X. Per ipotesi V contiene un
intorno di x connesso (per archi). Esso è un intorno di x anche per τ |U . 
Teorema 4.4.4. Le componenti connesse (per archi) di spazi localmente connessi (per archi) sono aperte.
D IMOSTRAZIONE . Sia X uno spazio localmente connesso (per archi). Sia x ∈ X e Cx la sua com-
ponente connessa (per archi). Per ipotesi x possiede quindi un intorno connesso (per archi) Ax . Ne
segue che Cx contiene Ax . Quindi x è interno a Cx . Quindi ogni punto è interno alla sua componente
connessa (per archi) che risulta dunque aperta. 
Corollario 4.4.5. Le componenti connesse per archi di spazi localmente connessi per archi son chiuse.
D IMOSTRAZIONE . Sia X uno spazio localmente connesso per archi. Per il Teorema 4.3.6 le com-
ponenti connesse per archi sono disgiunte, in particolare
X = tCi
ove Ci sono le componenti connesse per archi di X. Il complementare di una componente connessa
per archi C è quindi l’unione delle altre, che sono aperte per il Teorema 4.4.4, e dunque è aperto. 
Possiamo riassumere i risultati sulla (locale) connessione (per archi) nel seguente enunciato, la cui
dimostrazione, che lasciamo al lettore, segue immediatamente dai Teoremi 4.1.26, 4.2.5, 4.3.6, 4.4.2,
4.4.3, 4.4.4 e dal Corollario 4.4.5.
92 4. CONNESSIONE

Teorema 4.4.6. Uno spazio topologico X è localmente connesso (per archi) se e solo se le componenti
connesse (per archi) di ogni suo aperto sono aperte. In tal caso X è unione disgiunta delle sue componenti
connesse (per archi), ognuna delle quali è aperta e chiusa. Inoltre, ogni sottoinsieme di X che sia aperto e chiuso
è unione di componenti connesse di X.
I prodotti si comportano abbastanza bene rispetto alla locale connessione.
Teorema 4.4.7. Sia (Xi )i∈I una famiglia di spazi localmente connessi (per archi). Nel caso in cui I
abbia cardinalità infinita, supponiamo inoltre che tutti gli Xi siano connessi (per archi). Allora X = Πi Xi è
localmente connesso (per archi).
D IMOSTRAZIONE . Sia x = (xi ) ∈ X e sia U un intorno di x. Per come è fatta la topologia
prodotto, esiste un intorno aperto B di x della forma B = Πi Bi ove Bi ⊆ Xi è aperto e solo un
numero finito di essi è non banale. Siccome ogni Xi è localmente connesso, dentro ogni Bi si trova un
intorno connesso Ai di xi . Ponendo Ai = Xi per gli indici ove Bi = Xi , siccome Xi è connesso, per
i Teoremi 4.1.30 e 4.3.13 si ha che Πi Ai ⊆ B è un intorno connesso di x. Lo stesso ragionamento vale
per la connessione per archi. 
Le immagini continue di localmente connessi (per archi) invece, non sono necessariamente local-
mente connesse.
Esempio 4.4.8. Sia f : N → R data da f (0) = 0 e f (n) = 1/n per n 6= 0. N è discreto e quindi
localmente connesso per archi ma f (N) non è localmente connesso perché f (0) non ha intorni connessi
in f (N).
La buona notizia è che i quozienti di localmente connessi sono localmente connessi, la cattiva
notizia è che non si può usare la continuità della proiezione naturale per dimostrarlo.
Teorema 4.4.9 (Quoziente di loc. connesso è loc. connesso). Sia X uno spazio topologico e ∼ una
relazione d’equivalenza. Se X è localmente connesso (per archi) allora il quoziente X/ ∼ è localmente connesso
(per archi).
D IMOSTRAZIONE . Usiamo il Teorema 4.4.6 e dimostriamo che le componenti connesse (per archi)
degli aperti di X/ ∼ sono aperte. Sia π : X → X/ ∼ la proiezione naturale. Sia U un aperto di X/ ∼ e
sia A una sua componente connessa (per archi). L’insieme V = π −1 (U ) è aperto perché π è continua.
Per il Teorema 4.4.6 le componenti connesse (per archi) di V sono aperte. Per ogni x ∈ π −1 (A) sia Vx
la componente connessa (per archi) di V contenente x. L’insieme
[
W = Vx
x∈π −1 (A)

è dunque aperto. Inoltre π(Vx ) è un sottoinsieme di U connesso (per archi) e contenente π(x) ∈ A,
dunque esso è contenuto in A (Teoremi 4.2.6 e versione 4.3.9 per connessione per archi). Ne segue che
W ⊆ π −1 (A). D’altronde W contiene π −1 (A) per come è definito, quindi π −1 (A) = W è aperto, ergo
A è aperto. 
La locale connessione si comporta bene per mappe aperte.
Teorema 4.4.10. Sia f : X → Y una funzione continua tra spazi topologici. Se X è localmente connesso
(per archi) e f è aperta, allora f (X) è localmente connesso (per archi).
D IMOSTRAZIONE . Sia y = f (x) ∈ f (X) e sia V un intorno aperto di y. f −1 (V ) è un intorno
aperto di x. Per ipotesi, esso contiene un aperto U 3 x connesso (per archi). Siccome f è aperta, f (U )
è un aperto connesso (per archi) e y ∈ f (U ) ⊆ V . 
Corollario 4.4.11. Sia (Xi )i∈I una famiglia di spazi topologici. Se Πi Xi è localmente connesso (per archi)
allora ogni Xi lo è.
4.4. LOCALE CONNESSIONE 93

D IMOSTRAZIONE . Le proiezioni naturali sono aperte per il Teorema 2.1.12. 


Sappiamo già che connesso per archi implica connesso e quindi che localmente connesso per archi
implica localmente connesso. L’altra implicazione è la seguente.
Teorema 4.4.12. Ogni spazio topologico connesso e localmente connesso per archi, è connesso per archi.
D IMOSTRAZIONE . Sia X uno spazio topologico connesso e localmente connesso per archi, sia
x ∈ X e sia Cx la componente connessa per archi di x. Cx è un connesso per archi. Inoltre Cx è aperto
e chiuso per il Teorema 4.4.6. Siccome Cx è non vuoto perché contiene x, per connessione esso deve
essere tutto X che quindi risulta connesso per archi. 
Tutte le altre combinazioni sono possibili:

Connessi

1 3
Loc. Conn.

2 4 6

Connessi per archi


5 7

8 Loc. Conn. per archi

F IGURA 1. Le possibili proprietà di connessione

Esempio 4.4.13. Per ognuna delle possibilità 1–8 della Figura 1 esistono degli esempi.
D IMOSTRAZIONE .
(1) Connesso, non connesso per archi, non localmente connesso. Sia G il grafico di sin(1/x) con
x ∈ (0, ∞) e sia X = G. Esso è connesso ma non connesso per archi. Inoltre i punti del tipo
(0, y) con y ∈ [−1, 1] non possiedono un sistema fondamentale di intorni connessi. Quindi
X non è localmente connesso.
(2) Connesso per archi non localmente connesso. Il cosiddetto pettine delle pulci. Sia A = {1/n :
0 < n ∈ N} ∪ {0} e sia X ⊂ R2 definito da X = (A × [0, 1]) ∪ ([0, 1] × {0}). Esso è chiaramente
connesso per archi (l’asse orizzontale interseca tutte le rette verticali) ma i punti del tipo
(0, y) non hanno sistemi fondamentali di intorni connessi.
(3) Connesso, non connesso per archi, localmente connesso ma non localmente connesso per
archi. X = [0, 1]2 con l’ordine lessicografico (si veda la Sezione 4.5). La locale connessione si
dimostra come la globale connessione. La non locale connessione per archi si dimostra come
la non connessione per archi.
94 4. CONNESSIONE

(4) Connesso per archi, localmente connesso ma non localmente connesso per archi. Un cono su
un insieme di tipo 3). Sia Y un insieme di tipo 3) e X = Y × [0, 1]/ ∼ ove ∼ è la relazione che
identifica Y × {0} a un sol punto. X è connesso per archi perché ogni punto è connettibile
al vertice del cono. Y × [0, 1] è localmente connesso perché prodotto di localmente connessi
(Teorema 4.4.7). Quindi X è localmente connesso perché quoziente di un localmente con-
nesso (Teorema 4.4.9). D’altronde Y non è localmente connesso per archi e quindi nemmeno
Y × (0, 1) lo è (Corollario 4.4.11). Quindi X non è localmente connesso per archi perché
contiene Y × (0, 1) come aperto.
(5) Connesso in tutte le salse: X = un punto, oppure X = R, oppure X = [0, 1].
(6) Localmente connesso, ma non per archi, globalmente non connesso. Due copie disgiunte di
uno spazio di tipo 3).
(7) Localmente connesso per archi ma non connesso. Una qualsiasi topologia discreta su un
insieme con almeno due punti. Oppure X = [0, 1] ∪ [57, 128]. √ √
(8) Nessuna proprietà di connessione: X = Q. Infatti Q = (−∞, 2) t ( 2, ∞) è sconnesso. Le
componenti connesse sono i punti, che non sono aperti, ergo Q non è localmente connesso.

4.5. Una piccola digressione: connessione di insiemi totalmente ordinati


Teorema 4.5.1. Sia I = [0, 1]2 con la topologia dell’ordine lessicografico. I è connesso.
Prima di tutto si noti che l’ordine lessicografico di R2 induce l’ordine lessicografico di [0, 1]2 . Ma
[0, 1]2 non è connesso per la topologia indotta da R2 con l’ordine lessicografico (perché?). Questa non
è altro che un’ulteriore manifestazione del fenomeno già evidenziato con l’Esempio 1.4.15.
La dimostrazione del Teorema 4.5.1 è identica a quella del Teorema 4.1.12. C’è però una piccola
sottigliezza a cui si deve stare attenti. Proponiamo adesso la dimostrazione senza dire dove sta il
busillis, vediamo se ve viene scovato. Prima, un paio di precisazioni notazionali. L’insieme I ha un
massimo, il punto (1, 1), e un minimo, il punto (0, 0), che chiamiamo per semplicità 1 e 0 rispettiva-
mente. Dati a, b ∈ I usiamo la classica notazione di intervalli: (a, b) = {x ∈ I : a < x < b} incluse
tutte le varianti [a, b], [a, b), (a, b].
D IMOSTRAZIONE . Sia ∅ = 6 A ⊆ I aperto e chiuso. Vogliamo dimostrare che in tal caso A = I.
Se A 6= I allora Ac è aperto, chiuso e non vuoto. Quindi, a meno di scambiare A con Ac , possiamo
supporre che 0 ∈ A. Sia
X = {t ∈ I : [0, t] ⊆ A}
e sia t0 l’estremo inferiore del complementare di X, ponendo t0 = ∞ se X = I. Si noti che 0 ∈ X.
Inoltre, siccome A è aperto, per ogni 1 6= x ∈ A esiste y > x tale che [x, y) ⊂ A. Ne segue che se
1 6= t ∈ X allora esiste y > t tale che X c ⊆ [y, 1]. Ciò implica che
0 < t0 ∈
/ X.
Per ogni s < t0 si ha [0, s] ⊆ A, in particolare [0, t0 ) ⊆ A. Siccome A è chiuso, se t0 < ∞ allora
avremmo [0, t0 ] ⊆ A e quindi t0 ∈ X, in contraddizione con quanto appena dimostrato. Quindi
t0 = ∞ e dunque A = I. 
Dov’è il busillis? Si noti che questa dimostrazione — apparentemente — fa uso solo della rela-
zione d’ordine e sembrerebbe funzionare per ogni insieme totalmente ordinato. Sappiamo però che,
per esempio, Q non è connesso e Z nemmeno. Il prossimo esempio fornisce un altro caso di spazio
totalmente ordinato non connesso.
Esempio 4.5.2. Sia J = (0, 1)2 con la topologia dell’ordine lessicografico. J non è connesso.
D IMOSTRAZIONE . Sia A = (−∞, (1/2, 1)) = {(x, y) ∈ J : (x, y) < (1/2, 1)} e B = Ac =
((1/2, 1), +∞) = {(x, y) ∈ J : (x, y) > (1/2, 1)} (si noti che si è usato che (1/2, 1) non appartiene
a J). Sia A che B sono aperti (perché?) e J = A t B. 
4.5. UNA PICCOLA DIGRESSIONE: CONNESSIONE DI INSIEMI TOTALMENTE ORDINATI 95

Esercizio 4.5.3. Provare a seguire passo passo la dimostrazione rimpiazzando I con Q e/o con Z
per vedere se qualche nodo viene al pettine.
Adesso mettiamo in neretto i nodi.
D IMOSTRAZIONE . Sia ∅ = 6 A ⊆ I aperto e chiuso. Vogliamo dimostrare che in tal caso A = I.
Se A 6= I allora Ac è aperto, chiuso e non vuoto. Quindi, a meno di scambiare A con Ac , possiamo
supporre che 0 ∈ A. Sia
X = {t ∈ I : [0, t] ⊆ A}
e sia t0 l’estremo inferiore del complementare di X, ponendo t0 = ∞ se X = I. Si noti che 0 ∈ X.
Inoltre, siccome A è aperto, per ogni 1 6= x ∈ A esiste y > x tale che [x, y) ⊂ A. Ne segue che se
1 6= t ∈ X allora esiste y > t tale che X c ⊆ [y, 1]. Ciò implica che
0 < t0 ∈
/ X.
Per ogni s < t0 si ha [0, s] ⊆ A, in particolare [0, t0 ) ⊆ A. Siccome A è chiuso, se t0 < ∞ allora
avremmo [0, t0 ] ⊆ A e quindi t0 ∈ X, in contraddizione con quanto appena dimostrato. Quindi
t0 = ∞ e dunque A = I. 
Il primo nodo è l’esistenza di inf e sup, cosa che non è vera per esempio in Q. Il secondo nodo
è che [a, b) = [a, b] cosa che per esempio non è vera in Z (ove [2, 6) = [2, 5]). Affinché la dimostra-
zione proposta sia completa, queste due cose vanno dimostrate in I. Chiaramente, il Teorema 4.5.1 si
generalizza mutatis mutandis a insiemi totalmente ordinati con le proprietà opportune.
Lemma 4.5.4. Ogni ∅ =
6 A ⊆ I ha estremo inferiore.
D IMOSTRAZIONE . Sia X = {x ∈ [0, 1] : ∃y ∈ [0, 1] : ∀a ∈ A, (x, y) ≤ a}. L’insieme X è non
vuoto perché 0 ∈ X. Quindi X ha un estremo superiore x0 ∈ [0, 1]. Per ogni a = (xa , ya ) ∈ A si ha
xa ≥ x0 . Se x0 ∈/ X allora in particolare esiste a ∈ A con a < (x0 , 0), ma ciò implicherebbe xa < x0 .
Quindi x0 ∈ X. Dunque l’insieme Y = {y ∈ [0, 1] : ∀a ∈ A, (x0 , y) ≤ a} è non vuoto. Sia y0 l’estremo
superiore di Y in [0, 1]. Si ha (x0 , y0 ) ≤ a per ogni a ∈ A. Inoltre (x0 , y0 ) è il massimo dei minoranti di
A, quindi (x0 , y0 ) è l’estremo inferiore di A. 
Lemma 4.5.5. Per ogni a < b ∈ I si ha [a, b) = [a, b].
D IMOSTRAZIONE . Sia  b = (xb , yb ). Se yb 6= 0 allora ogni intorno di b contiene un intervallo del
tipo (xb , yb − ε), (xb , yb ) e quindi interseca
 [a, b). Se yb = 0 allora ogni intorno di b contiene un
intervallo del tipo (xb − ε, 1), (xb , yb ) e quindi interseca [a, b). In ogni caso b è un punto di aderenza
di [a, b). Ne segue [a, b] ⊆ [a, b). D’altronde [a, b]c = (−∞, a) ∪ (b, ∞) è aperto perché unione di aperti.
Quindi [a, b] è chiuso e dunque contiene la chiusura di [a, b). 
Teorema 4.5.6. Sia I = [0, 1]2 con l’ordine lessicografico. I non è connesso per archi.
D IMOSTRAZIONE . Supponiamo per assurdo che esista una funzione continua f : [0, 1] → I tale
che f (0) = (0, 0) e f (1) = (1, 1). L’immagine di f è connessa per il Corollario 4.1.15.
Osserviamo che se esistesse p0 non contenuto nell’immagine di f , allora essa risulterebbe scon-
nessa. Infatti in tal caso avremmo
Imm(f ) = (Imm(f ) ∩ {p < p0 }) t (Imm(f ) ∩ {p > p0 })
ed entrambi gli insiemi {p < p0 } e {p > p0 } sono aperti per la topologia dell’ordine lessicografico.
Quindi f è suriettiva. Per ogni x ∈ [0, 1] sia Ax = {x} × (0, 1). Esso è aperto per la topologia
dell’ordine lessicografico. Siccome f è continua allora Bx = f −1 (Ax ) è un aperto di [0, 1]. Inoltre Bx
è non vuoto perché f è suriettiva e Bx ∩ By = ∅ se x 6= y. La famiglia
{Bx }x∈[0,1]
costituisce quindi una famiglia più che numerabile di aperti disgiunti in [0, 1]. Ma per il Teore-
ma 1.5.15 ciò è incompatibile col fatto che [0, 1] sia a base numerabile. 
96 4. CONNESSIONE

4.6. Esercizi
Esercizio 4.6.1. Dimostrare che Rn Euclideo è connesso.
Esercizio 4.6.2. Dimostrare che R2 meno l’asse X è sconnesso.
Esercizio 4.6.3. Sia X ⊆ R2 l’insieme {(x, 0) : x > 0}. Si dimostri che X è omeomorfo a R. Si
dimostri che R2 \ X è connesso.
Esercizio 4.6.4. Dimostrare che R3 meno l’asse X è connesso.
Esercizio 4.6.5. Dimostrare che R, con la topologia generata dagli intervalli del tipo (a, b], non è
connesso.
Esercizio 4.6.6. Dimostrare che R, con la topologia generata dagli intervalli del tipo [a, b], non è
connesso.
Esercizio 4.6.7. Dimostrare che la topologia del punto particolare (Esercizio 1.1.11) è connessa.
Esercizio 4.6.8. Si dica se R2 con la topologia delle palle annidate (Esempio 1.1.10) è connesso.
Esercizio 4.6.9. Sia X un insieme dotato della topologia cofinita. Dimostrare che se X è sconnesso
allora ha un numero finito di elementi.
Esercizio 4.6.10. Si dica se Z con la topologia delle successioni aritmetiche (Esempio 1.2.5) è
connesso.
Esercizio 4.6.11. Dimostrare che R2 con la metrica dei raggi è connesso.
Esercizio 4.6.12. Dimostrare che R2 Euclideo privato di un punto è connesso.
Esercizio 4.6.13. Dimostrare che R2 con la metrica dei raggi e privato di un punto, è sconnesso.
Esercizio 4.6.14. Dimostrare che R2 con la topologia di Zariski è connesso.
Esercizio 4.6.15. Dimostrare che ogni aperto di R2 con la topologia di Zariski è connesso (rispetto
alla topologia di Zariski).
Esercizio 4.6.16. Dimostrare che ogni aperto di C con la topologia di Zariski è connesso rispetto
alla topologia standard.
Esercizio 4.6.17. Dimostrare che ogni aperto non banale di R con la topologia di Zariski è scon-
nesso rispetto alla topologia standard.
Esercizio 4.6.18. Vero o falso? Se σ è più fine di τ e σ è connessa allora τ è connessa.
Esercizio 4.6.19. Vero o falso? Se σ è meno fine di τ e σ è connessa allora τ è connessa.
Esercizio 4.6.20. Dimostrare che gli spazi proiettivi (su R e C) sono connessi.
Esercizio 4.6.21. Dimostrare che T 2 è connesso.
Esercizio 4.6.22. Dimostrare che S 2 è connesso.
Esercizio 4.6.23. Dimostrare che la bottiglia di Klein è connessa.
Esercizio 4.6.24. Dire quali lettere dell’alfabeto sono connesse.
Esercizio 4.6.25. Si dia un esempio di uno spazio contenente un insieme connesso la cui parte
interna non è connessa.
Esercizio 4.6.26. Dimostrare che l’insieme di Cantor non è localmente connesso.
Esercizio 4.6.27. Dimostrare che R × Q, come sottoinsieme del piano Euclideo, non è connesso.
4.6. ESERCIZI 97

Esercizio 4.6.28. Dimostrare che esiste una topologia su R2 che rende R × Q connesso.
Esercizio 4.6.29. Dimostrare, coi mezzi sviluppati sinora, che il tappeto e la guarnizione di Sier-
pinski sono connessi e localmente connessi.
Esercizio 4.6.30. Dimostrare che una varietà topologica è localmente connessa per archi.
Esercizio 4.6.31. Dare un esempio di varietà non connessa.
Esercizio 4.6.32. Dimostrare che un grafo è localmente connesso per archi.
Esercizio 4.6.33. Dare un esempio di grafo non connesso.
Esercizio 4.6.34. Sia X uno spazio topologico e sia A ⊆ X un insieme connesso. Sia B ⊆ A.
Dimostrare che A ∪ B è connesso.
Esercizio 4.6.35. Sia X = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 < 0} si dica se X è connesso. Si dica se X è
connesso. Si dica se X è localmente connesso. Si dica se X è localmente connesso.
Esercizio 4.6.36. Sia X = {(x, y, z) ∈ R3 : x2 + y 2 − z 2 6= 0}. Si dimostri che X ha esattamente tre
componenti connesse.
Esercizio 4.6.37. Sia X = {(x, y) ∈ R2 : sup{|x|, |y|} < 1, x2 + y 2 > 1}. Si dica se X e X sono
connessi e/o localmente connessi.
Esercizio 4.6.38. In R2 sia X = {(x, n2 x), x ∈ R, n ∈ Z}. Dimostrare che X è connesso per archi e
localmente connesso per archi. Dimostrare che X è connesso per archi ma non localmente connesso.
Esercizio 4.6.39. In R2 sia X = {(x, nx2 ), x ∈ R, n ∈ Z}. Dimostrare che X è connesso per archi e
localmente connesso per archi. Dimostrare che X è connesso per archi ma non localmente connesso.
2
Esercizio 4.6.40. In R2 sia X l’immagine di (0, ∞) tramite f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Dimostrare che X è connesso. Dimostrare che X è connesso, ma non per archi.
2
Esercizio 4.6.41. In R2 sia X l’immagine di (0, ∞) tramite f (t) = e−1/t (cos(t + 1/t), sin(t + 1/t)).
Dimostrare che X c è connesso ma non connesso per archi né localmente connesso. Dimostrare che
(X)c non è connesso.
Esercizio 4.6.42. In R2 sia X l’immagine di (0, ∞) tramite f (t) = t(cos t, sin t) e sia X
b la sua com-
pattificazione di Alexandroff. Dimostrare che X b è connesso e localmente connesso per archi. Si dica
se è una varietà.
Esercizio 4.6.43. Per ogni a 6= b ∈ R sia S(a, b) il semicerchio chiuso del semipiano positivo di R2
passante per (a, 0) e (b, 0) e ortogonale all’asse X. Sia X = ∪n∈Z S(2n , 2n+1 ). Dimostrare che sia X
che la sua chiusura sono connessi e localmente connessi per archi.
Esercizio 4.6.44. Per ogni a 6= b ∈ R sia E(a, b) la semi ellisse chiusa del semipiano positivo di R2
passante per (a, 0), (b, 0), ( a+b n n+1
2 , 1). Sia X = ∪n∈Z E(2 , 2 ). Dimostrare che sia la chiusura di X è
connessa ma non per archi.
Esercizio 4.6.45. Con la stessa notazione dell’Esercizio 4.6.43, sia X = ∪06=n∈Z S(2n , 1). Dimostrare
che X è connesso e localmente connesso per archi. Dimostrare che X non è localmente connesso.
Esercizio 4.6.46. Con la stessa notazione dell’Esercizio 4.6.43, sia X = ∪n<0 S(2n , 1). Dimostrare
che X ∪ {(0, 0)} è connesso, ma non per archi.
Esercizio 4.6.47. Dimostrare che il quoziente di R per la relazione d’equivalenza generata da x ∼
2x è connesso. Si dica se è una varietà.
98 4. CONNESSIONE

Esercizio 4.6.48. In R2 sia ∼ la relazione d’equivalenza generata da v ∼ 2v. Si dica se R2 / ∼ è


connesso.
Esercizio 4.6.49. In R2 sia ∼ la relazione d’equivalenza generata da v ∼ 2v e sia π : R2 → R2 / ∼ la
proiezione naturale. Sia X = {(x, y) : x 6= 0}. Si dica se π(X) è connesso.
Esercizio 4.6.50. In R2 sia ∼ la relazione d’equivalenza generata da v ∼ 2v e sia π : R2 → R2 / ∼ la
proiezione naturale. Sia X = {(x, y) : x 6= 0} ∪ {(0, 0)}. Si dica se π(X) è connesso.
Esercizio 4.6.51. In R2 sia ∼ la relazione d’equivalenza generata da v ∼ 2v e sia π : R2 → R2 / ∼ la
proiezione naturale. Sia X = {(x, y) : |x| > 1}. Si dica se π(X) è connesso.
Esercizio 4.6.52. In R2 sia ∼ la relazione d’equivalenza generata da v ∼ 2v e sia π : R2 → R2 / ∼ la
proiezione naturale. Sia X = {(x, y) : |x| > 1} ∪ {(0, 0)}. Si dica se π(X) è connesso.
Esercizio 4.6.53. Dimostrare che GL(n, R) ha esattamente due componenti connesse.
Esercizio 4.6.54. Dimostrare che SO(2) è connesso.
Esercizio 4.6.55. Siano X, Y spazi topologici con n e m componenti connesse rispettivamente.
Dimostrare che X × Y ha nm componenti connesse.
Esercizio 4.6.56. Sia X uno spazio topologico, sia C una componente connessa di X e sia A ⊆ X\C.
Dimostrare che A è una componente connessa di X \ C se e solo se è una componente connessa di X.
Mostrare un controesempio nel caso C non sia una componente connessa.
Esercizio 4.6.57. Vero o falso? Se uno spazio topologico è connesso allora togliendo un punto
rimane connesso.
Esercizio 4.6.58. Vero o falso? Se X è uno spazio topologico tale che ∃x ∈ X per cui X \ {x} è
connesso, allora X è connesso.
Esercizio 4.6.59. Vero o falso? Se X è uno spazio topologico tale che ∀x ∈ X sia ha che X \ {x} è
connesso, allora X è connesso.
Esercizio 4.6.60. Vero o falso? Se X è uno spazio topologico tale che ∀x ∈ X sia ha che X \ {x} è
connesso, allora X ha al più due componenti connesse.
Esercizio 4.6.61. Sia X ⊆ R2 un sottoinsieme del piano tale che esista ε > 0 tale che per ogni
x ∈ X la palla B(x, ε) è interamente contenuta in X. Dimostrare che X è connesso. Si diano due
esempi diversi di sottoinsiemi X ⊆ R2 con tale proprietà. Esiste un terzo esempio?
Esercizio 4.6.62. Sia X ⊆ R3 un sottoinsieme non vuoto tale che esista ε > 0 tale che per ogni
x ∈ X la palla B(x, ε) è interamente contenuta in X. Dimostrare che X = R3 .
Esercizio 4.6.63. Sia X uno spazio connesso e sia f : Y → X una funzione aperta e suriettiva tale
che le preimmagini di ogni punto siano connesse. Dimostrare che Y è connesso. Se ne deduca una
dimostrazione alternativa del Teorema 4.1.28.
Esercizio 4.6.64. Si trovi un esempio di una funzione aperta f : Y → X tra spazi topologici con X
connesso e Y no.
Esercizio 4.6.65. Si trovi un esempio di una funzione suriettiva f : Y → X tra spazi topologici con
X connesso e Y no.
Esercizio 4.6.66. Sia f : R → R una funzione che sia continua in ogni punto tranne che in zero,
ove è discontinua. Sia G ⊆ R2 il grafico di f . Dimostrare che G non è connesso per archi. Dare un
esempio in cui G è connesso e un esempio in cui non lo è. Dare un esempio in cui G è localmente
connesso per archi e uno in cui non lo è.
4.6. ESERCIZI 99

Esercizio 4.6.67. Sia X uno spazio connesso e sia f : X → R una funzione continua tale che
esistano x, y ∈ X per cui f (x) = −f (y). Dimostrare che esiste z ∈ X tale che f (z) = 0.
Esercizio 4.6.68 (Teorema di Borsuk-Ulam unidimensionale). Dimostrare che per ogni funzione
continua f : S 1 → R esiste x ∈ S 1 tale che f (x) = f (−x).
Esercizio 4.6.69. Dimostrare che esistono infiniti punti p sulla terra tali che p e il suo antipodale
hanno la stessa temperatura.
Esercizio 4.6.70. Dimostrare che dato un qualsiasi sottoinsieme (misurabile) del piano, esiste una
retta che lo divide in due pezzi di uguale area.
Esercizio 4.6.71. Dimostrare che data una qualsiasi torta, cioè un sottoinsieme limitato (e misura-
bile) del piano, esistono due rette perpendicolari che la dividono in quattro fette di uguale area.
CAPITOLO 5

Topologia degli Spazi metrici

Sin ora abbiamo usato gli spazi metrici (principalmente R2 ) come fonte di esempi per le varie
nozioni topologiche trattate. È arrivato il momento di studiare le proprietà peculiari che gli spazi
metrici hanno rispetto agli altri spazi topologici.

5.1. Spazi metrici, omotetie e isometrie


Cominciamo richiamando la definizione di spazio metrico (Definizione 0.2.1) e dando qualche
esempio in più rispetto a quelli che abbiamo già collezionato.
Definizione 5.1.1. Sia X un insieme. Una distanza è una funzione d : X × X → R tale che, quali
che siano x, y, z ∈ X si abbia:
(1) d(x, y) ≥ 0 (Positività);
(2) d(x, y) = 0 ⇔ x = y (Distinzione dei punti);
(3) d(x, y) = d(y, x) (Simmetria);
(4) d(x, y) ≤ d(x, z) + d(z, y) (Disuguaglianza triangolare).
Un insieme X dotato di una funzione distanza d si dice spazio metrico, e spesso le parole “metrica”
e “distanza” sono sinonimi.
Definizione 5.1.2. Sia (X, d) uno spazio metrico e Y ⊆ X. La restrizione d|Y di d a Y è una
distanza su Y che si chiama distanza indotta da (X, d) su Y . Lo spazio metrico (Y, d|Y ) si chiama
sottospazio di (X, d).
Teorema 5.1.3. Siano (X, δ) e (Y, σ) due spazi metrici. Allora le funzioni d, D su X × Y definite da
 
d (x1 , y1 ), (x2 , y2 ) = δ(x1 , x2 ) + σ(y1 , y2 ) D (x1 , y1 ), (x2 , y2 ) = sup{δ(x1 , x2 ), σ(y1 , y2 )}
sono metriche su X × Y .
D IMOSTRAZIONE . Siccome  δ e σ sono funzioni positive esimmetriche, anche d e D lo sono. Inol-
tre, se d (x1 , y1 ), (x2 , y2 ) = 0, oppure se D (x1 , y1 ), (x2 , y2 ) = 0, allora per positività δ(x1 , x2 ) =
σ(y1 , y2 ) = 0 e quindi x1 = x2 e y1 = y2 , ossia (x1 , y1 ) = (x2 , y2 ). Veniamo alle disuguaglianze
triangolari.

d (x1 , y1 ), (x2 , y2 ) = δ(x1 , x2 ) + σ(y1 , y2 ) ≤ δ(x1 , x3 ) + δ(x3 , x2 ) + σ(y1 , y3 ) + σ(y3 , y2 ) =
 
= d (x1 , y1 ), (x3 , y3 ) + d (x3 , y3 ), (x2 , y2 ) .

D (x1 , y1 ), (x2 , y2 ) = sup{δ(x1 , x2 ), σ(y1 , y2 )} ≤ sup{δ(x1 , x3 ) + δ(x3 , x2 ), σ(y1 , y3 ) + σ(y3 , y2 )}
≤ sup{(δ(x1 , x3 ), σ(y1 , y3 )} + sup{δ(x3 , x2 ), σ(y3 , y2 )}
 
= D (x1 , y1 ), (x3 , y3 ) + D (x3 , y3 ), (x2 , y2 ) .


Corollario 5.1.4. Siano d1 , d2 due metriche su X. Allora d1 + d2 e sup(d1 , d2 ) sono metriche su X.


101
102 5. TOPOLOGIA DEGLI SPAZI METRICI

D IMOSTRAZIONE . In X × X sia ∆ = {(x, x) : x ∈ X} la diagonale. ∆ è in relazione biunivoca


naturale con X. Quindi dare una metrica su ∆ equivale a darla su X. Per il Teorema 5.1.3 applicato a
(X, d1 ) e (X, d2 ), abbiamo delle metriche ben definite su X × X, le cui restrizioni a ∆ sono d1 + d2 e
sup(d1 , d2 ). 
Teorema 5.1.5. Sia (X, d) uno spazio metrico. Allora la funzione δ = arctan(d) è una metrica su X.
D IMOSTRAZIONE . δ è chiaramente simmetrica perché d lo è. L’arcotangente manda zero in zero, è
positiva su R+ , monotona e sub-additiva (cioè f (a+b) ≤ f (a)+f (b)). Ne segue subito che δ è positiva
e δ(x, y) = 0 se e solo se d(x, y) = 0, se e solo se x = y. Vediamo la disuguaglianza triangolare (qui
servono monotonia e sub-additività). Siccome d(x, y) ≤ d(x, z) + d(z, y) si ha
δ(x, y) = arctan(d(x, y)) ≤ arctan(d(x, z)+d(z, y)) ≤ arctan(d(x, z))+arctan(d(z, y)) = δ(x, z)+δ(z, y).

Vediamo adesso qualche esempio preso in prestito dall’analisi funzionale.

p Esempio 5.1.6 (Metrica Lp su Rn ). Su X = Rn , detti v = (xi ) e w = (yi ), si pone d(v, w) =


P p
P i (|xi − yi |) . Questa è una metrica solo per p ∈ [1, ∞]. Per p = 1 la metrica diventa d1∞(v, w) =
p

i |xi − yi |. Per p = ∞ la metrica diventa d∞ (v, w) = supi |xi − yi | (per questo la metrica L è detta
anche metrica del sup).
Esempio 5.1.7 (Spazi lp ). Per p ∈ [1, ∞) si definisce lp ⊆ RN come lp = {(xi )i∈N : |xi |p < ∞}, su
P
p
cui si mette la metrica lp definita
P p
da d(v, w) = p i (|xi − yi |) (ove v = (xi ) e w = (yi )). Per p = 1 la
metrica diventa d1 (v, w) = i |xi − yi |. Il caso p = ∞ si ottiene per passaggio al limite: l∞ è lo spazio
P
delle successioni limitate e la metrica per p = ∞ diventa d∞ (v, w) = supi |xi − yi |, cioè la metrica del
sup.
Esempio 5.1.8 (Spazi Lp ). Dato X ⊆ R, per p ∈ [1, ∞) si pone Lp (X) = {f : X |f (x)|p < ∞}/{f :
R
q
|f (x)|p = 0} con d(f, g) = p X |f (x) − g(x)|p . Per p = 1 la metrica diventa d1 (f, g) = X |f (x) −
R R R
X
g(x)|. Per p = ∞ si deve fare un po’ di attenzione. Nel caso dello spazio di funzioni continue
e limitate per passaggio al limite si ottiene la metrica del sup, quella della convergenza uniforme:
d∞ (f, g) = supX |f (x) − g(x)|.
Esercizio 5.1.9. Dimostrare che quelle appena elencate sono effettivamente metriche. (Per la disu-
guaglianza triangolare delle metriche Lp serve la disuguaglianza di Minkowski. Nel caso p = 2 segue
dalla disuguaglianza di Schwartz.)
Per il Teorema 1.1.12 ogni metrica induce una topologia: quella generata dalle palle aperte B(x, ε).
Negli spazi metrici in generale si deve fare attenzione all’uso della terminologia delle palle chiuse.
Fissiamo la convenzione che
D(x, R) = {y ∈ X : d(x, y) ≤ R}
mentre B(x, R) indica la chiusura topologica della palla aperta. Se in R2 le due cose coincidevano,
in generale non è più vero. Per esempio, in Z con la metrica Euclidea, B(0, 1) = B(0, 1) = {0} 6=
D(0, 1) = {−1, 0, 1} (e B(0, 1/2) = B(0, 1/2) = {0} = D(0, 1/2)).
Definizione 5.1.10. Due metriche d1 , d2 su un insieme X si dicono topologicamente1 equivalenti
se inducono la stessa topologia. In altre parole se l’identità (X, d1 ) → (X, d2 ) è un omeomorfismo.
Esempio 5.1.11. In R2 tutte le metriche Lp sono equivalenti (Esercizio: dimostrarlo).
1In generale, nella teoria degli spazi metrici, due metriche si dicono equivalenti se esistono due costanti A > B > 0 tali
che dB < δ < dA. Chiaramente due metriche equivalenti sono anche topologicamente equivalenti, ma il viceversa non vale.
In questo testo, se non esplicitamente dichiarato altrimenti, useremo semplicemente “metriche equivalenti” per “metriche
topologicamente equivalenti”.
5.1. SPAZI METRICI, OMOTETIE E ISOMETRIE 103

Esempio 5.1.12. In R2 la metrica Euclidea e quella dei raggi non sono equivalenti, ad esempio la
semiretta {x > 0, y = 0} è aperta per la metrica dei raggi ma non per quella Euclidea.
Esempio 5.1.13. Se (X, d) è uno spazio metrico, allora d e arctan(d) sono metriche equivalenti.
In particolare, se si è interessati solo alla topologia di uno spazio, si può sempre suppore che d sia
limitata.
Esempio 5.1.14. Se (X, d) è uno spazio metrico, si può fare lo zoom out/in (come in Google Earth).
Formalmente, per ogni t > 0 si definisce la metrica td ottenuta moltiplicando d per il fattore t.
Chiaramente d e td sono topologicamente equivalenti.
Definizione 5.1.15 (Metrica indotta da una funzione). Dato un insieme Y e uno spazio metrico
(X, d), ogni funzione iniettiva f : Y → X induce una distanza df su Y definita da
df (a, b) = d(f (a), f (b))
df si chiama distanza indotta da f su Y o distanza pull-back.
Esempio 5.1.16. Se Y ⊆ X e d è una distanza su X, allora la distanza d|Y non è altro che la
metrica indotta su Y dall’inclusione Y ,→ X. D’altra parte, se f : Y → X è iniettiva, essa identifica
(insiemisticamente) Y con un sottoinsieme di X.
Definizione 5.1.17. Siano (X, d) e (Y, δ) due spazi metrici. Una funzione f : X → Y si dice
immersione omotetica di fattore t > 0 se per ogni a, b ∈ X si ha
δ(f (a), f (b)) = td(a, b).
Se t = 1 si dice immersione isometrica. Un’immersione omotetica suriettiva si dice omotetia. Un’im-
mersione isometrica suriettiva si dice isometria.
Teorema 5.1.18. Un’immersione omotetica è continua e iniettiva. Un’omotetia è un omeomorfismo. (In
particolare lo sono anche le isometrie).
D IMOSTRAZIONE . Per l’iniettività, siccome t è non nullo si ha
f (x) = f (y) ⇒ 0 = δ(f (x), f (y)) = td(x, y) ⇒ d(x, y) = 0 ⇒ x = y.
Inoltre, se xi → x allora
δ(f (xi ), f (x)) = td(xi , x) → 0
quindi f (xi ) → f (x) e f è continua. Infine, se f è suriettiva allora è biunivoca e f −1 è un’omotetia di
fattore 1/t, dunque continua. 
Esempio 5.1.19. Sia X = [0, 2π) con la metrica standard e sia Y = S 1 = {z ∈ C : |z| = 1} munito
della metrica angolare (cioè la distanza tra z, w ∈ S 1 è la misura, in radianti, dell’angolo acuto formato
da z e w). Sia f : X → Y data da f (x) = eix . f è continua e biunivoca ma f −1 non è continua. Infatti
se xn = 2π − n1 si ha che zn = f (xn ) → 1 ma f −1 (zn ) = xn non tende a 0 = f −1 (1). Se invece
consideriamo la restrizione di f a Z = [0, π) ⊆ X, essa risulta un’immersione isometrica di Z in S 1 .
Ciò non deve stupire perché [0, 2π) con la metrica standard non è omeomorfo a S 1 in quanto il
secondo è compatto mentre il primo no.
Esempio 5.1.20. Sia X = [0, 2π) con la metrica
d(x, y) = inf{|x − y|, |x| + |2π − y|, |y| + |2π − x|}
e sia Y = S 1 = {z ∈ C : |z| = 1} munito della metrica angolare. Sia f : X → Y data da f (x) = eix .
f è un’isometria infatti la metrica d è esattamente la metrica pull-back di quella angolare. Con questa
metrica, X risulta quindi omeomorfo a S 1 , e in particolare compatto. Questa metrica non è quindi
equivalente a quella Euclidea su X.
104 5. TOPOLOGIA DEGLI SPAZI METRICI

5.2. Proprietà di separazione degli spazi metrici e metrizzabilità


Le principali proprietà di separazione e numerabilità degli spazi metrici viste sin ora sono:
(1) Gli spazi metrici sono T2 (Esempio 1.6.4). In particolare i punti son chiusi e i limiti sono unici
(Teoremi 1.6.12 e 1.6.11).
(2) Ogni spazio metrico è localmente numerabile: Per ogni x, l’insieme B(x, 1/n) è un sistema
fondamentale di intorni numerabile. (Van bene anche i raggi razionali, come nell’Esem-
pio 1.5.4.)
(3) Se A è un sottoinsieme di uno spazio metrico, i punti di aderenza di A sono tutti e soli i limiti
di successioni a valori in A. (Teorema 1.5.8.)
(4) Uno spazio metrico è separabile se e solo se è a base numerabile (Teoremi 1.5.13 e 1.5.14).
Vediamo ora una nuova proprietà degli spazi metrici, che si può considerare un raffinamento
della proprietà T2 .
Definizione 5.2.1. Uno spazio topologico X si dice regolare se per ogni chiuso C e per ogni x ∈/C
esistono aperti disgiunti contenenti l’uno x e l’altro C. X si dice T3 , o Hausdorff regolare, se esso è
T2 e regolare.
Esempio 5.2.2. La banale su R è regolare ma non T2 : gli unici chiusi sono il vuoto e il tutto; se C
è il tutto non esistono punti fuori da C, quindi ogni frase ∀x ∈ / C . . . è vera; se C è il vuoto, gli aperti
cercati sono il vuoto e il tutto.
Esempio 5.2.3. La topologia dell’Esempio 3.1.23 è T2 ma non T3 .
Teorema 5.2.4. Ogni spazio metrico è regolare, ergo T3 .
D IMOSTRAZIONE . Sia X uno spazio metrico, x ∈ X e C ⊆ X chiuso. Siccome x ∈ C c che è
aperto, esiste ε > 0 tale che B(x, ε) ⊆ C c . In particolare gli aperti
U = B(x, ε/3) V = D(x, 2ε/3)c = {y ∈ X : d(x, y) > 2ε/3}
sono disgiunti, x ∈ U e C ⊆ V . 
Definizione 5.2.5. Una topologia si dice metrizzabile se è indotta da una metrica.
Esempio 5.2.6. La topologia discreta su un insieme X è sempre metrizzabile. Infatti basta consi-
derare la metrica 0/1. Per questa metrica i punti sono aperti: {x} = B(0, 1/2). Ne segue che per ogni
A ⊆ X si ha A = ∪x∈A {x} e quindi A è aperto in quanto unione di aperti. Dunque ogni sottoinsieme
di X è aperto.
Le proprietà degli spazi metrici sono evidentemente delle condizioni necessarie affinché una
topologia sia metrizzabile.
Esempio 5.2.7. Se X ha almeno due elementi, la topologia banale su X non è metrizzabile. Infatti
in uno spazio metrico i punti sono chiusi mentre nella banale gli unici chiusi sono il vuoto e il tutto.
Esempio 5.2.8. La topologia cofinita su un insieme X è metrizzabile se e solo se X è finito. Infatti
se X è finito la topologia cofinita coincide con quella discreta, che è sempre metrizzabile. Se X è
infinito e A, B sono aperti non vuoti si ha
](A ∩ B)c = ](Ac ∪ B c ) ≤ ]Ac + ]B c < ∞
e siccome X è infinito ne segue che A ∩ B 6= ∅. In altre parole due aperti non vuoti si intersecano sem-
pre. Ma in uno spazio metrico con almeno due punti si trovano sempre aperti non vuoti e disgiunti
poiché i metrici son T2 . (Lo stesso argomento vale per la topologia di Zariski.)
Esempio 5.2.9. lo spazio ottenuto da R collassando Z a un punto non è metrizzabile perché non è
localmente numerabile (Esempio 2.2.11).
5.3. CAMMINI, LUNGHEZZE E GEODETICHE 105

Diamo adesso l’enunciato — ma non la dimostrazione — del più famoso dei teoremi di metriz-
zazione, che fornisce delle condizioni sufficienti di metrizzabilità.
Teorema 5.2.10 (Teorema di Uryshon). Ogni spazio T3 a base numerabile è metrizzabile.
Teorema 5.2.11. Uno spazio di Hausdorff compatto è regolare, ergo T3 .
D IMOSTRAZIONE . Sia X uno spazio compatto e T2 . Sia x ∈ X e C un chiuso di X. {x} è compatto
e per il Teorema 3.1.19, anche C lo è. Per il Teorema 3.1.22 x e C si separano con aperti. 
Corollario 5.2.12. Ogni spazio compatto T2 a base numerabile è metrizzabile.
Si noti che la metrica dei raggi su R2 induce una topologia che non è a base numerabile. (Per
il Teorema 1.5.15). Quindi il viceversa del Teorema di Uryshon non è vero. Visto però che gli spazi
metrici sono separabili se e solo se sono a base numerabile, si può rienunciare il Teorema di Uryshon
come segue:
Teorema 5.2.13 (Uryshon). Uno spazio topologico è metrizzabile e separabile se e solo se è T3 e a base
numerabile.
Corollario 5.2.14. Ogni varietà topologica è metrizzabile.
D IMOSTRAZIONE . Se X è una varietà topologica allora è T2 e ha base numerabile per definizione.
Vediamo la regolarità. Sia x ∈ X e sia C un chiuso di X non contenente x. Sia U un intorno di x
omeomorfo a un aperto di Rn . Quindi U è metrizzabile. Siccome x ∈ U \ C e C è chiuso, esiste ε > 0
tale che B(x, ε) ⊆ U \ C. Gli aperti B(x, ε/2) e (D(x, ε/2))c (ove il complementare è fatto in tutto X)
separano x da C. 
Esistono anche dei teoremi che forniscono delle condizioni necessarie e sufficienti per la metriz-
zabilità tout court, senza tener conto della separabilità, ma noi fermiamo qua il nostro excursus in
questa direzione.2

5.3. Cammini, lunghezze e geodetiche


In questa sezione per cammino si intenderà una funzione continua parametrizzata con un inter-
vallo [a, b] che non sia necessariamente [0, 1] (come definito precedentemente in 4.3.1).
Esempio 5.3.1. La funzione γ(x) = eix è un cammino da [0, 2π] a C che descrive una circonferenza.
Esempio 5.3.2. Sia ρ : [0, 1] → R una funzione continua monotona decrescente con ρ(0) = 1 e
ρ(1) = 0. Sia θ : [0, 1] → R una funzione continua monotona crescente. Il cammino γ[0, 1] → C dato
da γ(x) = ρ(x)eiθ(x) descrive una spirale in C.
Esempio 5.3.3 (curva di Koch). La curva a fiocco di neve di Koch (Figura 1) è definita ricorsiva-

F IGURA 1. La curva di Koch. Per fare un fiocco di neve si fa questa costruzione su


ogni lato di un trianglo equilatero.

mente cosı̀: Si parte da un segmento orizzontale; ad ogni passo si divide ogni segmento in tre, si
cancella il terzo centrale e lo si rimpiazza con gli altri due lati di un triangolo equilatero. Ad ogni
passo abbiamo una curva poligonale e quindi continua. La curva di Koch risulta limite uniforme di
tali poligonali e quindi è un cammino continuo.
2Il lettore incuriosito può cercare i teoremi di metrizzabilità di Bing e di Nagata-Smirnov. Entrambi si basano su una
particolare proprietà locale di numerabilità.
106 5. TOPOLOGIA DEGLI SPAZI METRICI

Dato un segmento [a, b] una suddivisione finita di [a, b] è una scelta di punti x0 = a < x1 < · · · <
xk = b. In questo modo [a, b] = ∪i [xi−1 , xi ].
Definizione 5.3.4 (Lunghezza di cammini). Sia (X, d) uno spazio metrico. Dato un cammino
γ : [a, b] → X, la sua lunghezza è definita come
k
X
L(γ) = sup d(γ(xi ), γ(xi−1 ))
a=x0 <x1 <x2 <···<xk =b i=1

ove il sup è calcolato su tutte le possibili suddivisioni di [a, b]. La lunghezza di γ, in quanto sup di
quantità positive, è un numero in [0, ∞]. Un cammino γ si dice rettificabile se L(γ) < ∞.
Esempio 5.3.5. La curva di Kock non è rettificabile perché se pn è la poligonale ennesima che
approssima la curva di Koch, si ha
 n
4 4
L(pn+1 ) = L(pn ) = L(p1 ) → ∞.
3 3
In R2 le curve differenziabili o poligonali sono tutte rettificabili.
p
Esempio 5.3.6. Sia X = [0, 1] con la metrica d(x, y) = |x − y|. Gli unici cammini rettificabili
in X sono quelli costanti. (Anche se X è omeomorfo al suo omologo Euclideo, come si dimostrerà
nell’Esercizio 5.8.7.)
D IMOSTRAZIONE . Sia γ : [a, b] → X un cammino non costante. In particolare esistono a0 , b0 ∈
(a, b) tali che γ(a0 ) < γ(b0 ). Non è restrittivo supporre a0 < b0 . Per ogni k ∈ N sia γ(a0 ) = xk0 <
xk1 < · · · < xkk = γ(b0 ) una suddivisione di [γ(a0 ), γ(b0 )] tale che |xki − xki−1 | = |γ(b0 ) − γ(a0 )|/k
e sia a0 < ak1 < · · · < akk = b0 una suddivisione di [a0 , b0 ] tale che γ(aki ) = xki . (Per esempio
aki = inf{t > aki−i : γ(t) = xki }.) Si ha
r
X X |γ(b0 ) − γ(a0 )| √ p
L(γ) ≥ d(γ(aki ), γ(aki−1 )) = d(xki , xki−1 ) = k = k |γ(b0 ) − γ(a0 )| → ∞
i i
k
e quindi L(γ) = ∞. 
Definizione 5.3.7 (Metrica dei cammini). Sia (X, d) uno spazio metrico. La metrica dei cammini
indotta da d su X è definita come
δ(x, y) = inf{L(γ) al variare di γ : [a, b] → X : γ(a) = x, γ(b) = y}
ponendo d(x, y) = ∞ se non ci sono cammini rettificabili da x a y.
Questa è una di quelle “distanze” che può assumere il valore ∞. A parte questo tutte le altre
proprietà di una distanza sono soddisfatte. In particolare (come discusso nella Sezione 0.2) se per
ogni x ∈ X definiamo l’insieme Mx = {y ∈ X : δ(x, y) < ∞}, allora la restrizione di δ ad ogni Mx è
una distanza vera e propria. Nell’Esempio 5.3.6 si ha Mx = {x} per ogni x ∈ [0, 1]. Alternativamente,
se si è interessati solo agli aspetti topologici e non metrici, si può usare il Teorema 5.1.5 e riscalare la
metrica dei cammini con l’arcotangente: questa volta la metrica avrà valori in [0, π/2].
Definizione 5.3.8. Uno spazio metrico (X, d) si dice geodetico (o semplicemente che d è geodeti-
ca) se
• d coincide con la distanza dei cammini indotta da d (che chiamiamo δ);
• per ogni x, y ∈ X esiste un cammino γ : [a, b] → X con γ(a) = x, γ(b) = y e L(γ) = δ(x, y).
Esempio 5.3.9. La distanza della città è geodetica.
Esempio 5.3.10. La distanza dei raggi di bicicletta è geodetica.
Esempio 5.3.11. La distanza dei raggi su R2 è geodetica.
5.4. SUCCESSIONI DI CAUCHY E COMPLETEZZA 107

Esempio 5.3.12. S 2 con la distanza angolare è geodetico.


Esempio 5.3.13. S 2 con la distanza indotta da R3 non è geodetico.
Esempio 5.3.14. La metrica dell’Esempio 5.3.6 non è geodetica.

5.4. Successioni di Cauchy e completezza


Definizione 5.4.1 (Successione di Cauchy). Sia (X, d) uno spazio metrico. Una successione (xi )i∈N
in X si dice di Cauchy se
∀ε > 0∃n0 : ∀m, n > n0 d(xn , xm ) < ε.
Esempio 5.4.2. La successione xn = 1/n è di Cauchy perché xn − xm = (m − n)/nm → 0.
Esempio 5.4.3. La successione xn = (−1)n non è di Cauchy perché d(xn , xn+1 ) = 2 6→ 0.
Esempio 5.4.4. La successione xn = (1, 1/n) è di Cauchy in R2 standard, ma non per la metrica dei
raggi.
Teorema 5.4.5. Negli spazi metrici, ogni successione convergente è di Cauchy.
D IMOSTRAZIONE . Sia (xi ) una successione convergente a un punto x. Per la disuguaglianza
triangolare
d(xi , xj ) ≤ d(xi , x) + d(x, xj ) → 0.

Teorema 5.4.6. Sia (X, d) uno spazio metrico e sia (xi ) una successione di Cauchy avente una sottosuc-
cessione convergente a un punto x ∈ X. Allora (xi ) converge a x.
D IMOSTRAZIONE . Se xin → x è una sottosuccessione convergente, dalla disuguaglianza triango-
lare
d(xi , x) ≤ d(xi , xin ) + d(xin , x).
d(xi , xin ) → 0 perché la successione è di Cauchy; d(xin , x) → 0 perché xin → x. 
Definizione 5.4.7. Uno spazio metrico (X, d) si dice completo se ogni successione di Cauchy in
X è convergente.
Esempio 5.4.8. Q non è completo: una successione di razionali che approssima π è di Cauchy ma
non ha limite in Q.
Esempio 5.4.9. (0, 1) ⊆ R standard non è completo: la successione ( n1 ) è di Cauchy ma non
converge in (0, 1).
Esempio 5.4.10. R2 \ {0} con la metrica standard non è completo.
Teorema 5.4.11 (Completezza di R). R con la metrica standard è completo.
D IMOSTRAZIONE . Sia (xn ) ⊂ R una successione di Cauchy. Esiste quindi n0 tale che per ogni
n, m ≥ n0 si ha d(xm , xn ) < 1. In particolare xn ∈ [xn0 − 1, xn0 + 1] definitivamente. Siccome
[xn0 −1, xn0 +1] è omeomorfo a [0, 1], esso è compatto (Teorema 3.1.13). Siccome R ha base numerabile,
[xn0 −1, xn0 +1] è compatto per successioni (Teorema 3.4.9). Ne segue che (xn ) ha una sottosuccessione
convergente a un punto x∞ ∈ [xn0 − 1, xn0 + 1]. Per il Teorema 5.4.6 l’intera successione (xn ) converge
a x∞ . 
Esercizio 5.4.12. Si dimostri la completezza di R senza usare la compattezza di [0, 1].
Si noti che la completezza è una proprietà metrica e non topologica: R e (0, 1) sono omeomorfi
tra loro, ma uno e completo e l’altro no.
108 5. TOPOLOGIA DEGLI SPAZI METRICI

Teorema 5.4.13. Sia A un sottoinsieme di un uno spazio metrico completo X. Allora A è chiuso se e solo
se è completo.
D IMOSTRAZIONE . A è chiuso se e solo se contiene i limiti delle successioni in A (Teorema 1.5.8).
Supponiamo A chiuso e sia (ai ) una successione di Cauchy in A. Ovviamente essa è di Cauchy anche
in X. Siccome X è completo, esiste x ∈ X tale che ai → x. Siccome A è chiuso, x ∈ A. Dunque ogni
successione di Cauchy in A è convergente e quindi A è completo.
Viceversa, supponiamo A completo. Sia x ∈ X un limite di una successione (ai ) in A. Siccome
ai → x allora (ai ) è di Cauchy. Siccome A è completo allora la successione (ai ) ha un limite a ∈ A.
Per l’unicità del limite a = x e quindi x ∈ A. 
Esempio 5.4.14. L’insieme di Cantor, il tappeto e la guarnizione di Sierpinski, con le metriche
standard indotte da R e R2 rispettivamente, sono completi.
Teorema 5.4.15. Sia X un insieme e Y uno spazio metrico completo. Allora lo spazio Y X delle funzioni
da X a Y con la metrica del sup
d∞ (f, g) = sup d(f (x), g(x))
x∈X
è completo.3
D IMOSTRAZIONE . Sia fn una successione di Cauchy in Y X . Facciamo vedere che ha un limite.
Per ogni x ∈ X la successione fn (x) è di Cauchy perché
d(fn (x), fm (x)) ≤ sup d(fn (t), fm (t)) = d∞ (fn , fm ).
t∈X

Siccome Y è completo esiste un punto f∞ (x) tale che fn (x) → f∞ (x). Chiaramente f∞ è una funzione
da X a Y . Inoltre per ogni x ∈ X e per ogni m, n ∈ N
d(fn (x), f∞ (x)) ≤ d(fn (x), fm (x)) + d(fm (x), f∞ (x)) ≤ d∞ (fn , fm ) + d(fm (x), f∞ (x))
e considerando il limite per m → ∞ si ottiene che per ogni x ∈ X e n ∈ N si ha
d(fn (x), f∞ (x)) ≤ lim d∞ (fn , fm )
m→∞
per cui
d∞ (fn , f∞ ) = sup d(fn (x), f∞ (x)) ≤ lim d∞ (fn , fm )
x∈X m→∞

che tende a zero se n → ∞ perché la successione fn è di Cauchy. Quindi fn → f∞ in (Y X , d∞ ).



Concludiamo questa sezione con un classico della teoria degli spazi metrici.
Definizione 5.4.16. Una funzione tra spazi metrici f : (X, d) → (Y, δ) si dice contrazione se esiste
0 < c < 1 tale che d(f (x), f (y)) ≤ cd(x, y). (Quindi f contrae le distanze.)
Le contrazioni sono continue infatti se xi → x allora d(f (xi ), f (x)) ≤ cd(xi , x) → 0.
Teorema 5.4.17 (Delle contrazioni). Sia (X, d) uno spazio metrico completo (non vuoto) e sia f : X →
X una contrazione. Allora f ha un punto fisso. Inoltre, esso è l’unico punto fisso di f .
D IMOSTRAZIONE . Sia x0 ∈ X un punto qualsiasi e sia xn = f n (x0 ).
d(x0 , f m (x0 )) ≤ d(x0 , f (x0 )) + d(f (x0 ), f 2 (x0 )) + · · · + d(f m−1 (x0 ), f m (x0 ))
X 1
≤ d(x0 , f (x0 ))( ci ) ≤ d(x0 , f (x0 )) .
i
1 − c

3A voler essere precisi, in generale la metrica del sup su Y X è una di quelle che ha valori in [0, ∞]. Ma se (f ) è una
n
successione di Cauchy, esiste n0 tale che per ogni n ≥ n0 si ha d(fn , fn0 ) < ∞. Nel nostro caso possiamo quindi supporre
che d∞ assuma solo valori finiti.
5.5. COMPLETAMENTO METRICO 109

Siccome c < 1, allora cn → 0 e visto che d(x0 , f m (x0 )) è limitato indipendentemente da m, si ha


d(xn , xn+m ) = d(f (xn−1 ), f (xn−1+m )) ≤ cd(xn−1 , xn−1−m ) ≤ · · · ≤ cn d(x0 , f m (x0 )) → 0.
Quindi la successione (xn ) è di Cauchy. Siccome X è completo, esiste z ∈ X tale che f n (x0 ) → z.
Siccome le contrazioni sono continue f (z) = lim f (f n (x0 )) = lim f n (x0 ) = z e quindi z è un punto
fisso di f . Se w è un altro punto fisso si ha
d(z, w) = d(f (z), f (w)) < cd(z, w)
siccome c < 1 ciò implica d(z, w) = 0, ergo z = w. 

5.5. Completamento metrico


In pratica l’unico modo per avere spazi non completi è partire da uno spazio completo e togliere
roba. Altrimenti detto, ogni spazio metrico si può completare. Il bello è che il completamento metrico
è unico (a meno di isometrie).
Lemma 5.5.1 (Lemma del rettangolo). Sia (X, d) uno spazio metrico e siano x1 , x2 , y1 , y2 ∈ X allora
|d(x1 , y1 ) − d(x2 , y2 )| ≤ d(x1 , x2 ) + d(y1 , y2 )

x2 y2

x1 y1

D IMOSTRAZIONE . Per la disugualianza triangolare


d(x1 , y1 ) ≤ d(x1 , x2 ) + d(x2 , y2 ) + d(y2 , y1 ) da cui d(x1 , y1 ) − d(x2 , y2 ) ≤ d(x1 , x2 ) + d(y1 , y2 )

d(x2 , y2 ) ≤ d(x2 , x1 ) + d(x1 , y1 ) + d(y1 , y2 ) da cui d(x2 , y2 ) − d(x1 , y1 ) ≤ d(x1 , x2 ) + d(y1 , y2 )


dunque
|d(x1 , y1 ) − d(x2 , y2 )| ≤ d(x1 , x2 ) + d(y1 , y2 ).


Corollario 5.5.2. Siano (xi ) e (yi ) due successioni di Cauchy in uno spazio metrico. Allora esiste il limite
lim d(xi , yi ).
i

D IMOSTRAZIONE . Siccome sono entrambe successioni di Cauchy, per ogni ε > 0 esiste nε > 0
tale che per ogni m, n > nε si ha
d(xn , xm ) < ε/2 d(yn , ym ) < ε/2
Per il Lemma 5.5.1 del rettangolo
|d(xn , yn ) − d(xm , ym )| ≤ ε
Quindi la successione dn = d(xn , yn ) è di Cauchy in R e quindi converge. 

Teorema 5.5.3 (del completamento metrico). Per ogni spazio metrico (X, d) esiste uno spazio metrico
completo (Y, δ) tale che:
(1) Esiste un’immersione isometrica f : X → Y ;
(2) l’immagine di f è densa in Y .
Inoltre, ogni spazio metrico completo con le due proprietà elencate è isometrico a (Y, δ).
110 5. TOPOLOGIA DEGLI SPAZI METRICI

D IMOSTRAZIONE . L’idea della dimostrazione è molto semplice: Y è lo spazio di tutte le succes-


sioni di Cauchy di X, dotato della metrica ovvia. I dettagli però, richiedono molto lavoro e notazioni
un po’ pesanti.
Sia S l’insieme di tutte le successioni di Cauchy di X. Su S × S definiamo la seguente funzione
D((xi ), (yi )) = lim d(xi , yi )
i

(che è ben definita per il Corollario 5.5.2.) La funzione D gode delle seguenti proprietà:
• D ≥ 0;
• D((xi ), (yi )) = D((yi ), (xi ));
• D((xi ), (yi )) ≤ D((xi ), (zi )) + D((zi ), (yi )) (perché la disuguaglianza d(xn , yn ) ≤ d(xn , zn ) +
d(zn , yn ) è vera per ogni n e passa al limite.)
Quindi D è una pseudo distanza (manca la separazione dei punti e infatti, data una qualunque suc-
cessione (xi ), basta cambiargli il primo termine ed otteniamo una successione diversa ma a distanza
nulla da essa). Per ottenere una distanza si usa un procedimento standard in questi casi: Su S si
definisce la relazione di equivalenza (xi ) ∼ (yi ) se D((xi ), (yi )) = 0. Si vede facilmente, attraverso
la disuguaglianza triangolare, che D induce una funzione, che chiameremo sempre D, sulle classi di
equivalenza.
Esercizio 5.5.4. Dimostrare che se (xi ) ∼ (x0i ) e (yi ) ∼ (yi0 ) allora D((xi ), (yi )) = D((x0i ), (yi0 )).
Definiamo Y = S/ ∼. A questo punto (Y, D) è uno spazio metrico.
Lemma 5.5.5. (Y, D) è completo.
D IMOSTRAZIONE . Sia (Si ) una successione di Cauchy in Y . Poniamo Si = [(xin )].
S1 : x11 x12 x13 ... x1n ...
S2 : x21 x22 x23 ... x2n ...
..
.
Sk : xk1 xk2 xk3 ... xkn ...
Siccome (Si ) è di Cauchy in Y , si ha:
• ∀ε > 0∃n : ∀i, j > n D(Si , Sj ) < ε. Sia n(ε) il più piccolo di tali n. Si noti che ε0 > ε ⇒
n(ε0 ) ≤ n(ε).
Siccome ogni (xin ) è di Cauchy in X, si ha:
• ∀ε > 0∀i∃l(i, ε) : ∀m, n > l(i, ε) d(xin , xim ) < ε.
Inoltre, dalla definizione di D(Si , Sj ) segue che per ogni i, j e per ogni ε > 0, |d(xin , xjn ) − D(Si , Sj )| <
ε per n sufficientemente grande, e possiamo richiedere che n sia “sufficientemente grande” per i primi
k casi considerati tutti insieme; in formule:
• ∀ε > 0∀k∃m(k, ε) : ∀i, j ≤ k, ∀m > m(k, ε) |d(xim , xjm ) − D(Si , Sj )| < ε.
Adesso usiamo un argomento diagonale. Scegliamo una successione εi → 0 per esempio εi =
1/2i . E scegliamo ni in modo che:
• ni+1 > ni
• ni > l(i, εi )
• ni > m(i, εi )
• ni > i.
Definiamo la successione (yj ) ponendo
yj = xjnj .
5.5. COMPLETAMENTO METRICO 111

Dobbiamo far vedere che (yj ) è di Cauchy in X e che Si → [(yj )] in Y . Vediamo che (yj ) è di Cauchy.
Per ogni ε > 0 se i, j sono sufficientemente grandi si ha ε − εi − εj > 0 e i, j > n(ε − εi − εj ). Quindi,
per j > i sufficientemente grandi si ha:

d(yi , yj ) = d(xini , xjnj ) ≤ d(xini , xinj ) + d(xinj , xjnj ) per la disuguaglianza triangolare
d(xini , xinj ) ≤ εi perché nj > ni > l(i, εi )
d(xinj , xjnj ) ≤ D(Si , Sj ) + εj perché nj > m(j, εj )
quindi d(yi , yj ) ≤ εi + D(Si , Sj ) + εj e dunque
d(yi , yj ) ≤ εi + D(Si , Sj ) + εj < ε perché i, j > n(ε − εi − εj )
Quindi (yj ) è di Cauchy in X. Vediamo adesso che Si → [(yj )] in Y . Per definizione
D(Si , [(yj )]) = lim d(xij , yj ) = lim d(xij , xjnj )
j→∞ j→∞

d(xij , xjnj ) ≤ d(xij , xinj ) + d(xinj , xjnj )


per ogni ε > 0 e per ogni i si ha che j > l(i, ε) definitivamente e quindi (siccome nj > j)
d(xij , xinj ) < ε.
Definitivamente j > i e siccome nj > m(j, εj ) si ha
d(xinj , xjnj ) < D(Si , Sj ) + εj
Se i > n(ε), siccome definitivamente j > i si ha D(Si , Sj ) < ε e dunque per ogni ε > 0
D(Si , [(yj )]) ≤ lim(d(xij , xinj ) + d(xinj , xjnj )) ≤ lim d(xij , xinj ) + lim d(xinj , xjnj )
j j j

≤ ε + lim(ε + εj ) = 2ε.
j
Quindi D(Si , [(yj )]) → 0, cioè Si → [(yj )]. 
La parte difficile è finita. Adesso che sappiamo che Y è completo vediamo l’immersione isome-
trica di f : X → Y . Basta porre f (x) = x̂ ove x̂ è la classe della successione costante x, x, x, x, . . .
Chiaramente D(x̂, ŷ) = d(x, y) e quindi f è un’immersione isometrica. Mostriamo ora che l’im-
magine di f è densa. Se S = [(xi )] ∈ Y , siccome (xi ) è di Cauchy, D(x̂j , (xi )) = limi→∞ d(xj , xi ), che
va a 0 per j → ∞. Quindi
f (xi ) = x̂i → S.
Infine sia (Z, h) uno spazio metrico completo tale che esista g : X → Z immersione isometrica
con immagine densa. Allora per ogni successione (xi ) di Cauchy in X, (g(xi )) è una successione di
Cauchy in Z. Poniamo
F :Y →Z F ([(xi )]) = lim g(xi )
Adesso è facile verificare che:
Esercizio 5.5.6. Dimostrare che F è ben definita sulle classi di equivalenza, cioè che se (xi ) ∼ (x0i )
allora lim g(xi ) = lim g(x0i ). (Si usa che g è immersione isometrica.)
Esercizio 5.5.7. Dimostrare che F è un’immersione isometrica. (Si usa la definizione di D e il fatto
che g sia isometrica.)
Esercizio 5.5.8. Dimostrare che F è suriettiva. (Si usa il fatto che g abbia immagine densa e che le
successioni convergenti sono di Cauchy.)
Questi tre esercizi concludono in quanto le immersioni isometriche suriettive sono isometrie.

112 5. TOPOLOGIA DEGLI SPAZI METRICI

Teorema 5.5.9. Sia (X, d) uno spazio metrico completo. Sia A ⊆ X. Allora il completamento metrico di
A è la sua chiusura in X.
D IMOSTRAZIONE . Per il Teorema 5.4.13 Ā è completo e A è denso in Ā. 
L’inclusione è un caso particolare di immersione isometrica.
Corollario 5.5.10. Sia A uno spazio metrico, sia X uno spazio metrico completo e sia f : A → X
un’immersione isometrica. Allora il completamento metrico di A è la chiusura dell’immagine di f .
D IMOSTRAZIONE . Siccome f è un’immersione isometrica, A è isometrico a f (A), il cui comple-
tamento metrico è f (A) per il Teorema 5.5.9. 
Esempio 5.5.11. Sia X = R con la metrica d(x, y) = | arctan x−arctan y|. Il completamento metrico
di X è [−π/2, π/2] in quanto arctan : X → R è un’immersione isometrica con immagine (−π/2, π/2).
Esempio 5.5.12. Sia X = R con la metrica d(x, y) = |(ei arctan x )2 − (ei arctan y )2 |. Il completamento
metrico di X è S 1 = {z ∈ C : |z| = 1} in quanto f (x) = e2i arctan x è un’immersione isometrica da X
in C la cui immagine è S 1 \ {−1}. La chiusura dell’immagine di f è dunque S 1 .

5.6. Compattezza in spazi metrici


Il Corollario 3.1.28 fornisce la familiare caratterizzazione dei compatti di Rn Euclideo come chiusi
e limitati. La cosa si generalizza agli spazi metrici rimpiazzando la limitatezza con una condizione
leggermente più forte. Inoltre vedremo che negli spazi metrici la nozione di compattezza e quella di
compattezza per successioni coincidono.
Lemma 5.6.1. (X, d) compatto ⇒ (X, d) compatto per successioni ⇒ (X, d) completo.
D IMOSTRAZIONE . Siccome gli spazi metrici sono localmente numerabili, per il Corollario 3.4.8, se
X è compatto allora è compatto per successioni. Se X è compatto per successioni, ogni successione di
Cauchy ha una sottosuccessione convergente e per il Teorema 5.4.6, essa è globalmente convergente.
Quindi X è completo. 
Definizione 5.6.2. Sia X uno spazio metrico e A ⊆ X. A si dice limitato se esistono x ∈ X e r ∈ R
tale che A ⊆ B(x, r).
In particolare, uno spazio metrico X è limitato se X = B(x, r) per un certo x ∈ X e r ∈ R. Il
vuoto si considera limitato.
Esempio 5.6.3. X = [0, 1] × [0, 1] con la metrica Euclidea è limitato.
Teorema 5.6.4. Sia A un sottoinsieme compatto di uno spazio metrico. Allora A è chiuso e limitato.
D IMOSTRAZIONE . A è chiuso per il Teorema 3.1.20 perché i metrici son T2 . Se A è vuoto è limitato.
Altrimenti, sia a ∈ A e sia U = {B(a, n) : n ∈ N}. Siccome A è compatto, U ha un sottoricoprimento
finito, in particolare A è contenuto in una palla centrata in a, ergo limitato. 
Occhio ché i chiusi e limitati non son sempre compatti!
Esempio 5.6.5. In R2 con la metrica dei raggi, sia X = B(0, 1). Esso è chiuso, limitato ma non
compatto.
D IMOSTRAZIONE . Sia S = {0} ∪ {x ∈ R2 : d(0, x) = 1} e sia U = {B(x, 1)}x∈S . Chiaramente U è
un ricoprimento aperto di X. Inoltre ogni elemento di S è contenuto in uno e un solo elemento di U.
Siccome S ⊂ X è infinito, nessuna sottofamiglia finita di U può ricoprire X. 
Definizione 5.6.6. Uno spazio metrico si dice totalmente limitato se per ogni ε > 0 esiste un
ricoprimento finito di palle aperte di raggio al più ε.
5.6. COMPATTEZZA IN SPAZI METRICI 113

Esempio 5.6.7. Ogni limitato di Rn standard è totalmente limitato.


Esempio 5.6.8. L’insieme X dell’Esempio 5.6.5 non è totalmente limitato.
Lemma 5.6.9. (X, d) compatto per successioni ⇒ (X, d) totalmente limitato.
D IMOSTRAZIONE . Se X non è totalmente limitato, allora esiste ε > 0 tale che non esistono rico-
primenti finiti con palle di raggio al più ε. Si può quindi costruire una successione xn tale che xn stia
nel complementare di ∪i<n B(xi , ε). In particolare d(xn , xm ) > ε per ogni n > m e quindi xn non
possiede sottosuccessioni convergenti. Quindi X non è compatto per successioni. 
Lemma 5.6.10. Ogni spazio metrico totalmente limitato è limitato.
D IMOSTRAZIONE . Sia X uno spazio metrico totalmente limitato. In particolare esiste n ∈ N e
x1 , . . . , xn ∈ X tali che X = ∪B(xi , 1). Per la disuguaglianza triangolare X = B(x1 , 2n). 
Lemma 5.6.11. (X, d) totalmente limitato ⇒ (X, d) separabile (e quindi a base numerabile).
D IMOSTRAZIONE . Siccome X è totalmente limitato, per ogni n esiste un ricoprimento fatto di
palle di raggio al più 1/n; sia Cn l’insieme, finito, dei centri di tali palle. Sia C = ∪n Cn . C è un
insieme numerabile, vediamo che è denso in X. Sia x ∈ X. Siccome le palle di raggio 1/n centrate nei
punti di Cn ricoprono X, per ogni n esiste cn ∈ Cn tale che d(cn , x) < 1/n. Quindi cn → x. (La parte
dell’enunciato tra parentesi segue dal Teorema 1.5.14.) 
Esempio 5.6.12. Sia X = Z con la metrica 0/1. Esso è tautologicamente limitato e separabile.
Inoltre le uniche successioni di Cauchy sono quelle definitivamente costanti, in particolare sono con-
vergenti e quindi X è completo. X non è però totalmente limitato perché ogni x ∈ X è contenuto in
una sola palla di raggio 1/2 e siccome X è infinito, non può essere ricoperto da un numero finito di
tali palle.
Lemma 5.6.13. Sia (X, d) uno spazio metrico totalmente limitato. Allora ogni successione in X ha una
sottosuccessione di Cauchy.
D IMOSTRAZIONE . Sia xn una successione in X. Siccome X è totalmente limitato esiste un rico-
primento finito di X fatto di palle di raggio al più 1/2. Per il principio dei cassetti c’è una sottosucces-
sione di {xn } che sta tutta dentro una di queste palle, che chiamiamo B1 . Sia I1 ⊆ N l’insieme degli
indici i tali che xi ∈ B1 .
Definiamo Bk e Ik ⊆ Ik−1 induttivamente. Siccome X è totalmente limitato, per ogni k esiste un
ricoprimento finito di X fatto di palle di raggio al più 1/2k . Per il principio dei cassetti esiste una
palla Bk di raggio al più 1/2k e un sottoinsieme infinito Ik ⊆ Ik−1 tale che xi ∈ Bk per ogni i ∈ Ik .
Sia ora i1 il primo elemento di I1 e definiamo ricorsivamente ik come il primo elemento di Ik
maggiore di ik−1 . La sottosuccessione {xik } è di Cauchy perché xis ∈ Bk per ogni s ≥ k e il raggio di
Bk tende a zero. 
Teorema 5.6.14. Sia (X, d) uno spazio metrico. Allora
X è compatto ⇔ X è compatto per successioni ⇔ X è completo e totalmente limitato.
D IMOSTRAZIONE . Sia X uno spazio metrico compatto. Per il Lemma 5.6.1 X è compatto per
successioni e completo. Per il Lemma 5.6.9 X è totalmente limitato.
Viceversa, se X è completo e totalmente limitato, dal Lemma 5.6.13 segue che ogni successio-
ne in X ha una sottosuccessione convergente, per cui X è compatto per successioni. Siccome X è
totalmente limitato, per il Lemma 5.6.11 esso è separabile e per il Teorema 3.4.9 è compatto. 
Corollario 5.6.15. Sia A un sottoinsieme di uno spazio metrico completo X. Allora A è compatto se e solo
se è chiuso e totalmente limitato.
D IMOSTRAZIONE . Per il Teorema 5.4.13 A è chiuso se e solo se è completo. Il Teorema 5.6.14
conclude. 
114 5. TOPOLOGIA DEGLI SPAZI METRICI

5.7. Teorema di Ascoli-Arzelà


Una conseguenza famosa del Teorema 5.6.14 è il celebre teorema di Ascoli-Arzelà, che si può
enunciare brevemente dicendo che ogni successione di funzioni equicontinue ed equilimitate am-
mette una sottosuccessione convergente. (Si veda più sotto per un enunciato preciso.)
Definizione 5.7.1. Un sottoinsieme A di uno spazio topologico X si dice relativamente compatto
se la sua chiusura in X è compatta.
Esempio 5.7.2. Per il Teorema 3.1.19 ogni sottoinsieme di uno spazio compatto è relativamente
compatto.
Definizione 5.7.3 (ε-net). Un ε-reticolo (o ε-net) in uno spazio metrico X è un sottoinsieme Y ⊆ X
tale che
∀x ∈ X∃y ∈ Y : d(x, y) < ε.
In altre parole, Y è un ε-reticolo se la famiglia {B(y, ε)}y∈Y è un ricoprimento di X.
Con questa terminologia, uno spazio metrico è totalmente limitato se per ogni ε > 0, esso contiene
un ε-reticolo finito.
Lemma 5.7.4. Sia A ⊆ (X, d) un sottoinsieme totalmente limitato. Allora A è totalmente limitato.
D IMOSTRAZIONE . Sia ε > 0. Per ogni x ∈ A esiste a ∈ A tale che d(x, a) < ε/2. Per ipotesi A con-
tiene un ε/2-reticolo finito {a1 , . . . , an }. Esiste quindi ai tale che d(a, ai ) < ε/2. Per la disuguaglianza
triangolare d(x, ai ) < ε. Dunque {a1 , . . . , an } è un ε-reticolo finito in A. 
Definizione 5.7.5. Il diametro di un sottoinsieme A di uno spazio metrico è l’esetremo superiore
delle distanze tra punti di A
diam(A) = sup{d(x, y) : x, y ∈ A}.
Teorema 5.7.6 (Ascoli-Arzelà). Siano X uno spazio compatto e Y uno spazio metrico. Sia F una famiglia
di funzioni da X a Y equicontinue ed equilimitate, e cioè tali che:
• Equilimitatezza: esiste un totalmente limitato A ⊆ Y tale che f (X) ⊆ A per ogni f ∈ F ;
• Equicontinutità: per ogni ε > 0 per ogni x ∈ X esiste un intorno Ux di x tale che per ogni f ∈ F il
diametro di f (Ux ) sia minore di ε.
Allora F è un insieme totalmente limitato rispetto alla metrica del sup di Y X . In particolare, se Y è completo
allora F è relativamente compatto.
D IMOSTRAZIONE . L’ultima affermazione deriva dal Lemma 5.7.4 e dal Corollario 5.6.15 perché
se Y è completo, allora Y X è completo (Teorema 5.4.15.)
Mostriamo ora che per ogni ε > 0 lo spazio F ha un 4ε-reticolo finito. Vista l’arbitrarietà di ε, ciò
sarà sufficiente. Sia {yi }i∈I un ε-reticolo finito in A. Per equicontinuità, ogni x in X ha un intorno
Ux tale che f (Ux ) ha diametro al più ε. Il ricoprimento aperto {Ux } ha un sotto ricoprimento finito
Ux1 , . . . , Uxn . Sia Σ l’insieme delle funzioni da {1, . . . , n} a I. Esso è chiaramente un insieme finito.
Ad ogni funzione f da X in A possiamo associare una (non unica in generale) σ(f ) ∈ Σ tale che
d(f (xi ), yσ(f )(i) ) < ε
per ogni i = 1, . . . , n.
Per ogni funzione σ ∈ Σ scegliamo, se esiste, una funzione fσ ∈ F tale che σ(fσ ) = σ.
L’insieme
{fσ : σ ∈ Σ}
è un 4ε-reticolo finito in F , con la metrica del sup di Y X . Infatti se g ∈ F , per ogni i = 1, . . . , n si ha:

d(g(xi ), fσ(g) (xi )) ≤ d(g(xi ), yσ(g)(i) ) + d(yσ(g)(i) , fσ(g) (xi )) < 2ε


5.8. ESERCIZI 115

e quindi se x ∈ Uxi
d(g(x), fσ(g) (x)) ≤ d(g(x), g(xi )) + d(g(xi ), fσ(g) (xi )) + d(fσ(g) (xi ), fσ(g) (x)) < ε + 2ε + ε
quindi
d∞ (g, fσ(g) ) = sup d(g(x), fσ(g) (x)) < 4ε.
x∈X

X
O SSERVAZIONE 5.7.7. Si noti che se Y è completo allora A è compatto. L’insieme A delle fun-
zioni da X ad A è dunque compatto per il teorema di Tychonoff. A prima vista potrebbe sembrare
quindi che il Teorema di Ascoli-Arzelà sia una banale conseguenza del teorema di Tychonoff. Ma un
prodotto infinito di compatti fornisce il classico esempio di compatto che non è compatto per suc-
cessioni (Esempio 3.4.2). In particolare la metrica della convergenza uniforme su Y X non induce la
topologia prodotto (che è quella della convergenza puntuale). Il teorema di Ascoli-Arzelà ci dice che
la famiglia F è compatta in Y X rispetto alla metrica del sup (ergo compatta per successioni).
O SSERVAZIONE 5.7.8. Spesso l’equicontinuità si riduce a una stima uniforme (quasi ovunque)
sulle derivate prime.
Esempio 5.7.9. Il tappeto di Sierpinski è connesso per archi.
D IMOSTRAZIONE . Stiamo lavorando in R2 Euclideo, che è completo. Sia S il tappeto di Sierpinski
e sia Sn l’approssimazione n-esima. Cioè S0 è un quadrato di lato 1, per formare S1 si è tolto l’interno
del quadratino centrale di lato 1/3 e cosı̀ via (si veda la figura dell’Esempio 1.1.17).
In particolare, S = ∩Sn . Dati x, y ∈ S, utilizzando solo segmenti orizzontali e verticali, si costrui-
sce facilmente un arco αn in Sn che unisce x a y e di lunghezza totale al massimo 2. Parametrizziamo
αn con [0, 1] a velocità costante. Le funzioni αn : [0, 1] → S ⊆ S0 sono quindi equicontinue. Esse sono
anche equilimitate perché S0 è compatto. Per il Teorema di Ascoli-Arzelà la chiusura F dell’insieme
F = {αn : n ∈ N} è compatto. Siccome F è numerabile, F è separabile. Per il Teorema 3.4.9, F è
compatto per successioni. Esiste quindi una sottosuccessione di αn che converge, per la metrica del
sup — che è quella della convergenza uniforme —, a una funzione α : [0, 1] → S0 . Per continuità α è
un arco continuo da x a y tale che α(t) ∈ Sn per ogni n, ergo α(t) ∈ S. 
Lo stesso ragionamento funziona anche per mostrare la locale connessione per archi e vale anche
per la guarnizione di Sierpinski.

5.8. Esercizi
Esercizio 5.8.1. Sia (X, d) uno spazio metrico. Dimostrare che per ogni x ∈ X e per ogni r > 0, la
palla chiusa D(x, r) = {y ∈ X : d(x, y) ≤ r} è un chiuso.
Esercizio 5.8.2. Dare un esempio di spazio metrico non discreto in cui esistono palle aperte B(x, r)
la cui chiusura non coincide col disco D(x, r).
Esercizio 5.8.3. Dare un esempio di spazio metrico non discreto X tale che esista x ∈ X e r > 0
per cui B(x, r) = B(x, r) 6= D(x, r).
Esercizio 5.8.4. Dare un esempio di spazio metrico non discreto X tale che esista x ∈ X e r > 0
per cui B(x, r) 6= B(x, r) 6= D(x, r).
Esercizio 5.8.5. Dare un esempio di spazio metrico non discreto X tale che esista x ∈ X e r > 0
per cui B(x, r) = B(x, r) = D(x, r).
Esercizio 5.8.6. Sia (X, d) uno spazio metrico e sia x ∈ X. Dimostrare che la funzione f (y) =
d(x, y) è continua.
116 5. TOPOLOGIA DEGLI SPAZI METRICI

p
Esercizio 5.8.7. Sia X = [0, 1] e sia d(x, y) = |x − y|. Verificare che d è una distanza. Verificare
che induce la stessa topologia della metrica Euclidea.

 0 x=y
Esercizio 5.8.8. Sia δ(x, y) = la distanza 0/1 su R (dimostrare che δ è una distanza)
 1 x 6= y
e sia
d((x, y), (a, b)) = |y − b| + δ(x, a).
Dimostrare che d è una distanza su R2 . Descrivere le palle aperte di centro (0, 0) e raggi 1/2, 1, 2 e la
palla chiusa di centro (0, 0) e raggio 1. Dimostrare che d non è equivalente alla topologia Euclidea.
Qual è la topologia indotta da d?
Esercizio 5.8.9. Dimostrare che la topologia dell’ordine lessicografico di R2 è metrizzabile.
Esercizio 5.8.10. Dimostrare che per 1 ≤ p, q < ∞ gli spazi lp sono tutti omeomorfi tra loro. (Usare
p

la corrispondenza (xi ) → (xiq ); serviranno un po’ di disuguaglianze tipo convessità e di Holder.)


Esercizio 5.8.11. Trovare funzioni f : R → [0, ∞) e θ : R → R tali che la spirale f (x)eiθ(x) abbia
lunghezza finita. Trovare funzioni f e θ tali che la spirale f eiθ abbia lunghezza infinita.
Esercizio 5.8.12. Dimostrare che ogni aperto di R è unione disgiunta di intervalli aperti.
Esercizio 5.8.13. Esibire un aperto di R2 che non sia unione disgiunta di palle aperte.
Esercizio 5.8.14. Si dica se la successione xn = ein è di Cauchy in C. E la successione yn = ein /n?
Esercizio 5.8.15. Sia (X, d) uno spazio metrico e sia (xn ) una successione di Cauchy. Si dimostri
che d(xn , xn+1 ) → 0.
Esercizio 5.8.16. Si dia un esempio di uno spazio metrico (X, d) che contiene una successione (xn )
che non sia di Cauchy ma tale che d(xn , xn+1 ) → 0.
Esercizio 5.8.17. Siano K, C sottoinsiemi disgiunti di uno spazio metrico (X, d), tali che K sia com-
patto e C chiuso. Dimostrare che la distanza tra K e C, definita come inf d(k, c), è strettamente
k∈K,c∈C
positiva.
Esercizio 5.8.18. Dimostrare che R2 con la metrica dei raggi è completo.
Esercizio 5.8.19. Trovare i completamenti metrici di R con le metriche degli Esempi 5.5.11 e 5.5.12,
senza usare i teoremi sui sottoinsiemi di spazi completi, ma usando direttamente la costruzione delle
successioni di Cauchy.
Esercizio 5.8.20. Sia (X, d) uno spazio metrico compatto e sia δ la metrica dei cammini su X.
Dimostrare che per ogni x, y ∈ X tali che δ(x, y) < ∞ esiste un cammino γ da x a y la cui lunghezza
realizza δ.
Esercizio 5.8.21. Dimostrare che uno spazio metrico compatto è separabile, senza usare la com-
pattezza per successioni.
Esercizio 5.8.22. Dimostrare che uno spazio metrico compatto è a base numerabile.
Esercizio 5.8.23. Dimostrare che uno spazio compatto T2 è metrizzabile se e solo se è a base
numerabile.
Esercizio 5.8.24. Sia X = {a, b, c, d}. Si dimostri che τ = {∅, X, {a, b}, {c, d}} è regolare non T2 .
Esercizio 5.8.25. Sia X un insieme con almeno due punti. Sia τ la topologia banale e σ quella
discreta. Si dimostri che τ × σ è regolare ma non T2 .
5.8. ESERCIZI 117

Esercizio 5.8.26. Si dimostri che Z con la topologia delle successioni aritmetiche (Esempio 1.2.5) è
metrizzabile. (Suggerimento: si usi il Teorema di Uryshon 5.2.10.)
Esercizio 5.8.27. Si dia un esempio di spazio topologico X non metrizzabile ma tale che ogni
sottoinsieme A ⊂ X, con A 6= X, sia metrizzabile.
Esercizio 5.8.28. Si dia un esempio di spazio T2 non metrizzabile, ma con un denso metrizzabile.
Esercizio 5.8.29. Sia X uno spazio T3 e sia A ⊆ X un chiuso. Dimostrare che X/A è T2 .
Esercizio 5.8.30. Sia X uno spazio metrico e A ⊆ X un chiuso. Dimostrare che X/A è T2 .
Esercizio 5.8.31. Sia X uno spazio metrico. Dimostrare che se ogni funzione continua f : X → R
è limitata, allora X è compatto.
Esercizio 5.8.32. Si dia un esempio di uno spazio X con due metriche d, δ che inducono la stessa
topologia, ma tali che d sia completa e δ no.
Esercizio 5.8.33. Dimostrare che il prodotto numerabile di spazi metrici è metrizzabile.
Esercizio 5.8.34. Dimostrare che uno spazio metrico non separabile non è compatto per successio-
ni.
Esercizio 5.8.35. Si dimostri che ω1 non è metrizzabile.
Esercizio 5.8.36. Sia R con la topologia discreta e sia X la sua compattificazione di Alexandroff.
Dimostrare che X è compatto, T2 , ma non metrizzabile.
Esercizio 5.8.37. Si dimostri che lo spazio descritto nell’Esempio 3.4.4 non è metrizzabile.
CAPITOLO 6

Topologia dal vivo

6.1. Riconoscere spazi diversi attraverso la connessione


Riconoscere quando due spazi non sono omeomorfi è una cosa difficile. Vediamo come la con-
nessione ci può togliere le castagne dal fuoco in alcuni casi. Chiaramente due spazi, uno connesso
e l’altro no, non sono omeomorfi. Cosı̀ come non sono omeomorfi spazi con un numero diverso di
componenti connesse. Questo ragionamento si può localizzare e si può guardare al numero delle
componenti connesse (per archi) di U \ {x} al variare del punto x e dell’intorno U di x.
Esempio 6.1.1. In R2 sia X un simbolo “ics” e sia Y un simbolo “ipsilon” (maiuscole, senza grazie).
X e Y sono diversi perché se x è l’incrocio di X, allora X \ {x} ha 4 componenti connesse mentre per
i punti y ∈ Y si ha che Y \ {y} ha 3 o 2 componenti connesse (a seconda se y sia l’incrocio di Y o no).
Esempio 6.1.2. Sia X una “ics” e sia Y un simbolo “8”. X e Y sono diversi perché se x è l’incrocio
di X allora X \ {x} ha 4 componenti connesse mentre per ogni x dell’8 si ha che 8 \ {x} ha al massimo
2 componenti connesse.
Definizione 6.1.3. Sia X uno spazio topologico connesso (per archi). Un punto x ∈ X si dice
punto di taglio (per archi) (in inglese cut point) se X \ {x} è sconnesso (per archi); si dice punto di
taglio locale (per archi) se x possiede un intorno connesso (per archi) per il quale x sia un punto di
taglio (per archi).
L’avere un punto di taglio o un punto di taglio locale è un invariante topologico.
Esempio 6.1.4. Ogni punto è di taglio e di taglio locale per R. R2 non ha punti di taglio, né punti
di taglio locale, S 1 non ha punti di taglio ma ogni punto è di taglio locale. In particolare R, R2 , S 1
sono tre spazi diversi tra loro.
Esempio 6.1.5. Il tappeto e la guarnizione di Sierpinski sono diversi. Il tappeto non ha punti
di taglio locali, la guarnizione sı̀ (i vertici dei triangoli). Se questa cosa sembra naturale, sia detto
che il tappeto di Sierpinski è una curva piana (sottoinsieme unidimensionale del piano nel senso di
Lebesgue) universale: ogni sottoinsieme unidimensionale del piano è omeomorfo a un sottoinsieme
del tappeto di Sierpinski1. Inoltre, ogni curva piana localmente connessa e senza punti di taglio locali
è omeomorfa al tappeto di Sierpinski.2
Esercizio 6.1.6. Dimostrare che il tappeto di Sierpinski non ha punti di taglio locali.
Definizione 6.1.7. Sia X uno spazio topologico connesso e localmente connesso (per archi) e sia
x ∈ X. La valenza di taglio (per archi) di x è il numero delle componenti connesse (par archi) di
X \ {x}. La valenza ti taglio locale (per archi) di x è definita come

v(x) = sup numero di componenti connesse (per archi ) di U \ {x}
U

1 Sierpiński, Wacław (1916). “Sur une courbe cantorienne qui contient une image biunivoque et continue de toute courbe
donnée”. C. r. hebd. Seanc. Acad. Sci., Paris. 162: 629—632.
2Whyburn, Gordon (1958). “Topological characterization of the Sierpinski curve”. Fund. Math. 45: 320—324.

119
120 6. TOPOLOGIA DAL VIVO

al variare di U intorno connesso di x.3


Il seguente lemma ci dice che la valenza di un punto di taglio può essere calcolata facendo il
limite su un sistema fondamentale di intorni connessi.
Lemma 6.1.8. Sia X uno spazio T2 e localmente connesso (per archi). Siano V ⊆ U intorni aperti e
connessi di x ∈ X. Allora il numero di componenti connesse (per archi) di U \ {x} è minore o uguale al numero
di quelle di V \ {x}.
D IMOSTRAZIONE . Ragioniamo sulle componenti connesse, per le componenti connesse per archi
la dimostrazione è identica. Mostriamo che esiste una funzione suriettiva
f : {componenti connesse di V \ {x}} → {componenti connesse di U \ {x}}
e ciò sarà sufficiente. Sia C una componente connessa di V \ {x}. In particolare C è un connesso
di V \ {x} e quindi anche un connesso di U \ {x}. (Per definizione C è massimale in V \ {x} ma
potrebbe non esserlo in U \ {x}.) Possiamo quindi definire f (C) come la componente connessa di
C in U \ {x}. Per mostrare la suriettività di f , si osservi che una componente connessa di U \ {x}
appartiene all’immagine di f se e solo se interseca V .
Siccome X è T2 , i suoi punti son chiusi e U \ {x} è aperto, quindi anch’esso è localmente connesso
(Teorema 4.4.3). Le sue componenti connesse son quindi aperte e chiuse in U \ {x} (Teorema 4.4.6).
In particolare sono aperte anche in U . Siccome U è connesso, esse non possono essere anche chiuse.
Ne segue che x sta nell’aderenza di ogni componente connessa di U \ {x}. Quindi, siccome V è un
intorno di x, ogni componente connessa di U \ {x} interseca V . 
Esempio 6.1.9. In R2 consideriamo un simbolo “8” (oppure “∞”). Esso ha un punto x, l’incrocio,
che ha valenza di taglio locale pari a 4. Tale spazio è diverso da S 1 , i cui punti hanno valenza 2.
Volendo, si può compattificare X a un punto e poi guardare la valenza di taglio locale di ∞.
Intuitivamente, in questo modo si contano le “fini” di uno spazio topologico.
Esempio 6.1.10. Sia X = {(x, y) ∈ R2 : |xy| ≤ 1} e sia Y = {(x, y) ∈ R2 : y ∈ [−1, 1]}. X e Y non
sono omeomorfi perché, se compattifichiamo X a un punto, ∞ ha valenza di taglio locale quattro;
mentre ogni punto y ∈ Yb ha valenza al più due.
Esercizio 6.1.11. Dimostrare, usando la connessione, che l’orecchino Hawaiano (Esempio 3.5.5) e
lo spazio dell’Esempio 2.2.11 non sono omeomorfi.
Esercizio 6.1.12. Siano X = {(x, y) ∈ R2 : y ≥ x2 } e Y = {(x, y) ∈ R2 : 0 ≤ x ≤ 1}. Dimostrare che
X e Y non sono omeomorfi tra loro.
Esercizio 6.1.13. Siano X = {(x, y) ∈ R2 : y > x2 } e Y = {(x, y) ∈ R2 : 0 < x < 1}. Dimostrare che
X e Y sono omeomorfi tra loro.

6.2. Taglia e cuci


In questa sezione ci dedicheremo a chirurgie topologiche, dette anche “tagli a cuci” (in inglese
si usa solitamente surgery). Ci focalizzeremo principalmente su oggetti bidimensionali, ma il lettore
audace saprà generalizzare il tutto in dimensione qualsiasi. Cominciamo con un paio di domande
che classicamente turbano gli studi dei giovani topologi.

Esempio 6.2.1. Come si dimostra rigorosamente che RP2 è omeomorfo a questo ?

3Si avverte il lettore che non esistono notazioni uniformi in letteratura per indicare le valenze.
6.2. TAGLIA E CUCI 121

Esempio 6.2.2. Come si dimostra che S 1 × S 1 è omeomorfo a questo ?

Vediamo subito un paio di utili risultati facilmente ottenibili con quanto sviluppato sin ora.
Teorema 6.2.3. Sia ∼ una relazione d’equivalenza su uno spazio X tale che X/ ∼ sia T2 . Se A ⊆ X è
compatto e interseca tutte le classi di equivalenza, cioè sat(A) = X, allora X/ ∼ è omeomorfo a A/ ∼.
D IMOSTRAZIONE . Siccome i quozienti dei compatti son compatti (Teorema 3.1.24), allora A/ ∼
è compatto. Per il Corollario 2.2.17, l’inclusione A → X induce una funzione continua f : A/ ∼→
X/ ∼. Tale funzione è iniettiva per definizione e siccome A interseca tutte le classi di equivalenza, f
è anche suriettiva. Se X/ ∼ è T2 , il Teorema del Compatto-Hausdorff conclude. 
Teorema 6.2.4. Siano X, Y spazi topologici e siano ∼X e ∼Y relazioni di equivalenza su X e Y rispettiva-
mente. Supponiamo che X/ ∼X sia compatto e che Y / ∼Y sia T2 . Se esiste una funzione continua f : X → Y
che coniuga le relazioni, e cioè tale che
x ∼X y ⇐⇒ f (x) ∼Y f (y),
e tale che l’immagine di f intersechi tutte le classi di equivalenza, allora X/ ∼X è omeomorfo a Y / ∼Y .
D IMOSTRAZIONE . Per il Corollario 2.2.17, f induce una funzione continua [f ] tra gli spazi quo-
zienti. Siccome f coniuga le relazioni, [f ] è iniettiva; siccome l’immagine di f interseca tutte le classi
di equivalenza allora [f ] è suriettiva. Per il Teorema del Compatto-Hausdorff essa è un omeomorfi-
smo. 
Esercizio 6.2.5. Esibire un controesempio al Teorema 6.2.4 nel caso Y non sia T2 .
Adesso vediamo come, con questi strumenti, possiamo risolvere il primo problema.
Lemma 6.2.6. Lo spazio proiettivo RPn è omeomorfo a S n modulo la relazione antipodale (cioè x ∼ −x).
D IMOSTRAZIONE . Il proiettivo è il quoziente di Rn+1 \ {0} per la relazione v ∼ λv. Esso è T2
perché due punti che non stanno sulla stessa retta sono separati da coni aperti (che sono aperti saturi).
Siccome S n = {v ∈ Rn+1 : ||v|| = 1} è compatto e interseca tutte le classi di equivalenza, allora per
il Teorema 6.2.3 RPn è omeomorfo a S n / ∼. La relazione v ∼ λv, ristretta a S n , non è altro che
l’antipodale. 
Lemma 6.2.7. Il proiettivo RPn è omeomorfo al disco Dn modulo l’antipodale al bordo.
D IMOSTRAZIONE . Per il Lemma 6.2.6P sappiamo che RPn ' S n / ∼. L’emisfero boreale di S n ,
n+1
cioè l’insieme E = {(x0 , . . . , xn ) ∈ R : x2i = 1, x0 ≥ 0}, è compatto e interseca tutte le classi di
n
equivalenza. Per il Teorema pP 6.2.3 il proiettivo è omeomorfo a E/ ∼. La proiezione D → E data da
f (x1 , . . . , xn ) = (1 − 2
xi , x1 , . . . , xn ) è continua, biunivoca e coniuga la relazione antipodale sul
bordo di Dn con ∼. Per il Teorema 6.2.4 essa induce un omeomorfismo tra i quozienti. 
Lemma 6.2.8. RP2 è omeomorfo a .
D IMOSTRAZIONE . Possiamo pensare il quadrato centrato nell’origine di R2 perché le traslazio-
ni sono omeomorfismi. Inoltre possiamo suppore che il quadrato abbia lato 2 perché le omotetie
sono omeomorfismi. La funzione f (x, y) = sup(|x|,|y|)
||(x,y)|| (x, y) è una funzione continua e biunivoca da
[−1, 1]2 al D2 . Gli incollamenti dati dalle freccette possono essere espressi tramite la relazione d’e-
quivalenza (x, y) ∼ (−x, −y) sul bordo di [−1, 1]2 , cioè l’antipodale. Per il Teorema 6.2.4 f induce un
omeomorfismo tra i quozienti. 
Per dimostrare che un quadrato e un cerchio sono omeomorfi, abbiamo esibito un omeomorfismo
esplicito. In generale però questa cosa potrebbe risultare ardua. L’uso della geometria affine ci può
aiutare.
122 6. TOPOLOGIA DAL VIVO

Teorema 6.2.9. Due triangoli qualsiasi in R2 (e in generale in Rn ) sono omeomorfi tra loro.
D IMOSTRAZIONE . Un triangolo è univocamente individuato dai suoi vertici, che sono punti affi-
nemente indipendenti di R2 (altrimenti il triangolo degenera a un segmento o a un punto). Indichia-
mo con T (P0 , P1 , P2 ) il triangolo di vertici P0 , P1 , P2 . Dati due triangoli T (P0 , P1 , P2 ) e T (Q0 , Q1 , Q2 )
esiste una (unica) affinità F di R2 tale che F (Pi ) = Qi per i = 0, 1, 2. È immediato verificare che
F : T (P0 , P1 , P2 ) → T (Q0 , Q1 , Q2 ) è un omeomorfismo. Discorso analogo vale per triangoli in Rn . 
Affrontiamo adesso il secondo problema, quello del toro. La cosa è un po’ più complicata perché
si chiede di dimostrare che S 1 × S 1 è omeomorfo a un disegnino. Si tratta di creare un ponte, il
più formale possibile, tra i disegnini e una loro formalizzazione matematica. Con un disegno si
intende generalmente un qualsiasi oggetto di R3 visivamente omeomorfo al disegno dato. Nel caso
in questione, il disegno voleva raffigurare la superficie di una ciambella.
Una buona strategia in questi casi è quella di suddividere i due spazi in pezzi (per esempio
triangoli) in modo tale da poter agilmente dimostrare che i pezzi sono omeomorfi a due a due e
che tali omeomorfismi sono compatibili sulle intersezioni. Diamo adesso degli strumenti precisi per
trattare questi casi. Son tutte istanze del Teorema 6.2.4.
Teorema 6.2.10. Sia Y uno spazio di Hausdorff. Supponiamo che Y sia ricoperto da un numero finito di
compatti Y = ∪ni=1 Ti . Per ogni i sia fi : Ti → Y l’inclusione. Sia X l’unione disgiunta dei Ti e sia ∼ la
relazione d’equivalenza su X data dalle intersezioni, ovvero quella generata da xi ∼ xj se fi (xi ) = fj (xj ) in
Y . Allora Y è omeomorfo a X/ ∼.
D IMOSTRAZIONE . Segue dal Teorema 6.2.4 ponendo su Y la relazione d’equivalenza banale. La
funzione continua da X a Y è data da f |Ti = fi . 

Esempio 6.2.11. Lo spazio è omeomorfo a (ove le frecce indicano le iden-


tificazioni e i disegni sono da considerarsi come figure bidimensionali “piene”).
Teorema 6.2.12. Siano X, Y spazi topologici di Hausdorff. Supponiamo che X = ∪i Ki sia unione
finita di compatti e siano fi : Ki → X le inclusioni. Similmente, sia Y = ∪i Ti unione di compatti e siano
gi : Ti → Y le inclusioni.
Supponiamo che per ogni i esista un omeomorfismo ϕi : Ki → Ti tale che fi (x) = fj (y) se e solo se
gi (ϕi (x)) = gj (ϕj (y)). Allora X è omeomorfo a Y .
D IMOSTRAZIONE . Per il Teorema 6.2.10 X è omeomorfo al quoziente di tKi modulo la relazione
d’equivalenza generata da xi ∼ xj se fi (xi ) = fj (xj ). Similmente Y è il quoziente di tTi . La tesi
segue dal Teorema 6.2.4 applicato a tKi e tTi . La funzione f è data da f |Ki = ϕi . 

Esempio 6.2.13. Lo spazio è omeomorfo a .

Teorema 6.2.14. Siano K1 , . . . , Kn compatti e sia ∼ una relazione di equivalenza su K = tKi . Sia Y
uno spazio di Husdorff tale che Y = ∪i Ti sia unione di compatti e siano gi : Ti → Y le inclusioni. Se per
ogni i esiste un omeomorfismo ϕi : Ki → Ti tale che xi ∼ xj se e solo se gi (ϕi (xi )) = gj (ϕj (xj )) allora Y è
omeomorfo a K/ ∼.
D IMOSTRAZIONE . Per il Teorema 6.2.10 Y è omeomorfo al quoziente di tTi modulo la relazione
d’equivalenza generata da yi ∼ yj se gi (yi ) = gj (yj ). La tesi segue dal Teorema 6.2.4 applicato a tKi
e tTi . La funzione f è data da f |Ki = ϕi . 

Esempio 6.2.15. Lo spazio è omeomorfo a .


6.2. TAGLIA E CUCI 123

Esempio 6.2.16. Lo spazio è omeomorfo a .

Esempio 6.2.17. Lo spazio è omeomorfo a (usando anche il Teorema 6.2.9.)

Definizione 6.2.18 (Incollamenti tramite mappe). Siano X, Y due spazi topologici e sia f una
funzione continua da un sottoinsieme A di X a Y . Su X t Y sia ∼ la relazione d’equivalenza generata
da x ∼ f (x). Lo spazio (X t Y )/ ∼ è l’incollamento di X e Y tramite la mappa f .
Chiaramente gli incollamenti si possono definire su un numero qualsiasi di spazi.
Esempio 6.2.19. Il Teorema 6.2.10 si può riformulare dicendo che Y è omeomorfo all’incollamento
dei Ti tramite le mappe fi ◦ fj−1 (definite su Ti ∩ Tj ).
Esempio 6.2.20. Nel caso particolare in cui A sia un punto, si ha l’incollamento di due spazi su
un punto, noto in letteratura come wedge (o one-point union, per gli anglofoni) o bouquet (per i
francofoni) dei due spazi.
Esempio 6.2.21. Un “8” è omeomorfo a un bouquet di due circonferenze.
Definizione 6.2.22 (Triangolazioni). Uno spazio triangolato in senso stretto4 è il quoziente di un
numero finito di triangoli incollati, tramite omeomorfismi affini, lungo alcuni lati e con alcuni vertici
identificati; il tutto in modo tale che, nel quoziente,
(1) ogni lato abbia due vertici diversi;
(2) ogni coppia di vertici appartenga al più a un lato;
(3) ogni tripla di vertici appartenga al più a un triangolo.
Una triangolazione (in senso stretto) di uno spazio topologico X è il dato di uno spazio triangolato
T e di un omeomorfismo tra X e T .
Uno spazio triangolato in senso lato è il quoziente di un numero finito di triangoli incollati lungo
alcuni lati e vertici tramite omeomorfismi affini, senza le tre richieste aggiuntive. Una triangolazione
(in senso lato) di uno spazio topologico X è il dato di uno spazio triangolato T e di un omeomorfismo
tra X e T .
Esempio 6.2.23. Sia T = {(x, y) ∈ R2 : x, y ≥ 0, x + y ≤ 1} un triangolo in R2 . Identificando
il lato orizzontale con quello verticale tramite (t, 0) ∼ (0, t) si ottiene una triangolazione del disco.
Tale triangolazione non è stretta perché il lato corrispondente al lato obliquo di T ha, nel disco, i due
vertici identificati.

v
a) b) c) d)
l3 l1 l2
T1 w
v w
T2 l4

F IGURA 1. Triangolazioni in senso stretto e non

4La nozione di triangolazione che diamo qui è puramente bidimensionale. In generale esisteranno triangolazioni di
dimensione qualsiasi. Quello che qui chiamiamo “spazio triangolato in senso stretto” è la versione bidimensionale di ciò che è
comunemente chiamato “complesso simpliciale”.
124 6. TOPOLOGIA DAL VIVO

Esempio 6.2.24. Quella di Figura 1 a) è una triangolazione in senso stretto di una sfera.
Esempio 6.2.25. Quello di Figura 1 b) è uno spazio triangolato in senso stretto con due triangoli
incollati lungo un vertice.
Esempio 6.2.26. Quella di Figura 1 c) è una triangolazione in senso lato, ma non stretto, del disco
D2 . Si noti che i triangoli T1 e T2 sono immersi nel disco, ma la coppia di vertici (v, w) appartiene a
due lati diversi.
Esempio 6.2.27. Quella di Figura 1 d) è una triangolazione in senso lato, ma non stretto, di una
corona circolare. Infatti la coppia di vertici (v, w) appartiene ai due lati l1 , l2 . Inoltre vi sono due lati
(l3 e l4 ) ognuno incidente a un sol vertice. Si noti che ci sono due triangoli, nessuno dei due immerso.
Esempio 6.2.28. Il cosiddetto cuscino triangolare (Figura 2) è uno spazio triangolato ottenuto da
due triangoli uguali identificando ogni lato del primo al corrispondente lato del secondo. La triango-
lazione ottenuta non è una triangolazione in senso stretto perché la tripla di vertici è comune ai due
triangoli.

F IGURA 2. Il cuscino triangolare

La definizione di triangolazione usa i triangoli perché sono oggetti universali dal punto di vista
affine (Teorema 6.2.9). Va da sé che si possono dare anche definizioni di quadrangolazioni et cetera.
Esempio 6.2.29. Un quadrato si può triangolare tagliandolo in due sulla diagonale (ottenendo
due triangoli), ma anche considerando un punto interno e i segmenti da esso verso i vertici (quattro
triangoli); una sfera si può triangolare con un cubo (triangolando le facce) come in Figura 3.

F IGURA 3. Triangolazioni di un quadrato e di una sfera (rappresentata come un cubo


con le facce triangolate) e una quadrangolazione di una sfera (un cubo semplice)

Definizione 6.2.30. Uno schema simpliciale bidimensionale è un sottospazio K di Rn , triango-


lato in senso stretto e tale che:
(1) Ogni vertice di K sia un elemento della base canonica;
(2) ogni lato di K sia il segmento congiungente due elementi della base canonica;
(3) ogni triangolo di K sia l’inviluppo convesso di tre elementi della base canonica.
P
In particolare, K è contenuto nell’inviluppo convesso della base canonica {(x1 , . . . , xn ) : xi =
1, xi ≥ 0}.
Esempio 6.2.31. Il triangolo standard è l’inviluppo convesso della base canonica di R3 , ∆ =
{(x, y, z) : x + y + z = 1, x, y, z ≥ 0}. Esso è uno schema simpliciale bidimensionale.
6.2. TAGLIA E CUCI 125

Esempio 6.2.32. Il bordo del tetraedro standard è lo schema simpliciale di R4 formato da tutti i
triangoli ottenibili come inviluppo convesso di tre elementi della base canonica e1 , e2 , e3 , e4 . Esso è
uno schema simpliciale bidimensionale omeomorfo a S 2 (si veda anche la Figura 1 a)).
Teorema 6.2.33. Ogni spazio X triangolato in senso stretto è omeomorfo a uno schema simpliciale di Rn ,
ove n è il numero dei vertici di X. In particolare esso è T2 .
D IMOSTRAZIONE . Sia X = tTi / ∼ uno spazio triangolato in senso stretto. Esso è compatto
perché è quoziente di un numero finito di triangoli, che sono compatti. Siano v1 , . . . , vn i vertici di
X. Sia e1 , . . . , en la base canonica di Rn . Poniamo ϕ(vi ) = ei . Essa è una corrispondenza biunivoca
tra i vi e gli ei . L’idea è che ϕ si estende, in modo naturale tramite mappe affini, ad una immersione
topologica.
La condizione (1) della Definizione 6.2.22 implica che ogni triangolo Ti ha tre vertici distinti in X.
È quindi ben definito il corrispondente triangolo ∆i in Rn , ossia l’inviluppo convesso dell’immagine
dei vertici di Ti . Per ogni i esiste un unico omeomorfismo affine fi : Ti → ∆i che estende ϕ. L’unione
delle fi definisce una funzione continua da f : ti Ti → Rn . Se I è un lato di Ti identificato a un lato J
di Tj tramite l’unica mappa affine g : I → J, allora fi = fj ◦ g su I. Ne segue che f è costante sulle
classi di equivalenza e quindi per il Teorema 2.2.16 induce una funzione continua F : X → Rn che
estende ϕ.
F è iniettiva sui vertici perché per definizione ϕ lo è. La condizione (2) della Definizione 6.2.22
implica che F è iniettiva sui lati. La condizione (3) della Definizione 6.2.22 implica che F è iniettiva
sui triangoli. L’immagine di F è T2 perché Rn lo è, quindi per il Teorema del compatto Hausdorff, F
è un omeomorfismo tra X e F (X). Si noti che F (X) è uno schema simpliciale per costruzione. 

Come si evince da questa dimostrazione, F dipende solo dai vertici, il resto è a botte di estensioni
affini uniche. Il bello delle triangolazioni è proprio che il tipo di omeomorfismo è completamente
codificato dalla combinatoria.
Teorema 6.2.34. Siano X, Y due spazi T2 triangolati in senso stretto. Supponiamo che esista una
corrispondenza biunivoca tra i vertici di X e quelli di Y tale che
(1) due punti di X sono vertici di un lato se e solo se lo stesso succede in Y ;
(2) tre punti di X sono vertici di un triangolo se e solo se lo stesso succede in Y .
Allora X e Y sono omeomorfi.
D IMOSTRAZIONE . Per il Teorema 6.2.33 possiamo suppore che X e Y siano schemi simpliciali
in Rn e Rm rispettivamente. Siccome i vertici sono in corrispondenza biunivoca, n = m. Inoltre la
corrispondenza tra i vertici induce una permutazione degli elementi della base di Rn che si estende
ad una unico isomorfismo lineare, che in particolare è affine. Tale isomorfismo, ristretto a X, è un
omeomorfismo tra X e Y . 

Per triangolare oggetti disegnati o parametrizzati da funzioni esplicite, basta considerare un in-
sieme abbastanza fitto di punti, in modo che essi determinino il disegno di una triangolazione curva
sull’oggetto. A questo punto ogni triangolino curvo si mostra essere omeomorfo al triangolo affine
individuato dai suoi vertici e ciò fornirà una triangolazione del nostro oggetto. Questo è esattamente
il procedimento che si fa per elaborare immagini 3D (e in questo ambito di lavoro, non chiedetemi
perché, le triangolazioni si chiamano mesh; la loro forza sta proprio nel fatto che bastano i vertici per
determinare l’oggetto.)
Usando la quadrangolazione della Figura 4 diventa chiaro come dimostrare che il toro “dise-
gnato” è omeomorfo a S 1 × S 1 . Infatti quest’ultimo è omeomorfo a [0, 2π]2 modulo la relazione
(0, y) ∼ (2π, y) e (x, 0) ∼ (x, 2π) (Esempio 3.2.5), che si può agilmente quadrangolare usando un re-
ticolo regolare di punti ( 2kπ 2hπ
n , m ) ∈ [0, 2π] × [0, 2π] al variare di k = 0, 1, . . . , n e h = 0, 1, . . . , m. La
quadrangolazione cosı̀ ottenuta di S 1 × S 1 è combinatorialmente equivalente a quella della Figura 4.
126 6. TOPOLOGIA DAL VIVO

F IGURA 4. Una toro, una sua triangolazione (fatta a mano) e una sua
quadrangolazione (algoritmicamente generata)

Per finire, vediamo un altro classico del taglia e cuci: la superficie di genere due. Essa è una
“ciambella per due”, cioè quella disegnata in Figura 5.

F IGURA 5. Una superficie di genere due

Esempio 6.2.35. Una superficie di genere due è omeomorfa a un ottagono con i lati identificati
come in Figura 5 (lati con frecce uguali vengono incollati d’accordo con l’orientazione data dalla
freccia).
D IMOSTRAZIONE . Per il Teorema 6.2.10, possiamo tagliare la superficie lungo una curva, come
descritto in figura, spezzandola in due tori bucati. Sull’ottagono invece, grazie al Teorema 6.2.4,
tagliamo lungo una diagonale (sempre come in Figura 5) ottenendo due pentagoni.
Adesso osserviamo che i vertici dell’ottagono sono tutti identificati tra loro e quindi possiamo
incollare i vertici dei lati lunghi dei pentagoni (sempre usando il Teorema 6.2.4). Otteniamo due
quadrati bucati, ciascuno dei quali ha i lati identificati in modo da formare un toro bucato (per il
teorema del Compatto-Hausdorff). Abbiamo quindi tagliato sia la superficie sia l’ottagono in modo
da ottenere due pezzi omeomorfi a tori bucati. Per il Teorema 6.2.12, entrambi gli spazi di partenza
quindi sono omeomorfi una coppia di tori bucati attaccati tra loro lungo i bordi (con le orientazioni
invertite). 

6.3. La topologia compatto-aperta


Lavorando con funzioni da R in R, si è abituati a parlare di convergenza di successioni di funzioni.
Ci sono molte nozioni differenti di convergenza, per esempio quella puntuale e quella uniforme. In
generale, per poter parlare di convergenza, è necessaria una topologia sugli spazi di funzioni. Se
si lavora con spazi topologici senza ulteriori particolari strutture, la scelta naturale è quella della
topologia compatto-aperta. (Si rimanda il lettore curioso del perché tale scelta sia quella naturale, al
libro del Kelley citato in introduzione, ove potrà trovare una discussione dettagliata sull’argomento.)
Definizione 6.3.1. Siano X, Y spazi topologici. La topologia compatto-aperta su Y X è la topo-
logia K-aperta (Esempio 1.2.20) ove K è la famiglia dei compatti di X. Essa è dunque generata dagli
6.3. LA TOPOLOGIA COMPATTO-APERTA 127

insiemi del tipo V (K, U ) = {f : f (K) ⊆ U } al variare di K compatto in X e U aperto in Y e una sua
base è data dalle intersezioni finite di tali insiemi.
La topologia compatto-aperta si può definire (come si è fatto) su tutto Y X , ma di solito se ne usa
la restrizione allo spazio C(X, Y ) ⊆ Y X delle funzioni continue da X a Y . (Addirittura, in molti testi
viene definita solo su C(X, Y )).
Esempio 6.3.2. Nel caso in cui X sia un punto (ergo ogni funzione da X in Y è continua) allora la
topologia compatto-aperta rende C(X, Y ) = Y X omeomorfo a Y .
D IMOSTRAZIONE . Sia X = {x}. Ogni f ∈ Y X è caratterizzata dal suo unico valore f (x) ∈ Y . È
dunque naturalmente definita una biiezione F : Y X → Y ponendo F (f ) = f (x). Se U è un aperto di
Y allora F −1 (U ) = {f ∈ Y X : f (x) ∈ U } che è un aperto di base per la compatto-aperta in quanto {x}
è compatto. Quindi F è continua. Viceversa, l’unico compatto non vuoto di X è X stesso e quindi
ogni aperto non vuoto della compatto-aperta è della forma V = {f : f (x) ∈ U } con U aperto di Y .
Dunque F (V ) = U è aperto, quindi F è una mappa aperta. Essendo continua e biunivoca, è dunque
un omeomorfismo. 

Esercizio 6.3.3. Dimostrare che se X è dotato della topologia discreta, allora C(X, Y ) con la topo-
logia compatto-aperta è omeomorfo a Y X con la topologia prodotto.
Teorema 6.3.4. Siano X, Y spazi topologici. Se Y è T2 allora la topologia compatto-aperta su Y X è T2 .
D IMOSTRAZIONE . Siano f 6= g ∈ Y X . Allora esiste x ∈ X tale che f (x) 6= g(x). Siccome Y è
T2 esistono aperti disgiunti U, V tali che f (x) ∈ U e g(x) ∈ V . L’insieme {x} è compatto. Quindi gli
insiemi A = {ϕ : ϕ(x) ∈ U } e B = {ϕ : ϕ(x) ∈ V } sono aperti per la topologia compatto-aperta, e
sono chiaramente disgiunti, l’uno contenente f e l’altro g. 

Teorema 6.3.5. Se Y è uno spazio metrico, allora la topologia compatto-aperta su C(X, Y ) è quella della
convergenza uniforme sui compatti: fn → f se e solo se per ogni compatto K ⊆ X si ha che (fn )|K converge
uniformemente a f |K .
D IMOSTRAZIONE . Supponiamo fn → f per la compatto-aperta e sia K un compatto di X. Sia
ε > 0. Siccome f è continua allora per ogni x ∈ K esiste Ux intorno di x tale che f (Ux ) ⊆ B(f (x), ε/4).
Per compattezza esistono x1 , . . . , xk tali che K ⊆ ∪i Uxi . Gli insiemi Ki = Uxi sono chiusi in un
compatto, ergo compatti. Siccome f è continua (usando il Teorema 1.7.10) si ha che f (Ki ) = f (Uxi ) ⊆
f (Uxi ) ⊆ B(f (xi ), ε/2). Gli insiemi Ai = {ϕ ∈ C(X, Y ) : ϕ(Ki ) ⊆ B(f (xi ), ε/2)} sono quindi intorni
aperti di f nella compatto-aperta. Quindi A = ∩i Ai è un intorno aperto di f . Si noti che, siccome i Ki
coprono K, allora per ogni g ∈ A si ha supx∈K d(f (x), g(x)) < ε.
Siccome fn → f per la compatto-aperta, allora esiste nε tale che per ogni n > nε si ha fn ∈ A, in
particolare
sup d(fn (x), f (x)) < ε.
x∈K
Siccome ciò vale per ogni ε > 0, allora fn → f uniformemente in K.
Viceversa, supponiamo che fn → f uniformemente su ogni compatto. Sia V un intorno di f nella
compatto-aperta. Esistono dunque compatti K1 , . . . , Kk e aperti U1 , . . . , Uk di Y tali che l’insieme
A = {ϕ : ϕ(Ki ) ⊆ Ui per ogni i} contiene f ed è contenuto in V . Siccome f è continua, f (Ki ) è
un compatto dentro l’aperto Ui . Esiste quindi εi > 0 tale che l’insieme ∪y∈f (Ki ) B(y, εi ) = {y ∈ Y :
d(y, f (Ki )) < εi } è interamente contenuto in Ui . Siccome fn → f uniformemente su Ki , allora per
ogni x ∈ Ki si ha d(fn (x), f (x)) < εi definitivamente in n e quindi fn (Ki ) ⊆ {y ∈ Y : d(y, f (Ki )) <
εi } ⊆ Ui . Siccome i Ki sono in numero finito, definitivamente in n si ha fn (Ki ) ⊆ Ui per ogni
i = 1, . . . , k. Ossia fn ∈ A. Abbiamo quindi dimostrato che per ogni intorno V di f la successione fn
sta in V da un certo n in poi. Quindi fn → f per la topologia compatto-aperta. 
128 6. TOPOLOGIA DAL VIVO

Esercizio 6.3.6. Dimostrare che se U è un aperto di uno spazio metrico X e K ⊆ U è compatto,


allora esiste ε > 0 tale che l’insieme {x ∈ X : d(x, K) < ε} è interamente contenuto in U .

Si noti che nella dimostrazione del Teorema 6.3.5 si è usata l’ipotesi che la funzione limite f
sia continua. In generale infatti, limite compatto-aperto di funzioni continue potrebbe non essere
continuo.

Esempio 6.3.7. Siano X = [0, 1] e Y = [−1, 1] con le topologie Euclidee. Siano


 
 sin(1/x) x 6= 0  sin(1/x) x > 1
2πn
f (x) = fn (x) = .
 0 x=0  0 x≤ 1
2πn

Chiaramente f non è continua mentre ogni fn lo è. Ebbene, fn → f nella topologia compatto-aperta.

D IMOSTRAZIONE . Vediamo quali sono gli intorni di f nella compatto-aperta. Per ogni compatto
K di X e U aperto di Y sia V (K, U ) = {g : g(K) ⊆ U }. Supponiamo che f ∈ V (K, U ). Ci sono due
casi:
(1) 0 ∈
/ K e allora fn ∈ V per n abbastanza grande in quanto non appena min K > 1/2πn, fn
coincide con f su K.
(2) 0 ∈ K. In tal caso, siccome f ∈ V (K, U ) e f (0) = 0, allora 0 ∈ U . Ma allora fn ∈ V per ogni
n in quanto fn vale 0 ove non coincide con f .
In entrambi i casi fn sta in V definitivamente in n. Siccome una base della compatto-aperta è data da
intersezioni finite di insiemi tipo V (K, U ), ne segue che fn → f per la compatto-aperta. 

6.4. Gruppi topologici


Definizione 6.4.1. Un gruppo topologico è un gruppo G, dotato di una topologia tale che:
• la moltiplicazione G × G → G, data da (g, h) 7→ gh, è continua (G × G si intende dotato della
topologia prodotto);
• l’inversione G → G data da g → g −1 è continua.

Esempio 6.4.2. Ogni gruppo è un gruppo topologico se dotato della topologia discreta. In questo
caso si parla di gruppo discreto. I gruppi finiti o numerabili si considerano usualmente come gruppi
discreti.

Esempio 6.4.3. Gli esempi più classici di gruppi non discreti sono R, C, Rn , Cn (con la struttura
additiva).

Esempio 6.4.4. I gruppi di matrici, per esempio i gruppi GL(n, R) e GL(n, C) e tutti i loro sotto-
2
gruppi, dotati dell’usuale topologia derivante dall’identificazione di Mn×n (K) con Kn , sono gruppi
topologici.

In particolare sono gruppi topologici R∗ = GL(1, R), C∗ , O(n), SO(n), U (n), SU (n) etc... Cosı̀
2
come sono gruppi topologici PSL(n, R) e PSL(n, C). Siccome Cn è metrizzabile, lo sono anche tutti
i gruppi di matrici.

Esempio 6.4.5. S 1 , identificato con la sfera unitaria di C, è un gruppo topologico.

Esempio 6.4.6. La sfera S 3 è un gruppo topologico. La struttura di gruppo è data dall’identifica-


zione con la sfera unitaria dei quaternioni.

Teorema 6.4.7. SO(2) è omeomorfo a S 1 .


6.4. GRUPPI TOPOLOGICI 129

D IMOSTRAZIONE . Identifichiamo S 1 con [0, 2π] modulo 0 ∼ 2π. La funzione f : S 1 → SO(2)


data da  
cos θ − sin θ
f (θ) =  
sin θ cos θ
è continua e biunivoca tra un compatto e un T2 , ergo è un omeomorfismo. 
Teorema 6.4.8. SO(3) è omeomorfo a RP3 (che quindi eredita una struttura di gruppo topologico).
D IMOSTRAZIONE . RP3 è compatto ed omeomorfo a D3 modulo l’antipodale al bordo (Lem-
ma 6.2.7). Il gruppo SO(3) è il gruppo delle isometrie lineari di R3 che preservano l’orientazione,
cioè il gruppo delle rotazioni. Definiamo ora una funzione F : RP3 → SO(3) che sia continua e
biunivoca; siccome SO(3) è T2 ciò sarà sufficiente.
Ad ogni punto 0 6= x ∈ D3 associamo la rotazione di angolo π||x|| attorno alla retta passante per
x, l’angolo è considerato in senso orario rispetto alla regola della mano destra con il pollice che punta
verso x. Si noti che F (−x) ha lo stesso asse di rotazione di F (x) e stesso angolo, ma in senso antiorario
rispetto a F (x). Tale funzione si estende per continuità nell’origine ponendo F (0) = Id. Inoltre se
||x|| = 1 allora, siccome la rotazione oraria di π coincide con la antioraria di −π, si ha F (x) = F (−x).
In altre parole
x ∼ y ⇒ F (x) = F (y).
Per il Teorema 2.2.16 F induce una funzione continua da D3 modulo antipodale a SO(3). F è
biunivoca perché una rotazione è univocamente determinata dall’asse e angolo di rotazione. 
Teorema 6.4.9. SU (2) è omeomorfo a S 3 .
D IMOSTRAZIONE . Ricordiamo che U (2) è il gruppo delle matrici complesse 2 × 2 tali che A−1 è il
coniugato della trasposta di A e che SU (2) è il sottogruppo di quelle con determinante 1. In formule
SU (2) è l’insieme dalle matrici del tipo
 
a −b̄
  a, b ∈ C, |a|2 + |b|2 = 1
b ā
Se a = x + iy e b = z + it l’equazione |a|2 + |b|2 = 1 diventa x2 + y 2 + z 2 + t2 = 1, che definisce S 3
come sfera unitaria di R4 . L’applicazione
 
x + iy −z + it
(x, y, z, t) 7→  
z + it x − iy
definisce quindi una funzione continua e biunivoca da S 3 a SU (2), il Teorema del Compatto Hau-
sdorff conclude. 
Esempio 6.4.10. Il gruppo di Heisenberg è il gruppo delle matrici 3 × 3 a coefficienti in R, che
siano
 triangolari
 superiori con unico autovalore 1. In altre parole,il gruppodelle matrici della forma
1 a c 1 a c
   
0 1 b . Esso è omeomorfo a R tramite la corrispondenza 0 1 b  → (a, b, c) ∈ R3 . Ma la
3
   
   
0 0 1 0 0 1
struttura di gruppo non è quella usuale di R3 .
2
 delle affinità di R può essere identificato col gruppo delle matrici 3 × 3
Esempio 6.4.11.Il gruppo
A b
della forma M =   con A matrice 2 × 2 e b vettore colonna di R2 . Ad ogni affinità, che è del
0 1
130 6. TOPOLOGIA DAL VIVO

tipo f (x) = Ax + b, possiamo associare una matrice M come sopra e viceversa. L’azione su R2 è data
dall’usuale moltiplicazione riga per colonna, una volta identificato R2 con {(x, y, 1), x, y ∈ R} ⊂ R3 .
Ne segue che il gruppo delle affinità di R2 è un gruppo topologico.
Esempio 6.4.12. Dato un prodotto scalare su Rn il gruppo delle isometrie di Rn rispetto a tale
prodotto scalare è un gruppo topologico.
Esempio 6.4.13. Il gruppo delle isometrie dello spaziotempo di Minkowski è un gruppo topologi-
co.

6.5. Azioni di gruppi


Sia X uno spazio topologico. L’insieme omeo(X) di tutti gli omeomorfismi è un gruppo rispetto
alla composizione: l’elemento neutro è l’identità e (f ◦ g)−1 = g −1 ◦ f −1 .
Definizione 6.5.1 (Azioni di gruppi). Si dice che un gruppo G agisce su un spazio topologico
X (tramite omeomorfismi) se è data una rappresentazione (cioè un morfismo di gruppi) ρ : G →
omeo(X). Quando è necessario specificare la rappresentazione, si dice che G agisce via ρ.
Se non ci sono ambiguità, è generalmente usata la terminologia semplificata “gx” al posto di
ρ(g)(x). Dato x ∈ X, l’orbita di x è l’insieme Gx = {gx : g ∈ G} = {y ∈ X : ∃g ∈ G : y = gx}.
Esempio 6.5.2. Se G ≤ omeo(X) allora G agisce su X tramite l’inclusione G ⊆ omeo(X).
Un’azione di G su X è dunque una funzione da G × X → X data da (g, x) 7→ ρ(g)(x). Per ogni
g fissato, ρ(g) è un omeomorfismo di X. Per studiare l’effetto di un’azione su X, non è importante
tanto la rappresentazione ρ : G → omeo(X) quanto l’immagine ρ(G) ≤ omeo(X).
Esempio 6.5.3. Z agisce naturalmente su R tramite traslazioni, cioè via la rappresentazione τ :
Z → omeo(R) n 7→ τn τn (x) = x + n.
L’orbita di 0 è Z, l’orbita di π è π + Z.
Esempio 6.5.4. Il gruppo Z può agire su R (e più in generale su Rn ) in altri modi, per esempio per
moltiplicazione per 2k :
Z → omeo(R) n 7→ σk σk (x) = 2k x.
L’orbita di 0 è {0}. L’orbita di 1 è formata dai multipli positivi di due: Z1 = {2k : k ∈ Z}. Visivamente
è una successione che si accumula a zero da un lato e tende all’infinito dall’altro.
Esempio 6.5.5. Z2 < R2 agisce su R2 per traslazioni. Zn < Rn agisce su Rn per traslazioni.
Esempio 6.5.6. Sia V uno spazio vettoriale su R, con la topologia indotta da un prodotto scalare.
Allora R∗ (come gruppo moltiplicativo) agisce su V per moltiplicazione:
R → omeo(V ) λ 7→ ρ(λ) ρ(λ)(v) = λv.
L’orbita di 0 è {0}, l’orbita di v 6= 0 è la retta per v privata dello zero.
Esempio 6.5.7. Sia X = GL(n, R) con la topologia indotta dall’identificazione di GL(n, R) con un
2
aperto di Rn . X agisce su sé stesso tramite coniugio:
ρ : X → omeo(X) M 7→ ρ(M ) ρ(M )A = M AM −1 .
L’orbita dell’identità è l’identità. L’orbita di A è l’insieme di tutte le matrici simili ad A.
Esempio 6.5.8. S 1 agisce su S 2 per rotazioni orizzontali. Usando S 1 ' {z ∈ C : |z| = 1},
R ' C × R e ponendo S 2 = (z, t) ∈ C × R : |z|2 + t2 = 1, si ha
3

ρ : S 1 → omeo(S 2 ) ρ(ξ)(z, t) = (ξz, t)


Con una terminologia geografica, le orbite dei poli nord e sud sono i poli stessi, le altre orbite sono i
paralleli.
6.5. AZIONI DI GRUPPI 131

Esempio 6.5.9. Se G è un gruppo topologico allora la moltiplicazione a sinistra definisce un’azione


di G su sé stesso: ρ(g)h = gh.
Esempio 6.5.10. Se G è un gruppo topologico non commutativo allora la moltiplicazione a destra
ρ(g)h = hg non definisce un’azione di G su sé stesso in quanto non è un morfismo: ρ(g1 )(ρ(g2 )h) =
hg2 g1 6= hg1 g2 = ρ(g1 g2 )h.
Esercizio 6.5.11. Dimostrare che se G è un gruppo topologico allora la moltiplicazione per inverso
a destra: ρ(g)h = hg −1 definisce un’azione di G su sé stesso.
A questo punto è d’uopo una precisazione sulle azioni a destra e a sinistra. Il fatto che ρ sia una
rappresentazione ci dice che ρ(gh) = ρ(g) ◦ ρ(h) e ρ(1) = id, per cui la notazione moltiplicativa a
sinistra “gx” è coerente:
ρ(1)(x) = 1x = x ρ(gh)(x) = ghx = g(hx) = ρ(g)(ρ(h)(x)) = (ρ(g) ◦ ρ(h))(x).
Se invece, pur avendo ρ(1) = id, succede che ρ(gh) = ρ(h) ◦ ρ(g) — e ciò è equivalente a chiedere
che g 7→ ρ(g)−1 sia una rappresentazione — allora la notazione coerente è quella della moltiplicazione
a destra “xg”:
ρ(1)(x) = x1 = x ρ(gh)(x) = xgh = (xg)h = ρ(h)(ρ(g)(x)) = (ρ(h) ◦ ρ(g))(x).
Quando si parla di azioni di gruppi senza specificare, o è chiaro dal contesto se l’azione sia a
destra o a sinistra, o generalmente si intende un’azione a sinistra. Nel caso fosse necessario essere
più precisi, si parlerà di azione a destra o sinistra a seconda che ρ inverta o meno l’ordine della
moltiplicazione.
Esempio 6.5.12. La moltiplicazione a sinistra fornisce un’azione a sinistra di G su sé stesso. La
moltiplicazione a destra fornisca un’azione a destra. Il coniugio ρ(g) = ghg −1 fornisce un’azione a
sinistra. Il coniugio ρ(g) = g −1 hg fornisce un’azione a destra.
Lemma 6.5.13. Sia G un gruppo che agisce su uno spazio X. Allora le orbite sono a due a due disgiunte.
D IMOSTRAZIONE . Siano x, y ∈ X tali che Gx ∩ Gy 6= ∅. Allora esistono g, h ∈ G tali che gx = hy.
Ma allora y = h−1 gx e quindi y ∈ Gx. Ne segue che Gx = Gy. 
Definizione 6.5.14. Un’azione di G su X si dice transitiva se per ogni x, y ∈ X esiste g ∈ G tale
che gx = y.
Esempio 6.5.15. L’azione di G su sé stesso per moltiplicazione a sinistra è transitiva perché per
ogni g, h ∈ G si ha h = (hg −1 )g.
Esempio
 6.5.16. L’azione di GL(2, R) su se stesso per coniugio non è transitiva. Infatti le matrici
10 e 10 11 non sono simili.
01

Esempio 6.5.17. L’azione di un gruppo non banale su sé stesso per coniugio non è transitiva. Infatti
l’orbita dell’identità è costituita da un sol punto: l’identità.
Esercizio 6.5.18. Dimostrare che un’azione di G su X è transitiva se e solo se in X v’è una sola
orbita, ossia se per ogni x ∈ X si ha X = Gx.
Definizione 6.5.19. Un’azione di G su X si dice libera se per ogni x ∈ X, gx = x ⇐⇒ g = id.
Esempio 6.5.20. L’azione di Z/2Z su S 2 data dall’antipodale è libera in quanto ogni punto è diverso
dal suo antipodale.
Esempio 6.5.21. L’azione di un gruppo su sé stesso per moltiplicazione a sinistra è libera in quanto
gh = h se e solo se g = id.
Esempio 6.5.22. L’azione di un gruppo (non banale) su sé stesso per coniugio non è libera perché
per ogni x ∈ G, gxg −1 = x se g = x.
132 6. TOPOLOGIA DAL VIVO

Definizione 6.5.23. Sia G un gruppo che agisce su X. Per ogni punto x ∈ X lo stabilizzatore di
x è il sottogruppo di G che fissa x
stab(x) = {g ∈ G : gx = x}
Esempio 6.5.24. Un’azione è libera se e solo se tutti gli stabilizzatori sono banali.
Esempio 6.5.25. L’azione di S 1 su S 2 per rotazioni orizzontali (Esempio 6.5.8) non è libera in
quanto gli stabilizzatori dei poli sono tutto S 1 .
Esercizio 6.5.26. Dimostrare che un’azione di G su X è libera se e solo se la funzione F : X × G →
X × X data da F (x, g) = (x, gx) è iniettiva.
Data un’azione di G su X, si definisce la relazione di equivalenza ∼G
x ∼G y ⇔ ∃g ∈ G : y = gx
essa è una relazione d’equivalenza perché G è un gruppo. Le classi di equivalenza sono le orbite
[x] = Gx.
Definizione 6.5.27. Sia G un gruppo che agisce su uno spazio topologico X. Il quoziente di
X per l’azione di G, detto anche spazio delle orbite, è X/ ∼G . È solitamente in uso la notazione
X/G = X/ ∼G .
La notazione X/G va usata con cura, infatti è uguale a quella del collasso di sottoinsiemi. Per
esempio: R/Z è il quoziente che si ottiene da R identificando tutto Z a un punto o è il quoziente di
R per l’azione di Z? E quale azione stiamo considerando? Di solito tutte queste cose sono chiare dal
contesto, altrimenti vanno specificate.
Nel caso si stia lavorando con azioni a destra/sinistra e si voglia specificare, sono in uso le nota-
zioni G\X e X/G per denotare il quoziente di X per un’azione a sinistra e a destra rispettivamente.
(Si noti che in generale, quando non si specifica, si usa la notazione X/G per le azioni a sinistra).
Teorema 6.5.28. Se X è uno spazio topologico e G ≤ omeo(X), allora la proiezione naturale π : X →
X/G è aperta. Se inoltre G è un gruppo finito, allora π è anche chiusa.
D IMOSTRAZIONE . Per ogni A ⊆ X, sat(A) = π −1 (π(A)). Per definizione di topologia quoziente,
π(A) è aperto se e solo se π −1 (π(A)) è aperto. Quindi dire che π è aperta è equivalente a dire che il
saturato di un aperto è aperto. Sia A un aperto di X. Per ogni g ∈ omeo(X), g(A) è aperto. Inoltre,
visto che stiamo trattando l’azione di un gruppo, sat(A) = GA = ∪g∈G g(A). Ne segue che sat(A) è
unione di aperti e quindi è aperto.
Lo stesso ragionamento dimostra che se G è finito allora π è anche chiusa (gli omeomorfismi sono
mappe chiuse e unione finita di chiusi è chiusa). 
Corollario 6.5.29. Se un gruppo G agisce su uno spazio topologico X a base numerabile, allora X/G è a
base numerabile.
D IMOSTRAZIONE . Basta applicare il Teorema 2.2.15 e il Teorema 6.5.28. 
Corollario 6.5.30. Il quoziente di un compatto T2 per l’azione di un gruppo finito è compatto e T2 .
D IMOSTRAZIONE . Segue immediatamente dai Teoremi 3.1.25, 3.1.24 e 6.5.28. 
La seguente è una generalizzazione del Teorema 2.1.4.
Teorema 6.5.31. Sia X uno spazio topologico e G ≤ omeo(X). Allora X/G è di Hausdorff se e solo se
l’insieme
∆ = {(x, g(x)) : x ∈ X, g ∈ G}
è chiuso in X × X.
6.5. AZIONI DI GRUPPI 133

D IMOSTRAZIONE . Dire [x] 6= [y] è equivalente a dire (x, y) ∈


/ ∆. ∆ è chiusa se e solo se il suo
/ ∆ è interno a ∆c , se e solo se esistono aperti A, B
complementare è aperto, se e solo se ogni (x, y) ∈
tali che x ∈ A e y ∈ B con A × B ⊆ ∆c . A × B ⊆ ∆c equivale a dire che non esiste g ∈ G tale che
g(a) ∈ B con a ∈ A. Cioè sat(A) ∩ sat(B) = ∅. Ma ciò è equivalente a dire che π(A) ∩ π(B) = ∅.
Chiarmente [x] ∈ π(A) e [y] ∈ π(B). Quindi ∆ chiuso equivale a dire che ogni [x] 6= [y] sono separati
da aperti. 
Corollario 6.5.32. Sia X uno spazio topologico e sia G < omeo(X). Se c’è anche una sola orbita che non
è chiusa, allora X/G non è T2 .
D IMOSTRAZIONE . Supponiamo che esista x ∈ X tale che l’orbita Gx non sia chiusa. Allora esiste
y ∈ X tale che [x] 6= [y] ma y ∈ Gx. Per ogni intorno A di y esiste quindi g ∈ G tale che gx ∈ A. Per
cui (x, y) ∈
/ ∆ è un punto di aderenza di ∆, il quale risulta non chiuso, ergo X/G non è T2 . 
Esempio 6.5.33. Sia X = R3 e consideriamo l’azione di R∗ data dalla moltiplicazione. Le orbite
non son chiuse perché si accumulano nell’origine. Dunque il quoziente non è T2 . Questo è uno dei
motivi per cui quando si fa il proiettivo si toglie l’origine.
Il viceversa del Corollario 6.5.32 in generale non è vero:
Esempio 6.5.34. Sia A = R2 \ {(0, 0)}. Consideriamo l’azione di R∗ data da ρ(λ)(x, y) = (λx, y/λ).
Se ab 6= 0, l’orbita di (a, b) è
[(a, b)] = {(x, y) : xy = ab}.
Se x = 0 l’orbita di (0, y) è l’asse Y meno l’origine e se y = 0 l’orbita di (x, 0) è l’asse X meno l’origine.
I punti di A/R∗ sono quindi
[(1, c)] = {xy = c} per c 6= 0, [X], [Y ].
2
Le orbite son dunque chiuse in R \ {(0, 0)}. Ma un aperto saturo che contiene l’asse X e un aperto
saturo che contiene l’asse Y si intersecano sempre in un ramo di iperbole xy = ε per un certo ε 6= 0.
Quindi A/R non è T2 .
Vediamo adesso un esempio classico di azione di gruppi: il vento in direzione d. Fissiamo una
direzione non nulla d ∈ R2 e consideriamo l’azione su R2 di R come gruppo additivo
ρd : R → omeo(R2 ) ρd (λ)(v) = v + λd
Le orbite dell’azione di R su R2 sono rette parallele con direzione d (e quindi son chiuse).
Esercizio 6.5.35. Dimostrare che, per qualsiasi direzione d, il quoziente R2 /R è omeomorfo a R.
Sia ora X = R2 /Z2 (l’azione è quella naturale per traslazioni). Usando il Teorema del Compatto
Hausdorff si dimostra agilmente che X è omeomorfo al toro T 2 = S 1 × S 1 .
Se [v] = [w] in X, cioè se v − w ∈ Z2 , allora ρd (λ)v − ρd (λ)w = v − w ∈ Z2 , cioè [ρd (λ)(v)] =
[ρd (λ)(w)]. Per il Corollario 2.2.17, ρd induce una rappresentazione
R → omeo(T 2 ) λ([v]) = [ρd (λ)(v)].
Le orbite nel toro sono linee “parallele” che si avvolgono su T 2 . La direzione d = (x, y) si dice
razionale se x/y ∈ Q ∪ {∞}, per esempio se d ∈ Q2 . Se d è razionale allora si può dimostrare che il
quoziente è Hausdorff.
Esercizio 6.5.36. Determinare il quoziente T 2 /R nel caso d ∈ Q2 . (Si pensi a cosa succede quando
si srotola il cilindretto di cartone dei rotoli di carta igienica.)

Se la direzione non è razionale, per esempio d = (1, 2), le orbite in T 2 sono dense. In particolare
in questo caso il quoziente non è Hausdorff.

Esercizio 6.5.37. Dimostrare che per d = (1, 2) le orbite dell’azione di R su T 2 sono tutte dense.
134 6. TOPOLOGIA DAL VIVO

6.6. Azioni continue, proprie e propriamente discontinue


Prima di cominciare dimostriamo un lemmetto, che sistema il problema della definizione non
universale di mappa propria (per alcuni una mappa propria è chiusa per definizione).
Lemma 6.6.1. Siano X e Y spazi di Hausdorff. Se Y è localmente compatto allora ogni mappa f : X → Y
che sia propria è anche chiusa.
D IMOSTRAZIONE . Sia f : X → Y una mappa propria e sia A ⊆ X un chiuso. Dobbiamo far
vedere che f (A) = f (A). Sia y ∈ f (A). Sia U = {Ui }i∈I un sistema fondamentale di intorni compatti
di y, che esiste per il Teorema 3.5.9 in quanto Y è T2 e localmente compatto. Siccome f è propria allora
ogni f −1 (Ui ) è compatto, ergo chiuso in X perché X è T2 .
Siccome y ∈ f (A), ogni intersezione finita degli Ui interseca f (A). Sia Uo ∈ U. Gli insiemi
f −1 (Ui ) ∩ A ∩ f −1 (Uo ) sono dei chiusi di f −1 (Uo ) con la proprietà delle intersezioni finite (Definizio-
ne 3.3.1). Siccome f −1 (Uo ) è compatto, per il Lemma 3.3.2, esiste
\
x∈ f −1 (Ui ) ∩ A.
i∈I

Quindi f (x) ∈ Ui per ogni i ∈ I. Da ciò, essendo Y di Hausdorff e U un sistema fondamentale di


intorni di y, segue che f (x) = y. Siccome x ∈ A allora y ∈ f (A). 
Esercizio 6.6.2. Sia f : X → Y una mappa continua e propria tra spazi topologici. Dimostrare che
se Y è localmente compatto allora anche X lo è. Trovare un controesempio se f è propria ma non
continua.
Definizione 6.6.3. Sia G un gruppo topologico e X uno spazio topologico. Un’azione di G su X
si dice continua se la funzione f : X × G → X data da
f (x, g) = gx
è continua rispetto alla topologia prodotto di X × G.
Esempio 6.6.4. L’azione di G su sé stesso per moltiplicazione o coniugio è continua per definizione
di gruppo topologico.
Esempio 6.6.5. Sia G < R il gruppo additivo generato da 1 e π, con la topologia indotta da R. Sia
X = R e sia ϕ ∈ omeo(X) data da ϕ(x) = x + 1. Sia ρ : G → omeo(R) definita da ρ(m + nπ) = ϕn .
Essa è una rappresentazione e dunque definisce un’azione di G su R. Siccome π non è razionale,
esistono mk , nk ∈ Z tali che mk + nk π → 0, con nk → ∞. In particolare ρ(mk + nk π) = ϕnk non
converge all’identità. Ponendo gk = mk + nk π, si ha che (0, gk ) → (0, 0) ma f (0, gk ) = ϕnk (0) = nk
non converge a 0 = f (0, 0). Quindi f non è continua (Teorema 1.7.9) e l’azione non è continua.
Definizione 6.6.6. Un’azione di un gruppo topologico G su uno spazio X si dice chiusa se la
funzione F : X × G → X × X data da
F (x, g) = (x, gx)
è chiusa. L’azione si dice propria se F è propria.
Lemma 6.6.7. Se X e G sono T2 e localmente compatti, allora un’azione di G su X è propria se e solo se
è chiusa e ogni punto ha stabilizzatore compatto.
D IMOSTRAZIONE . Siccome la locale compattezza e l’essere Hausdorff passano ai prodotti, per
il Lemma 6.6.1 se X e G sono T2 e localmente compatti allora ogni azione propria è anche chiusa.
Inoltre, se l’azione è propria allora F −1 (x, x) = {x} × stab(x) è compatto, quindi gli stabilizzatori dei
punti son compatti.
Viceversa, se l’azione è chiusa e ogni punto ha stabilizzatore compatto allora F −1 (x, gx) = {x} ×
g stab(x) è compatto e per il Corollario 3.1.33 l’azione è anche propria. 
6.6. AZIONI CONTINUE, PROPRIE E PROPRIAMENTE DISCONTINUE 135

Teorema 6.6.8 (Azione chiusa, quoziente T2 ). Sia G un gruppo topologico che agisce su uno spazio
topologico X. Se l’azione è chiusa allora X/G è di Hausdorff.
D IMOSTRAZIONE . Sia F (x, g) = (x, gx). Siccome F è chiusa, la sua immagine è un chiuso di
X × X. L’immagine di F è l’insieme {(x, gx) : x ∈ X, g ∈ G}. Per il Teorema 6.5.31, X/G è T2 . 
Esercizio 6.6.9. Sia G un gruppo topologico che agisce su X. Dimostrare che se G è T2 e l’azione è
chiusa allora X è T2 . (Si suggerisce di usare i Teoremi 1.6.12 e 2.1.4).
Teorema 6.6.10. Sia G un gruppo compatto e T2 che agisce in modo continuo su uno spazio X localmente
compatto e T2 . Allora l’azione è chiusa. In particolare X/G è di Hausdorff.
D IMOSTRAZIONE . Sia F : X ×G → X ×X data da F (x, g) = (x, gx). Siccome l’azione è continua,
le componenti di F sono continue e quindi F è continua. Se dimostriamo che F è propria abbiam
finito perché per il Lemma 6.6.1 essa risulta anche chiusa e per il Teorema 6.6.8 il quoziente è T2 .
Sia K ⊆ X × X un compatto. L’insieme K è compatto in un T2 e quindi chiuso. Per continuità
l’insieme F −1 (K) è chiuso in X ×G. Sia ora K1 la proiezione di K sul primo fattore di X ×X. Siccome
le proiezioni sono continue, K1 è compatto. Inoltre
F −1 (K) = {(x, g) : (x, gx) ∈ K} ⊆ {(x, g) : x ∈ K1 } = K1 × G
Quindi F −1 (K) è un chiuso di K1 × G. Siccome G è compatto allora K1 × G è compatto e quindi
F −1 (K) è compatto. Quindi F è propria. 
Vi è una naturale corrispondenza biunivoca G/ stab(x) → Gx che è continua se l’azione di G lo è
(Teorema 2.2.16, stab(x) agisce a destra su G in quanto suo sottogruppo).
Teorema 6.6.11. Sia G un gruppo topologico che agisce in modo continuo su uno spazio topologico X. Se
l’azione è chiusa, allora per ogni x ∈ X la mappa naturale G/ stab(x) → Gx è un omeomorfismo.
D IMOSTRAZIONE . Sia F : X × G → X × X definita da F (x, g) = (x, gx). Sia x ∈ X. La
mappa naturale f : G/ stab(x) → Gx data da f [g] = gx è continua e biunivoca per come è definita
(G/ stab(x) è dotato della topologia quoziente). Vediamo che è anche chiusa e ciò concluderà grazie
al Teorema 1.7.43.
Sia A un chiuso di G/ stab(x) e sia C la sua preimmagine in G. C è un chiuso di G perché la
proiezione G → G/ stab(x) è continua. Quindi X × C è un chiuso di X × G. Siccome F è chiusa,
allora F (X ×C) è un chiuso di X ×X. Dunque F (X ×C)∩{x}×X è un chiuso di {x}×X. D’altronde
F (X × C) ∩ {x} × X = {(x, gx) : g ∈ C} = {(x, gx) : [g] ∈ A} = {x} × f (A). Quindi {x} × f (A) è un
chiuso di {x} × X. Dunque f (A) è un chiuso di X, in particolare di Gx ⊆ X. 
Esempio 6.6.12. Se G agisce su X in modo continuo, chiuso e libero, allora per ogni x ∈ X l’orbita
Gx è omeomorfa a G.
Esempio 6.6.13. Se G agisce su X in modo continuo, chiuso e transitivo, allora per ogni x ∈ X si
ha che Gx = X è omeomorfo a G/ stab(x).
Se si lavora con spazi T2 e localmente compatti (come le varietà topologiche per esempio) la
nozione di azione propria è più forte di quella di azione chiusa (Lemma 6.6.7). Vediamo adesso una
caratterizzazione topologica delle azioni proprie.
Teorema 6.6.14. Sia G un gruppo che agisce continuamente su uno spazio X. Se entrambi X e G sono
T2 e localmente compatti, allora le seguenti condizioni sono equivalenti:
(1) L’azione è propria;
(2) l’azione è propria e chiusa;
(3) per ogni compatto K ⊆ X l’insieme
B = {g ∈ G : g(K) ∩ K 6= ∅}
è compatto in G;
136 6. TOPOLOGIA DAL VIVO

(4) per ogni x, y ∈ X esistono aperti x ∈ Ux e y ∈ Uy per cui l’insieme


A = {g ∈ G : g(Ux ) ∩ Uy 6= ∅}
è relativamente compatto (ha chiusura compatta) in G.
D IMOSTRAZIONE . Denotiamo con F : X × G → X × X la funzione F (x, g) = (x, gx) data
dall’azione di G su X. Per il Lemma 6.6.7, (1) e (2) sono equivalenti.
(1) ⇒ (3). Sia K ⊆ X un compatto. Allora K × K è compatto in X × X. Siccome F è propria
l’insieme F −1 (K × K) = {(x, g) : x ∈ K, gx ∈ K} è compatto. Compatta è quindi anche la sua
proiezione su G, che è data da {g ∈ G : gK ∩ K 6= ∅}.
(3) ⇒ (4). Siccome X è localmente compatto, per ogni x, y esistono intorni compatti x ∈ Vx e
y ∈ Vy . Siano Ux ⊆ Vx e Uy ⊆ Vy intorni aperti rispettivamente di x e y. L’unione K = Vx ∪ Vy è
compatta. L’insieme A = {g ∈ G : g(Ux ) ∩ Uy 6= ∅} è un sottoinsieme di B = {g ∈ G : g(K) ∩ K 6= ∅}
che è compatto — e quindi chiuso perché G è T2 — per (3). Quindi la chiusura di A è contenuta nel
compatto B e dunque Ā è compatto.
(4) ⇒ (1). Diamo la dimostrazione nel caso in cui X e G siano a base numerabile. In questo
caso la compattezza equivale alla compattezza per successioni (Teorema 3.4.9).5 Sia K ⊆ X × X
un compatto. Dobbiam far vedere che F −1 (K) è compatto. Sia (xn , gn ) una successione in F −1 (K).
Mostriamo che a meno di sottosuccessioni essa ha un limite in F −1 (K). Siccome K è compatto, a
meno di sottosuccessioni (xn , gn xn ) converge a un punto (x, y) ∈ K. In particolare xn → x. Siano
Ux e Uy intorni come in (4). Siccome (xn , gn xn ) → (x, y) possiamo supporre che (xn , gn xn ) ∈ Ux ×
Uy . L’insieme dei gn è contenuto in A, che è relativamente compatto per (4) e quindi, a meno di
sottosuccessioni, esiste g ∈ G tale che gn → g. Quindi (xn , gn ) → (x, g). Siccome F è continua
(xn , gn xn ) = F (xn , gn ) → F (x, g) = (x, gx). Siccome (xn , gn xn ) → (x, y) si ha gx = y (nei T2 c’è
unicità del limite) e dunque (x, g) ∈ F −1 (K). 

Due parole meritano le azioni di gruppi discreti. Se un gruppo G è discreto esso è automatica-
mente T2 e localmente compatto, e tutte le azioni di G su spazi topologici sono continue. Inoltre un
sottoinsieme di G è compatto se e solo è relativamente compatto se e solo se è finito. In particolare,
il Teorema 6.6.10 ci dice che se X è T2 e localmente compatto, allora i suoi quozienti per azioni di
gruppi finiti sono T2 .
Definizione 6.6.15. Sia X uno spazio topologico. Sia G un gruppo discreto che agisce su X.
L’azione di G si dice propriamente discontinua se per ogni compatto K ⊆ X l’insieme B = {g ∈ G :
g(K) ∩ K 6= ∅} è finito.
Il Teorema 6.6.14 si enuncia cosı̀ per gruppi discreti:
Teorema 6.6.16. Sia G un gruppo discreto che agisce su uno spazio topologico X localmente compatto e
T2 . Allora le seguenti condizioni sono equivalenti
(1) L’azione è propria;
(2) l’azione è propria e chiusa;
(3) l’azione è propriamente discontinua;
(4) per ogni x, y ∈ X esistono aperti x ∈ Ux e y ∈ Uy tali che l’insieme
A = {g ∈ G : g(Ux ) ∩ Uy 6= ∅}
sia finito.
Per i gruppi discreti, di particolare rilievo sono le azioni libere e propriamente discontinue.

5Il caso generale si dimostra esattamente nello stesso modo rimpiazzando le successioni con le successioni generalizzate,
si veda l’Appendice B.
6.6. AZIONI CONTINUE, PROPRIE E PROPRIAMENTE DISCONTINUE 137

Teorema 6.6.17. Sia X uno spazio T2 e localmente compatto. Sia G un gruppo discreto che agisce su X in
modo libero e propriamente discontinuo. Allora per ogni x ∈ X esiste un intorno Vx di x tale che g(Vx )∩Vx = ∅
per ogni g 6= id.
D IMOSTRAZIONE . Sia x ∈ X. Per il Teorema 6.6.16 punto (4) (ponendo y = x ed eventualmente
rimpiazzando Ux con Ux ∩ Uy ) esiste un aperto Ux di x tale che g(Ux ) ∩ Ux 6= ∅ per g = id e al massimo
un numero finito di altri elementi g1 , . . . , gk . Poniamo g0 = id. Siccome l’azione è libera, x 6= gi (x) per
i 6= 0. Siccome X è T2 e i punti gi (x) sono in numero finito, per ogni i = 0, . . . , k esiste un intorno Ui
di gi (x) tale che gli Ui siano disgiunti tra loro. Siccome G agisce per omeomorfismi per definizione,
esiste un intorno Vx di x che sia contenuto in Ux e tale che gi (Vx ) ⊆ Ui (si è usato ancora il fatto che
i gi sono in numero finito). In particolare per ogni i 6= 0 si ha gi (Vx ) ∩ Vx ⊆ Ui ∩ U0 = ∅. Siccome
Vx ⊂ Ux , per ogni altro g 6= gi si ha g(Vx ) ∩ Vx = ∅. Quindi g(Vx ) ∩ Vx 6= ∅ solo per g = g0 = id. 

Il viceversa del Teorema 6.6.17 non è vero in generale.


Esempio 6.6.18. Sia X = R2 \ {(0, 0)}. Sia G = Z che agisce su R2 tramite n(x, y) = (2n x, 2−n y).
L’azione è libera perché abbiam tolto l’origine. Si noti che l’orbita di (x0 , y0 ) è contenuta nell’iperbole
xy = x0 y0 (si veda anche l’Esempio 6.5.34). Se x 6= 0 basta prendere 0 < ε < |x|/3 e U = (x − ε, x +
ε) × R. Si verifica immediatamente che n(U ) ∩ U = ∅ per ogni n 6= 0. Similmente se y 6= 0. D’altronde
i punti (1, 0) e (0, 1) non hanno intorni con la proprietà richiesta dal punto (4) del Teorema 6.6.16.
Quindi l’azione non è propriamente discontinua.
Teorema 6.6.19. Sia X una varietà topologica di dimensione n e G un gruppo discreto che agisce in modo
libero e propriamente discontinuo su X. Allora X/G è una varietà topologica di dimensione n.
D IMOSTRAZIONE . X è T2 , a base numerabile e localmente compatto per definizione di varietà.
Siccome la proiezione π : X → X/G è aperta (Teorema 6.5.28) allora X/G è a base numerabile e
localmente compatto. Siccome l’azione è propriamente discontinua allora X/G è T2 (Teorema 6.6.8).
Vediamo che X/G è localmente omeomorfo a Rn . Sia x ∈ X e sia U un intorno di x omeomorfo a un
aperto di Rn . Per il Teorema 6.6.17 esiste un intorno aperto Vx ⊆ U tale che gVx ∩ Vx = ∅ per ogni
g 6= id. Equivalentemente gVx ∩ hVx 6= ∅ ⇒ g = h. In altre parole, Vx contiene al più un elemento di
ogni orbita. Ne segue che π|Vx : Vx → π(Vx ) è iniettiva. Essa è tautologicamente suriettiva e siccome
π è aperta, essa è un omeomorfismo. Siccome π è aperta, π(Vx ) è un intorno aperto di π(x). Siccome
Vx ⊆ U , anch’esso è omeomorfo a un aperto di Rn . La tesi segue. 

Il seguente risultato è una utile variante del Teorema 6.6.11.


Teorema 6.6.20. Sia G un gruppo T2 , localmente compatto e a base numerabile. Sia X uno spazio T2 e
localmente compatto. Se G agisce su X in modo continuo e transitivo, allora X è omeomorfo a G/ stab(x) (per
ogni x ∈ X).
D IMOSTRAZIONE . Sia x ∈ X e f : G → X definita da f (g) = gx. Essa è continua e suriettiva
perché l’azione è continua e transitiva. La mappa naturale [f ] : G/ stab(x) → X data da [f ]([g]) =
gx è quindi continua e biunivoca. Se mostriamo che è aperta abbiam finito. Siccome la proiezione
π : G → G/ stab(x) è continua basta mostrare che f è aperta. Siccome ogni aperto è intorno dei suoi
punti, basta dimostrare che se U è un intorno di g allora f (U ) è un intorno di f (g). Se U ⊆ G è un
aperto e g ∈ U , siccome G è un gruppo topologico allora g −1 U è un intorno dell’identità. Inoltre, per
come è definita la f , si ha che f (gh) = gf (h).
Ci siamo quindi ricondotti a dover dimostrare che per ogni intorno U dell’identità, f (U ) è un
intorno di x. Sia U un intorno dell’identità. Siccome G è un gruppo topologico, la funzione ϕ(g, h) =
g −1 h è continua e quindi esiste un intorno V dell’identità tale che ϕ(V × V ) ⊂ U . Ciò significa che
g −1 h ∈ U per ogni g, h ∈ V . Inoltre, siccome G è T2 e localmente compatto, possiamo scegliere V in
modo che sia compatto.
138 6. TOPOLOGIA DAL VIVO

Adesso inseriamo il fatto che G è a base numerabile. Sia B = {Bi }i∈N una base per la topologia
di G. Definiamo il seguente insieme di indici

I = {i ∈ N : ∃g ∈ G : g ∈ Bi ⊆ gV }.

A priori I potrebbe essere vuoto, ma di sicuro è al più numerabile. Per ogni i ∈ I definiamo Gi =
{g ∈ G : g ∈ Bi ⊆ gV }. Per ogni i ∈ I scegliamo gi ∈ Gi . Per ogni g ∈ G, l’insieme gV è un intorno
di g, in particolare la sua parte interna è non vuota ed è unione di elementi di base:

∀g ∈ G ∃i ∈ N : g ∈ Bi ⊆ Int(gV ) ⊆ gV

da cui

∀g ∈ G ∃i ∈ I : g ∈ Bi ⊆ gi V

in altre parole

G = ∪i∈I gi V

è unione numerabile di traslati di V .


Sia Ai = f (gi V ) = gi f (V ). Ogni Ai è compatto in quanto immagine di un compatto, ergo chiuso
poiché X è T2 . Inoltre X = f (G) = f (∪i gi V ) = ∪i f (gi V ) = ∪i Ai . Siccome X è T2 e localmente
compatto, per il Teorema 3.5.10 uno degli Ai ha parte interna non vuota. Quindi gi−1 Ai = f (V ) ha
parte interna non vuota. Se gx ∈ Int f (V ) allora g −1 f (V ) è un intorno di x. Si noti che g ∈ V . Siccome
V è stato scelto in modo che g −1 h ∈ U per ogni g, h ∈ V , allora g −1 f (V ) = {g −1 hx : h ∈ V } ⊆ f (U ).
Dunque f (U ) è un intorno di x. 

Esempio 6.6.21. Il gruppo Isom+ (R3 ) delle isometrie di R3 che preservano l’orientazione agisce
transitivamente su R3 . Gli stabilizzatori dei punti sono tutti coniugati (ergo omeomorfi) a SO(3) =
stab(0). Quindi R3 ' Isom+ (R3 )/SO(3).

Esempio 6.6.22. Il gruppo SO(3), che è omeomorfo a RP3 , agisce per isometrie su S 2 , con stabiliz-
zatori omeomorfi a SO(2), che è un S 1 . Quindi S 2 ' SO(3)/SO(2) ' RP3 /S 1 .

Nel Teorema 6.6.20, se l’azione non è transitiva ma le orbite son chiuse, allora Gx è omeomorfo a
G/ stab(x) perché Gx , essendo un chiuso di un T2 e localmente compatto, è T2 è localmente compatto.
Quindi il Teorema 6.6.20 si può applicare all’azione di G su Gx .

Esempio 6.6.23. L’azione di R su S 2 per rotazioni orizzontali non è transitiva ma le orbite son
chiuse. Se x è il polo Nord o Sud, allora il suo stabilizzatore è tutto R e l’orbita è un sol punto,
omeomorfo a R/R. Altrimenti lo stabilizzatore è 2πZ e l’orbita, che è un parallelo, è omeomorfa a
R/2πZ ' S 1 .

Riassumiamo nella seguente tabella i principali risultati sulle azioni di gruppi topologici
6.6. AZIONI CONTINUE, PROPRIE E PROPRIAMENTE DISCONTINUE 139

G agisce su X per omeomorfismi, con X e G entrambi T2 e localmente compatti


Azione chiusa e
Azione propria ⇐⇒
stabilizzatori compatti

Azione chiusa; oppure


G compatto e azione continua; oppure
⇒ X/G di Hausdorff
G finito, oppure
G discreto, azione propriamente discontinua
Azione continua e chiusa; oppure
⇒ Gx ' G/ stab(x)
Azione continua, G a base numerabile, orbite chiuse
Azione continua, chiusa e libera; oppure
⇒ Gx ' G
Azione continua e libera, G a base numerabile
Azione continua, chiusa e transitiva; oppure
⇒ X ' G/ stab(x)
Azione continua e transitiva, G a base numerabile
G discreto, X varietà di dimensione n,
⇒ X/G varietà di dimensione n
azione libera e propriamente discontinua

Concludiamo infine questa sezione con un esempio celebre: la fibrazione di Hopf.

Esempio 6.6.24. Sia S 3 = {(z, w) ∈ C2 : |z|2 + |w|2 = 1} e sia S 1 = {u ∈ C : |u| = 1}. S 1 agisce
naturalmente su S 3 per moltiplicazione complessa:

u(z, w) = (uz, uw).

Il quoziente S 3 /S 1 è omeomorfo a S 2 .

D IMOSTRAZIONE .
S3 S6 3 2 S2 S2
= = = = S2.
S1 S6 1 S0 1
Ok, siamo seri. L’azione è continua perché la moltiplicazione per un numero complesso è continua.
Siccome S 1 e S 3 sono compatti e T2 , il quoziente è compatto e T2 per il Teorema 6.6.10. Sia D =
{(z, w) ∈ S 3 : w ∈ R, w ≥ 0}. D è la calotta superiore della sfera ottenuta dall’intersezione di S 3 col
piano =(w) = 0. Più precisamente D = {(z, t) ∈ C × R : |z|2 + t2 = 1, t ≥ 0}. In particolare D è
compatto. Inoltre, interseca tutte le orbite, infatti se (z, w) ∈ S 3 e w ∈
/ R, in particolare w 6= 0 e quindi,
posto u = w̄/|w| si ha u ∈ S 1 e u(z, w) = (uz, |w|) ∈ D. Per il Teorema 6.2.3, S 3 /S 1 è omeomorfo
a D modulo la relazione d’equivalenza ristretta a D. Vediamo quindi chi sono le intersezioni delle
orbite con D. Se t > 0 allora l’orbita di (z, t) interseca D solo in (z, t). Se invece t = 0 allora il cerchio
{(z, 0) : |z| = 1} è un’unica orbita. Quindi la relazione d’equivalenza ristretta a D è il collasso del
bordo di D a un punto, il cui quoziente è omeomorfo S 2 . 

Si noti che per il Teorema 6.6.11 le orbite sono omeomorfe a S 1 (gli stabilizzatori sono tutti banali).
Geometricamente si è “fibrato” S 3 in cerchi, che sono le orbite dell’azione di S 1 su S 3 , e il quoziente
è magicamente una sfera S 2 .
140 6. TOPOLOGIA DAL VIVO

6.7. La topologia degli spazi proiettivi


Se V è uno spazio vettoriale su K, il proiettivo di V è per definizione il quoziente di V \{0} tramite
l’azione naturale di K∗ data dalla moltiplicazione di v ∈ V per 0 6= λ ∈ K.
Il proiettivo KPn è per definizione il proiettivo di Kn+1 . Ci limiteremo qui al caso di K = R, C,
che consideriamo dotati della topologia usuale (e Kn+1 di quella prodotto). Gli spazi proiettivi so-
no quindi naturalmente muniti della topologia quoziente. Denotiamo con π : Kn+1 \ {0} → KPn
la proiezione. Un punto di KPn si denota generalmente attraverso le cosiddette coordinate omo-
genee [x0 , . . . , xn ] intendendo questa scrittura come sinonimo di [(x0 , . . . , xx )]. Quindi per esempio
[x0 , . . . , xn ] = [3x0 , . . . , 3xn ]. Se [x0 , x1 , . . . , xn ] ∈ KPn con x0 6= 0, allora possiamo scegliere il rappre-
sentante con x0 = 1 cioè il punto [1, xx01 , . . . , xxn0 ]. In altre parole, dentro KPn vive una (molte in effetti)
copia di Kn tramite la corrispondenza
Kn 3 (x1 , . . . , xn ) ←→ [1, x1 , . . . , xn ] ∈ KPn .
Ovviamente questo giochino si può fare per ogni i = 0, . . . , n (e non solo).
Definizione 6.7.1. Siano [x0 , . . . , xn ] le coordinate omogenee di KPn . La i-esima carta affine
standard di KPn è l’insieme {xi 6= 0} identificato con Kn tramite la corrispondenza
x0 xi−1 xi+1 xn
KPn 3 [x0 , x1 , . . . , xi−1 , xi , xi+1 , . . . , xn ] −→ ( , . . . , , ,..., ) ∈ Kn
xi xi xi xi
Kn 3 (x1 , . . . , xn ) −→ [x1 , . . . , xi , 1, xi+1 , . . . , xn ] ∈ KPn .
Il vettore ( xx1i , . . . , xxi−1
i
, xxi+1
i
, . . . , xxni ) ∈ Kn si chiama vettore delle coordinate affini (o coordinate non
omogenee) del punto [x0 , . . . , xn ] ∈ KPn nella carta affine xi 6= 0.
Esercizio 6.7.2. Dimostrare che per K = R, C l’identificazione di una carta affine (con la topologia
indotta dal proiettivo) con Kn (topologia standard) è un omeomorfismo.
Se si sta lavorando in una carta affine, per esempio x0 6= 0, i punti con x0 = 0 sono detti punti
all’infinito. Geometricamente la carta affine corrispondente a x0 6= 0 si vede cosı̀. In Kn+1 si considera
il piano affine α di equazioni x0 = 1. Ogni retta non parallela ad α lo interseca in uno e un solo punto.
L’intersezione di span(x0 , . . . , xn ) con α è precisamente il punto (1, xx10 , . . . , xxn0 ). Le rette parallele ad
α sono i punti all’infinito della carta affine.

rappresentante di
[r] nella carta affine
r
(1, 0, . . . , 0)
α = {x0 = 1}

F IGURA 6. Carta affine di KPn

Se un punto sta in due carte affini diverse, per esempio se [x0 , . . . , xn ] ∈ KPn ha sia x0 che xn
diversi da zero, esso si leggerà nelle due carte in modo diverso. Nell’intersezione di due carte affini
quindi, le due identificazioni con Kn danno luogo a una mappa di cambio di coordinate affini, da Kn
in sé. Per esempio, nelle carte {x0 6= 0} e {xn 6= 0} la mappa di cambio di carta è
1 x1 xn−1 1 x1 xn−1
(x1 , . . . , xn ) ←→ [1, x1 , . . . , xn ] = [ , ,..., , 1] ←→ ( , ,..., )
xn xn xn xn xn xn
6.7. LA TOPOLOGIA DEGLI SPAZI PROIETTIVI 141

Per cui il cambio di coordinate diventa


1 x1 xn−1
(x1 , . . . , xn ) ←→ (
, ,..., )
xn xn xn
Per il Corollario 2.2.17, ogni elemento di GL(n + 1, K) induce un omeomorfismo di KPn . Inoltre,
se f e g ∈ GL(n + 1, K) sono una multipla dell’altra, esse inducono la stessa funzione su KPn . Quindi
PGL(n + 1, K) è naturalmente identificato con un gruppo di omeomorfismi di KPn .
Definizione 6.7.3. Una proiettività di KPn è un’applicazione di KPn in sé indotta da un elemento
di PGL(n + 1, K).
Le proiettività di KP1 sono molto semplici da descrivere nelle carte affini e prendono il nome di
applicazioni di Moebius.  
a b
L’azione su K2 di una matrice A =   ∈ GL(2, K) è data da A(x, y) = (ax + by, cx + dy).
c d
Nella carta affine y = 1 si ha
az + b
A(z, 1) = [az + b, cz + d] = [ , 1]
cz + d
quindi nella carta affine y = 1, la proiettività indotta da A è l’applicazione di Moebius
az + b
f (z) =
cz + d
e si intende che f (−d/c) = ∞ e f (∞) = a/c.
Teorema 6.7.4. Dati z1 , z2 , z3 ∈ KP1 diversi tra loro e w1 , w2 , w3 ∈ KP1 diversi tra loro, esiste un’unica
applicazione di Moebius f tale che f (zi ) = wi .
D IMOSTRAZIONE . Siano vi , ui ∈ K2 tali che zi = [vi ] e wi = [ui ]. Siccome z1 , z2 , z3 sono diversi
tra loro, in particolare v1 , v2 non sono allineati e quindi sono una base di K2 . Esistono quindi λ1 , λ2
tali che v3 = λ1 v1 + λ2 v2 e siccome i punti zi son distinti tra loro, entrambi i λi sono diversi da zero.
Quindi [vi ] = [λi vi ] e, a meno di rimpiazzare vi con λi vi , possiamo supporre v3 = v1 + v2 . Lo stesso
dicasi per u1 , u2 , u3 . Siccome v1 , v2 è una base di K2 , esiste una unica applicazione lineare A di K2 tale
che Av1 = u1 e Av2 = u2 e per linearità Av3 = u3 . La proiettività f indotta da A manda gli zi nei wi .
Vediamo l’unicità. Se g è una proiettività tale che g(zi ) = wi , allora essa è indotta da un’appli-
cazione lineare B tale che esistano dei coefficienti µi tali che B(vi ) = µi ui . Per linearità abbiamo
µ1 u1 + µ2 u2 = B(v1 ) + B(v2 ) = B(v1 + v2 ) = B(v3 ) = µ3 u3 = µ3 (u1 + u2 ) = µ3 u1 + µ3 u2 . Siccome
u1 , u2 è una base di K2 , ne segue che µ1 = µ2 = µ3 , quindi B = µ3 A e dunque g = f . 
Veniamo adesso alla topologia vera e propria degli spazi proiettivi.
Teorema 6.7.5. I proietivi RPn e CPn sono T2 .
D IMOSTRAZIONE . Ogni v, w ∈ Rn non allineati sono separati da coni aperti, cioè da aperti saturi.
(Discorso simile per CPn ). 
Esercizio 6.7.6. Dimostrare che l’azione di R∗ su Rn \ {0} è chiusa. Dedurne che i proiettivi son
T2 . (Stessa cosa per l’azione di C∗ su Cn \ {0}.)
Teorema 6.7.7. I proietivi RPn e CPn sono a base numerabile e sono, globalmente e localmente, compatti
e connessi per archi.
D IMOSTRAZIONE . Sia K = R, C. La relazione d’equivalenza che definisce i proiettivi è data
dall’azione di K \ {0} su Kn+1 \ {0} (K = R, C). Per il Teorema 6.5.28 la proiezione π è aperta. In
particolare, siccome Kn+1 \ {0} è localmente compatto e localmente connesso per archi, anche gli
spazi proiettivi lo sono. Inoltre, per il Teorema 2.2.15, gli spazi KPn sono a base numerabile.
142 6. TOPOLOGIA DAL VIVO

Infine, la sfera unitaria di Kn+1 , S = {||x|| = 1}, è compatta e interseca tutte le classi di equi-
valenza. Quindi KPn = π(S) è compatto e connesso per archi in quanto immagine continua di un
compatto e connesso per archi. 
Corollario 6.7.8. Gli spazi proiettivi su R e C sono metrizzabili.
D IMOSTRAZIONE . Essendo compatti T2 e a base numerabile, per il Corollario 5.2.12 sono metriz-
zabili. 
In particolare, nei proiettivi si può lavorare con le successioni in modo abbastanza tranquillo
(Corollario 1.7.11, Teoremi 1.5.8 e 5.6.14). Nel proiettivo, una successione pn = [vn ] ∈ KPn converge a
[v] se e solo se esistono numeri λn 6= 0 tali che λn vn → v in Kn+1 .
Teorema 6.7.9. Ogni carta affine è un aperto denso.
D IMOSTRAZIONE . Facciamo la dimostrazione per K = R. Il caso K = C è analogo. A meno di
proiettività possiamo supporre che la carta affine in questione sia quella x0 6= 0. In Rn+1 consideriamo
l’emisfero boreale aperto B = {x = (x0 , . . . , xn ) ∈ Rn+1 : ||x|| = 1, x0 > 0}, e la sua chiusura
B = {x = (x0 , . . . , xn ) ∈ Rn+1 : ||x|| = 1, x0 ≥ 0} (Figura 7).

Rn+1

carta affine x0 = 1

RPn−1 all’infinito
Rn

F IGURA 7. Visualizzazione del proiettivo attraverso l’emisfero boreale

Il saturato di B è un aperto di Rn+1 e π(sat(B)) = π(B). L’immagine π(B) è la carta affine x0 6= 0


e siccome π è aperta e sat(B) è un aperto, allora π(B) = π(sat(B)) è aperto. Siccome π è continua e
π(B) = RPn , tale aperto è denso (Teorema 1.7.10). 
In particolare, la frontiera topologica di una carta affine è formata dai punti all’infinito. Nel caso
del piano proiettivo RP2 = P(R3 ), i punti all’infinito della carta affine x0 6= 0 sono una retta proiettiva,
corrispondente a π({x0 = 0}), che si chiama retta all’infinito. In generale in una carta affine di KPn i
punti all’infinito sono un KPn−1 per cui
KPn = Kn ∪ (KPn−1 )∞ .
Con la terminologia della dimostrazione del Teorema 6.7.9, il KPn−1 all’infinito non è altro che
l’immagine della frontiera di B in B (Figura 7). Si noti che ciò è una riformulazione dei Lemmi 6.2.6
e 6.2.7. In particolare abbiamo una ricetta ricorsiva per costruire i proiettivi reali: Si prende un disco
Dn e lo si attacca su un proiettivo di dimensione n − 1 incollando ∂Dn = S n−1 su RPn−1 attraverso
l’antipodale. Quindi RP0 è un punto; RP1 è un segmento con entrambi i vertici incollati su tale punto,
quindi è un S 1 ; RP2 è un disco col bordo attorcigliato due volte su un S 1 = RP1 ; RP3 è un D3 incollato
su un RP2 e cosı̀ via...
Corollario 6.7.10. KPn è una compattificazione di Kn .
D IMOSTRAZIONE . KPn è compatto per il Teorema 6.7.7 e per il Teorema 6.7.9 contiene un sot-
toinsieme denso omeomorfo a Kn (una carta affine). 
6.8. RP2 E LA CHIUSURA PROIETTIVA DI SOTTOINSIEMI DI R2 143

Un caso particolare è quello di KP1 = P(K2 ). In questo caso la carta x0 6= 0 è omeomorfa a K e c’è
un solo punto all’infinito: la classe proiettiva della retta di K2 di equazione x0 = 0 (che in carta affine
corrisponderebbe a [1, ∞]). Per questo si suole dire che
KP1 = K ∪ {∞}.
In altre parole, KP1 è la compattificazione di Alexandroff di K.
Teorema 6.7.11. CP1 è la compattificazione di Alexandroff di R2 .
D IMOSTRAZIONE . Segue dal fatto che C è omeomorfo a R2 . 

Corollario 6.7.12. RP1 è omeomorfo a un cerchio, CP1 è omeomorfo a una sfera.


D IMOSTRAZIONE . Siccome R e R2 sono T2 e localmente compatti, le loro compattificazioni di
Alexandroff sono uniche a meno di omeomorfismi. S 1 è la compattificazione di R e S 2 è quella di
R2 . 

6.8. RP2 e la chiusura proiettiva di sottoinsiemi di R2


Abbiamo visto che RP2 e CP1 sono entrambi compattificazioni di R2 . Intuitivamente sono diversi:
il complementare di R2 in RP2 è RP1 e non un sol punto; ma ciò non basta a priori per dire che RP2
non è la compattificazione di Alexandrof di R2 (si veda per esempio l’Esercizio 3.6.33). In effetti è vero
che RP2 e CP1 non sono omeomorfi, ma il modo più semplice di dimostrarlo è quello di sviluppare
invarianti abbastanza potenti come il gruppo fondamentale (che faremo nel Capitolo 7, si veda in
particolare il Corollario 7.6.7) o la caratteristica di Eulero, oppure attraverso risultati come il teorema
della curva di Jordan. Per il momento, accontentiamoci di sapere che son diversi.
Lemma 6.8.1. RP2 è un disco attaccato a un nastro di Moebius lungo la frontiera.

D IMOSTRAZIONE . Sappiamo (Lemma 6.2.8) che RP2 è omeomorfo a . Se da tale disegno

togliamo un quadrato (che è omeomorfo a un disco) otteniamo . Con un po’ di taglia e cuci si
ottiene un nastro di Moebius (Figura 8). 

F IGURA 8. RP2 è un disco più un Moebius

Lo stesso procedimento mostra che rimuovendo un punto da RP2 si ottiene un nastro di Moebius
“aperto”. Si noti che rimuovendo un punto da CP1 si ottiene R2 . (Ma ancora non sappiamo dimostra-
re che R2 è diverso da un nastro di Moebius aperto). In particolare, ciò ci dice che un’intorno della
retta all’infinito, che è un S 1 , è un nastro di Moebius. Si apprezzi la differenza con S 2 ove un’intorno
dell’equatore è un cilindro.
Definizione 6.8.2. Sia X ⊆ R2 . La chiusura proiettiva di X è la chiusura di X in RP2 , ove R2 è
considerato una carta affine di RP2 .
144 6. TOPOLOGIA DAL VIVO

Vediamo come si calcola la chiusura proiettiva di un insieme. Siccome i proiettivi son metrizza-
bili, per trovare la chiusura di X basta trovare i limiti di tutte le successioni in X. Per le successioni
limitate, si fa come in R2 , per quelle che invece “tendono all’infinito in R2 ” si devono fare i conti nel
proiettivo.
Una successione di punti pn ∈ R2 converge a un punto all’infinito nel proiettivo se la retta per
l’origine e pn converge a una ben definita retta. Questa cosa si può visualizzare bene usando la calotta
boreale in R3 (Figura 9).

pn

punto limite all’infinito

F IGURA 9. Convergenza verso punti all’infinito

In formule, se pn = (xn , yn ) in R2 , esso corrisponde al punto di coordinate omogenee [1, xn , yn ].


Sia Cn = max{|xn |, |yn |}. Se pn → ∞ in R2 allora Cn → ∞. Se xn /Cn → x∞ e yn /Cn → y∞ per certi
x∞ , y∞ , allora il punto limite all’infinito di pn nel proiettivo è [0, x∞ , y∞ ]:
1 xn yn
[1, xn , yn ] = [ , , ] → [0, x∞ , y∞ ].
Cn Cn Cn
Esempio 6.8.3. La chiusura proiettiva di un iperbole è un cerchio. (Figura 10.)
D IMOSTRAZIONE . Sia X = {xy = 1} un’iperbole (a meno di affinità di R2 , che sono proiettività,
si può sempre supporre che sia in questa forma). Possiamo descrivere X con l’usuale formula y = 1/x.
Quindi i punti all’infinito dell’iperbole si hanno quando x tende a zero, da destra o sinistra, o a ±∞.

[0, 0, 1]

[0, 1, 0] [0, 1, 0]

[0, 0, 1]

F IGURA 10. Un’iperbole in RP2 visto come D2 modulo l’andipodale al bordo (che è
equivalente al modello della calotta boreale vista dall’alto).

1
[1, x, ] = [x, x2 , 1] → [0, 0, 1] per x → 0 da destra o sinistra (in questo caso Cn = |1/x|)
x
1 1 1
[1, x, ] = [ , 1, 2 ] → [0, 1, 0] per x → ±∞ (in questo caso Cn = |x|).
x x x
6.9. CP1 E LA COMPATTIFICAZIONE DI ALEXANDROFF DI SOTTOINSIEMI DI R2 145

Quindi X ha due punti all’infinito: [0, 0, 1] che è il limite dei due rami che tendono all’asintoto ver-
ticale e [0, 1, 0] che è il limite dei due rami che tendono all’asintoto orizzontale. La chiusura proiet-
tiva di X si ottiene quindi incollando i due rami dell’iperbole ai due punti limite, ottenendo cosı́ un
cerchio. 
Esempio 6.8.4. La chiusura proiettiva di una parabola è un cerchio. (Figura 11.)
D IMOSTRAZIONE . Sia X = {x2 − y = 0} una parabola (a meno di affinità di R2 , che sono proiet-
tività, si può sempre supporre che sia in questa forma). Possiamo descrivere X con l’usuale formula
y = x2 . Quindi i punti all’infinito della parabola si hanno quando x tende a ±∞.

[0, 0, 1]

[0, 0, 1]

F IGURA 11. Una parabola in RP2 visto come D2 modulo l’andipodale al bordo.

1 1
[1, x, x2 ] = [
, , 1] → [0, 0, 1] per x → ±∞ (in questo caso Cn = x2 ).
x2 x
Quindi X ha un solo punto all’infinito: [0, 0, 1]. La chiusura proiettiva di X coincide quindi con la sua
compattificazione di Alexandroff ed è dunque un cerchio. 

6.9. CP1 e la compattificazione di Alexandroff di sottoinsiemi di R2


Come abbiamo visto, CP1 è la compattificazione di Alexandroff di C ' R2 , ed è quindi una sfera,
identificata con C ∪ {∞}. La carta affine y = 1 è identificata con C tramite la corrispondenza
x x
z 7→ [z, 1] [x, y] = [ , 1] 7→
y y
e includendo il punto all’infinito, possiamo dire che
1 1 1
= ∞, = 0, ∞ ←→ [∞, 1] = [1, ] = [1, 0].
0 ∞ ∞
Topologicamente, se si pensa a CP1 come una sfera, si può visualizzare il punto all’infinito nel
polo nord e la carta affine y = 1 come il suo complementare. Un’omeomorfismo esplicito della carta
affine con R2 è dato dalla proiezione stereografica.
Lemma 6.9.1. Sia X ⊆ R2 un chiuso non limitato (e quindi non compatto). La compattificazione di
Alexandroff di X è la chiusura di X in CP1 .
D IMOSTRAZIONE . Siccome X è chiuso in R2 , ma non limitato, la sua chiusura in CP1 è un com-
patto T2 ottenuto aggiungendo un sol punto ad X. (Si vedano il Teorema 3.5.24 e l’Esempio 3.5.25).

Le applicazioni di Moebius di C hanno proprietà molto interessanti.
146 6. TOPOLOGIA DAL VIVO

Teorema 6.9.2. Un’applicazione di Moebius manda cerchi e rette di C in cerchi e rette (un cerchio può
andare in una retta e viceversa).
D IMOSTRAZIONE . Innanzi tutto si noti che un’applicazione di Moebius è composizione di trasla-
zioni (z 7→ z + λ), omotetie (z 7→ λz) e l’inversione f (z) = 1/z, infatti
az + b z + b/a a cz + cb/a a cz + d − d + cb/a a −d + cb/a
=a = = = (1 + )
cz + d cz + d c cz + d c cz + d c cz + d
Le traslazioni e le omotetie mandano cerchi in cerchi e rette in rette e si verifica facilmente (si vedano
gli Esercizi 6.11.45 e 6.11.46) che l’inversione manda
• rette passanti per l’origine in rette passanti per l’origine;
• rette non passanti per l’origine in cerchi passanti per l’origine e viceversa;
• cerchi non passanti per l’origine in cerchi non passanti per l’origine.


Inoltre, per il Teorema 6.7.4 si può sempre scambiare il punto all’infinito con un punto qualsiasi
di C attraverso un’applicazione di Moebius, che è un omeomorfismo di CP1 . Ciò risulta utile per
esempio se si vuole calcolare la compattificazione di Alexandroff di un sottoinsieme di R2 . Infatti, se
X ⊂ R2 ' C è un insieme illimitato, per farne la compattificazione basta considerare un punto p che
non appartiene a X e un’applicazione di Moebius f tale che f (p) = ∞ e f (∞) = p. Siccome f è un
omeomorfismo, la chiusura di X in CP1 è omeomorfa alla chiusura di f (X), che è un sottoinsieme
limitato di C perché p ∈
/ X e quindi la sua chiusura si calcola nel modo usuale.
Esempio 6.9.3. Sia X un’insieme formato da due rette incidenti in R2 . La sua compattificazione di
Alexandroff è omeomorfa a due cerchi intersecantesi in due punti.
D IMOSTRAZIONE . Scambiando tra loro l’infinito e un punto p ∈
/ X con una Moebius, le due rette
incidenti che formano X diventano due cerchi incidenti in due punti: il punto di incidenza originario
e p (che era l’infinito). 

6.10. Birapporto
Dati tre punti distinti x, y, z ∈ KP1 , il Teorema 6.7.4 ci dice che esiste un’unica applicazione di
Moebius f tale che f (x) = 1, f (y) = 0, f (z) = ∞. Esplicitamente si ha
x−z t−y
f (t) = · .
x−y t−z
Definizione 6.10.1. Il birapporto (in inglese cross-ratio) di quattro punti distinti di KP1 è definito
come
x−z t−y
(t, x; y, z) = · .
x−y t−z
Per come è definito, il birapporto di quattro punti è l’immagine del primo tramite l’unica appli-
cazione di Moebius che manda gli altri tre in 1, 0, ∞.
Esercizio 6.10.2. Dimostrare che se (a, b; c, d) = x, allora se si permutano a, b, c, d in ogni modo
possibile, i birapporti che si ottengono sono esattamente x, x1 , 1 − x, 1−x
1 x
, x−1 , x−1
x .

Esercizio 6.10.3. Dimostrare che date due quadruple di punti distinti in KP1 , esiste un’applicazio-
ne di Moebius che manda l’una nell’altra se e solo se le due quadruple hanno lo stesso birapporto.
Esercizio 6.10.4. Dimostrare che il birapporto è invariante per trasformazioni di Moebius: (x, y; z, t) =
(f (x), f (y); f (z), f (t)) per ogni trasformazione di Moebius f e per ogni quadrupla di punti distinti
x, y, z, t.
6.11. ESERCIZI 147

Teorema 6.10.5. Quattro punti distinti di C stanno su un cerchio o retta se e solo se il loro birapporto è
reale.
D IMOSTRAZIONE . Siano a, b, c, d quattro punti distinti e sia f l’unica Moebius che manda b, c, d
in 1, 0, ∞. Se a, b, c, d stanno su un cerchio o retta, allora per il Teorema 6.9.2 f (a) giace sull’unico
cerchio/retta che passa per 1, 0, ∞, cioè su R. Viceversa, se f (a) è reale allora a, b, c, d stanno su
f −1 (R) che, sempre per il Teorema 6.9.2, è un cerchio o una retta. 
Esempio 6.10.6. I punti 0, 2i + 1, 2i, 1 stanno su un cerchio in quanto (0, 2i + 1; 2i, 1) = −4 ∈ R.

6.11. Esercizi
Esercizio 6.11.1. Sia M una varietà topologia connessa avente un punto di taglio locale. Dimostra-
re che la dimensione di M è uno.
Esercizio 6.11.2. In R2 siano X = B((0, 0), 10), Y = B((5, 0), 1), Z = B((−5, 0), 1). Dimostrare che
X \ Y non è omeomorfo a X \ (Y ∪ Z).
Esercizio 6.11.3. In R2 sia X = {x2 +y 2 < 1}. Dimostrare che X e X \{(0, 0)} non sono omeomorfi.
Esercizio 6.11.4. Sia X = {(x, y, z) ∈ R3 : x2 + y 2 = 1}. Sia Y un toro privato di un punto.
Dimostrare che X e Y non sono omeomorfi.
Esercizio 6.11.5. Per ogni n ≥ 3 sia Pn un poligono regolare con n lati inscritto in un cerchio
unitario e sia Xn la chiusura della regione compresa tra il cerchio e il poligono. Dimostrare che Xn è
omeomorfo a Xm se e solo se m = n.
Esercizio 6.11.6. Dimostrare che S 2 privato di un punto non è omeomorfo a S 2 privato di due
punti.
Esercizio 6.11.7. Si dia un esempio di uno spazio X tale che X meno un punto sia omeomorfo a
X meno due punti.
Esercizio 6.11.8. Dimostrare che R2 con la metrica dei raggi ha un punto di taglio.
Esercizio 6.11.9. Dimostrare che ogni punto di R2 con la metrica dei raggi è di taglio.
Esercizio 6.11.10. Dimostrare che R con la topologia di Zariski non ha punti di taglio.
Esercizio 6.11.11. Dimostrare che R con la topologia di Zariski non ha punti di taglio locali.
Esercizio 6.11.12. Siano X = {(x, y, z) ∈ R3 : −1 ≤ x ≤ 1} e Y = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1}.
Dimostrare che X e Y non sono omeomorfi.
Esercizio 6.11.13. Sia X = {(x, y, z) ∈ R3 : |xzy| ≤ 1}. Siano A = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1},
B = {(x, y, z) ∈ R3 : x2 + z 2 ≤ 1}, C = {(x, y, z) ∈ R3 : z 2 + y 2 ≤ 1} e sia Y = A ∪ B ∪ C. Dimostrare
che X non è omeomorfo a Y .
Esercizio 6.11.14. Dimostrare che un cubo e una piramide sono omeomorfi.
Esercizio 6.11.15 (Superficie di genere tre). Dimostrare che questi due spazi sono omeomorfi:

Esercizio 6.11.16. Si dica se un cilindro con un buco è omeomorfo a una sfera con tre buchi.
148 6. TOPOLOGIA DAL VIVO

Esercizio 6.11.17. In R2 sia X = [−10, 10] × [−10, 10] \ (((−5, −3) × (−1, 1)) ∪ ((3, 5) × (−1, 1))).
(Esso è un quadrato con due buchi quadrati). In R3 sia Y = ∂([−1, 1] × [−1, 1]) × [−10, 10]. (Esso è un
cilindro a base quadrata). Su X t Y mettiamo la relazione generata da
(x, 10) ∼ (x, −10) (10, x) ∼ (−10, x) (x, y, −10) ∼ (x − 4, y) (x, y, 10) ∼ (−x + 4, y).
Dimostrare che X t Y / ∼ è una superficie di genere due.
Esercizio 6.11.18. Si provi che la superficie di una tazzina da caffè classica è omeomorfa a un toro.
Esercizio 6.11.19. Dimostrare che un pallone da rugby e uno da calcio sono omeomorfi.
Esercizio 6.11.20. Dimostrare che R2 meno una retta è omeomorfo a S 2 meno una circonferenza.
Esercizio 6.11.21. Dimostrare che R2 meno una retta e un punto è omeomorfo a R2 meno una
circonferenza.
Esercizio 6.11.22. Dimostrare che R3 meno una retta e un punto è omeomorfo a R3 meno una
circonferenza.
Esercizio 6.11.23. Dimostrare che la bottiglia di Klein è ottenuta unendo due nastri di Moebius
lungo la frontiera.
Esercizio 6.11.24. Sia X lo spazio ottenuto incollando tra loro i lati opposti di un esagono rego-
lare mantenendo le orientazioni. Dimostrare che X è una varietà topologica. Dimostrare che X è
omeomorfo a un toro.
Esercizio 6.11.25. Sia X lo spazio ottenuto incollando tra loro i lati opposti di un ottagono rego-
lare mantenendo le orientazioni. Dimostrare che X è una varietà topologica. Dimostrare che X è
omeomorfo a una superficie di genere due.
Esercizio 6.11.26. Sia A un ottagono regolare in R2 e sia X lo spazio ottenuto identificando i due
lati orizzontali tra loro e i due lati verticali tra loro. Sia B un quadrato privato di un disco aperto e sia
Y lo spazio ottenuto identificando i due lati orizzontali tra loro e i due lati verticali tra loro.
> >
@
Y

@
@


X ∧





@
@
@ > >

Dimostrare che X e Y sono omeomorfi, che sono varietà a bordo e che sono omeomorfi a un toro a
cui è stato rimosso un disco.
Esercizio 6.11.27. Sia X lo spazio ottenuto da una forma a “L” identificando i lati come in figura:

Dimostrare che X è omeomorfo a una superficie di genere due.


Esercizio 6.11.28. Sia X lo spazio ottenuto da una forma a “L” identificando i lati come in figura:
6.11. ESERCIZI 149

Dimostrare che X è omeomorfo a una superficie di genere due.


Esercizio 6.11.29. Sia X lo spazio ottenuto da una forma a “L” identificando i lati come in figura:

Convincersi che X non è omeomorfo a una superficie di genere due (è una superficie di genere tre).
Esercizio 6.11.30. Dimostrare che lo spazio R/Z dell’Esempio 2.2.11 è un bouquet di infinite copie
di S 1 .
1
Esercizio 6.11.31. Sia X = { n+1 : n ∈ N} ∪ {0} con la topologia indotta da R. Esso è una successio-
ne convergente a zero. Sia Y = {0, 1} con la topologia discreta. Sia f la funzione che vale 1 in zero e 0
altrove. Sia fn la funzione che vale 1 per x > 1/n e 0 altrove. Dimostrare che fn → f per la topologia
compatto-aperta. Dimostrare che fn non converge uniformemente a f .
Esercizio 6.11.32. Sia X uno spazio topologico e Y uno spazio metrico. Sia fn : X → Y una
successione di funzioni continue. Dimostrare che se fn → f uniformemente allora f è continua.
Esercizio 6.11.33. Siano X, Y spazi topologici e sia fn : X → Y una successione di funzioni che
converge a f nella topologia compatto-aperta. Dimostrare che per ogni x ∈ X si ha fn (x) → f (x).
Esercizio 6.11.34. Sia G un gruppo che agisce su X. Dimostrare che se y = gx allora stab(y) =
g stab(x)g −1 .
Esercizio 6.11.35. Su S 2 facciamo agire G = Z/6Z via rotazioni di angolo 2π/6 attorno all’asse Z.
Si dimostri che il quoziente è una varietà topologica.
Esercizio 6.11.36. Sia G ≤ omeo(R2 ) il gruppo generato da una rotazione di angolo π/3 e da
un’omotetia di ragione 2. Si determini il quoziente (R2 \ {0})/G .
Esercizio 6.11.37. Sia G ≤ omeo(R2 ) il gruppo generato dalle riflessioni rispetto all’asse X e
rispetto alla retta y = 2x. Si dica se R2 /G è T2 .
Esercizio 6.11.38. Sia G ≤ omeo(R2 ) il gruppo generato dalle riflessioni rispetto all’asse X e
rispetto alla retta y = 2x. Sia S 1 ⊆ R2 . Si determini S 1 /G.
Esercizio 6.11.39. Dimostrare che R/Z è omeomorfo a S 1 . Dimostrare che R2 /Z2 è omeomorfo al
toro T 2 . Dimostrare che Rn /Zn è omeomorfo a T n .
Esempio 6.11.40. Consideriamo l’azione di SO(2) in R3 per rotazioni orizzontali, i.e. per ogni A ∈
SO(2) sia A(x, y, z) = (A(x, y), z). Si dimostri che il quoziente S 2 /SO(2) è uno spazio di Hausdorff.
Si dica se è omeomorfo a un segmento.
Esercizio 6.11.41. In C2 consideriamo l’azione di S 1 data per moltiplicazione su entrambe le
coordinate: θ(z, w) = (θz, θw). Si dica se C2 /S 1 è T2 .
150 6. TOPOLOGIA DAL VIVO

Esercizio 6.11.42. In R3 consideriamo l’azione per isometrie di SO(3). Si dica se R3 /SO(3) è T2 .


Esercizio 6.11.43. Dimostrare che gli spazi degli Esempi 2.2.10 e 6.5.34 sono omeomorfi tra loro.
Esempio 6.11.44. Sia S 3 = {x + iy + jz + kt : x2 + y 2 + z 2 + t2 = 1} la sfera unitaria dei quaternioni,
con la struttura di gruppo indotta. Sia S 2 = {p ∈ S 3 : <(p) = 0} = {iy + jz + kt : y 2 + z 2 + t2 = 1}.
Dimostrare che l’azione per coniugio di S 3 su sé stesso preserva S 2 . Determinare gli stabilizzatori di
tale azione, dedurne che S 2 = S 3 /S 1 . Confrontare questa costruzione con la fibrazione di Hopf.
Esercizio 6.11.45. Sia f (z) = 1/z definita su C∪{∞}. Sia Rα una retta a distanza α > 0 dall’origine.
Dimostrare che esiste z0 ∈ C di modulo uno tale che Rα = {λz0 + iαz0 : λ ∈ R}. Dimostrare che
f (Rα ) è il cerchio di centro −iz̄0 /2α e raggio 1/2α. (Suggerimento: Per z ∈ Rα calcolare la distanza
tra f (z) e il centro del cerchio).
Esercizio 6.11.46. Sia f (z) = 1/z definita su C ∪ {∞}. Dimostrare che per ogni z0 ∈ C e R 6= |z0 |,
f manda il cerchio di centro z0 e raggio R nel cerchio di centro z̄0 /(|z0 |2 − R2 ) e raggio R/||z0 |2 − R2 |.
(Suggerimento: calcolare la distanza tra f (z) e il centro del cerchio immagine, ricordando che R =
|z − z0 | se z sta nel cerchio di partenza).
Esercizio 6.11.47. In R2 sia X = {|x| ≥ 1} ∩ {|y| ≥ 1}. Dimostrare che la chiusura proiettiva e la
compattificazione di Alexandroff di X non sono omeomorfe.
Esercizio 6.11.48. In R2 sia X = {|x| > 1} ∩ {|y| > 1}. Dimostrare che la chiusura proiettiva e la
compattificazione di Alexandroff di X c non sono omeomorfe.
Esercizio 6.11.49. Dimostrare che i quattro spazi degli Esercizi 6.11.47 e 6.11.48 sono tutti diversi
tra loro.
Esercizio 6.11.50. Sia X = {xy ≥ 0}. Si dica se la compattificazione di Alexandroff e la chiusura
proiettiva di X sono omeomorfe.
Esercizio 6.11.51. Si dica se i sei spazi degli Esercizi 6.11.47, 6.11.48, e 6.11.50 son tutti diversi tra
loro.
Esercizio 6.11.52. In R2 sia X = {(x, 2n x2 ), x ∈ R, n ∈ Z}. Si determinino la chiusura proiettiva e
la compattificazione di Alexandroff di X. Si dica se sono connesse e/o localmente connesse per archi.
Esercizio 6.11.53. Dimostrare che la chiusura proiettiva di un’iperbole qualsiasi e quella di una
parabola qualsiasi sono sempre omeomorfe a un’ellisse.
Esercizio 6.11.54. Sia A = {xy < 1} ⊆ R2 . Dimostrare che la chiusura proiettiva di A è omeomorfa
a un nastro di Moebius.
Esercizio 6.11.55. Sia B = {xy > 1} ⊆ R2 . Dimostrare che la chiusura proiettiva di B è omeomorfa
a una palla chiusa.
Esercizio 6.11.56. Sia C = B(0, 1) ⊆ R2 . Dimostrare che la chiusura proiettiva del complementare
di C è omeomorfa a un nastro di Moebius.
Esercizio 6.11.57. Sia D = {y > x2 }. Dimostrare che la chiusura proiettiva di C è omeomorfa a un
disco e che la chiusura proiettiva di Dc è omeomorfa a un nastro di Moebius.
Esercizio 6.11.58. Dimostrare che date due quadruple di rette distinte e passanti per l’origine in
R2 , esiste un diffeomorfismo di R2 che manda le une nelle altre se e solo se i birapporti delle due
quadruple (come punti di RP1 ) coincidono.
CAPITOLO 7

Un pizzico di topologia algebrica: il gruppo fondamentale e i suoi


amici

AVVERTIMENTO : In questo capitolo, e soprattutto a partire dalla Sezione 7.2, si parlerà di concetti
che trovano il loro ambito di applicazione naturale nella trattazione di spazi decenti, ove il minimo
richiesto per la decenza è la locale connessione per archi e l’essere di Hausdorff. Molti autori scelgono
quindi di mettere a questo punto l’ipotesi che tutti gli spazi in questione siano decenti. Qui si è scelto
di non farlo e di enunciare i teoremi e i risultati con le ipotesi opportune. Va da sé che il lettore può
tranquillamente sovraimporre l’ipotesi di decenza ad ogni spazio, semplificando quindi enunciati e
definizioni. A proposito di quest’ultime, sia detto che non c’è una scelta standard universale sul chie-
dere o meno la decenza degli spazi. Per esempio quando leggerete la definizione di “semplicemente
connesso” vedrete che la versione più comune è “X è semplicemente connesso se è connesso e il suo
gruppo fondamentale è banale” senza specificare se X debba essere localmente connesso per archi
o meno. Come si suol dire, queste son questioni di lana caprina: in generale uno lavora con spazi
decenti, altrimenti avrà la buona creanza di specificare le notazioni e le convenzioni in uso.

7.1. Omotopie e deformazioni


Definizione 7.1.1. Due funzioni continue f, g : X → Y tra spazi topologici si dicono omotope se
esiste una funzione continua F : X × [0, 1] → Y tale che per ogni x ∈ X si ha
F (x, 0) = f (x) F (x, 1) = g(x).
Tale F si dice omotopia tra f e g.
Per le omotopie si usa spesso la notazione Ft (x) = F (x, t). Un’omotopia può quindi essere
descritta come una famiglia continua di funzioni Ft : X → Y , ossia un cammino tra f e g nello
spazio delle funzioni continue da X a Y . Graficamente, un’omotopia rappresenta una deformazione
continua da f a g

g = F1

Ft
X × {1}
X × {t}
F
X × [0, 1]

X × {0}

f = F0

F IGURA 1. Omotopia tra funzioni

151
152 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Esempio 7.1.2. Sia f : [0, 2π] → R2 data da f (x) = (cos x, sin x). La funzione costantemente nulla
è omotopa a f tramite l’omotopia F (x, t) = tf (x).
Definizione 7.1.3. Siano X, Y spazi topologici e sia A ⊆ X. Siano f, g : X → Y due funzioni
continue che coincidono su A. Un’omotopia F : X × [0, 1] → Y tra f e g si dice relativa ad A se è
costante su A:
F (x, 0) = f (x) F (x, 1) = g(x) F (a, t) = f (a) = g(a) ∀a ∈ A.
In tal caso f e g si dicono omotope relativamente ad A.
Esempio 7.1.4. Sia f : [0, 1] → R2 data da f (t) = (t, t2 ) e sia g(t) = (t, 0). L’omotopia F (t, s) =
(t, st2 ) è un’omotopia tra g e f relativa a {0} ma non relativa a {0, 1}.
Esempio 7.1.5. Sia f : [0, 1] → R2 data da f (t) = (t, t2 − t) e sia g(t) = (t, 0). L’omotopia F (t, s) =
(t, s(t2 − t)) è un’omotopia tra g e f relativa a {0, 1}.
Teorema 7.1.6. La relazione di omotopia (relativa o meno) è una relazione d’equivalenza sull’insieme delle
funzioni continue da X a Y .
D IMOSTRAZIONE . Siano X, Y spazi topologici e sia f : X → Y continua. Chiaramente f è
omotopa a sé stessa tramite F (x, t) = f (x) indipendentemente da t. Se g : X → Y è una funzione
omotopa a f e se F è un’omotopia tra f e g, allora la funzione G(x, t) = F (x, 1 − t) è un’omotopia tra
g e f . Quindi la relazione d’omotopia è simmetrica.
Sia ora h una terza funzione continua da X → Y e supponiamo che esistano omotopie F, G, tra f
e g la prima, e tra g e h l’altra. La funzione

 F (x, 2t) t ∈ [0, 1/2]
H(x, t) =
 G(x, 2t − 1) t ∈ [1/2, 1]

è un’omotopia tra f e h.
Si noti che la stessa dimostrazione è valida anche per omotopie relative. 

Graficamente, guardando la Figura 1, l’omotopia H si può pensare costruita mettendo “G sopra


F ” e riscalando l’altezza del cilindro X × [0, 2] ottenuto. Se non diversamente specificato, la scrittura
f ∼ g indica solitamente due funzioni omotope.
Esercizio 7.1.7. Verificare che la funzione H sopra descritta è continua.
Teorema 7.1.8. Sia X uno spazio topologico, allora tutte le funzioni continue da X a Rn sono omotope
tra loro.
D IMOSTRAZIONE . Ciò dipende dalla struttura lineare di Rn . Siano f, g : X → Rn due funzioni
continue, allora la funzione
F (x, t) = tg(x) + (1 − t)f (x)
è un’omotopia tra f e g. 

Qui il discorso si fa simile agli omeomorfismi: in generale è fattibile dimostrare che due funzioni
sono omotope, mentre per dimostrare che non lo sono servono strumenti più potenti.
Esercizio 7.1.9. Provare a dimostrare che le funzioni f, g : S 1 → C \ {0} date da
f (x) = x g(x) = f (x) + 3i
non sono omotope. (Qui si è identificato S 1 col cerchio unitario di C.) Dimostrare che sono invece
omotope in CP1 \ {0}.
7.1. OMOTOPIE E DEFORMAZIONI 153

Definizione 7.1.10 (Inversa di omotopia). Sia f : X → Y una funzione continua. Una funzione
continua g : Y → X si dice inversa di omotopia destra di f se f ◦ g : Y → Y è omotopa all’identità di
Y ; sinistra se g ◦ f : X → X è omotopa all’identità di X. Si dice inversa di omotopia se è un’inversa
destra e sinistra.
Esempio 7.1.11. Se X è costituito da un sol punto, allora qualsiasi funzione X → Y ha come
inversa di omotopia sinistra la funzione costante Y → X. In generale non ci sono però inverse destre
Y → X. (Per esempio se Y non è connesso.)
Ovviamente l’inversa di una funzione continua, se continua, è anche un’inversa di omotopia. Gli
omeomorfismi quindi hanno sempre un’inversa di omotopia. In generale però le funzioni che hanno
un’inversa di omotopia non sono necessariamente biunivoche.
Esempio 7.1.12. Sia X = C \ {0} e sia S 1 = {z ∈ C : |z| = 1}. Sia f : S 1 → X l’inclusione e sia
g : X → S 1 data da g(z) = z/|z|. La funzione f non è suriettiva, g non è iniettiva. Nondimeno f e g
sono inverse di omotopia l’una dell’altra.
D IMOSTRAZIONE . f ◦ g : X → X è semplicemente uguale a g. Un’omotopia tra g e l’identità
è data da G(z, t) = z(t + (1 − t)/|z|). Ancora più semplice è il caso di g ◦ f : S 1 → S 1 : essa è già
l’identità! 

Definizione 7.1.13. Due spazi topologici X, Y sono omotopicamente equivalenti se esiste una
funzione continua f : X → Y che ha un’inversa di omotopia.
Esempio 7.1.14. Due spazi omeomorfi sono omotopicamente equivalenti.
La relazione d’equivalenza di omotopia però è più debole dell’omeomorfismo.
Esempio 7.1.15. R2 meno un punto e S 1 sono omotopicamente equivalenti. (Ma non sono omeo-
morfi perché due punti sconnettono S 1 mentre tre punti non sconnettono R2 .)
Teorema 7.1.16 (La connessione è un invariante per omotopia). Se due spazi sono omotopicamente
equivalenti, allora hanno lo stesso numero di componenti connesse.
D IMOSTRAZIONE . Siano X, Y spazi topologici e siano f : X → Y e g : Y → X funzioni continue
una inversa omotopica dell’altra. Sia CX l’insieme delle componenti connesse di X e CY quello delle
componenti di Y . Per ogni C ∈ CX sia ϕ(C) la componente connessa che contiene f (C). Essa è
ben definita perché ogni C ∈ CX è connesso e quindi lo è anche f (C). Similmente, se C ∈ CY
definiamo ψ(C) come la componente connessa che contiene g(C). Mostriamo adesso che le funzioni
ϕ : CX → CY e ψ : CY → CX sono una inversa dell’altra.
Sia F l’omotopia tra g ◦f e l’identità di X. Sia C ∈ CX . Siccome C ×[0, 1] è connesso, F (C ×[0, 1]) è
contenuto in una sola componente connessa di X. Siccome F1 = IdX , allora F (C × [0, 1]) è contenuto
in C. Similmente F0 = g ◦ f e quindi F (C × [0, 1]) è contenuto in ψ(ϕ(C)). Quindi ψ(ϕ(C)) = C.
Ragionando con l’omotopia tra f ◦ g e l’indentità di Y si ottiene ϕ(ψ(C)) = C. 

Esempio 7.1.17. GL(2, R) ha due componenti connesse, ambe omotopicamente equivalenti a S 1 .


D IMOSTRAZIONE . Sia det : GL(2, R) → R∗ il determinante. Siccome R∗ ha due componenti
connesse e il determinante è suriettivo, GL(2, R) ha almeno due componenti connesse. Poniamo
GL+ = {A ∈ GL(2, R) : det(A) > 0} e dimostriamo che è omotopicamente equivalente a S 1 (per cui
risulterà automaticamente connesso per il Teorema 7.1.16). Simile discorso vale per l’insieme delle
matrici a determinante negativo. Definiamo:
(1) M1 l’insieme delle matrici in GL+ tali che la prima colonna abbia norma uno.
(2) M2 l’insieme delle matrici in M1 tali che le due colonne siano ortogonali tra loro.
(3) SO(2) l’insieme delle matrici in M2 le cui colonne formano una base ortonormale.
154 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Sappiamo già che SO(2) è omeomorfo a S 1 (Teorema 6.4.7). Dimostriamo che GL+ ∼ M1 ∼
M2 ∼ SO(2) usando il procedimento di Gram-Schmidt.
(1) GL+ ∼ M1 . Sia A ∈ GL+ e siano v1 e v2 i suoi vettori colonna. Poniamo w1 = v1 /||v1 ||
e definiamo f (A) la matrice in M1 che ha come colonne w1 e v2 . Sia ı : M1 → GL+ l’inclusione.
Chiaramente f ◦ ı = IdM1 e ı ◦ f = f . L’omotopia tra f e l’identità è data definendo Ft (A) come la
matrice che ha tv1 + (1 − t)w1 come prima colonna e v2 come seconda.
(2) M1 ∼ M2 . Sia ora A ∈ M1 e siano w1 , v2 i suoi vettori colonna. Poniamo u2 = hv2 , w1 iw1 ,
w2 = v2 − u2 e definiamo g(A) come la matrice in M2 le cui colonne sono w1 e w2 . Sia ı : M2 → M1
l’inclusione. Come sopra g ◦ ı = IdM2 e ı ◦ g = g. L’omotopia tra l’identità e g è data definendo
Gt (A) come la matrice che ha w1 come prima colonna e v2 − tu2 come seconda colonna. (Si noti che il
determinante di Gt (A) non dipende da t.)
(3) M2 ∼ SO(2). Sia infine A ∈ M2 e siano w1 , w2 i suoi vettori colonna. Poniamo u1 = w1 e
u2 = w2 /||w2 || e procediamo come nel caso (1). 
Esercizio 7.1.18. Dimostrare che GL(3, R) ha due componenti connesse, ognuna delle quali è
omotopicamente equivalente a RP3 .
Definizione 7.1.19. Le funzioni che sono omotope a una funzione costante si chiamano omotopi-
camente banali, gli spazi che sono omotopicamente equivalenti a un punto si chiamano contraibili.
Teorema 7.1.20. Il cono su un qualsiasi spazio topologico è contraibile.
D IMOSTRAZIONE . Se C = X ×[0, 1] con X ×{0} collassato a un punto, la funzione F : C ×[0, 1] →
C data da F ((x, t), s) = (x, st) è un’omotopia tra la costante sul vertice del cono (per s = 0 si ha
Fs (x, t) = (x, 0)) e l’identità (per s = 1 si ha F1 (x, t) = (x, t)). 
Corollario 7.1.21. La compattezza, locale e non, la locale connessione, le proprietà di separazione e
numerabilità non sono invarianti per omotopia.
D IMOSTRAZIONE . Il cono su uno spazio non (localmente) compatto non è (localmente) compatto.
Il cono di uno spazio che non è localmente connesso non è localmente connesso. Il cono su uno
spazio a base non numerabile non ha base numerabile. Il cono di uno spazio che non è localmente
numerabile non è localmente numerabile. Il cono di uno spazio non T2 non è T2 .
Ma tutti sono omotopicamente equivalenti a un punto che ha tutte queste proprietà. 
Esempio 7.1.22. Rn è contraibile. L’omotopia tra l’identità e la costante sull’origine è F (v, t) = tv.
Esempio 7.1.23. Per il Teorema 7.1.16 uno spazio non connesso non è contraibile.
Definizione 7.1.24. Sia X uno spazio topologico e A ⊆ X. Sia ı : A → X l’inclusione.
(1) A si dice retratto di X se esiste una funzione continua f : X → A che sia l’identità su A (cioè
tale che f ◦ ı = IdA ). Una tale funzione si chiama retrazione.
(2) A è un retratto di deformazione se esiste una retrazione da X su A che sia omotopa all’i-
dentità (cioè tale che ı ◦ f sia omotopa a IdX .)
(3) A è un retratto di deformazione forte se esiste una retrazione da X su A che sia omotopa
all’identità tramite un’omotopia che fissa i punti di A.
Ogni spazio si retrae su ogni suo punto: se x0 ∈ X la funzione costante f : X → x0 è continua. Se
A è un retratto di deformazione di X allora essi sono omotopicamente equivalenti. Quindi non tutti
i retratti sono di deformazione. Il pettine delle pulci fornisce un esempio di retratto di deformazione
che non sia forte:
Esempio 7.1.25. In R2 sia X = ({0} × [0, 1]) ∪ ([0, 1] × {0}) ∪ ({1/n : 0 < n ∈ N} × [0, 1]). Sia
A = {0} × [0, 1] il dente più a sinistra di tutti. Esso è un retratto di deformazione di X. Infatti la
mappa f : X → A data da f (x, y) = (0, y) è continua, fissa A ed è omotopa all’identità. L’omotopia
7.2. GRUPPO FONDAMENTALE 155

F IGURA 2. Il pettine delle pulci

è costruita prima schiacciando tutto sull’asse orizzontale, poi portando tutto a zero e poi rimettendo
gli elementi di A al loro posto. Esplicitamente,



 (x, (1 − 2t)y) t ∈ [0, 1/2]

Ft ((x, y)) = ((3 − 4t)x, 0) t ∈ [1/2, 3/4]


 (0, (4t − 3)y) t ∈ [3/4, 1]

Mostriamo ora che A non è retratto di deformazione forte. Sia F : X × [0, 1] → X una funzione
continua tale che F (x, 1) ∈ A e tale che F (a, t) = a per ogni a ∈ A e t ∈ [0, 1]. Sia a0 = (0, 1) e sia B
la palla di centro a0 e raggio 1/2. F −1 (B) è un aperto che contiene a0 × [0, 1] perché F fissa A. Tale
aperto contiene un aperto U × [0, 1] con U intorno di a0 in X. Inoltre, possiamo supporre che U sia
della forma ({1/n : n > 1/ε} ∪ {0}) × (1 − ε, 1]. La restrizione di F a U × [0, 1] è quindi una funzione
continua da U × [0, 1] in B. B non è connesso e la componente connessa di a0 è {0} × (1/2, 1] = A ∩ B.
Siccome F è continua e F (x, 1) ∈ A, allora F −1 (A) interseca tutte le componenti connesse di U ×[0, 1].
Quindi per connessione l’immagine di F |U ×[0,1] è contenuta in A. In particolare F0 non può essere
l’identità.

7.2. Gruppo fondamentale


Fissiamo le notazioni per i cammini:
• Un cammino in X è una funzione continua γ : [0, 1] → X.
• Un cammino si dice chiuso (o laccetto) se γ(0) = γ(1); in tal caso si dice che γ è basato in
γ(0).
• Riguardo ai cammini, con ∼ si intenderà la relazione di omotopia a estremi fissi, cioè relativa
a {0, 1}.
Definizione 7.2.1. Dato uno spazio X e a, b ∈ X, si definisce Ω(X, a, b) come l’insieme dei cam-
mini f : [0, 1] → X tali che f (0) = a, f (1) = b. L’insieme dei cammini chiusi basati in a si denota con
Ω(X, a).
Definizione 7.2.2. Due cammini α, β : [0, 1] → X si dicono componibili se α(1) = β(0). In tal caso
si definisce la composizione percorrendo prima α e poi β il tutto riparametrizzato con [0, 1]; l’inverso
di un cammino α si definisce percorrendolo in senso inverso:

 α(2t) t ∈ [0, 1/2]
αβ(t) = α−1 (t) = α(1 − t)
 β(2t − 1) t ∈ [1/2, 1]

Lemma 7.2.3. Se α è un cammino in uno spazio X, omotopo (a estremi fissi) a β, allora α−1 è omotopo a
−1
β . Inoltre, αα−1 è omotopicamente banale.
156 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

D IMOSTRAZIONE . Se F è un’omotopia tra α e β allora G(t, s) = F (1 − t, s) è un’omotopia tra α−1


e β . L’omotopia tra il cammino costante e αα−1 è data da
−1

 α(2ts) t ∈ [0, 1/2]
G(t, s) =
 α(s(2 − 2t)) t ∈ [1/2, 1]


Lemma 7.2.4. Se α ∼ α0 e β ∼ β 0 sono cammini in X tali che gli α sono componibili con i β, allora
αβ ∼ α0 β 0 .
D IMOSTRAZIONE . Siano F l’omotopia a estremi fissi tra α e α0 e G quella tra β e β 0 . La funzione

 F (2t, s) t ∈ [0, 1/2]
H(t, s) =
 G(2t − 1, s) t ∈ [1/2, 1]

è un’omotopia a estremi fissi tra αβ e α0 β 0 . 


Lemma 7.2.5. Sia α un cammino chiuso in X e sia x0 = α(0). Se β è il cammino costante in x0 , allora
αβ ∼ βα ∼ α.
D IMOSTRAZIONE . Un’omotopia tra αβ e α è data da

 α( 2 t) t ∈ [0, s+1 ]
s+1 2
F (t, s) =
s+1
 x
0 t∈[ , 1] 2

un’omotopia tra βα e α si costruisce in modo analogo. 


Esercizio 7.2.6. Dimostrare che se ξ : [0, 1] → [0, 1] è una riparametrizzazione che fissa 0 e 1, allora
ogni cammino α(t) è omotopo, a estremi fissi, a α(ξ(t)).
Esercizio 7.2.7. Dimostrare che l’operazione di composizione di cammini è associativa a meno di
omotopia. (Basta riparametrizzare le composizioni (αβ)γ e α(βγ) in modo opportuno.)
Definizione 7.2.8. Sia X uno spazio topologico e sia x0 ∈ X. Il gruppo fondamentale di X,
basato in x0 è il quoziente di Ω(X, x0 ) modulo la relazione d’equivalenza dell’omotopia a estremi
fissi. Il gruppo fondamentale si denota con
π1 (X, x0 ).
Il punto x0 si suole chiamare punto base.
Per i Lemmi 7.2.3, 7.2.4 e 7.2.5 (e l’Esercizio 7.2.7) l’operazione di composizione rende π1 (X, x0 )
un gruppo. L’identità è data dal cammino costante in x0 , che spesso si denota con 1 o con 0. In
generale il gruppo fondamentale non è commutativo.
Teorema 7.2.9. Sia X uno spazio topologico. Se x0 , x1 ∈ X stanno nella stessa componente connessa
per archi, allora i gruppi fondamentali π1 (X, x0 ) e π1 (X, x1 ) sono isomorfi. Più precisamente, ogni cammino
γ ∈ Ω(X, x0 , x1 ) definisce un isomorfismo naturale ϕγ : π1 (X, x0 ) → π1 (X, x1 ).
D IMOSTRAZIONE . Sia γ un cammino tra x0 e x1 . Per ogni α ∈ π1 (X, x0 ) sia ϕγ (α) = γ −1 αγ ∈
π1 (X, x1 ). La funzione ϕ è un morfismo di gruppi per i Lemmi 7.2.3, 7.2.4 e 7.2.5. Inoltre la funzione
β 7→ γβγ −1 , è l’inversa di f che quindi risulta un isomorfismo. 
Per questo motivo se uno spazio è connesso per archi si suole parlare di “gruppo fondamentale”,
anzichè di “gruppo fondamentale basato in x0 ”, intendendo il gruppo astratto isomorfo a π1 (X, x0 ).
A volte viene usata la notazione π1 (X). Si noti che se x0 = x1 e γ è un laccetto, allora ϕγ è il coniugio
per γ.
7.2. GRUPPO FONDAMENTALE 157

Esercizio 7.2.10. Dimostrare che se γ ∼ η allora ϕγ = ϕη .

Definizione 7.2.11. Uno spazio topologico si dice semplicemente connesso se è connesso per
archi e il suo gruppo fondamentale è banale.

Esempio 7.2.12. Un punto è semplicemente connesso.

Definizione 7.2.13. Siano X, Y spazi topologici e sia f : X → Y una funzione continua. Sia
x0 ∈ X e sia y0 = f (x0 ). Si definisce

f∗ : π1 (X, x0 ) → π1 (Y, y0 )
come f∗ (α) = f ◦ α.
Si noti che la definizione è ben posta perché se F è un’omotopia tra α e β allora f ◦F è un’omotopia
tra f ◦ α e f ◦ β. Inoltre, è immediato verificare che f∗ è un morfismo di gruppi, cioè che f∗ (αβ) =
f∗ (α)f∗ (β) e f∗ (α−1 ) = (f∗ (α))−1 .

Lemma 7.2.14. Se f : X → Y e g : Y → Z sono funzioni continue, allora (g ◦ f )∗ = g∗ ◦ f∗ .

D IMOSTRAZIONE . (g ◦ f )∗ (α) = g ◦ f ◦ α = g∗ (f∗ (α)). 

Teorema 7.2.15. Siano f, g : X → Y due funzioni continue tra spazi topologici. Supponiamo che esista
un’ompotopia F tra f e g. Sia x0 ∈ X e sia γ : [0, 1] → Y dato da γ(s) = F (x0 , s). Allora, se ϕγ è come nel
Teorema 7.2.9
g∗ = ϕγ ◦ f∗ .
In altre parole f e g inducono lo stesso morfismo tra i gruppi fondamentali, a meno di isomorfismi. (Si noti che
se l’omotopia è relativa a x0 allora f∗ = g∗ .)

D IMOSTRAZIONE . Per ogni α ∈ π1 (X, x0 ), la composizione F ◦ α è un’omotopia, a priori senza


estremi fissi, tra f∗ (α) e g∗ (α) (Figura 3). Si tratta quindi di sistemare i punti base. Il laccetto ϕγ (f∗ (α))

g(α)
Y
X
g(x0 )
x0
F (α(t), s) F (α, s)

α γ f (α)

f (x0 )

F IGURA 3. Visualizzazione del fatto che ϕγ ◦ f∗ = g∗

è dato da



 F (x0 , 1 − 3t) t ∈ [0, 1/3]

ϕγ (f∗ (α))(t) = F (α(3t − 1), 0) t ∈ [1/3, 2/3]


 F (x , 3t − 2)

t ∈ [2/3, 1]
0
158 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Per ottenere un’omotopia tra ϕγ (f∗ (α)) e g∗ (α), basta considerare





 F (x0 , 1 − 3t(1 − s)) t ∈ [0, 1/3]

G(t, s) = F (α(3t − 1), s) t ∈ [1/3, 2/3]


 F (x , 3t(1 − s) − 2 + 3s) t ∈ [2/3, 1]

0

che è un’omotopia tra ϕγ (f ∗ (α)) e un cammino omotopo a g∗ (α) . 

Corollario 7.2.16 (Il gruppo fondamentale è un invariante di omotopia). Se X e Y sono omotopica-


mente equivalenti allora hanno lo stesso gruppo fondamentale.

D IMOSTRAZIONE . Se f : X → Y ha g : Y → X come inversa di omotopia, le composizioni g ◦ f


e f ◦ g sono omotope all’identità. L’indentità induce un isomorfismo del gruppo fondamentale. Per il
Lemma 7.2.14 e il Teorema 7.2.15 sia f∗ che g∗ sono isomorfismi. 

In particolare spazi omeomorfi hanno lo stesso gruppo fondamentale (il viceversa non è vero
però). Come vedremo, ciò sarà uno strumento molto potente per distinguere spazi diversi tra loro.

Esempio 7.2.17. Gli spazi contraibili sono semplicemente connessi in quanto un punto lo è.

Esempio 7.2.18. Rn è semplicemente connesso.

Esempio 7.2.19. Il cono su uno spazio X è sempre semplicemente connesso.

Teorema 7.2.20. Sia X uno spazio topologico, A ⊆ X e a0 ∈ A. Sia ı : A ,→ X l’inclusione.


(1) Se A è un retratto di X, allora ı∗ : π1 (A, a0 ) → π1 (X, a0 ) è un morfismo iniettivo.
(2) Se inoltre A è retratto di deformazione, allora ı∗ è un isomorfismo.
In particolare, X ha lo stesso gruppo fondamentale di ogni suo retratto di deformazione.

D IMOSTRAZIONE . Sia f : X → A una retrazione di X su A. Per definizione f ◦ ı = IdA . Per il


Lemma 7.2.14 e il Teorema 7.2.15, f∗ ◦ ı∗ = (IdA )∗ = Idπ1 (A,a0 ) è un isomorfismo e quindi ı∗ è iniettiva
(e f∗ suriettiva). Se inoltre A è un retratto di deformazione, possiamo suppore che esista un’omotopia
tra ı ◦ f e l’identità di X. Sempre per il Teorema 7.2.15, ı∗ ◦ f∗ è un isomorfismo. Quindi ı∗ è anche
suriettiva (e f∗ iniettiva) ergo un isomorfismo. 

Teorema 7.2.21. Siano X, Y spazi topologici. Allora π1 (X × Y, (x0 , y0 )) = π1 (X, x0 ) × π1 (Y, y0 ).

D IMOSTRAZIONE . Denotiamo con fX e fY le proiezioni di X × Y su X e Y rispettivamente


(per non far confusione col simbolo π1 usato per i gruppi fondamentali). Siano x0 ∈ X, y0 ∈ Y e
p0 = (x0 , y0 ) ∈ X × Y i punti base dei gruppi fondamentali. Definiamo le mappe

× : π1 (X, x0 ) × π1 (Y, y0 ) → π1 (X × Y, p0 ) (α × β)(t) = (α(t), β(t))



H : π1 (X × Y, p0 ) → π1 (X, x0 ) × π1 (Y, y0 ) H(γ) = (fX )∗ (γ), (fY )∗ (γ) .
Chiaramente H(α × β) = (α, β). Quindi H ◦ × è l’identità di π1 (X, x0 ) × π1 (Y, y0 ). D’altronde
((× ◦ H)(γ))(t) = (fX )∗ (γ)(t), (fY )∗ (γ)(t) = γ(t). Quindi H e × sono una l’inversa dell’altra. 

Fin’ora abbiamo visto solo esempi di spazi con gruppo fondamentale banale. Possiamo intuire
quali possano essere alcuni esempi di spazi con gruppo fondamentale non banale (che dite di S 1 ?)
Ma per poter dimostrare che determinati gruppi fondamentali siano effettivamente non banali, la via
più naturale è quella di introdurre la controparte del gruppo fondamentale: la teoria dei rivestimenti.
7.3. RIVESTIMENTI 159

7.3. Rivestimenti
Definizione 7.3.1. Sia X uno spazio topologico. Un rivestimento di X è il dato di uno spazio
topologico Xb e una funzione continua π : X b → X tale che ogni x ∈ X abbia un intorno aperto U —
−1
detto aperto banalizzante — tale che π (U ) sia unione disgiunta di aperti non vuoti in X b — detti
placche di U — tali che la restrizione di π a ognuno di essi sia un omeomorfismo con U .
A volte può succedere che con la parola rivestimento ci si riferisca alla sola proiezione, a volte
al solo Xb (se la proiezione è sottintesa o non rilevante). Ci si può quindi imbattere in frasi del tipo
“sia f un rivestimento” oppure “sia X b un rivestimento di X”. In alcuni testi la proiezione si chiama
proiezione di rivestimento.
Esempio 7.3.2. Identificando S 1 con R/Z, la proiezione naturale R → S 1 è un rivestimento, che si
può visualizzare agevolmente pensando R storto come una molla infinita (Figura 4).

x+2

x+1

S 1 = R/Z [x]

F IGURA 4. Il rivestimento R → S 1

O SSERVAZIONE 7.3.3. La definizione di rivestimento è una di quelle che van lette con attenzione.
Essa impone che esista un ricoprimento fatto di aperti banalizzanti. Si noti però che, affinché U sia un
aperto banalizzante, non si richiede solo che π −1 (U ) sia un unione disgiunta di placche omeomorfe a
U , ma anche che la proiezione di rivestimento realizzi l’omeomorfismo.
Inoltre si noti che la richiesta è che “per ogni x ∈ X esista U intorno di x tale che. . . ”, e non che
“per ogni y ∈ X b esista un intorno V tale che la proiezione ristretta a V sia omeomorfismo con π(V )”;
né che “la restrizione a ogni componente V di π −1 (U ) sia un omeomorfismo tra V e π(V )”.
Esempio 7.3.4. Sia X = R e sia X b = {(x, y) ∈ R2 : xy = 1, x > 0} ∪ {y = 0}. La proiezione
π(x, y) = x non è un rivestimento. Infatti il punto 0 non ha un intorno con le proprietà richieste: Per
ogni intorno U dello zero, il pezzo di π −1 (U ) che giace sul ramo d’iperbole non contiene preimmagini
dello zero. In particolare π ristretta a π −1 (U ) ∩ {iperbole} non può essere suriettiva e quindi non può
essere un omeomorfismo con U .
Si noti tuttavia che:
• ogni punto di X b ha un intorno V tale che la restrizione di π a V sia un omeomorfismo tra V
e π(V );
• per ogni intervallo aperto U ⊆ R contenente lo zero, π −1 (U ) è fatto di due componenti
connesse e che la restrizione di π a ognuna di esse è un omeomorfismo con l’immagine.
• π −1 (−ε, ε) è fatto comunque di due componenti omeomorfe a (−ε, ε), ma la proiezione non
realizza l’omeomorfismo.
160 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

b = R × Z. La proiezione π(x, n) = x è un rivestimento.


Esempio 7.3.5. Sia X = R e sia X
b = R × R. La proiezione π(x, y) = x non è un rivestimento.
Esempio 7.3.6. Sia X = R e sia X
Esempio 7.3.7. Sia X la retta con due zeri (Esempio 2.2.10). La proiezione da R × {0, 1} su X non
è un rivestimento (i due zeri non hanno la proprietà richiesta).
Esempio 7.3.8. Sia X la retta con due zeri (Esempio 2.2.10). La proiezione di X su R che identifica
i due zeri non è un rivestimento (la preimmagine di un intorno dello 0 non è T2 quindi non può essere
omeomorfa a un sottoinsieme di R).
Esempio 7.3.9. Sia X = R e sia X b = {(x, y) ∈ R2 : xy = 1}. La proiezione π(x, y) = x non è un
rivestimento. Infatti il punto 0 non ha un intorno con le proprietà richieste.
Esempio 7.3.10. Sia X = R e sia X b = {(x, y) ∈ R2 : y = x2 }. La proiezione π(x, y) = x è un
rivestimento.
Esempio 7.3.11. Sia X = R e sia X b = {(x, y) ∈ R2 : x = y 2 }. La proiezione π(x, y) = x non è un
rivestimento. Infatti il punto 0 non ha un intorno con le proprietà richieste. In questo caso π −1 (−ε, ε) è
omeomorfo ad un intervallo aperto ma la proiezione π : π −1 (−ε, ε) → (−ε, ε) non è iniettiva. Quindi
non può essere un omeomorfismo.
Esempio 7.3.12. Sia C = {(x, y, z) ∈ R3 : z 2 = x2 + y 2 }. La proiezione C → R2 data da π(x, y, z) =
(x, y) non è un rivestimento. Infatti l’origine non ha un intorno con le proprietà richieste.
Esempio 7.3.13. Sia S 1 = {z ∈ C, |z| = 1}. La funzione f : S 1 → S 1 data da f (z) = z 2 è un
rivestimento di S 1 su sé stesso. In generale z 7→ z n è un rivestimento di S 1 su sé stesso.
Esempio 7.3.14. Sia D = {z ∈ C, |z| ≤ 1}. La funzione f : D → D data da f (z) = z 2 non è un
rivestimento. Infatti la restrizione di f a un qualsiasi intorno di zero non è mai iniettiva, dunque non
può essere un omeomorfismo. In generale f (z) = z n non è un rivestimento per n ≥ 2.
Esempio 7.3.15. Sia S 1 = {z ∈ C, |z| = 1}. La funzione f : R → S 1 data da f (x) = eix è un
rivestimento.
Esempio 7.3.16. La proiezione R2 → T 2 data dal quoziente per Z2 è un rivestimento.
Esempio 7.3.17. Sia X ⊆ C un insieme costituito da tre cerchi di raggio unitario e centrati in −2, 0, 2
e sia r(z) = −z la rotazione di 180 gradi. Ciò determina un’azione di Z/2Z su X. Sia Y il quoziente
di X per tale azione. Esso è omeomorfo all’unione di soli due cerchi attaccati per un punto e la pro-
iezione π : X → Y è un rivestimento. Quest’ultima può essere realizzata nella vita reale prendendo
due anelli di legno (i cerchi laterali) e legandoli con due spaghi di uguale lunghezza (che formeranno
il cerchio centrale). A questo punto si sovrappongono i due cerchi di legno e si arrotola due volte su
sè stesso il cerchio centrale, in pratica formando un cerchio con ogni spago e poi sovrapponendoli (in
questo modo il cerchio centrale dimezza la propria dimensione nell’arrotolamento, ma dal punto di
vista della topologia la lunghezza non conta).

Esempio 7.3.18. Sia X ⊆ C un insieme costituito da due cerchi di raggio unitario e centrati in
±1 e sia r(z) = −z la rotazione di 180 gradi. Ciò determina un’azione di Z/2Z su X. Sia X/ ∼ il
quoziente. Esso è omemorfo a S 1 e la proiezione π : X → X/ ∼ non è un rivestimento. Ciò si vede
bene guardando le componenti connesse di un intorno dell’origine privato dell’origine.
7.3. RIVESTIMENTI 161

Esempio 7.3.19. La proiezione S 2 → RP2 data dall’identificazione antipodale è un rivestimento.


Esempio 7.3.20. La proiezione D2 → RP2 data dall’identificazione antipodale al bordo non è un
rivestimento. Infatti se x ∈ ∂D2 e U è un intorno di [x] in RP2 , allora π −1 (U ) non è unione disgiunta
di copie di U . La restrizione della proiezione a ∂D2 è invece un rivestimento di π(∂D2 ) = RP1 ' S 1 .
Esempio 7.3.21. Sia X = R2 \ {(0, 0)} con la metrica dei raggi. La proiezione su R+ data dalle
coordinate polari (r, θ) 7→ r è un rivestimento.
Esempio 7.3.22. Sia X = R2 \ {(0, 0)} con la metrica Euclidea. La proiezione su R+ data dalle
coordinate polari (r, θ) 7→ r non è un rivestimento.
Teorema 7.3.23. Le proiezioni di rivestimento sono mappe aperte.

D IMOSTRAZIONE . Sia π : X b → X un rivestimento. Sia A un aperto di X b e sia a ∈ A. Sia U un


aperto banalizzante contenente π(a) e sia V la placca di U contenente a. V ∩ A è un aperto e, siccome
π|V : V → U è un omeomorfismo, essa è una mappa aperta. Quindi π(V ∩ A) è un aperto contenente
π(a) e contenuto in π(A). Ne segue che ogni punto di π(A) è interno e dunque π(A) è un aperto. 
Teorema 7.3.24 (G-rivestimenti). Sia X uno spazio topologico su cui agisce per omeomorfismi un gruppo
G. Se ogni x ∈ X ha un intorno aperto U tale che per ogni g 6= h ∈ G si ha g(U ) ∩ h(U ) = ∅ 1 allora la
proiezione naturale X → X/G è un rivestimento.
D IMOSTRAZIONE . Sia U = {Ui } un ricoprimento di X fatto di aperti tali che gUi ∩ hUi 6= ∅ →
g = h. Vediamo che per ogni i, l’aperto [Ui ] ∈ X/G è un aperto banalizzante. La sua preimmagine
non è altro che l’orbita di Ui e per ipotesi GUi = ∪g∈G gUi è costituita da aperti disgiunti. La proiezio-
ne, ristretta a ogni gUi , è iniettiva per ipotesi, tautologicamente suriettiva sull’immagine e continua.
Inoltre per il Teorema 6.5.28 essa è anche aperta, ergo un omeomorfismo. 
b → X e g : Yb → Y rivestimenti. Allora
Teorema 7.3.25. Siano f : X
f ×g :X
b × Yb → X × Y (f × g)(x, y) = (f (x), g(y))
è un rivestimento.
D IMOSTRAZIONE . Siano U, V aperti banalizzanti in X e Y rispettivamente e siano U b e Vb loro
0
placche. La restrizione di f × g è un omeomorfismo tra U b × Vb e U × V . Inoltre se U
b è un’altra placca
di U , allora U × V è disgiunto da U × V e similmente per le altre placche di V . Quindi (f ×g)−1 (U ×V )
b 0 b b b
è unione disgiunta di prodotti del tipo Ub × Vb , che risultano dunque essere le placche di U × V . 
Esempio 7.3.26. S 1 × R riveste il toro S 1 × S 1 . Infatti R riveste S 1 via t 7→ eit e S 1 riveste sé stesso,
per esempio attraverso z 7→ z n .
Uno spazio sufficientemente patologico da produrre controesempi interessanti è costituito dal-
l’orecchino hawaiano (Esempio 3.5.5). Per esempio, se gli spazi sono sufficientemente regolari, come
le varietà o i grafi, la composizione di rivestimenti è un rivestimento (si veda il Corollario 7.9.13). In
generale però ciò non è vero.

1per esempio se X è una varietà e G agisce in modo libero e propriamente discontinuo, vedasi il Teorema 6.6.17.
162 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Esempio 7.3.27. Con la notazione dell’Esempio 3.5.5, il cosiddetto orecchino hawaiano è un sot-
toinsieme di R2 formato da una famiglia di cerchi Cn sempre più piccoli, tutti tangenti a uno stesso
punto. Applicando la costruzione dell’Esempio 7.3.17, ma solo al cerchio Cn , si costruisce un rivesti-
bn → X che “srotola” il cerchio Cn e sdoppia gli altri. (In Figura 5 si è srotolato il secondo
mento fn : X
cerchio.)

fn
X
bn ∼

F IGURA 5. Un rivestimento dell’orechino hawaiano

Esempio 7.3.28. Sia X un orecchino hawaiano e sia X bn il rivestimento costruito nell’Esempio 7.3.27.
Sia Y = X × N un’unione disgiunta di copie di X. Sia Z lo spazio formato dall’unione disgiunta de-
bn . Per ogni x ∈ X
gli X bn sia π(x) = (fn (x), n). Ciò definisce una funzione π : Z → Y . Si verifica
agilmente che π è un rivestimento. La proiezione p : Y → X data da p(x, n) = x è chiaramente
un rivestimento. Ma la composizione p ◦ π non è un rivestimento in quando ogni intorno del punto
singolare contiene un intero cerchio Cn , che però risulta “srotolato” in Z.

7.4. Sollevamenti di cammini e omotopie


Definizione 7.4.1 (Convenzione per gli spazi puntati). Uno spazio puntato è il dato di uno spazio
topologico X e di un suo punto x0 . Si indica con (X, x0 ). Se (X, x0 ) e (Y, y0 ) sono spazi puntati, una
funzione f : (X, x0 ) → (Y, y0 ) è una funzione f : X → Y tale che f (x0 ) = y0 .

Se (X, x0 ) è uno spazio puntato, quando si dice che (X,


b xb0 ) è un rivestimento di (X0 , x0 ) si intende
che π(b
x0 ) = x0 . I rivestimenti hanno un’importante proprietà di sollevamento di cammini, omotopie
e mappe. Se π : Yb → Y è un rivestimento e f : X → Y una funzione, per sollevamento si intende
una funzione fb : X → Yb tale che f = π ◦ fb; altrimenti detto, tale che il seguente diagramma sia
commutativo:

Yb
fb
π

f
X Y

I sollevamenti di funzioni continue si intendono sempre continui, se non altrimenti specificato.

Lemma 7.4.2 (Dell’unicità del sollevamento). Sia π : X b → X un rivestimento, sia C uno spazio
connesso e sia f : C → X una funzione continua. Siano F, G : C → X
b due sollevamenti di f . Se esiste c ∈ C
tale che F (c) = G(c) allora F = G.
D IMOSTRAZIONE . Sia A = {x ∈ C : F (x) = G(x)} l’insieme ove F e G coincidono. Per ipotesi
A 6= ∅. Se dimostriamo che A e Ac sono entrambi aperti, la connessione di C conclude.
Sia x ∈ C e sia U un aperto banalizzante contenente il punto f (x) = π(F (x)) = π(G(x)). Sia
V la placca di U contenente F (x) e W quella contenente G(x). Siccome F e G sono continue, esiste
7.4. SOLLEVAMENTI DI CAMMINI E OMOTOPIE 163

un aperto B ⊆ C contenente x e tale che F (B) ⊆ V e G(B) ⊆ W . Siccome π : V → U è un


omeomorfismo, la condizione f (x) = π(F (x)) determina F su B e si ha
F (x) = π −1 (f (x)).
Se x ∈ A, alias F (x) = G(x), allora V = W e dunque G(x) = π −1 (f (x)) = F (x) per ogni x ∈ B.
Quindi A è aperto. Se invece x ∈ Ac , et ergo G(x) 6= F (x), allora W 6= V . Siccome placche diverse
son disgiunte, ciò implica che F (x) 6= G(x) per ogni x ∈ B. Quindi anche Ac è aperto. 

Corollario 7.4.3. Sia π : Xb → X un rivestimento, sia f : Y → X una funzione continua e sia


fb : Y → Xb un suo sollevamento. Sia F : Y × [0, 1] un’omotopia di f e siano Fb, G
b due sollevamenti di F tali
che F0 = f = G0 . Allora F = G.
b b b b b

D IMOSTRAZIONE . Per ogni y ∈ Y l’insieme {y} × [0, 1] è connesso e quindi il Lemma 7.4.2 si
applica. Siccome Fb0 (y) = G
b 0 (y) = fb(y), si ha Fb(y, t) = G(y,
b t) per ogni (y, t). 

Lemma 7.4.4 (Del sollevamento). Sia π : X b → X un rivestimento, sia f : Y → X una funzione


continua e sia f : Y → X un suo sollevamento. Allora ogni omotopia F : Y × [0, 1] → X di f ha un unico
b b
sollevamento Fb tale che Fb0 = fb.
D IMOSTRAZIONE . Per ogni y ∈ Y sia
Ty = {t ∈ [0, 1] : ∃A intorno aperto di y, tale che F |A×[0,t] ha un sollevamento che estendefb|A }.
Per prima cosa dimostriamo che Ty = [0, 1]. Per come è definito Ty , esso contiene lo zero e se t < s ∈
Ty , allora t ∈ Ty . In altre parole Ty è un sottosegmento di [0, 1] contenente lo zero. Sia t0 = sup Ty . Sia
U un aperto banalizzante contenente F (y, t0 ). Per continuità di F , esiste un aperto B di Y contenente
y e ε > 0 tale che F (B × (t0 − ε, t0 + ε)) ⊆ U . Essendo t0 = sup Ty , il punto t1 = t0 − ε/2 appartiene
a Ty . Quindi esiste A aperto contenente y e un sollevamento Fb1 di F |A×[0,t1 ] . Sia V la placca di U
contenente Fb1 (y, t1 ). Si noti che V contiene Fb1 (z, t1 ) per ogni z ∈ A ∩ B. Definiamo
Fb2 : (A ∩ B) × (t0 − ε, t0 + ε) → V ⊆ X
b come Fb2 (z, t) = π −1 (F (z, t)).
Per costruzione, Fb1 (z, t) = Fb2 (z, t) per ogni z ∈ A ∩ B e t ∈ (t0 − ε, t1 ]. È dunque ben definita la
funzione 
 Fb (z, t) per t < t
1 1
Fb3 : A ∩ B × [0, t0 + ε) → X b Fb3 (z, t) =
 Fb (z, t) per t − ε < t
2 0

e si verifica immediatamente che essa è continua e un sollevamento di F sull’insieme (A ∩ B) ×


[0, t0 + ε). Ne segue che t0 è un punto interno di Ty (rispetto alla topologia indotta da [0, 1]). Essendo
t0 = sup Ty , se ne deduce che Ty = [0, 1], come volevasi dimostrare.
Possiamo ora concludere la dimostrazione. Per ogni y ∈ Y sappiamo infatti che esiste un aperto
Ay contenente y e un sollevamento Fby : Ay × [0, 1] → X b della restrizione di F all’insieme Ay × [0, 1].
Se Ay1 ∩ Ay2 6= ∅ allora le restrizioni di Fby1 e Fby2 a (Ay1 ∩ Ay2 ) × [0, 1] sono due sollevamenti della
restrizione di F , e coincidono al tempo 0. Per il Corollario 7.4.3 essi coincidono per ogni t ∈ [0, 1]. Le
funzioni Fby definiscono quindi globalmente un sollevamento di F , che è unico per il Corollario 7.4.3.


Corollario 7.4.5. Sia π : (X,


b xb0 ) → (X, x0 ) un rivestimento. Allora π∗ : π1 (X,
b xb0 ) → π1 (X, x0 ) è
iniettiva.
D IMOSTRAZIONE . Sia γ ∈ π1 (X, b0 ) un laccetto tale che π(γ) sia omotopicamente banale in X.
b x
Per il Lemma 7.4.4 γ è omotopicamente banale anche in X.b 
164 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Nel caso particolare in cui lo spazio Y sia un punto (e quindi l’omotopia F è semplicemente un
cammino) otteniamo il seguente risultato noto come Teorema del sollevamento unico dei cammini.
Teorema 7.4.6 (Del sollevamento unico dei cammini). Sia π : X b → X un rivestimento e sia γ :
−1
[0, 1] → X un cammino. Allora per ogni x
b0 ∈ π (γ(0)) esiste un unico sollevamento γ
b : [0, 1] → X
b tale che
γ
b(0) = xb0 .
Ovviamente, se π : (Yb , yb0 ) → (Y, y0 ) è un rivestimento e f : (X, x0 ) → (Y, y0 ) è una funzione
continua che ha un sollevamento fb : (X, x0 ) → (Yb , yb0 ), allora f∗ (π1 (X, x0 )) < π∗ (π1 (Yb , yb0 )) perché
f = π ◦ fb. In realtà vale anche il viceversa.
Teorema 7.4.7. Sia π : (Yb , yb0 ) → (Y, y0 ) un rivestimento, sia (X, x0 ) uno spazio connesso e localmente
connesso per archi e sia f : (X, x0 ) → (Y, y0 ) una funzione continua. Allora f ha un sollevamento fb :
(X, x0 ) → (Yb , yb0 ) se e solo se f∗ (π1 (X, x0 )) < π∗ (π1 (Yb , yb0 )).
D IMOSTRAZIONE . Del solo se si è già detto. Costruiamo ora esplicitamente un sollevamento di f .
In x0 si pone fb(x0 ) = yb0 . Per ogni altro x ∈ X, sia γ un cammino da x0 a x in X. Per il Teorema 7.4.6 il
cammino f ◦ γ ha un unico sollevamento in Yb . Si definisce fb(x) come il punto finale del sollevamento
di f ◦ γ. Se η è un altro cammino da x0 a x, allora η −1 γ è un laccetto α ∈ π1 (X, x0 ). Per ipotesi
f∗ (α) ∈ π∗ (π1 (Yb , yb0 )). Quindi f ◦ α è omotopo a un laccetto β che si solleva a un laccetto βb in Yb , con
punto base yb0 . Per il Lemma 7.4.4 tale omotopia si solleva e quindi i sollevati di f ◦ γ e f ◦ η hanno lo
stesso punto finale. Ne segue che fb è ben definita e f = π ◦ fb.
Dimostriamo infine che fb è continua, mostrando che è continua in ogni punto. Sia x ∈ X e sia B
un intorno di fb(x) in Yb . Visto che le proiezioni di rivestimento son mappe aperte (Teorema 7.3.23),
π(B) è un aperto in Y . Per definizione di rivestimento, esiste un aperto banalizzante U con π(fb(x)) =
f (x) ∈ U ⊆ π(B). Sia V la placca di U contenente fb(x). Siccome f è continua, esiste un intorno aperto
A di x tale che f (A) ⊆ U , ed essendo X localmente connesso per archi, A può essere scelto connesso
per archi. Ne segue che, per come è definita fb, si ha che fb(A) = π −1 (f (A)) ∩ V . Quindi fb−1 (B)
contiene A e dunque è un intorno di x. 
Esempio 7.4.8 (Sinusoide topologica chiusa). Sia X lo spazio ottenuto dalla sinusoide topologica
attaccando la coda a zero. Più precisamente, in R2 si considera la chiusura del grafico di f : (0, 1] → R
data da f (x) = sin(1/x) e si identifica il punto (1, sin(1)) con (0, 0) (Figura 6). Sia ora R → S 1 il

F IGURA 6. La sinusoide topologica chiusa

rivestimento naturale dato dall’identificazione S 1 = R/Z. La funzione f : X → S 1 data da (x, y) →


[x] è continua ma non ha un sollevamento continuo su R. Eppure X è semplicemente connesso! Ciò
non contraddice il Teorema 7.4.7 in quanto X non è localmente connesso per archi.
Esercizio 7.4.9. Dimostrare che lo spazio X dell’Esempio 7.4.8 è semplicemente connesso secondo
la Definizione 7.2.11.
Esercizio 7.4.10. Ripercorrere la dimostrazione del Teorema 7.4.7 con in mano l’Esempio 7.4.8 per
vedere dove non funziona.
7.6. PRIME CONSEGUENZE IMPORTANTI, TEOREMA DEL PUNTO FISSO DI BROUWER E TEOREMA DI BORSUK-ULAM 165

7.5. Fibre, grado e monodromia


b → X un rivestimento e sia a ∈ X. La fibra di a è l’insieme X
Definizione 7.5.1. Sia π : X ba =
π −1 (a).
Per definizione di rivestimento, la fibra di un punto è un insieme discreto. L’insieme degli
automorfismi di una fibra, cioè delle permutazioni dei suoi elementi, si denota con Aut(X
ba ).

Teorema 7.5.2. Sia π : X b → X un rivestimento e siano a, b ∈ X. Ogni cammino γ ∈ Ω(X, a, b) induce


una corrispondenza biunivoca naturale ψγ : X ba → X bb . Inoltre, se γ è omotopo a γ 0 a estremi fissi, allora
ψγ = ψγ 0 . Infine, se η ∈ Ω(X, b, c) allora ψγη = ψη ◦ ψγ .
D IMOSTRAZIONE . Per ogni x ∈ X ba , ψγ (x) è definito come il punto finale dell’unico sollevamento
b di γ che inizia per x. Siccome γ
γ b è un sollevamento di γ, il suo punto finale sta in X bb . Per dimostrare
−1
che ψγ sia biunivoca, si noti che ψγ −1 = (ψγ ) . L’invarianza per omotopia discende direttamente dal
Lemma 7.4.4 del sollevamento. La regola di composizione è immediata. 
Dal Teorema 7.5.2 si deducono immediatamente un paio di corollari, che permettono di dare le
definizioni di grado e monodromia.
b → X è un rivestimento e X è connesso per archi, allora le fibre hanno tutte la
Corollario 7.5.3. Se X
stessa cardinalità.
D IMOSTRAZIONE . Per ipotesi di connessione, per ogni a, b ∈ X l’insieme Ω(X, a, b) è non vuoto,
per cui esiste una corrispondenza biunivoca tra la fibra di a e quella di b. 
Definizione 7.5.4. Se Xb → X è un rivestimento di uno spazio connesso per archi, allora si
definisce il suo grado come la cardinalità di una fibra.
È spesso in uso la notazione
d:1
b −→
X X
per indicare un rivestimento di grado d.
Corollario 7.5.5. Se Xb → X è un rivestimento, allora per ogni x ∈ X si ha una (anti)-rappresentazione2,
cioè un (anti)-morfismo di gruppi ψ , da π1 (X, x) nel gruppo degli automorfismi della fibra X
bx .

D IMOSTRAZIONE . È un istanza particolare del Teorema 7.5.2 con a = b = x. 


Definizione 7.5.6. La rappresentazione ψ : π1 (X, x) → Aut(X
bx ) si chiama rappresentazione di
monodromia o semplicemente monodromia del rivestimento.
O SSERVAZIONE 7.5.7. Si noti che il Teorema 7.5.2 ci dice che la monodromia sulle fibre ψ inverte
la moltiplicazione a destra con quella a sinistra. Quindi π1 (X) agisce a destra sulle fibre e si usa la
notazione xγ come equivalente di ψ(γ)(x). La notazione semplifica i calcoli in quanto ψ(γη)(x) =
ψ(η) ◦ ψ(γ)(x) = ψ(η)(ψ(γ)(x)) = ψ(η)(xγ) = xγη.

7.6. Prime conseguenze importanti, Teorema del punto fisso di Brouwer e Teorema di
Borsuk-Ulam
Con quello che abbiamo sin ora è possibile dimostrare teoremi abbastanza importanti. La mo-
nodromia per esempio fornisce finalmente uno strumento che permette di dimostrare che il gruppo
fondamentale di certi spazi è non banale.
Teorema 7.6.1. Se uno spazio topologico X ha un rivestimento connesso per archi e di grado > 1 allora
π1 (X) è non banale.
2Il prefisso “anti” indica che ψ inverte l’ordine della moltiplicazione.
166 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

D IMOSTRAZIONE . Sia π : X b → X un rivestimento connesso per archi e di grado > 1, e sia


a ∈ X. La fibra Xa contiene almeno due punti b
b a2 . Siccome X
a1 , b b è connesso per archi, allora esiste
b ∈ Ω(X,
γ b b a2 ). Il cammino γ = π ◦ γ
a1 , b b è un laccetto basato in a e ψγ (b a2 , in particolare ψγ 6= 1.
a1 ) = b
Quindi γ 6= 1 ∈ π1 (X, a). 
Esempio 7.6.2. L’orecchino hawaiano ha gruppo fondamentale non banale: La costruzione dell’E-
sempio 7.3.27 fornisce infatti un rivestimento connesso per archi e di grado due.
Esempio 7.6.3. Per ogni n, il gruppo fondamentale di RPn è non banale. Infatti RPn è S n modulo
l’azione di Z/2Z che agisce tramite l’antipodale. Per il Teorema 7.3.24 la proiezione S n → RPn è un
rivestimento. Esso ha grado 2 e S n è connesso per archi.
Teorema 7.6.4. π1 (S 1 ) 6= 1.
D IMOSTRAZIONE . La funzione z 7→ z 2 è un rivestimento connesso di grado due di S 1 su sé
stesso. Il Teorema 7.6.1 conclude. (Si noti che si poteva argomentare come nell’Esempio 7.6.3 notando
che S 1 = RP1 .) 
Corollario 7.6.5. R2 non è omeomorfo a Rn per ogni n 6= 2 (senza usare l’invarianza del dominio).
D IMOSTRAZIONE . Per n = 1 si ragiona per connessione togliendo un punto. Per n > 2 si ragiona
per semplice connessione rimuovendo un punto: R2 meno un punto si retrae su un cerchio e quindi
ha gruppo fondamentale non banale, Rn meno un punto invece è semplicemente connesso per ogni
n > 2. 
Esercizio 7.6.6. Dimostrare che Rn meno un punto è semplicemente connesso per ogni n > 2.
Corollario 7.6.7. Il gruppo fondamentale del nastro di Moebius è non banale. In particolare il nastro di
Moebius non è omeomorfo a R2 e quindi RP2 non è omeomorfo a CP1 (Si dia un’occhiata al Lemma 6.8.1).
D IMOSTRAZIONE . Il nastro di Moebius si retrae sull’S 1 centrale; per il Teorema 7.2.20 il suo
gruppo fondamentale è non banale. 
Corollario 7.6.8. Il gruppo fondamentale del toro è non banale.
D IMOSTRAZIONE . Il toro è omeomorfo a S 1 × S 1 il cui gruppo fondamentale è il prodotto di due
copie di π1 (S1 ) (Teorema 7.2.21) che è non banale (Teorema 7.6.4). 
Lemma 7.6.9. Non esiste una retrazione D2 → S 1 .
D IMOSTRAZIONE . Se esistesse, per il Teorema 7.2.20 avremmo π1 (S 1 ) < π1 (D2 ). Ma π1 (D2 ) è
banale (perché D2 è contraibile) e π1 (S 1 ) no (Teorema 7.6.4). 
Teorema 7.6.10 (del punto fisso di Brouwer bidimensionale). Ogni funzione continua f : D2 → D2
ha un punto fisso.
D IMOSTRAZIONE . Sia f : D2 → D2 continua. Se per ogni x ∈ D2 avessimo f (x) 6= x allora
potremmo definire g(x) come l’intersezione con S 1 della retta passante per x e f (x), dal lato di x. Ciò
determinerebbe una retrazione di D2 su S 1 , che non esiste per il Lemma 7.6.9. 
Teorema 7.6.11 (di Borsuk-Ulam unidimensionale, Esercizio 4.6.68). Sia f : S 1 → R una funzione
continua. Allora esistono x, y antipodali tali che f (x) = f (y).
D IMOSTRAZIONE . La funzione g(x) = f (x) − f (−x) è continua, dispari (cioè g(−x) = −g(x)) e la
tesi equivale a dire che esiste x ∈ S 1 tale che g(x) = 0. Siccome S 1 è connesso, g(S 1 ) è un connesso di
R, ergo un intervallo. Dato x ∈ S 1 , se g(x) 6= 0 allora g(x) e g(−x) sono due numeri di segno opposto
in g(S 1 ) che quindi, essendo un intervallo, contiene anche lo zero. 
Lemma 7.6.12. Ogni funzione continua f : S 1 → S 1 e dispari è omotopicamente non banale.
7.6. PRIME CONSEGUENZE IMPORTANTI, TEOREMA DEL PUNTO FISSO DI BROUWER E TEOREMA DI BORSUK-ULAM 167

D IMOSTRAZIONE . Usiamo il modello S 1 = {z ∈ C : |z| = 1}. Parametrizziamo l’S 1 di par-


tenza con [0, 2π] (ove 0 è identificato con 2π). In questo modo se θ ≤ π corrisponde a x, allora −x
corrisponde a θ + π. In arrivo consideriamo il rivestimento p : R → S 1 dato da p(x) = eix .
Supponiamo per assurdo che esista una funzione continua e dispari f : S 1 → S 1 che sia omotopi-
camente banale. A meno di rotazioni non è restrittivo supporre che f (0) = f (2π) = 1 = ei0 . Siccome
f è omotopicamente banale, essa si solleva a una funzione fe : S 1 → R. Siccome f è dispari si ha
fe(θ + π) = fe(θ) + k(θ)π per un certo k(θ) ∈ Z dispari. Siccome Z è discreto, per continuità e per
connessione di S 1 , k(θ) = k non dipende da θ.
Ne segue che fe(0) = fe(2π) = fe(π + π) = fe(π) + k = fe(π + 0) + k = fe(0) + k + k (stesso k). Da
f (0) = fe(0) + 2k si deduce k = 0 ma ciò è assurdo perché k è dispari, ergo non nullo.
e 
Esercizio 7.6.13. Dimostrare che π1 (S 1 ) è non banale usando solo il Lemma 7.6.12.
Definizione 7.6.14. Sia γ : [0, 1] → X un laccetto in uno spazio topologico. Identificando S 1
con [0, 1]/{0, 1}, γ induce una funzione continua, che continuiamo a chiamare γ, da S 1 a X (Teore-
ma 2.2.16). Diciamo che γ borda un disco se esiste una funzione continua F : D2 → X tale che la
restrizione di F a S 1 = ∂D2 sia γ.
Lemma 7.6.15. Sia X uno spazio topologico e siano α, β : [0, 1] → X due cammini con gli stessi estremi.
Allora α è omotopo a β relativamente a {0, 1} se e solo se il laccetto αβ −1 borda un disco .
D IMOSTRAZIONE . Se α è omotopo a β a estremi fissi allora esiste un’omotopia F : [0, 1] × [0, 1] →
X tra essi tale che F (0, t) = α(0) = β(0) e F (1, t) = α(1) = β(1) per ogni t. [0, 1] × [0, 1] è un quadrato
da cui, collassando a un punto il segmento {0} × [0, 1] e a un altro punto {1} × [0, 1], si ottiene un
disco. Per il Teorema 2.2.16 F induce una funzione continua dal disco a X, la cui restrizione al bordo
è il laccetto αβ −1 .

β
[0, 1] × [0, 1] F
X
α

D2

Viceversa, supponiamo che αβ −1 bordi un disco. Siano fα : [0, 1] → S 1 e fβ : [0, 1] → S 1 le identi-


ficazioni di [0, 1] col semicerchio superiore e inferiore rispettivamente, tali che fα (0) = fβ (0). Sia F :
D2 → X una funzione continua che estende αβ −1 e cioè tale che α(x) = F (fα (x)) e β(x) = F (fβ (x)).
Attraverso le combinazioni convesse si definisce ft (x) = tfβ (x) + (1 − t)fα (x). Essa è un’omotopia a
estremi fissi tra fα e fβ . La composizione di tale omotopia con F fornisce un’omotopia a estremi fissi
tra α e β. 
Il seguente corollario è una conseguenza immediata del Lemma 7.6.15
Corollario 7.6.16. Sia X uno spazio topologico e γ un laccetto in X. Allora γ borda un disco se e solo se
esso è omotopicamente banale a estremi fissi.
Esercizio 7.6.17. Dimostrare il Corollario 7.6.16.
Teorema 7.6.18 (di Borsuk-Ulam bidimensionale). Sia f : S 2 → R2 una funzione continua. Allora
esistono p, q antipodali tali che f (p) = f (q).
168 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

D IMOSTRAZIONE . Usiamo il classico modello per la sfera S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}.


Consideriamo g(p) = f (p) − f (−p). Essa è una funzione continua e dispari da S 2 in R2 . Se per ogni
p avessimo g(p) 6= 0 potremmo definire h(p) = g(p)/||g(p)||, che sarebbe una funzione h : S 2 → S 1
continua e dispari. Mostriamo che ciò è assurdo. Sia S 1 ⊂ S 2 il cerchio dato da S 2 ∩ {z = 0}. La
restrizione di h a S 1 fornisce una funzione continua h : S 1 → S 1 omotopicamente banale (perché S 1
borda un disco in S 2 ) e dispari. Che non esiste per il Lemma 7.6.12. 
Corollario 7.6.19. S 2 non è omeomorfo a un sottoinsieme di R2 .
D IMOSTRAZIONE . Sia X ⊆ R2 e sia f : S 2 → X una qualsiasi funzione continua. Per il Teorema
di Borsuk-Ulam f non è iniettiva (identifica almeno due punti antipodali). Quindi non può essere un
omeomorfismo. Ergo non esistono omeomorfismi tra S 2 e X. 

7.7. Rivestimenti di grafi


I rivestimenti di grafi sono oggetti abbastanza semplici da costruire. In questa sezione ci limi-
teremo a rivestimenti finiti di grafi finiti e connessi. Ogni grafo sarà dotato della metrica naturale
(Teorema 2.3.18) in cui ogni lato ha lunghezza unitaria.
Sia X un grafo. Per costruire tutti i rivestimenti possibili di grado d di X, si fa come segue. Si
numerano i vertici v1 , . . . , vn e si etichettano i lati con le lettere e1 , . . . , ek , specificando un’orienta-
zione per ogni lato. Per ogni vertice vi si considera la palla Bi = B(vi , ε) con 0 < ε < 1/2. Essa è
costituita dal vertice vi e da segmenti lunghi ε, ognuno dei quali porta l’etichetta e l’orientazione del
lato corrispondente. (Figura 7).

e2 e2
e1 e3 e3
B1d
e4 e4 B2d
e1
.. ..
. .
e2 e2
B12 e1 e3 e3
e4 e4 B22
e1
e2 e2
B11 e1 e3 e3
e4 e4 B21
e1

e2
v2
v1 e3
e1 e4

F IGURA 7. Come costruire un rivestimento di un grafo

A questo punto, se si vuole un rivestimento di grado d, per ogni Bi si considerano d copie di-
sgiunte Bi1 , . . . , Bid di Bi e si collega ogni segmento uscente di Bim ad un segmento entrante di un Bjh
che abbia la stessa etichetta. La possibilità Bjh = Bim è consentita. (Si noti che per ogni lato es ci sono
esattamente d segmenti entranti etichettati con es e d uscenti.) In termini combinatori, se es esce dal
vertice vi ed entra in vj (e potrebbe succedere vi = vj ), si deve dare una permutazione σ ∈ S(d) e
σ(m)
collegare il segmento etichettato es uscente da Bim con quello entrante in Bj .
Ovviamente la proiezione naturale ti,m Bim → ∪i Bi è un rivestimento per costruzione e, una
volta collegati tutti segmenti, il risultato è un rivestimento di X di grado d. Indipendentemente dalle
scelte fatte.
7.8. AUTOMORFISMI DI RIVESTIMENTO 169

Esercizio 7.7.1. Dimostrare che la procedura appena descritta produce un rivestimento di X di


grado d.
Esercizio 7.7.2. Trovare un criterio, basato sulle monodromie, che assicuri che il rivestimento
ottenuto sia connesso.
Esercizio 7.7.3. Dimostrare che tutti i rivestimenti di grado d di X si ottengono in questo modo.
Esempio 7.7.4. A meno di omeomorfismi, l’unico grafo connesso che sia un rivestimento di grado
due di è . (Provare tutte le combinazioni possibili per convincersene).
Esercizio 7.7.5. Trovare tutti i rivestimenti connessi e di grado due, del grafo della Figura 7.
Occhio che se anche due rivestimenti sono omeomorfi come spazi topologici, le proiezioni di
rivestimento potrebbero essere diverse. (Provare con gli esempi appena discussi).

7.8. Automorfismi di rivestimento


b → X e q : Yb → Y due rivestimenti. Un morfismo di rivestimenti
Definizione 7.8.1. Siano p : X
tra p e q è una coppia di funzioni continue f : X → Y e fb : X
b → Yb tali che q ◦ fb = f ◦ p. In altre
parole, un morfismo di rivestimenti è un diagramma commutativo:

fb
X
b Yb
p q

X Y
f

In altre parole ancora, un morfismo è il dato di f e di un sollevamento fb di f ◦ p.

Un morfismo si dice isomorfismo se entrambi f e fb sono omeomorfismi. Nel caso in cui X = Y


si richiede di solito che f sia l’identità.
Definizione 7.8.2. Siano p : X1 → X e q : X2 → X due rivestimenti dello stesso spazio X. Un
isomorfismo di rivestimento è un omeomorfismo F : X1 → X2 tale che q ◦ F = p. In altre parole, un
isomorfismo di rivestimenti è un diagramma commutativo ove F è un omeomorfismo:

F
X1 X2

p q

In altre parole ancora, un isomorfismo è un sollevamento di p che sia un omeomorfismo.


A meno di isomorfismi, i rivestimenti sono determinati dall’immagine del loro gruppo fonda-
mentale.
Teorema 7.8.3. Siano p : (X1 , x1 ) → (X, x0 ) e q : (X2 , x2 ) → (X, x0 ) due rivestimenti dello stesso
spazio puntato (X, x0 ). Supponiamo che X1 e X2 siano entrambi connessi e localmente connessi per archi.
Allora esiste un isomorfismo f : (X1 , x1 ) → (X2 , x2 ) se solo se p∗ (π1 (X1 , x1 )) = q∗ (π1 (X2 , x2 )).
170 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

D IMOSTRAZIONE . Se f esiste, allora da p = q ◦ f si deduce p∗ = q∗ ◦ f∗ ; siccome f è invertibile


p∗ ◦ f∗−1 = q∗ e l’uguaglianza richiesta segue. Viceversa se p∗ (π1 (X1 , x1 )) = q∗ (π1 (X2 , x2 )), allora
per il Teorema 7.4.7 p si solleva a una funzione f : (X1 , x1 ) → (X2 , x2 ); similmente q si solleva a una
g : (X2 , x2 ) → (X1 , x1 ). Ne segue che p = p ◦ g ◦ f . Dunque g ◦ f è un sollevamento di p che fissa x1 ,
per cui può solo essere l’identità (Lemma 7.4.2). Discorso analogo vale per f ◦ g, ed f risulta essere
l’isomorfismo cercato. 
In particolare, se due rivestimenti di uno stesso spazio sono semplicemente connessi e localmente
connessi per archi, allora sono isomorfi.
Definizione 7.8.4. Sia X uno spazio localmente connesso per archi. Il rivestimento universale di
X è, se esiste, un rivestimento semplicemente connesso di X. Esso è unico a meno di isomorfismi e si
indica generalmente con
π:X e → X.
Esempio 7.8.5. R è il rivestimento universale di S 1 .
Esempio 7.8.6. R2 è il rivestimento universale del toro T 2 .
Esercizio 7.8.7. Dimostrare che R2 è il rivestimento universale della bottiglia di Klein.
Esercizio 7.8.8. Determinare il rivestimento universale del nastro di Moebius.
Esercizio 7.8.9. Sia X la variante della sinusoide topologica chiusa (Esempio 7.4.8) descritta in
Figura 8. Si costruiscano, se esistono, due rivestimenti connessi di X, di grado due e non isomorfi.

F IGURA 8. L’omino coi baffi: una variante della sinusoide topologica chiusa

Esercizio 7.8.10. Esistono due rivestimenti dell’omino coi baffi (Figura 8) connessi, di grado due e
non omeomorfi come spazi topologici? (Si veda l’Esempio 7.7.4).
Esercizio 7.8.11. Si costruiscano due rivestimenti connessi dell’omino coi baffi (Figura 8) di grado
tre e non omeomorfi.
Esercizio 7.8.12. Esibire due rivestimenti semplicemente connessi dell’omino coi baffi (Figura 8)
non isomorfi né omeomorfi tra loro.
Definizione 7.8.13 (Il gruppo Aut(π)). Sia π : X b → X un rivestimento. Un automorfismo di
π è un isomorfismo di rivestimento da X in sé; in altre parole, un sollevamento di π che sia un
b
omeomorfismo. Il gruppo degli automorfismi di π si chiama spesso gruppo delle trasformazioni deck,
o deck tranformations3, e si indica con Aut(π) oppure con Aut(X
b → X) o con Aut(X)b (se la proiezione
di rivestimento è chiara dal contesto).
Esempio 7.8.14. Sia X = R e X b = R × Z. La proiezione π(x, n) = x è chiaramente un rivestimento.
La mappa f : X b →X b = R × N, la
b data da f (x, n) = (x, n + 1) è un automorfismo di π. Se invece X
mappa f (x, n) = (x, n + 1) è un sollevamento di π che non è un omeomorfismo (non è suriettiva).
3Non sembra esserci una buona alternativa italiana all’uso di questo vocabolo inglese “deck”.
7.8. AUTOMORFISMI DI RIVESTIMENTO 171

Per definizione, ogni automorfismo preserva le fibre e quindi Aut(π) agisce su ogni fibra attra-
verso permutazioni.
O SSERVAZIONE 7.8.15. Sia X b → X un rivestimento, sia x ∈ X e sia Xbx la sua fibra. In termini
di azioni a destra e a sinistra, il gruppo Aut(X)
b agisce a sinistra su Xx mentre l’azione di π1 (X, x)
attraverso la monodromia è a destra. Le due azioni sono compatibili nel senso che f (yγ) = (f y)γ per
ogni f ∈ Aut(X)b e per ogni γ ∈ π1 (X, x). Altrimenti detto f (ψ(γ)(y)) = ψ(γ)(f (y)). Ciò discende
immediatamente dalla definizione di monodromia e di automorfismo di rivestimento.
Teorema 7.8.16. Sia π : X b → X un rivestimento connesso. Allora l’azione di Aut(π) su ogni fibra è libe-
ra (cioè nessun automorfismo, eccetto l’identità, ha punti fissi). In particolare, ogni automorfismo è determinato
dall’immagine di un sol punto.
D IMOSTRAZIONE . Segue direttamente dal Lemma 7.4.2 (con C = X, b f = π, F ∈ Aut(π) e G =
Id). Diamo qui una dimostrazione alternativa, supponendo che X b sia connesso per archi, che a nostro
avviso getta maggior luce sulla natura dell’azione di Aut(π) sulle fibre.
Sia f ∈ Aut(π) non banale. Allora esiste y ∈ X b tali che f (y) 6= y. Sia ora x ∈ X
b un punto qualsiasi
e mostriamo che f (x) 6= x. Siccome X b è connesso esiste un cammino γ da y a f (y) e un cammino α da
y a x. Il cammino π(α−1 )π(γ)π(α), che è un cammino chiuso basato in π(x), si solleva a un cammino
che termina in un elemento x1 della fibra di x. Per il Teorema 7.5.2 applicato ad α ∈ Ω(X, y, x), x1 6= x.
Per definizione di automorfismo di rivestimento, il sollevamento di π(α−1 )π(γ)π(α) che parte da x
non è altro che α−1 γf (α) e quindi f (x) = x1 6= x.

f (y) x1
f (α)
π π(α)
γ π(x)
π(y)
y π(γ)
x
α


Lemma 7.8.17. Sia π : (X, b xb0 ) → (X, x0 ) un rivestimento connesso e localmente connesso per archi.
Sia γ ∈ π1 (X, x0 ) e sia x
b1 il punto finale del sollevamento di γ che parte da x b0 . Allora esiste (ed è unico)
f ∈ Aut(π) tale che f (b
x0 ) = xb1 se e solo se γ appartiene al normalizzatore di π∗ (π1 (X,
b xb0 )) in π1 (X, x0 ).
D IMOSTRAZIONE . Per il Teorema 7.8.3 esiste f ∈ Aut(π) tale che f (b b1 se e solo se i due
x0 ) = x
gruppi π∗ (π1 (X, x
b b0 )) e π∗ (π1 (X, x
b b1 )) coincidono.
Per il Teorema 7.2.9 il coniugio per γ induce un isomorfismo tra π∗ (π1 (X, b0 )) e π∗ (π1 (X,
b x b xb1 )).
Quindi π∗ (π1 (X,
b xb0 )) = π∗ (π1 (X,
b xb1 )) se e solo se γ appartiene al normalizzatore di π∗ (π1 (X,
b xb0 )).
L’unicità di f discende dal Teorema 7.8.16. 
Definizione 7.8.18. Un rivestimento π : X b → X si dice normale o regolare se il gruppo Aut(π)
agisce transitivamente sulle fibre, cioè se per ogni x ∈ X e per ogni y, z ∈ Xx esiste f ∈ Aut(π) tale
che f (y) = z.
Esempio 7.8.19. Il rivestimento S 2 → RP2 è normale. L’antipodale è infatti un automorfismo di
rivestimento che permuta gli elementi delle fibre.
Teorema 7.8.20. Sia π : (X, b xb0 ) → (X, x0 ) un rivestimento connesso e localmente connesso per archi.
Allora esso è normale se e solo se π∗ (π1 (X,
b xb0 )) è un sottogruppo normale di π1 (X, x0 ).
b ∈ π −1 (x0 ). Siccome X
D IMOSTRAZIONE . Sia x b è connesso, esiste un cammino γ da x
b0 a xb. Il
cammino π(γ) determina un elemento di π1 (X, x0 ) e per sollevamento ogni elemento si ottiene in
172 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

questo modo. Per il Lemma 7.8.17 esiste f ∈ Aut(π) tale che f (b x0 ) = x b se e solo se π(γ) è nel
normalizzatore di π∗ (π1 (X, x
b b0 )). Quindi Aut(π) agisce transitivamente sulla fibra di x0 se e solo se
il normalizzatore di π∗ (π1 (X,
b x b0 )) è tutto π1 (X, x0 ), cioè se π∗ (π1 (X,
b xb0 )) è normale in π1 (X, x0 ). (Si
noti che, per il Teorema 7.2.9, se π∗ (π1 (X,
b xb0 )) è un sottogruppo normale di π1 (X, x0 ), ciò rimane vero
anche se si cambia punto base). 
Esempio 7.8.21. Se X è connesso e localmente connesso per archi e π1 (X) è abeliano allora ogni
rivestimento è normale perché ogni sottogruppo di un gruppo abeliano è normale.
Esempio 7.8.22. Il rivestimento universale è normale perché il sottogruppo banale è normale.

Per il Lemma 7.8.17 se X b è connesso e localmente connesso per archi, e se (X,


b xb0 ) → (X, x0 ) è nor-
male, allora la (anti)-rappresentazione di monodromia della fibra di x0 induce una rappresentazione
suriettiva, talvolta detta monodromia deck4 o semplicemente monodromia (se non v’è possibilità di
confusione con la monodromia vera e propria)
ρ : π1 (X, x0 ) → Aut(X).
b

Per evitare equivoci si usa spesso la dicitura “π1 (X) agisce su X


b via trasformazioni deck”, intendendo
che l’azione è data dalla rappresentazione di monodromia deck.
O SSERVAZIONE 7.8.23. Anche se si tendono ad omettere i punti base, essendo definita attraverso
il Lemma 7.8.17, la monodromia deck ρ : π1 (X, x0 ) → Aut(X) b dipende dalla scelta di un punto base
b0 . Quando ci sarà bisogno di specificare useremo la notazione ρxb0 .
x

O SSERVAZIONE 7.8.24. La rappresentazione di monodromia deck ρ : π1 (X, x0 ) → Aut(X) b è una


rappresentazione vera e propria, cioè non inverte la moltiplicazione destra con la sinistra, come invece
fa la (anti)-rappresentazione di monodromia sulle fibre ψ : π1 (X, x0 ) → Aut(X b0 ). In particolare, se il
gruppo fondamentale non è abeliano, l’elemento ψ(γ) ∈ Aut(X b0 ) non coincide con la restrizione di
ρ(γ) ∈ Aut(X) sulla fibra di x0 . (Coincidono solo su x
b b0 .)
b0 ∈ X
Siano infatti γ e η sono due laccetti in x0 e sia x bx il punto base scelto per definire ρ. Sia γ
0 b il
sollevamento di γ che parte da x0 , ηb quello di η e sia γbη il sollevamento di γ che parte da ηb(1).

γ
bη = ρ(η)(b
γ)
x
b1 = ηb(1) = ρ(η)(b
x0 ) = ψ(η)(b
x0 ) γ
bη (1) = ρ(ηγ)(b
x0 ) = ψ(ηγ)(b
x0 ) = ψ(γ)ψ(η)(b
x0 )

ηb

x
b0 γ
b(1) = ρ(γ)(b
x0 ) = ψ(γ)(b
x0 )
γ
b

Si ha
γ
b(1) = ρ(γ)(b
x0 ) = ψ(γ)(b
x0 )
ηb(1) = ρ(η)(b
x0 ) = ψ(η)(b
x0 )
per cui γ γ) e
bη = ρ(η)(b
ρ(ηγ)(b
x0 ) = γ
bη (1) = ρ(η)(ρ(γ)(b
x0 ))
ψ(ηγ)(b
x0 ) = γ
bη (1) = ψ(γ)(ψ(η)(b
x0 )).

4Si è scelto questo nome, ma non c’è una notazione standard per l’azione del gruppo fondamentale via automorfismi
deck.
7.8. AUTOMORFISMI DI RIVESTIMENTO 173

In particolare detto x
b1 = ηb(1),
ψ(γ)(b
x1 ) = γ x0 ) = ρ(η)ρ(γ)ρ(η)−1 ρ(η)(b
bη (1) = ρ(η)ρ(γ)(b x0 ) = ρ(η)ρ(γ)ρ(η)−1 (b
x1 )
e in generale ρ(η)ρ(γ)ρ(η)−1 (b
x1 ) 6= ρ(γ)(b
x1 ).
O SSERVAZIONE 7.8.25. Con le notazioni di qui sopra, se si cambia punto base scegliendo x b1 al
posto di x
b0 , avremmo ρxb1 (γ) = γ bη (1) e l’ultimo calcolo fatto ci dice che la monodromia ρxb1 si ot-
tiene da ρxb0 coniugando per ρxb0 (η). In particolare, la classe di coniugio della rappresentazione di
monodromia deck è ben definita e non dipende dalle scelte dei punti base.
In generale, se π : Xb → X non è normale, la monodromia deck è definita solo sul normalizzatore
di π∗ (π1 (X)) in π1 (X). Essa è sempre suriettiva se X
b b connesso.
In termini di successioni esatte, se X è connesso e localmente connesso per archi, abbiamo la
b
seguente successione esatta
ρ
0 → K → N → Aut(X) b →0
ove K = ker(ρ) è il nucleo della rappresentazione di monodromia e N è il normalizzatore di π∗ (π1 (X))
b
in π1 (X). Se inoltre X → X è normale, si ha
b
ρ
0 → K → π1 (X) → Aut(X)
b → 0.

Si noti che il nucleo della monodromia è formato esattamente dai laccetti che si sollevano in X,
b quindi
da π1 (X). Dunque tale successione esatta si può leggere come
b
ρ
(3) 0 → π1 (X)
b → π1 (X) → Aut(X)
b → 0.
Il tutto può essere riassunto come segue.
Teorema 7.8.26. Sia π : (X, b x b0 ) → (X, x0 ) un rivestimento connesso e localmente connesso per archi.
Identificando π1 (X, x
b b0 ) con π∗ (π1 (X,
b x b0 )), sia N (π1 (X,
b xb0 )) il suo normalizzatore in π1 (X, x0 ). Allora
N (π1 (X,
b xb0 ))
Aut(π) = .
π1 (X, x
b b0 )
In particolare, se π è normale allora
π1 (X, x0 )
Aut(π) = .
π1 (X,
b xb0 )
e → X è il rivestimento universale, allora
Se π : X
Aut(X e → X) = π1 (X, x0 );

e se X
b è normale, indicando con K = π1 (X) b → X, si ha
b il nucleo della rappresentazione di monodromia di X

Aut(X)
e Aut(X)
e
Aut(X)
b = = .
π1 (X)
b K

D IMOSTRAZIONE . Per il Lemma 7.8.17, ad ogni γ ∈ N (π1 (X, b0 )) possiamo associare un unico
b x
elemento ϕ(γ) di Aut(π). La funzione ϕ : N (π1 (X, x
b b0 )) → Aut(π) è un morfismo di gruppi per il
Teorema 7.5.2. Il nucleo di ϕ è formato precisamente da tutti i laccetti basati in x0 che si sollevano a
laccetti basati in x
b0 , cioè da π∗ (π1 (X,
b x0 )). 
Corollario 7.8.27. π1 (S 1 ) = Z.
D IMOSTRAZIONE . Il rivestimento universale di S 1 è R e la proiezione è data da π(r) = e2πir .
Si verifica facilmente che per ogni f ∈ Aut(π) si ha f (x) = x + f (0). Quindi f è univocamente
determinato da f (0) ∈ π −1 (1) = Z e Aut(π) = Z. Per il Teorema 7.8.26 si ha π1 (S 1 ) = Z. 
174 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Teorema 7.8.28. Sia π : X b → X un rivestimento normale connesso. Allora X è omeomorfo a X/


b Aut(π).
In particolare, se X = X è il rivestimento universale, allora
b e

X = X/π
e 1 (X).
Ove π1 (X) agisce tramite l’identificazione con Aut(π).
D IMOSTRAZIONE . Siccome gli automorfismi preservano le fibre, la proiezione di rivestimento
è costante sulle classe di equivalenza e quindi induce una mappa quoziente f : X/ b Aut(π) → X
che è continua (Teorema 2.2.16). Se X è normale allora essa è biunivoca perché l’azione di Aut(π) è
b
transitiva sulle fibre. Inoltre f è aperta per i Teoremi 6.5.28 e 7.3.23 e quindi è un omeomorfismo. 

7.9. Esistenza del rivestimento universale e altre questioni


Definizione 7.9.1. Uno spazio topologico X si dice semi-localmente semplicemente connesso
se ogni punto x ∈ X ha un intorno U tale che l’inclusione π1 (U, x) → π1 (X, x) sia banale. In altre
parole se ogni laccetto in U è omotopicamente banale in X.
Esempio 7.9.2. L’orecchino Hawaiano NON è semi-localmente semplicemente connesso.
Esempio 7.9.3. Se X è semplicemente connesso, per esempio Rn , allora è semi-localmente sempli-
cemente connesso. In particolare, il cono su ogni spazio è semi-localmente semplicemente connesso.
Esempio 7.9.4. Se X è localmente semplicemente connesso, cioè se ogni punto ha un (sistema fon-
damentale di) intorno(i) semplicemente connesso(i) allora è anche semi-localmente semplicemente
connesso. In particolare tutte le varietà topologiche sono semi-localmente semplicemente connesse.
Esempio 7.9.5. Se X è uno spazio tale che ogni punto ha un intorno omeomorfo a un cono su
qualche spazio, allora è semi-localmente semplicemente connesso. Per esempio, i grafi lo sono.
Esempio 7.9.6. Se X è semi-localmente semplicemente connesso e X b → X è un rivestimento,
allora anche X
b è semi-localmente semplicemente connesso (segue dalla definizione di rivestimento e
dal Corollario 7.4.5).
Teorema 7.9.7. Sia X uno spazio connesso, localmente connesso per archi e semi-localmente semplice-
mente connesso. Allora per ogni sottogruppo H < π1 (X, x0 ) esiste un rivestimento π : (X, b0 ) → (X, x0 )
b x
tale che π∗ (π1 (X,
b xb0 )) = H. In particolare X ha il rivestimento universale (se H è il sottogruppo banale).
D IMOSTRAZIONE . La dimostrazione di questo teorema si fa costruendo esplicitamente X. b Sia Ω
l’insieme dei cammini γ : [0, 1] → X tali che γ(0) = x0 . Su Ω si mette la relazione d’equivalenza
α ∼ β se α(1) = β(1) e la classe di omotopia (a estremi fissi) di αβ −1 sta in H. Poniamo X b = Ω/ ∼ e
definiamo x b0 come la classe del cammino costante in x0 (si noti che se γ ∈ H allora [γ] = x b0 ). Per il
momento X b è solo un insieme, dobbiamo definirci una topologia e una proiezione di rivestimento. Si
pone π([α]) = α(1). Tale funzione è ben posta perché se due cammini sono equivalenti allora hanno
lo stesso punto finale.
Sia x ∈ X. Siccome X è connesso e localmente connesso per archi, allora esiste un cammino γ da
x0 a x. Sia U un intorno aperto di x, connesso e tale che π1 (U, x) sia banale in π1 (X, x). Sia V l’insieme
dei cammini in U che partono da x. Per ogni [γ] ∈ π −1 (x) sia
V[γ] = {[γη] : η ∈ V }.

η U
x
γ
x0
7.9. ESISTENZA DEL RIVESTIMENTO UNIVERSALE E ALTRE QUESTIONI 175

Su Xb mettiamo la topologia che ha come base gli insiemi V[γ] , al variare di γ ∈ X b e U con le proprietà
di cui sopra. (Tale topologia è ben definita per il Teorema 1.2.4).
Siccome π1 (U, x) è banale in π1 (X, x) i cammini γη e γη 0 inducono lo stesso elemento di V[γ] se e
solo se η e η 0 hanno lo stesso punto finale. Quindi la restrizione di π a V[γ] è biunivoca da V[γ] a U e
per come abbiamo definito la topologia di X, b essa è un omeomorfismo. In particolare π è continua in
ogni punto e quindi è continua. Vediamo adesso che π è una proiezione di rivestimento. Chiaramente
V[γ] ⊆ π −1 (U ). Siccome X è connesso e localmente connesso per archi, allora se π([α]) ∈ U allora α
è omotopa a estremi fissi a un cammino del tipo γη con γ ∈ Ω(X, x0 , x) e η ∈ Ω(U, x, α(1)). Quindi
π −1 (U ) = ∪[γ] V[γ] . Vediamo adesso che se γ1 e γ2 non sono equivalenti, allora V[γ1 ] ∩ V[γ1 ] = ∅. In
questo modo avremo dimostrato che π −1 (U ) è unione disgiunta di aperti omeomorfi a U via π.
Sia [β] ∈ V[γ1 ] ∩ V[γ2 ] . Siccome π1 (U, x) è banale in X possiamo supporre che [β] = [γ1 η] = [γ2 η]
con η ∈ Ω(U, x, β(1)). Ma da [γ1 η] = [γ2 η] si deduce [γ1 ] = [γ2 ].
Per concludere, dobbiamo dimostrare che π∗ (π1 (X, b x b0 )) = H. Sia γ : [0, 1] → X un laccetto
basato in x0 . Il suo sollevamento in X, che parte da x
b b0 , è dato da γ
b(t) = [γ|[0,t] ] (ove γ|[0,t] si considera
riparametrizzato con [0, 1]). Per come si è definito X, b γ si solleva a un laccetto in X b (cioè γ
b(1) = xb0 )
se e solo se γ ∈ H. Per il Teorema 7.4.7 π∗ (π1 (X, x b b0 )) = H. 
O SSERVAZIONE 7.9.8. Si noti la somiglianza tra le definizioni di gruppo fondamentale e quella
di rivestimento universale: il gruppo fondamentale è formato da classi di omotopia a estremi fissi
di laccetti; il rivestimento universale è formato da classi di omotopia a estremi fissi di cammini non
necessariamente chiusi.
O SSERVAZIONE 7.9.9. Si noti che l’azione di monodromia a destra sulla fibra di [x] è data sem-
plicemente per concatenazione (a destra) di cammini in π1 (X, x). Cioè se π([η]) = x e γ ∈ π1 (X, x)
allora [η]γ = [ηγ]. L’azione a sinistra via trasformazioni deck è data per concatenazione a sinistra per
cammini in π1 (X, x0 ). Ossia se per ogni [α] ∈ X b si pone γ[α] = [γα]. Si noti che essa è ben definita
solo se γ è nel normalizzatore di H (come ha da essere) in quanto se [β] = [α], cioè αβ −1 in H, allora
affinché [γβ] = [γα] si deve avere γαβ −1 γ −1 in H.
O SSERVAZIONE 7.9.10. Il Teorema 7.8.3 ci dice che due rivestimenti di X sono isomorfi se e solo
se corrispondono allo stesso sottogruppo di π1 (X). Il Teorema 7.9.7 ci dice che ogni sottogruppo
corrisponde a un rivestimento. Per spazi connessi, localmente connessi per archi e semi-localmente
semplicemente connessi, vi è quindi una corrispondenza biunivoca tra sottogruppi di π1 (X, x0 ) e
classi di isomorfismo di rivestimenti puntati.

Teorema 7.9.11. Sia π : X b → X un rivestimento localmente connesso per archi che spezzi lungo uno
b → Y e p : Y → X tali che π = p ◦ q.
spazio intermedio Y , cioè tale che esistano funzioni continue q : X
Allora p è un rivestimento se e solo se q lo è.

X
b
q

π Y
p
X

D IMOSTRAZIONE . Supponiamo p rivestimento (in questo caso q è un sollevamento di π). Sia


x ∈ X e sia U un intorno aperto e connesso di x che sia banalizzante sia per π che per p. Abbiamo
p−1 (U ) = tVi e p : Vi → U è un omeomorfismo
π −1 (U ) = tUj e π : Uj → U è un omeomorfismo.
176 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Siccome p ◦ q = π, si ha tj Uj = π −1 (U ) = q −1 (p−1 (U )) = ∪i q −1 (Vi ). q : Uj → Y è un sollevamento


di π|Uj . D’altronde, anche p−1 ◦ π : Uj → Vi ⊆ Y è un sollevamento di π|Uj . Siccome U è connesso,
per il Lemma 7.4.2 dell’unicità del sollevamento, se Vi ∩ q(Uj ) 6= ∅ allora Vi = q(Uj ). Ne segue che
q −1 (Vi ) è unione disgiunta di alcuni degli Uj , la restrizione di q ad ognuno dei quali è p−1 ◦ π, dunque
un omeomorfismo.
Viceversa, supponiamo q rivestimento. In particolare q è una mappa aperta (Teorema 7.3.23) e
suriettiva (per definizione di rivestimento). Sia x ∈ X e sia U aperto connesso banalizzante per π.
Come prima si ha
π −1 (U ) = tUi e π : Ui → U è un omeomorfismo.
Poniamo Vi = q(Ui ). Siccome Ui è aperto e q è una mappa aperta, allora Vi è aperto. Inoltre, q(tUi ) =
p−1 (U ) perché q è suriettiva e π = p ◦ q. Siccome π|Ui = p ◦ q|Ui è un omeomorfismo, allora q|Ui
è un omeomorfismo tra Ui e Vi e quindi p|Vi = π|Ui ◦ (q|Ui )−1 è un omeomorfismo tra Vi e U . Se
dimostriamo che Vi ∩ Vj 6= ∅ solo se Vi = Vj , abbiamo che p è un rivestimento.
Siano f = (p|Vi )−1 = q ◦ (π|Ui )−1 : U → Vi e g = (p|Vj )−1 = q ◦ (π|Uj )−1 : U → Vj . Se z ∈ Vi ∩ Vj , si
ha z = f (x1 ) e z = g(x2 ) per certi x1 , x2 . Siccome p ◦ f = p ◦ g = idU , si ha x1 = x2 e f (x1 ) = g(x1 ). In
particolare Vi ∩ Vj è l’immagine di A = {x ∈ U, f (x) = g(x)}. Mostriamo che se A 6= ∅ allora A = U .

γi Vi
γ 0 ηi
Ui q

γj ηj
Vj
Uj p

γ
x0 x
U

F IGURA 9. A priori ηi e ηj potrebbero essere diversi; a posteriori coincidono.

Come in Figura 9, sia x0 ∈ A, sia x ∈ U e sia γ : [0, 1] → U un cammino da x0 a x. Siano γi e γj i


sollevamenti di γ in Ui e Uj rispettivamente e siano ηi , ηj le loro q-proiezioni in Vi e Vj rispettivamente.
Per come son definite f, g, si ha ηi = f ◦ γ e ηj = g ◦ γ. In particolare ηi (1) = f (x) e ηj (1) = g(x). Sia
α il cammino ηi−1 ηj ; esso è ben definito perché f (x0 ) = g(x0 ). Sia αi il suo sollevamento che parte da
γi (1).
Chiaramente γi è un q-sollevamento di ηi . Sia γ 0 il q-sollevamento di ηj in Ui . Per ogni t si ha
p(q(γ 0 (t))) = p(ηj (t)) = p(q(γj (t))) = π(γj (t)) = γ(t). Quindi γ 0 è un sollevamento di γ in Ui , in
particolare γ 0 = γi e αi = γi−1 γi . Ne segue che α = ηi−1 ηi . In particolare ηi = ηj e f (x) = g(x). 
Corollario 7.9.12. Sia Y → X un rivestimento tra spazi connessi, localmente connessi per archi e semi-
localmente semplicemente connessi. Allora X
e = Ye .

D IMOSTRAZIONE . Per il Teorema 7.9.7 il rivestimento universale π : X e → X esiste. Per il Teo-


rema 7.4.7 π si solleva a Y e per il Teorema 7.9.11 tale sollevamento è un rivestimento. Siccome Xe è
semplicemente connesso allora esso è il rivestimento universale di Y . 
Corollario 7.9.13. Siano p : X2 → X1 e q : X1 → X rivestimenti. Se X è connesso, localmente connesso
per archi e semi-localmente semplicemente connesso, allora q ◦ p : X2 → X è un rivestimento.
7.10. G-SPAZI 177

D IMOSTRAZIONE . Sia π : Xe → X il rivestimento universale. Esso si solleva a f : X e → X1 , che si


solleva a g : X → X2 , entrambi rivestimenti (universali). Siccome (q ◦ p) ◦ g = π, per il Teorema 7.9.11
e
q ◦ p è un rivestimento. 
Possiamo riassumere questi ultimi risultati dicendo che, in spazi adeguatamente connessi, se
si ha un triangolo commutativo di mappe tali che due siano rivestimenti, allora anche la terza è un
rivestimento. Se gli spazi sono qualsiasi invece l’Esempio 7.3.28 mostra che la composizione di due ri-
vestimenti potrebbe non essere un rivestimento. Vediamo altri due esempi di triangolo commutativo
in cui una delle tre mappe non è un rivestimento.
Esempio 7.9.14. Sia N+ = N \ {0}. In R consideriamo X = {1/n, n ∈ N+ } ∪ {0} con la topologia
di sottospazio. X è una successione che converge a zero – il quale sta in X e non ha intorni connessi
– quindi X non è localmente connesso. Sia X b = X × N+ . Chiaramente la proiezione π : Xb → X data
da π(x, n) = x è un rivestimento. Sia ora Y = X × {0, 1}. La proiezione p : Y → X data da p(x, y) = x
b → Y definita come segue
è ancora un rivestimento. Sia q : X

 (x, 0) x < 1/n
q(x, n) =
 (x, 1) x ≥ 1/n

si noti che p(q(x, n)) = x = π(x, n). Ma q non è un rivestimento in quanto il punto (0, 1) non ha
preimmagini.
Esempio 7.9.15. Consideriamo X = {1/n, n ∈ N+ }∪{0} con la topologia indotta da R e X
b = X ×N
0 0
con π(x, n) = x. Sia Y = {(x, n) ∈ X : x < 1/n}, sia Xo = {1/n, n ∈ N} e sia Y = Y ∪ (Xo × {−1}).
b
Sia p : Y → X data da p(x, n) = x. Essa non è un rivestimento perché lo 0 ∈ X non ha un intorno
b → Y definita come
banalizzante. Sia q : X

 (x, n) x < 1/n
q(x, n) =
 (x, −1) x ≥ 1/n

chiaramente p(q(x, n)) = x = π(x, n). Inoltre q è un rivestimento, perché è l’identità su Y 0 e il resto
ha la topologia discreta (si noti che 0 ∈
/ Xo ).
Infine, nelle ipotesi del Teorema 7.9.11 potrebbe succedere che né p né q siano rivestimenti.
Esempio 7.9.16. Sia Rdisc l’insieme R dotato della topologia discreta. Sia Xb = R × Rdisc e siano
2
Y = R e X = R Euclidei. La proiezione di rivestimento π : X → X data da π(x, r) = x spezza
b
lungo R2 con q = id e p = π (insiemisticamente Y e X b coincidono, sono le topologie a essere diverse).
La mappa q : X b → Y non è un rivestimento perché non è aperta. La mappa p : Y → X non è un
rivestimento perché la fibra di un punto non è discreta.

7.10. G-spazi
Ricordiamo che per convenzione s’è definito il rivestimento universale solo per spazi localmen-
te connessi per archi. Quindi la frase “X ha rivestimento universale” comprende “X è localmente
connesso per archi”.
Definizione 7.10.1 (G-spazi). Sia G un gruppo. Un G-spazio è il dato di uno spazio topologico X
e di un’azione di G su X tale che ogni x ∈ X abbia un intorno aperto U tale che per ogni g 6= h ∈ G
sia g(U ) ∩ h(U ) = ∅.
Si noti che se X è un G-spazio allora l’azione di G è libera.
Esempio 7.10.2. Per spazi T2 e localmente compatti, il dato di un’azione libera e propriamente
discontinua di G su X fornisce un G-spazio (Teorema 6.6.16).
178 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Esempio 7.10.3. L’Esempio 6.6.18 fornisce un G-spazio.


Il Teorema 7.3.24 ci dice che se X è un G-spazio, allora la proiezione naturale X → X/G è un
rivestimento.
Definizione 7.10.4. Un G-rivestimento è un rivestimento X → X/G ottenuto per quoziente di
un G-spazio.
e→
Esempio 7.10.5. Se X ha rivestimento universale allora, ponendo G = π1 (X), si ha G = Aut(X
X) (Teorema7.8.26) e X = X/G (Teorema 7.8.28). Quindi i G-spazi forniscono una classe universale
e
di rivestimenti.
Quando si trattano spazi non connessi, i punti base sono utili per individuare la componente
connessa di lavoro. Se (X, x) → (X/G, [x]) è un G-rivestimento puntato, la rappresentazione di
monodromia deck è naturalmente definita da π1 (X/G, [x]) a valori, a priori, solo nel gruppo degli
automorfismi della componente di X che contiene x.
Lemma 7.10.6. Sia G un gruppo e X → X/G un G-rivestimento. Allora:
(1) G ≤ Aut(X → X/G).
(2) X → X/G è regolare.
(3) Se X è connesso allora G = Aut(X → X/G).
(4) Per ogni scelta di punto base x ∈ X, la monodromia deck ha valori in G e se si cambia punto base con
y = hx, essa si coniuga per h. Il nucleo K della monodromia deck è isomorfo a π1 (X, x).
(5) Se X è connesso per archi, allora la monodromia deck è suriettiva.
D IMOSTRAZIONE . (1) L’azione di G su X commuta evidentemente con la proiezione al quozien-
te, quindi ogni g ∈ G è naturalmente un automorfismo del rivestimento X → X/G.
(2) Per definizione G agisce transitivamente sulle orbite, che sono le fibre e quindi l’azione di
Aut(X → X/G) è transitiva.
(3) Se X è connesso e f : X → X è un isomorfismo di rivestimento, allora scelto x ∈ X, si ha
f (x) = gx per qualche g ∈ G. Per il Lemma 7.4.2 dell’unicità del sollevamento, f coincide con g su
tutto X.
(4) Dato γ ∈ π1 (X/G, [x]), il punto finale del sollevamento γe di γ che parte da x, appartiene alla
fibra di x. Quindi esiste g ∈ G tale che gx = γ e(1). La restrizione di g alla componente connessa
di X contenente x è un automorfismo di rivestimento, dunque la monodromia ρx (γ) è esattamente
g. Se si cambia punto base usando y = hx al posto di x, il sollevato γ eh di γ che parte da hx è
h(eγ ) e quindi γeh (1) = hgx = hgh−1 hx = hgh−1 y. (Si veda anche l’Osservazione 7.8.25). Il nucleo
della monodrommia è formato dai laccetti che si sollevano a cammini chiusi ed è quindi isomorfo a
π1 (X, x).
(5) Per ogni x ∈ X e g ∈ G esiste un cammino γ tra x e gx, che si proietta a un laccetto in
π1 (X/G, [x]) la cui monodromia è esattamente g. 
Lemma 7.10.7. Sia X → X/G un G-rivestimento connesso e localmente connesso per archi. Allora:
(1) π1 (X/G) è un’estensione di G.
(2) Se X è semplicemente connesso allora π1 (X/G) = G.
e → X/G), si ha G = H/K (ove K
(3) Se X ammette rivestimento universale, allora detto H = Aut(X
è il nucleo della monodromia deck).
D IMOSTRAZIONE . La successione esatta (3) di pagina 173 (rimpiazzando X b → X con X → X/G)
diventa
0 → π1 (X) → π1 (X/G) → G → 0.
e → X/G) (Teorema 7.8.26).
I punti (1) e (2) seguono. Il punto (3) segue dal fatto che π1 (X/G) = Aut(X

7.10. G-SPAZI 179

Definizione 7.10.8 (G-mappe). Una funzione continua f : X → Y tra due G-spazi si dice G-
mappa se commuta con l’azione di G, cioè se per ogni x ∈ X si ha
f (gx) = gf (x).
Se gli spazi sono puntati, si richiede che f mandi il punto base di X in quello di Y .
Lemma 7.10.9. Sia f : X → Y una G-mappa tra due G-spazi. Allora f è biunivoca sulle orbite. Più
precisamente, per ogni x ∈ X, f è una biiezione tra Gx e Gf (x).
D IMOSTRAZIONE . Siano x1 , x2 ∈ X tali che f (x1 ) = f (x2 ). Se x2 = gx1 allora f (x1 ) = f (x2 ) =
f (gx1 ) = gf (x1 ). Poiché l’azione di G è libera, ciò implica g = Id e dunque x1 = x2 . D’altronde se
y ∈ Gf (x) allora y = gf (x) = f (gx) quindi f è suriettiva dall’orbita di x all’orbita di f (x). 
Definizione 7.10.10 (Isomorfismo tra G-rivestimenti). Siano X → X/G e Y → Y /G due G-
rivestimenti. Un isomorfismo di G-rivestimenti è un omeomorfismo f : X → Y che sia una G-mappa.
Per il Corollario 2.2.17 un isomorfismo di G-rivestimenti è anche un isomorfismo di rivestimenti.
Lemma 7.10.11. Siano p1 : (X1 , x1 ) → (X, x0 ) e p2 : (X2 , x2 ) → (X, x0 ) due G-rivestimenti dello
stesso spazio puntato (X, x0 ). Se esiste un isomorfismo di G-rivestimenti
f : (X1 , x1 ) → (X2 , x2 )
allora i due rivestimenti hanno la stessa rappresentazione di monodromia deck.
D IMOSTRAZIONE . Per i = 1, 2 sia ρi : π1 (X, x0 ) → G la monodromia deck di pi . Sia γ ∈ π1 (X, x0 )
e siano γi i sollevamenti di γ in Xi che partono da xi . Siccome f è un isomorfismo di rivestimenti,
f ◦ γ1 = γ2 e quindi f (γ1 (1)) = γ2 (1). Ma
ρ1 (γ)(x2 ) = ρ1 (γ)(f (x1 )) = f (ρ1 (γ)(x1 )) = f (γ1 (1)) = γ2 (1) = ρ2 (γ)(x2 )
e quindi (ρ1 (γ))−1 ρ2 (γ) fissa x2 . Siccome l’azione di G è libera ciò implica ρ1 (γ) = ρ2 (γ). 
Si noti che in generale, se gli spazi non son puntati, le monodromie di rivestimenti isomorfi
possono essere diverse come rappresentazioni. Si pensi per esempio a cosa succede cambiando punto
base in uno stesso rivestimento. Il Lemma 7.10.11 ci dice che la funzione
Φ : {classi di isomorfimso di G-rivestimenti puntati di (X, x0 )} −→ hom(π1 (X, x0 ), G)
che associa ad ogni rivestimento la sua monodromia deck, è ben definita.
Teorema 7.10.12. Se X ammette rivestimento universale allora Φ è biunivoca.
Dividiamo la dimostrazione in due lemmi, dimostrando prima la suriettività e poi l’iniettività.
Lemma 7.10.13 (Costruzione del ρ-rivestimento). Φ è suriettiva.

D IMOSTRAZIONE . Sia π : (X, e xe0 ) → (X, x0 ) il rivestimento universale e sia ρ : π1 (X, x0 ) → G


una rappresentazione qualsiasi. Sappiamo che Aut(X) e = π1 (X, x0 ) (Teorema 7.8.26) quindi per ogni
γ ∈ π1 (X, x0 ) e per ogni x ∈ X è chiaro cosa sia γx. Dotiamo G della topologia discreta. Come in
e
Figura 10, su Xe × G facciamo agire π1 (X, x0 ) tramite
γ(x, g) = (γx, gρ(γ −1 )).
e × G un π1 (X, x0 )-spazio. Sia
Ciò rende X
X e × G)/π1 (X, x0 )
bρ = (X
il quoziente (che potrebbe essere anche sconnesso, per esempio se ρ è la rappresentazione banale) ove
scegliamo x x0 , 1)] come punto base.
b0 = [(e
180 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

X

(γx, gρ(γ −1 )) [(γx, g)]

(x, g) (γx, g)
[(x, g)]
X
e

F IGURA 10. Costruzione di X


bρ . I segmentini neri rappresentano aperti banalizzanti
per X → X.
e

Su X
bρ facciamo agire G tramite
g[(x, h)] = [(x, gh)].
Vediamo com’è fatta quest’azione. [(x, h)] e [(y, g)] stanno nella stessa G-orbita se e solo se
∃α ∈ G tale che [(y, g)] = α[(x, h)] = [(x, αh)]
se e solo se
∃α ∈ G, ∃γ ∈ π1 (X, x0 ) tali che (y, g) = γ(x, αh) = (γx, αhρ(γ −1 ))
il che, ponendo α = gρ(γ)h−1 equivale a chiedere che
∃γ ∈ π1 (X, x0 ) tale che y = γx.
Quindi X bρ /G = X, la proiezione è data da p([(x, g)]) = π(x) e se U è un aperto banalizzante per π
allora lo è anche per p, che risulta quindi un G-rivestimento. La monodromia agisce semplicemente
per
monodr(γ)(b x0 ) = monodr(γ)[(x0 , 1)] = [(γx0 , 1)]
ma
[(γx0 , 1)] = [γ(x0 , 1ρ(γ))] = [(x0 , ρ(γ))] = ρ(γ)[(x0 , 1)]
e quindi la monodromia è proprio ρ. 
Lemma 7.10.14. Φ è iniettiva.
D IMOSTRAZIONE . Sia (Y, y0 ) → (X, x0 ) un G-rivestimento con monodromia ρ. Basta far vedere
che esso è isomorfo a (X
bρ , x e ∈ X,
b0 ). Per ogni x e sia αe un cammino da x
e0 a x
e, sia α la sua proiezione su
X e sia αY il suo sollevamento in Y che parte da y0 . Poniamo f (e x) = αY (1). Si noti che f : Xe →Y
è il rivestimento universale della componente di Y che contiene y0 . Usando la f , si definisce una
funzione F : X e × G → Y ponendo
F (e
x, g) = gf (e
x)
(G agisce su Y perché Y è un G-rivestimento di X). La funzione F è costante sulle orbite dell’azione
di π1 (X, x0 ). Infatti per definizione di monodromia, se γ ∈ π1 (X, x0 ), si ha γY (1) = ρ(γ)(y0 ) e quindi
f (γe
x0 ) = ρ(γ)f (ex0 ), da cui f (γe x) per ogni x
x) = ρ(γ)f (e e e dunque
F (γ(e x, gρ(γ −1 )) = gρ(γ −1 )f (γe
x, g)) = F (γe x) = gρ(γ −1 )ρ(γ)f (e
x) = gf (e
x) = F (e
x, g).
7.11. IL TEOREMA DI VAN KAMPEN 181

Per il Teorema 2.2.16 F discende a una funzione continua F : X bρ → Y . In oltre, dalla definizione
di f , si vede che F è una G-mappa e che è un rivestimento, in particolare è aperta. Per ogni y ∈ Y
sia x = [y] ∈ X = Y /G e sia x e ∈ X e un suo sollevamento. Per costruzione f (e x) e y stanno nella
stessa fibra Yx . Esiste quindi g ∈ G tale che y = gf (e x, g)]. Dunque F è suriettiva. Se
x) = F [(e
F [(e
x, g)] = F [(e x1 , g1 )] allora f (e
x) e f (e
x1 ) stanno nella stessa G-orbita, da cui segue che xeexe1 stanno
nella stessa π1 (X, x0 )-orbita et ergo (come abbiamo visto nella dimostrazione del Lemma 7.10.13)
x, g)] e [(e
[(e x1 , g1 )] stanno nella stessa G-orbita.
Per il Lemma 7.10.9 F è biunivoca sulle G-orbite e dunque è biunivoca globalmente. Quindi è un
omeomorfismo, ergo un G-isomorfismo. 

7.11. Il teorema di Van Kampen


Uno degli strumenti principali che si hanno per calcolare il gruppo fondamentale a mano è il
celeberrimo Teorema di Van Kampen. Daremo un paio di dimostrazioni, quella classica che è generale
ma richiede dettagli assai tediosi (lasciati con affetto al lettore volenteroso) e una “alla Grothendieck”
che usa la teoria dei G-spazi, più concisa, ma che vale solo per spazi che possiedono il rivestimento
universale.
Prima di enunciare e dimostrare il teorema, richiamiamo (senza dimostrazioni) alcuni fatti sui
prodotti amalgamati.
Siano A, B, C gruppi e siano f : C → A, g : C → B morfismi di gruppi. Sia A ∗ B il prodotto
libero di A e B e sia K il sottogruppo normale di A ∗ B generato dagli elementi del tipo f (c)g(c−1 ), al
variare di c ∈ C. Il prodotto amalgamato A ∗C B è il quoziente (A ∗ B)/K.
Se A, B sono sottogruppi di un gruppo G e C è un sottogruppo comune, se non altrimenti
specificato le funzioni f, g sono le inclusioni di C in A e B rispettivamente.
Se A = hGA |RA i, B = hGB |RB i, C = hGC |RC i sono dati in termini di generatori e relazioni di
equivalenza, allora A ∗C B = hGA , GB |RA , RB , Ri ove R è l’insieme delle relazioni f (c) = g(c) al
variare di c ∈ GC .
Il prodotto amalgamato si può caratterizzare anche attraverso la sua proprietà universale (vedasi
il diagramma in figura 11) come segue. Dati A, B, C come sopra, a meno di isomorfismi, esiste un
unico gruppo H con morfismi jA : A → H, jB : B → H tali che jA ◦ f = jB ◦ g, tale che per ogni altro
gruppo G e morfismi fA : A → G e fB : B → G tali che fA ◦ f = fB ◦ g, esista un unico F : H → G
tale che fA = F ◦ jA e fB = F ◦ jB . Tale gruppo H è il prodotto amalgamato.

A fA
f
jA
F
C A ∗C B G
jB
g
B fB

F IGURA 11. La proprietà universale del prodotto amalgamato

Teorema 7.11.1 (Van Kampen). Sia X uno spazio topologico localmente connesso per archi e siano
A, B ⊆ X tali che
• A, B sono aperti e connessi;
• A ∪ B = X;
• ∅=
6 A ∩ B è connesso.
182 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Sia x0 ∈ A∩B e siano iA : π1 (A∩B, x0 ) → π1 (A, x0 ), iB : π1 (A∩B, x0 ) → π1 (B, x0 ) le inclusioni naturali.


Allora il gruppo fondamentale di X è il prodotto amalgamato di π1 (A, x0 ) e π1 (B, x0 ) lungo π1 (A ∩ B, x0 ):
π1 (X, x0 ) = π1 (A, x0 ) ∗π1 (A∩B,x0 ) π1 (B, x0 ).
In altre parole, il gruppo fondamentale di X può essere calcolato quozientando il prodotto libero π1 (A, x0 ) ∗
π1 (B, x0 ) per la relazione d’equivalenza generata da iA (γ) = iB (γ) al variare di γ ∈ π1 (A ∩ B, x0 ).
In termini di generatori/relazioni, se π1 (A, x0 ) = hGA |RA i, π1 (B, x0 ) = hGB , RB i, π1 (A∩B, x0 ) =
hGC |RC i e R = {iA (γ)iB (γ)−1 : γ ∈ GC }, allora
π1 (X, x0 ) = hGA ∪ GB |RA ∪ RB ∪ Ri.
Un enunciato equivalente si può dare tramite la proprietà universale. Se jA : π1 (A, x0 ) → π1 (X, x0 )
e jB : π1 (B, x0 ) → π1 (X, x0 ) sono le inclusioni naturali, il teorema di Van Kampen si può enunciare
dicendo che π1 (X, x0 ) gode della proprietà universale del prodotto amalgamato, ossia che vale jA ◦
iA = jB ◦iB e che per ogni gruppo G tale che esistano morfismi fA : π1 (A, x0 ) → G e fB : π1 (B, x0 ) →
G con fA ◦iA = fB ◦iB , esiste unico morfismo di gruppi F : π1 (X, x0 ) → G tale che fA = F ◦jA e fB =
F ◦ jB (si veda la Figura 12). Siccome tale proprietà universale caratterizza il prodotto amalgamato a

π1 (A, x0 )
fA
iA
jA
F
π1 (A ∩ B, x0 ) π1 (X, x0 ) G
jB
iB
fB
π1 (B, x0 )

F IGURA 12. La proprietà universale del gruppo fondamentale

meno di isomorfimsi, dire che π1 (X, x0 ) gode della proprietà universale equivale a dire che è isomorfo
al prodotto amalgamato π1 (A, x0 ) ∗π1 (A∩B,x0 ) π1 (B, x0 ).
D IMOSTRAZIONE CLASSICA . Le inclusioni jA , jB definiscono naturalmente un morfismo
ϕ : π1 (A, x0 ) ∗ π1 (B, x0 ) → π1 (X, x0 ).
Si deve far vedere che ϕ è suriettivo e che il suo nucleo coincide con K = {iA (γ)iB (γ)−1 : γ ∈
π1 (A ∩ B, x0 )}. Sia γ : [0, 1] → X un laccetto basato in x0 . In [0, 1] consideriamo le componenti
connesse di γ −1 (A) e quelle di γ −1 (B). Esse forniscono un ricoprimento aperto ([0, 1] è localmente
connesso per archi). Per compattezza se ne estrae un sottoricoprimento finito. Da ciò si ricava una
partizione
0 = t0 < t1 < ... < tk = 1
tale che γ([ti , ti+1 ]) è interamente contenuto o in A o in B e ti ∈ A ∩ B. Essendo A ∩ B connesso (e
localmente connesso per archi) per ogni ti esiste un cammino ηi da x0 a γ(ti ). Per cui γ si esprime
come prodotto dei cammini
−1
ηi+1 γ|ti ,ti+1 ηi
che sono laccetti in basati in x0 e interamente contenuti in A o B. Ciò dimostra la suriettività di ϕ.
Passiamo al nucleo di ϕ. Esso contiene evidentemente tutti gli elementi di K, si deve far vedere
che non c’è altro. Lo si può fare a mano, prendendo un elemento del nucleo di ϕ e suddividendolo
accuratamente come prodotto di cammini omotopi a elementi di K. Per mettere a posto i dettagli
di questa dimostrazione ci vogliono due-tre pagine di conti, che lasciamo volentieri al lettore (e che
7.11. IL TEOREMA DI VAN KAMPEN 183

si possono trovare in un qualsiasi libro di topologia algebrica, per esempio in quello famosissimo di
Hatcher “Algebraic Topology”). 

D IMOSTRAZIONE ALLA G ROTHENDIECK . Useremo principalmente il Teorema 7.10.12 per dimo-


strare la proprietà universale del gruppo fondamentale. Siano G, fA , fB come in Figura 12. Per il
Teorema 7.10.12 esistono unici (a meno di isomorfismo) G-rivestimenti di A e B con monodromie
fA e fB rispettivamente. Il seguente Lemma 7.11.2 di incollamento ci fornirà un unico (a meno di
isomorfismi) G-rivestimento di X che si ottiene incollando i due rivestimenti di cui sopra, per il Teo-
rema 7.10.12 tale rivestimento determina una rappresentazione di monodromia, che è il morfismo F
richiesto, unico perché in tutta la costruzione i rivestimenti usati sono unici. 

Lemma 7.11.2 (Di incollamento di rivestimenti). Sia X uno spazio topologico e supponiamo X =
A ∪ B con A, B aperti. Siano πA : A
b → A e πB : B b → B rivestimenti tali che esista un isomorfismo, come
rivestimenti di A ∩ B,
−1 −1
ϕ : πA (A ∩ B) → πB (A ∩ B).
b → X e due isomorfismi di rivestimento
Allora esiste, unico a meno di isomorfismi, un rivestimento π : X
ψA : π −1 (A) → A
b ψB : π −1 (B) → B
b
−1
tali che su πA (A ∩ B) si abbia
−1
ψB ◦ ψA = ϕ.
Inoltre, se i rivestimenti di partenza sono G-rivestimenti e ϕ è un G-isomorfismo, allora anche π è un G-
rivestimento e ψA e ψB sono G-isomorfismi.
D IMOSTRAZIONE . Lo spazio X è ottenuto dall’unione disgiunta di A e B incollando tra loro i
punti di A ∩ B. Ripetendo tale operazione sulle preimmagini di aperti banalizzanti si costruisce X. b
Più precisamente, X è lo spazio ottenuto come quoziente dall’unione disgiunta A t B incollando
b b b
−1
a ∈ πA
b (A ∩ B) con ϕ(ba). Siccome ϕ è un isomorfismo di rivestimenti si ha che Xb è un rivestimento di
−1 −1
X con proiezione π(x) = πA (x) se x ∈ A e π(x) = πB (x) se x ∈ B. Gli isomorfismi ψA
b b e ψB sono le
restrizioni, a A
beB b rispettivamente, della proiezione A btB b → (Ab t B)/
b ∼= X. b Se tutti i rivestimenti
sono G-rivestimenti e l’isomorfismo ϕ è un G-isomorfismo, l’azione di G è ben definita su X b e ψA e
ψB sono G-isomorfismi.
b Sia p : Y → X è un altro rivestimento tale che esistano isomorfismi
Vediamo infine l’unicità di X.
−1 −1
ξA : p (A) → A e ξB : p (B) → B
b b tali che su π −1 (A ∩ B) si abbia ξB ◦ ξ −1 = ϕ. La funzione
A A
F :X b → Y data da

 ξ −1 ◦ ψ (x) x ∈ π −1 (A)
A A
F (x) =
 ξ −1 ◦ ψ (x) x ∈ π −1 (B)
B B

è un isomorfismo di (G-)rivestimenti 

Corollario 7.11.3. Se X è localmente connesso per archi e X = A ∪ B con A, B aperti semplicemente


connessi e A ∩ B connesso allora X è semplicemente connesso. Se invece A e B sono connessi e A ∩ B è
semplicemente connesso allora π1 (X) è il prodotto libero di π1 (A) e π1 (B).
D IMOSTRAZIONE . Segue immediatamente dal Teorema di Van Kampen. 

Esercizio 7.11.4. Il Corollario 7.11.3 vale per l’omino coi baffi? (Esempio 7.8.9).
Esempio 7.11.5. S 2 è semplicemente connesso perché S 2 meno un punto è contraibile e quindi
semplicemente connesso. Inoltre due punti non sconnettono S 2 e quindi se x1 6= x2 ∈ S 2 si ha
S 2 = (S 2 \ x1 ) ∪ (S 2 \ x2 ) è un unione di aperti semplicemente connessi con intersezione connessa.
184 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Esempio 7.11.6. π1 (RP2 ) = Z/2Z. Infatti, siccome S 2 è semplicemente connesso, esso è il ri-
vestimento universale di RP2 e Aut(S 2 → RP2 ) ha solo due elementi: l’identità e l’antipodale. Il
Teorema 7.8.26 conclude. (In particolare RP2 e CP1 non sono omeomorfi).
Esempio 7.11.7. Il gruppo fondamentale di una figura a “otto” o a “infinito” (cioè 8, ∞) è Z ∗ Z.
Infatti un “otto” è omeomorfo a due S 1 attaccati per un punto. π1 (S 1 ) = Z e π1 (un punto) = 1. Per
applicare Van Kampen si devono usare aperti e i lobi S 1 non sono aperti nell’otto. Poco male, basta
prendere intorni dei lobi con due baffetti e, al posto del punto, una piccola “x”.
Esempio 7.11.8. Il gruppo fondamentale di un toro bucato è Z ∗ Z infatti esso si retrae su un “otto”
e il Teorema 7.2.20 conclude.
Esempio 7.11.9. Il gruppo fondamentale di una superficie Σ2 di genere due (Figura 5, Sezione 6.2)
è dato dalla seguente presentazione
ha, b, c, d|aba−1 b−1 cdc−1 d−1 i.
D IMOSTRAZIONE . Σ2 è l’unione di due tori bucati X, Y attaccati lungo il bordo γ, considerando
un intorno del quale si descrive Σ2 come l’unione di due tori bucati che si intersecano lungo un cilin-
dretto. Il gruppo fondamentale del toro bucato X è il gruppo libero generato da due elementi a, b e γ è
omotopo al commutatore aba−1 b−1 . Stesso discorso per il secondo toro Y , che consideriamo generato
da c, d con γ omotopo a dcd−1 c−1 . Per Van Kampen, il gruppo fondamentale di Σ2 è generato dai
quattro elementi a, b, c, d e la relazione data da X ∩ Y identifica i due commutatori, quindi dobbiamo
imporre aba−1 b−1 = dcd−1 c−1 . 
Calcolare il gruppo fondamentale di un grafo finito e connesso è facile, attraverso la seguente
ricetta, descritta via esercizi. Un albero è un grafo semplicemente connesso.
Esercizio 7.11.10. Dimostrare che in un grafo finito, il collasso a un punto di un albero è un’equi-
valenza di omotopia.
Esercizio 7.11.11. Dimostrare che ogni grafo finito e connesso contiene un albero massimale (ri-
spetto all’inclusione).
Esercizio 7.11.12. Dimostrare che collassando a un punto un albero massimale di un grafo finito e
connesso si ottiene un bouquet di S 1 .
Esercizio 7.11.13. Calcolare per induzione il gruppo fondamentale di un bouquet di S 1 usando
Van Kampen.

7.12. Esercizi
Esercizio 7.12.1. Sia f : [0, 2π] → S 1 data da f (t) = eit . Dimostrare che f è omotopa a una costante.
Esercizio 7.12.2. Sia f : [0, 2π] → S 1 data da f (t) = eit . Dimostrare che f non è omotopa a una
costante relativamente a {0, 2π}.
Esercizio 7.12.3. Sia f : (−π, π) → R2 data da f (t) = (0, tan 2t ). Identificando [−π, π]/{−π, π} con
S 1 , dimostrare che f ha un’estensione continua g : S 1 → RP2 . Dimostrare che g non è omotopica-
mente banale.
Esercizio 7.12.4. Sia f : (−π, π) → R2 data da f (t) = (0, tan 2t ). Identificando R2 con C e S 1
con [−π, π]/{−π, π}, dimostrare che f ha un’estensione continua g : S 1 → CP1 . Dimostrare che g è
omotopicamente banale.
Esercizio 7.12.5. Siano f (t) = eit cos(t) e g(t) = eit cos(2t), funzioni da S 1 = [0, 2π]/{0, 2π} a C.
Dimostrare che f e g sono omotope. Dimostrare che f e g sono omotope in C \ {1 + i}. Dimostrare
che f e g non sono omotope in C \ {1/2}.
7.12. ESERCIZI 185

Esercizio 7.12.6. Dimostrare che X = {(x, y) ∈ R2 : xy = 0} è omotopicamente equivalente a un


punto.
Esercizio 7.12.7. Dimostrare che ogni punto di R2 con la metrica dei raggi è un suo retratto di
deformazione forte.
Esercizio 7.12.8. Sia γ una curva a otto (per esempio una lemniscata di Bernoulli) in R2 e siano p, q
due punti ciascuno dentro uno dei lobi dell’otto.

p q

Dimostrare che R2 \ {p, q} si retrae su γ.


Esercizio 7.12.9. Sia X = {(q, y); q ∈ Q} ∪ {y = 0}. Dimostrare che X è omotopicamente equi-
valente a un punto. Dimostrare che X si retrae per deformazione su ogni suo punto. Dimostrare
che l’origine è retratto di deformazione forte di X. Dimostrare che il punto (0, 1) non è retratto di
deformazione forte di X.
Esercizio 7.12.10 (Il parquet di Hatcher). Sia X il sottoinsieme di R2 formato dal segmento oriz-
zontale [0, 1] e dalle rette verticali {q} × [0, 1 − q] con q razionale in [0, 1]. Sia Z lo spazio ottenuto
sistemando infinite copie di X a zig-zag, come mostrato in figura.

Dimostrare che Z è contraibile.


Esercizio 7.12.11. Dimostrare che il parquet di Hatcher si retrae per deformazione su ogni suo
punto.
Esercizio 7.12.12. Dimostrare che nessun punto è retratto di deformazione forte del parquet di
Hatcher.
Esercizio 7.12.13. Sia X → Y un rivestimento. È vero che se X è T2 anche Y lo è?
Esercizio 7.12.14. Sia X uno spazio localmente connesso per archi che ammette un rivestimento
semplicemente connesso. Dimostrare che X è semi-localmente semplicemente connesso.
Esercizio 7.12.15. Siano X, Y come in figura. Dimostrare che X è un rivestimento di Y .

X Y

Esercizio 7.12.16. Siano A, B come in figura. Dimostrare che A non è un rivestimento di B.

A B

Trovare uno spazio C che sia un rivestimento di entrambi A e B.


186 7. UN PIZZICO DI TOPOLOGIA ALGEBRICA: IL GRUPPO FONDAMENTALE E I SUOI AMICI

Esercizio 7.12.17. Siano X, Y come in figura. Si dica se X è un rivestimento di Y .

X Y

Si dica se R è un rivestimento di X.
Esercizio 7.12.18. Siano X, Y come in figura. Si dica se X è un rivestimento di Y .

X Y

Esercizio 7.12.19. Siano X, Y come in figura. Si dica se X è un rivestimento di Y .

X Y

Esercizio 7.12.20. Siano X, Y come in figura. Si dica se X è un rivestimento di Y .

X Y

Esercizio 7.12.21. Si descrivano i rivestimenti universali dei seguenti grafi e si dica se sono omeo-
morfi.

Esercizio 7.12.22. Trovare tutti i rivestimenti di grado tre di un grafo a forma di 8.


Esercizio 7.12.23. Trovare tutti i rivestimenti di grado tre di un grafo a forma di A.
Esercizio 7.12.24. Trovare tutti i rivestimenti di grado tre di un grafo a forma di T.

Esercizio 7.12.25. Trovare un rivestimento connesso e di grado due di .


Esercizio 7.12.26. Esiste un rivestimento connesso e di grado due di un grafo a forma di X?
Esercizio 7.12.27. Esiste un rivestimento di grado due di un grafo a forma di X?
Esercizio 7.12.28. Dimostrare che il gruppo fondamentale di un grafo è un gruppo libero.
7.12. ESERCIZI 187

Esercizio 7.12.29. Sia X una superficie, cioè una varietà topologica di dimensione due, connessa.
Dimostrare che il gruppo fondamentale di X meno un numero finito di punti è un gruppo libero.
Esercizio 7.12.30. Calcolare il gruppo fondamentale di RPn .
Esercizio 7.12.31. Dimostrare che CP1 è semplicemente connesso.
Esercizio 7.12.32. Dimostrare che CP2 è semplicemente connesso.
Esercizio 7.12.33. Dimostrare che CPn è semplicemente connesso.
Esercizio 7.12.34. Calcolare il gruppo fondamentale del toro, del toro meno un punto e del toro
meno due punti. Verificare che sono diversi tra loro.
Esercizio 7.12.35. Calcolare il gruppo fondamentale della sfera meno un punto, meno due punti e
meno tre punti. Verificare che sono diversi tra loro.
Esercizio 7.12.36. Calcolare il gruppo fondamentale della bottiglia di Klein.
Esercizio 7.12.37. Dimostrare che per n ≥ 2 sia S n che S n meno un punto sono semplicemente
connessi.
Esercizio 7.12.38. Dimostrare che se X è una varietà topologica di dimensione n ≥ 3 semplice-
mente connessa, allora X meno un numero finito di punti rimane semplicemente connessa.
Esercizio 7.12.39. Calcolare il gruppo fondamentale di una superficie di genere 3 (per esempio
quella dell’Esercizio 6.11.29).
Esercizio 7.12.40. Calcolare il gruppo fondamentale di R3 meno l’asse X.
Esercizio 7.12.41. Calcolare il gruppo fondamentale di R3 meno una circonferenza.
Esercizio 7.12.42. In R3 sia X = {x2 + y 2 = 1, z = 0} ∪ {x = 0, y = 0}. Calcolare il gruppo
fondamentale di X c .
Esercizio 7.12.43. Dimostrare che se una funzione continua f : D2 → D2 fissa i punti del bordo,
allora è suriettiva.
Esercizio 7.12.44. Dimostrare che S 3 e T 3 non sono omeomorfi.
Esercizio 7.12.45. Dimostrare che S 3 e RP3 non sono omeomorfi.
Esercizio 7.12.46. Dimostrare che RP3 e T 3 non sono omeomorfi.
Esercizio 7.12.47. Sia X una varietà topologia unidimensionale compatta. Calcolare π1 (X).
Esercizio 7.12.48. Sia X una varietà topologia unidimensionale compatta. Dimostrare che X è
omeomorfa a S 1 .
Esercizio 7.12.49. Siano X e Y due grafi finiti e connessi. Dimostrare che se X e Y hanno lo stesso
numero di lati e di vertici allora essi hanno lo stesso gruppo fondamentale.
Esercizio 7.12.50. Sia X un grafo finito e connesso. Sia V il numero dei vertici e L il numero dei
lati. Dimostrare che il gruppo fondamentale di X dipende solo da V − L.
Esercizio 7.12.51. Sia M una varietà topologia tridimensionale. Dimostrare che il gruppo fonda-
mentale di M e quello di M meno un punto coincidono. (Si usi Van Kampen.)
APPENDICE A

Minicorso di aritmentica ordinale

Notazione: Nel seguito indicheremo con “<” una relazione d’ordine stretto e useremo “≤” con
l’usuale significato di “minore o uguale”.

A.1. La classe degli ordinali


Definizione A.1.1 (Buoni ordini). Un insieme X totalmente ordinato si dice ben ordinato (e
l’ordine si dice un buon ordine) se ogni sottoinsieme non vuoto di X ha un minimo:
∀∅ =
6 A ⊆ X∃a ∈ A : ∀b ∈ A : a ≤ b.
In particolare ogni insieme non vuoto ben ordinato ha un minimo. Se non vi sono ambiguità
notazionali, il minimo di un insieme ben ordinato si chiama spesso 0.
Esempio A.1.2. L’insieme vuoto è ben ordinato, ed è l’unico ben ordinato che non ha minimo. N è
ben ordinato rispetto all’ordine usuale; Z no, infatti non è vuoto ma non ha un minimo.
È da sottolineare che nella definizione di insieme ben ordinato, il minimo di A deve stare in A.
Esempio A.1.3. L’insieme [0, ∞) con l’ordine usuale non è ben ordinato, infatti il suo sottoinsieme
A = (1, 2) non ha un minimo. (Verrebbe da dire che 1 sia il minimo di A; ma non sta in A, che ha
quindi un estremo inferiore, ma non un minimo!)
1 1
Esempio A.1.4. L’insieme {1 − n+1 : n ∈ N} è ben ordinato. L’insieme { n+1 : n ∈ N} no.
1 1
Esempio A.1.5. L’insieme {k − n+1 : k, n ∈ N} è ben ordinato. L’insieme {k + n+1 : k, n ∈ N} no.
1
Nemmeno l’insieme {k − n+1 : k ∈ Z, n ∈ N} lo è.
Esempio A.1.6. L’insieme N ∪ {∞} con l’ordine

 x, y ∈ N e x ≤ y per l’ordine naturale di N
x≤y⇔
 x qualsiasi e y = ∞

è ben ordinato. In quanto ogni sottoinsieme non vuoto o è il solo ∞ — e allora ∞ è il minimo —
oppure è un sottoinsieme di N (più eventualmente ∞) e quindi ha minimo.
Esercizio A.1.7. Dimostrare che l’insieme N ∪ {∞1 } ∪ {∞2 } con l’ordine



 x, y ∈ N e x ≤ y per l’ordine naturale di N


 x < ∞ ∀x ∈ N

1


 x < ∞2 ∀x ∈ N


 ∞ <∞

1 2

è ben ordinato.
Definizione A.1.8. Sia X un insieme ben ordinato. Un punto x ∈ X è il massimo di X se ∀y ∈
X : y ≤ x.
189
190 A. MINICORSO DI ARITMENTICA ORDINALE

Chiaramente il massimo se esiste è unico, ma non tutti gli insiemi ben ordinati hanno un massimo.

Esempio A.1.9. L’insieme ben ordinato N non ha un massimo.

Esempio A.1.10. Il massimo di N ∪ {∞} è ∞. Il massimo di N ∪ {∞1 } ∪ {∞2 } è ∞2 .

Definizione A.1.11. Sia X un insieme ben ordinato e sia x ∈ X. Se x non è il massimo, l’insieme
Sx = {y ∈ X : y > x} (maggiore stretto) è non vuoto. In tal caso si definisce il successore di x come

s(x) = min Sx .

Il successore di x, se esiste, si suole indicare spesso con la notazione x + 1 :

s(x) = x + 1

Esempio A.1.12. In N il successore di 0 è 1; quello di n è n+1. In N∪{∞1 }∪{∞2 } si ha ∞1 +1 = ∞2 .


1
Esempio A.1.13. Sia X l’insieme {k − n+1 : k, n ∈ N} con l’ordine indotto da R. Il minimo di X è
−1 (ottenuto per k = n = 0), X non ha massimo. Il successore di 3 (ottenuto per k = 4 e n = 0) è 7/2
(ottenuto per k = 4 e n = 1). Quindi si può dire

” − 1 = 0” ”3 + 1 = 7/2”

(questo è preziosissimo materiale da aperitivo con ingegneri.)

Definizione A.1.14. Sia X un insieme ben ordinato. Un elemento x ∈ X si dice successore se


esiste y tale che x = y + 1 e si dice limite se 0 6= x e x non è successore. Ci sono quindi tre tipi di
punti:



 0 (il minimo di X, se non vuoto)

successori


 limiti

Esempio A.1.15. In N non ci sono numeri limite.

Esempio A.1.16. In N ∪ {∞} l’unico punto limite è ∞.

Esempio A.1.17. In N ∪ {∞1 } ∪ {∞2 } con l’ordine dell’Esercizio A.1.7 l’unico punto limite è ∞1 .
(∞2 = ∞1 + 1 è un successore.)
1
Esempio A.1.18. Sia X l’insieme {k − n+1 : k, n ∈ N} con l’ordine indotto da R. Gli elementi
limite sono gli elementi di N. Gli altri, tranne −1 che è il minimo, sono successori.

Teorema A.1.19 (Induzione transfinita). Sia α 6= ∅ un insieme ben ordinato. Sia P (x) una proposizione
che dipende da x ∈ α. Se

 P (0) è vera
 ∀x ∈ α : (∀y < x P (y) è vera) ⇒ P (x) è vera

allora P (x) è vera per ogni x ∈ α.

D IMOSTRAZIONE . Sia F l’insieme degli x ∈ α per cui P (x) è falsa. Se F non è vuoto allora ha
un minimo x0 ∈ F perché α è ben ordinato. Ma allora P (y) è vera per tutti gli y < x0 . Per ipotesi
induttiva ne segue che P (x0 ) è vera e dunque non può stare in F . Dunque F è vuoto. 
A.1. LA CLASSE DEGLI ORDINALI 191

Si noti che l’induzione usuale è un caso particolare della transfinita (con α = N). Come l’usuale,
anche l’ipotesi induttiva transfinita si può rimpiazzare con un’ipotesi del tipo P (x) ⇒ P (x + 1), ma
solo per i successori, per i limiti si deve mantenere l’ipotesi induttiva generale:



 P (0) è vera

∀x ∈ α : (P (x) è vera) ⇒ P (x + 1) è vera


 ∀x ∈ α limite : (∀y < x P (y) è vera) ⇒ P (x) è vera

Nella Definizione 0.4.7 si erano introdotti tutti i tipi di intervalli di insiemi ordinati. Nel mondo
degli insiemi ben ordinati però, ne bastano meno.
Definizione A.1.20 (Segmenti). Sia X un insieme ben ordinato. Un segmento di X è un insieme
del tipo:
[a, b) = {x ∈ X : a ≤ x < b} segmento generico
[0, b) = {x ∈ X : x < b} segmento iniziale
[a, ∞) = {x ∈ X : x ≥ a} segmento finale
Si noti che un segmento può avere un massimo anche se la sintassi è quella di “aperto in b” e ciò
succede precisamente tutte le volte che b è un successore. Quindi [a, b] non è altro che [a, b + 1):
[a, b] = {x ∈ X : a ≤ x ≤ b} = [a, b + 1)
(Se b è il massimo di X si ha [a, b] = [a, ∞)). Inoltre, siccome X è ben ordinato, ogni segmento ha un
minimo quindi non esistono “segmenti (a, b) aperti in a” in quanto (a, b) non è altro che [a + 1, b):
(a, b) = {x ∈ X : a < x < b} = [a + 1, b).
Definizione A.1.21. Siano X e Y due insiemi ben ordinati. Una funzione f : X → Y si dice
monotona se x > y ⇒ f (x) > f (y); f si dice immersione se è monotona e l’immagine di f è un
segmento di Y , si dice isomorfismo se è biunivoca e monotona. Due insiemi ben ordinati si dicono
isomorfi se esiste un isomorfismo tra loro.
Teorema A.1.22. Siano X e Y due insiemi non vuoti e ben ordinati. Una funzione f : X → Y è
un’immersione se e solo se per ogni 0 < x ∈ X si ha f (x) = min{y ∈ Y : f ([0, x)) < y}.
D IMOSTRAZIONE . Supponiamo che f sia un’immersione e sia x > 0. Per monotonia f (x) >
f ([0, x)). Se esistesse y ∈ Y tale che f ([0, x)) < y < f (x) allora, sempre per monotonia, y non starebbe
nell’immagine di f che quindi non sarebbe un segmento e dunque f non sarebbe un’immersione.
Viceversa, supponiamo che valga f (x) = min{y ∈ Y : f ([0, x)) < y}. In particolare, siccome
f (x) > f ([0, x)), se x > z allora f (x) > f (z). Quindi f è monotona. Vediamo adesso che l’immagine
di f è un segmento di Y . Sia I l’immagine di f e sia A il suo complementare. Per ogni x > 0 si deve
mostrare che A ∩ [f (0), f (x)] è vuoto. Se cosı̀ non fosse, tale insieme avrebbe un minimo y0 e detto
y1 = min{y ∈ I ∩ [f (0), f (x)] : y > y0 }, per definizione y1 sarebbe immagine di un punto x1 per il
quale non vale f (x1 ) = min{y ∈ Y : f ([0, x1 )) < y}. 
Corollario A.1.23. Siano X e Y due insiemi non vuoti e ben ordinati. Allora ogni immersione di X in Y
è determinata dall’immagine di zero.
D IMOSTRAZIONE . Siano f, g : X → Y due immersioni tali che f (0) = g(0). Se f (z) = g(z) per
ogni z < x, allora f ([0, x)) = g([0, x)). Per il Teorema A.1.22, f (x) = min{y ∈ Y : f ([0, x)) < y} =
min{y ∈ Y : g([0, x)) < y} = g(x). Siccome f (0) = g(0), per induzione transfinita f (x) = g(x) per
ogni x ∈ X. 
Un’immersione è sempre un’isomorfismo con l’immagine. Di particolare importanza nella teoria
dei buoni ordini sono i segmenti iniziali e le loro immersioni in segmenti iniziali.
192 A. MINICORSO DI ARITMENTICA ORDINALE

Definizione A.1.24 (Ordinali come tipi d’ordine). Un ordinale è la classe di isomorfismo di un


insieme ben ordinato. Se α = [X] è un ordinale, un segmento di α è la classe di un segmento di X.
Un segmento iniziale di α è la classe di un segmento iniziale di X. Dati due ordinali α e β, si dice che
α < β se α è un segmento iniziale di β (cioè, posto β = [Y ], se X è isomorfo a un segmento iniziale di
Y ).
In parole povere, α < β significa che β “comincia” come α. Ciò definisce un ordine stretto.
Teorema A.1.25. Sia X un insieme ben ordinato. Allora X non è isomorfo a nessun suo segmento iniziale
proprio.
D IMOSTRAZIONE . Sia A ⊆ X l’insieme degli elementi x ∈ X tali che X è isomorfo a [0, x).
Supponiamo A 6= ∅ e sia a il minimo di A. Siccome X è isomorfo a [0, a) esite un’immersione f :
X → [0, a) con f (0) = 0. Sia b = f (a). Siccome X è isomorfo a [0, a) allora è anche isomorfo a
f ([0, a)) = [0, b). Quindi b ∈ A e b < a = min A. Assurdo. Quindi A = ∅. 

Teorema A.1.26. Siano α = [X] e β = [Y ] due ordinali. Allora uno dei due è un segmento iniziale
dell’altro.
D IMOSTRAZIONE . Se uno dei due tra X e Y è vuoto non v’è nulla da dimostrare. (∅ = [0, 0) è
segmento iniziale di tutto.) Supponiamo quindi X, Y non vuoti e denotiamo con 0 sia il minimo di
X che quello di Y . Supponiamo che β non sia un segmento iniziale di α e dimostriamo che α è un
segmento iniziale di β.
Dimostriamo per induzione transfinita che la frase P (x)= “Esiste un’immersione f : [0, x] → Y
con f (0) = 0” è vera per ogni x. P (0) è ovviamente vera. Se per ogni z < x esiste un’immersione
fz : [0, z] → Y tale che fz (0) = 0, per il Corollario A.1.23 tale immersione è unica. Ne segue che le
funzioni fz definiscono un’immersione f : [0, x) → Y con f (0) = 0. Quindi [0, x) è isomorfo a un
segmento iniziale di Y . Siccome Y non è isomorfo a [0, x) (stiamo supponendo che β 6≤ α), allora
f ([0, x)) 6= Y . Ponendo f (x) = min{y ∈ Y : f ([0, x)) < y} si ottiene un’immersione di [0, x] in un
segmento iniziale di Y . Quindi P (x) è vera per ogni x. Le immersioni fx : [0, x] → Y (uniche per il
Corollario A.1.23) definiscono un’immersione di X in un segmento iniziale di Y .


Il Teorema A.1.26 dice che dati due ordinali α, β si ha α ≤ β o β ≤ α e si può quindi parafrasare
dicendo che la classe1 degli ordinali è totalmente ordinata.
Teorema A.1.27. La classe degli ordinali è ben ordinata.
D IMOSTRAZIONE . Sia A una classe di ordinali e sia α ∈ A. Gli elementi di A minori di α non sono
altro che classi di equivalenza di ordini di segmenti iniziali [0, x) di α. Ad ogni segmento iniziale [0, x)
corrisponde il suo estremo superiore x. Quindi l’insieme degli elementi di A minori di α corrisponde
a un sottoinsieme di α. Siccome α è bene ordinato, ha un minimo. Tale minimo è ovviamente il
minimo di A. 

Dato un ordinale si può quindi definire il suo successore come il più piccolo ordinale maggiore
di esso. Gli ordinali sono di tre tipi, come gli elementi



 0=∅ lo zero, l’ordinale più piccolo

successore X è successore, se esiste Y : X = s(Y ), se e solo se X ha un massimo


 limite

X è limite, se non è successore né vuoto

1Si è volutamente usata la parola “classe” al posto di “insieme” perché in genere “l’insieme” degli ordinali è troppo grosso
per essere catalogato come insieme senza incorrere in paradossi di tipo Russell.
A.2. GLI ORDINALI DI VON NEUMANN 193

A.2. Gli ordinali di Von Neumann


I fatti mostrati sinora suggeriscono che gli ordinali stiano uno dentro l’altro. Ebbene, si possono
scegliere dei rappresentanti canonici per i tipi d’ordine in modo che ciò sia effettivamente vero.
Definizione A.2.1 (Ordinali di Von Neumann). Un insieme X si dice ordinale di Von Neumann se
X ⊆ P(X) — cioè se ogni elemento di X è un sottoinsieme di X — e se la relazione di appartenenza
è un buon ordinamento su X.
Se un ordinale X di Von Neuman non è vuoto, allora contiene il vuoto come elemento: Infatti il
minimo X0 di X deve essere un sottoinsieme di X, quindi gli elementi di X0 sono elementi anche
di X, ma siccome l’ordine è dato dall’appartenenza, allora se x ∈ X0 si ha x ∈ X e x < X0 , quindi
X0 non sarebbe minimo. Se ne deduce che X0 non ha elementi. Gli ordinali di Von Neumann sono i
seguenti:

 0=∅




1 = {0} = {∅}






2 = {0, 1} = {∅, {∅}}






3 = {0, 1, 2} = {∅, {∅}, {∅, {∅}} }





 .
..


ω = {0, 1, 2, 3, 4, . . . } = {∅, {∅, {∅}}, {∅, {∅}, {∅, {∅}} }, . . . }






ω + 1 = ω ∪ {ω} = {∅, {∅, {∅}}, {∅, {∅}, {∅, {∅}} }, . . . , ω}






ω + 2 = ω + 1 ∪ {ω + 1} = ω ∪ {ω} ∪ {ω ∪ {ω}} = {∅, {∅, {∅}}, {∅, {∅}, {∅, {∅}} }, . . . , ω, ω ∪ {ω}}





 ...


e in generale 


 0=∅

α + 1 = α ∪ {α} = {γ ≤ α} = {γ < α + 1}


 ∀α limite si ha α = ∪
γ<α γ = {γ < α}

In particolare, ogni ordinale di Von Neumann è esattamente l’insieme dei suoi predecessori. Data una
famiglia di ordinali F = {γi }i∈I esiste sempre l’estremo superiore, detto anche limite dei γi
lim γi = sup F = ∪i γi .
i

Esempio A.2.2. Per come è definito, ω è il tipo d’ordine di N. Esso è il limite (o il sup, o l’unione)
degli ordinali finiti.
1
Esempio A.2.3. Il tipo d’ordine di {k − 1+n , n ∈ N, k = 1, 2} è ω + ω. Esso è il limite degli ordinali
ω + n.
Esempio A.2.4. Il tipo d’ordine dell’Esempio A.1.13 è ω + ω + ω + . . . .
Teorema A.2.5. Ogni ordinale ha uno e un solo rappresentante di Von Neumann.
D IMOSTRAZIONE . Procediamo per induzione transfinita. Il vuoto è un ordinale di Von Neu-
mann. Se X è di Von Neumann allora X ∪ {X}, che ha il tipo d’ordine di X + 1, è di Von Neumann.
Se ogni Y < X ha un rappresentante YV N di Von Neumann, allora l’unione
[
YV N
Y <X
194 A. MINICORSO DI ARITMENTICA ORDINALE

è di Von Neumann ed ha il tipo d’ordine di X. L’unicità segue dal fatto che due ordinali di Von
Neumann diversi stanno uno dentro l’altro e quindi hanno tipo d’ordine diverso. 

Possiamo quindi identificare gli ordinali con gli ordinali di Von Neumann. Il fatto che gli ordinali
siano ben ordinati ci permette, per ogni proprietà P , di trovare il più piccolo ordinale con tale pro-
prietà, che non è altro che il minimo degli elementi con P . Per esempio ω è il primo ordinale limite, il
più piccolo ordinale non numerabile si chiama ω1 , il primo ordinale di cardinalità maggiore di ω1 si
chiama ω2 (e si può continuare).
Definizione A.2.6. Un ordinale cardinale è il più piccolo ordinale della sua classe di cardinalità.
Esempio A.2.7. ω1 è un cardinale. Sia ω che ω + 1 sono numerabili, ma solo ω è cardinale.

A.3. Aritmetica ordinale


Se non specificato, useremo sempre gli ordinali di Von Neumann.
Definizione A.3.1 (Somma). Dati α, β ordinali, si definisce la somma α + β come il tipo d’ordine
su α t β 


 z ∈ α, w ∈ β

z<w⇔ z, w ∈ α, z < w


 s, w ∈ β, z < w

in parole povere, si mette β dopo α.


Il successore di α è quindi α + 1, coerentemente con la notazione usata finora, ed è costrui-
to aggiungendo ad α un elemento dichiarato più grande di tutti gli altri, che negli ordinali di Von
Neumann è α stesso. Si noti che la somma tra ordinali non è commutativa:
1 + ω = ω 6= ω + 1.
Esercizio A.3.2. Dimostrare che 1 + ω = ω.
Esercizio A.3.3. Dimostrare che la somma è associativa. Per ogni α, β, γ si ha (α + β) + γ =
α + (β + γ) che coincide col tipo d’ordine sull’unione disgiunta di α, β, γ con α prima di β prima di
γ. Si possono quindi omettere le parentesi e scrivere α + β + γ.
Su un prodotto X × Y abbiamo visto l’ordine lessicografico. Per definire il prodotto tra ordinali
è comodo usare l’ordine antilessicografico, cioè il lessicografico di Y × X.
Esercizio A.3.4. Dimmostrare che se X e Y sono ben ordinati allora l’ordine antilessicografico è
un buon ordine su X × Y .
Definizione A.3.5 (Prodotto). Dati due ordinali α, β si definisce αβ come il tipo d’ordine di α × β
con l’ordine antilessicografico (o se si preferisce, il tipo d’ordine di β × α con l’ordine lessicografico).
In soldoni, per fare αβ si prendono β copie di α e si mettono “una dopo l’altra seguendo l’ordine
di β” (l’ordine antilessicografico questo fa). Per esempio ωω = ω + ω + ω + . . . “ω volte”. Come la
somma, nemmeno il prodotto tra ordinali è commutativo:
2ω = ω 6= ω2 = ω + ω.
Esercizio A.3.6. Dimostrare che 2ω = ω e ω2 = ω + ω.
Teorema A.3.7. Per ogni α, β ordinali si ha



 α0 = 0 caso β = 0

αβ = α(β + 1) = αβ + α caso successore


 ∪

αγ caso limite
γ<β
A.4. ESERCIZI 195

D IMOSTRAZIONE . Siano α e β ordinali. Il prodotto tra un insieme e il vuoto è vuoto, quindi


α0 = 0. α(β + 1) è l’ordine antilessicografico su α × (β ∪ {β}) che per definizione è uguale all’ordine
antilessicografico di α × β seguito da l’ordine di α × {β}, cioè l’ordine di αβ + α.
Vediamo il caso limite. Siccome β = {γ < β}, allora α × β = {α × γ : γ < β} e dunque il
tipo d’ordine di α × β coll’antilessicografico è maggiore di αγ per ogni γ < β. D’altronde, ogni
ordinale η che sia minore di αβ è un segmento iniziale di αβ e quindi è realizzato dal tipo d’ordine
di {ξ ∈ α × β : ξ < (x, γ)} per certi x ∈ α, γ ∈ β. In particolare η < α × (γ + 1). Siccome β è limite e
γ < β, anche γ + 1 < β. Quindi αβ è il più piccolo ordinale maggiore di tutti gli αγ con γ < β, cioè
αβ = limγ<β αβ. 

Esercizio A.3.8. Dimostrare che il prodotto è associativo. Per ogni α, β, γ si ha (αβ)γ = α(βγ) che
coincide col tipo d’ordine antilessicografico su α × β × γ. Si possono quindi omettere le parentesi e
scrivere αβγ.
Per la potenza bisogna stare un po’ attenti perché i prodotti infiniti non sono ben ordinati antiles-
sicograficamente di suo. (Cos’è l’ordine antilessicografico su un prodotto infinito?) È comodo quindi
dare direttamente una definizione per induzione.
Definizione A.3.9. Per ogni α, β ordinali si pone

 α0 = 1

 caso β = 0

β (β+1) β
α = α = α α caso successore


 ∪ γ
caso limite

γ<β α

Esempio A.3.10. 2ω = ∪n 2n = ω. (Da questo esempio si evince in particolare che l’aritmetica


ordinale è differente da quella cardinale dove 2X ha sempre cardinalità maggiore di X. Si veda anche
l’Esercizio A.4.18, da cui si deduce che 2ω è il tipo d’ordine di un’ordine sull’insieme dei sottoinsiemi
finiti di ω, che ha cardinalità numerabile).
Esempio A.3.11. 2ω+1 = 2ω 21 = ω2 = ω + ω.
Esempio A.3.12. ωω = ω 2 6= 2ω . Infatti ω 2 = ωω = limn ωn = ω + ω + ω + . . . contiene un elemento
limite (per esempio ω) mentre tutti gli elementi di 2ω = ω sono successori. (Si noi che 2ω = ω < ω 2 ).

A.4. Esercizi
Esercizio A.4.1. Dimostrare che l’insieme Z con l’ordine



 0 ≤ x < y per l’ordine naturale di Z

x<y⇔ y < x < 0 per l’ordine naturale di Z


 y < 0 ≤ x per l’ordine naturale di Z

è ben ordinato. Che tipo d’ordine è?


Esercizio A.4.2. Sia X un insieme ben ordinato e sia Y ⊆ X. Dimostrare che [Y ] ≤ [X].
Esercizio A.4.3. Dimostrare che la somma tra ordinali può essere definita per induzione transfinita
come 


 α+0=α

α + (β + 1) = (α + β) + 1


 α+β =∪

α + γ per ordinali limite
γ<β
196 A. MINICORSO DI ARITMENTICA ORDINALE

Esercizio A.4.4. Dimostrare che la somma tra ordinali è monotona a destra:


β<γ ⇒ α + β < α + γ.
Esercizio A.4.5. Dimostrare che la somma tra ordinali è debolmente monotona a sinistra.
Esercizio A.4.6. Dimostrare con un esempio che in genere la somma tra ordinali non è strettamente
monotona a sinistra.
Esercizio A.4.7. Dimostrare che per la somma tra ordinali vale la legge di cancellazione a sinistra
α+β =α+γ ⇒ β = γ.
Esercizio A.4.8. Dimostrare con un esempio che in genere la somma tra ordinali non gode della
legge di cancellazione a destra.
Esercizio A.4.9. Dimostrare la proprietà distributiva a sinistra tra somma e prodotto di ordinali:
α(β + γ) = αβ + αγ.
Esercizio A.4.10. Dimostrare che 0α = 0.
Esercizio A.4.11. Dimostrare che 1α = α1 = α.
Esercizio A.4.12. Dimostrare che il prodotto di ordinali è strettamente monotono a destra: se α 6= 0
allora
β < γ ⇒ αβ < αγ.
Esercizio A.4.13. Dimostrare che il prodotto di ordinali è debolmente, e in genere non strettamen-
te, monotono a sinistra: se α 6= 0 allora
β<γ ⇒ βα ≤ γα.
Esercizio A.4.14. Dimostrare che il prodotto tra ordinali gode della cancellazione a sinistra:
α 6= 0 e αβ = αγ ⇒ β = γ.
Esercizio A.4.15. Dimostrare con un esempio che in genere il prodotto non gode della cancellazio-
ne a destra.
Esercizio A.4.16. Dimostrare che gli ordinali non hanno divisori dello zero:
αβ = 0 ⇒ (α = 0) oppure (β = 0).
Esercizio A.4.17. Dimostrare che per gli ordinali vale una regola di divisione con resto (dalla parte
giusta). Per ogni ordinale α, per ogni ordinale β 6= 0 esistono unici γ e δ < β ordinali tali che
α = βγ + δ.
Esercizio A.4.18. Dimostrare che, se α = [A] e β = [B] allora αβ è il tipo d’ordine di
{f : B → A : f (b) 6= 0 solo per un numero finito di elementi}
con l’ordine anti-lessicografico di AB visto come il prodotto di B copie di A.
Esercizio A.4.19. Dimostrare la regola ordinata delle potenze tra ordinali
αβ+γ = αβ αγ .
Esercizio A.4.20. Dimostrare che ω + 1 con la topologia dell’ordine è omeomorfo (anche se non
1
isomorfo come tipo d’ordine) al sottoinsieme di R definito da { n+1 : n ∈ N}∪{0} (si noti quest’ultimo
non è ben ordinato dall’ordine indotto da R).
Esercizio A.4.21. Dimostrare che ω 2 = ωω = ω + ω + ω + . . . con la topologia dell’ordine il
1
sottoinsieme di R definito da {k − n+1 : k, n ∈ N} sono omeomorfi.
A.4. ESERCIZI 197

Esercizio A.4.22. Dimostrare che ω1 con la topologia dell’ordine e R Euclideo non sono omeomorfi.
Esercizio A.4.23. Dimostrare che ω1 e ω1 + ω1 non sono omeomorfi.
Esercizio A.4.24. Dimostrare che ω e ω + 1 non sono omeomorfi.
Esercizio A.4.25. Dimostrare che 1 + ω e ω + 1 non sono omeomorfi.
Esercizio A.4.26. Dimostrare che ω + 1 e ω + 2 sono omeomorfi.
Esercizio A.4.27. Dimostrare che ω + 1 e ω + ω non sono omeomorfi.
Esercizio A.4.28. Dimostrare che ω + ω e ω + ω + ω non sono omeomorfi.
Esercizio A.4.29. Dimostrare che ω1 è compatto per successioni ma non è compatto.
Esercizio A.4.30. Dimostrare che ω1 non è omeomorfo a nessun suo elemento.
APPENDICE B

Successioni generalizzate

Le successioni usuali sono indicizzate con N, ma nulla osta che si usino insiemi ordinati più gene-
rali. Una delle proprietà principali di N nella teoria delle successioni è che dato n ∈ N, esiste sempre
m > n. Una successione (xi ) a valori in X può essere definita come una famiglia di punti indiciz-
zati da N o più semplicemente come una funzione x : N → X. Questi concetti possono essere estesi
considerando insiemi di indici più generali di N. Una volta introdotte le successioni generalizzate,
che sono apparentemente più complicate delle successioni usuali, avremo l’indubbio vantaggio di
semplificare molte dimostrazioni e di avere teoremi che non richiedono ipotesi di numerabilità.

B.1. Insiemi diretti e successioni generalizzate


Definizione B.1.1. Un insieme diretto (Definizione 1.3.9) è un insieme parzialmente ordinato
(I, ≤) tale che
∀x, y ∈ I ∃z ∈ I : z ≥ x, z ≥ y.
Esempio B.1.2. Un filtro è un insieme diretto. Se X è uno spazio topologico e x ∈ X, il filtro I(x)
degli intorni di x è un insieme diretto.
Esempio B.1.3. Un insieme totalmente ordinato è un insieme diretto, in particolare gli ordinali lo
sono.
Definizione B.1.4. Sia I un insieme diretto. Un sottoinsieme J ⊆ I si dice cofinale in I se per
ogni x ∈ I esiste y ∈ J tale che y ≥ x.
Esempio B.1.5. Ogni sistema fondamentale di intorni di x è cofinale nel filtro degli intorni di x.
Definizione B.1.6. Una successione generalizzata a valori in un insieme X è una una funzione da
un insieme diretto I a X. Equivalentemente, una successione generalizzata può essere descritta come
una famiglia (xi )i∈I di punti di X, indicizzata da un insieme diretto. Una successione generalizzata
indicizzata con I, si chiama anche I-successione.
È opportuno sapere che nella letteratura inglese, le successioni generalizzate si chiamano usual-
mente net. Non useremo questa terminologia per non confonderle con gli ε-net usati negli spazi
metrici.
Esempio B.1.7. Se X è uno spazio topologico e x ∈ X, considerando I come l’insieme degli intorni
di x, se per ogni A ∈ I si sceglie xA ∈ A otteniamo una successione generalizzata a valori in X.
I concetti di definitivamente e frequentemente si danno per le successioni generalizzate attraverso il
concetto di cofinalità.
Definizione B.1.8. Sia I un insieme diretto e sia (xi )i∈I una successione generalizzata. Sia P una
proprietà dipendente da i. Si dice che P vale definitivamente in I se esiste i0 ∈ I tale che P (i) è vera
per ogni i ≥ i0 . Si dice che P vale frequentemente in I se l’insieme degli indici i tale che P (i) è vera
è cofinale in I.
Esempio B.1.9. È di facile verifica che non definitivamente P equivale a frequentemente non P e
viceversa.
199
200 B. SUCCESSIONI GENERALIZZATE

Definizione B.1.10. Un ordinale α si dice cofinale in un insieme diretto X se esiste una α-successione
cofinale in X. La cofinalità di X, denotata con cof(X), è il più piccolo ordinale cofinale in X.
Esempio B.1.11. n è cofinale in ω + 1 per ogni n ∈ ω. La cofinalità di ω + 1 è 1.
Esempio B.1.12. n è cofinale in ω + 2 per ogni n ∈ ω. La cofinalità di ω + 2 è 1.
Esempio B.1.13. Se α ha un massimo (cioè se è un successore) allora ha cofinalità 1.
Esempio B.1.14. ω + ω ha cofinalità ω.
Teorema B.1.15. ω1 ha cofinalità non numerabile.
D IMOSTRAZIONE . Ricordiamo che ω1 è il più piccolo ordinale non numerabile. Consideriamo un
ordinale numerabile α e una α-successione xi in ω1 . Poniamo Xi = [0, xi ) < ω1 . Siccome ω1 è il primo
ordinale non numerabile, tutti gli Xi sono numerabili. Se (xi )i∈α fosse cofinale in ω1 si avrebbe
[
Xi = ω1
i∈α

e quindi avremmo ottenuto ω1 come unione numerabile di numerabili, il che lo renderebbe numera-
bile. 
Corollario B.1.16. cof(ω1 ) = ω1 .
D IMOSTRAZIONE . Ovviamente ω1 è cofinale in ω1 ed essendo lui il primo non numerabile, visto
che cof(ω1 ) non è numerabile, si ha cof(ω1 ) = ω1 . 
La cofinalità non è però una questione di cardinalità, ma di come “finisce” un ordinale:
Esempio B.1.17. ω1 + ω ha cofinalità ω.
Esempio B.1.18. ω1 + ω + 1 ha cofinalità 1.

B.2. Convergenza di successioni generalizzate e continuità


Definizione B.2.1 (α-successioni convergenti). Sia (X, τ ) uno spazio topologico e sia x ∈ X. Sia
α un insieme diretto e sia (xi )i∈α una α-successione in X. Si dice che
xi → x
se per ogni intorno A di x si ha xj ∈ A, definitivamente in α.
Come nel caso classico, negli spazi T2 c’è unicità del limite.
Teorema B.2.2 (Teorema 1.5.8 generalizzato). Sia X uno spazio topologico e sia A ⊆ X. Allora x ∈ X
è un punto di aderenza di A se e solo se è il limite di una successione generalizzata in A.
D IMOSTRAZIONE . Se x è il limite di una α-successione (ai )i∈α ⊆ A allora non è interno ad Ac e
quindi è di aderenza per A. Viceversa, sia x ∈ Ā. Sia I = I(x) il filtro degli intorni di x (che è un
insieme diretto). Per ogni U ∈ I esiste aU ∈ U ∩ A. La successione generalizzata (aU )U ∈I converge a
x. 
Se I ha un massimo allora xi → x ∈ R se e solo se xmax = x. In generale, la convergenza di
successioni generalizzate si può interpretare come una continuità all’infinito.
Teorema B.2.3. Sia I un insieme diretto senza massimo. Consideriamo I ∪{∞} con la seguente topologia.
Su I mettiamo la discreta e dichiariamo intorni di ∞ gli insiemi del tipo Vi0 = {i ∈ I : i > i0 }, al variare di
i0 in I (ciò definisce una topologia per il Teorema 1.3.16).
Allora una I-successione (xi )i∈I a valori in uno spazio topologico X converge a x ∈ X se e solo se (xi ) è
continua all’infinito, cioè se la funzione
i 7→ xi ∞ 7→ x
è continua da I ∪ {∞} in X.
B.3. SOTTOSUCCESSIONI GENERALIZZATE E COMPATTEZZA 201

D IMOSTRAZIONE . (xi ) è continua all’infinito se e solo se per ogni intorno A di x la sua preimma-
gine è un intorno di infinito, se e solo se xi ∈ A definitivamente. Avendo messo la topologia discreta
su I, se (xi ) è continua all’infinito, è continua ovunque. 
In particolare abbiamo che la nozione di convergenza generalizzata si mantiene per composizione
con funzioni continue.
Teorema B.2.4. Sia (X, τ ) uno spazio topologico e sia A ⊆ X. Un punto x ∈ A è interno se e solo se per
ogni insieme diretto α, se (xi )i∈α è una α-successione convergente a x allora xi ∈ A definitivamente.
In particolare A è aperto se e solo se per ogni x ∈ A e per ogni insieme diretto α, se (xi )i∈α è una
α-successione convergente a x allora xi ∈ A definitivamente .
D IMOSTRAZIONE . Dire che x è interno ad A è equivalente per definizione a dire che A è un
intorno di x. Se xi → x ∈ A e A è un intorno di x allora per definizione di convergenza xi ∈ A
definivamente. Viceversa, supponiamo che A non sia un intorno di x, cioè x non è interno ad A. Sia
I = F(x) il filtro degli intorni di x.
Per ogni B ∈ I esiste xB ∈ B∩Ac perché x non è interno ad A. La I-successione (xB )B∈I converge
a x: per ogni intorno U di x, per ogni B > U si ha xB ∈ B ⊂ U ; quindi xB ∈ U definitivamente in
I. Quindi se A non è un intorno di x abbiamo trovato una successione xB che converge a x ma
xB ∈/ A. 
Il seguente teorema ci dice che, se paghiamo il prezzo di passare alle successioni generalizzate, la
nozione di continuità topologica coincide con l’usuale definizione di continuità metrica.
Teorema B.2.5 (Continuità per α-successioni). Siano (X, τ ) e (Y, σ) due spazi topologici. Una funzio-
ne f : X → Y è continua in x ∈ X se e solo se per ogni insieme diretto α e per ogni α-successione (xi )i∈α che
converge a x si ha f (xi ) → f (x).
D IMOSTRAZIONE . Supponiamo f continua in x e sia xi → x un’α-successione. Per ogni intorno
A di f (x) si ha che f −1 (A) è un intorno di x e quindi x è interno a f −1 (A). Per il Teorema B.2.4 la suc-
cessione xi sta in f −1 (A) definitivamente in α e quindi la successione f (xi ) sta in A definitivamente
in α. Quindi f (xi ) → x.
Viceversa, se f non è continua in x, esiste un intorno A di f (x) tale che f −1 (A) non è un intorno
di x. Per il Teorema B.2.4 esiste un insieme diretto β e una β-successione xi tale che xi → x e xi ∈
(f −1 (A))c . Per cui f (xi ) ∈
/ A mentre f (x) ∈ A. Dunque
f (xi ) 6→ f (x).

Teorema B.2.6. Sia X = Πi Xi il prodotto di una famiglia di spazi topologici. Una successione generaliz-
zata in X converge se e solo se convergono le sue proiezioni.
D IMOSTRAZIONE . Segue immediatamente dai teoremi B.2.3 e 2.1.15. 

B.3. Sottosuccessioni generalizzate e compattezza


Vediamo ora come le successioni generalizzate possano essere usate per riconoscere la compat-
tezza. Per comodità d’uso nelle dimostrazioni, si introduce una nozione di sottosuccessione legger-
mente controintuitiva. Una sottosuccessione nel senso classico sarebbe semplicemente la restrizione
dell’insieme degli indici a un sottoinsieme diretto cofinale. Questo però non permette di lavorare
agevolmente. La definizione che daremo ha il pregio di trasformare tutte le dimostrazioni come se gli
spazi fossero localmente numerabili.
Definizione B.3.1. Siano I, J insiemi diretti. Una funzione f : J → I si dice monotona se ∀j ≥
k ⇒ f (j) ≥ f (k); si dice finale se l’immagine di f è cofinale in I.
202 B. SUCCESSIONI GENERALIZZATE

Esempio B.3.2. Una funzione costante f : I → N è monotona ma non finale.


Esempio B.3.3. Se J ⊆ I è cofinale allora l’inclusione è monotona e finale.
Esempio B.3.4. Sia I un insieme diretto qualsiasi. Su α = I × N mettiamo l’ordine prodotto (cioè
(i, n) ≥ (j, m) se e solo se i ≥ j e n ≥ m). In questo modo α è un insieme diretto perché dati (i, n) e
(j, m) esiste sempre k ∈ I maggiore di i, j; ergo l’elemento (k, n + m) è maggiore di entrambi (i, n) e
(j, m). La funzione f : α → N data da f (i, n) = n è monotona e finale.
Quest’esempio si può interpretare come un procedimento diagonale generalizzato. Infatti I × N
si può interpretare come un insieme che indicizza una I-successione di successioni e l’ordine prodotto
che ci abbiamo messo rende possibile l’estrazione di successioni generalizzate a partire da una I-
successione di successioni.
Definizione B.3.5. Sia (xi )i∈I una I-successione generalizzata a valori in X. Una sottosuccessio-
ne generalizzata di (xi ) è una sua pre-successione, cioè una successione generalizzata ottenuta per
pre-composizione con una funzione monotona e finale J → I.
In altre parole, una sottosuccessione generalizzata di (xi ) è una J-successione generalizzata (yj )j∈J ,
ove J è un insieme diretto, tale che esista una funzione monotona e finale f : J → I tale che
yj = xf (j) .
Esempio B.3.6. Se (xi )i∈I è una I-successione e J ⊆ I è un sottoinsieme diretto cofinale, allora
(xj )j∈J è una sottosuccessione di (xi ). In altre parole, le sottosuccessioni nel senso classico sono
sottosuccessioni generalizzate.
Si noti però che le sottosuccessioni generalizzate non sono semplicemente sottoinsiemi cofinali.
In particolare, l’Esempio B.3.4 mostra che l’insieme degli indici di una sottosuccessione generalizzata
potrebbe avere cardinalità qualsiasi.
Teorema B.3.7. Sia X uno spazio topologico e sia (xi )i∈I una successione generalizzata in X. Allora essa
converge se e solo se tutte le sue sottosuccessioni generalizzate convergono.
D IMOSTRAZIONE . Supponiamo che xi → x. Sia J un insieme diretto e f : J → I una funzione
monotona e finale. Per ogni intorno A di x esiste i0 ∈ I tale che xi ∈ A per ogni i ≥ i0 . Per finalità
esiste j0 ∈ J tale che f (j0 ) ≥ i0 . Per monotonia per ogni j ≥ j0 si ha f (j) ≥ f (j0 ) ≥ i0 . Quindi per
ogni j ≥ j0 si ha xf (j) ∈ A. Il viceversa è ovvio perché (xi ) è una sottosuccessione di sé stessa. 

Le definizioni di punto limite e punto di ricorrenza per successioni generalizzate (xi )i∈I si danno
esattamente come nel caso classico:
• x è un punto di ricorrenza di (xi ) se per ogni intorno U di x, la successione xi sta frequente-
mente in U (cioè se per ogni i0 esiste j > i0 con xj ∈ U ).
• x è un punto limite di (xi ) se esiste una sottosuccessione generalizzata (xf (j) ) che converge
a x.
Teorema B.3.8 (Teorema 3.4.6 generalizzato). Sia X uno spazio topologico e sia (xi )i∈I una successione
generalizzata a valori in X. Allora x ∈ X è un punto di ricorrenza di (xi )i∈I se e solo se è limite di una sua
sottosuccessione generalizzata.
D IMOSTRAZIONE . Se x è un punto limite di una sottosuccessione generalizzata di (xi ) allora
è immediato verificare che è un punto di ricorrenza di (xi ). Viceversa, supponiamo che x sia di
ricorrenza per (xi ). Definiamo J come l’insieme delle coppie (U, i) ove U è un intorno di x e i ∈ I è
tale che xi ∈ U . Come nell’Esempio B.3.4 rendiamo J un insieme diretto ponendo (U, i) ≥ (V, k) se e
solo se
U ⊆V e i ≥ k.
B.4. FILTRI, CONVERGENZA E CONTINUITÀ 203

La funzione f : J → I data da f (U, i) = i è monotona per come abbiamo definito l’ordine ed è finale
perché x è un punto di ricorrenza di (xi ).
La J-successione generalizzata yj = xf (j) è dunque una sottosuccessione generalizzata di (xi ).
Vediamo che converge a x. Per ogni intorno U di x, esiste i ∈ I tale che xi ∈ U perché x è di ricorrenza
per (xi ). D’altronde, per ogni j = (V, k) ≥ (U, i) si ha
yj = xf (j) = xk ∈ V ⊆ U
dunque yj ∈ U definitivamente. Quindi yj → x. 
Questo teorema è la chiave per riscrivere tutte le dimostrazioni che hanno a che fare con aperti e
chiusi in salsa successioni generalizzate. Si noti in particolare che la nozione di punto di ricorrenza e
punto limite diventano equivalenti per le successioni generalizzate.
Definizione B.3.9. Uno spazio topologico X si dice compatto per successioni generalizzate se
ogni successione generalizzata in X ha una sottosuccessione generalizzata convergente.
Teorema B.3.10 (Teorema 3.4.9 generalizzato). Uno spazio topologico X è compatto se e solo se è
compatto per successioni generalizzate.
D IMOSTRAZIONE . Mostriamo prima che se X non è compatto allora non è compatto per succes-
sioni generalizzate. Sia U = {Uα } un ricoprimento aperto di X che non ammette un sottoricoprimento
finito. Sia I l’insieme delle unioni finite di elementi di U, ordinato per inclusione. Chiaramente I è un
insieme diretto perché se A, B ∈ I allora A∪B ∈ I e A∪B ≥ A, B. Siccome U non ha sottoricoprimen-
ti finiti, per ogni i ∈ I esiste xi ∈
/ i. Anche se la notazione è un po’ strana, non sta succedendo nulla
di strano: stiamo usando come insieme di indici per una successione una famiglia I di sottoinsiemi.
Quindi ha senso dire xi ∈ / i. Sia J un qualsiasi insieme diretto e f : J → I una funzione monotona e
finale. Consideriamo la sottosuccessione generalizzata yj = xf (j) .
Sia x ∈ X e sia Uα ∈ U tale che x ∈ Uα . Per ogni j ∈ J l’insieme f (j) ∪ Uα è un elemento di
I in quanto unione finita di elementi di U. Per finalità esiste k ∈ J tale che f (k) ≥ f (j) ∪ Uα e, per
monotonia, per ogni n ≥ k in J si ha
yn = xf (n) ∈
/ f (n) ⊇ f (k) ⊇ j ∩ Uα
in particolare
∃k ∈ J : ∀n ≥ k : yn ∈
/ Uα
e dunque la sottosuccessione generalizzata (yj )j∈J non converge a x. Siccome ciò vale per ogni x, la
sottosuccessione (yj )j∈J non converge a nessun limite. Siccome ciò vale per ogni J, la successione
iniziale (xi )i∈I non ha sottosuccessioni generalizzate convergenti.
Viceversa, supponiamo X compatto e sia (xi )i∈I una successione generalizzata. Esattamente
come nel Teorema 3.4.7, si mostra che essa ha un punto di ricorrenza. Per il Teorema B.3.8 tale punto
è un punto limite di una sottosuccessione generalizzata di (xi ) che quindi ha una sottosuccessione
generalizzata convergente. 
O SSERVAZIONE B.3.11. Il Teorema B.3.10 può sembrare l’uovo di Colombo. Si deve però stare
attenti a questioni di cardinalità. Per esempio, in teoria della misura, la numerabilità di molti processi
è fondamentale e le successioni generalizzate perdono questa caratteristica.

B.4. Filtri, convergenza e continuità


Vediamo adesso un’ulteriore generalizzazione del concetto di successione convergente. Quando
diciamo che xn → x in realtà siamo intrinsecamente interessati alla proprietà del filtro degli intorni
di x. In un certo senso possiamo dire che il filtro degli intorni di x converge a x. Vediamo come questo
punto di vista può essere usato in modo potente, per esempio per dare una dimostrazione cristallina
del Teorema di Tychonoff (Teorema 3.3.3). In questa sezione parleremo di filtri in e filtri su insiemi.
204 B. SUCCESSIONI GENERALIZZATE

Definizione B.4.1 (Definizione 1.3.5). Dato un insieme X, un filtro di sottoinsiemi di X, o filtro


su X, è una famiglia non vuota F ( P(X) chiusa per intersezione e passaggio a soprainsiemi:
∀A, B ∈ F si ha A ∩ B ∈ F ∀A ⊆ B, (A ∈ F) ⇒ (B ∈ F).
Un filtro in X è un filtro su un sottoinsieme di X, detto supporto di F.
Si noti che la chiusura per soprainsiemi implica X ∈ F, mentre la condizione F 6= P(X) implica
che ∅ ∈/ F. Inoltre se A ∩ B = ∅ allora al più uno dei due sta in F. In particolare, per ogni A, al
massimo uno tra A ed Ac può stare in F.
Esempio B.4.2 (Il filtro delle code). Sia (xn )n∈N ∈ X una successione. Sia A ⊆ X l’immagine di
(xn ), cioè A = {xn : n ∈ N}. L’insieme F = {C ⊆ A : ∃n ∈ N : ∀m ≥ n, xm ∈ C} = {C ⊆ A tale che
xn ∈ C definitivamente} è un filtro su A e quindi in X, detto filtro delle code di (xn ). La stessa cosa
vale per le successioni generalizzate.
Lemma B.4.3. Se F è un filtro in X e f : X → Y è una funzione qualsiasi, allora f (F) = {f (A) : A ∈
F} è un filtro in Y .
D IMOSTRAZIONE . Sia Z ⊆ X il supporto di F e sia W = f (Z). Chiaramente f (F) ⊆ P(W ).
Quindi, a meno di restringere f a una funzione da Z a W , ci basta dimostrare che se F è un filtro su
X e f è suriettiva allora f (F) è un filtro su Y .
Siano A, B ∈ f (F). Per definizione esiste U ∈ F tale che f (U ) = A. Siccome F è un filtro e
f −1 (f (U )) ⊇ U , si ha f −1 (A) ∈ F; similmente f −1 (B) ∈ F. Quindi (f −1 (A) ∩ f −1 (B)) ∈ F e dunque
A ∩ B = f (f −1 (A) ∩ f −1 (B)) ∈ f (F).
Se C ⊇ A, allora f −1 (C) ⊇ f −1 (A) ∈ F e dunque C = f (f −1 (C)) ∈ f (F). Siccome F 6= ∅ allora
f (F) 6= ∅ e siccome ∅ ∈
/ F, per ogni A ∈ F, f (A) 6= ∅ e quindi ∅ ∈
/ f (F). 
Definizione B.4.4 (Convergenza di filtri). Sia X uno spazio topologico e sia F un filtro in X. Si
dice che F converge a x ∈ X, usando l’usuale notazione
F →x
se per ogni intorno U di x esiste A ∈ F tale che A ⊆ U . Se F → x il punto x si dice limite di F.
Esempio B.4.5. Come anticipato, se I(x) è il filtro degli intorni di x, allora I(x) → x.
Esempio B.4.6. Se (xn ) è una successione (generalizzata) in X, allora xn → x se e solo se il filtro
delle sue code converge a x.
Siccome un filtro è chiuso per intersezione e non contiene il vuoto, negli spazi T2 il limite di filtri
se c’è è unico. Come per le successioni.
Teorema B.4.7 (Teoremi 1.5.8 e B.2.2 versione filtri). Sia X uno spazio topologico e sia A ⊆ X. Allora
x ∈ X è un punto di aderenza di A se e solo se è il limite di un filtro in A.
D IMOSTRAZIONE . Se x è il limite di un filtro in A allora è immediato verificare che x ∈ Ā. Vice-
versa, se x ∈ Ā allora per il Teorema B.2.2 esso è limite di una successione generalizzata e dunque del
filtro delle sue code. 
Teorema B.4.8. Una funzione f : X → Y tra spazi topologici è continua se e solo se per ogni filtro in X
si ha
F →x ⇒ f (F) → f (x).
D IMOSTRAZIONE . Se f è continua e F → x, allora per ogni intorno A di f (x), f −1 (A) è un intorno
di x e quindi esiste U ∈ F con U ⊆ f −1 (A). Quindi f (U ) ⊆ A e f (U ) ∈ f (F). Quindi f (F) → f (x).
Viceversa, se f non è continua allora esiste una successione generalizzata xi → x con f (xi ) 6→ f (x)
(Teorema B.2.5). Il filtro delle sue code è un filtro F → x tale che f (F) 6→ f (x). 
B.5. ULTRAFILTRI E COMPATTEZZA 205

B.5. Ultrafiltri e compattezza


Lemma B.5.1. Intersezioni di filtri su X è un filtro su X.
D IMOSTRAZIONE . Siano F, G due filtri su X. Se A ∈ F e B ∈ G allora, per passaggio a soprain-
siemi, A ∪ B ∈ F ∩ G. Quindi F ∩ G 6= ∅. Se A, B ∈ F ∩ G allora A ∩ B ∈ F ∩ G e se A ∈ F ∩ G e B ⊇ A
allora B ∈ F ∩ G. Infine, siccome F ∩ G ⊆ F =6 P(X), allora F ∩ G = 6 P(X). 

Corollario B.5.2. Sia F = {Ai }i∈I una famiglia di sottoinsiemi di X. Se F ha la proprietà delle interse-
zioni finite (Definizione 3.3.1), allora F è contenuta in un filtro su X, il più piccolo dei quali si chiama filtro
generato da F.
D IMOSTRAZIONE . Si verifica immediatamente che la famiglia G dei soprainsiemi delle intersezio-
ni finite di elementi di F è un filtro (si noti che il vuoto non è un’intersezione finita per definizione,
ergo G 6= P(X)) ed è chiaramente contenuto in tutti i filtri contenenti F. 

Definizione B.5.3. Un ultrafiltro su X è un filtro F su X tale che per ogni A ⊆ X si ha


A∈F oppure Ac ∈ F.
Un ultrafiltro in X è un ultrafiltro F su un sottoinsieme di X, detto supporto di F.
Si noti che se un ultrafiltro contiene A ∪ B allora contiene almeno uno tra A e B (perché non
contiene (A ∪ B)c ). Tale condizione si estende ovviamente alle unioni finite.
Lemma B.5.4. Sia F un ultrafiltro in X e sia A ∈ F. Siano B1 , . . . , Bn ⊆ X tali che A ⊆ B1 ∪ · · · ∪ Bn .
Allora esiste Bi tale che
A ∩ Bi ∈ F.
D IMOSTRAZIONE . Siccome A = (A ∩ B1 ) ∪ ... ∪ (A ∩ Bn ) è un elemento di F, almeno uno degli
A ∩ Bi sta in F. 

Teorema B.5.5. Un filtro su X è un ultrafiltro se e solo se è massimale rispetto all’inclusione.


D IMOSTRAZIONE . Sia F un filtro che non è massimale. Quindi esiste un filtro G ⊃ F tale che
esista A ∈ G ma A ∈ / F. Siccome G è un filtro Ac ∈
/ G e siccome G ⊃ F allora Ac ∈
/ F. Siccome né A né
c
A stanno in F, esso non è un ultrafiltro.
Viceversa supponiamo che un filtro F non sia un ultrafiltro. Allora esiste A ∈ P(X) tale che
nessuno tra A e Ac sta in F. Siccome F contiene X, allora A e Ac sono entrambi non vuoti. Siccome
A∈ / F allora nessun sottoinsieme di A sta in F. Quindi ogni elemento di F interseca Ac . In particolare
G = F ∪ {Ac } soddisfa le ipotesi del Corollario B.5.2 e quindi è contenuto in un filtro, che contiene
strettamente F in quanto contiene Ac . Quindi F non è massimale. 

Corollario B.5.6. Ogni filtro su X è contenuto in un ultrafiltro. In particolare, gli ultrafiltri esistono.
D IMOSTRAZIONE . Sia F un filtro e sia M la famiglia dei filtri contenenti F, ordinata per inclusio-
ne. M è non vuota perché contiene almento F. Sia {Fi }i∈I una catena di filtri in M tale che Fi ⊆ Fj
se i ≤ j. L’unione degli Fi è un filtro. Quindi ogni catena in M ha un maggiorante. Per il Lemma di
Zorn, M ha un elemento massimale, che è un ultrafiltro per il Teorema B.5.5. 

Definizione B.5.7. Uno spazio topologico X si dice compatto per ultrafiltri se ogni ultrafiltro in
X converge.
Teorema B.5.8 (Teoremi 3.4.9 e B.3.10 versione ultrafiltri). Uno spazio topologico X è compatto se e
solo se è compatto per ultrafiltri.
206 B. SUCCESSIONI GENERALIZZATE

D IMOSTRAZIONE . Supponiamo X non compatto. Sia {Ci } una famiglia di chiusi con la proprietà
delle intersezioni finite (Definizione 3.3.1) tali che ∩i Ci = ∅. Sia F il filtro generato da {Ci } e sia G un
ultrafiltro contenente F. Per ogni x ∈ X esiste i tale che x ∈ / Ci . Siccome Ci è chiuso esiste un intorno
U di x tale che U ∩ Ci = ∅. Siccome Ci ∈ G e G è un filtro, nessun elemento di G può stare in U , in
particolar G 6→ x. Visto che ciò vale per ogni x, l’ultrafiltro G non converge.
Viceversa, supponiamo che G sia un ultrafiltro in X non convergente. Allora ogni x ∈ X ha un in-
torno aperto Ux che non contiene elementi di G. Per il Lemma B.5.4 nessuna unione finita degli Ux con-
tiene elementi di G. Siccome G non è vuoto, il ricoprimento {Ux }x∈X non ammette sottoricoprimenti
finiti. 
Lemma B.5.9. Se f : X → Y è una funzione e F un ultrafiltro in X, allora f (F) è un ultrafiltro in Y .
D IMOSTRAZIONE . Per il Lemma B.4.3 sappiamo già che f (F) è un filtro e a meno di restringerci
ai supporti possiamo supporre che F sia su X e che f sia suriettiva (e quindi f (F) è su Y ).
Sia A ⊂ Y . Allora Y = A ∪ Ac e quindi X = f −1 (A) ∪ f −1 (A)c . Siccome F è un ultrafiltro, uno
dei due sta in F. Quindi uno tra A e Ac sta in F. 
Teorema B.5.10 (Teorema di Tychonoff). Un prodotto qualsiasi di spazi compatti è compatto.
D IMOSTRAZIONE . Sia {Xi }i∈I una famiglia di spazi compatti e sia X = Πi Xi . Sia F un ultrafiltro
in X. Ogni proiezione Fi = πi (F) è un ultrafiltro in Xi . Siccome Xi è compatto Fi converge a xi ∈ Xi .
Sia x = (xi ) ∈ X e vediamo che F → x. Sia V un intorno di x. Per come è fatta la topologia prodotto
possiamo supporre che V sia della forma Πi Ui con Ui intorno di xi , diverso da Xi solo per un numero
finito di indici. Siano i1 , . . . , in tali indici. Siccome Fik → xik , esiste Aik ∈ Fik contenuto in Uik . Gli
insiemi πi−1k
(Aik ) sono elementi di F. Essendo in numero finito, la loro intersezione A è ancora un
elemento di F . Siccome Aik ⊆ Uik , si ha A ⊆ V . Quindi F → x. 

B.6. Ultralimiti di successioni classiche


Concludiamo con un’altra, un po’ bizzarra ma a volte comoda, generalizzazione del concetto di
convergenza. Questa volta non tenteremo di generalizzare oltre il concetto di successione, anzi trat-
teremo successioni classiche. Metteremo mano invece al concetto di limite. Attraverso un ultrafiltro
sugli indici, ci permetteremo di trattare ogni successione come una successione convergente. In un
certo senso sarà l’ultrafiltro a scegliere il limite.
Definizione B.6.1. Un filtro su X si dice principale se esiste x ∈ X tale che
F = {A ∈ P(X) : x ∈ A}
Si noti che un filtro principale è un ultrafiltro. Infatti dato A non vuoto, o A o il suo complemen-
tare contengono x.
Esempio B.6.2. Sia X un insieme infinito. La famiglia degli insiemi cofiniti è un filtro su X che non
è principale in quanto non è un ultrafiltro perché in X esistono sottoinsiemi infiniti col complementare
infinito. (Si noti che se X = R questa è la topologia di Zariski.)
Lemma B.6.3. Un ultrafiltro su X è principale se e solo se contiene un sottoinsieme finito di X. In
particolare un ultrafiltro non principale contiene tutti i cofiniti.
D IMOSTRAZIONE . Una implicazione è ovvia per definizione di filtro principale. Supponiamo che
F sia un filtro su X e supponiamo che contenga un elemento A finito. Mostriamo per induzione sulla
cardinalità di A che F è il filtro principale su uno degli elementi di A. Se A ha un solo elemento è la
definizione di filtro principale. Altrimenti, sia x ∈ A. Per definizione di ultrafiltro si ha {x} ∈ F o
{x}c ∈ F . Nel primo caso abbiamo finito, nel secondo si è diminuita di uno la cardinalità di A.
Se F è non principale e A è cofinito allora F non contiene Ac per quanto appena visto e siccome
è un ultrafiltro, allora contiene A. 
B.6. ULTRALIMITI DI SUCCESSIONI CLASSICHE 207

Corollario B.6.4. Sia F = {Ai }i∈I una famiglia di sottoinsiemi di X. Se ogni intersezione finita di
elementi di F è infinita, allora F è contenuta in un ultrafiltro non principale su X. In particolare gli ultrafiltri
non principali esistono.
D IMOSTRAZIONE . Sia U il filtro degli insiemi cofiniti e sia B = F ∪ U. Consideriamo un numero
finito di elementi di B. Quelli in F hanno intersezione infinita per ipotesi, quelli di U hanno interse-
zione cofinita e dunque l’intersezione di tutti è non vuota. Per il Corollario B.5.2, B è contenuto in
un filtro, che per il Teorema B.5.5 è contenuto in un ultrafiltro G. Siccome G contiene U, allora non
contiene nessun sottoinsieme finito di X. Per il Lemma B.6.3 G non è principale. 
Infelicemente, in letteratura, per gli ultrafiltri non principali su N si usa spesso il simbolo ω, lo
stesso che si usa per il tipo d’ordine di N. Obtorto collo ci adegueremo a questa usanza.
Definizione B.6.5 (ω-convergenza). Sia ω un ultrafiltro non principale su N. Sia X uno spazio
topologico e sia (xn )n∈N una successione in X. Si dice che xn ω-converge a x
ω
xn → x
o che x è un’ω-limite di xn se per ogni intorno U di x si ha
{n ∈ N : xn ∈ U } ∈ ω.
Siccome ω è un ultrafiltro, se X è T2 l’ω-limite è unico... Ma non dipende solo da (xn ).
Esempio B.6.6. Sia xn = (−1)n la successione oscillante per antonomasia. Ebbene xn ha un ω-
limite. Infatti N = P t D è unione disgiunta dei pari e dispari. Siccome ω è un ultrafiltro su N, esso
contiene uno e uno solo tra D e P e la successione xn è costante su entrambi. Quindi xn ω-converge
a 1 o a −1. Quale dei due? Dipende da ω.
ω
Lemma B.6.7. Se xn → x nel senso usuale allora xn → x per ogni ultrafiltro non principale ω.
D IMOSTRAZIONE . Per ogni U intorno di X l’insieme {n : xn ∈ U } è cofinito e quindi sta in ω
perché ω è non principale. 
Teorema B.6.8. Sia ω un ultrafiltro non principale su N. Allora ogni successione classica in uno spazio
compatto ha un ω-limite.
D IMOSTRAZIONE . Sia X uno spazio topologico. Una successione in X non è altro che una fun-
zione f : N → X. Quindi f (ω) è un ultrafiltro in X. Se X è compatto allora f (ω) converge per il
Teorema B.5.8. Se f (ω) → x allora per ogni intorno U di x esiste A ⊆ U con A ∈ f (ω). Ne segue che
f −1 (A) ∈ ω e siccome f −1 (U ) ⊇ f −1 (A) allora l’insieme f −1 (U ) = {n ∈ N : xn ∈ U } ∈ ω. Quindi
ω
xn → x. 
Esempio B.6.9. La successione f (n) = sin(n) ha un ω-limite in [0, 1], che dipende da ω.
Esempio B.6.10. ω1 (il primo ordinale non numerabile) non è compatto, ma è compatto per suc-
cessioni. Quindi il viceversa del Teorema B.6.8 non è vero.
Un esempio di uso degli ω-limiti è la costruzione degli ultralimiti e dei coni asintotici. Fissiamo
un ultrafiltro non principale ω su N. Sia {(Xn , dn )}n∈N una famiglia di spazi topologici e sia on ∈ Xn
un punto base scelto in ogni Xn . Sia Xe lo spazio delle successioni costruite prendendo un punto per
ogni Xn
e = {(xn )n∈N : xn ∈ Xn }
X
(in altri termini X
e = Πn Xn ). Lo spazio X e ha un punto base o dato dalla successione dei punti base:
o = (on ). Su Xe definiamo una candidata distanza d attraverso gli ω-limiti
dω ((xn ), (yn )) = ω- lim d(xn , yn ).
208 B. SUCCESSIONI GENERALIZZATE

e ×X
La funzione dω è ben definita da X e → [0, ∞].
Sia X0 l’insieme dei punti che hanno una distanza finita da o = (on )
e
e0 = {x ∈ X
X e : dω (x, o) < ∞}.
Su X
e0 si pone la relazione d’equivalenza
x ∼ y ⇐⇒ d(x, y) = 0.
Il quoziente X b =X e0 / ∼, dotato della distanza dω , si chiama ultra-limite, o ω-limite degli spazi
metrici Xi .
Un caso particolare è quello del cono asintotico di uno spazio metrico fissato X. In questo caso
l’operazione che andiamo a fare è una formalizzazione dello zoom-out.
Sia (X, d) uno spazio metrico e sia o ∈ X un punto base. Sia λi → ∞ una successione di numeri
positivi, che utilizziamo come fattore di riscalamento ponendo
d(x, y)
di (x, y) = .
λi
Lo spazio metrico Xi = (X, di ) non è altro che un riscalamento di X per un fattore λi . Il punto base
rimane lo stesso. Il cono asintotico di X relativo alla scelta di ω, o, λi è l’ultra-limite degli spazi Xi .
Esempio B.6.11. Il cono asintotico di un compatto è un punto.
Esempio B.6.12. Il cono asintotico di Z è R (intuitivamente perché allontanandoci sempre più da
N vedremo i suoi punti avvicinarsi sempre di più.)
D IMOSTRAZIONE . Sia λi → ∞ una qualsiasi scelta dei fattori di scala. Scegliamo o = 0 come
punto base. Sia C(Z) il cono asintotico di Z. Per ogni x = [(xi )] 6= 0 il segno di x è definito come
±1 a seconda che l’insieme degli indici tali che xi ≶ 0 stia o meno in ω. Si verifica che il segno è ben
definito sulla classe di equivalenza. Definiamo
f (x) = segno(x)dω (0, x).
Essa è una ben definita funzione C(Z) → R, che si verifica essere un’immersione isometrica. Inol-
tre f è suriettiva perché per ogni r ∈ R, prendendo xn uguale alla parte intera di λn r si ha che
dω ([(xn )], 0) = r.


B.7. Esercizi
Esercizio B.7.1. Dimostrare che non definitivamente P equivale a frequentemente non P e viceversa.
Esercizio B.7.2. Dimostrare che un sottoinsieme di uno spazio topologico è chiuso se e solo se
contiene i limiti di tutte le sue successioni generalizzate.
Esercizio B.7.3. Dare un esempio di spazio topologico (X, τ ) che contenga un sottoinsieme A che
non sia chiuso ma tale che A contenga tutti i limiti di N-successioni in A.
Esercizio B.7.4. Dimostrare che lo spazio X ottenuto da R quozientando tutto Z a un sol punto
(Esempio 2.2.11) non è compatto esibendo una successione (xn )n∈N in X che non ha sottosuccessioni
generalizzate convergenti.
Esercizio B.7.5. Sia (en )n∈N la successione di funzioni in [0, 1][0,1] data dalla rappresentazione
binaria, cioè en (x) = 1, 0 a seconda che 2−n compaia o meno nell’espressione binaria di x. Nel-
l’Esempio 3.4.2 si è visto che (en )n∈N non ha sottosuccessioni classiche convergenti: esibire una
sottosuccessione generalizzata convergente a zero.
Esercizio B.7.6. Tradurre le condizioni di essere una funzione aperta/chiusa in termini di conver-
genza di successioni generalizzate.
B.7. ESERCIZI 209

Esercizio B.7.7. Dimostrare che se α è numerabile e (xi )i∈α è una α-successione in ω1 + ω1 che
tende a ω1 , allora xi = ω1 definitivamente in α.
Esercizio B.7.8. Dimostrare che se X è un insieme totalmente ordinato, allora
cof(cof(X)) = cof(X)
Esercizio B.7.9. Dimostrare che un ordinale ha cofinalità 1 se e solo se è un successore, se e solo se
ha un massimo.
Esercizio B.7.10. Sia (X, τ ) uno spazio topologico, sia x ∈ X e F(x) il filtro degli intorni di x. Si
dimostri che se {x} è aperto in X allora cof(F(x)) = 1.
Esercizio B.7.11. Dimostrare che negli spazi T2 il limite di filtri è unico.
Esercizio B.7.12. Dimostrare che una successione (generalizzata) converge se e solo se converge il
filtro delle sue code.
Esercizio B.7.13. Sia X un insieme e sia A ⊆ X non vuoto. Dimostrare che F = {B ∈ P(X) : A ⊆
B} è un filtro. Dimostrare che se A ha almeno due elementi allora F non è un ultrafiltro.
Esercizio B.7.14. Sia F un filtro su X tale che esista x ∈ X tale che x = ∩A∈F A. Dimostrare che se
F è un ultrafiltro allora {x} ∈ F. Se ne deduca che F è principale.
Esercizio B.7.15. Sia X uno spazio topologico e sia x ∈ X. Dimostrare che il filtro degli intorni di
x è un ultrafiltro se e solo se x è un punto isolato di X (cioè {x} è aperto).
Esercizio B.7.16. Dimostrare che non esistono ultrafiltri su N numerabili.
Esercizio B.7.17. Dimostrare che ogni cono asintotico di Q è omeomorfo a R.
Esercizio B.7.18. Dimostrare che ogni cono asintotico di R è omeomorfo a R.
Esercizio B.7.19. Dimostrare che ogni cono asintotico di Z2 è omeomorfo a R2 .
Esercizio B.7.20. Sia X = {(x − 1)2 + y 2 = 1} ∪ {(x + 1)2 + y 2 = 1}. Sia Y = {x2 + y 2 ≤ 1} ∪ X.
Siano X
e e Ye i rivestimenti universali. Dimostrare che i coni asintotici di X
e e Ye coincidono.

Potrebbero piacerti anche