Sei sulla pagina 1di 69

Universit`

a di Pisa
` DI SCIENZE MATEMATICHE, FISICHE E NATURALI
FACOLTA
Corso di Laurea Triennale in Matematica

Tesi di laurea triennale

Connessioni e teorie di gauge

Candidato:

Relatore:

Alessandro Malus`
a

Chiarissimo prof.
Riccardo Benedetti

Anno Accademico 20112012

Sommario e convenzioni
Il mio obiettivo in questo lavoro stato quello di approfondire un argomento
che non solo fosse interessante di per s, ma che si prestasse anche ad applicazioni alla fisica. Con gli strumenti acquisiti in questo percorso mi stato
possibile formalizzare in maniera per cos dire pulita alcuni problemi classici
della meccanica trattata nei corsi di base e affrontare argomenti pi avanzati
dellelettrodinamica nel contesto della meccanica quantistica.
Nel primo capitolo affronto le propriet fondamentali dei fibrati su una variet M , ponendo particolare attenzione ai due principali punti di vista possibili:
luno globale, laltro locale. Nel primo, la struttura rappresentata da una mappa di proiezione definita su uno spazio totale E a valori in M con delle propriet
di banalizzazione per certi aspetti molto simili a quelle dei rivestimenti. Il secondo, invece, consiste nella ricostruzione del fibrato per mezzo di incollamenti
di insiemi della forma U F , dove U aperto in M , secondo le regole imposte
dalle mappe di transizione. Un aspetto molto importante, trattato alla fine, la
possibilit di ricondurre qualsiasi fibrato a uno principale che ne riassume molte
propriet. Questo oggetto permette gi di dare una formulazione compiuta ai
problemi di corpo rigido.
Passo poi alle connessioni, trattando prima quelle affini su variet generiche
e passando poi a quelle su fibrati principali. Le prime generalizzano a variet
qualsiasi la nozione di derivata covariante, gi affrontata durante i corsi, come un
oggetto che consente di formalizzare consistentemente lidea che un dato campo
vettoriale sia parallelo lungo una direzione, ed eventualmente di valutarne le
variazioni: in questo modo possibile dare una formulazione del principio
dinerzia anche per ambienti diversi da quello usuale di Rn . Nel contesto dei
fibrati principali viene introdotto uno strumento simile, espresso in due possibili
modi equivalenti: tramite unopportuna distribuzione o una 1-forma a valori
in unalgebra di Lie, richiedendo in entrambi i casi delle buone propriet di
traslazione. Vengono definiti i sollevamenti paralleli e lolonomia. Tutto questo
viene affrontato con una particolare attenzione per le regole di trasformazione
delle rappresentazioni locali degli oggetti in analisi: questo sar un punto chiave
nellaffrontare le applicazioni a problemi fisici avanzati.
Nel capitolo successivo approfondisco la nozione di curvatura, accennata
nello studio delle derivate covarianti, estendendola al caso delle connessioni su
fibrati principali. In termini della forma differenziale ad essa associata possibile
parlare di fibrati piatti, cio a curvatura nulla, e dimostrare che, in questo
caso, la distribuzione associata alla connessione integrabile. In questo modo
risulta ben definita una foliazione dello spazio totale, che consente di definire
un opportuno rivestimento di M che lega lolonomia allomotopia dello spazio.

SOMMARIO E CONVENZIONI

Tutto questo viene impiegato nellultima parte per costruire un modello per
lelettrodinamica come teoria di gauge, in termini di una connessione data dal
potenziale vettore. Tramite esempi classici come quello del monopolo di Dirac e
delleffetto Aharonov-Bohm illustro le applicazioni di quanto visto a questo contesto, dando una previsione teorica astratta e dando una descrizione consistente
di un fenomeno effettivamente osservato in laboratorio.
Salvo precisazioni ulteriori, in quello che segue assumo che tutte le variet
siano C , cos come tutte le mappe. User indistintamente le espressioni liscio,
differenziabile e C .
Prima di iniziare lesposizione, vorrei lasciare un saluto e un ringraziamento alla memoria del professor Pino Vigna Suria, dellUniversit degli Studi di
Trento, venuto a mancare la scorsa primavera.

Indice
1 Fibrati
1.1 Qualche esempio introduttivo . . . . .
1.2 Due parole sui rivestimenti . . . . . .
1.3 Definizioni e prime propriet . . . . .
1.3.1 Punto di vista globale . . . . .
1.3.2 Punto di vista locale . . . . . .
1.4 Operazioni sui fibrati . . . . . . . . . .
1.4.1 Pullback di un fibrato . . . . .
1.4.2 Operazioni su fibrati vettoriali
1.5 Fibrati principali . . . . . . . . . . . .
1.6 Curiosit e considerazioni a posteriori

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

4
4
6
6
7
10
12
12
13
14
17

2 Connessioni
2.1 Motivazioni; principio dinerzia . . . . . . . . . . .
2.1.1 Il punto di vista delle coordinate . . . . . .
2.2 Connessioni affini . . . . . . . . . . . . . . . . . . .
2.2.1 La derivata covariante in sottovariet di Rn
2.2.2 Connessioni affini su variet generiche . . .
2.2.3 Il caso di variet riemanniane . . . . . . . .
2.3 Connessioni su fibrati principali . . . . . . . . . . .
2.3.1 Derivata covariante indotta . . . . . . . . .
2.4 Olonomia . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

21
21
23
24
25
28
35
38
42
44

3 Piattezza
3.1 Ancora sulla curvatura nel caso affine .
3.2 Curvatura di una 1-forma di connessione
3.3 Condizioni equivalenti alla piattezza . .
3.4 Olonomia di una connessione piatta . .
4 Teorie di gauge
4.1 Background fisico . . . . . . .
4.1.1 Equazioni di Hamilton
4.2 Lelettrodinamica come teoria
4.3 Il monopolo di Dirac . . . . .
4.4 Leffetto Aharonov-Bohm . .
4.5 Continua... . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

46
46
48
50
52

. . . . . . . . . .
e di Schrdinger
di gauge . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

55
55
57
59
61
63
66

Bibliografia

.
.
.
.

.
.
.
.

.
.
.
.

68

Capitolo 1

Fibrati
La struttura di fibrato molto utile per formalizzare e descrivere alcune idee
che in matematica e fisica ricorrono spesso.

1.1

Qualche esempio introduttivo

Di seguito riporto alcune situazioni in cui questo oggetto si rende necessario,


per mettere in luce i bisogni che portano a introdurre tale strumento.
Es 1.1.1 (Fibrato tangente): Data M una variet di dimensione n possibile
definire, punto per punto, lo spazio tangente: si tratta di uno spazio vettoriale
della stessa dimensione di M . Vorremmo costruire un oggetto che esprima bene
lidea di aver incollato una copia di un certo spazio vettoriale a ogni punto, e
che permetta di parlare in maniera consistente di campi vettoriali e della loro
eventuale regolarit. Uno spazio costruito come unione disgiunta dei Tp M al
variare di p M del tutto inadeguato a questo scopo: esso non ha alcuna
ovvia struttura differenziabile ereditata da M , n una topologia soddisfacente.
C bisogno di qualcosa di pi raffinato.
Se p un punto di M , esister un isomorfismo tra Tp M ed Rn , ma in generale non uno canonico; analogamente, spazi tangenti ad M in punti distinti
sono a loro volta differenti, e non possono essere identificati. per possibile
dare una base di Tp M , e quindi un particolare isomorfismo con Rn , quando
in un intorno del punto definito un sistema di coordinate: in questo caso
una base sar definita sullo spazio tangente in ciascuno dei punti dellintorno. Consideriamo due aperti coordinati Ui e Uj della variet, e supponiamo
che questi si intersechino. Lo Jacobiano del cambio di carta fornisce una trasformazione delle coordinate dello spazio tangente, ed essendo M una variet
C anche questa trasformazione sar differenziabile. Se le carte sono date da
i(j) : Ui(j) F
Ai(j) , con Ai e Aj aperti di Rn , questo fornisce delle funzioni
i(j) : T M := pM Tp M Ai(j) Rn che possonoFessere considerate delle
parametrizzazioni C : Ui e Uj si intersecano in U = pUi Uj Tp M , ed ben
definita una funzione : i (U ) j (U ) che risulta essere C . Abbiamo quindi
una struttura differenziabile su T M che permette di vedere questo spazio come
incollamento di aperti della forma Ai Rn , cio una variet di dimensione 2n.
Inoltre, nelle carte cos costruite, le prime n coordinate della parametrizzazione

CAPITOLO 1. FIBRATI

identificano un punto di M , mentre le altre n individuano un vettore tangente


nello stesso. Sar naturale considerare solo carte che godano di questa propriet,
poich permettono di individuare in maniera immediata lo spazio a cui ciascun
vettore appartiene.
Es 1.1.2 (Corpo rigido): Considero il moto di un corpo rigido nello spazio
tridimensionale. Nellapprossimazione di un punto materiale, la posizione sar
determinata completamente dalle coordinate del centro di massa rispetto a un
fissato sistema di riferimento, ma se si considera un corpo esteso occorre tenere
conto di ulteriori gradi di libert legati alle possibili rotazioni. utile considerare una fissata posizione privilegiata, in cui il centro di massa delloggetto
sia nellorigine del sistema di riferimento, e sia orientato in un qualsiasi modo.
Questo permette, fissato un qualunque punto P , di traslare loggetto dallorigine
in P e di considerare lorientazione ottenuta in questo punto come riferimento.
A questo punto, una qualsiasi posizione delloggetto con centro di massa in P
determinata biunivocamente dalla rotazione intorno al punto che trasforma
lorientazione di riferimento in quella data. Per passare dal punto materiale al
corpo esteso, quindi, basta associare ad ogni posizione non solo le coordinate del
centro di massa, ma anche un elemento di SO3 che ne esprima lorientazione.
Si potr dunque pensare lo spazio delle configurazioni come uno spazio euclideo
a cui sia incollata, punto per punto, una copia di SO3 . Viene naturale a questo punto immaginare che lo spazio che descrive questa situazione possa essere
R3 SO3 con la sua struttura di variet differenziabile.
Una situazione simile, ma pi complessa, quella di un corpo esteso il cui
centro di massa libero di muoversi sulla superficie di una sfera, con lulteriore vincolo che le rotazioni possibili siano solo attorno allasse radiale della
sfera. Anche in questo caso per determinare una generica configurazione non
sufficiente la posizione del centro di massa. Se si dispone, in ogni punto,
di unorientazione di riferimento, unaltra generica pu essere espressa tramite
una rotazione del piano, cio un elemento di S 1 (' SO2 ). Nel caso visto sopra
sufficiente unorientazione di riferimento solo nellorigine, poich questo permette di costruirne una in ogni altro punto in maniera canonica, ma sulla sfera
non ovvio come procedere per avere lo stesso risultato. In R3 si sfruttato
il fatto che, comunque dati due punti, esiste ununica traslazione che manda
il primo nel secondo, e sulla sfera vale un risultato simile: se p e q sono due
punti sulla sfera non diametralmente opposti, allora esiste ununica rotazione
che manda p in q fissando lortogonale ai due punti (come raggi vettori). Dunque, data unorientazione di riferimento in un punto qualsiasi, ad esempio il
polo nord PN = (0, 0, 1), possibile costruirne una in ogni punto, eccetto quello
diametralmente opposto. Se il centro di massa delloggetto non nel polo sud
PS = (0, 0, 1), quindi, la sua posizione sar individuata da quella del centro di
massa e da una rotazione del piano: questo permette di vedere lo spazio delle
configurazioni per cui il centro di massa non sia il polo sud come il prodotto
(S 2 \ { PS }) S 1 . Analogamente, per le configurazioni con il centro di massa
diverso dal polo nord si ha (S 2 \ { PN }) S 1 . Non chiaro se lintero spazio
delle configurazioni possa essere rappresentato come S 2 S 1 , ma sicuramente
possibile ricoprire la sfera con aperti per cui questa decomposizione vale.
Nelle situazioni esposte negli esempi qui sopra si rende necessario introdur-

CAPITOLO 1. FIBRATI

re un oggetto che permetta di formalizzare lidea di incollare a ogni punto di


una certa variet M una copia di una qualche struttura (ad esempio il gruppo che esprime le simmetrie di un corpo libero di muoversi in M ), in maniera
globalmente consistente. Questo permetterebbe, inoltre, di parlare di regolarit di funzioni che assegnano ad ogni punto un elemento della struttura ad
esso associata: questo corrisponde, nei due esempi visti, a campi vettoriali e
rotazioni.

1.2

Due parole sui rivestimenti

La struttura di fibrato richiama quella di rivestimento, affrontata nei corsi istituzionali. Per tale motivo vale la pena riprendere le propriet fondamentali di
questa costruzione prima di introdurre la definizione precisa di fibrato.
Def 1.2.1: Siano X, E due spazi topologici, : E X una funzione continua.
Si dice che un rivestimento se ogni punto p X ammette un intorno aperto
U tale che, per ogni V componente connessa della controimmagine di U , la
restrizione |V : V U sia un omeomorfismo. Si chiamano aperti trivializzanti
quelli che realizzano questa propriet.
Se E localmente connesso, un rivestimento permette di ricoprire E con
aperti della forma Ui Fi , dove gli Ui sono aperti di X, mentre gli Fi rappresentano degli spazi discreti (con abuso di notazione, in questa sezione intender
con questa espressione totalmente sconnessi). Dal seguente diagramma, in cui
p denota la proiezione sul primo fattore, si pi concludere che, per qualsiasi
punto x Ui , lo spazio di Fi omeomorfo alla fibra di x tramite . Infatti, la
proiezione p0 : Ui Fi Fi sul secondo fattore induce un omeomorfismo tra Fi
e la controimmagine di x tramite p (si tratta di una bigezione tra spazi discreti),
mentre la funzione f un omeomorfismo sullimmagine. Per la commutativit
del diagramma, questo induce una bigezione tra Fi e 1 (x), spazio discreto
rispetto alla topologia di sottospazio: si ha lomeomorfismo cercato.

Ui Fi

f E
p

?
X

Dunque, ogni punto x di X ammette un intorno (aperto) U la cui immagine


possa essere descritta come U 1 (x). Sar questa la propriet fondamentale
dei fibrati.

1.3

Definizioni e prime propriet

Le questioni riguardanti i fibrati su M possono essere formulate sfruttando due


diversi punti di vista equivalenti, ciascuno dei quali risulta essere pi o meno
vantaggioso a seconda del contesto. Il primo globale, e si concentra su di una

CAPITOLO 1. FIBRATI

seconda variet E e una mappa di proiezione su M , con propriet analoghe a


quelle dei rivestimenti, a meno di rimuovere lipotesi che le fibre locali siano
discrete. Il secondo, invece, di carattere locale, e consiste nel ricostruire la
variet E incollando insiemi della forma Ui F , con Ui aperti di M con la fibra
F , identificando i punti tramite opportune mappe.

1.3.1

Punto di vista globale

Considero una variet M , e suppongo siano date unaltra variet E e una funzione differenziabile : E M con differenziale surgettivo. Suppongo inoltre che
la fibra di ogni punto p M (non lo specificher pi, ma salvo indicazioni ulteriori intender sempre tramite ) sia diffeomorfa ad una fissata variet F , che
chiamer genericamente fibra, con la seguente propriet: esistono un ricoprimento aperto { Ui }iI di M e una famiglia di diffeomorfismi i : Ui F 1 (Ui )
in modo che il seguente diagramma sia commutativo (pi denota la proiezione
sul primo fattore):
Ui F

i
1 (Ui )
pi

?
Ui

Gli aperti di tale ricoprimento saranno detti trivializzanti, e le mappe i


trivializzazioni locali.
Supponiamo che due aperti trivializzanti Ui e Uj si intersechino: le i e
j inducono due diffeomorfismi (per i quali non cambio notazione), a priori
distinti, tra (Ui Uj ) F e 1 (Ui Uj ). Avr dunque un diffeomorfismo di
(Ui Uj ) F in s dato da 1
i j , che inoltre conserva la prima componente, e
questo permette di associare ad ogni punto p Ui Uj una mappa tij (p) : F F
data da f 7 tij (p) f tale che 1
j (p, f ) = (p, tij (p) f ). Tale mappa sar
i
nuovamente un diffeomorfismo: in effetti, dallipotesi che i lo sia segue che la
sua restrizione a { p } F differenziabile e iniettiva, e cos per la sua inversa.
Sulla fibra F non stata formulata alcuna ipotesi, se non, naturalmente,
quella che sia una variet. Tale spazio pu avere della struttua ulteriore, come
quella di gruppo, spazio vettoriale o metrico: in tal caso avr senso richiedere
che, punto per punto, la mappa tij preservi anche questa struttura, e cio che
tij (p) appartenga a un opportuno sottogruppo si quello dei diffeomorfismi di F in
s (potr trattarsi di automorfismi di gruppo o spazio vettoriale o di insometrie,
in questi casi). Si potr aggiungere lipotesi che tale gruppo abbia a sua volta
una struttura differenziabile: questo far s che tij possa essere definita come
una mappa da Ui Uj nel gruppo G considerato, e avr senso lipotesi che anche
queste siano differenziabili.
Una struttura di questo tipo proprio ci che occorre per affrontare i problemi sopra menzionati. Riassumo nella seguente definizione ci che fin qui
stato detto:
Def 1.3.1 (Fibrato): Siano E, M ed F variet di classe C , G un sottogruppo
di Lie dei diffeomorfismi di F in s. Si dice che la mappa : E M definisce un

CAPITOLO 1. FIBRATI

fibrato su M con fibra tipica F e gruppo di transizione G se valgono le seguenti


propriet:
1. differenziabile e il suo differenziale surgettivo;
2. La controimmagine di ogni punto p M (indicata come Fp , la fibra di
in p) diffeomorfa a F ;
3. M ammette un ricoprimento tramite aperti { Ui }iI per i quali esistano
diffeomorfismi i : Ui F 1 (Ui ) in modo che limmagine di ogni
coppia (p, f ) appartenga a Fp , e che per ogni Ui , Uj che si intersechino
non banalmente esista una fuzione tij : Ui Uj G tale che, per ogni
(p, f ) (Ui Uj ) F valga 1
i j (p, f ) = (p, tij (p) f ).
In tal caso, si dice che E lo spazio totale del fibrato, M lo spazio base,
chiamata proiezione, mentre gli Ui sono detti aperti trivializzanti, ciascuna i
trivializzazione locale, e infine le mappe tij sono chiamate mappe di transizione.
G detto gruppo di transizione o di struttura (in contesto fisico di gauge). Si
usa chiamare dimensione del fibrato quella di F , e se questo non pu dare luogo
ad ambiguit si scrive dim E = dim F .
Sia U M un aperto, s : U E una funzione differenziabile. Si dice che
s una sezione locale del fibrato se s la mappa identica di U : in altre
parole, s una sezione se limmagine di ogni punto appartiene alla sua fibra.
Dato un punto p M , esiste sempre una sezione locale in un suo intorno: se
(Ui , i ) un aperto trivializzante contenente p, f un qualsiasi elemento della
fibra, si pu considerare la mappa sf : Ui E che manda m M in i (m, f ).
Per definizione di trivializzazione questa mappa in effetti una sezione locale
in (un intorno di) p. Lesistenza di una sezione globale, invece, non sempre
garantita, ed anzi uno dei problemi principali nello studio di un fibrato.
Es 1.3.1: Se M ed N sono variet, il loro prodotto cartesiano M N ha
una naturale struttura di fibrato su ciascuna delle due, tramite le rispettive
proiezioni. Qualsiasi funzione differenziabile f : M N induce una sezione
globale s : m 7 (m, f (m)) (analogamente per g : N M ).
Es 1.3.2: Il cilindro C e il nastro di Mbius N , costruiti identificando i due bordi verticali del quadrato [0, 1] (0, 1), rispettivamente preservando e invertendo
lorientazione, forniscono due esempi di fibrati sulla circonferenza S 1 . Infatti, in
entrambi i casi la proiezione sul primo fattore induce mappe C e N a valori
in S 1 ' [0, 1]/ , dove la relazione che identifica gli estremi.
qN
N 
N

[0, 1] (0, 1)

qC C
C

?
?
?
qS 1 - 1
1  qS 1
S
[0, 1] { 1/2 }
S
Nel diagramma, qN , qS 1 e qC denotano le proiezioni ai quozienti. Si verifica
immediatamente che C e N sono di classe C e che i rispettivi differenziali

CAPITOLO 1. FIBRATI

sono surgettivi. Siano U1 = (0, 1) e U2 = [0, 1] \ { 1/2 }: le immagini di questi


insiemi tramite qS 1 danno un ricoprimento aperto della circonferenza. Sono ben
definite le seguenti mappe: le prime due in maniera immediata, le altre passando
per il quoziente:
1,C : qS 1 (U1 ) (0, 1) C

(qS 1 (x), y) 7 qC (x, y)

1,N : qS 1 (U1 ) (0, 1) N

(qS 1 (x), y) 7 qN (x, y)

2,C : qS 1 (U2 ) (0, 1) C

(qS 1 (x), y) 7 qC (x, y)


(
qN (x, y)
per x < 1/2
(qS 1 (x), y) 7
qN (x, 1 y) per x > 1/2

2,N : qS 1 (U2 ) (0, 1) N

Queste mappe sono differenziabili, godono delle propriet delle trivializzazioni


locali, e le prime componenti dei loro domini ricoprono S 1 . Siano GC = { 1 }
con lazione banale su (0, 1), e GN = { 1 }, dove 1 agisce mandando y in
1 y, tC : qS 1 (Ui ) qS 1 (Uj ) GC la costante 1, tN : qS 1 (Ui ) qS 1 (Uj ) GN
che vale 1 nei punti della forma qS 1 (x) con x < 1/2, 1 altrimenti. Allora le due
proiezioni C e N danno fibrati su S 1 con le trivializzazioni indicate, gruppi di
transizione GC e GN e mappe di transizione tC e tN .
Es 1.3.3: Sia M una variet differenziabile n-dimensionale, e sia T M definito
come nellesempio 1.1.1, : T M M la mappa che manda ogni elemento
di Tp M in p. La rappresentazione in coordinate della proiezione mostra la
differenziabilit di e la surgettivit del suo differenziale, e chiaramente la fibra
di ogni punto p Tp M , isomorfa (e dunque diffeomorfa) a Rn . Dato un atlante di
M la costruzione gi fatta permette di individuare delle trivializzazioni locali,
le cui mappe di transizione sono date dallo Jacobiano dei cambi di carta. Il
gruppo di transizione sar dunque GLn (R).
In letteratura esistono diverse definizioni di classi di mappe tra fibrati. Per
questa trattazione sar sufficiente la seguente:

Def 1.3.2 (Morfismo di fibrati): Siano dati E M , E 0 M due fibrati,


f : E E 0 una funzione differenziabile. Si dice che f un morfismo di fibrati
se 0 f = , cio se il seguente diagramma commuta:
f

- E0
0

M
Se f un diffeomorfismo tra E ed E 0 come variet, allora si dice che un
isomorfismo di fibrati.
La condizione che f sia un morfismo di fibrati equivale a richiedere che
mandi le fibre di in quelle di 0 . Questa definizione di isomorfismo permette
di confrontare due fibrati e permetter di classificarli.
Un fibrato si dice banale se equivalente a M F , con la naturale struttura
di fibrato accennata nellesempio 1.3.1. Un esempio di fibrato banale su S 1 il

CAPITOLO 1. FIBRATI

10

cilindro, mentre il nastro di Mbius non pu esserlo: se lo fosse, come variet


sarebbe diffeomorfo a S 1 (0, 1), cosa che non vale.
Oss 1.3.1L: e notazioni impiegate per indicare i fibrati sono varie: talvolta vengono denotati tramite la 5-upla (E, , M, F, G), mentre a volte si usa la nota
zione E M , o semplicemente E. Naturalmente, specificare soltanto lo spazio
base e la fibra tipica non determina il fibrato, come mostra lesempio 1.3.2.
Nemmeno lo spazio totale E, da solo, determina la struttura di fibrato, dato
che, ad esempio, nel caso del prodotto cartesiano tra spazi distinti fornisce un
fibrato su ciascuno. Addirittura pu non essere sufficiente nemmeno indicare
E ed M : le mappe eikt : S 1 S 1 , con k intero non nullo, definiscono fibrati
sulla circonferenza non isomorfi tra loro (la fibra ha cardinalit |k|). Daltra
parte, fondamentale specificare anche il gruppo di transizione, poich al variare di questo pu darsi che cambi la classe di banalizzazioni locali permesse.
Ad esempio, in maniera del tutto analoga al cilindro, anche il toro ammette una
struttura di fibrato su S 1 con la stessa circonferenza come fibra, con gli aperti banalizzanti e le banalizzazioni locali costruite nello stesso modo. Se come
gruppo di transizione si ammette quello delle isometrie della circonferenza, la
2 potr essere sostituita con una mappa che manda (x, y) in 2 (x, (y)), dove
una riflessione: in questo caso t12 (x) = in ogni punto, anzich lidentit.
Se per si desidera considerare solo il gruppo delle rotazioni della circonferenza,
la famiglia di trivializzazioni costruita non soddisfa le richieste.
Nonostante queste considerazioni, spesso indicando un generico fibrato si
alleggerisce la notazione omettendo di specificare alcune delle sue caratteristiche,
purch questo non comprometta la consistenza della trattazione. Io adotter

E M.

1.3.2

Punto di vista locale

Oss 1.3.2: Se { (Ui , i ) }iI un ricoprimento di M tramite aperti trivializzanti, le mappe di transizione tij godono delle seguenti due propriet:
tii = Id per ogni i I;
tij tjk = tik per ogni i, j, k per cui Ui Uj Uk 6= . Infatti, applicando
la definizione, si ha, per ogni p Ui Uj Uk , f F :
(p, (tij tjk (p)) f ) = (p, tij (p) (tjk (p) f )) =
= 1
i j (p, tjk (p) f ) =
1
= 1
i j j k (p, f ) =

= 1
i k (p, f ) =
= (p, tik (p) f )

In effetti, queste propriet caratterizzano le mappe di transizione: una volta


fissati M , F e G e dato un ricoprimento aperto { Ui }iI di M e delle funzioni

CAPITOLO 1. FIBRATI

11

tij : Ui Uj G con le propriet ora enunciate, esiste un fibrato che abbia le


tij come mappe di transizione.
Thm 1.3.3: Siano M , F variet di dimensione r ed s rispettivamente, G un
gruppo di Lie che agisce a sinistra su F in modo liscio, { Ui }iI un ricoprimento
aperto di M e tij : Ui Uj G tali che, per ogni i, j, k I, tii = e (elemento
neutro di G) e tij tjk = tik . Allora esiste un fibrato con base M , fibra tipica F e
gruppo di transizione G con tij come mappe di transizione; inoltre, tale fibrato
unico a meno di isomorfismo.
F
Dim: Sia E = iI Ui F , la relazione binaria su E definita nel seguente
modo: se (p1 , f1 ) Ui F , (p2 , f2 ) Uj F , allora (p1 , f1 ) (p2 , f2 ) se e solo
se p1 = p2 e f1 = tij f2 . Tale relazione riflessiva, poich tii = Id, e transitiva,
dato che tij tjk = tik . Inoltre, per ogni i, j I vale t1
ij = tji : tij tji = tii = Id
e viceversa. Da questo segue la simmetria di , che risulta essere quindi una
relazione di equivalenza.
Sia E definito come E/ . Per come definita , la proiezione sul primo
fattore di ciascun Ui passa al quoziente, e induce una funzione : E M .
Inoltre, per ogni i I la proiezione al quoziente su E fornisce una mappa
i : Ui F E per cui banalmente ( i )(p, f ) = p.
Se { (Vj , j ) }jJ , { (Wh , h ) }hH sono atlanti rispettivamente di M ed F ,
allora { ((Ui Vj ) Wh , ij h ) }, dove ij rappresenta j ristretta a Ui Vj ,
un atlante su E. Le ij h inducono mappe anche su aperti Aijk in E. Se
Aijk interseca non banalmente Almn , le carte inducono una funzione (di cui
ometto gli indici) da j (Ui Vj ) h (Wh ) in m (Ul Vm ) n (Wn ). Il fatto
che gli aperti si intersechino significa che Ui Vj interseca Ul Vm , mentre Wh
interseca til (Wn ). Si avr
1
1
(x, y) = (lm 1
(y))
ij (x), m (k til (ij (x)))

che per la differenziabilit delle mappe coinvolte a sua volta di classe C .


Queste carte mostrano che la proiezione anchessa differenziabile e il differenziale surgettivo, e questo dimostra la struttura di fibrato delloggetto
costruito, dato che le trivializzazioni locali sono gi state introdotte e sono banalmente differenziabili. Inoltre, per come stato costruito E, le mappe di
transizione sono quelle richieste.
0

Sia ora E 0 M un fibrato con fibra tipica F e le tij come mappe di transizione. Allora le trivializzazioni locali i degli aperti Ui definiscono una mappa
: E E 0 di classe C , che passa al quoziente e induce una : E E 0
differenziabile. Poich le i sono diffeomorfismi sullimmagine, ciascuna di esse
ammette inversa differenziabile i1 a valori in E. Per definizione di mappe di
transizione, passando al quoziente in E le i1 coincidono dove i domini si intersecano e permettono quindi di costruire linversa di , anchessa differenziabile.
Questo rende un diffeomorfismo tra E ed E 0 , che manda banalmente fibre in
fibre, ed dunque un isomorfismo di fibrati.

Oss 1.3.4: Il risultato ora dimostrato non implica che la costruzione fatta con
due famiglie distinte di mappe dia luogo a fibrati non isomorfi: riprendendo la
trattazione del cilindro fatta nellesempio 1.3.2, ad esempio, scegliendo tij =

CAPITOLO 1. FIBRATI

12

Id per i 6= j si otterrebbe un fibrato isomorfo. Per vederlo, basta considerare


al posto di 2,C la funzione che manda (x, y) in 2,C (x, 1 y).
In generale, sempre vero che le mappe tij = Id per ogni i, j I danno
luogo al fibrato banale, ma non vale limplicazione inversa.
La definizione 1.3.1 propone un punto di vista globale: lidea di fibrato su
M con fibra F viene introdotta tramite una nuova variet E ed una mappa di
proiezione , e lattenzione focalizzata sulle propriet di questi due oggetti.
Il risultato appena mostrato, invece, apre la strada a un diverso approccio,
che pone laccento sugli aspetti locali della nuova struttura: un fibrato viene
costruito incollando spazi della forma Ui F , secondo le regole espresse dalle
mappe di transizione. I due punti di vista si equivalgono, ed quindi possibile
adottare di volta in volta il pi comodo.
Oss 1.3.5: Di fatto, quando si definisce il fibrato tangente ad una variet,
la costruizione che si fa quella locale: dato un atlante di M , se due aperti
coordinati si intersecano lo Jacobiano del cambio di carta fornisce una funzione
dallintersezione in GLn (R), dove n la dimensione di M . La famiglia di queste
mappe soddisfa le ipotesi richieste.

1.4

Operazioni sui fibrati

Dati uno o pi fibrati pu essere utile saperne costruire degli altri a partire da

questi. Se ad esempio dato E M , naturale aspettarsi che un embedding


di una variet N in M induca in qualche modo una struttura di fibrato anche
su N . Inoltre, come stato definito uno strumento che consente di trattare
consistentemente i campi di vettori tangenti ad una variet, cos sar possibile
costruirne altri per i vettori appartenenti a spazi legati al tangente, ad esempio
il suo duale, e i prodotti tensoriali tra questi.
Alcune di tali costruzioni danno loccasione di vedere esempi di situazioni in
cui vengono adottate le due diverse prospettive della teoria dei fibrati.

1.4.1

Pullback di un fibrato

Siano E M un fibrato, N una variet ed f : N M una mappa differenziabile. Dal momento che permette, euristicamente, di incollare a ogni punto
di M una copia di F , ci si pu aspettare che f permetta di fare lo stesso su N ,
associando a ogni n la fibra di f (n). Ad esempio, se f un embedding, questo
permette di considerare non solo lo spazio tangente ad n in N , ma anche tutto
il tangente a f (n) in M . Un altro caso che pu essere interessante quello di
una curva in M che esprime il moto di un oggetto nella variet, con F un
gruppo che ne esprime le simmetrie: la traiettoria pu non essere iniettiva, ma
ha senso considerare a ogni tempo la fibra del punto in cui ci si trova.
Una tale costruzione possibile, ed detta pullback di : la definir adottando il punto di vista globale. Sia f (M ) definita come il sottoinsieme di N E
dei punti (p, u) tali che f (p) = (u), 1 e 2 le restrizioni a questo insieme delle
due proiezioni sui fattori di N E. Se { (Ui , i ) }iI un ricoprimento banalizzante per M , la controimmagine di Ui tramite f aperta in N per ogni i, e gli

CAPITOLO 1. FIBRATI

13

insiemi di questa forma ricoprono N . Dato (p, u) f (E) tale che f (p) Ui ,
possibile definire i : f 1 (Ui ) F f (E) tramite
i1 (p, u) = (p, fi )
dove fi la seconda componente di 1
i (u). Questo fornisce una bigezione
tra f 1 (Ui ) F e 11 (f 1 (Ui )), e mostra che 1 banale su f 1 (Ui ). Se
p f 1 (Ui ) f 1 (Ui ), allora fi = tij fj : dato che queste mappe sono lisce, le
rappresentazioni delle transizioni tra le i tramite coordinate in N ed F sono a
loro volta C , e questa costruzione permette di definire una struttura differenziale su f (E) che renda regolari tutte le funzioni ora definite, in modo che 1
definisca un fibrato. Le mappe di transizione tij sono definite per composizione
con f .

1.4.2

Operazioni su fibrati vettoriali

A fianco dei campi vettoriali, tra i primi oggetti che vengono definiti quando
si introducono le variet ci sono le forme differenziali: mappe che associano ad
ogni punto p M un funzionale sul tangente. In maniera del tutto analoga
al fibrato tangente, si pu definire il cotangente, la cui fibra sar il duale dello
spazio tangente.

Def 1.4.1 (Fibrato vettoriale): Si dice vettoriale un fibrato E M la cui fibra


tipica uno spazio vettoriale V e con gruppo di transizione G un sottogruppo
di Lie di GL(V ).
In generale, a ogni fibrato vettoriale pu essere associato il suo duale, cio
un altro fibrato la cui fibra lo spazio duale di V .
Richiamo un risultato di algebra lineare: se V uno spazio vettoriale e
f End(V ), esiste ununica f End(V ) tale che, per ogni V e per ogni
v V valga
(f ())(v) = f ((v))
Inoltre, (IdV ) = IdV , e per f, g End(V ) vale (f g) = g f . Infatti,
per ogni V , v V :


(f g) () (v) = ((f g) (v)) =


= (f (g (v))) =
= (f ()) (g (v)) =
= (g (f ())) (v) =
= ((g f ) ()) (v)
Siano { tij } le mappe di transizione associate al ricoprimento banalizzante

{ (Ui , i ) }iI del fibrato vettoriale E M : definisco ij = tji . Queste funzioni


soddisfano le ipotesi del teorema 1.3.3, e permettono quindi di definire il fibrato
duale E .
Da un altro risultato di algebra lineare risulta che, per ogni endomorfismo
f di uno spazio vettoriale V , esiste ununica mappa k f End(k V ) tale che
(k f )(v1 vk ) = f (v1 ) f (vk )

CAPITOLO 1. FIBRATI

14

Si verifica che, se f, g End(V ), allora k (f g) = (k f ) (k g), e che


k (IdV ) = Idk V ; di conseguenza, se f invertibile lo sar anche k f , e vale
k (f 1 ) = (k f )1 .

Dato E M un fibrato vettoriale con fibra V e mappe di transizione tij


rispetto a un certo ricoprimento banalizzante { (Ui , i ) }iI , per ogni p M si
ha k tij GL(k V ): ancora una volta sono soddisfatte le ipotesi del teorema
1.3.3, ed ben definito il fibrato k E con la potenza esterna k V come fibra
tipica.
Usando queste due costruzioni si pu formalizzare il fibrato delle k-forme
differenziali su una variet M : da T M si passa a T M , il fibrato duale, e poi si
passa alla potenza esterna k-esima. Per il fibrato di tutte le forme differenziali,
invece, manca ancora un passaggio.

Siano E M ed E 0 M 0 due fibrati vettoriali (non necessariamente


sulla stessa variet) con fibre V e V 0 . Questi inducono una struttura di fibrato
su M M 0 con fibra V V 0 . Se { (Ui , i ) }iI e { (Vj , j ) }jJ sono rispettivi
ricoprimenti banalizzanti, gli aperti della forma Wij = Ui Vj ricoprono M N .
Dette tii0 e sjj 0 le mappe di transizione, su Wij Wi0 j 0 sono ben definite rii0 jj 0
che agiscono su V V 0 componente per componente. Ancora una volta, si pu
definire quello che si usa chiamare il fibrato prodotto, indicato con E E 0 .
In maniera del tutto analoga si pu definire un fibrato su M M 0 con fibra
V V 0 . Se M = M 0 , identificando M con la diagonale M M tramite
limmersione , il pullback del fibrato prodotto d quella che si chiama somma
di Whitney (o somma diretta) E E 0 , e analogamente si ottiene il prodotto
tensore E E 0 . Naturalmente queste due costruzioni possono essere ripetute
con un qualsiasi numero finito di fibrati: in questo modo si ottiene il fibrato
delle forme differenziali su M sommando tutte le potenze k-esime non banali.
Bench ristretti alla sola classe dei fibrati vettoriali, questi esempi danno
unidea dellutilit del punto di vista locale presentato sopra, fatta eccezione per
la somma di Whitney e per il prodotto tensore, che coinvolgono un pullback.

1.5

Fibrati principali

Def 1.5.1 (Fibrato principale): Un fibrato E M detto principale se la fibra


coincide con il gruppo di transizione G, e lazione quella sinistra naturalmentee
indotta dalla struttura di gruppo. Tali fibrati sono detti anche G-fibrati su M ,
e spesso il loro spazio totale si indica con P anzich con E.
Nei fibrati principali ben definita unazione destra di G su P . Sia u P ,
U un intorno banalizzante di p = (u) con trivializzazione , g G tale che
(p, g) = u. Per ogni a G, si definisce:
u a = (p, ga)
Il punto u a dipende in effetti solo da a e u, e non dalla particlare scelta di U o
di . Se infatti V un altro intorno banalizzante di p, la trivializzazione,
con u = (p, h) e t la mappa di transizione, avr:
(p, ga) = (p, t(ga)) = (p, (tg)a) = (p, ha)

CAPITOLO 1. FIBRATI

15

Inoltre, si tratta proprio di unazione destra, poich


(u a) b = (p, ga) b = (p, (ga)b) = (p, g(ab)) = u ab
Oss 1.5.1: Lazione ora definita preserva le fibre: segue immediatamente dalla
definizione che (u) = (u a) per ogni u E, a G. Essa libera e transitiva
su ogni fibra, cio dati comunque punti u1 , u2 Fp esiste un unico a G tale
che u1 a = u2 : se unopportuna trivializzazione locale, con (p, g) = u1
e (p, h) = u2 , baster scegliere a = g 1 h, questa lunica scelta possibile.
Questa azione liscia, dato che localmente pu essere scritta come composizione
di mappe C :
 
u a = (u) , 2 1 (u) a
dove 2 denota la proiezione sul secondo fattore.
Il seguente risultato, seppure molto semplice, merita di essere messo in evi
denza per via delle sue implicazioni. La struttura di E M , come gi stato
osservato, determinata completamente dalle mappe di transizione: sembra
ragionevole che, se queste non vengono modificate, molte propriet del fibrato
siano conservate quando si cambia la fibra tipica. Pu essere molto interessante
avere un modo canonico per ricondursi a un caso particolare, come quello dei
fibrati principali, che sia pi facile da trattare o che si presti a costruzioni pi
ricche e flessibili, ed questo lobiettivo del prossimo teorema.
Thm 1.5.2: Date due variet M ed F e un gruppo di Lie G agente a sinistra su
F in maniera liscia, esiste una corrispondenza biunivoca tra le classi di isomorfismo di fibrati su M con fibra F e gruppo di transizione G e quelle di G-fibrati
su M . Inoltre, tale corrispondenza canonica.

Dim: Sia dato E M un fibrato con fibra F e gruppo di transizione G,


{ (Ui , i }iI un ricoprimento banalizzante. Se { tij } la famiglia delle mappe
di transizione rispetto a questo ricoprimento, esiste un unico G-fibrato, a meno
di isomorfismo, con le stesse mappe di transizione rispetto al ricoprimento { Ui },
essendo banalmente vere le ipotesi del teorema 1.3.3.
In maniera del tutto analoga, dato un qualsiasi G-fibrato ne esiste uno e uno
solo, sempre a meno di isomorfismo, che soddisfi le richieste.

Due fibrati ottenuti luno dallaltro tramite la costruzione descritta nella dimostrazione sono detti associati. Limportanza del risultato risiede nel fatto che
molte propriet di un fibrato sono riassunte in quelle del suo associato. Una di
queste, ad esempio, la banalit: infatti, questa equivalente allesistenza di un
ricoprimento banalizzante le cui mappe di transizione mandino costantemente
nellidentit di G.
Oss 1.5.3: Dato il G-fibrato P , la costruzione di quello associato con fibra F
pu essere fatta in maniera alternativa definendo lo spazio totale come quoziente
di un prodotto. Pi precisamente, se lazione di G su F (lomomorfismo di
G in un opportuno gruppo di trasformazioni di F che ne definisce lazione), si
indica con P F lo spazio P F quozientato sulla relazione di equivalenza
data da (u, f ) (u g, (g)1 f ); ben definita una mappa di proiezione
e data

CAPITOLO 1. FIBRATI

16

da [(u, f )] 7 (u). Una trivializzazione locale i di P pu essere impiegata per


definirne una di questa nuova mappa: si definisce i (p, f ) = [(i (p, e), f )]. Se
j una trivializzazione il cui dominio interseca quello di i , varr:
j (p, f ) = [(j (p, e), f )] = [(i (p, tij (p)), f )] =
= [(i (p, e) tij (p), f )] = [(i (p, e), (tij (p)) f )] = i (p, (tij (p)) f )
Dunque le mappe di transizione di questo fibrato sono le stesse di P .
Questa costruzione esplicita sar utile studiando le connessioni per far ereditare a P F della struttura definita su P .
Vale la pena osservare che esiste una corrispondenza biunivoca
tra le sezioni

di P F e le mappe P : P F che soddisfano P u g 1 = (g) P (u). Sia
data ad esempio una sezione del fibrato. Allora per ogni u P esiste un unico
f F tale che ((u)) sia la classe di (p, f ): sia f = P (u). Per ogni g G la
proiezione di u g uguale a quella di u, e di conseguenza ((u)) = ((u g)),
e (u g, f 0 ) rappresenta la stessa classe di (u, f ) se e solo se f 0 = (g)1 f . Data
invece una mappa P con le propriet richieste immediato verificare la buona
definizione di (p) = [(u, P (u))] per qualsiasi u Fp .
Un risultato interessante il seguente:
Thm 1.5.4: Un fibrato vettoriale di dimensione n con gruppo G = GL(V )
banale se e solo se ammette n sezioni linearmente indipendenti.
Questo segue da un altro teorema, tenendo conto del fatto che un G-fibrato
banale se e solo se lo un suo associato:
Thm 1.5.5:
globale.

Un fibrato principale banale se e solo se ammette una sezione

Dim: Il G-fibrato banale M G, fissato un qualsiasi elemento g G, ammette


lovvia sezione s : p 7 (p, g).
Sia ora s una sezione globale del G-fibrato P . Sar ben definita una mappa
f : M G P data da:
f (p, g) = s(p) g
La differenziabilit di f discende da quelle di s e dellazione; le propriet di
questultima mostrano anche la sua bigettivit. Linversa pu essere scritta
localmente come composizione di mappe C , e risulta quindi anchessa differenziabile. Dunque f un diffeomorfismo tra M G e P , e per costruzione
preserva le fibre: un isomorfismo di fibrati.

Anche quando un fibrato principale non banale, emulando la dimostrazione


appena vista si pu dare una procedura per costruire in modo naturale, data una
sezione locale s, una trivializzazione sul suo dominio. Si usa chiamare canonica
questa banalizzazione.
Dim (Teorema 1.5.4): sufficiente mostrare che in un fibrato vettoriale E n
sezioni globali indipendenti corrispondono ad una sezione globale del principale
associato: questo equivalente alla banalit di P , che a sua volta coimplica
quella di E. Se V la fibra di E, una base di V induce un isomorfismo tra V ed

CAPITOLO 1. FIBRATI

17

Rn e uno tra GL(V ) e GLn (R) che indico con , il quale anche diffeomorfismo.
Sia { (Ui , i ) }iI un ricoprimento banalizzante di E con mappe di transizione
tij , le (tij ) definiscono una famiglia di mappe di transizione per un fibrato E 0
su M con fibra Rn e gruppo GLn (R). Se le i sono le trivializzazioni locali
naturalmente associate alla costruzione di E 0 ben definita una mappa f : E
E 0 tale che per ogni i
f (i (p, v)) = i (p, (v))
Infatti, se p Ui Uj , vale
j (p, (v)) = i (p, (tij (p)) (v)) = i (p, (tij (p) v))
f un diffeomorfismo e preserva le fibre, ed quindi un isomorfismo di fibrati.
In maniera analoga si mostra che il fibrato P 0 associato ad E 0 isomorfo a P
tramite una mappa naturale definita nello stesso modo di f .
Lipotesi ulteriore che V sia Rn e che G sia GLn (R), dunque, non lede la
generalit dellenunciato. Siano ora s1 , . . . , sn sezioni globali indipendenti su E,
e per ogni aperto banalizzante Ui , p Ui , sia vik (p) tale che
k
1
i (sk (p)) = (p, vi (p))

Detta Mi (p) la matrice ottenuta accostando gli n vettori colonna vik (p), risulta
ben definita la mappa
(p) = i (p, Mi (p))
Dato che i vik (p), fissati p e i, formano una base di Rn , Mi (p) una matrice
invertibile. La verifica della buona definizione di , a questo punto, immediata:
dalle sk si ricava quindi una sezione globale di P . La costruzione vista, infine,
pu essere invertita per mostrare limplicazione inversa.

1.6

Curiosit e considerazioni a posteriori

Es 1.6.1 (Il teorema della palla pelosa): Una conseguenza dellultimo teorema enunciato, ad esempio, lequivalenza tra il cosiddetto teorema della palla
pelosa, secondo il quale ogni campo vettoriale tangente ad S 2 si annulla almeno
in un punto, e la non banalit del fibrato tangente di S 2 . Infatti, se esistesse
un campo tangente mai nullo sarebbe facile costruirne un secondo ortogonale
ad esso, e questi darebbero due sezioni globali indipendenti del fibrato tangente. Per dimostrare il teorema, quindi, sufficiente studiare T S 2 , o anche il suo
principale associato.
Sia : SO3 S 2 la mappa data da g 7 g e1 , dove la sfera quella unitaria
in R3 , ed e1 il primo vettore della sua base canonica. Dato che lazione C ,
differenziabile. Si avr che Tg SO3 = Lg (TId SO3 ) per ogni g, dove Lg
la naturale azione destra di g su SO3 : identificando TId SO3 con lalgebra di
Lie so3 , e indicando con Jei i suoi generatori standard, si ottiene che per ogni
g G il tangente in g generato dai Lg Jei . Siano inoltre i le curve date da
Lg exp(tJi ) per un certo g fissato. Con questa notazione facile mostrare che
il differenziale di surgettivo, e che la fibra di ogni punto diffeomorfa ad S 1 :
avr che 2 e 3 sono trasversali in quanto giacciono su piani distinti la cui

CAPITOLO 1. FIBRATI

18

intersezione ortogonale a T(g) S 2 (rappresentano le due rotazioni attorno agli


assi dati da g e2 e g e3 ), e i loro vettori tangenti al tempo 0 generano T(g) S 2 ,
da cui la surgettivit di d. Inoltre, (h) = (g) se e solo se (h1 g) = e1 ,
cio h1 g fissa e1 sulla sfera. Questo significa che la fibra di (g) il laterale
g SO2 , dove SO2 identificato con il sottogruppo di Lie di SO3 delle rotazioni
di Span(e2 , e3 ): ogni fibra quindi diffeomorfa a SO2 ' S 1 .
Dato un punto p S 2 \ { e1 } possibile costruire in modo canonico una
rotazione gp della sfera
p che manda e1 in p, scegliendo quella che fissa lortogonale.
Se p = (x, y, z), r = y 2 + z 2 e = arccos(x), tale rotazione data da


yJe2 + zJe3
gp = exp
r
e dipende quindi in maniera liscia da p, e questo vale anche scegliendo ge1 = Id.
Questo permette di costruire la trivializzazione C di tramite la mappa
1 :(S 2 \ { e1 }) SO2
(p, )

- SO3
- gp

In maniera analoga pu essere definita 2 su S 2 \{ e1 }, associando ad ogni punto


una rotazione che vi mandi e1 anzich e1 . A questo scopo basta considerare
gp e scegliere 2 (p, ) = gp . Questo dimostra che la definita sopra definisce
una struttura di fibrato; non stato per imposto che sia principale, cio che
il gruppo strutturale sia S 1 . In effetti, con questa scelta delle trivializzazioni
questo non vale: se 1 (p, ) = 2 (p, ), allora:
gp = gp = = gp1 gp
Le mappe di transizione sono dunque della forma gp1 gp , che non una rotazione di Span(e2 , e3 ) poich ne inverte lorientazione (e1 va in e1 ). Se allora
h = exp(Je2 ), cio la rotazione di un angolo piatto intorno allasse di e2 ,
modificando 2 in modo che sia
2 (p, ) = gp h
le mappe di transizione diventano della forma
gp1 gp h
e sono in effetti rotazioni del piano.
SO3 , dunque, stato fornito di una struttura di fibrato principale su S 2
con fibra tipica S 1 , identificata con il gruppo delle rotazioni del piano ortogonale a e1 . Inoltre, si pu dimostrare che questo fibrato isomorfo a quello
associato a T S 2 . In effetti, il tangente della sfera ammette delle trivializzazioni
locali costruite in modo analogo a 1 e 2 : identificando nuovamente R2 con
Span(e2 , e3 ), siano:
1 (p, v) = gp (v)2 (p, v) = (gp h)(v)

(1.1)

dove i domini delle 1 sono quelli ovvi. A questo punto evidente, avendo
definito le trivializzazioni dei due fibrati in analisi come lazione di uno stesso

CAPITOLO 1. FIBRATI

19

oggetto sugli elementi delle rispettive fibra tipiche, che le mappe di transizione

sono le stesse. SO3 S 2 quindi isomorfo al fibrato principale associato a


2
TS .
Infine, quello introdotto ora non un fibrato banale: se lo fosse, il suo spazio
totale sarebbe diffeomorfo a S 2 S 1 , cosa che per non vera. Esiste infatti
un omomorfismo continuo e surgettivo da S 3 , come sottogruppo moltiplicativo
del corpo dei quaternioni, su SO3 , dato dallazione per coniugio sulliperpiano
dei quaternioni puramente immaginari. Il nucleo di tale morfismo { Id },
e si pu mostrare che la topologia quoziente di S 3 / { Id } la stessa di SO3 .
Questo spazio, quindi, ottenuto come quoziente di S 3 (il quale semplicemente connesso) per lazione propriamente discontinua del gruppo generato dalla
mappa antipodale. Tale gruppo isomorfo a Z/2Z, e per un teorema sulla teoria dei rivestimenti si ha che questo isomorfo al primo gruppo di omotopia si
SO3 . Daltronde, 1 (S 2 S 1 ) isomorfo al prodotto diretto dei singoli gruppi di
omotopia, ed quindi { Id } Z ' Z. Dunque SO3 non omeomorfo a S 2 S 1 ,
e di conseguenza i due fibrati non sono isomorfi.
Es 1.6.2 (Ancora sul corpo rigido): Alla luce di quanto visto fin qui si possono
fare diverse osservazioni sullesempio 1.1.2. chiaro che, in entrambi i casi,
loggetto che occorreva formalizzare un fibrato, rispettivamente su R3 e su S 2 ,
con fibre SO3 e SO2 ' S 1 . Da quanto detto risultava intuitivamente chiaro che
il primo possa essere scritto come R3 SO3 , mentre non era ancora evidente se
valga una condizione analoga per il secondo: con il linguaggio ora introdotto si
pu dire che il primo un fibrato banale, e che non ovvio se lo sia anche il
secondo.
I due gruppi SO3 ed S 1 erano stati introdotti per esprimere le simmetrie di
oggetti che si muovono tangenzialmente agli spazi in analisi: una rotazione di
questi oggetti corrisponde ad una dello spazio tangente ad R3 o ad S 2 rispettivamente. Osservato questo, se ne conclude che i fibrati che occorrono in queste
situazioni sono quelli principali associati a T R3 e a T S 2 . Stando cos le cose,
la congettura che il primo fosse banale dimostrata, mentre il secondo non pu
esserlo.
Unaltra osservazione interessante questa: il modo in cui sono state costruite le trivializzazioni locali di questi fibrati (per quanto non fossero stati definiti
come tali) in sostanza quello menzionato nel precedente paragrafo, sulla falsa
riga della dimostrazione del teorema 1.5.5. Infatti, una volta scelto un punto
di T R3 stato riconosciuto un modo canonico per costruire a partire da questo
una sezione (in questo caso globale) del fibrato, e da questa la banalizzazione.
Trattando il caso della sfera, invece, non era evidente come scegliere una tale
sezione in modo che fosse globale (in effetti un tale oggetto non esiste, come visto), ma stato comunque possibile mettere in evidenza la struttura di fibrato
scegliendone due locali.
Lipotesi che i moti di rotazione fossero tangenziali allo spazio, fatta in questi due casi, non generale. Ad esempio, nel secondo caso si sarebbe potuto
assumere che il corpo potesse ruotare liberamente intorno al proprio baricentro:
il fibrato che descrive questa situazione non quello associato al tangente di
S 2 . In questo caso, una rotazione delloggetto pu essere associata ad una dello
spazio tangente nei punti di S 2 , ma non alla sfera stessa, bens ad R3 , in cui essa
immersa. In questo modo appare evidente che loggetto giusto il fibrato

CAPITOLO 1. FIBRATI

20

associato al pullback di T R3 tramite lembedding della sfera nello spazio tridimensionale. Tale fibrato, peraltro, banale: il pullback menzionato ammette
tre sezioni globali ortonormali date da quelle di T R3 .
Costruzioni di questo tipo possono essere applicate spesso in fisica per esprimere le simmetrie di un dato sistema meccanico. Negli esempi visti sopra il
fibrato considerato quello associato a un tangente: questultima condizione
specifica di queste situazioni, e in generale i fibrati considerati saranno s
principali, ma senza il bisogno che siano associati ad altri pi semplici.

Capitolo 2

Connessioni
Da qui in avanti adotter la convenzione di Einstein per le sommatorie: se in
prodotto compare due volte lo stesso indice, una volta in alto e una in basso, si
intende che la quantit vada sommata su tutti i possibili valori di quellindice,
salvo indicazioni contrarie.

2.1

Motivazioni; principio dinerzia

In uno spazio affine A i vettori sono definiti in modo astratto come elementi
della sua giacitura V : si pu sempre parlare di vettore da un punto a un altro
o di vettore applicato a un punto senza bisogno di dare ulteriori specificazioni
sullo spazio a cui questi appartengono, perch si tratta sempre dello stesso (la
giacitura per lappunto). In questo modo non c difficolt nel definire i campi
vettoriali come funzioni da A in V , n vi alcuna ambiguit quando si parla
di campi costanti. Inoltre, spazi di questo tipo ereditano da Rn anche una
struttura differenziale, tramite la quale lo spazio tangente in qualsiasi punto
canonicamente isomorfo alla giacitura. La nozione di campo vettoriale, in questo
contesto, ben definita senza bisogno di distinguere un tangente per ogni punto,
n occorre introdurre alcuna struttura ulteriore sulla collezione di questi spazi:
in definitiva non evidente il bisogno di parlare di fibrati.
In una generica variet M le cose non sono cos semplici: vettori tangenti
in punti distinti non possono essere confrontati, n tanto meno sommati, in
quanto appartengono a spazi definiti separatamente. Questa la ragione per
cui, in principio, stato definito il fibrato tangente. Passando a contesti pi
ampi, poi, ci si pu imbattere in altre situazioni che si presentano lo stesso
problema, ossia in cui ha senso considerare in ogni punto di M una copia di un
certo oggetto F , ma per qualche ragione necessario tenerle tutte distinte al
variare del punto in considerazione. La nozione di fibrato stata introdotta in
definitiva per risolvere questo problema, e ha permesso di definire come sezioni
di una certa mappa le funzioni che a ogni punto assegnano un elemento della
sua copia di F .
Si pone per un altro problema: mentre nel caso degli spazi affini ha senso parlare di campi vettoriali costanti, questo non possibile in generale, dal
momento che vettori applicati in punti distinti non possono essere confrontati.
Lintroduzione del fibrato tangente, in questo caso, non di aiuto: questo
21

CAPITOLO 2. CONNESSIONI

22

definito come uno spazio localmente diffeomorfo a U Rn , U aperto in M , ma


per avere unidentificazione tra il tangente in un punto e lo spazio delle coordinate c bisogno di una trivializzazione locale. Questa nella maggior parte dei
casi non canonica: non stato stabilito alcun criterio per preferire una banalizzazione ad unaltra, e anzi sono state introdotte le mappe di transizione per
confrontarle nel caso in cui non sia possibile sceglierne una particolare. Inoltre,
quando un fibrato tangente non banale (come si visto nel caso della sfera,
ad esempio), non esiste unidentificazione globalmente coerente. Tutte queste
considerazioni valgono in generale per fibrati qualsiasi.
Un altro oggetto che perde di significato passando da spazio affine a variet
quello di retta. I primi sono definiti come oggetti su cui la giacitura agisce
secondo determinate regole, ed ha sempre senso, dati un punto p e un vettore
non nullo v, considerare la famiglia del punti della forma p + v al variare di
su R, e chiamare retta questo oggetto, come sottoinsieme su cui Span(v)
agisce secondo le stesse regole degli spazi affini. Nel contesto delle variet,
invece, i vettori naturalmente legati agli spazi hanno un significato diverso, e il
loro ruolo quello di descrivere landamento delle curve passanti per un dato
punto. Se negli spazi affini ha senso introdurre questo secondo significato dando
loro una struttura differenziale, il contrario non vale: in una generica variet
non ovvio come dare unazione dello spazio tangente in modo da poter fare
costruzioni analoghe. Cambiano leggermente punto di vista, per, e pensando
alle rette affini come curve parametrizzate, esse rappresentano le soluzioni di
una particolare classe di problemi di Cauchy: quelli della forma
(
= v
(0) = p
In altre parole, le rette sono le curve integrali dei campi costanti. Questo riconduce al problema precedente, ossia quello di stabilire cosa significhi che un
campo costante: se non ha senso questo, non nemmeno possibile parlare di
rette come curve con vettore tangente costante.
Da un punto di vista fisico questa osservazione costituisce un problema non
indifferente, poich compromette il senso del principio di inerzia, secondo il quale un corpo lasciato a se stesso conserva il proprio stato di moto o di quiete,
cio in definitiva la propria velocit (come grandezza vettoriale). Lintuizione
suggerisce che lo spazio fisico possa essere descritto come R3 (affine), e in questo modo la formulazione del principio dinerzia secondo cui un corpo che non
venga perturbato da alcuna forza ha velocit costante ha effettivamente senso.
Appena si abbandona questo modello, per, essa perde di significato, e in effetti
limitandosi a questo si corre il rischio di essere troppo restrittivi.
Tanto per cominciare, riprendendo la situazione dellesempio 1.1.2, ci si pu
chiedere che significato assuma il principio dinerzia per un corpo vincolato a
muoversi su di una sfera (o su una generica superficie) se si dimentica lo spazio
circostante e ci si restringe a questa. chiaro che in queste condizioni loggetto
non potr muoversi in linea retta come si abituati a vedere in R3 . Si potrebbe
obiettare che si tratta di un esempio artificioso, e che di fatto un tale corpo
soggetto alle forze vincolari della superficie, e perci non costituisce una seria
minaccia al principio dinerzia, ma vale sempre la domanda: che significato pu
assumere tale principio se si considerano spazi diversi da R3 ?

CAPITOLO 2. CONNESSIONI

23

La seguente considerazione pu essere pi illuminante: perch, nonostante


la nostra percezione sia locale, assumiamo che lintero spazio possa essere rappresentato da R3 ? In effetti questa ipotesi non ben giustificata, e sarebbe del
tutto legittimo descrivere lo spazio come una generica 3-variet Riemanniana.
In questo modo, anche se le regioni che consideriamo si comportano come uno
spazio affine, nulla vieta che problemi su scala pi ampia impongano un punto
di vista diverso, e, ancora una volta, vanifichino la nostra formulazione del principio dinerzia, almeno da un punto di vista teorico. Occorrerebbe dunque un
oggetto che permetta di esprimere lidea che un certo campo vettoriale (in questo caso la velocit) definito almeno lungo una curva rimanga costante lungo
di essa, bench i valori assunti istante per istante non possano essere confrontati.
Questo soltanto un esempio, in un contesto limitato, di come si renda
necessario uno strumento per studiare alcune propriet dei campi vettoriali.
In generale, dato un fibrato, pu essere interessante domandarsi anche cosa
significhi che una certa sezione non vari lungo una data curva. A questo scopo
vengono introdotte le connessioni.

2.1.1

Il punto di vista delle coordinate

Nella definizione di variet, o di struttura differenziabile, richiesta lesistenza locale di sistemi di coordinate compatibili, nel senso che i cambi di carta
debbano essere C . La maggior parte delle argomentazioni che si fanno oggi
nello studio di questi oggetti, le coordinate sono viste come oggetti transitori
che vengono introdotti alloccorrenza e dimenticati appena possibile. Esiste un
punto di vista, caro alla tradizione passata, utile in alcuni contesti, e largamente
impiegato in fisica, che si concentra invece sulle coordinate, e secondo il quale
molti oggetti vengono definiti attraverso di esse. Ad esempio, campi vettoriali,
tensoriali e forme differenziali vengono introdotti attraverso le regole secondo
cui le coordinate di questi oggetti variano nel passaggio da un sistema di coordinate a un altro. In questo modo, il vettore tangente a una curva definito,
in un particolare sistema di coordinate xk (k = 1, . . . , n), dallespressione:
=

dxi
ei
dt

dove xi (t) sono le coordinate del punto (t), mentre il differenziale di una
funzione scalare , come forma differenziale, definita da:
d =

i
dx
xi

In questottica, gli oggetti vengono confusi con le loro rappresentazioni in


coordinate, e una stessa quantit, se misurata rispetto a sistemi diversi, pu
cambiare. Questo principio ben evidente in contesto fisico: le coordinate di
uno stesso vettore cambiano a seconda dello specifico sistema di riferimento, e
la forma di una stessa funzione pu cambiare nello stesso modo. Si dir che
una funzione scalare, o semplicemente uno scalare, se le sue rappresentazioni
in coordinate si corrispondono per valore: ad esempio, la temperatura soddisfa
questa condizione, mentre una funzione hamiltoniana, in generale, la viola. Questa definizione equivale sostanzialmente alla richiesta che sia una ben definita
funzione su M , a valori reali. Date n funzioni scalari, poi, chiaro che queste

CAPITOLO 2. CONNESSIONI

24

non possano in generale rappresentare le coordinate di un vettore: le funzioni


costanti ad esempio hanno la medesima rappresentazione in qualsiasi sistema,
ma evidente che il campo ek , fissato qualche k, dipende fortemente dalla scelta
delle coordinate, bench sia identificato dalln-upla di funzioni costanti i ik .
Si dir dunque che una famiglia di funzioni rappresentate da X k rispetto a un
h
dato sistema di coordinate xk e da X rispetto a xh se vale
h

X =

xh k
X
xk

Questa lusuale regola di cambiamento di coordinate per i vettori. Adottando


la definizione intrinseca di spazio tangente, questo risultato pu essere dimostrato come teorema: secondo questo punto di vista assume invece il valore di
una definizione. In maniera analoga si parla di campi tensoriali qualsiasi, ed
da questo contesto che nascono le espressioni di vettori co- e controvarianti:
un vettore non definito in maniera intrinseca, ma come una collezione di coordinate, e la sua natura determinata dalle regole con cui queste trasformano se
misurate rispetto a sistemi diversi.
In questo punto di vista il problema sollevato nel precedente paragrafo, cio
quello di confrontare vettori in punti diversi o di studiare il parallelismo di un
campo lungo una curva, potrebbe non essere tanto evidente. Si potrebbe essere
tentati, dati un campo vettoriale X, una curva e un sistema di coordinate in
un opportuno intorno di (0), di definire la derivata di X lungo come il vettore
che abbia per componenti le derivate temporali delle componenti di X((t)). Se
nellottica precedente tutto questo non poteva essere fatto per un problema di
cattiva definizione, ora tutto questo ha senso ed lecito: la rappresentazione
di X in coordinate non altro che una funzione definita su un aperto di Rn e
a valori in Rn , mentre la rappresentazione di una curva in questo aperto,
lungo la quale ha senso derivare la definizione. Quello che non vero in generale,
per, che ci che si ottiene sia un vettore nel senso ora introdotto: non
detto cio che questa operazione, rispetto a due sistemi distinti, dia risultati
compatibili, cio che si ottengano oggetti che variano secondo le date regole di
trasformazione. In effetti, si pu verificare che:
j

2 xj xl h xj xl X h
X
=
X +
k
xl xh xk
xh xk xl
x

(2.1)

e la violazione alla regola di trasformazione data dal primo termine della


quantit a destra. Dunque non ben definita la derivazione del campo lungo
la direzione data da ek , nel senso che loggetto che si ottiene non di natura
vettoriale. Un modo per aggirare questo ostacolo quello di definire un nuovo
operatore differenziale che faccia le veci dellusuale derivata parziale, in modo
che il termine indesiderato sia dovuto alla trasformazione delloperatore, e non
a quella delloggetto ottenuto per derivazione.
Questo punto di vista trattato in maniera approfondita e dettagliata (presentando anche i calcoli qui omessi) in [5].

2.2

Connessioni affini

Alla luce delle considerazioni fatte nel precedente paragrafo, occorre definire un
oggetto che consenta di stabilire quando un certo campo vettoriale tangente a

CAPITOLO 2. CONNESSIONI

25

una variet M definito su una curva sia parallelo a se stesso in ogni punto,
e in caso contrario di misurarne la variazione nel tempo. Prima di definire assiomaticamente un simile strumento utile considerare un caso particolarmente
semplice: quello delle variet immerse in Rn .

2.2.1

La derivata covariante in sottovariet di Rn

Sia M unipersuperficie di Rn , cio una sottovariet di dimensione n 1. Nei


corsi istituzionali di introduzione alla geometria sono stati definiti la mappa
di Gauss associata ad una parametrizzazione regolare e loperatore forma, o di
Weingarten 1 . Richiamo rapidamente che la prima definita come lapplicazione che assegna ad ogni punto di un aperto parametrizzato di M lunico vettore
unitario N ortogonale ad essa che completi a base positiva quella indotta sul tangente dalle coordinate locali. N (p) ha una dipendenza multilineare e alternante
dagli elementi del riferimento su Tp M e pertanto d una mappa differenziabile
a valori in S n1 definita sullaperto. Il tangente ad M in p e quello alla sfera nella sua immagine coincidono (come sottospazi vettoriali di Rn ), pertanto
lapplicazione lineare indotta L pu essere vista come un endomorfismo di Tp M ,
che porta il nome appunto di operatore di Weingarten. Esso autoaggiunto rispetto al prodotto scalare naturalmente indotto da quello standard dello spazio
ambiente, e per il teorema spettrale ammette una base ortonormale di autovettori, detti direzioni principali, mentre gli autovalori, tutti reali, si chiamano
curvature principali. Il loro prodotto, ossia il determinante di L, porta il nome
di curvatura gaussiana di M .
Dora in avanti adotter la convenzione, comune nel linguaggio delle variet
C , per cui lo spazio tangente ad M in un punto quello delle derivazioni.
In questo modo, la velocit (t)

di una curva identificata con loperatore che


assegna ad ogni funzione f : M R la derivata di f al tempo t. Per un
generico vettore X Tp M , quindi, la notazione Xf assume questo significato,
a meno di scegliere unopportuna curva che passi per p al tempo 0 con velocit
X; f X, invece, indica lusuale prodotto per scalare di X per il valore di f in p.
Se Y un campo vettoriale definito in un intorno di p M , X un vettore in
p, lo strumento pi immediato per valutare la variazione di Y lungo X in p la
derivata direzionale del campo come applicazione da M in Rn . Questo d come
risultato un nuovo vettore DX Y di Rn . Se X e W sono vettori in un punto p,
Y , Z campi vettoriali ed f una funzione, definiti in un intorno di p, vale:
DX (Y + Z) = DX Y + DX Z
DX+W Y = DX Y + DW Y
DX (f Y ) = f DX Y + (Xf )Y

(2.2)

Df X Y = f DX Y
La seconda e la quarta propriet esprimono la linearit di DX Y come funzione della sola X, mentre la prima e la terza rappresentano un analogo per la
regola di Leibnitz per D, e cio il fatto che questo operatore agisce su Y come
una derivata. Se poi X un campo liscio, anche quello cos ottenuto lo .
Va osservato che, in generale, loperatore D non d vettori tangenti a M : se
ad esempio (t) la curva piana data da (cos(t), sin(t)), il suo vettore velocit
1 Questo

per le superfici regolari in R3 , ma non c difficolt nel passaggio al caso generale.

CAPITOLO 2. CONNESSIONI

26

Y (t) = ( sin(t), cos(t)), e D(0)


Y (t) = ( cos(t), sin(t)), che non tangente

alla circonferenza parametrizzata da . Daltra parte, un qualsiasi vettore in un


punto di M pu essere decomposto in modo unico come somma di uno tangente
alla variet ed uno ortogonale ad essa, e ha perfettamente senso la seguente:
Def 2.2.1 (Derivata covariante): Siano p un punto di una sottovariet M di
Rn , X un vettore tangente ad M in p e Y un campo definito in un intorno di p
(in M ). Si chiama derivata covariante di Y lungo X il vettore DX Y dato dalla
componente di DX Y tangente ad M .
Loggetto cos definito valuta la derivata di Y , come mappa in Rn anzich
come sezione del fibrato tangente, lungo qualsiasi curva che abbia velocit X,
e ne trascura la componente ortogonale ad M . Euristicamente, linformazione
che si ottiene in questo modo la variazione di Y che potrebbe essere misurata
da un osservatore che vive in M senza accorgersi che questa immersa in Rn .
Dati X ed Y come sopra, varr costantemente hN, Y i = 0, da cui:
0 = X hN, Y i = hN, DX Y i + hL(X), Y i
Questo implica che la coordinata di DX Y ortogonale ad M (data dal prodotto
scalare con N essendo questo unitario e ortogonale a Tp M ) data dallopposto
di hL(X), Y i, e dunque che
DX Y = DX Y + hL(X), Y i N = DX Y + hX, L(Y )i N
Questa relazione porta il nome di equazione di Gauss. Dalla linearit di L segue
che la derivata covariante gode delle stesse propriet enunciate per D.
La definizione ora data fornisce gi uno strumento utile per formalizzare il
semplice problema fisico del moto vincolato, e in definitiva di formulare il principio dinerzia per punti materiali soggetti a vincoli olonomi. Un oggetto libero
di muoversi nello spazio tridimensionale, cio su cui non agisca alcuna forza
esterna, soddisfa la relazione v = 0, dove v indica il vettore velocit. Se invece
il moto ristretto a una superficie, lassenza di altre forze che quella di reazione
del vincolo equivalente alla richiesta che laccelerazione sia ortogonale a questo: la condizione dunque che Dv v abbia componente tangenziale nulla ad ogni
tempo, cio Dv v = 0. In questo modo, quindi, il principio dinerzia conserva
la sua forma originale, a meno di considerare la derivata della velocit lungo la
traiettoria in un senso diverso da quello solito: occorre impiegare la nuova derivata covariante, naturalmente legata alla struttura del vincolo, anzich quella
usuale a cui si abituati in R3 .
Siano dati X, Y e Z campi vettoriali qualsiasi, definiti su uno stesso intorno
(in Rn ) di un punto p. Applicando la definizione di derivata di Lie a ciascuna
componente di Z si ottiene:
DX (DY Z) DY (DX Z) D[X,Y ] Z = 0
Se si suppone che i tre campi siano tangenti ad unipersuperficie in Rn , la derivata direzionale D pu essere riscritta tramite lequazione di Gauss in termini
della derivata covariante D e della metrica riemanniana che M eredita dallo
spazio ambiente. Sostituendo nella relazione appena scritta e ricomponendo Z

CAPITOLO 2. CONNESSIONI

27

si ottiene:

DX (DY Z) = DX DY Z hL(Y ), Zi N =

= DX DY Z hL(Y ), Zi N hL(X), DY Xi N =
= DX DY Z hL(Y ), Zi L(X) (X hL(Y ), Zi + hL(X), DY Xi)N
DY (DX Z) = DY DX Z hL(X), Zi L(Y ) (Y hL(X), Zi + hL(Y ), DX Y i)N
D[X,Y ] Z = D[X,Y ] Z hL([X, Y ]), Zi N
Sommando e separando i contribuiti tangenziali ad M da quelli ortogonali
si ottengono le equazioni:
DX DY Z DY DX Z D[X,Y ] Z = hL(Y ), Zi L(X) hL(X), Zi L(Y )
DX L(Y ) DY L(X) L([X, Y ]) = 0

(2.3a)
(2.3b)

dove nella (2.3b) sono stati sommati i coefficienti con cui compariva N nella
somma, e sono state applicate la bilinearit del prodotto scalare e larbitrariet
di Z. La (2.3a) si chiama equazione della curvatura di Gauss, la (2.3b), invece,
equazione di Codazzi (o Codazzi-Mainardi).
Lequazione della curvatura di Gauss mette in evidenza che, dati X, Y e Z
tangenti ad M , in un punto p fissato loggetto
R(X, Y )Z := DX DY Z DY DX Z D[X,Y ] Z
dipende solo dai valori dei campi in p, ed lineare in ciascuno argomento.
Inoltre, R espresso in termini della sola derivata covariante, senza riferimenti
espliciti allembedding di M in Rn (a cui loperatore di Weingarten prodondamente legato), e sembra in qualche senso definito a partire dalla sola struttura
intrinseca di M dato che, come osservato sopra, la stessa derivata covariante
stata introdotta nel tentativo di studiare delle propriet delle superficie che
prescindono dalla sua immersione.
Un risultato classico ed interessante il seguente:
Thm 2.2.1 (Theorema Egregium di Gauss): La curvatura di una superficie
in R3 pu essere espressa in termini della metrica riemanniana e della derivata
covariante.
Dim: Se p M e X, Y Tp M formano una base ortonormale, allora K(p), la
curvatura gaussiana in p, data da hR(X, Y )Y, Xi. Infatti:
hR(X, Y )Y, Xi = hhL(Y ), Y i L(X) hL(X), Y i L(Y ), Xi =
= hL(Y ), Y i hL(X), Xi hL(X), Y i hL(Y ), Xi = det L = K(p)

La curvatura gaussiana di unipersuperficie stata inizialmente definita a


partire dalloperatore di Weingarten: ora questo teorema mostra che, almeno
nel caso particolare di superfici nello spazio tridimensionale, essa pu essere
espressa in termini di oggetti che, almeno euristicamente, sono legati alla natura intrinseca di M , cio alla sua metrica e alla derivata covariante. Si pu

CAPITOLO 2. CONNESSIONI

28

mostrare, poi, che questultima pu essere costruita a partire dalla metrica stessa, a prescindere dallimmersione e dalloperatore D dal quale era iniziata la
discussione (si veda la sezione 2.2.3). Di conseguenza, la curvatura gaussiana
pu essere espressa in funzione della sola metrica riemanniana della superficie,
bench inizialmente sia stata introdotta in termini di oggetti strettamente legati
allembedding.

2.2.2

Connessioni affini su variet generiche

Quanto visto nella sezione precedente, limitato al caso ristretto di ipersuperfici


in Rn , servir ora a giustificare delle nuove definizioni. Sia dunque M una
generica variet differenziabile.
Def 2.2.2 (Connessione affine): Per connessione affine su M si intende un
operatore D che, dati un vettore X Tp M e un campo Y in un intorno U di
p, assegna loro un vettore DX Y tale che soddisfi le condizioni (2.2). inoltre
richiesto che, se X un campo su U , DX Y definisca a sua volta un campo C .
Sono naturali, a questo punto, le seguenti:
Def 2.2.3 (Trasporto parallelo): Un campo vettoriale X definito lungo una
curva si dice parallelo (rispetto alla connessione D) se vale
DT X 0
T = essendo il vettore tangente a . Se X definito su un aperto, e soddisfa
la condizione data, si dice che parallelo lungo .
Def 2.2.4 (Geodetica): Una curva si dice geodetica se il suo vettore tangente
T parallelo:
DT T 0

Se e1 , . . . , en sono campi vettoriali linearmente indipendenti definiti in un


aperto U (cio formano una base del tangente che varia in modo liscio sullaperto), sono naturalmente definite n forme differenziali 1 , . . . , n caratterizzate
da h i , ej i = ji . Inoltre, la linearit di DX Y rispetto a X, saranno ben definite
delle forme ji caratterizzate da:
hji , Xi = h i , DX ej i
Questo consente di introdurre quello che si usa chiamare il punto di vista di
Cartan, che consiste nello studio delle connessioni per mezzo di forme differenziali. Questo punto di vista sar ripreso pi avanti per studiare i tensori
di curvatura e torsione, e poi ancora per proporre un collegamento tra la teoria delle connessioni su fibrati e il punto di vista locale adottato nelle teorie di
gauge.
Una volta dati campi ei come sopra, le propriet di D consentono di determinare completamente la connessione una volta noti i coefficienti kij definiti

CAPITOLO 2. CONNESSIONI

29

da:
Dei ej = kij ek
Infatti, se X = X i ei e Y = Y j ej , varr:
DX Y = DX (Y j ej ) =
= X(Y j )ej + Y j DX ej =
= X(Y j )ej + Y j DX i ei ej =
= (X(Y k ) + kij X i Y j )ek
Secondo il punto di vista di Cartan questi coefficienti kij sono quelli che individuano le forme ji : da hji , ek i = h i , Dek ej i = ikj segue luguaglianza
ji = ikj k .
Dato che ogni carta permette di definire una base del tangente in ciascun
punto dellaperto, ad ogni sistema di coordinate possono essere associati i coefficienti della connessione kij . evidente che, dato un aperto coordinato U
e una qualsiasi famiglia di n3 funzioni, esiste ununica connessione D su U i
cui coefficienti rispetto alle date coordinate siano quelle assegnate. Pu essere
interessante, dati due aperti coordinati con intersezione non vuota e delle funk
zioni kij e ij associate rispettivamente ai due sistemi, sotto quali ipotesi queste
famiglie definiscano la stessa connessione sullintersezione delle carte; equivalentemente, questo corrisponde a cercare le regole di trasformazione dei coefficienti
di una connessione.
Siano , coordinate definite su uno stesso aperto U , con
(p) = (x1 (p), . . . , xn (p))
(p) = (y 1 (p), . . . , y n (p))
e basi associate rispettivamente (ei ) ed (fj ). Allora vale:
fj =

xi
ei
y j
k

da cui, essendo rispettivamente kij e ij i coefficienti di D associati ai sistemi:


k

ij

xm
k
em =ij fk = Dfi fj =
y k
 h 
x
2 xh
xl xh
eh =
eh + i j Del eh =
=Dfi
j
i
j
y
y y
y y
 2 m

l
h
x
x x
=
+ i j m
em
y i y j
y y lh
k

Da questa relazione possibile ricavare ij , ricordando che lo Jacobiano del


cambio di carta invertibile:
k

ij =

xl xh y k m
2 xm y k
lh + i j m
i
j
m
y y x
y y x

(2.4)

Dunque questa la regola di trasformazione dei coefficienti di una connessione.


Daltra parte, naturalmente, dato un aperto coordinato U e una famiglia di

CAPITOLO 2. CONNESSIONI

30

funzioni kij , esister ununica connessione che abbia queste come coefficienti.
Questa potr essere estesa ad un altro aperto coordinato con altri coefficienti se
e solo se le due famiglie soddisfano la regola di trasformazione, poich solo in
questo caso definiscono la stessa connessione sullintersezione.
Il secondo termine della (2.4) somiglia a quello indesiderato in (2.1): in
effetti, sostituendo loperatore D alle derivate direzionali (mal definite) del
campo considerato in quel contesto, si ottiene una regola di trasformazione che,
tenendo conto della relazione tra i coefficienti della connessione nelle varie carte,
mostra che il risultato ottenuto in effetti un vettore, secondo il senso del punto
di vista delle coordinate.
Naturalmente, dare le regole di trasformazione per i coefficienti kij equivalente a dare quelle per le forme ji . Se le ij sono le forme associate al sistema
, ricordando che in questo caso i = dxi e j = dy j , si dovr avere:
i

ij =kj dy k =
 l

x xh y i m
2 xm y i y k a
=

+
dx =
y k y j xm lh y k y j xm xa

 m k

i
h

x
y y i
l x y
m
= a j
+
dxa =
y xm lh y k y j xa xm
 m
x
y i
xh y i m l
lh dx +
d
= j
=
m
m
y x
x
y j


y i
xm
xh y i m

+
d
= j
y xm h
xm
y j

(2.5)

Questa equazione d le condizioni affinch, date delle 1-forme su aperti della


variet, queste possano essere usate per costruire una connessione. Nel contesto
delle teorie di gauge questo punto di vista si rivela fondamentale.
Oss 2.2.2: Fissato un sistema di coordinate, le ji sono forme differenziali a
tutti gli effetti: lintroduzione delle loro regole di trasformazione resa necessaria
dal fatto che le forme associate a due carte sono a priori del tutto indipendenti.
Queste regole, quindi, non esprimono come siano rappresentate le ji di una carta
rispetto ad unaltra (il che sarebbe banale, perch le regole di trasformazione di
una 1-forma sono note), bens il legame tra queste e quelle di un altro aperto
coordinato.
La rappresentazione della connessione tramite questi coefficienti permette di
mostrare degli interessanti risultati di esistenza e unicit di campi paralleli e
geodetiche.
Thm 2.2.3: Sia data : [a, b] M una curva liscia, e sia X0 Tp M , con
p = (a). Allora esiste un unico campo vettoriale X definito lungo , parallelo
e tale che X((0)) = X0 .
Oss 2.2.4: Per campo vettoriale definito lungo intendo una mappa differenziabile definita su [a, b] che assegna a ogni t un vettore X(t) T(t) M . Secondo
il linguaggio dei fibrati, un oggetto come questo non altro che un sollevamento
di rispetto alla proiezione del fibrato tangente: quello che si cerca, infatti,

CAPITOLO 2. CONNESSIONI

31

una nuova curva, definita sullo stesso dominio di ma a valori nello spazio
totale del fibrato, in modo che X = . Non detto che un campo in questo
senso possa essere esteso un aperto contenente la traccia di : ad esempio la
curva potrebbe non essere iniettiva, e X potrebbe avere valori diversi a tempi
in cui questa passa dallo stesso punto.
Dim (teorema 2.2.3): Ogni punto t [a, b] ammette un intorno connesso
controimmagine di un aperto coordinato. A meno di scegliere unopportuna
famiglia finita di sottoinsiemi di questo tipo (la cui esistenza garantita dalla
compattezza dellintervallo), si pu supporre che la traccia di giaccia per intero
in un aperto coordinato.
Dato un generico campo vettoriale X, la sua derivata covariante lungo il
vettore T della velocit di espressa in coordinate da:



dX k
+ kij ((t))x i X j ek
DT X = T (X k ) + kij ((t))T i X j ek =
dt
dove le xi (t) rappresentano le coordinate di (t). Il problema del trasporto
parallelo dunque ricondotto a quello di Cauchy:

k
dX
+ kij ((t))x i X j = 0
(2.6)
dt
i
X (a) = X0i
Questo problema ammette ununica soluzione (per via del teorema di CauchyLipschitz), e questa pu essere estesa a tutto lintervallo poich lequazione
lineare.

Questo risutlato permette di parlare in maniera consistente di trasporto


parallelo di un vettore lungo una curva. Dati due punti p, q M , un arco
che li connette e un vettore X Tp M , quindi, possibile costruire un unico
X 0 Tq M per parallelismo lungo larco. Tuttavia, la scelta del cammino
tuttaltro che indifferente: il ruolo giocato da questa sar uno degli argomenti
del prossimo capitolo.
Thm 2.2.5: Se p M , X0 Tp M , esistono una costante reale positiva e
ununica geodetica : (, ) M passante in p al tempo 0 con vettore velocit
X.
Dim: Data una curva a valori in un intorno parametrizzato di p, con vettore
velocit T , vale:


DT T = T (T k ) + kij ((t))T i T j ek = x
k + kij ((t))x i x j ek
Una curva realizza dunque la tesi del teorema se e solo se
k
+ kij ((t))x i x j = 0

x
(0) = p

(0)

= X0

CAPITOLO 2. CONNESSIONI

32

Esplicitando le coordinate di questo sistema assume la forma di un problema


di Cauchy; da qui, nuovamente per il teorema di Cauchy-Lipschitz, si ha la tesi.

Una volta che sia data una connessione su una variet naturale cercare
di estendere loperatore in modo da poter derivare campi tensoriali generici,
anzich solo quelli vettoriali. Il principio guida in questa estensione sar la
regola di Leibnitz: come si richiesto che DX (f Y ) = X(f )Y + f DX Y , cos sar
naturale imporre che, dati campi tensoriali T1 e T2 valga
DX (T1 T2 ) = (DX T1 ) T2 + T1 (DX T2 )
oltre alle regole di linearit. Inoltre, se una 1-forma e Y un campo, naturale
chiedere che valga
X(h, Y i) = hDX , Y i + h, DX Y i

(2.7)

In coordinate, scegliendo X = ei , Y = ej e = dxk e applicando la (2.7) si


ottiene
0 = hDei dxk , ej i + kij
=
Dei dxk = ij k dxj
Queste regole sono sufficienti per determinare completamente la derivata covariante di qualsiasi campo tensoriale lungo una direzione.
I tensori di curvatura e torsione
Nel caso delle ipersuperfici lequazione di curvatura di Gauss permette di confrontare un oggetto espresso esclusivamente in termini della derivata covariante
con una che dipende dalla struttura metrica e dallimmersione, e questo consente in dimensione 2 di dimostrare il Theorema Egregium, secondo il quale la
curvatura dipende solo da questo oggetto (fissata la metrica).
Sia data una connessione su M , e siano fissati campi vettoriali X e Y . La
mappa
R(X, Y ) : Z 7 DX DY Z DY DX Z D[X,Y ] Z
fornisce un quarto campo il cui valore dipende linearmente da quello di Z puntualmente, e non da quelli assunti in un intorno. La linearit per somma
infatti evidente, mentre quella per prodotto per scalare data dalla somma di:
DX DY Z = f DX DY + X(f )DY Z + X(Y (f ))Z + Y (f )DX Z
DY DX Z = f DY DY Z Y (f )DX Z Y (X(f ))Z X(f )DY Z
D[X,Y ] Z = f D[X,Y ] Z [X, Y ](f )Z
Se poi e1 , . . . , en sono campi vettoriali indipendenti, la rappresentazione di Z
rispetto a questa base mostra che R(X, Y )Z in un punto p dipende solo dai
valori in p delle coordinate. Dunque R cos definito assegna ai campi vettoriali
X e Y un campo tensoriale del tipo (1, 1). Inoltre, R(X, Y ) dipende in modo
bilineare da X e Y (la verifica analoga a quella appena fatta e non presenta
alcun particolare interesse, pertanto la ometto). Dunque R un tensore del tipo
(1, 3) su M .
Def 2.2.5 (Tensore di curvatura):
tensore R dato da

Si chiama curvatura di una connessione il

R(X, Y )Z = DX DY Z DY DX Z D[X,Y ] Z

CAPITOLO 2. CONNESSIONI

33

Dalle propriet di linearit della derivata covariante rispetto alla direzione


e dallantisimmetria della parentesi di Lie immediato verificare che R alternante rispetto a X e Y . Per questa ragione si usa dire che la curvatura una
2-forma a valori in End(T M ).
In questa nuova notazione, lequazione di curvatura di Gauss scritta come:
R(X, Y )Z = hL(Y ), Zi L(X) hL(X), Zi L(Y )
Lequazione di Codazzi, invece, non pu essere espressa nello stesso modo,
poich le quantit coinvolte mescolano la derivata covariante con gli altri oggetti
legati alla struttura di variet immersa. Si usa per dare la seguente:
Si chiama torsione di una connessione il
Def 2.2.6 (Tensore di torsione):
tensore dato da:
Tor(X, Y ) = DX Y DY X [X, Y ]

Anche in questo caso le verifiche delle propriet di linearit sono immediate


e poco interessanti, e pertanto le ometto. Come per il tensore di curvatura,
anche questo antisimmetrico rispetto ai due argomenti.
Siano U un aperto ed e1 , . . . , en n campi vettoriali indipendenti, come nellintroduzione del punto di vista di Cartan. Le propriet di linearit e alternanza
dei tensori ora definiti consentono di rappresentarli come
R(X, Y )ej = Rji (X, Y )ei
Tor(X, Y ) = T i (X, Y )ei
dove le Rji e le T i sono opportune 2-forme. Queste saranno naturalmente legate
alle i e alle ji introdotte sopra: le equazioni che esprimono questa relazione
sono chiamate equazioni di struttura di Cartan, e sono equivalenti alle definizioni
dei tensori.
Rji (X, Y )ei =R(X, Y )ej =
=DX DY ej DY DX ej D[X,Y ] ej =
=DX ji (Y )ei DY ji (X)ei ji ([X, Y ])ei =
=X(ji (Y ))ei + ji (Y )ik (X)ek Y (ji (X))ei ji (X)ik (Y )ek +
ji ([X, Y ])ei =

= hdji , X, Y i + hki i jk , X, Y ei
Da qui si ricava una delle equazioni di Cartan:
dji = Rji ki jk

(2.8)

Laltra pu essere ottenuta in modo del tutto analogo dalla definizione di torsione:
d i = T i ji j
(2.9)

CAPITOLO 2. CONNESSIONI

34

Lultimo punto di vista ancora da analizzare quello delle coordinate. Supponendo che la base e1 , . . . , en sia quella indotta da un sistema di coordinate,
si avr
i = dxi
ji = ikj dxk
i
T i = Tjk
dxj dxk
i
Rji = Rjkh
dxk dxh

(2.10)

i
i
dove si pu facilmente riconoscere che Tjk
= T i (ej , ek ) e che Rjkh
= Rji (ek , eh ).
In questa notazione, le equazioni strutturali di Cartan assumono la forma:


ijk
ijh
i

+ irk rjh irh rjk


Rjkh
= dji + ri jr (ek , eh ) =
k
h
x
x

i
Tjk
= d i + ri r (ej , e, k) = ikj ijk
Confronto tra connessioni
e connessioni affini su una variet M . Applicando la definizione si
Siano D, D
pu mostrare facilmente che loperatore
e X Y := DX Y D
eX Y
(D D)
lineare in ciascuna entrata, anche per coefficienti non costanti. La linearit in
X segue infatti da quella di ciascuna connessione, cos come quella per somma
in Y . Inoltre, loperatore commuta con il prodotto per scalare in Y , infatti:
e X (f Y ) = (D D)
e X Y + X(f )Y X(f )Y = (D D)
e XY
(D D)
Da questo segue che la differenza B tra due qualsiasi connessioni su M un
campo tensoriale del tipo (1, 2). Inoltre, immediato verificare che, dati una
e definito
connessione D e un campo tensoriale T di tipo (1, 2), loperatore D
come D + T una connessione. Questo permette di considerare sullinsieme
delle connessioni su M una struttura di spazio affine su T21 (M ).
e sono due connessioni che definiscono lo stesso trasporto
Lemma 2.2.6: Se D, D
parallelo (cio tali che un campo X parallelo lungo rispetto a D se e solo se
e allora sono uguali.
lo rispetto a D),
Dim: Sia p M , con X0 , Y Tp M , e sia X il trasporto parallelo di X0 rispetto
a D lungo una curva che abbia Y come vettore tangente. Allora X parallelo
e e dunque
anche rispetto a D,
e Y X = B(Y, X(p)) = B(Y, X0 )
0 = DY X D
Per larbitrariet di X0 e Y si conclude che B 0, e dunque la tesi.

Questo risultato permette di affermare che una connessione affine biunivocamente determinata dal suo trasporto parallelo. Per verificare che due connessioni siano uguali, quindi, sufficiente mostrare che i campi paralleli rispetto
alluna lo sono anche rispetto allaltra, e viceversa.

CAPITOLO 2. CONNESSIONI

35

Il tensore differenza pu essere scomposto in maniera unica come somma


di uno simmetrico e uno antisimmetrico rispetto ai due indici covarianti. Sia
B = S + A tale scomposizione: una propriet interessante di A che pu essere
espresso in termini dei soli tensori di torsione delle due connessioni:
2A(X, Y ) = B(X, Y ) B(Y, X) =
e X Y DY X + D
e Y X [X, Y ] + [X, Y ] =
= DX Y D
g
= Tor(X, Y ) Tor(X,
Y)
particolarmente interessante il caso in cui B = A, cio B antisimmetrico: in questo caso, se una geodetica rispetto alla connessione D, varr
e T T = DT T B(T, T ) = DT T , e dunque una geodetica anche rispetto
D
e Viceversa, se le due connessioni hanno le stesse geodetiche, dato un veta D.
tore X qualsiasi varr B(X, X) = 0: per mostrarlo sufficiente considerare la
geodetica con velocit X al tempo 0.
Questo risultato mostra che non possibile ricostruire una connessione conoscendo solo le sue geodetiche: essa sar determinata a meno di un campo di
torsione. Inoltre, data una connessione qualsiasi possibile costruirne una con
le stesse geodetiche e torsione assegnata, e questa sar unica.

2.2.3

Il caso di variet riemanniane

Nel seguito, per ogni oggetto espresso tramite pi indici, indicher il simmetrizzato rispetto a due di essi racchiudendoli tra parentesi tonde, e lantisimmetrizzato con le quadre. Ad esempio, si potranno esprimere i coefficienti del tensore
di torsione come Tijk = 2k[ij] .
Il lavoro svolto finora costituisce un buon punto di partenza nella ricerca dello strumento che occorre per studiare problemi come quelli presentati allinizio,
poich mette in luce le propriet che deve avere loggetto cercato per soddisfare
le nostre richieste ed elabora alcuni aspetti di linguaggio utili nella sua manipolazione. Tuttavia, in quanto visto finora non stato presentato alcun risultato
di esistenza e unicit di connessioni, e anzi le ultime osservazioni del paragrafo
precedente mostrano che un tale risultato non pu esistere, a meno di imporre
delle ulteriori restrizioni sulla connessione da costruire. A priori non ci sono
delle condizioni naturali da aggiungere, ma nel caso in cui la variet su cui si
lavora abbia della struttura aggiuntiva pu darsi che sia questa a suggerirle.
Il contesto in cui si affrontano generalmente i problemi di meccanica quello
delle variet provviste di una metrica riemanniana o pseudo-riemanniana. In
questo caso ragionevole richiedere che, se X e Y sono campi vettoriali paralleli
lungo una curva , il prodotto scalare di questi sia costante. Tale condizione
pu essere espressa chiedendo che il tensore metrico sia parallelo lungo qualsiasi
direzione. Sia infatti una curva in un aperto coordinato di M con (0) = p,
X, Y campi vettoriali lungo ottenuti per trasporto parallelo di due vettori X0
e Y0 qualsiasi. Allora varr:
0 = DV (g(X, Y )) = V k (Dek g) = V k X i Y j (Dek g)ij
Dallarbitrariet dei tre vettori segue che
gij
hki ghj hkj gih = 0
xk

CAPITOLO 2. CONNESSIONI

36

Permutando ciclicamente gli indici i,j e k si ha


gki
hjk ghi hji gkh = 0
xj
gjk
hij ghk hik gjh = 0
xi
Con opportune combinazioni lineari di queste equazioni si ottiene:

gij
gki
gjk
h
h
+
+
+ Tki
ghj + Tkj
gih 2h(ij) ghk = 0
xk
xj
xi

Dato che il tensore gij ha rango massimo, esister g ij tale che gij g jk = ik :
questo permette di esplicitare h(ij) moltiplicando tutta lequazione per g hk /2.
Definendo
( )


h
gki
gjk
1 hk
gij
+
= g
k +
2
x
xj
xi
ij
si ha:
kij =

( )
k
ij


1 k
k
T + Tji
+ Tij
2 ij

(2.11)

Questa la condizione che garantisce che una connessione la cui curvatura sia
rappresentata dai coefficienti Tijk sia compatibile con la struttura metrica. Resta
ancora in dubbio lesistenza di una tale connessione.
Se si riesce a far vedere che i
( )
k
ij
sono i coefficienti di una connessione, allora si sar dimostrato che, per ogni
tensore di coefficienti Tijk antisimmetrico rispetto a i e j, i kij come in (2.11)
definiscono una connessione. Dunque, a meno di questultimo passaggio, che
si riduce a una lunga manipolazione di indici e derivate, si pu dimostrare che
esiste ununica connessione simmetrica (cio a curvatura nulla) rispetto alla
quale il tensore metrico sia parallelo.
Def 2.2.7 (Connessione di Levi-Civita): Si chiama connessione di Levi-Civita
di una variet (pseudo-)riemanniana lunica connessione simmetrica che preserva
la metrica.
Es 2.2.1 (Ancora sulla derivata covariante in ipersuperfici di Rn ): La connessione data dalla derivata covariante nel caso di ipersuperfici preserva i prodotti
scalari: se X e Y sono paralleli lungo , con (0)

= T , si ha:
T (hX, Y i) = hDT X, Y i + hX, DT Y i = hDT X, Y i + hX, DT Y i = 0
e dunque hX, Y i costante lungo . Il passaggio intermedio giustificato dal
fatto che la derivata tramite D e quella con D differiscono per un vettore ortogonale alla superficie, che non contribiusce quindi ai prodotti scalari. Inoltre, la
connessione anche simmetrica:
DX Y DY X = DX Y + hL(X), Y i N DY X hL(Y ), Xi N = [X, Y ]

CAPITOLO 2. CONNESSIONI

37

dove stata applicata la simmetria di L. Dunque la connessione di Levi-Civita


generalizza a variet riemanniane qualsiasi la derivata covariante vista in questo
caso particolare.
Es 2.2.2 (Il pendolo di Foucault): Uno degli esperimenti pi famosi della storia
della fisica fu quello che prov che la terra non ferma, cio che il sistema
di riferimento ad essa associato non inerziale. Lesperimento consistette nellosservazione del moto di un pendolo vincolato ad un punto fisso rispetto alla
terra, cio libero di muoversi sulla superficie di una sfera ferma nel suo sistema
di riferimento, con una piccola perturbazione iniziale rispetto al punto di equilibrio stabile. Se la terra fosse ferma, nel senso precisato sopra, allora il moto del
pendolo sarebbe descritto in prima approssimazione da un vettore X(t) Tp S 2
che risolva il problema di Cauchy:

= gX

l
X(0) = X0


X(0) = 0
p
Seguirebbe X(t) = cos(t)X0 , dove = g/l .
La teoria fin qui esposta permette di dare, invece, una previsione per il caso
in cui esista un sistema di riferimento inerziale solidale al centro della terra,
ma rispetto al quale questa ruoti intorno ad una retta, che senza perdita di
generalit pu essere supposto essere lasse z, con velocit angolare . Se R
il raggio terrestre e la latitudine a cui si trova il pendolo, dunque, il moto
del vincolo sar dato dalla curva
(t) = R (cos(t) sin(), sin(t) sin(), cos())
Le equazioni del moto del pendolo in questo caso diventano piuttosto complesse,
ma possibile affrontare il problema in un altro modo trattandolo da un punto
di vista intrinseco. Quella che nel caso precedente era la derivata temporale
valutava la variazione di un vettore nel tempo; in questo caso, il vettore X(t)
appartiene a T(t) S 2 , che varia nel tempo, e occorre quindi sostituire la derivata
rispetto al tempo con quella covariante. Se v la velocit di il problema
assume la forma:

Dv Dv X = l X
X(0) = X0

Dv X(0) = 0
Nel caso precedente la soluzione era data da un vettore costante modulato da un
fattore oscillante cos(t), e sar quindi ragionevole cercare una soluzione della
forma X(t) = cos(t)V (t) con V un campo parallelo lungo . In effetti si ha:
Dv Dv (cos(t)V (t)) = Dv (cos(t)Dv V (t) sin(t)V (t)) = 2 cos(t)V (t)
e lequazione differenziale soddisfatta. Il problema risolto se si sceglie V (0) =
X0 : in ultima analisi si tratta di trasportare X0 parallelamente lungo la curva
. La soluzione di questo problema un vettore la cui rappresentazione rispetto

CAPITOLO 2. CONNESSIONI

38

alle coordinate sferiche dato da una rotazione di quella di X0 con velocit


angolare cos() 2 .
Da un punto di vista fisico, questa non la soluzione esatta del problema,
nemmeno nellapprossimazione fatta scrivendo il primo problema di Cauchy. In
effetti, la terra soggetta ad altri moti oltre a quello intorno al proprio asse, e
il pendolo di Foucault ne risentir.

2.3

Connessioni su fibrati principali

La nozione di connessione affine ammette una descrizione alternativa in termini


del fibrato tangente della variet su cui si sta lavorando, e questa permetter
poi una generalizzazione ad un contesto pi ampio.
Il problema fondamentale che ha spinto allintroduzione di questo strumento
stato quello di valutare la variazione di un campo vettoriale lungo una curva,
o di costruire, dati un cammino e un vettore in un suo punto, un campo a variazione nulla lungo questo. Il problema non banale in quanto non possibile
confrontare vettori in punti diversi, cio elementi di fibre distinte, il che legato,
in definitiva, al fatto che non esiste in generale unidentificazione canonica tra la
fibra tipica e quelle puntuali. In questo linguaggio, un campo vettoriale lungo
una curva pu essere definito semplicemente come un sollevamento di questa al
fibrato: introdurre un trasporto parallelo, ad esempio, equivale a costruire un
criterio per sollevare i cammini su M scelto il punto di partenza in T M . Nel
caso dei rivestimenti questo facile, poich la proiezione un omeomorfismo locale, e scelto un punto nella fibra di (0) esiste un unico sollevamento a partire
dal punto assegnato. Nei fibrati la cosa pi complessa, poich la fibra non
discreta e non vi alcuna identificazione tra aperti di M e sottoinsiemi di T M :
per questa ragione necessario introdurre della struttura ulteriore.
Vale la pena ora fare qualche osservazione sulla struttura dello spazio tan
gente a E in un punto fissato, per un generico fibrato E M . Siano p M ,
1
u (p), e si consideri Tu E. Per le propriet della mappa di proiezione, e
per il teorema della mappa implicita, la fibra Fp = 1 (p) ha una struttura
di sottovariet di E, e avr quindi senso considerare il suo tangente Tu Fp come sottospazio di Tu E. Esso coincide con ker( |Tu ): dato che |Fp costante
dovr valere Tu Fp ker( |Tu E ), e poich entrambi gli spazi hanno la stessa
dimensione di F si conclude. Dunque ogni punto dello spazio totale ammette
unimmersione canonica del tangente di F in quello di E: tale copia di Tf F
usualmente indicata con Vu . Inoltre, vale naturalmente lisomorfismo di spazi
vettoriali Tu E ' Tp M Tf F , dove f pu essere scelto in modo arbitrario, ad
esempio a partire da una trivializzazione locale intorno a p. Mentre Tf F pu
essere identificato come un sottospazio di Tu E, per, non vale lo stesso per Tp M :
proprio in questo consiste il nostro problema.
Sia ora M una variet con una connessione affine, e siano dati un vettore
X0 Tp M e una base e1 , . . . , en del tangente in p. Scegliendo 1 , . . . , n curve
con i (0) = p e i (0) = ei , sar possibile trasportare X0 parallelamente lungo
queste ottenendo i campi X1 , . . . , Xn . Si pu vedere, allora, che i vettori velocit
dei (i , X i ) generano un sottospazio di T(p,X0 ) (T M ) in somma diretta con
2 Questo problema stato affrontato dettagliatamente dal punto di vista matematico in un
corso di introduzione alla geometria differenziale, e perci ne ometto lo svolgimento.

CAPITOLO 2. CONNESSIONI

39

il tangente alla fibra, e cio forniscono lidentificazione di Tp M in T(p,X0 ) (T M ).


Per mostrarlo, basta osservare che, essendo (i , Xi i ) = i , deve valere
0
anche (i , Xi i ) (0) = i (0) = ei . Poich questi formano una base di
Tp M , ed essendo in numero di n, questi vettori sono linearmente indipendenti;
per ragioni di dimensione, poi, vale la decomposizione in somma diretta con
Vu . Il sottospazio cos costruito viene spesso indicato con Hu : esso non dipende
dalla particolare scelta della base e1 , . . . , en , per via della linearit della derivata
covariante rispetto alla direzione, ed pertanto ben definito.
Va notato che questa costruzione fornisce delle identificazioni a livello di
spazi tangenti, senza per definire alcuna sezione locale di .
naturale aspettarsi che le condizioni di linearit per la derivata covariante
imponga delle relazioni tra gli spazi Hu in punti diversi di Fp . Se u0 = (p, Y0 ), la
base e1 , . . . , en fornisce campi Y1 , . . . , Yn che permettono di caratterizzare Hu0 .
Essendo Dei (Xi + Yi ) = Dei Xi + Dei Yi , segue che una base di H(p,X0 +Y0 )
data dalle velocit delle curve Xi + Yi . Inoltre, se c una costante, i campi cXi
sono paralleli e le loro velocit danno una base di H(p,cX) .
Per passare alle connessioni su fibrati principali, conviene analizzare un attimo il fibrato dei riferimenti P associato a T M . La connessione su M consente
di trasportare non solo vettori, ma anche basi del tangente, e questo permette
di dare una decomposizione Tu P = Vu Hu come nel caso del fibrato tangente.
Siano X1 , . . . , Xn vettori linearmente indipendenti in p M , estesi a campi paralleli lungo gli ei 3 , con una trivializzazione che associa alla base formata dagli
Xi la matrice Xij . Se u = (p, X1 (p), . . . , Xn (p)) e ghk GL(Rn ), allora vale
Hu g = Rg Hu

(2.12)

Infatti, Yhj = Xij ghi una matrice che rappresenta dei campi Yh = Xi ghi in p,
per i quali vale:


Dej Yh = Dej Xi ghi = Dej Xi ghi = 0
poich i coefficienti ghi sono costanti e gli Xi sono paralleli lungo gli ej . Dunque,
poich lazione destra di ghi sui Dej X i il differenziale di quella sugli X i , vale
la relazione (2.12).
Tutto questo giustifica la seguente:

Def 2.3.1 (Connessione su un fibrato principale): Se P M un G-fibrato


principale, si chiama connessione su P una decomposizione in somma diretta di
Tu P come Vu Hu , al variare di u in P , dove Vu il nucleo del differenziale
della proiezione , tale che:
le proiezioni su Vu e Hu preservano la differenziabilit dei campi vettoriali;
per ogni g G vale Hu g = Rg Hu .
Questa scomposizione assume un significato ben preciso: dato un sollevamento di una curva in M , si dir che questo parallelo se il suo vettore
tangente T appartiene ad Hu ad ogni tempo. In caso contrario, la proiezione di
T su Vu un buon candidato a misurare la variazione del sollevamento lungo
3 Con questo si richiede che per ogni i e ogni j sia dato un campo lungo la direzione data
da ej , che valga Xi in p.

CAPITOLO 2. CONNESSIONI

40

la curva, essendo un vettore tangente alla fibra. esattamente questo lo scopo


della decomposizione.
Se P un G-fibrato principale, lazione destra fornisce per ogni u unidentificazione canonica tra Vu e lalgebra di Lie g. Dato A g, lesponenziale d
una curva in G passante per lidentit al tempo 0 con velocit A(Id): lazione
u exp(tA) d una curva differenziabile in P con (0) = u. Mandando A nel
vettore tangente a al tempo 0, denotato con A# , si ottiene un isomorfismo tra
i due spazi vettoriali.
Avendo in mente questa corrispondenza, possibile adottare un nuovo punto
di vista nella trattazione delle connessioni su fibrati principali. Dato che in
questo caso lanalogo della derivata covariante giocato dalla proiezione su Vu ,
il quale identificato con g, la struttura di connessione pu essere data da
quella che si usa chiamare una 1-forma a valori in g, formalmente un elemento
di T P g, cio un oggetto che assegna ad ogni punto di P una mappa lineare
dal suo tangente in g. Nel caso di una connessione su P , secondo la prima
definizione, vale naturalmente che la proiezione su Vu fissa puntualmente questo
spazio. Inoltre, Rg induce un isomorfismo tra Hu e Hu g , e dunque vale
V (Rg X) = Rg X H (Rg X) = Rg X Rg (H X) = Rg (V X)

Vale la pena ricordare che nellalgebra di Lie (Rg ) A(h) = Adg1 A (h).

Def 2.3.2 (1-forma di connessione): Sia P M un fibrato principale: si dice


che 1 (P ) g una 1-forma di connessione su P se differenziabile e:
(A# ) = A;
Rg = Adg1
Data una 1-forma di connessione facile costruire in ogni punto uno spazio
Hu come ker u . Dato che u surgettiva, la dimensione del suo nucleo la
stessa di M , e dunque Hu d in effetti la somma diretta con Vu , ed essendo

differenziabile anche la decomposizione di un campo


 liscio ne dar due C .

Inoltre, se X Hu e g G, allora (Rg X) = Rg X = Adg1 ((X)): ancora una volta per ragioni di dimensione segue che Hu g = Rg Hu , e questo mostra
che i due punti di vista presentati sono equivalenti. Nel seguito confonder le
due nozioni di connessione di 1-forma associata.
La nozione di connessione espressa tramite 1-forma si presta meglio dellaltra
a parallelismi col caso affine: assegnare ad ogni punto di un aperto di M un
elemento della sua fibra equivale a dare una sezione locale del fibrato P . Sia
questa , e X Tp M : la derivata di lungo X sar espressa da ( X) =
( ) X.
Es 2.3.1: Il toro pu essere visto comeun opportuno quoziente di [0, 1] S 1 ,
identificando il punto 0, ei con 1, ei : questo significa richiudere il cilindro
su se stesso in modo da identificare gli estremi di ogni segmento orizzontale. Intuitivamente, se invece che in questo modo si incollassero
 i due estremi
ruotando il secondo, cio identificando (0, ei ) con 1, ei(+) per un qualche
fissato, si otterrebbe un oggetto diverso, in un qualche senso da precisare
meglio. La cosa si rende pi evidente se anzich una circonferenza si considera
un poligono P : in questo caso si ha un prisma anzich un cilindro, senza le due

CAPITOLO 2. CONNESSIONI

41

basi. Un modo di richiudere il prisma quello di identificare ciascun lato l di


P { 0 } con quello corrispondente in P { 1 }; un altro quello di applicare
una permutazione ciclica agli spigoli di P { 1 } e di incollare l a (l). Ci
chiediamo allora in quale senso possa essere descritta in modo matematicamente
rigorosa questa differenza intuitiva tra i due diversi quozienti.
Tornando al caso del cilindro, la topologia non distingue i due quozienti, cio
essi sono omeomorfi, e anzi diffeomorfi. Infatti, la mappa t, ei 7 t, ei(+t)
un diffeomorfismo del cilindro in s che passa al quoziente, e induce lequivalenza cercata. Nemmeno come fibrati su S 1 (ottenuto come quoziente dellintervallo) i due oggetti sono distinti: la mappa fornita sopra un
isomorfismo.
Sia (t) = t un cammino sul segmento [0, 1]. Poich il cilindro un fibrato
principale banale sullintervallo, con unovvia connessione data da g 1 dg, cio
il differenziale della proiezione sul secondo fattore,
dato ei S 1 esiste un solle
i
vamento naturale di con punto base 0, e : quello con seconda componente
costante. Passando al quoziente viene trasformata in un loop che viene sollevato a una curva sul cilindro: questa dipender da quale dei due quozienti del
cilindro stato scelto. In un caso, il laccio si chiude, nellaltro questo non vero
in generale, e lo sar solo per multiplo intero di 2.
La differenza tra queste strutture ora evidente: il quoziente fa s che il toro
erediti dal cilindro una connessione che dipende dalla scelta di . Per approfon2
dire ulteriormente, passo a considerare il cilindro ingrassato (,
 1+)S an
1
i
zich [0, 1] S : il quoziente sar ottenuto identificando , e
con 1 + , ei
1
1
per ogni
 compreso
 tra ed . Sia : [0, 1] S [0, 1] S data da
i
i(t)
t, e 7 t, e
, p la mappa di proiezione sul quoziente standard: allora
p la proiezione sul toro ottenuto ruotando il secondo estremo. Poich
un diffeomorfismo, la connessione standard sul cilindro pu essere trasformata
tramite tramite il pull-back dellinversa, ottenendo:



1 (g 1 dg)(t, i) = g 1 dg 1 (t, i) = (dt + g 1 dg)(t, i)
dove il tangente di S 1 identificato con iR e quello del toro con il prodotto
iR iR. Passando al quoziente si pu vedere che, definendo la connessione
:= dt + g 1 dg

sul toro, si ha (p ) = g 1 dg, la connessione canonica del cilindro.


Questa connessione la stessa che si ottiene definendo gli spazi Hu come
quelli generati dai vettori (i, i): si ha infatti (i, i) = i+i = 0. Questi
vettori formano un campo globale sul toro, che pu sempre essere integrato
dando curve definite su tutto lasse reale.
Nel caso delle connessioni affini stato sviluppato il punto di vista di Cartan,
che consiste, dato un riferimento di T M che vari in modo liscio su un intorno
U di un punto p, nel definire delle 1-forme ji su U da cui possibile ricostruire
localmente la connessione. Viste tutte insieme, queste possono definire n forme
differenziali a valori in Tp M , ciascuna delle quali esprime la derivata covariante
di una delle direzioni del riferimento. Le regole di trasformazione di queste
ji , poi, consentono di definire una connessione su M dando delle forme locali
compatibili.

CAPITOLO 2. CONNESSIONI

42

Anche nel caso in analisi ora possibile una costruzione analoga: ad una
connessione possibile associare delle 1-forme locali su M a valori in g dalle
quali sia possibile ricostruire quella su P , e viceversa una famiglia di forme
compatibili definisce una connessione sul fibrato. Il punto di partenza della
prospettiva suggerita da Cartan unopportuna famiglia di campi vettoriali, cio
di sezioni locali di T M : sia allora una sezione di P . Lobiettivo di in questo
caso non quello di dare in ogni punto un elemento di G, ma di fornire una
trivializzazione locale di P , cosa che possibile grazie alla struttura di fibrato
principale (si veda la dimostrazione del teorema 1.5.5). Naturalmente, la forma
indotta su U sar il pull-back di tramite . Se invece A una 1-forma a valori
in g definita su U , la sezione permette di sollevarla ad una connessione su
P |U : la costruzione pu essere fatta definendo
e su U G e poi passando a P
tramite la trivializzazione locale. Naturalmente, T(p,g) (U G) = Tp U Tg G: se
X un vettore in (p, g) definisco
e (X) come somma di due contributi provenienti
dalla sua decomposizione. La proiezione su Tg G, che pu essere scritta come
dg, d un vettore tangente in g: per vederlo come elemento dellalgebra di Lie
occorre valutare nellorigine il campo invariante che vale dg(X) in g, cos che il
contributo della componente parallela a G g 1 dg. La proiezione su Tp U data

A) X un ben definito elemento dellalgebra di Lie. Tuttavia,


: (U
invece da U

A non soddisfa le condizioni


la forma differenziale definita da
e = g 1 dg + U
di traslazione richieste dalla definizione di connessione, e per questo si compone
il secondo termine con lazione di G su g per aggiunzione:

e := g 1 dg + Adg1 (U
A)

immediato verificare che, se limmersione U 3 u 7 (u, 0) U G, allora



e = A. Passando a P |U si ottiene la 1-forma locale:
U = Adg1 A + g 1 dg
dove g = g(u) rappresenta lelemento di G per cui vale u = ((u)) g. Linvarianza sotto lazione di G segue per costruzione, cos come la condizione
(U ) = A. Rimangono da studiare le regole di trasformazione che garantiscono che due 1-forme locali Ai e Aj definite rispettivamente su Ui e Uj diano
tramite le sezioni i e j la stessa connessione = Ui Uj . Per ogni p Ui Uj
sia tij (p) tale che j (p) = i (p) tij (p). Si avr allora:
Aj (p) = j ( (j (p))) = j ( (i (p) tij (p))) =


= j Adt1 Ai + t1
ij dtij =
ij

= Adt1 Ai +
ij

(2.13)

t1
ij dtij

Vale la pena notare che la (2.5) formalmente analoga a questa condizione: di


fatto esprime in coordinate una trasformazione del tutto simile a questa (luna
per la derivata covariante in una variet, laltra per la 1-forma di connessione
su un fibrato principale).

2.3.1

Derivata covariante indotta

La derivata covariante stata introdotta per studiare il comportamento dei


campi vettoriali tangenti ad M , ed in seguito stata estesa a campi tensoriali.

CAPITOLO 2. CONNESSIONI

43

In generale, ha senso parlare di derivata covariante nel caso di fibrati vettoriali


qualsiasi, come di un oggetto che soddisfi le propriet (2.2).
Una connessione su un principale P induce su qualsiasi fibrato vettoriale
associato E = P V una derivata covariante, cio un oggetto che associa ad
una sezione di E e un campo vettoriale tangente X una seconda sezione di E.
A  associata una mappa P : P V il cui differenziale fornisce una funzione
P : T P V . Dati un punto p M e un qualsiasi u nella sua fibra,
la connessione su P d un isomorfismo tra Tp M e Hu tramite il differenziale
della proiezione . A meno di scegliere il punto u nella fibra di p, dunque,
esiste unimmersione u di Tp M in Tu P , e per composizione una mappa da Tp M
in V . Scegliendo u g al posto di u si ha, per le propriet della connessione,
u g = Rg u . Dunque:




P u g = P Rg u = P Rg u = L(g)1 P u =


= L(g)1 P u = L(g)1 P u
essendo L(g)1 lineare. Dunque ben definita



(DX )(p) = u, P u (X)
La linearit in X banale, come quella in rispetto alla somma. Rimane
P
da verificare la regola di Leibnitz: se f una funzione su M allora (f ) =
P
(f ) . Di conseguenza



P
(f )
= f P + P (df )

da cui
DX (f )(p) =

u, f P

(X)
u


+ X(f ) P (u) = f DX ()(p) + X(f )(p)

e questo conclude.
Pu essere utile a questo punto saper rappresentare la derivata covariante
associata ad in termini della 1-forma locale A legata alla sezione . Sia
: [0, 1] M una curva con vettore tangente X al tempo 0,
e un sollevamento
di in P con vettore tangente orizzontale in 0. Per unopportuna curva in G
vale
e(t) = (t) g(t), dove (t) = ((t)). Data una base e01 , . . . , e0m di V ,
induce m sezioni indipendenti di E, e di conseguenza una base di V lungo :

 

ei (t) = (t), e0i =
e(t), g(t)1 e0i
Derivando la seconda componente rispetto al tempo si ottiene:

dg
d
g(t)1 e0i = g(t)1 g(t)1 e0i
dt
dt
Valutando al tempo 0 si ha
DX ei =

e(0) g(0)1 , A(X) e0i



dove A(X), essendo un elemento di g, agisce su V come una mappa lineare. Sia
dunque A(X) rappresentato in forma matriciale da
A(X)e0i = Aji (X)e0j

CAPITOLO 2. CONNESSIONI

44

e sostituendo in DX ei si trova:
DX ei = Ak ji X k ej
dove lindice k legato alla scrittura di A in coordinate come Ak dxk . Per un
generico campo Y = Y i ei si ottiene
DX Y = X(Y i )ei + Ak ji Yi X k ej
che ricorda la vecchia forma della derivata covariante espressa tramite i coefficienti kij .

2.4

Olonomia

Anche nel caso di connessioni su fibrati principali vale un risultato di esistenza


ed unicit del trasporto parallelo, cio di un sollevamento a P dei cammini in
M che dia come risultato curve i cui vettori tangenti siano sempre orizzontali,
cio in Hu .
Thm 2.4.1 (Trasporto parallelo): Se P un fibrato principale con una connessione , : [0, 1] M una curva differenziabile, u0 1 ((0)) allora esistono
> 0 ed un unico sollevamento di a P con punto iniziale u0 e vettore
velocit in Hu ad ogni tempo, definito su [0, ).
Dim: Come nella dimostrazione del teorema 2.2.3 si potr supporre senza
perdita di generalit che la traccia di sia contenuta in un aperto U su cui sia
definita una sezione . Questo consente di riformulare il problema in termini di
una connessione su U G. Se
e(t) = ((t),
 g(t)) un generico sollevamento di
dg
in U G, il suo vettore tangente sar (t),

dt . Identificando Tg G con g,
dg
dt

d
come elemento dellalgebra di Lie rappresentato da g 1 dt
g. La condizione
che
e sia orizzontale espressa da

Adg1 U ()
+ g 1

d
g=0
dt

e dunque il sollevamento soddisfa le richieste se e solo se


d
g + U ()
g=0
dt

(2.14)

Dato un punto iniziale lequazione differenziale ammette ununica soluzione in


un intorno di 0, e il teorema dimostrato.
Oss 2.4.2: Se si aggiunge lipotesi che G sia compatto, la soluzione dellequazione differenziale (2.14) globale: se infatti essa cessasse di esistere a un tempo
t0 , allora in un intorno di tale istante dovrebbe uscire da qualsiasi compatto
contenuto nel dominio, il quale per, essendo prodotto di compatti, lo a sua
volta. Nel seguito supporr dunque che G sia un gruppo compatto, in modo che
i trasporti paralleli esistano sempre globalmente.

CAPITOLO 2. CONNESSIONI

45

Applicando il teorema un numero finito di volte possibile rilassare la condizione di differenziabilit di chiedendo solo che sia C a tratti. Il risultato
vale quindi anche per curve ottenute per concatenazione: date e curve
differenziabili con (1) = (0) ben definita data da:

(2t)
per 0 t
2
(t) =
1

(2t 1)
per t 1
2
differenziabile a tratti, e il teorema con lipotesi rilassata pu essere applicato
ad essa.
Se dato un sollevamento orizzontale
e di con punto iniziale u0 , per
ogni g G le propriet della connessione fanno s che
e(t) g sia un sollevamento
orizzontale con punto iniziale u0 g. Dunque sufficiente sollevare con un punto
iniziale u0 qualsiasi per costruire in maniera immediata quello da u0 g, per ogni
g. Un sollevamento globale (cio definito su tutto lintervallo [0, 1]) di induce
una corrispondenza biunivoca tra le fibre di (0) e (1). Indicando con () la
bigezione associata alla curva, per ogni g G varr ()(u g) = (()(u)) g. Se
si indica con 1 (t) la curva (1 t),
e1 ancora una curva orizzontale, poich
il suo vettore tangente lopposto di quello di
e e di conseguenza orizzontale.
Dunque ( 1 ) (()u0 ) = u0 e () ( 1 )u1 = u1 , il che dimostra che la
corrispondenza biunivoca. Infine, se 1 2 la concatenazione di due cammini,
vale (1 2 )(u0 ) = (2 ) ((1 )(u0 )). Dunque i () con un cammino chiuso
con punto base p formano un sottogruppo di G, poich le osservazioni appena
fatte mostrano la chiusura per prodotto e per inverso. In questo caso indicher
con la bigezione di 1 (p) su se stesso indotta dalla curva. Se M connessa,
essendo localmente diffeomorfa ad Rn connessa per archi C a tratti, e se q
un altro punto su M un qualsiasi cammino che lo colleghi a p induce un
isomorfismo tra i sottogruppi di G associati ai due punti. Data una curva chiusa
in q, infatti, la concatenazione 1 fornisce lisomorfismo. dunque
ben posta la seguente:
Def 2.4.1 (Gruppo di olonomia): Sia P un G-fibrato su una variet M connessa, una connessione su P . Per ogni punto u P si chiama gruppo di olonomia
di in u, indicato con u (), il sottogruppo di G definito da:
u () = { g G : (u) = u g per qualche cammino chiuso }
Essendo i u () isomorfi tra loro, spesso si omette il riferimento al punto base
e si parla semplicemente del gruppo di olonomia di .
Si chiama olonomia ristretta in u il sottogruppo 0u ottenuto limitando
alla sola classe dei cammini omotopi a quello costante.
Es 2.4.1: Il trasporto parallelo sulla sfera unitaria (rispetto alla connessione
di Levi-Civita) lungo le curve a latitudine costante mostra che il gruppo di
olonomia S 1 . Infatti, per definizione della connessione, il trasporto parallelo
in questo caso conserva i prodotti scalari, e quindi SO2 . Daltronde, il
trasporto di un vettore alla latitudine d come olonomia 2 cos(): include
quindi un intorno dellelemento neutro di S 1 , e la tesi segue dal fatto che ogni
gruppo di Lie connesso generato da un suo qualsiasi aperto.

Capitolo 3

Piattezza
Lolonomia occupa una posizione centrale nello studio delle connessioni: una
volta definita la sua azione naturale chiedersi da quali propriet di un arco
dipenda il trasporto parallelo lungo di essa, oppure, equivalentemente, sotto
quali ipotesi lolonomia associata ad un cammino sia nulla. La piattezza della
connessione una condizione che garantisce la banalit locale del trasporto
parallelo; globalmente questo non sar comunque vero in generale, ma esister
una stretta relazione tra olonomia e omotopia.

3.1

Ancora sulla curvatura nel caso affine

Il tensore di curvatura di una connessione affine gi stato introdotto, ma


senza una riflessione sul suo significato. Esso gioca un ruolo determinante nello studio dellolonomia, e pertanto merita a questo punto una trattazione pi
approfondita.
Oss 3.1.1: In maniera euristica, se la variazione dei coefficienti kij lungo una
curva sufficientemente piccola, la soluzione del problema di Cauchy (2.6)
pu essere approssimata con:

X i ((t)) = X0i X0j ijk ((t)) xk (t) xk (0)
dove xk (t) la rappresentazione in coordinate di (t). Vale infatti X i (0) = X0i ,
e

dijk k
d i
X = X0j
x (t) xk (0) X0j ijk ((t))x k ' X0j ijk ((t))x k
dt
dt
Dunque in prima approssimazione la funzione suggerita risolve il problema di
Cauchy.
Siano p M , U un intorno parametrizzato di p con xi le coordinate di p e
X Tp M rappresentato da X i . Siano inoltre i , i Rn due vettori, a cui si
voglia dare il significato di perturbazioni del punto p, e dunque sufficientemente
piccoli nel senso dellosservazione fatta sopra. I punti q, s ed r di coordinate
rispettivamente xi + i , xi + i e xi + i + i definiscono un rettangolo i cui lati

46

CAPITOLO 3. PIATTEZZA
sono le curve

47

1 (t) = xi + ti

2 (t) = xi + i + t i

3 (t) = xi + t i

2 (t) = xi + i + ti

Il trasporto parallelo di X lungo 1 d in q un vettore approssimato dalle


coordinate X i ijk (p)k X j . Trasportando questo lungo 2 si ottiene in r:

X i ijk (p)k X j ilm (q) m X l ljk (p)k X j '



i h m

X l ljk (p)k X j '


' X i ijk (p)k X j ilm (p) +
lm
h
x


i
i
h
' X i ijk (p)X j k ijk (p)X j k

(p)
(p)
X l k m
hm
lk
xk lm
approssimato tramite uno sviluppo in Taylor e trascurando i termini di grado
superiore al secondo in i e i . Trasportando invece lungo 3 e 4 si ottiene


i
i
h

(p)
(p)
X l k m
X i ijk (p)X j k ijk (p)X j k
hk
lm
xm lk
e la differenza tra i due trasporti :


i
i
i
h
i
h
i

(p)
(p)
+

(p)
(p)
X l k m = Rlkm
X l k m
hm
lk
hk
lm
xk lm xm lk
In questo approccio euristico, dunque, il tensore di curvatura esprime la differenza tra i trasporti paralleli di X lungo due curve diverse, ottenute scambiando
due direzioni fissate. Questo giustifica il nome di tale tensore: intuitivamente ragionevole aspettarsi che la non commutativit di questi trasporti paralleli
dipenda dal fatto che lo spazio curvo, mentre ad esempio in Rn , che piatto,
ci si pu aspettare che il parallelismo non dipenda dal percorso lungo il quale
viene valutato.
Questo esempio chiarisce il significato geometrico della curvatura, ma non
suggerisce in che modo definirla nel caso di connessioni su fibrati principali. A
questo scopo utile riprendere la deifnizione nel caso affine:
R(X, Y )Z = DX DY Z DY DX Z D[X,Y ] Z
Una volta fissato il campo Z, la derivata covariante DX Z una funzione lineare
di X, e pu essere vista come una forma differenziale. Scrvendo questa forma
come Z , lequazione sopra diventa:
R(X, Y )Z = DX (Z (Y )) DY (Z (X)) Z ([X, Y ])
Questa richiama una nota espressione per la valutazione del differenziale di una
1-forma:
(d)(X, Y ) = X((Y )) Y ((X)) ([X, Y ])
In effetti, le due scritture sono formalmente analoghe: in un caso si tratta di una
forma a valori in R per cui ben definita lusuale derivata direzionale, mentre
nellaltro il codominio lo spazio (tangente a) Tp M , e per derivare quantit di
questo tipo necessario ricorrere alla connessione. La curvatura R(, )Z pu
essere quindi vista come il differenziale della forma Z nel senso dato dalla
derivata covariante.

CAPITOLO 3. PIATTEZZA

3.2

48

Curvatura di una 1-forma di connessione

Avendo in mente le osservazioni appena fatte, possibile definire la curvatura


di una 1-forma di connessione come la 2-forma a valori in g data dal suo
differenziale, in un senso che ora va approfondito meglio.
Sulle forme differenziali su P ben definita lusuale derivata esterna, che
per non ha niente a che vedere con la struttura indotta dalla connessione. Si
usa quindi definire la derivata covariante di una forma r (P ) come

(D) (X1 , . . . , Xn ) = (d) X1H , . . . , XnH
dove XiH denota la proiezione di X su Hu . Questa definizione ha senso anche
per forme a valori in uno spazio vettoriale: immediato verificare che se questa
rappresentata in una base e1 , . . . , en come = i ei allora ben definita
d = (d i ) ei .
Def 3.2.1 (Curvatura di una connessione): Sia una 1-forma di connessione
su un fibrato principale P . Si chiama curvatura di la 2-forma data dalla
sua derivata covariante.
La curvatura eredita dalle propriet della connessione la sua condizine di
invarianza per traslazione: se g G, allora Rg = Adg 1 . Infatti:
Rg (X, Y ) = (Rg X, Rg Y ) =

H
= d Rg X H , RgY
=

= Rg d X H , Y H =

= d(Rg ) X H , Y H =

= d(Adg1 ) X H , Y H =

= Adg1 d X H , Y H =
= Adg1 (X, Y )
Trattando le forme differenziali a valori in unalgebra di Lie si usa introdurre
il commutatore tra due forme. Se T1 , . . . , Tn una base di g, e se = i Ti ,
= i Ti sono una p-forma ed una q-forma, si definisce:
[, ] = i j [Ti , Tj ]
e si pu verificare che [, ] = (1)pq . Dunque per ogni p-forma
vale [, ] = 2 per p dispari, 0 altrimenti.
Come nel caso delle connessioni affini vale il seguente:
Thm 3.2.1 (Equazione di struttra di Cartan): Se una 1-forma di connessione su un fibrato principale P , allora la sua curvatura soddisfa
d =

CAPITOLO 3. PIATTEZZA

49

Dim: Valutando in X, Y si ha

2( )(X, Y ) = [, ](X, Y ) = [Ti , Tj ] i j (X, Y ) =

= [Ti , Tj ] i (X) j (Y ) j (X) i (Y ) =
= [(X), (Y )] [(Y )(X)] = 2[(X), (Y )]
Dunque la tesi equivalente a
d(X, Y ) = (X, Y ) [(X), (Y )]
per ogni X, Y Tu P . Per le propriet di linearit e alternanza delle forme
differenziali basta dimostrare lasserto nei seguenti casi:
X, Y Hu : allora (X) = (Y ) = 0. Inoltre, in questo caso particolare
coincide proprio con il differenziale di , e la tesi verificata.
X Hu e Y Vu : per la bilinearit del commutatore anche in questo
caso [(X), (Y )] = 0, e (X, Y ) = 0 dato che Y H = 0. Per valutare
d(X, Y ) possibile estenderli a campi in un intorno del punto in analisi
ed applicare:
d(X, Y ) = X((Y )) Y ((X)) ([X, Y ]) = X((Y )) ([X, Y ])
Essendo Y verticale, il campo pu essere scelto come quello indotto da
V g: in questo modo (Y ) = V , una costante, e d(X, Y ) si riduce
a ([X, Y ]). Daltra
 parte tale vettore orizzontale: lo si scriva come
limt0 Rg(t) X X /t con g(t) una curva in G in modo che il tangente
di u g(t) sia Y . Allora Rg(t) X orizzontale, e cos anche [X, Y ].
X, Y Vu : allora (X, Y ) = 0. In modo analogo al passo precedente si
ha d(X, Y ) = ([X, Y ]). Sia A = ([X, Y ]): allora
A = ([X, Y ]) = ([(X)# , (Y )# ] = ([(X), (Y )]# ) = [(X), (Y )]
da cui finalmente d(X, Y ) = [(X), (Y )].

Segue immediatamente dallequazione di struttura di Cartan la seguente:


Thm 3.2.2 (Identit di Bianchi): Se 2-forma di connessione di , allora
D = 0
dove D denota la derivata covariante.
Dim: Il differenziale di dato da
d = d (d + ) = (d) (d)

Di conseguenza, dato che D(X, Y, Z) = d(X H , Y H , Z H ), e che (V H ) si


annulla per ogni V , si ha la tesi.

CAPITOLO 3. PIATTEZZA

50

Sia una sezione locale di P . Come alla connessione la sezione associa


una 1-forma A 1 (M ) g, cos possibile rappresentare la curvatura per
mezzo di una 2-forma F definita come il pull-back di tramite . Se Fi ed
Fj sono le forme locali rispetto a due sezioni i e j , con j (p) = tij (p) i (p),
allora vale
Fj = dAj + Aj Aj =
= d(Rt1 Ai +
ij

t1
ij dtij )

1
+ (Rt1 Ai + t1
ij dtij ) (Rt1 Ai + tij dtij ) =
ij

ij

= Rt1 (dAi + Ai Ai ) = Rt1 Fi


ij

ij

Le equazioni dimostrate sopra impongono delle condizioni anche su queste


forme locali: quella di Cartan data da
dA = d = (d) = + ( ) ( ) = F + A A
Per quanto riguarda lidentit di Bianchi si ha invece:
dF = (d) = ((d) (d)) = (dA) A A (dA) = F A A F
da cui
dF + [A, F] = 0
Definendo DF come dF + [A, F] si ottiene unidentit formalmente identica a
quella di Bianchi:
DF = 0

3.3

Condizioni equivalenti alla piattezza

Come osservato nella sezione 3.1, la curvatura di una connessione affine esprime
la dipendenza del trasporto parallelo dal cammino scelto. Ci si potrebbe quindi
aspettare che tale dipendenza venga meno nel caso in cui la curvatura si annulli
identicamente: questo vero soltanto localmente.
Def 3.3.1: Si dice che una connessione piatta se la sua curvatura nulla. Si
usa anche dire che un fibrato piatto se su di esso definita una connessione e
non si corrono rischi di ambiguit.
Prima di proseguire occorre introdurre della terminologia comune nellambito della geometria differenziale. Sia data una variet M di dimensione n, e
sia assegnato, per ogni punto p M , un sottospazio (p) di dimensione d di
Tp M . Se M pu essere ricoperta tramite aperti sui quali siano definite d campi
vettoriali lisci che formino basi per (p), allora si dice la famiglia di questi spazi
costituisce una distribuzione d-dimensionale su M . La condizione sullesistenza
dei campi vettoriali serve per fare in modo che, in un senso intuitivo, (p) vari in
modo liscio su M . Una distribuzione pu essere vista anche come un sottofibrato
tel tangente ad M . Una distribuzione si dice involutiva se, comunque date X, Y
sezioni di come sottofibrato (cio due campi vettoriali i cui valori in qualsiasi
p appartengano a (p)) anche il loro commutatore lo . In modo pi stringato,
una distribuzione si dice involutiva se chiusa rispetto al commutatore.
Data una distribuzione ha senso chiedersi se per ogni punto p M esista
una sottovariet N 3 p il cui tangente sia (q) in ogni punto q N . Una tale

CAPITOLO 3. PIATTEZZA

51

sottovariet chiamata variet integrale, ed detta massimale se connessa


e non ne esiste unaltra che la contenga. Naturalmente, se una distribuzione
ammette una variet integrale allora involutiva: due sezioni di possono essere
viste come campi vettoriali su N , e il loro commutatore non dipender dal fatto
che lo si valuti rispetto alla struttura di M o a quella di N . Di conseguenza, la
loro parentesi di Lie sar un campo tangente ad N , e in quanto tale sar una
sezione di . Non ovvia laltra implicazione, che invece discende dal seguente:
Thm 3.3.1 (Frobenius): Se una distribuzione involutiva d-dimensionale
allora ogni punto p M ammette un intorno U e una carta : U Rn il
cui differenziale mappa sulla distribuzione su Rn che consta dei sottospazi
generati dai primi d vettori della base canonica.
Una carta come quella di cui lesistenza garantita dal teorema di Frobenius
induce una partizione di U in sottoinsiemi della forma 1 (Rd { x }). Se M
ricoperta da carte di questo tipo, in modo che per ogni overlapping tra due carte
le decomposizioni indotte sullintersezione coincidano, si ha una partizione di
M detta foliazione. Ciascuna delle sottovariet (nel senso degli imbedding) che
ricoprono M in questo modo detta foglia. Il teorema di Frobenius garantisce
quindi lesistenza di una foliazione cui sia tangente, a condizione che questa
sia involutiva.
Se su un fibrato principale P data una connessione, gli spazi orizzontali
formano una distribuzione: se T1 , . . . , Tn una base di g, si completi T1# , . . . , Tn#
a base liscia di Tu P su un aperto opportuno. Le proiezioni dei vettori aggiunti
formano una base liscia di Hu . Indicher con H tale distribuzione. Vale allora:
Thm 3.3.2: La distribuzione data dalla connessione involutiva se e solo se
questa piatta.
Dim:
Il punto chiave della dimostrazione sar lequazione di struttura di
Cartan.
Siano X, Y campi orizzontali su un aperto di P . Allora
d(X, Y ) = X((Y )) Y ((X)) ([X, Y ]) = ([X, Y ])
Se piatta, allora lequazione di struttura d
([X, Y ]) = [(X), (Y )] = 0
Dunque [X, Y ] orizzontale, e la distribuzione involutiva. Viceversa, se vale
questa condizione allora ([X, Y ]) = 0, e quindi
0 = (X, Y ) + [(X), (Y )] = (X, Y )

Daltra parte se uno tra X e Y verticale vale (X, Y ) = d(X H , Y H ) = 0.


Per bilinearit si conclude che 0.
Dal teorema di Frobenius, poi, segue che una connessione piatta se e solo se
induce una foliazione tangente alla distribuzione degli spazi orizzontali. Questa
la condizione cruciale che avr importanti conseguenze sullolonomia di .

CAPITOLO 3. PIATTEZZA

3.4

52

Olonomia di una connessione piatta

Sia F una foliazione orizzontale. Una prima propriet di F la seguente: poich Rg Hu = Hu g , H invariante per traslazioni. Ne segue che anche F lo .
Sia V un aperto coordinato in P con una carta che soddisfa la definizione di
foliazione. Al variare di g G gli insiemi Vg = V g definiscono un ricoprimento
di 1 ((V )), ciascuno dei quali fornisce una carta che rispetta la foliazione,
essendo questa invariante sotto lazione destra. Queste carte permettono di dare
un diffeomorfismo tra (V ) G e 1 ((V )) che manda la foliazione F nella
partizione in insiemi del tipo (V ) { G }. Si ha dunque una banalizzazione
locale di tramite mappe che rispettano la struttura della foliazione. Ogni punto p M ammette un tale intorno banalizzante, e tutte queste trivializzazioni
sono tra loro compatibili nel senso che la transizione dalluna allaltra manda le
foglie di Ui G in quelle di Uj G. Ne segue che le mappe di transizione sono
funzioni da Ui in G costanti.
Fatte queste premesse, possibile introdurre una nuova struttura differenziale su P , con una topologia diversa da quella originale, che corrisponde ad
una discretizzazione del gruppo G. Sia dato un ricoprimento { Ui }iI di M con
delle banalizzazioni i come quelle descritte nel precedente paragrafo. A meno
di restringere gli Ui lecito assumere che si tratti di aperti connessi coordinati,
e dunque diffeomorfi a sottoinsiemi Wi di Rn tramite i . La nuova topologia su
P sar quella indotta dalle carte
i,g :(Ui { g })
(p, g)

- Wi
- i (p)

facile vedere che queste mappe definiscono un atlante su P . Inoltre, le banalizzazioni per possono essere viste in questa nuova struttura come delle
mappe C rispetto a quella su Ui G data dalla topologia discreta su G: in
questo senso il procedimento ora svolto corrisponde ad una discretizzazione di
G. Il fatto che le mappe di transizione siano costanti una condizione necessaria e sufficiente affinch siano continue, e in questo caso sono differenziabili.
Se u (Ui { g }), la carta induce un isomorfismo canonico tra lo spazio
tangente in u rispetto a questa nuova struttura e il sottospazio Hu del tangente
in quella vecchia. Dunque rimane differenziabile per costruzione, e questa
osservazione permette di concludere che viene preservata anche la surgettivit
del differenziale, che ora diviene addirittura un isomorfismo. Si ha dunque una
nuova struttura di fibrato di P su M , con la stessa proiezione. Infine, le foglie di
F sono aperte in quanto per costruzione sono date da unioni di aperti coordinati, e connesse per archi. Infatti, se (t) un arco in una foglia F , differenziabile
rispetto alla struttura originale, le sue rappresentazioni in coordinate tramite le
banalizzazioni locali danno curve lisce con seconda componente costante. Sono
dunque C rispetto alla struttura di Ui G con G discreto, e ricostruendo si
ha la tesi, ricordando che inizialmente F era connesso e localmente diffeomorfo
ad Rn , dunque connesso per archi. Le foglie sono quindi le componenti connesse
di P rispetto alla nuova topologia.
Sia ora p M , u 1 (p), F la foglia passante per u. La mappa di
proiezione pu essere ristretta ad F , e poich Tu F isomorfo a Tp M tramite
segue dal teorema della mappa inversa che esistono un intorno U di p in M ed

CAPITOLO 3. PIATTEZZA

53

uno di u in P , indicato con U 0 , tali che ristretta a U 0 F un diffeomorfismo


su U . A meno di restringere gli intorni si potr supporre che ciascuno dei due
sia connesso. Se ora u
e un altro punto di 1 (p) F , lazione destra d un
0
diffeomorfismo tra U F e un opportuno aperto connesso contenente u
e, sul
quale si restringe a sua volta ad un diffeomorfismo su U . Dunque per ogni
g G per cui valga u g 1 (p) le traslazioni di U 0 F danno aperti disgiunti
e connessi su cui si restringe ad un diffeomorfismo su U . Sotto queste ipotesi
tali traslazioni sono tutte e sole le componenti connesse di 1 (U ). Dunque
ogni punto la cui fibra intersechi F ha un intorno banalizzante nel senso dei
rivestimenti. Daltronde, sotto lipotesi che M sia connessa, dato un qualsiasi
punto q M esiste un arco che lo connette a p. Se
e il suo sollevamento
orizzontale con punto iniziale u, questo giace interamente su F :
e(1) appartiene
a 1 (q) F . Se ne conclude che , ristretto ad F , d un rivestimento. Tutta
la teoria riguardante questi oggetti pu essere quindi richiamata a questo punto
per lo studio dellolonomia di 1 .
Richiamo qualche risultato dalla teoria dei rivestimenti. Ogni cammino chiuso in M con punto base p pu essere sollevato in modo unico a
e a meno di
scegliere il punto di partenza u. Naturalmente il secondo estremo di
e appartiene
alla fibra di p, ma non detto che coincida con u: sotto lipotesi di connessione
di F (in questo caso valida per definizione di foglia) dato comunque un punto
u0 1 (p) esiste un arco in F che lo collega a u, e la sua proiezione dar un
cammino chiuso il cui sollevamento termina in u0 . per vero che i sollevamenti di due cammini omotopicamente equivalenti con punto base u coincidono
anche nel secondo estremo, e sono a loro volta equivalenti: questo d unazione
destra di 1 (M ) sulla fibra di p, detta di monodromia. Essa transitiva, grazie
allosservazione fatta poco sopra. Se poi dato un cammino chiuso e omotopicamente banale in F con punto base u, anche la sua proiezione lo sar: questo
d un omomorfismo iniettivo : 1 (F ) 1 (M ). Lazione di monodromia d
invece un omomorfismo surgettivo : 1 (M ) (): se esiste un trasporto
parallelo che porta u in u0 , allora questo giace su F , e di conseguenza u0 F .
Se il trasporto fatto su un cammino chiuso allora la proiezione d un laccio
in M , la cui classe di omotopia agisce su u mandandolo in u0 . Il nucleo di tale
morfismo dato dalla famiglia dei cammini in M il cui sollevamento pure
chiuso in F : si tratta dellimmagine di 1 (f ) tramite . Vale quindi lesattezza
della seguente successione:
0

- 1 (F )

1 (M )

()

- 0

Si pu dunque concludere:
Thm 3.4.1:
quoziente

Il gruppo di olonomia di una connessione piatta isomorfo al


1 (M )/ (1 (F ))

o pi succintamente
1 (M )/1 (F )
dove F un qualsiasi elemento della foliazione indotta dalla distribuzione H.
1 Questi argomenti sono stati trattati nei corsi istituzionali nel caso C 0 , ma valgono anche
in contesto differenziabile.

CAPITOLO 3. PIATTEZZA

54

Il fatto che la costruzione fatta non dipenda dalla scelta specifica della foglia di facile dimostrazione: basta ricordare che la foliazione invariante per
traslazione destra e che = Rg .
Es 3.4.1: Sia una connessione sul toro come quella introdotta nellesempio
2.3.1. Il campo che genera la distribuzione, come detto, integrabile e d
delle curve sul toro definite su tutto R. Poich S 1 ha dimensione 1 deve valere
[(X), (Y )] = 0 per ogni X, Y . Dunque lequazione di struttura d = d.
Essendo = dt + g 1 dg, con costante, varr d = 0, e la connessione
piatta. Il gruppo di monodromia dipende fortemente da : si tratter sempre
di un gruppo ciclico, e sar finito se e solo se il rapporto tra e 2 razionale.
Innanzi tutto, le curve integrali del campo non sono altro che i sollevamenti
orizzontali di (t) = e2it su S 1 , che ne genera il gruppo fondamentale. Se
una di queste curve si autointerseca allora periodica: la sua velocit infatti
determinata dalla posizione, e per la parte di unicit del teorema di CauchyLipschitz due curve che in uno stesso punto abbiano la stessa velocit e risolvano
lo stesso problema coincidono.
 I sollevamenti corrispondono alle curve su [0, 1]
S 1 date da t 7 t, ei(+t) : lazione di monodromia di n quindi data da


t, ei 7 t, ei(+n) . Se il rapporto tra e 2 non razionale, tale azione
libera, e pertanto il morfismo di Z in () iniettivo. Essendo questo surgettivo
per quanto argomentato sopra, si tratta di un isomorfismo: il gruppo di olonomia
quindi Z. Se invece e 2 sono in rapporto razionale, esiste un n Z
positivo per cui la curva si richiude. Scegliendo n minimo si ottiene che il
nucleo dellazione il sottogruppo nZ, e si ha () ' Z/nZ.

Capitolo 4

Teorie di gauge
Alla luce della teoria esposta finora possibile costruire un modello della teoria
dellelettrodinamica in termini di connessioni su fibrati principali, come esempio
di teoria di gauge.

4.1

Background fisico

Quanto svolto di seguito vuole essere una giustificazione sintetica del formalismo
usato nelle prossime sezioni; per ulteriori dettagli si vedano [2], [3] e [7].
Richiamo brevemente qualche elemento di relativit ristretta. In questa
teoria lusuale spazio R3 viene sostituito dallo spazio di Minkowski, cio R4 con
la metrica espressa da

1 0
0
0
0 1 0
0

gij =
0 0 1 0
0 0
0 1
Le variabili spaziali sono espresse da x , con = 0, 1, 2, 3: x0 rappresenta il
tempo moltiplicato per la costante c (la velocit della luce, talvolta posta a 1 tramite unopportuna scelta delle unit di misura) mentre le altre coordinate sono
quelle usuali. In questo modo, i cambiamenti di sistema di riferimento non sono
elementi di SO3 , ma di quello che si chiama gruppo di Lorentz, formato dalle
trasformazioni che preservano questo prodotto scalare. Naturalmente, qualsiasi
prodotto scalare tra vettori in R4 tramite questa metrica indipendente dalla
scelta del sistema di riferimento.
Dato che questo nuovo modello si basa su una geometria diversa da quella
classica di R3 , naturale aspettarsi che le vecchie grandezze vettoriali, come
velocit e momento, non siano invarianti sotto le trasformazioni di Lorentz, e in
definitiva non siano quantit fisicamente consistenti. Certamente non potranno
essere pi considerate come vettori, poich il nuovo sistema in dimensione
quattro. A questo scopo vengono introdotti i cosiddetti quadrivettori, il cui
primo esempio quello di posizione, ottenuto da quello classico per laggiunta
di una componente ct.
Sia data una curva nello spazio di Minkowski: essa rappresenter il moto
di un oggetto rispetto a un dato sistema di riferimento. Come curva parame55

CAPITOLO 4. TEORIE DI GAUGE

56

trizzata essa ammetter un vettore velocit intesa come la derivata rispetto


al parametro; questo non potr essere identificato con il tempo, poich secondo
il modello in uso esso dipende dal sistema di riferimento, e dunque le derivate
rispetto a questo non rappresenteranno dei vettori ben definiti. A questo scopo occorre utilizzare una variabile intrinseca, cio indipendente dalla scelta del
sistema di riferimento, e un buon candidato pu essere:
1p 2 2
1p
x g x =
c t x2
=
c
c
Paramentrizzando la curva rispetto alla variabile , detta tempo proprio, e
derivando, si ottiene quello che si usa chiamare quadrivettore velocit, le cui
componenti spaziali sono v i , e quella temporale c, dove
=r

v2
c2
In generale, la derivata rispetto al tempo proprio uguale a quella rispetto a t
moltiplicata per .
In maniera simile vengono definiti degli altri quadrivettori, le cui componenti spaziali sono proporzionali a grandezze vettoriali della meccanica classica, mentre quella temporale unopportuna quantit che nel vecchio modello
rappresentava uno scalare. Ad esempio:
1

il quadrivettore impulso P definito come la velocit moltiplicata per la


massa. Le componenti spaziali sono quelle del momento classico moltiplicate per , quella temporale E/c (E essendo lenergia);
il quadrivettore forza la derivata rispetto a dellimpulso;
il quadrivettore densit di corrente ha componenti c e J ;
il potenziale vettore ottenuto accostando a quello classico il campo .
Il campo elettromagnetico viene espresso in questo formalismo da un unico
tensore a due indici F ij , in modo che la forza di Lorentz possa essere descritta
semplicemente facendolo agire sul quadrivettore sorgente:
dpi
= Jj F ij
d
Imponendo questo e scegliendo un sistema di misura in cui c = 1 si ottiene:

0 Ex Ey Ez
Ex
0
Bz By

F ij =
Ey Bz
0
Bx
Ez By Bx
0
In termini del potenziale vettore si ha F = dA come forma differenziale, cio
Fij = i Aj j Ai .
Anche in questo nuovo modello possibile descrivere la dinamica tramite un
principio di azione stazionaria, e di conseguenza tramite le equazioni di EuleroLagrange che sono equivalenti ad essa. Per la particella libera, ad esempio, si
scrive lazione come
Z
Z
mc2
2
dt
S = mc d =

CAPITOLO 4. TEORIE DI GAUGE

57

che stazionaria quando la lunghezza della traiettoria minima rispetto alla


metrica di Minkowski. La lagrangiana sar quindi L = mc2 /, e si pu verificare che la variabile coniugata a q p , e le equazioni di Hamilton in questo
caso hanno la stessa forma che nel caso classico.
evidente a questo punto che non sempre ha senso sommare due grandezze che classicamente sono scalari: bisogna prima assicurarsi che lo rimangano
relativisticamente. Ad esempio, se E lenergia di una particella e V un potenziale, essendo la prima una componente di un quadrivettore la somma delle
due non sar uno scalare, poich cambiando il sistema di riferimento la nuova
E sar data da termini che coinvolgono le componenti di p. Nel caso in cui il
potenziale quello scalare di un campo elettromagnetico, invece, dal momento
che questo la coordinata temporale del potenziale vettore avr senso sommarlo allenergia, a condizione che anche al momento venga aggiunto il potenziale
vettore: loggetto ottenuto sar un ben definito quadrivettore.

4.1.1

Equazioni di Hamilton e di Schrdinger

Sia H lhamiltoniana di una particella carica in un sistema in cui non siano presenti campi elettromagnetici: classicamente, se questa non dipende dal tempo
rappresenta lenergia della particella. Si introduca ora un quadrivettore (covariante) potenziale elettromagnetico A = dt + A dx , e si considerino le nuove
coordinate momento definite da
p = p + A (t, q)
Allora possibile descrivere la dinamica del nuovo sistema tramite queste coordinate e lhamiltoniana
H (q, p , t) = H(q, p eA, t) e(t, q)
e le equazioni sono le solite, usando le nuove variabili al posto delle vecchie.
Poich si potr avere una dipendenza di H dal tempo, si aggiunge unequazione:

H
dp

dt
q

dq
H
=

dt
p

dH = H
dt
t
Dunque le equazioni della fisica sono in definitiva quelle classiche, purch
la variabili in uso vengano opportunamente modificate. Per la dimostrazione
rimando a [2].
Una cosa simile avviene in meccanica quantistica. In questo contesto, le
grandezze misurabili, dette osservabili, sono rappresentate da operatori autoaggiunti che agiscono su uno spazio di Hilbert complesso i cui elementi sono
i possibili stati del sistema, indicati con |i. Si postula che i possibili esiti
di unoperazione di misura siano gli autovalori delloperatore, e gli autovettori associati rappresentino stati in cui losservabile assuma il valore assegnato
(gli autostati del sistema). Uno stato generico sar combinazione lineare di autostati o, quando questi siano in numero infinito, sar rappresentato da una

CAPITOLO 4. TEORIE DI GAUGE

58

distribuzione. Quando viene misurata unosservabile si dice che lo stato collassa


nellautostato corrispondente al valore ottenuto.
Si consideri per semplicit loperatore corrispondente alla misura della posizione di una particella che si muove su R. Per quanto detto, il risultato della
misura d un autovalore x per loperatore, corrispondente allautostato che si
indica con |xi. In questo modo si ha una corrispondenza tra i punti della retta, indicati con x, e gli elementi |xi della base spettrale dellosservabile. Ad
ogni stato |i viene associata la funzione donda (x), il cui valore dato
dal prodotto scalare hx|i tra lo stato stesso e lautostato corrispondente alla
posizione x. Tale funzione rappresenta le coordinate dello stato, come vettore,
rispetto alla base formata dagli autostati delloperatore posizione in R. Aggiungendo lipotesi che se due vettori sono multipli luno dellaltro tramite uno
scalare complesso non nullo allora esprimono lo stesso stato, si pu assumere
che R|i sia unitario. In questo caso, dato che la norma quadra di |i data
2
da R |(x)| dx, lintegrando una distribuzione di probabilit che viene interpretata come quella che lo stato, una volta che sia misurata la posizione,
collassi nellautostato associato a x. Il caso di particelle a pi gradi di libert
pu essere affrontato in maniera simile, prestando attenzione alle complicazioni
tecniche, ottenendo nuovamente una distribuzione di probabilit sullo spazio in
cui si muove la particella.
Data lhamiltoniana H, levoluzione temporale della funzione donda descritta dallequazione di Schrdinger:
i~

= H
t

Per presentare un semplice esempio, sia


H(x, p) =

p2
+ V (x)
2m

In coordinate cartesiane si assume che p agisca come una derivata:


p = i~

metre V agisce semplicemente per prodotto. Allora lequazione di Schrdinger


diviene:
 2 X 2

~

+V
i~
=
2
t
2m
(x )
Considero ora la dinamica di una particella carica in presenza di campi
elettromagnetici rappresentati da un potenziale vettore. Per analogia con il
caso relativistico classico (cio non quantistico) riscrivo lequazione sostituendo
al momento p e allhamiltoniana H che si avrebbero in assenza di campi quelli
ottenuti sommando i contributi dovuti ad A. Si ha dunque:

i~

ie
~

 
 2 X
  2
~

ie
=
A + V

2m
x
~

Il potenziale vettore non determinato dai campi: la fisica del sistema rimane
invariata se ad A si somma , dove = /x e una qualsiasi funzione

CAPITOLO 4. TEORIE DI GAUGE

59

scalare definita su R4 , cio se si applica quella che si chiama una trasformazione


di gauge. Ci si pu chiedere allora come cambia la soluzione dellequazione di
Schrdinger a seguito di questa trasformazione. Se risolve lequazione per il
potenziale A, allora


ie

exp
~
la risolve per A + d.

4.2

Lelettrodinamica come teoria di gauge

La fisica di un sistema elettrondinamico quindi invariante sotto trasformazioni


del tipo
A 7 A +
purch anche la venga modificata secondo
 
ie
7 exp

~
Delle trasformazioni simili erano gi state incontrate nel contesto delle connessioni su fibrati principali. Se tij la mappa di transizione tra due banalizzazioni locali i e j , le forme di connessione locali trasformano come
Aj = Adt1 Ai + t1
ij dtij
ij

t1
ij dtij

dove ricordo che la scrittura


sta a rappresentare il campo vettoriale
invariante su G che in tij assume il valore dato da dtij . Se il gruppo abeliano
lazione di Adt1 banale e scompare. Se poi il fibrato associato ad uno
ij
vettoriale, la derivata covariante rappresentata semplicemente da
+ Aj = + Ai +

tij
x

Questo suggerisce di descrivere lelettrodinamica secondo il modello che segue. La funzione donda pu essere considerata come una sezione di un fibrato
vettoriale complesso di dimensione 1, la cui struttura andr specificata in seguito 1 . La trasformazione di quando si cambia il potenziale un prodotto per un
numero complesso unitario: si potr quindi pensare che una scelta della gauge
corrisponda a un cambiamento della banalizzazione locale del fibrato tramite la
mappa di transizione data dallelemento di U (1) rappresentato da exp(ie/~).
Si chieder dunque che il gruppo di struttura del fibrato sia proprio U (1), che
abeliano. Se si indica con A la quantit complessa iA si ottiene una 1-forma di
connessione locale: essendo il potenziale un vettore covariante reale, moltiplicarlo per lunit immaginaria fornir in effetti una forma differenziale a valori
in iR, lalgebra di Lie di U1 . La trasformazione A 7 A + i mostra che A
rappresenta in effetti una connessione sul fibrato principale associato a quello
di cui una sezione. Segue che loperatore
 e
 e
A = + i
A
+
~
~
1 Se si immagina di lavorare su tutto R4 , senza singolarit nei campi, il fibrato necessariamente banale, per via di un teorema di omotopia che garantisce lesistenza di un unico fibrato
su uno spazio retraibile una volta che sia fissata la fibra.

CAPITOLO 4. TEORIE DI GAUGE

60

una derivata covariante a tutti gli effetti. Lequazione di Schrdinger pu


quindi essere riscritta in termini di connessioni come

i~D0 =

~2
2m

X
3

D2 + V

=1

dove D rappresenta la derivata covariante rispetto alla variabile x . Questa


scrittura formalmente identica a quella originale senza potenziale vettore: come il principio di inerzia conserva la sua forma nel caso di variet generiche a
condizione di sostituire la derivata covariante con quella indotta dalla connessione di Levi-Civita, cos anche lequazione di Scrdinger viene modificata soltanto
indtroducendo la differenziazione covariante data dai potenziali.
In questottica, segue immediatamente dallequazione di struttura di Cartan
che il tensore dei campi F proporzionale alla forma locale di curvatura:
F = dA = idA = iF
La connessione rappresentata dai potenziali piatta se e solo se i campi si
annullano identicamente. Applicando lidentit di Bianchi si ottiene:
0 = (dF ) = F + F + F
Sostituendo opportunamente gli indici questo d le due equazioni di Maxwell
omogenee, che sono quindi legate alla struttura geometrica del modello. Linformazione fisica sar data dalle altre due equazioni, che possono essere ottenute
tramite quelle di Eulero-Lagrange, o equivalentemente dal principio di azione
stazionaria, legato alla fisica pi che alla geometria del modello.
Per studiare gli effetti elettromagnetici si propone quindi un nuovo modello
geometrico, che consiste nel considerare, anzich lo spazio di Minkowski, un
fibrato su di esso con fibra C, e nel definire unopportuna connessione sul suo
principale associato. In questo modo, la scelta della gauge corrisponde a una
banalizzazione locale del fibrato, mentre la funzione donda di uno stato si
riduce ad una sezione del fibrato vettoriale (o ad una sua rappresentazione
locale), e il potenziale vettore una 1-forma locale di connessione. Il tensore
dei campi, che sembra quasi passare in secondo piano (e in effetti avr rilevanza
secondaria per questa teoria), rappresenta la forma locale della curvatura: la
sua rappresentazione non dipende dalla scelta della gauge, e al variare delle
coordinate trasforma come un tensore. Incidentalmente, questo in accordo
con il fatto che classicamente larbitrariet sta solo nella scelta del potenziale,
che deve comunque essere tale da non cambiare i campi. Per questa ragione in
passato si ritenuto che fossero questi a portare linformazione fisica rilevante,
mentre il potenziale non era visto che come un mero artificio matematico utile
per semplificare le equazioni.
Quando lo spazio base R4 il fibrato banale. In questo caso particolare
possibile una scelta globale della gauge, e tanto la funzione donda quanto il
potenziale sono definiti su tutto lo spazio. Ci possono per essere delle situazioni
(come quella del monopolo magnetico, afforntata poco pi avanti) in cui questo
non possibile, e si rende necessario sfruttare appieno la struttra di fibrato
dando delle trivializzazioni locali che consentano di definire vari potenziali locali,
che trasformeranno secondo le regole note imposte dalle mappe di transizione.

CAPITOLO 4. TEORIE DI GAUGE

4.3

61

Il monopolo di Dirac

La teoria dellelettromagnetismo, pur non prevedendo lesistenza di un monopolo


magnetico, non la nega nemmeno; in altre parole non in disaccordo con la
possibilit che sperimentalmente possa essere trovata della carica magnetica.
Dirac si pose il problema di descrivere il comportamento di un simile oggetto
qualora esistesse.
Si consideri una carica magnetica g localizzata nellorigine del sistema di
riferimento, in condizioni statiche. Le equazioni di Maxwell (espresse in cgs)
per questo sistema sono:

E(t, r) = 0

B(t, r) = 4g(r)

E(t, r) = 0

B(t, r) = 0
Le equazioni sono disaccoppiate, e quelle per il campo magentico sono formalmente identiche a quelle dellelettrostatica. Il campo magnetico fuori dallorigine
sar quindi:
g
B(t, r) = 3 r
r
Va osservato che ha senso studiare solo la regione esterna allorigine, e questo
non solo perch il campo non definito in quel punto, ma anche per una ragione
teorica. Il modello introdotto sopra mostrava che le equazioni di Maxwell omogenee discendono naturalmente dallidentit di Bianchi, e sono pertanto legate
alla struttura geometrica dellambiente. Se la fisica di una certa regione pu
essere descritta tramite un potenziale vettore allora la distribuzione di carica
magnetica in tale spazio deve annullarsi. In altre parole, il modello introdotto
pu descrivere i fenomeni dovuti alla presenza di monopolo magnetico, ma solo
fuori dalla regione in cui questo concentrato.
Nellipotesi che il sistema sia statico (rispetto ad un particolare riferimento)
la componente temporale trascurabile, e ha senso restringere lo spazio a R3 .
Occorre inoltre rimuovere lorigine: ha quindi senso scegliere la sfera S 2 come
ambiente in cui studiare i fenomeni dovuti alla presenza del monopolo. Il tutto
sar quindi espresso in termini di un fibrato su S 2 con fibra C e del suo principale
associato, la cui struttura andr stabilita in seguito. Dato che la sfera privata
di un qualsiasi punto diffeomorfa al piano e in particolare retraibile, sui due
aperti ottenuti rimuovendo rispettivamente i due poli Nord e Sud (cio
z)
possibile trovare delle banalizzazioni del fibrato, e dunque dei potenziali estesi
a tutta la regione. Non sar invece possibile trovarne uno definito sullintera
sfera, poich altrimenti per il teorema di Gauss si avrebbe:
Z
Z
Z
ds =
ds =
4g =
Bn
An
A dl = 0
S2

S2

S 2

I due potenziali
AN = g

ydx + xdy
r(r + z)

AS = g

ydx xdy
r(r z)

sono definiti rispettivamente sulle calotte Nord e Sud, e il loro rotore effettivamente il campo magnetico B sul dominio di ciascuno. Fuori dallasse z ben

CAPITOLO 4. TEORIE DI GAUGE

62

definita la differenza tra queste due forme: ci permetter di costruire la mappa


di transizione da un aperto banalizzante allaltro.
AN AS = g

2ydx + 2xdy
r (r2 z 2 )

e passando a coordinate sferiche si ha


AN AS =

2g
d = (2g)
r sin

La trasformazione quindi data dal potenziale di gauge = 2g. Da qui si pu


riottenere il risultato del teorema di Gauss da cui si era partiti:
Z
Z
Z
ds =
ds +
ds =
Bn
Bn
Bn
S2
S 2 { z0 }
S 2 { z0 }
Z
Z
ds +
ds =
=
AN n
AS n
UN
2

US

Z
=

(AN AS ) d = 4g
0

Si supponga ora che nella regione perturbata dalla presenza del monopolo
magnetico venga introdotta una carica elettrica di prova sufficientemente piccola da non modificare apprezzabilmente i campi. Questo teoricamente possibile
a prescindere dallipotesi che non esista una carica elettrica non nulla di modulo
arbitrariamente piccolo, poich in questa eventualit basta sovrapporre pi monopoli magnetici in modo da soddisfare la condizione. Se q il valore di questa
carica, lequazione di Schrdinger per questo sistema, diviene
i~

N
=
t

~2
2m

X

iq
~

2


(AN )

per la calotta Nord, e analogamente per quella Sud. La regola che trasforma
N in S data dunque da


 q 
2qg
S
N = exp i S = exp i
~
~
Da qui si ricava la funzione di transizione


2qg

tSN = exp i
~
Se il modello buono, tSN rappresenta una ben definita funzione di , e in
quanto tale devessere 2-periodica. Questo equivale alla condizione di quantizzazione:
2qg
Z
~
Ecco dunque una prima previsione ricavata da questa teoria: cariche elettrica
e magnetica sono quantizzate. Infatti, fissando il valore di q si ottiene una
condizione su g che le impone di avere un valore multiplo intero di una data
costante, e dunque esiste una carica fondamentale g0 per cui il valore di qualsiasi

CAPITOLO 4. TEORIE DI GAUGE

63

monopolo magnetico sia g = kg0 per qualche k Z. In modo del tutto analogo
si ricava la quantizzazione della carica elettrica. Questo risultato del tutto
indipendente da quello mostrato da Millikan in laboratorio, e anzi non d alcuna
previsione sul valore di queste cariche fondamentali. Ci che si pu concludere
che, se la teoria di gauge per lelettrodinamica un buon modello, e se esiste
nelluniverso un monopolo magnetico, allora le cariche elettrica e magnetica
sono quantizzate.

4.4

Leffetto Aharonov-Bohm

Non mai stata provata fino ad oggi lesistenza di alcuna carica magnetica. I
risultati della sezione precedente potrebbero essere visti come fini a se stessi,
senza significato fisico in quanto basati solo su ipotesi sperimentalmente prive
di fondamento. In definitiva, quellesempio non giustifica fino in fondo lintroduzione della teoria di gauge elettrodinamica, o per lo meno non la rende davvero
necessaria. Quello che viene presentato di seguito, invece, un risultato che ha
trovato un riscontro sperimentale, e pu quindi essere pi convincente.
Uno dei primi risultati sperimentali nellambito della meccanica quantistica
fu quello messo in luce dalla cosiddetta esperienza della doppia fenditura. Agli
inizi del XIX secolo Young aveva fatto passare della luce attraverso due fenditure
verticali su una parete, rilevando su uno schermo una figura di interferenza ed
evidenziando cos il comportamento ondulatorio dei fotoni (bench allora non
si usasse questo linguaggio). Analogamente, questo nuovo esperimento consiste
nello sparare attraverso una doppia fenditura un fascio di elettroni, ottenendo
anche in questo caso un fenomeno di interferenza.
Classicamente questo fenomeno non ha senso: se lelettrone una particella massiva naturale aspettarsi che la distribuzione rilevata sullo schermo sia
concentrata in due punti corrispondenti alle fenditure. Secondo la meccanica
quantistica, invece, questo ha perfettamente senso. Se si suppone che un certo
elettrone abbia superato il piano su cui sono incise le fenditure, senza per sapere
da quale delle due sia passato, il suo stato potr essere scritto come combinazione lineare dei due fondamentali |1 i e |2 i, ciascuno dei quali rappresenta
il caso in cui la particella abbia attraversato una delle due fessure. Tali stati,
essendo autovettori per loperatore hermitiano che rappresenta losservazione
della fenditura da cui passato lelettrone, sono ortogonali. Se si suppone che
le situazioni siano equiprobabili, allora:

2
(|1 i + |2 i)
|i =
2

dove la costante 2/2 serve da normalizzazione. Sulla base dei principdio di


Huygens, ciascuno dei due stati fondamentali pu essere descritto come quello
di una sorgente, posta nella relativa fenditura, che emette elettroni in maniera
isotropa. Le due funzioni donda sono ottenute luna dallaltra tramite uno shift
del dominio, e la fase relativa tra di esse fa s che sommandole si abbia leffetto
di interferenza rilevato sperimentamente.
Inserendo dietro le fenditure, in una zona in cui gli elettroni non possano entrare, un solenoide molto lungo attraversato da corrente, si ottiene un fenomeno
molto curioso, che porta il nome di effetto Aharonov-Bohm. Bench la teoria
classica non preveda alcuna variazione rispetto al caso precedente (nella regione

CAPITOLO 4. TEORIE DI GAUGE

64

esterna al solenoide il campo elettromagnetico trascurabile), sperimentalmente si osserva uno shift della figura di interferenza proporzionale al flusso del
campo magnetico nel solenoide, misurato considerando positivo il verso dellasse
z verso lalto.

Fenditura 2

2
P
Solenoide

Sorgente

Fenditura 1

La trattazione fisica pu essere svolta nel modo che segue. Le due funzioni
donda 1 (x) e 2 (x) corrispondenti ai due autostati delloperaore che misura da quale fenditura sia passato lelettrone sono identiche nella sorgente. Si
ipotizza che lemissione di particelle sia isotropa e abbia propagazione sferica;
sotto la condizione che la distanza tra le fessure sia trascurabile rispetto alle lunghezze caratteristiche dellapparato sperimentale (distanza sorgente-fenditure e
fenditure-schermo) si pu approssimare il comportamento nei punti di interesse,
in condizioni di particella libero, come quello di unonda piana. Scelgo un sistema di riferimento in cui il piano delle fenditure corrisponde a x = 0, e i punti in
cui queste si trovano siano individuati dai vettori r1 ed r2 , mentre la sorgente
posta in rS . Lo scopo della trattazione studiare cosa avviene in un punto P
sullo schermo, individuato da rP .
Per prima cosa occorre valutare le due funzioni donda in r1 ed r2 rispetto
ad una particolare scelta di gauge. Per ora comodo usarne una in cui il
potenziale vettore identicamente nullo nel semipiano delimitato dalle fenditure
e contenente la sorgente. In questo modo vale
j (ri ) = j (rS ) eik(rj rS )
dove il vettore k una costante che caratterizza la propagazione degli elettroni,
mentre i lunit immaginaria e j un indice che varia tra 1 e 2 (cio identifica
lo stato che si sta considerando). Fin qui non vi stata nessuna influenza da
parte del solenoide.
Si suppongano note le funzioni donda nei punti corrispondenti alle fenditure per una differente scelta di gauge, quella cio in cui il potenziale si annulla
identicamente nellaltro semipiano. Qui si sta ipotizzando che il solenoide sia
sufficientemente sottile da renderne trascurabile la sezione. Allora i valori delle
funzioni in P sono ottenuti nuovamente in maniera analoga al caso senza solenoide, e cio moltiplicando per il termine di fase eik(rP rj ) . Anche qui non c
alcun contributo dalla presenza del solenoide. Questo per diviene importante

CAPITOLO 4. TEORIE DI GAUGE

65

quando si cambia la gauge: passando dalla prima alla seconda ogni funzione
donda viene sfasata di un termine che dipende dal potenziale di gauge , che
pu essere espresso come integrale di linea della differenza tra i potenziali. In
questo modo la j (rj ), rispetto alla seconda gauge, diviene:

 Z rj
ie
A dl
j (rS ) eik(rj rS ) exp
~ rS
In definitiva, le funzioni donda in P sono le stesse del caso senza solenoide, a
meno di una fase determinata dal potenziale. Questo pu essere rilevante se la
fase relativa tra le due viene modificata. La variazione di tale fase rispetto al
caso senza solenoide data da
 Z

Z
ie
ie
exp
A dl +
A dl
~ 1
~ 2
Il percorso 1 + 2 pu essere chiuso con un qualsiasi arco 3 nella regione in
cui il potenziale nullo, senza dare alcun contributo. La fase cercata diviene
dunque

 Z
 e 
ie
A dl = exp i
exp
~ 2 +3 1
~
Segue che la figura dinterferenza risulta shiftata di una lunghezza proporzionale
al flusso del campo magnetico attraverso una spira del solenoide.
Il fenomeno pu essere descritto geometricamente nel modo che segue. La
regione di interesse quella esterna al solenoide, e ha la stesso tipo di omotopia
di una circonferenza, perci il fibrato da introdurre avr spazio base S 1 (e fibra
C, come sempre). I due stati fondamentali |1 i e |2 i corrispondono ad archi di
circonferenza 1 e 2 che connettono un punto S, che rappresenta la sorgente,
a P , posto sullo schermo, in cui si vogliono valutare le nuove funzioni donda.
Suppongo che la fenditura corrispondente al percorso 1 sia posta in y = d,
laltra, invece, in y = d, con d > 0, in modo che 1 2 dia la circonferenza
percorsa in verso antiorario partendo dalla sorgente. Queste sono ottenute dalle
vecchie (|1 iV e |2 iV ) moltiplicandole per una fase ei(x) , cio una sezione
del fibrato principale associato a quello in uso, con la condizione che questa
sia trasportata parallelamente lungo gli archi. Questo giustifica la restrizione
dello spazio ad un suo retratto per deformazione: dato che la curvatura della
connessione rappresentata dai campi, che in questo caso sono nulli nella regione
di interesse, il trasporto parallelo lungo una curva non dipende che dalla sua
classe di omotopia. Per questo sistema possibile scegliere un potenziale globale:
le condizioni che questo deve soddisfare sono che il suo rotore sia nullo, e che il
suo integrale lungo la circonferenza, percorsa in senso antiorario, dia i 2 . La
forma
ydx + xdy
A = i
2r2
soddisfa tali richieste. Lequazione del trasporto parallelo lungo la curva (s)
sar
d exp (i((s))) e
exp (i((s)))
A(s)

=0
ds
~
2 Il

flusso deve essere uguale allintegrale di linea del potenziale A = iA. Moltiplicando
per i si ha la relazione data.

CAPITOLO 4. TEORIE DI GAUGE

66

da cui si ricava che, se lo sfasamento tra |iV e |i in (0) 0 , allora in (1)


vale
Z
e
i0 +
Ads
~
Se si applica quanto detto supponendo nota la fase relativa tra 1 vecchia e
nuova in P , allora quella in S sar
Z
Z
e
e
Ads = i0
Ads
i0 +
~ 1
~ 1
Poich per ipotesi 1 (S) = 2 (S), la fase relativa di |2 i rispetto al valore
vecchio data da
Z
Z
Z
e
e
e
e
i0
Ads +
Ads = i0 +
Ads = i i
~ 1
~ 2
~ 2 1
~
Dunque la fase relativa tra i due stati fondamentali di questo sistema quella
del caso senza solenoide con un contributo aggiuntivo pari a ie/~. Se
un multiplo intero di h/e, allora sullo schermo non si rileva alcuna differenza
rispetto al caso precedente, poich il nuovo contributo non influisce sullesponenziale. Se per questo non vale, la figura di interferenza deve cambiare, e
in effetti levidenza sperimentale ha mostrato che questo realmente ci che
avviene.
Questo un esempio in cui si manifesta la rilevanza fisica del potenziale
vettore, che classicamente non aveva altro significato che quello di un semplice
strumento matematico per manipolare le equazioni che determinano i campi,
veri protagonisti della teoria di Maxwell. Nella meccanica quantistica questi
devono invece passare in secondo piano poich non sono in grado di descrivere
fino in fondo la fisica di fenomeni come quello appena analizzato, in cui la
presenza di potenziali non banali in grado di influenzare un sistema nonostante
i campi siano identicamente nulli nella regione di interesse. Se da un punto
fisico questo pu sorprendere (e in effetti questo risultato fu accolto con stupore
dalla comunit scientifica), matematicamente non presenta alcuna novit. Si
tratta semplicemente di un caso in cui una connessione, seppur piatta, presenta
olonomia non banale, ossia non tutti i cammini che si richiudano nello spazio
base fanno lo stesso una volta sollevati orizzontalmente. Se si considera una
regione sufficientemente piccola allora i trasporti paralleli sono tutti non banali,
ma appena entra in gioco una curva non retraibile questo non pi vero, e
leffetto Aharonov-Bohm rappresenta un esempio fisico di questo fenomeno.

4.5

Continua...

La formulazione presentata ora dellelettrodinamica non che un esempio particolare di teoria di gauge. Pi in generale, si possono presentare situazioni fisiche
in cui il sistema in analisi abbia dei gradi di libert teorici in pi rispetto a quelli
effettivamente osservabili. Nel caso trattato finora, questa variabile in eccesso
il potenziale di gauge , che nella soluzione delle equazioni si manifesta chiaramente, ma che fisicamente non rappresenta nulla di evidentemente concreto. I
gradi di libert in pi vengono parametrizzati punto per punto da un opportuno
gruppo di Lie G, formato dalle trasformazioni che lasciano invariato il resto del

CAPITOLO 4. TEORIE DI GAUGE

67

sistema; scelto il gruppo viene definito un G-fibrato principaleP sulla variet


M che rappresenta lambiente in cui si svolgono i fenomeni in analisi. Nel caso
presentato sopra, la variabile aggiuntiva era il potenziale di gauge , che varia
su R, sostituito poi da iR (unalgebra di Lie) e infine da U(1). Vengono poi introdotte delle 1-forme locali Ai a valori in g, con le regole di trasformazione che
permettano di definire una connessione su P . Da queste nascono immediatamente le 2-forme Fi che rappresentano la curvatura, legate ad Ai dallequazione
di struttura di Cartan
Fi = dAi + Ai Ai
(4.1)
Il secondo termine della parte destra dellequazione sparisce se G, detto gruppo
di gauge, abeliano, ma in generale rilevante. Riscritta per componenti, la
(4.1) diviene (omettendo lindice i):
F = A A + [A , A ]
Questa differisce dallequazione che definisce il tensore campo elettromagnetico
per la presenza del termine [A , A ], che in effetti stato trascurato osservando
esplicitamente che questo legittimo essendo U(1) commutativo.
Si ha poi lidentit di Bianchi:
dFi + [Ai , Fi ] = 0
Tutte queste relazioni, ricavate in precedenza in modo puramente matematico, assumono significati fisici ben precisi, esattamente come nel caso dellelettrodinamica lidentit di Bianchi rappresenta le due equazioni di Maxwell
omogenee.
Un celebre esempio di teoria di gauge non abeliana quella di Yang-Mills,
in cui il gruppo di struttura considerato U(2).

Bibliografia
[1] Tohru Eguchi, Peter B. Gilkey, e Andrew J. Hanson. Gravitation, gauge theories and differential geometry. North Holland publishing company,
1980.
[2] Theodore Frankel. The geometry of physics. Cambridge University Press,
2004.
[3] Herbert Goldstein, Charles Poole, e John Safko. Classical mechanics (third
edition). Addison Wesley, 2002.
[4] Noel Jeffrey Hicks. Notes on differential geometry. Van Nostrand Company,
1965.
[5] David Lovelock e Hanno Rund. Tensors, differential forms, and variational
principles. Dover Publications, Inc., New York, 1975.
[6] Marco Manetti. Topologia. Springer, 2008.
[7] David Morin. Introduction to classical mechanics, 2004.
[8] Shigeyuki Morita. Geometry of characteristic classes. American Mathematical Society, 2001.
[9] Mikio Nakahara. Geometry, topology and physics. Taylor and Francis
Group, 2003.
[10] Clifford Henry Taubes. Differential Geometry. Oxford Graduate Texts in
Mathematics, 2011.

68

Potrebbero piacerti anche