Sei sulla pagina 1di 136

Metodi matematici

per la

Relatività Generale

Pierre Martinetti
martinetti@dima.unige.it

Laurea magistrale, primo semestre 2019-20


DIMA, università di Genova

May 10, 2019


Contents

1 Introduzione 5
I Da Newton alla relativtià ristretta . . . . . . . . . . . . . . . . . . . . . . . . 6
I.1 Spazio e tempo nelle fisica pre-relativistica . . . . . . . . . . . . . . . 6
I.2 Invarianza della velocità della luce e trasformazione di Lorentz . . . . 7
I.3 Lo spazio-tempo di Minkowski . . . . . . . . . . . . . . . . . . . . . . 9
II Necessità di una nuova gravitazione . . . . . . . . . . . . . . . . . . . . . . . . 10
II.1 La perdita della simulatenaita assoluta . . . . . . . . . . . . . . . . . . 10
II.2 Il principio di equivalenza . . . . . . . . . . . . . . . . . . . . . . . . . 11

PARTE 1: Fondamenti della Relatività Generale 13

2 Relatività ristretta 15
I Trasformazioni di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.1 Dimostrazione delle trasformazioni di Lorentz . . . . . . . . . . . . . . 16
I.2 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . 19
I.3 Conseguenze fisiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
II Quadrivettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
II.1 Definizione e quadriposizione . . . . . . . . . . . . . . . . . . . . . . . 21
II.2 Prodotto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
II.3 Pseudo norma e ortogonalità . . . . . . . . . . . . . . . . . . . . . . . 23
II.4 Forma generale di una trasformazione di Lorentz * . . . . . . . . . . . 24
II.5 Intervallo e struttura causale . . . . . . . . . . . . . . . . . . . . . . . 24
III Cinematica relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
III.1 Tempo proprio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
III.2 Quadrivelocità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
IV Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
IV.1 Quadrivettore energia-impulso . . . . . . . . . . . . . . . . . . . . . . 28
IV.2 Equivalenza tra massa e energia . . . . . . . . . . . . . . . . . . . . . 29

Interludio: verso la relatività generale 31


A. Successi e limite della relatività ristretta . . . . . . . . . . . . . . . . . 31
B. Conflitto con la teoria newtoniana della gravitazione . . . . . . . . . . 31

1
2 CONTENTS

C. Il principio di equivalenza . . . . . . . . . . . . . . . . . . . . . . . . . 33
D. Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . 34

3 Geometria differenziale 35
I Varietà . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
I.1 Spazio topologico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
I.2 Varietà topologica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
I.3 Varietà differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
II Vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
II.1 Vettore tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
II.2 Spazio tangente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
II.3 Campo vettoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
II.4 Curva integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
III Tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
III.1 Duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
III.2 1-forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
III.3 Tensori di grado superiore . . . . . . . . . . . . . . . . . . . . . . . . . 50
III.4 Mappa differenziale e pull back . . . . . . . . . . . . . . . . . . . . . . 51
IV Connessione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
IV.1 Trasporto parallello . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
IV.2 Derivata covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
IV.3 Geodetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
IV.4 Connessione e geodetiche per il trasporto parallelo “naturale” del piano 58
IV.5 Trasformazione dei componenti della connessione ∗ . . . . . . . . . . . 60
V Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
V.1 Curvatura di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
V.2 Tensori di Riemann e di torsione . . . . . . . . . . . . . . . . . . . . . 62
V.3 Componenti dei tensori di Riemann e di torsione . . . . . . . . . . . . 65
V.4 Tensore di Ricci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
V.5 Significato geometrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
VI Metrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
VI.1 Tensore metrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
VI.2 Isomorfismo musicale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
VI.3 Derivata covariante di un tensore . . . . . . . . . . . . . . . . . . . . . 72
VI.4 Teorema di Levi-Civita . . . . . . . . . . . . . . . . . . . . . . . . . . 74
VI.5 Identità di Bianchi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
VI.6 Curvatura scalare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4 Fondamenti della relatività generale 79


I Moto nel campo gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . 80
I.1 Geodetiche come traiettoria di caduta libera . . . . . . . . . . . . . . . 80
I.2 Tempo proprio e quadri-velocità . . . . . . . . . . . . . . . . . . . . . 82
I.3 Geodetiche come curve di lunghezza estremale . . . . . . . . . . . . . 83
I.4 Forze di marea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
I.5 Coordinate normali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
II Le equazioni del campo gravitazionale . . . . . . . . . . . . . . . . . . . . . . 92
CONTENTS 3

II.1 Tensore energia-impulso . . . . . . . . . . . . . . . . . . . . . . . . . . 92


II.2 Primo tentativo per un equazione del campo gravitazionale . . . . . . 97
II.3 Divergenza del tensore di Ricci . . . . . . . . . . . . . . . . . . . . . . 101
II.4 Equazioni di Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

PARTE 2: Soluzioni e applicazioni 109

5 Soluzione linearizzata 111


I Linearizzazione delle equazioni di Einstein . . . . . . . . . . . . . . . . . . . . 111
I.1 Sviluppo nel primo ordine del tensore geometrico . . . . . . . . . . . . 111
I.2 Gauge armonica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
II Approssimazione Newtonianna . . . . . . . . . . . . . . . . . . . . . . . . . . 114
II.1 Potenziale gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . 114
II.2 Legge di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
III Onde gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

6 Soluzione di Schwarzschild 117


I Metrica di Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
I.1 Spazio-tempo stazionario, statico e a simmetria sferica . . . . . . . . . 117
I.2 Soluzione delle equazioni di Einstein nel vuoto . . . . . . . . . . . . . 120
I.3 Campo di Killing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
II I test della relatività . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
II.1 Spostamento verso il rosso gravitazionale . . . . . . . . . . . . . . . . 123
II.2 Geodetiche nello spazio di Schwarzschild . . . . . . . . . . . . . . . . . 124
II.3 Geodetiche di tipo tempo: il perielio di Mercurio . . . . . . . . . . . . 125
II.4 Geodetiche di tipo luce: deviazione della luce dal Sole . . . . . . . . . 127
III Buchi neri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
III.1 Singolarità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
III.2 Orizzonte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
III.3 Buco nero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
III.4 Singolarità di coordinate∗ . . . . . . . . . . . . . . . . . . . . . . . . . 133

Un asterisco accanto a un paragrafo, prova o sezione indica che l’argomento non


è stato trattato durante la lezione (e quindi non è esigibile all’esame).
4 CONTENTS
Chapter 1

Introduzione

La relatività generale è la teoria relativistica della gravitazione, pubblicata da Albert


Einstein nel 1915. Dai tempi di Newton e i suoi Principia Mathematica (1687), la gravitazione
veniva vista come una forza attrattiva Fg tra due corpi massivi, proporzionale alle loro masse
m1 , m2 , e inversamente proporzionale al quadrato della distanza r tra di loro:
m1 m2
Fg = G (1.1)
r2
dove G è una costante, detta costante di Newton. La gravitazione è quindi un interazione a
distanza (i due corpi non si toccano e però esiste una forza tra di loro, al contrario della forza
meccanica esercita da una mola ad esempio) e instantanea (a l’instante in cui sparisce una
delle masse, la forza smette di applicarsi sull’altra massa).
Come vedremmo sotto, questa descrizione della gravitazione non è compatibile con la
teoria della relatività speciale (o relatività ristretta), pubblicata dallo stesso Einstein nel
1905, per risolvere il conflitto tra la meccanica classica e l’osservazione che la velocità della
luce (nel vuoto) è la stessa in tutti i sistemi di riferimento inerziali.
La relatività generale risolve l’apparente contraddizione tra gravitazione e relavità ristretta,
interpretando la gravitazione non più come una forza, ma come un effetto dovuto alla cur-
vatura dello spazio-tempo. Inoltre, la teoria specifica che questa curvatura è dovuta alla massa
degli oggetti presenti.
Lo scopo di questo corso è capire il senso di queste affirmazioni, capirne le motivazioni
fisiche, e presentare gli oggetti matematici che permettono di darle un senso chiaro. Più parti-
colarmente, verrano utilizzati degli strumenti di geometria differenziale pseudo-Riemanniana.
La prima parte presenta i fondamenti della relatività generale, che culminano nelle equazioni
di Einstein, legando la curvatura dello spazio-tempo al suo contenuto in materia. In una
seconda parte, si studieranno vari esempi di spazi-tempi curvi, insieme alle loro applicazioni
alla fisica, come la cosmologia, la teoria dei buchi neri, le onde gravitazionali.
La relatività ristretta già implicava una revisione radicale dei concetti di spazio e di
tempo. La relatività generale porta questa revisione ancora più avanti, in un modo non
sempre intuitivo. In questo capitolo introduttivo, faremmo un introduzione storica-scientifica
alla teoria. Partendo della visione newtoniana (cioè pre-1905), ricorderemo i motivi fisici che
portano alla relatività ristretta e a rinunciare all’idea di un tempo assoluto. Poi indicheremmo
le grande linee del ragionamento di Einstein, che lo portarono a vedere la gravitazione come
un effetto geometrico, di curvatura dello spazio-tempo. Nuovi strumenti e nozioni saranno
introdotti in modo informale, i dettagli matematici saranno studiati nei capitoli successivi.

5
6 CHAPTER 1. INTRODUZIONE

I Dallo spazio e tempo diNewton allo spazio-tempo relativistico


I.1 Spazio e tempo nelle fisica pre-relativistica

Nella fisica classica (cioè newtoniana), lo spazio è visto come un continuum di punti: per
specificare un punto P servono un origine O e tre coordinate reali che danno la posizione
relativa di P rispetto a O. Una scelta comoda sono le coordinate cartesiani x, y, z. Rendono
facile il calcolo della distanza (Euclidea) tra due punti P1 = (x1 , y1 , z1 ) e P2 = (x2 , y2 , z2 ),
grazie al teorema di Pythagoras. La distanza tra i due punti è
p
dEuc (P1 , P2 ) := (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 . (1.2)

Oltre alla legge di gravitazione universale (1.1), un’altra scoperta di Newton fu di indi-
viduare il tempo come un parametro universale t da cui dipendono le altre grandezze fisiche.∗
Ad esempio, la posizione P di un massa (puntiforme) è caratterizzata da tre funzioni reale
x(t), y(t), z(t). Newton spiegò anche come sono determinate queste funzioni: enunciò formal-
mente il principio d’inerzia (o prima legge di Newton), scoperto prima da Galileo Galilei:

se un corpo è fermo o si muove di moto rettilineo uniforme (cioè con velocità costante),
vuol dire che non è soggetto a forze oppure che la risultante delle forze che agiscono su
di esso nulla. Viceversa, se la risultante delle forze applicate a un corpo è nulla, esso
è fermo o si muove di moto rettilineo uniforme.

Matematicamente, il principio d’inerzia si traduce nella seconda legge di Newton:


X
mẍ = Fi , (1.3)
i

dove x(t) indica il vettore di componente (x(t), y(t), z(t)), Fi sono i vettori rappresentano le
varie forze che agiscono sul corpo (puntiforme), e il doppio punto¨indica la derivata seconda
rispetto al tempo. La costante di proporzionalità tra forza e accelerazione è la massa m.
Un sistema di riferimento (O, x̂, ŷ, ẑ)† in cui vale il principio d’inerzia è detto inerziale.
Ogni sistema di riferimento (O0 , x̂0 , ŷ 0 , ẑ 0 ) ottenuto dal primo tramite una delle seguente
trasformazioni è ancora inerziale:

• Traslazione spaziale: x̂0 = x̂, ŷ 0 = ŷ, ẑ 0 = ẑ ma O0 diverso da O.

• Rotazione spaziale: O0 = O ma x̂0 = R(x̂), ŷ 0 = R(ŷ), ẑ 0 = R(ẑ) con R una rotazione.

• Traslazione temporale: O0 = O e x̂0 = x̂, ŷ 0 = ŷ, ẑ 0 = ẑ, ma i tempi t e t0 misurati dagli


osservatori solidali a O e O0 sono tale che t0 = t + δ dove δ è una costante.

• Trasformazione di Galileo: O0 si muove a velocità costante rispetto a O.

Si dimostra che qualunque trasformazione tra due sistemi di riferimento inerziali è sia una
di queste trasformazioni, sia una composizione di esse. Il gruppo cosı̀ generato è chiamato

Quest’idea ci sembra ovvia, non lo era al tempo di Newton (cf il libro di Rovelli “L’ordine del tempo”).

Un sistema di riferimento nello spazio Euclideo è dato da un’origine O insieme a tre vettori di norma 1
ortogonali (i.e. versori). Denotiamo x̂, ŷ, ẑ i versori associati alle coordinate cartesiani.
I. DA NEWTON ALLA RELATIVTIÀ RISTRETTA 7

gruppo di Galileo, denotato Gal(3). Si tratta di un gruppo non-abeliano ‡ di dimensione 10


(4 traslazioni spazio-temporali, 3 rotazioni spaziali, 3 trasformazioni di Galileo). Si verifica
che la distanza euclidea (1.2) è invariante per azione del gruppo di Galileo
dEuc ((G(P1 ), G(P2 )) = dEuc (P1 , P2 ) ∀G ∈ Gal(3). (1.4)
In questo senso anche lo spazio è assoluto: la distanza tra due punti è una grandezza univoca,
independente dell’osservatore inerziale.

Fino al inizio del 900, vale quindi la seguente descrizione dello spazio e del tempo:

- lo spazio è lo spazio Euclideo tridimensionale, cioè R3 munito della distanza (1.2);

- il tempo è un parametro (reale) assoluto: anche se due orologi non indicano la


stessa ora -pensare ai fusi orari sulla Terra - misurano gli stessi intervalli di tempo:
dt = dt0 in qualunque sistema di riferimento;

Vale inoltre il principio di relatività di Galileo: le legge della meccanica sono invari-
ante sotto una trasformazione delle coordinate data da qualunque elemento di Gal(3).

I.2 Invarianza della velocità della luce e trasformazione di Lorentz

Consideriamo un osservatore solidale al sistema di riferimento inerziale (O, x̂, ŷ, ẑ), munito
di un orologio che misura il tempo t; e un secondo osservatore solidale a un sistema di
riferimento (O0 , x̂0 , ŷ 0 , ẑ 0 ) in moto rettilineo uniforme rispetto a O con un velocità costante
v = vx̂. Assumiamo che i due referenziali hanno la stessa orientazione, x̂0 = x̂, ŷ 0 = ŷ, ẑ 0 = ẑ,
e che a un certo istante le posizione di O e O0 coincidono, in tale modo che i due osservatori
possano sincronizzare le loro orologi (mettendole a zero). Sia x, y, z le coordinate di un punto

P misurato dall’osservatore O ad un tempo t. Allo stesso tempo


t0 = t, (1.5)

o non-commutativo: la composizione g1 ◦ g2 di due elementi del gruppo non è necessariamente uguale a
g2 ◦ g1 . Lo è per g1 , g2 entrambi traslazioni, ma non lo è in generale, ad esempio per rotazioni arbitrarie.
8 CHAPTER 1. INTRODUZIONE

le coordinate x0 , y 0 , z 0 di P misurate da O0 sono §

x0 = x − vt, y 0 = y, z 0 = z. (1.6)
Supponiamo che a l’istante 0, l’osservatore O emette un raggio di luce lungo l’asso x, nella
stessa direzione lungo la quale si muove O0 . Dopo un tempo t, il raggio di luce raggiunge il
punto di coordinate (x = ct, y = 0, z = 0), dove c è la velocità della luce misurata da O. Per
O0 , segue da (1.6) che dopo lo stesso tempo t0 = t, la luce raggiunge il punto di coordinate
(x0 = ct − vt, y = 0, z = 0). Per O0 la luce ha percorso una distanza x0 durante un tempo t0 ,
quindi la sua velocità è
x0 (c − v)t
c0 = 0 = = c − v. (1.7)
t t
Dal momento che v non è nulla, abbiamo che c0 6= c. Di conseguenza, O0 e O non misurano
la stessa velocità della luce. Questo è in accordo con la legge di additività delle velocità tra
due osservatori in moto uniforme, che segue del principio di relatività di Galileo.
Però segue dell’esperienza di Michelson e Morley (1885) che il valore della velocità della
luce, misurate in due sistemi di riferimento inerziale, non cambia e vale
c = 299792458m/s,
in contraddizione col calcolo precedente. Una possibile soluzione sarebbe che le legge del
elettromagnetismo (cioè le equazioni di Maxwell, che stabiliscano che la luce si muove con
una velocità c) non soddisfino allo stesso principe di relatività di quello soddisfatto dalle leggi
della meccanica. Oppure si devono trovare nuove trasformazioni di coordinate che
• rispettano l’invarianza della velocità della luce,
• permettono di ritrovare le legge di Galileo in un limite adeguato.
Tale trasformazioni esistono, e sono le trasformazioni di Lorentz. Le scriveremmo in
extenso nella sezione dedicata alla relatività speciale, e mostreremmo che sono le uniche a
soddisfare i requisiti di sopra. Al momento, ci limitiamo alla trasformazione di Lorentz tra
due sistemi di riferimento (O, x̂, ŷ, ẑ) e (O0 , x̂0 , ŷ 0 , ẑ 0 ) come sopra (stessa orientazione nello
spazio, in moto uniforme con velocità v = vx̂, 0 < v < c, sincronizzati a t = t0 = 0). È data
da
vx
t0 = γ(t − 2 ), x0 = γ(x − vt), y 0 = y, z 0 = z (1.8)
c
dove s
1
γ := 2 (1.9)
1 − vc2
è il fattore di Lorentz. Riprendendo la formula (1.7) con queste nuove definizioni di x0 e t0 ,
viene (per x = ct)
x0 x − vt ct − vt (c − v)t
c0 = 0 = = vct = (c − v)t c = c. (1.10)
t t − vx
c2 t − c2
Quindi la velocità della luce misurata da O0 è la stessa di quella misurata da O. Si verifica
anche che per velocità v molto inferiore a c, il fattore γ tende a 1 mentre cv2 tende a 0, in tale
modo che la trasformazione di Lorentz (1.8) si riduce a quella di Galileo (1.5)-(1.6).
§
Queste equazioni costituiscono la forma esplicita di una trasformazione di Galileo.
I. DA NEWTON ALLA RELATIVTIÀ RISTRETTA 9

I.3 Lo spazio-tempo di Minkowski

La differenza fondamentale tra le trasformazioni di Galileo e quelle di Lorentz è che queste


ultime mischiano le coordinate spaziali con la coordinata temporale. La distinzione tra spazio
e tempo non è più assoluta. Invece di “un punto dello spazio tridimensionale” insieme ad “un
instante del tempo”, conviene parlare di evento in uno spazio-tempo quadridimensionale.
La distanza Euclidea non è rilevante per descrivere la geometria di questo spazio-tempo,
perché non è una quantità invariante sotto trasformazione di Lorentz. Per vederlo, conside-
riamo due eventi
E1 = (t1 , x1 , y1 , z1 ), E2 = (t2 , x2 , y2 , z2 ), (1.11)

che accadono allo stesso instante t1 = t2 ed in due punti dello spazio distinti P1 = (x1 , y1 , z1 ),
P2 = (x2 , y2 , z2 ). La distanza Euclidea tra questi due punti è
p
dEuc (P1 , P2 ) = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 . (1.12)

Le imagini degli eventi E1 e E2 sotto la trasformazione di Lorentz (1.8) sono gli eventi
 vx1 
E10 = t01 = γ(t1 − ), x01 = γ(x1 − vt1 ), y10 = y1 , z10 = z1 , (1.13)
c
 vx2 
E20 = t02 = γ(t2 − ), x02 = γ(x2 − vt2 ), y20 = y2 , z20 = z2 . (1.14)
c

Accadono in due punti P10 = (x01 , y10 , z10 ) e P20 = (x02 , y20 , z20 ) dello spazio, che sono separati da
una distanza Euclidea
q
dEuc (P10 , P20 ) = (x01 − x02 )2 + (y10 − y20 )2 + (z10 − z20 )2 , (1.15)
p
= γ 2 (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 . (1.16)

dove la seconda riga segue da (x02 − x01 ) = γ(x1 − x2 ) (conseguenza di t1 = t2 ). Siccome γ


non è mai uguale a 1, abbiamo che dEuc (P10 , P20 ) 6= dEuc (P1 , P2 ).
Quello che si conserva invece è la separazione spazio-temporale (anche chiamata intervallo),

I(E1 , E2 ) := c2 (t1 − t2 )2 − (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 .



(1.17)

Di fatti, verrà dimostrato nel capitolo sulla relatività ristretta (§II.5) che

I(E10 , E20 ) = I(E1 , E2 ) (1.18)

per qualunque eventi E1 . E2 , e le loro immagini E10 , E20 sotto una trasformazione di Lorentz.
L’intervallo I(E1 , E2 ) può assumere valore sia negativa che positiva, e può essere zero
anche se gli eventi E1 e E2 non coincidono (al contrario di dEuc (P1 , P2 ) che è sempre positiva,
e vale zero se e solo se P1 = P2 ). Matematicamente, l’intervallo non è una distanza ma
una pseudo-metrica. Lo spazio R4 munito della pseudo metrica (1.17) è chiamato spazio di
Minkowski (o spazio-tempo di Minkowski, ma spesso si usa la forma abbreviata). Come lo
vedremmo nel capitolo Geometria Differenziale, lo spazio di Minkowski è una varietà differen-
ziale pseudo-Riemanianna piatta.
10 CHAPTER 1. INTRODUZIONE

II Verso la relatività generale


II.1 La perdita della simulatenaita assoluta

Nel sistema di riferimento¶ (O, x̂), due eventi di coordinate (t1 , x1 ) e (t2 , x2 ) sono simul-
tanei quando t1 = t2 . In un sistema di riferimento (O0 , x̂0 = x̂) in moto rettilineo uniforme
v = vx̂ rispetto a O con 0 < v < c, questi due eventi hanno coordinate temporale
vx1 vx2
t01 = γ(t1 − ), t02 = γ(t2 − ). (1.19)
c2 c2
Nel caso i due eventi sono simultanei per O (i.e. t1 = t2 ), ma si svolgono in due punti distinti
dello spazio (i.e. x1 6= x2 ), viene che
v
t02 − t01 = γ (x1 − x2 ) (1.20)
c2
non si annula: per O0 i due eventi non sono simultanei ! In relatività quello che è simultaneo
per un osservatore non lo è necessariamente per un altro. In altre parole, non ha senso dire
che due eventi sono simultanei in assoluto, senza specificare in quale sistema di riferimento.
Questa perdità della simultaneità assoluta è incompatibile con l’idea di forza a distanza
instantanea. Per convincerci, supponiamo che il primo sistema di riferimento sia solidale alla
Terra, con x l’asse che punta verso il Sole, mentre il secondo è in moto uniforme con velocità
v = −vx̂ con 0 < v < c costante. Supponiamo che esista un instante dove O0 coincida con
O, in cui due osservatori solidale ad O e O0 sincronizzano i loro orologi. L’evento E0 cosı̀
definito ha coordinate (t = 0, x = 0) per O, (t0 = 0, x0 = 0) per O0 .

Supponiamo che a l’instante t = 0 (nel primo sistema di riferimento) il Sole sparisca, ad


esempio colpito da una stella a neutroni vagabonde, Quest’evento ha coordinate

Es = (t = 0, x = s, y = z = 0) (1.21)

dove s è la distanza Terra-Sole, ed è simultaneo per O a l’evento E0 . Quindi dal punto di


vista dell’osservatore O, il suo incontro con O0 è simultaneo alla distruzione del Sole.

Denotiamo x̂ := (x̂, ŷ, ẑ) e x1 = (x1 , y1 , z1 ), x2 = (x2 , y2 , z2 ).
II. NECESSITÀ DI UNA NUOVA GRAVITAZIONE 11

Per l’osservatore O0 invece, usando la legge di trasformazione (1.8)‖ viene che l’evento Es
“destruzione del Sole” ha coordinate temporale t0s = γ vsc2
, che è superiore a 0. Quindi per O0 ,
il Sole sparisce doppo il suo incontro con O (che si svolge a t0 = 0). In altre parole, quando
O0 incontra O, per lui il Sole esiste ancora.
Se la gravitazione fosse una forza a distanza instantanea, dal momento in cui O e O0 si
incontrano, O smetterebbe di sentire l’attrazione del Sole mentre O0 continuerebbe a sen-
tirla. Questo significherebbe che la forza di gravitazione non dipenda solo delle masse e della
distanza tra di loro, ma anche delle loro velocità. Il cui non è in accordo con la legge di
gravitazione universale di Newton: le velocità di m1 e m2 non entrano nell’equazione (1.1).

II.2 Il principio di equivalenza

Nella fisica newtoniana, la massa giocca un doppio ruolo: da una parte, in (1.3) è il
coefficiente di proporzionalità tra le forze e l’accelerazione. La massa misura la “difficoltà
a muovere un corpo”, ed è detta massa inerte (o inerziale). Dall’altra parte, riscrivendo
l’equazione (1.1) come Fg = m1 g dove g := G m 2
r2
è l’intensità del campo gravitazionale creato
da m2 a una distanza r, allora la massa m1 rappresenta la sensibilità di un corpo al campo
gravitazionale generato da un altra massa. Si parla di massa pesante. È un fatto sperimentale
che le due masse sono uguale. Ma niente nella fisica newtoniana ne spiega il perchè. Einstein
al contrario fa dal uguaglianza
massa inerte = massa pesante
un principio, detto principio di equivalenza.
Consideriamo allora in un sistema di riferimento (O, x̂), una massa m, in presenza di
in un campo di gravitazione g. Se non si esercitano su m altre forze, la seconda legge di
Newton dà mg = ma. Dal principio di equivalenza, viene g = a. Einstein postula che sia
possibile annulare l’effetto della gravitazione lavorando in un sistema di riferimento (O0 , x̂0 )
in accelerazione a = g rispetto a (O, x̂) (in realtà quest’annullamento vale solo localmente,
come spiegato in dettagli nel capitolo “Interludio verso la relatività generale”). Tuttavia, le
trasformazioni di Lorentz collegano due sistemi di referenze in motto rettilineo, non in motto
accelerato. Si tratta quindi di trovare trasformazioni di coordinate più generale, valide tra
qualunque sistema di riferimento.
Il problemà si può riformulare nel modo seguente: si cerca di descrivere lo spazio-tempo in
tale modo che - localmente - esistono delle coordinate che lo fanno rassomigliare allo spazio-
tempo in assenza di gravitazione, cioè allo spazio-tempo di Minkowski. Questo è proprio
il tipo di problema che affronta la geometria differenziale: la sfera ad esempio è descritta
come uno spazio che localmente rassomiglia al piano euclideo (è cosı̀ che, localmente, la Terra
ci sembra piatta) anche se globalmente la sfera non è un piano: sul piano si può andare
per sempre dritto in una direzione, senza mai ripassare là dove si è già passata; mentre se
uno va dritto sempre nella stessa direzione sulla Terra, dopo un po torna al suo punto di
partenza (avendo compiuto un giro completo della Terra). La nozione di curvatura permette
di catturare questa differenza.
In relatività non serve un oggetto localmente euclideo, ma un oggetto che rassomiglia
localmente allo spazio di Minkowski. Per questo motivo la soluzione non verrà data dalla
geometria differenziale riemanniana, ma dalla geometria pseudo-riemanniana.
‖ vx
con il segno + davanti a c2
, perchè nel nostro esempio v è orientato lungo −x̂
Parte 1
Fondamenti della Relatività
Generale

13
Chapter 2

Relatività ristretta

Per affrontare l’incompatibilità tra le trasformazioni di Galileo (1.5)-(1.6) e l’osservazione


che la velocità della luce nel vuoto è la stessa in ogni sistema inerziale Einstein postula nel
1905 il principio di relatività:
le leggi fisiche sono le stesse in tutti i sistemi di riferimento inerziali.
Alla differenza del principio di relatività di Galileo, le “leggi della fisica” per Einstein in-
cludono le equazioni di Maxwell, che stabiliscono che la velocità della luce nel vuoto è c,
independentement della velocità della sorgente emmetrice.

I Trasformazioni di Lorentz
Per implementare il principio di relatività, conviene rinunciare a l’ipotesi del tempo asso-
luto. Come spiegato nell’introduzione, invece di vedere lo spazio (tridimensionale) e il tempo
come entità separate, si considera un singolo spazio-tempo quadri-dimensionale. Un elemento
di esso è un evento E, caratterizzato da un punto P dello spazio e da un instante del tempo.
Alla differenza della fisica classica, ogni osservatore misura quest’instante del tempo col suo
proprio orologio. Perciò un evento E è caratterizzato da quatre coordinate,
E = (t, x, y, z), (2.1)
relative a un orologio t̂ e a un sistema di riferimento (O, x̂) dello spazio (con x̂ = (x̂, ŷ, ẑ)
una terna di versori). Per brevità, scriviamo (O, t̂, x̂) un tale “sistema di riferimento” dello
spazio-tempo.
In un altro sistema di riferimento (O0 , t̂0 , x̂0 ), lo stesso evento E ha coordinate (t0 , x0 , y 0 , z 0 ).
In caso O0 è in moto rettilineo uniforme rispetto a (O, t̂, x̂) con velocità v, cerchiamo delle
trasformazioni di coordinate (t, x, y, z) → (t0 , x0 , y 0 , z 0 ) tale che valga il principio di relatività,
cioè tale che
1. qualunque entità fisica si propaga alla velocità c per un osservatore solidale a (O, t̂, x̂)
si propaga alla stessa velocità c per un osservatore solidale a (O0 , t̂0 , x̂0 ).
2. In un limite adeguato, si ritrovano le formule di Galileo (1.5)-(1.6).
Dimostriamo che sotto opportune assunzioni fisiche, l’unica soluzione sono le trasformazioni
di Lorentz (1.8).

15
16 CHAPTER 2. RELATIVITÀ RISTRETTA

I.1 Dimostrazione delle trasformazioni di Lorentz

La prima assunzione è l’omogeneità dello spazio e del tempo. Permette di scegliere come
origine O0 del seconda sistema di riferimento il punto di esse che coincida con O a t = 0, e
di sincronizzare le orologi in tale modo che questo succedi a t0 = 0. In modo equivalente,
imponiamo che l’evento E0 definito da “O coincida con O0 ” esisti e abbia coordinata (0, O)
nei due sistemi di referenza.
Assumiamo inoltre che lo spazio sia
isotropo, cosı̀ di poter scegliere x̂ = x̂0
lungo la direzione della velocità, con
ŷ 0 = ŷ e ẑ 0 = ẑ. Perciò,

v = vx̂,

con v un numero reale.


Inoltre, l’omogeneità implica che le funzioni t0 (t, x, y, z), x0 (t, x, y, z), y 0 (t, x, y, z) e z 0 (t, x, y, z)
siano lineari in t, x, y, z. Di fatti, il modo in cui le coordinate di un evento in (O0 , t̂0 , x̂0 ) dipen-
dono delle sue coordinate in (O, t̂, x̂) non deve dipendere del evento considerato. Matemati-
camente, significa che la dipendenza in t, x, y, z delle funzioni t0 , x0 , y 0 , z 0 è indipendente da
t, x, y, z. Ad esempio per la funzione x0 (ma lo stesso vale per t0 , y 0 e z 0 ) significa che

∂x0 ∂x0 ∂x0 ∂x0


, , e sono constanti, (2.2)
∂t ∂x ∂y ∂z

cioè x0 (t, x, y, z) è una combinazioni lineare di t, x, y, z.


Finalemente, imponiamo |v| < c. Sarà giustificato più avanti, dalla dinamica relativistica.

Teorema I.1. Nelle condizioni di sopra, le uniche trasformazioni di coordinate che soddisfano
alla condizione 1, e tale che il limite 2 sia quello delle piccole velocità |v| << c, sono le
trasformazioni di Lorentz∗
vx
ct0 = γ(ct − ) (2.3)
c
x0 = γ(x − vt) (2.4)
0
y =y (2.5)
0
z = z. (2.6)

dove γ := q 1 è il fattore di Lorentz.


2
1− v2
c

Proof. Esaminiamo prima le equazioni (2.5) e (2.6). Nonostante sembrino ovvie (una velocità
lungo l’asse x non può indurre una modifica delle coordinate y e z), è interessante giustificarle
da un argomento di omogeneità e isotropia. Supponiamo che esista un evento E le cui
coordinate (t, x, y, z) vengono mandate in (t0 , x0 , y 0 , z 0 ) dove y 0 = y + δ con δ 6= 0. Per
omogeneità del piano (y, z), si assuma che l’origine O è tale che y = z. Per isotropia, la
coordinata z deve variare come y, cioè z 0 = z + δ. Lo stesso ragionamento vale se invece di ŷ

La trasformazione di Lorentz della coordinata temporale (1.8) si deduce di (2.3) dividendo entrambi
membri da c.
I. TRASFORMAZIONI DI LORENTZ 17

e ẑ scegliamo altri due versori ortonormali û, v̂ ortogonali a x̂. Ad esempio û := √1 (ŷ + ẑ) e
2
v̂ = √1 (−ŷ + ẑ). L’evento E ha allora coordinate spaziali
2
 
1 1
x, u = √ (y + z), v = √ (−y + z) , (2.7)
2 2
che vengono mandate in
 
0 0 1 0 1
x , u = √ (y + z + 2δ), v = √ (−y + z) . (2.8)
2 2

Per isotropia, la variazione u0 − u = 2δ deve essere uguale alla variazione v 0 − v = 0, il cui
è possibile solo se δ = 0, cioè se y 0 = y e z 0 = z. Cosı̀ sono dimostrate (2.5) e (2.6).
Similarmente, si dimostra che le funzione t0 e x0 non dipendono di y e z. Con la condizione
di linearità e l’invarianza di E0 sotto trasformazione di coordinate (cioè t0 (t = 0, x = 0) = 0
e x0 (t = 0, x = 0) = 0), otteniamo che t0 e x0 sono dei polinomi omogeni (di grado 1)

ct0 (t, x) = αct + βx, (2.9)


0
x (t, x) = δct + γx. (2.10)

Il problema consiste allora nel determinare le quattre incognite α, β, γ, δ.


In (O, t̂, x̂), a l’instante t il punto O0 ha coordinate (t, vt), mentre in (O0 , t̂0 , x̂0 ) questo
evento ha coordinate (t0 , 0). Significa che per qualsiasi t, vale x0 (t, vt) = 0, cioè da (2.10):
δct + γvt = 0. Quindi
γv
δ=− , (2.11)
c
che è proprio il valore di δ atteso in (2.4)).
Per determinare le tre altre incognite, notiamo prima che per qualunque evento E viene

c2 t02 − x02 = (αct + βx)2 − (δct + γx)2 , (2.12)


2 2 2 0 00
= c t K + x K + 2ctxK , (2.13)

dove abbiamo definito

K := α2 − δ 2 , K 0 := β 2 − γ 2 , K 00 := αβ − δγ. (2.14)

Consideriamo poi un raggio di luce emesso da O al tempo 0. Dopo il tempo t, il fronte


d’onda raggiunge un punto P di coordinate (x, y, z). Per ipotesi, in (O, t̂, x̂) la velocità della
luce è c, quindi abbiamo
c2 t2 − (x2 + y 2 + z 2 ) = 0. (2.15)
In (O0 , t̂0 , x̂0 ), la luce è emessa da O0 al tempo 0 (per invarianza dell’evento E0 ) e raggiunge
lo stesso punto P , di coordinate (x0 , y 0 , z 0 ), dopo un tempo t0 . In accordo al requisito 1, O0
misura la stessa velocità c, quindi

c2 t02 − (x02 + y 02 + z 02 ) = 0. (2.16)

L’uguaglianza tra (2.16) e (2.15), sfruttando (2.13), dà

c2 t2 K + x2 K 0 + 2ctxK 00 = c2 t2 − x2 . (2.17)
18 CHAPTER 2. RELATIVITÀ RISTRETTA

Questa relazione vale per qualsiasi valore di (ct, x) tale che valga (2.15), in particolare per
(ct = 1, x = 1) e (ct = 1, x = −1), con y = z = 0. Portando questi valori in (2.17), otteniamo

K + K 0 + 2K 00 = 0, (2.18)
0 00
K + K − 2K = 0, (2.19)

le cui somme e differenze implicano

K 0 = −K, K 00 = 0. (2.20)

Ricordandosi (2.14) e (2.11), l’annullamento di K 00 dà

γδ γ2v
β= =− , (2.21)
α αc
dove si nota che α 6= 0 altrimenti, da (2.9) verrebbe ct0 = βx, cioè un osservatore immobile
nello spazio per O sarebbe “immobile nel tempo” per O0 . Sostituendo questo valore di β nella
4 2
definizione (2.14) di K 0 , la prima equazione (2.20) dà γα2vc2 − γ 2 = −K, cioè
 v 2
γ4 − α2 γ 2 = −Kα2 . (2.22)
c
Sostituendo α2 da  v 2
α2 = K + δ 2 = K + γ 2 (2.23)
c
(che scende dalla definizione (2.14) di K insieme al valore (2.11) di δ), otteniamo
  2 
4 v 2 v
 2
2 2
γ2 − K .

γ = α (γ − K) = K + γ (2.24)
c c
 2 
Sviluppando, viene K γ 2 − K − γ 2 vc = 0. Dividendo per K (che non è nullo, altrimenti
(2.13) con (2.20) darebbero c2 t02 − x02 = 0 per qualunque t0 e x0 , in particolare O0 sarebbe
bloccato a t0 = 0), otteniamo
  v 2 
2
γ 1− = K. (2.25)
c
 2 
Visto che |v| < c, segue che 1 − vc > 0 quindi K > 0 e

K
γ = ±q 2 . (2.26)
1 − vc

Il valore di K e il segno di γ sono determinati dal limite delle piccole velocità: portando
(2.11) in (2.10) viene x0 = γ(x − vt). Siccome

lim γ = ± K,
v
(2.27)
( c )→0

per ritrovare la trasformazione di Galileo x0 = x − vt, dobbiamo porre K = 1 e scegliere il


segno +. Otteniamo cosı̀ la forma di γ data nel teorema.
I. TRASFORMAZIONI DI LORENTZ 19

Mancano solo i fattori α e β. Portando il valore di γ nella definizione (2.14) di K 0 riscritta


come β 2 = −1 + γ 2 , e in (3.220) viene
v 2

2 1 c
 v 2
β = −1 + = = γ2, (2.28)
v 2 v 2 c
 
1− c 1− c
v 2

2 v 1
 2
2 c 2
α =1+γ =1+  =  =γ . (2.29)
c v 2 v 2
1− c 1− c

Per α abbiamo due possibilità: α = ±γ. Di nuovo la scelta è dettata dal limite delle piccole
velocità: γ → 1 e β → 0 (da (2.28)), quindi (2.9) scritta come

ct0 = ±γct + βx, (2.30)

tende a t0 = ±t. Per ritrovare la formula di Galileo t0 = t, dobbiamo scegliere il segno +,


quindi α = γ. Portando questo valore in (2.21) troviamo finalmente β = −γ vc .

I.2 Interpretazione geometrica

La trasformazione (2.3, 2.6) è chiamata boost nella direzione x. I boost nelle direzione
y o z sono dati da formule simili, e corrispondono a velocità v = v ŷ o vẑ. I boost hanno
un’interpretazione geometrica, ottenuta notando che, siccome −1 < vc < 1, esiste sempre
ζ ∈ R tale che tanh ζ = vc . Allora

1 1 cosh ζ
γ=p =q =p = cosh ζ (2.31)
2
cosh2 ζ − sinh2 ζ
2
1 − tanh ζ sinh ζ
1 − cosh2 ζ

mentre
v
γ = cosh ζ tanh ζ = sinh ζ. (2.32)
c
Un boost nella direzione x si riscrive

ct0 = (cosh ζ)ct − (sinh ζ)x, x0 = (cosh ζ)x − (sinh ζ)ct. (2.33)

Sono formule simili a quelle da una rotazione nel piano (ct, x), con cosh, sinh invece di cos, sin.
Per questo motivo, un boost nella direzione x è chiamato rotazione iperbolica nel piano (ct, x).
Il parametro ζ, che gioca il ruolo del angolo per la rotazione, è chiamato “rapidità” del boost.

Proposizione I.2. L’inverse di un boost con rapidità ζ è un boost con rapidità −ζ, cioè

ct = (cosh ζ)ct0 + (sinh ζ)x0 , x = (sinh ζ)ct0 + (cosh ζ)x0 . (2.34)

Proof. Sotto le trasformazioni (2.34), il punto (2.33) di coordinate (ct0 , x0 ) è mandato in

cosh ζ ((cosh ζ)ct − (sinh ζ)x) + sinh ζ ((cosh ζ)x − (sinh ζ)ct) = ct, (2.35)
sinh ζ ((cosh ζ)ct − (sinh ζ)x) + cosh ζ ((cosh ζ)x − (sinh ζ)ct) = x.

Da (2.32), cambiare ζ in −ζ è equivalente a cambiare v in −v. La proposizione I.2 indica


che l’inverse di un boost lungo l’asse x con velocità v, è il boost lungo x con velocità −v.
20 CHAPTER 2. RELATIVITÀ RISTRETTA

I.3 Conseguenze fisiche

Oltre alla perdità della simultaneità assoluta già spiegata nell’introduzione (cf (1.20))
e le applicazioni all’elettromagnestismo (e.g. il fatto che la distinzione tra campi elettrici
e magnetici è dovuta solo alla scelta del sistema di riferimento), un effetto spettacolare in
relatività ristretta è la seguente dilatazione del tempo.†
In un sistema di riferimento (O, t̂, x̂) (ad esempio un razzo), si considera l’emissione da O
di due segnali a tempi t2 e t2 = t1 + ∆t, cioè due eventi E1 = (t1 , 0, 0, 0) e E2 = (t2 , 0, 0, 0).
In un sistema di riferimento (O0 , t̂0 , x̂0 ) in motto rettilineo uniforme rispetto a O con velocità
v = −vx̂ (ad esempio lo spazio interstellare), questi due eventi hanno coordinate
vx1 vx2
t01 = γ(t1 + ) = γt1 , t02 = γ(t2 + ) = γt2 , (2.36)
c2 c2
x01 = γ(x1 + vt1 ) = γvt1 , x02 = γ(x2 + vt2 ) = γvt2 , (2.37)
y10 = z10 =0 y20 = z20 = 0. (2.38)

Significa che in (O0 , t̂0 , x̂0 ) il primo segnale è ricevuto al tempo t01 da un osservatore postato
sull’asse x in x01 , mentre il secondo segnale è ricevuto al tempo t02 da un altro osservatore
postato in x02 . Essendo solidale allo stesso sistema di riferimento, i due osservatori possono
paragonare i loro orologi, e trovano che il tempo tra la ricezione dei due segnali è

∆t0 = t02 − t01 = γ(t2 − t1 ) = γ∆t. (2.39)

Siccome il fattore di Lorentz γ è sempre superiore a 1, abbiamo ∆t0 > ∆t: il tempo tra la
ricezione dei due segnali è superiore al tempo tra la loro emissione !
La dilatazione del tempo ha importante conseguenze sperimentale. Consideriamo una
particella prodotta al tempo t0 = 0 all’origine O di (O, t̂, x̂), che si propaga a velocità v = vx̂
costante, e sparisce al tempo t1 al punto dell’asse x di coordinate x1 = vt1 . Nel sistema di
riferimento (O0 , t̂0 , x̂0 ) solidale alla particella (sincronizzato nel modo adeguato), la particelle
sparisce al tempo
vx1 v2
t01 = γ(t1 − 2 ) = t1 γ(1 − 2 ) = γ −1 t1 . (2.40)
c c
Siccome γ > 1, la durata di vita “effetiva” t1 della particella in (O, t̂, x̂) è superiore alla sua
durata di vita “propria” t01 .
Esempio I.3. Un muone ha una vita media t01 ' 2, 2.10−6 s. Classicamente, con velocità
v = 0, 999999c circa quella della luce, percorre d = vt01 ' 2, 2.10−6 × 3.108 = 660m prima di
sparire. In relatività invece, la distanza percorsa è x1 = vt1 = γvt01 , cioè d moltiplicata dal
fattore di Lorentz. Scrivendo v = (1 − 1.10−6 )c, otteniamo
1 1
γ(v) = p '√ ' 103 . (2.41)
−6
1 − (1 − 1.10 ) 2 2.10−6
Quindi per l’osservatore sulla Terra, il muone percorre 660km prima di sparire.
Muoni sono prodotti dai raggi cosmici quando toccano i strati alti dell’atmosfera terrestra
(la cui spessore è del ordine di 100km). Senza la correzione relativisticà, tali muoni non
avrebbero tempo di arrivare alla superficià della Terra, dove le osserviamo però !

Esiste un effetto “duale” di contrazione delle lunghezze, che non studiamo qui per mancanza di tempo, e
perchè non ci servirà per la relatività generale.
II. QUADRIVETTORI 21

II Quadrivettori
II.1 Definizione e quadriposizione

Ad ogni evento E dello spazio-tempo si associa un vettore-colonna detto quadrivettore


posizione (o quadriposizione), le cui componenti sono le coordinate del evento. Ad esempio,
in un sistema di riferimento (O, t̂, x̂) la quadriposizione del evento E = (t, x, y, z) è
 
  x
ct
con x =  y  . (2.42)
x
z

In un altro sistema di riferimento (O0 , t̂0 , x̂0 ) in moto rettilineo uniforme rispetto a O con
velocità v, le coordinate del evento E - e di conseguenza le componenti del quadrivettore
posizione - si ottengono tramite una trasformazione di Lorentz Λ(v).‡
Più generalmente, chiamiamo quadrivettore ogni vettore-colonna X le cui componenti si
trasformano - sotto il cambiamento di sistema di riferimento (O, t̂, x̂) → (O0 , t̂0 , x̂0 ) - seguendo
la trasformazione di Lorentz Λ(v). Ad esempio sia
 0 
X
 X1 
X=  X2 
 (2.43)
X3

un quadrivettore in (O, t̂, x̂) (X 0 è la componente temporale; X 1 , X 2 , X 3 le componenti


spaziali ). In caso v = vx̂, le componenti di X in (O0 , t̂0 , x̂0 ) sono date dal boost (2.3)-(2.6) §
γv 1
(X 0 )0 = γX 0 − X (2.44)
c
γv
(X 1 )0 = − X 0 + γX 1 (2.45)
c
2 0 2
(X ) = X (2.46)
3 0 3
(X ) = X , (2.47)

L’azione di Λ(v) è rappresentata da matrice 4 × 4 (ancora denotata Λ(v)) tale che,


dato (2.43), l’espressione di X in (O0 , t̂0 , x̂0 ) sia Λ(v)X. Ad esempio, nel caso v = vx̂ uno ha

− γv
 
γ c 0 0
 − γv γ 0 0 
Λ(v) :=  c . (2.48)
 0 0 1 0 
0 0 0 1

Di fatti, (2.44)- (2.47) si ritrovano dal solito prodotto matrice/vettore

− γv γX 0 − γv (X 0 )0
  0   1
  
γ c 0 0 X c X
 − γv γ 0 0   1   γv 0 1  (X 1 )0 
  X  =  − c X + γX  = 

Λ(v)X =  c . (2.49)
 0 0 1 0  X   2 X 2   (X 2 )0 
0 0 0 1 X 3 X 3 (X 3 )0

La formula di una trasformazione di Lorentz per v arbitrario è data nella sezione II.4.
§
Nel passagio da (2.4) a (2.45) −γv diventa − γv
c
perchè X 0 è identificato a ct, non a t.
22 CHAPTER 2. RELATIVITÀ RISTRETTA

II.2 Prodotto interno

Dati due quadrivettori X, Y di componenti X α , Y β (α, β = 0, 1, 2, 3, 4) in (O, t̂, x̂), il loro


prodotto interno è il numero reale

X · Y := X 0 Y 0 − X 1 Y 1 − X 2 Y 2 − X 3 Y 3 . (2.50)

Il prodotto interno è bilineare, (X+λZ)·Y = X·Y+λZ·Y e X·(Y+λZ) = X·Y+λX·Z per


ogni λ ∈ R, simmetrico nello scambio di X e Y, ma non è un prodotto scalare perchè X · X
non è necessariamente positivo (il prodotto interno di quadrivettori non è definito positivo).
Introducendo la metrica di Lorentz, cioè la matrice¶
 
1 0 0 0
 0 −1 0 0 
η := 
 0 0 −1 0 
 (2.51)
0 0 0 −1
di componenti ηαβ , si scrive
3
X
X·Y = ηαβ X α Y β =: ηαβ X α Y β , (2.52)
α,β=0

dove nella seconda uguaglianza si usa la convenzione di Einstein di sommatoria su indici


ripetuti in posizione alta/bassa.
Proposizione II.1. Il prodotto interno è invariante sotto trasformazione di Lorentz.
Proof. Dato X in (2.43), si denota T X := (X 0 , X 1 , X 2 , X 3 ) il quadrivettore trasposto. Per
semplice prodotto di matrice e di vettori riga/colonna, si verifica che in (O, t̂, x̂)

X · Y = TX η Y. (2.53)

Calcolato in (O0 , t̂0 , x̂0 ) in motto rettilineo uniforme con velocità v, il prodotto interno è
T
(Λ(v)X) η Λ(v)Y = TX TΛ(v) η Λ(v) Y. (2.54)

Si verifica che TΛ(v) η Λ(v) = η per qualunque v. Ad esempio, per v = vx̂:


− γv − γv
   
γ c 0 0 1 0 0 0 γ c 0 0
γv   − γv
T
 −c γ 0 0   0 −1 0 0 γ 0 0 
Λ(v) η Λ(v) = 
 0
  c , (2.55)
0 1 0  0 0 −1 0
 0 0 1 0 
0 0 0 1 0 0 0 −1 0 0 0 1
2 v 2
 2   
γ − γ (c) 0 0 0 1 0 0 0
 0 γ 2 ( vc )2 − γ 2 0 0   0 −1 0 0 
= =
  0 0 −1 0  = η.
 (2.56)
 0 0 −1 0
0 0 0 −1 0 0 0 −1

Perciò (2.54) è uguale a (2.53).

Questa proposizione garantisce che il valore del prodotto interno di due quadrivettori non
dipende del sistema di riferimento in cui viene calcolato. È una quantità intrinseca.

Esiste un all’altra convenzione −1, +1, +1, +1 che si incontra spesso, ad esempio in cosmologia.
II. QUADRIVETTORI 23

II.3 Pseudo norma e ortogonalità

La (pseudo) norma quadrata di un quadrivettore è


X · X := (X 0 )2 − (X 1 )2 − (X 2 )2 − (X 3 )2 . (2.57)
Un quadrivettore X è detto di tipo tempo, luce o spazio se X · X è rispettivamente positiva,
nulla, o negativa.
Definizione II.2. La (pseudo) norma di un quadrivettore X di tipo tempo o luce è

|X| := X · X. (2.58)
Non si tratta di una norma perchè |X| può annullarsi anche se X non è il quadrivettore nullo
(di fatti si annula per X di tipo luce). Però, spesso si parla della “norma del quadrivettore”.
Definizione II.3. Due quadrivettori X e Y sono ortogonali quando X · Y = 0.
La proposition II.1 garantisce che il tipo di un quadrivettore, la sua norma (quadrata) e
l’ortogonalità die due quadrivettori sono caratteristiche intrinseche, indipendente della scelta
del sistema di riferimento inerziale.
L’ortogonalità nello spazio-tempo (iperbolico) non si visualizza come nello spazio Euclideo.
Ad esempio, due quadrivettori non nulli di componenti - in (O, t̂, x̂) -
X = (X 0 , X 1 , 0, 0), Y = (Y 0 , Y 1 , 0, 0) (2.59)
sono ortogonali se e solo se X 0 Y 0 − X 1 Y 1 = 0. Nel caso X 1 = 0 (i.e. X multiplo di x̂),
questo implica Y 0 = 0 (i.e. Y multiplo di t̂) e si ritrova la nozione usuale di ortogonalità.

Figure 2.1: Due quadrivettori ortogonali nel piano (t̂, x̂).


0
Ma nel caso X 1 6= 0, X e Y sono ortogonali se e solo se Y 0 = a1 Y 1 con a := XX1
. Le due
equazioni
1
X 0 = aX 1 , Y 0 = Y 1. (2.60)
a
descrivono due rete, simmetriche rispetto alla reta t = x. In particolare, un vettore di tipo
luce è ortogonale a se stesso.
24 CHAPTER 2. RELATIVITÀ RISTRETTA

II.4 Forma generale di una trasformazione di Lorentz *

Finora sono stati considerati solo boost nella direzione x. Per una velocità v qualunqe,
la trasformazione di Lorentz di un quadrivettore X = X 0 , x è data da
γ
(X 0 )0 = γX 0 − v · xk , (2.61)
c
γX 0
x0k = − v + γxk , x0⊥ = x⊥ (2.62)
c
dove xk = x · v̂ è la componente di x lungo la direzione v̂ della velocità, mentre x⊥ = x − xk
è la componente ortogonale a v, e il fattore di Lorentz è dato da γ = q 1 v·v .
1−
c2

II.5 Intervallo e struttura causale

Siano due eventi E1 = (t1 , x1 ) e E2 = (t2 , x2 ) in un sistema di riferimento (O, t̂, x̂), con
quadrivelocità X1 , X2 . Da (2.57) si verifica che l’intervallo

I(E1 , E2 ) = c2 (t1 − t2 )2 − (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2



(2.63)

definito in (1.17) non è altro che la norma quadrata del quadrivettore X2 − X1 . La propo-
sizione II.1 garantisce che l’intervallo è invariante sotto trasformazione di Lorentz, facendone
una quantità utile per implementare il principio di relatività (al contrario della distanza
euclidea che non è un invariante di Lorentz, cf eq. (1.16)).
Lo spazio-tempo R4 munito dell’intervallo è chiamato spazio di Minkowski. Oltre alle
trasformazioni di Lorentz, l’intervallo è invariante per traslazione spazio-temporale e rotazione
spaziale. Il gruppo generato dai 3 boost, le 4 traslazioni spazio-temporale e le 3 rotazioni
spaziali si chiama gruppo di Poincaré. È un gruppo die Lie di dimensione 10. Si dimostra
che costituisce il gruppo di isometria dello spazio di Minkowski (cioè il più grande gruppo
che preserva la forma quadratica (t, x, y, z) → t2 − x2 − y 2 − z 2 . ). Il grupo di Poincaré gioca
in relatività ristretta lo stesso ruolo del gruppo di Galileo per la meccanica newtoniana.
Il tipo dell’intervalo I(E1 , E2 ) è quello del vettore X2 − X1 : tempo se I(E1 , E2 ) > 0,
luce se I(E1 , E2 ) = 0, spazio se I(E1 , E2 ) < 0. La terminologia si giustifica della seguente
osservazione : un segnale emesso in (t1 , x1 ) e ricevuto in (t2 , x2 ) ha velocità

∆x2
v= (2.64)
∆t

dove ∆x2 = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2√ )2 e ∆t = t2 − t1 . Se l’intervallo I(E1 , E2 ) è


∆x2
di tipo tempo, allora c2 (∆t)2 − ∆x2 > 0, cioè ∆t < c. Perciò v < c può essere la velocità
di un segnale fisico. Se I(E1 , E2 ) è di tipo luce, v = c e i due eventi possono essere correlati
solo da un raggio di luce. Invece se I(E1 , E2 ) < 0, viene v > c e i due eventi non possono
essere correlati da nessun segnale fisico.
Dato E0 = (t0 , x0 ), l’insieme degli eventi E = (t, x) tale che I(E0 , E) sia di tipo luce sod-
disfa
c(t − t0 )2 − (x − x0 )2 − (y − y0 )2 − (z − z0 )2 = 0. (2.65)
III. CINEMATICA RELATIVISTICA 25

Quest’equazione descrive due coni nello spazio di


Minkowski con apice in E0 :
- il cono luce futuro composto delle soluzioni di (2.65)
con t > 0,
- il cono luce passato composto delle soluzioni con t < 0.

L’insieme degli eventi all’interiore del cono luce futuro


(incluso il cono stesso) forma il cono futuro di E0 :
sono tutti gli eventi su cui E0 può avere influenza. Si
definisce similarmente, il cono passato di E0 . Costitu-
isce l’insieme degli eventi che possono avere un influenza
su E0 . Tutti gli altri eventi costituiscono “l’altrove”.
L’intervallo essendo invariante di Lorentz, la distinzione
tra “futuro”, “passato” e “altrove” è indipendente del
sistema di riferimento. Determina la struttura causale
dello spazio di Minkowski.

III Cinematica relativistica


III.1 Tempo proprio

Il motto di un corpo massivo (puntiforme) in relatività è descritto da una “curva di


eventi” nello spazio di Minkowski - la linea d’universo del corpo - tale che l’intervallo tra
due qualunque eventi sia di tipo tempo. Fissato un sistema di riferimento (O, t̂, x̂), la linea
d’universo può sempre essere parametrizzata da t, e viene descritta come un insieme di eventi

E(t) = (t, x(t)), (2.66)

dove x(t) = (x(t), y(t), z(t)) descrive la traiettoria del corpo nello spazio tridimensionale,
come vista da O (si assuma che le tre funzioni reali x(t), y(t), z(t) siano lisce).
Tuttavia, secondo il principio di relatività, il tempo t non è particolarmente rilevante per
descrivere il moto del corpo: il tempo t0 di qualunque sistema di riferimento inerziale sarebbe
ugualmente pertinente. L’unico tempo che potrebbe, a priori, avere un ruolo particolare è
quello misurato da un orologio solidale al corpo (detta comovente). Ma, almeno che il corpo
sia in motto rettilineo uniforme rispetto a O, non esiste una trasformazione di Lorentz fissata
che leghi le coordinate comovente a t, x, y, z. Però ad ogni instante t, il corpo si muove con
una velocità instantanea v(t) rispetto a O. Quindi ad ogni instante t le coordinate comoventi
sono deducibili da quelle in (O, t̂, x̂) via la trasformazione di Lorentz “instantanea”

Λ(t) := Λ(v(t)). (2.67)

Per implementare quest’idea, si considera due eventi “infinitesimalmente vicini” E(t) e


E(t + dt) sulla linea d’universo del corpo, con dt > 0. Al primo ordine in dt, viene

E(t + dt) = (t + dt, x(t + dt)) = (t + dt, x(t) + dx)


26 CHAPTER 2. RELATIVITÀ RISTRETTA

dove dx = (dx, dy, dz) con

dx dy dz
dx = dt, dy = dt, dz = dt.
dt |t dt |t dt |t

Per ipotesi, la linea d’universo E(t) è di tipo tempo.


Questo garantisce la positività dell’intervallo

I (E(t), E(t + dt)) = c2 dt2 − dx2 − dy 2 − dz 2 . (2.68)

Calcoliamo lo stesso intervallo infinitesimale dal punto


di vista comovente. Scrivendo τ la coordinata tempo-
rale, i due eventi hanno coordinate

E(t) = (τ, 0, 0, 0), E(t + dt) = (τ + dτ, 0, 0, 0) (2.69)


dove si assuma dτ > 0 (il secondo evento è successivo al primo anche per l’osservatore
comovente) mentre le coordinate spaziali sono nulle perché (la linea d’universo coincida con
le posizioni successivi dell’origine del sistema comovente). Quindi per l’osservatore comovente,
l’intervallo infinitesimale vale
I(E(t), E(t + dt)) = c2 dτ 2 . (2.70)
Ad ogni instante t, esiste una trasformazione di Lorentz tra il sistema comovente e (O, t̂, x̂)
(quella instantanea (2.67)). Essendo l’intervallo invariante di Lorentz, segue da (2.68) e (2.70)
p
cdτ = c2 dt2 − dx2 − dy 2 − dz 2 . (2.71)
Tirando cdt fuori della radice, e osservando che dt1
dx = dx
dt |t = vx (t) è la componente vx (t)
di v(t) (similarmente per y e z) otteniamo
v
u 2  2  2 ! r
v(t)2

u 1 dx dy dz c
cdτ = cdtt1 − 2 + + = cdt 1 − 2 = dt (2.72)
c dt |t dt |t dt |t c γ(t)

dove γ(t) è il fattore di Lorentz associato alla trasformazione instantanea (2.67)


1
γ(t) := q . (2.73)
v2 (t)
1 − c2
L’equazione (2.72), riscritta come
dt = γ(t)dτ (2.74)
costituisce un’equazione fondamentale in relatività. Lega la variazione infinitesimale dτ di
tempo nel sistema comovente a quella dt del tempo in (O, t̂, x̂). Il parametro τ è chiamato
tempo proprio. Un intervallo non-infinitesimale di tempo proprio si ottiene per integrazione
Z t
dt
∆τ = . (2.75)
0 γ(t)
In caso di motto rettilineare uniforme, γ(t) è costante e (2.75) diventa ∆t = γ∆τ . Non è
altro che la dilatazione del tempo (2.39), con ∆τ il tempo nel razzo (cioè ∆t in (2.39)), e ∆t
il tempo nello spazio-tempo intersiderale (cioè ∆t0 in (2.39)).
III. CINEMATICA RELATIVISTICA 27

III.2 Quadrivelocità

Sia un corpo con linea d’universo E(t) in (O, t̂, x̂). L’analogo quadrivettoriale alla velocità
si otteniene derivando la quadriposizione X(t) rispetto a un adeguato parametro temporale.
Per ottenere un quadrivettore, conviene che la variazione infinitesimale di questo parametro
sia invariante di Lorentz. Questo esclude dt, e suggerisce invece l’uso del tempo proprio dτ .
dX
Definizione III.1. La quadrivelocità è il quadrivettore U = dτ .

L’espressione di U nel sistema di riferimento (O, t̂, x̂) si deduce dall’espressione (2.42) di
X(t) e della relazione (2.74):
 
  ct  
d X(t) dt d X(t) d  x(t)  c
U(t) = = = γ(t)    = γ(t) (2.76)
dτ dτ dt dt y(t)  v(t)
z(t)

dove v(t) è la velocità del corpo rispetto a O.


Geometricamente, la quadrivelocità è proporzionale, con un fattore γ(t), al vettore tan-
gente alla curva (t, x(t)) (cioè alla linea d’universo E(t), modulo un riscalamento t → ct).
Nel sistema comovente, la quadriposizione è
   
cτ c
X= , da cui segue U(τ ) = . (2.77)
0 0

La stessa espressione si deduce da (2.76) con v = 0 (i.e. γ = 1).


La norma della quadrivelocità si calcola facilmente da (2.77):

|U| = U · U = c. (2.78)

Lo stesso risultato si trova da da (2.76): omettendo la dipendenza in t, viene

c2 − v2

2 2 2
= c2 .

U·U=γ c −v = 2 (2.79)
1 − vc2

È notevole che la norma della quadrivelocità sia una costante. Più avanti ne daremmo una
spiegazione geometrica: U è il vettore tangente alla linea d’universo parametrizzata dalla sua
lunghezza.
Osservazione III.2. ∗ Per assicurarsi che la quadrivelocità sia un quadrivettore, tocca verifi-
care che U(τ ) si deduce da U(t) tramite la trasformazioni di Lorentz Λ(v(t)). La componente
spaziale u := γv di U(t) è proporzionale alla velocità v. Dalle notazioni della trasformazione
di Lorentz generale (§II.4) viene uk = u e u⊥ = 0. Applicando (2.61)-(2.62) otteniamo

γ γ2 v2
(u0 )0 = γu0 − v · u = γ 2 c − v2 = cγ 2 (1 − 2 ) = c, (2.80)
c c c
γu0
u0 = − v + γu = −γ 2 v + γ 2 v = 0, (2.81)
c
in accordo con (2.77).
28 CHAPTER 2. RELATIVITÀ RISTRETTA

IV Dinamica
La dinamica relativisticà si basa sulla conservazione del momento, invece delle leggi di
Newton (principio d’inerzia, ΣF = ma, principio di azione-reazione). Accelerazione e forza -
concetti centrali per Newton - diventano secondari in relatività.

IV.1 Quadrivettore energia-impulso

La prima assunzione è l’esistenza della massa. Tuttavia, al contrario della massa New-
toniana, non si assume che la massa relativistica sia invariante per cambiamento di sistema
di riferimento. Cosı̀ ad ogni corpo viene associata una massa al riposo m0 che è un scalare
sotto trasformazione di Lorentz (cioè invariante), ma coincida con la massa classica solo per
l’osservatore comovente. La quantità di moto relativistica di un corpo m0 con quadrivelocità
U è definita in analogia a la quantità di moto classica mv.

Definizione IV.1. Il quadrivettore energia-impulso è P = m0 U.

L’espressione di P nel sistema di riferimento (O, t̂, x̂) segue da (2.76):


 
γ(t)m0 c
P= . (2.82)
γ(t) m0 v(t)

La secondo assunzione è la conservazione della quantità di moto relativistica: considerando


una collisione che coinvolge n corpi di massa al riposo (m0 )k (k = 1, ..., n), con velocità vk
misurate in (O, t̂, x̂) (n0 corpi si urtano e ne escono n00 , con n0 + n00 = n), si impone

n 0 n 00
X∗ X X
Pk := Pk − Pk = 0, (2.83)
k=1 k=n0 +1

dove Pk è il quadrivettore energia-impulso del corpo k, e ∗ denota la somma dove i quadriv-


P
ettori dei corpi entranti sono contati positivamente, e quelli uscenti negativamente. Questa
legge ha senso perchè da una parte è invariante di Lorentz, ‖ d’altra parte nel limite delle
piccole velocità ridà la conservazione della massa e della quantità di moto classica
X∗ X∗
(m0 )k = 0, (m0 )k vk = 0. (2.84)

Per vederlo, basta scrivere (2.83) in componenti


X∗ X∗
γk (m0 )k = 0 e γk (m0 )k vk = 0, (2.85)

vk2 − 1
dove γk = (1 − c2
) 2, e considerare il limite in cui tutti i corpi hanno velocità vi << c.


Il membro di sinistra è una somma e differenza di quadrivettori, cioè un quadrivettore. Il membro di
destra è il quadrivettore nullo, invariante sotto qualsiasi trasformazione di Lorentz
IV. DINAMICA 29

IV.2 Equivalenza tra massa e energia

La componente spaziale p = γm0 v di P, chiamata impulso, coincide con la quantità di


moto classica di un corpo di massa
m := γm0 . (2.86)
Questa massa relativistica dipende della velocità (al contrario di m0 ). Le leggi di conser-
vazione relativistiche (2.85) si interpretano come le conservazioni classica della massa e del
momento per corpi di massa mk = γk (m0 )k . In questo modo, i vari corpi si comportano per
O come dei corpi classici, le cui masse (m0 )k vengono corrette dal fattore di Lorentz γk .
2
Per capire questa correzione, sviluppiamo la massa relativistica in vc2 :
− 12
v2
  
1 1 2
m = m0 1 − 2 = m0 + 2 m0 v + ... (2.87)
c c 2
La correzione al primo ordine non è altro (almeno di un fattore c−2 ) che l’energia cinetica
del corpo m0 misurata in (O, t̂, x̂). È come se, dal punto di vista di O, l’energia cinetica
contribuisse alla massa, con una costante di proporzionalità c12 bassissima (che spiega perchè
tale variazioni di massa non si vedono ad energia rilevante per la fisica classica).
Il colpo di genio di Einstein∗∗ consiste nel postulare che il membro di sinistra di (2.87)
(moltiplicato da c2 ) sia l’energia totale del corpo misurata in (O, t̂, x̂),
E = mc2 , (2.88)
somma dell’energia di massa m0 c2 (senza equivalente classica) e dell’energia cinetica rela-
tivistica,
E − m0 c2 = m0 c2 (γ − 1). (2.89)
2
Essa tende a l’energia cinetica classica 21 m0 v 2 nelle basse velocità, perchè (γ − 1) → 21 vc2 .
Il nome di quadrivettore energia-impulso si capisce allora, riscrivendo P come
 E 
P= c . (2.90)
p
Nel sistema comovente, ha espressione
 
m0 c
P= . (2.91)
0
La norma quadrata di P calcolata in (O, t̂, x̂) è E 2 c−2 − p2 con p2 = p2x + p2y + p2z ; mentre
nel sistema comovente viene m20 c2 . Dall’invarianzia della norma quadrata sotto Lorentz,
segue la relazione di dispersione relativistica, al cuore della meccanica relativistica:
E 2 = p2 c2 + m20 c4 . (2.92)
Per concludere, osserviamo che per una velocità vicino a c, il fattore di Lorentz γ tende
all’infinito, e lo stesso vale per E = γm0 c2 . Questo significa che per accelerare un corpo
massivo fino alla velocità della luce, si dovrebbe communicargli un’energia infinita. Per
questo motivo, la velocità della luce costituisce un “muro” che un corpo massivo non pò
raggiungere. Che la luce si possa muove alla velocità c significa che la “massa della luce” (o
più esattamente la massa del fotone, cf la meccanica quantistica) è zero.
∗∗
L’idea di un equivalenza tra massa ed energia era però “dans l’air du temps”, cf il libro di Rindler, fine
della sezione 6.3.
30 CHAPTER 2. RELATIVITÀ RISTRETTA
Interludio: verso la relatività
generale

A. Successi della relatività ristretta


Oltre alla spiegazione della costante della velocità della luce nel vuoto in qualsiasi sistema
di riferimento inerziale, la relatività ristretta è confermata da numerosi fatti sperimentali,
in particolare nell’elettromagnetismo (cf ad esempio l’effetto Compton). Anche se gli effetti
relativistici sono trascurabili per velocità molto inferiore a c (e quindi nella vita quotidiana),
ci sono delle conseguenze effettive:

- Dall’equivalenza tra massa e energia, uscı̀ l’idea di estrarre energia della massa, dando
nascita all’energia nucleare (e alla bomba atomica).

- L’equivalenza massa/energia è anche al cuore dei fenomeni di disintegrazione di par-


ticelle: quando due particelle elementari si urtano, la loro energia totale (cinetica +
massa) è messa in commune, e da lı̀ escono nuove particelle, di natura diversa da quelle
incidenti. Le particelle prodotte non sono contenute dentro quelle incidenti (al contrario
dei neutroni o protoni contenuti dentro i nuclei degli atomi), ma nascono dell’energia
resa disponible al momento del urto.

- Un altra conseguenza importante della relatività ristretta nasce della sua unione con
la fisica quantistica. Procedendo secondo le regole di quantizzazione prescritte da la
meccanica quantistica, la quantizzazione della relazione di dispersione E 2 = p2 c2 +m2 c4
porta all’equazione di Dirac. Oltre alle sue soluzioni “normali”, quest’equazione am-
mette delle soluzioni di “energia negativa”, che portarono alla scoperta dell’antimateria.

- La dilatazione del tempo permette di osservare sulla Terra particelli che, classicamente,
non sarebbero dovuto arrivare (cf sezione I.3).

B. Conflitto con la gravitazione newtoniana


All’inizio del 900, la teoria newtoniana era la teoria più convincente per spiegare i fenomeni
gravitazionali. Un suo sucesso spettacolare fù la predizione dell’esistenza del pianetà Nettuno
da Le Verrier e Adams, prima della sua scoperta nel 1846. C’erano però qualche discordanza
tra teoria esperienza, ad esempio il calcolo della precessione del perielio di Mercurio dava
un valore di circa 40” per secolo inferiore al valore osservato. (già notato da Le Verrier nel
32 CHAPTER 2. RELATIVITÀ RISTRETTA

1850). Similare discordanze (ma di ampiezza inferiore) erano note per Venere, Marte e anche
la Terra. Di conseguenza esisteva uno spazio per una nuova teoria della gravitazione.
Con la relatività ristretta, le insufficienze della teoria di Newton diventano delle incoerenze
sul piano teorico: come spiegato nell’introduzione, la perdita della simultaneità assoluta rende
impossibile l’idea di interazione a distanza immediata. È instrutivo ritrovare questo risultato
in modo geometrico, sfruttando gli strumenti matematici introdotti finora.
La superficie di simultaneità †† di un osservatore O al tempo (proprio) τ0 è l’insieme SτO0
di tutti gli eventi di coordinate (τ0 , x) nel sistema comovente, con xqualunque. In modo

equivalente, è l’insieme degli eventi la cui quadriposizione X = verifica
x

(X − X0 ) · U = 0 (1)
   
c cτ0
dove U = è la quadrivelocità di O e X0 = la sua quadriposizione al tempo
0 x0
τ0 . Di fatti, si verifica che,
   
c (τ − τ0 ) c
(X − X0 ) · U = · = c2 (τ − τ0 ) (2)
x − x0 0

si annula se e solo se τ = τ0 .

Esempio IV.2. Sia (O, t̂, x̂) il sistema comovente della Terra con x l’asse Terra-Sole. Sia
(ct, s, 0, 0) la linea d’universo al Sole (in verde nella figura seguente), con s la distanza Terra-
Sole. Si assuma che il Sole sparisca a t = 0. In rosso si vede la linea d’universo di un
osservatore O0 in moto rettilineo uniforme rispetto alla Terra, il cui incontro con la Terra
definisce l’evento E0 . Assumiamo che l’orologio proprio di O0 sia sincronizzato in tale modo
che E0 abbia coordinate comovente (0, =).
La superficie di simultaneità della Terra in t = 0 è l’asse x: in (O, t̂, x̂) la scomparsa del
Sole è simultaneo all’incontro con l’osservatore rosso.
0
La superficia di simultaneità S0O di O0 al momento in cui incontra la Terra è la retta
perpendicolare alla sua quadrivelocità in E0 . Siccome la quadrivelocità è tangente alla linea
d’universo, segue della descrizione geometrica dell’ortogonalità in un spazio iperbolico che
0
S0O (in puntini rossi) è la reta simmetrica alla linea d’universo di O0 rispetto al raggio luce
ct = x (in grigio).
O0 intersecca la linea d’universo del Sole ad un tempo t < 0. Quindi per O 0 l’incontro
SE 0
con la Terra è contemporaneo alla presenza del Sole. Se la gravitazione fosse una forza
instantanea, O0 ne sentirebbe ancora l’effetto all’instante in cui arriva sulla Terra, mentre gli
abitanti della Terra non la sentirebbero più.

††
Tale superficie è in realtà un oggetto tri-dimensionale: il nome viene dal fatto che si tratta da un’iper-
superficie dello spazio di Minkowski, cioè un oggetto di dimensione m − 1, dove m è la dimensione dello spazio
ambiente, in questo caso m = 4.
C. Il principio di equivalenza
Come spiegato nella sezione II.2 dell’introduzione, il principio di equivalenza pone l’uguaglianza
tra massa inerte e massa pesante. In assenza di altre forze, suggerisce che sia possibile can-
cellare l’effetto della gravitazione considerando un sistema di riferimento accelerato.
E il famoso “ascensore di Einstein”: in un ascensore
immobile alla cima di una torre, la gravità terrestra
ci fa tenere “attacato” al pavimento del ascensore.
Se viene tagliato il cavo del ascensore, quest’ultimo
cade in caduta libera, e noi insieme a lui. Dando
un piccolo impulso con i piedi, ci mettiamo a
“flottare” dentro l’ascensore, come gli astronauti
nella Stazione Spaziale Internazionale (la cui è in
caduta libera !): non abbiamo più l’impressione di
essere in un campo di gravità.
Però, per un osservatore immobile al piano zero,
siamo sottomesso alla gravità, che proprio ci fa
cadere insieme all’ascensore.
Secondo i principi della relatività generale, i due
punti di vista devono essere equivalenti:
non esistono differenze tra essere sottomesso a un campo gravitazionale - a l’esclusione
di qualunque altre forze - rispetto a un sistema di riferimento inerziale (punto di vista
dell’osservatore al piano zero), e l’assenza di gravità rispetto a un sistema di riferimento
accelerato (punto di vista di chi sta cadendo con l’ascensore).
Ovviamente, un sistema di riferimento accelerato rispetto ad uno inerziale non è inerziale.
Perciò il principio di relatività viene generalizzato al principio di relatività generale:
le leggi fisiche sono le stesse in tutti i sistemi di riferimento, inerziali o no.

D. Interpretazione geometrica
L’annullamento della gravitazione, ottenuto in un
sistema di riferimento accelerato, funziona solo
quando il campo gravitazionale è uniforme nello
spazio e il tempo. Nel caso contrario, funziona solo
localmente.
Per capirlo, si considera un ascensore molto largo,
che inizia a cadere da un altitudine molto alta, nel
atmosfera. Sia due osservatori alle estremità del
ascensore. Al inizio della caduta libera, cadono in
modo simile. Ma poco a poco la distanza tra di
loro diminuisce, perchè le loro linee di caduta non
sono parallele (essendo diritte verso il centro della
Terra). Perciò, i due osservatori non sono immo-
bili rispetto al ascensore, si avvicinano uno rispetto
all’altro. Questo motto traversale permette loro di
capire che non sono immobile in un ascensore perso
nello spazio (cioè, non sottomesso a nessun forza di
gravitazione), ma che sono invece in caduta libera
in un campo gravitazionale non uniforme.
Riassumendo, per descrivere la gravitazione in modo compatibile con la relatività ristretta,
conviene descrivere lo spazio-tempo in tale modo che, localmente, esista un sistema di co-
ordinate che lo faccia rassomigliare allo spazio di Minkowski. È proprio il tipo di problema
affrontato dalla geometria differenziale. La sfera ad esempio è descritta come uno spazio che
localmente rassomiglia al piano Euclideo (è cosı̀ che, localmente, la Terra ci sembra piatta).
Però la sfera non è un piano. La differenza è catturata dalla nozione di curvatura.
In relatività non vogliamo uno spazio-tempo che sia localmente Euclideo, ma che ras-
somiglia localmente lo spazio di Minkowski. Per questo motivo la soluzione non verrà data
dalla geometria riemanniana, ma dalla geometria pseudo-riemanniana.
L’idea che per implementare il principio di equivalenza bisognava curvare lo spazio di
Minkowski non è venuta direttamente. Einstein ha impiegato dieci anni tra la pubblicazione
della relatività ristretta nel 1905 e la formulazione finale della relatività generale nel 1915,
che sarà esposta nel capitolo 4. Il legame tra gravitazione e curvatura viene costruito tramite
analogie con la fisica classica, che portano alle equazioni di Einstein. Stricto-sensu, queste
equazioni non sono dimostrate. Sono dei postulati (come le equazioni di Newton) la cui
validità è confermata dall’esperienza.
Chapter 3

Geometria differenziale

La geometria differenziale studia le proprietà geometriche di


oggetti che rassomigliano localmente allo spazio Rn , n ∈ N (op-
pure Cn nel caso di geometrie complesse), ma che non ne hanno
necessariamente le proprietà globale.
È uno strumento particolarmente adeguato per studiare la ge-
ometria degli oggetti curvi. Ad esempio la sfera rassomiglia “lo-
calmente” al piano, però se si disegna un triangolo sulla superficie
di una sfere, la somme degli angoli è strettamente compresa tra
180◦ e 540◦ . Quindi un osservatore sulla sfera (come noi sulla
Terra), anche se non ha a disposizione il punto di vista ”esterno”
della sfera emersa in uno spazio ambiente tridimensionale, è in
grado di capire localmente che non è sul piano, semplicemente
misurando un piccolo triangolo intorno a lui.

Le considerazioni dei capitoli precedenti indicano che per incorporare la gravitazione,


lo spazio-tempo deve essere descritto come un continuum quadridimensionale di eventi, che
localmente rassomiglia a R4 munito della metrica di Lorentz. La geometria differenziale
appare quindi come l’oggetto adeguato per implementare il principio di relatività generale.

I Varietà
Per dare senso alla definizione della geometria differenziale data sopra, bisogna avere una
nozione di località. Questa viene fornita dalla topologia.

I.1 Spazio topologico

La topologia può essere vista come il “livello zero” della geometria, nel senso della prima
struttura di cui deve essere munito un oggetto matematico per diventare “spazio”. In modo
informale, la topologia permette di definire la nozione di “essere vicino a”. Ovviamente lo
spazio fisico è munito di strutture più raffinate, e la nozione di vicinità non basta. Ma è
essenziale. Uno spazio topologico è definito nel modo seguente.

35
36 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Definizione I.1. Uno spazio topologico (X , T) è dato da un insieme X e una collezione T


di sottoinsiemi di X tale che

• L’unione di un arbitrario numero


S (anche infinito) di sottoinsiemi di X , tutti in T, è
ancora in T: se Oi ∈ X , allora Oi ∈ T.
i

• L’intersezione di un numero finito di sottoinsiemi, tutti in T, è ancora in T: se


n
T
O1 , O2 , ....On ∈ T, allora Oi ∈ T.
i=1

• L’insieme X e l’insieme vuoto ∅ sono in T.

La collezione T è detta una topologia di X , e i suoi elementi sono chiamati gli aperti di X
nella topologia T. In poche parole, una topologia di X è una collezione di sottoinsiemi di X
stabile per unione arbitraria, intersezione finita, e che contiene X e ∅. Un sottoinsieme C di
X è detto chiuso quando il suo complemento in X (l’insieme {x ∈ X , x ∈ / C}) è aperto.
Questa definizione è motivata dalle proprietà soddisfatte dagli intervalli aperti di R, cioè
(a, b) := {x ∈ R, a < x < b} (perciò il nome ”aperti” per gli elementi di una topologia). In
particolare, ogni intersezione finita di intervalli aperti è un intervallo aperto ma, ad esempio,
l’intersezione infinita degli intervalli aperti (− n1 , 1 + n1 ) per n ∈ N è l’intervallo chiuso [0, 1].
Qualunque insieme X può essere fatto un spazio topologico, prendendo per T tutti i
sottoinsiemi di X (topologia discreta), oppure T = {∅, X } (topologia banale).
Su R, la topologia in cui gli aperti sono gli intervalli aperti (e le loro unioni) è la topologia
naturale. Si estende in modo ovvio allo spazio euclideo Rn : gli aperti sono tutte le palle
aperte di centro x ∈ Rn e di raggio r ∈ R+ ,

B(x, r) := x0 ∈ Rn , dEuc (x, x0 ) < r ,



(3.1)

insieme alle loro unioni arbitrarie.


Chiamiamo intorno del punto p ∈ (X , T) qualunque aperto Op che contiene p. Due punti
q e p sono “vicini” se esiste un intorno di p che contiene q (o vice-versa). Lo spazio è Hausdorff
(o separato, o T2 ), se per ogni coppia di punti p, q ∈ X , p 6= q, esistono due intorni Op , Oq
tale che Op ∩ Oq = ∅. In altre parole, uno spazio topologico è Hausdorff se la topologia è
abbastanza fine per distinguere un punto dall’altro.

Esempio I.2. Rn munito della topologia naturale è Hausdorff, basta considerare


1
Op = B(p, r), Oq = B(q, r) con r < dEuc (p, q). (3.2)
2
Ma Rn munito della topologia banale non è Hausdorff (visto che ne p ne q sono nel’insieme
vuoto, entrambi Op e Oq sono uguali a Rn ).

La topologia è caratteristica di uno spazio. La nozione duale per le funzioni è la continuità.

Definizione I.3. Una mappa f tra due spazi topologici (X , T) e (Y, S) è detta continua se
l’imagine inversa f −1 (O) := {x ∈ X , f (x) ∈ O} di qualunque aperto O ⊂ Y è un aperto di X .

Per Y = R, si ritrova la nozione usuale di funzione continue su X . Non lo mostreremmo, ma


per convincerci è istruttivo vedere un esempio.
I. VARIETÀ 37

 1 ∀x > 0,
Esempio I.4. Sia la funzione f di R in R definita da f (x) = 0 per x = 0,
−1 ∀x < 0.

L’imagine inverse dell’aperto (− 12 , 23 ) è [0, +∞), che non è aperto. Quindi f non è continua.
Se f è continua, biunivoca e il suo inverse è continuo, allora f è detta un omeomorfismo, e
gli spazi (X , T) e (Y, S) sono omeomorfi.

I.2 Varietà topologica

Dato uno spazio topologico (X , T), una collezione di aperti F = {Ui } tale che
[
Ui = X (3.3)
i

è un ricoprimento aperto di X . Darsi un ricoprimento di X significa dunque darsi una


collezione di aperti tale che ogni punto p di X ammetta almeno un intorno Up .
Definizione I.5. Una varietà (topologica) di dimensione m ∈ N è uno spazio topologico M,
Hausdorff, che ammette un ricoprimento aperto {Ui } tale che
• per ogni i, esiste un omeomorfismo ψi : Ui → Ui0 con Ui0 un aperto di Rm ;
• Se due aperti Ui , Uj si intersecano, allora la mappa ψji := ψj ◦ ψi−1 di dominio
ψi (Ui ∩ Uj ) ⊂ Ui0 e codominio ψj (Ui ∩ Uj ) ⊂ Uj0 , definita per ogni x ∈ ψi (Ui ∩ Uj )
da
x 7→ ψj (ψi−1 (x)) (3.4)
è continua (cf figura 3.1).
La coppia (Ui , ψi ) è chiamata carta. L’insieme delle carte forma un atlante (in analogia con
carte e atlante in geografia). In fisica si parlerà piuttosto di un sistema di coordinate. Le ψi
sono chiamate funzioni coordinate, e le ψij sono le funzioni di transizione del atlante.
Esempio I.6. • L’esempio più semplice di varietà topologica è lo spazio Rn stesso, che
può essere coperto da un carta sola: l’aperto Rn con la funzione coordinate x → x.
• Un esempio di varietà per cui ogni atlante è composto da almeno due carte è il cerchio.
Dati due punti A, B diametralmente opposti, un possibile atlante è

U1 = S 1\ A, ψ1 (p) = θ ∈ (0, 2π) ,




U2 = S 1\ B, ψ2 (p) = θ0 ∈ (−π, π)


dove p è un punto nel dominio della carta in considerazione.


L’intersezione delle due carte è l’unione dei due archi aperti
_ _
AB , BA. La funzione di transizione ψ12 di (0, π) ∪ (π, 2π)
in (−π, 0) ∪ (0, π) è

θ0 = θ ∀θ ∈ (0, π), θ0 = θ − 2π ∀θ ∈ (π, 2π).

È continua sul suo dominio.


38 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Figure 3.1: Una varietà M, con due carte (Ui , ψi ) e (Uj , ψj ) con intersezione non vuota. La
funzione di transizione mappa l’intersezione - vista come aperto di Rm nella prima carta -
nell’intersezione vista come aperto di Rm nella seconda carta.

• ∗ Un altro esempio istruttivo è la sfera S 2 . Come il cerchio, non può essere ricoperta
solo da un aperto, ne servono almeno due. Si può vedere usando le proiezioni stere-
ografiche: fissato un polo nord N e il corrispondente piano equatoriale, si associa ad
ogni punto P di S 2 l’intersezione P 0 della reta (N P ) col piano equatoriale (cf figura
I.6). Questa mappa è bi-univoca sull’aperto U1 := S 2 /N : i punti dell’emisfero sud
sono mappati sul disco equatoriale, quelli dell’emisfero nord sul suo complemento nel
piano equatoriale (più P è vicino a N , più P 0 si “avvicina all’infinito”), e l’equatore è
invariante. Nelle coordinate polari (r, θ, ϕ), abbiamo

x = r sin θ cos ϕ, y = r sin θ sin ϕ, z = cos θ. (3.5)

Un pò di calcolo mostra che l’angolo tra la reta (P P 0 ) e il piano equatoriale è 2θ . As-
sumendo per semplicità che il raggio della sfera è r = 1, troviamo che P 0 ha coordinate

1 x x cos 2θ x x
X1 = θ
cos ϕ = θ
= 2 θ θ
= = , (3.6)
tan 2 tan 2 sin θ 2 sin 2 cos 2 1 − cos θ 1−z
1 y y
Y1 = θ
sin ϕ = = . (3.7)
tan 2 1 − cos θ 1−z
I. VARIETÀ 39

Figure 3.2: Le coordinate stereografiche

Similarmente, proiettando dal polo sud S, associamo ad ogni P in U2 := S 2 /S il punto


P 00 sul piano equatoriale di coordinate (basta sostituire θ da π − θ in (3.6) e (3.7)):
x x y y
X2 = = , Y2 = = . (3.8)
1 + cos θ 1+z 1 + cos θ 1+z
L’intersezione di U1 e U2 è la sfera privata dei due poli. L’immagine di questa inter-
sezione in entrambi le proiezione stereografiche è il piano bucato R2∗ := R2 /O. Notando
che X12 + Y12 = 1+z 2
1−z , si trova facilmente la funzione di transizione ψ21 da R∗ in se
stesso:
X1 Y1
X2 (X1 , Y1 ) = 2 2 , Y2 (X1 , Y1 ) = 2 . (3.9)
X1 + Y1 X1 + Y12

I.3 Varietà differenziale

Ovviamente, per discrivere lo spazio-tempo la topologia non basta: la cinematica richiede


una struttura differenziale, cioè la possibilità di derivare una funzione. Il modo più naturale
per rendere “differenziale” una varietà topologica consiste a importare la struttura differen-
ziale di Rn .
Una funzione φ di dominio D ⊂ Rm in Rn non è altra che una collezione di n funzioni φα
di m variabili:
 1 
φ (x)
 φ2 (x) 
φ(x) =  ..  dove φα (x) = φα (x1 , x2 , · · · , xm ) α = 1, ..., n. (3.10)
 
 . 
φn (x)
40 CHAPTER 3. GEOMETRIA DIFFERENZIALE

La funzione φ è detta di classa C ∞ se tutte le funzioni φα sono infinitamente derivabili in


tutte le loro componenti e su tutto D. Cioè per qualunque α = 1, ..., n, le funzioni
∂φα ∂ 2 φα ∂ m φα
, , · · · ∀βi ∈ [1, m] (3.11)
∂xβ ∂xβ1 ∂xβ2 ∂xβ1 · · · ∂xβm
esistono su tutto D e sono continue.
Definizione I.7. Una varietà differenziale è una varietà topologica le cui funzioni di tran-
sizione sono di classe C ∞ sul loro dominio.
Una mappa f tra due varietà differenziali M e N di dimensione m, n è liscia se preserva
la struttura differenziale, nel senso seguente. Per ogni punto p ∈ M, esistono una carta
(U, ψ) su M con U un intorno di p, e una carta (V, φ) su N con V un intorno di f (p),
tale che U ∩ f −1 (V ) sia un aperto di M e la funzione φ ◦ f ◦ ψ −1 sia C ∞ sul suo dominio
ψ(U ∩ ψ(f −1 (V ))).

Sottolineiamo tre casi particolarmente notevoli:


• Se f : M → N è liscia, invertibile e la sua funzione inversa è liscia, allora f è un
diffeomorfismo. Le varietà M e N sono diffeomorfe. Ovviamente M è diffeomorfa a se
stesso (considerare la mappa f (p) = p). L’insieme dei diffeomorfismi di M verso M è
il gruppo dei diffeomorfismi di M, denotato Diff(M).
• Una funzione liscia f : M → R è semplicemente detta funzione liscia su M. L’insieme
di tutte le funzioni lisce su M si scrive C ∞ (M).
• Una funzione liscia c : R → N è una curva liscia in N. La definizione si estende a una
mappa di un aperto (a, b) di R in N .
II. VETTORI 41

II Vettori
Come definire un vettore in geometria differenziale ? Un vettore non può essere definito
come nello spazio euclideo, in termine di “freccia lungo una direzione fissa”, perchè su una
varietà la nozione di “direzione fissa” ha al più un senso locale. Tocca quindi pensare ad una
definizione “locale” di vettore in geometria euclidea, che sarà poi esportata nell’ambito della
geometria differenziale. Questa definizione esiste ed è quella di vettore tangente a una curva.

II.1 Vettore tangente

Data una curva liscia c(t) = (x(t), y(t)) nel piano (x, y), il vettore c(t0 + dt) − c(t0 ) tende
ad essere tangente alla curva c nel punto p = c(t0 ) quando dt tende a zero. Si definisce quindi
il vettore tangente a c in p come il vettore∗

c(t0 + h) − c(t0 )
lim = ẋ(t0 ) x̂ + ẏ(t0 ) ŷ. (3.12)
h→0 h

Si nota che qualunque vettore V = Vx x̂ + Vy ŷ del piano (con Vx , Vy ∈ R) si ritrova come


vettore tangente, considerando la curva c(t) = (Vx t, Vy t).
In modo simile, data una curva liscia c in una varietà M di dimensione m, e una carta
(Up , ψ) con p = c(t0 ) e

c1 (t)
 

ψ(c(t)) =  ...  ∈ Rm per t in un intorno di t0 , (3.13)


 

cm (t)

vorremmo definire il vettore tangente al punto p come l’oggetto le cui componenti sono ċµ (t0 ).
Ma componenti lungo quale assi ? Cioè, qual’è l’analogo per M dei versori x̂, ŷ del piano in
(3.12) ? Nella carta (3.13) possiamo sempre considerare i versori x̂µ di Rm . Però cerchiamo
una definizione di vettore independente della carta.
Per capire la difficoltà, è istruttivo paragonare il piano alla sfera. Nel piano, esistono
−→ −→
sempre coppie di punti (Ax , Bx ) e (Ay , By ) in R2 tale che x̂ = Ax Bx e ŷ = Ay By . Non è il
caso sulla sfera: il vettore tangente alla curva equatoriale (in coordinate sferiche)
π
c(t) = (θ = , ϕ = t) (3.14)
2

è - per definizione - il versore ϕ̂. Ma non esistono in S 2 nessun copia di punti (A, B) tal che
−→
ϕ̂ sia il vettore AB. Per capire cosa è ϕ̂, tocca immergere la sfera in uno spazio R3 ambiente.
In questo ambito, la curva c(t) ha componenti (x(t) = cos t, y(t) = sin t, z(t) = 0). Da cui
segue che il vettore tangente abbia componenti ẋ = −y, ẏ = x, z = 0, e quindi ϕ̂ = −yx̂ + xŷ.
Il punto della geometria differenziale è dare senso al vettore senza richiedere uno spazio
ambiente. Per questo motivo, invece di vedere il vettore tangente come una combinazione
lineare di versori come in (3.12), lo vediamo come la derivata direzionale lungo la curva.

Come al solito il punto denota la derivata rispetto a t. Qui, t è il parametro della curva, e non ha nessun
interpretazione come coordinata temporale di un qualche sistema di riferimento.
42 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Definizione II.1. Sia c(t) una curva liscia in una varietà differenziale M di dimensione m.
d
Il vettore tangente alla curva c al punto p = c(t0 ) è l’operatore dt che ad ogni funzione liscia

f ∈ C (M) associa la sua derivata direzionale
d
f (c(t)) . (3.15)
dt |t=t0

Nella carta (3.13), denotiamo f (xµ ) := f ◦ ψ −1 (xµ ). Si tratta di una funzione di m


variabili {xµ , µ = 1, ..., m}. Valutata in xµ = cµ (t), diventa una funzione di t, la cui derivata

m
d X ∂f dcµ
f (c(t)) = =: X µ ∂µ f|p (3.16)
dt |t=t0 ∂xµ |p dt |t0
µ=1

dove usiamo la convenzione di Einstein per la sommatoria sul indice µ, e definiamo


∂ dcµ
∂µ := , X µ := ċµ (t0 ) = . (3.17)
∂xµ dt |t0

I numeri X µ , µ = 1, ..., m sono le componenti del vettore tangente alla curva c in p = c(t0 ),
nella carta (3.13). Da adesso in poi, scriviamo (Up , xµ ) o (Up , ψ, xµ ) questa carta.

II.2 Spazio tangente

Ogni curva che attraversa il punto p ∈ M definisce un vettore tangente in p. L’insieme


di tutti questi vettori costituisce lo spazio tangente in p, e viene denotato Tp M.
Proposizione II.2. Tp M è uno spazio vettoriale di dimensione m = dim M. Una base
nella carta (Up , xµ ), chiamata “base delle coordinate”, è
n o
∂µ |p , µ = 1, · · · , m (3.18)

dove ∂µ |p denota l’operatore f 7→ ∂µ f |p , per f ∈ C ∞ (M).

Proof. Tramite la formula (3.15), ogni vettore tangente X in Tp M è in corrispondenza bi-


univoca con una combinazione lineare X µ ∂µ |p di operatori ∂µ |p . Reciprocamente, qualunque
combinazione lineare X µ ∂µ |p , con X µ ∈ R arbitrari, è il vettore tangente in p a una curva,
basta considerare la curva c : I → Up (I un intorno di 0 in R) le cui coordinate nel intorno
Up sono
cµ (t) = pµ + X µ t con {pµ } le coordinate di p. (3.19)
Per concludere, tocca provare che l’insieme (3.18) è una famiglia libera, cioè
X
X ν ∂ν |p = 0 ⇐⇒ X ν = 0 ∀ν = 1, ..., m. (3.20)
ν

X ν ∂ν |p sulla funzione coordinata q 7→ xµ (q), q ∈ Up :


P
Questo segue applicando X := ν
X
0= X ν ∂ν xµ |p = X µ (3.21)
ν

dove utilizziamo ∂ν xµ = δνµ (simbolo di Kronecker, nullo se µ 6= ν, = 1 se µ = ν).


II. VETTORI 43

Di conseguenza, la forma generale di un vettore in Tp M è X = X µ ∂µ |p con X µ dei


coefficienti reali arbitrari. L’azione di questo vettore su una funzione liscia f viene scritta

X[f ] := X µ ∂µ f|p . (3.22)

Quest’azione è lineare,

X[λf + g] = λX[f ] + X[g] ∀f, g ∈ C ∞ (M), λ ∈ R (3.23)

e soddisfa la regola di Leibniz

X[f g] = f (p) X[g] + X[f ] g(p) ∀f, g ∈ C ∞ (M). (3.24)

Osservazione II.3. Si dimostra che Tp M è l’insieme di tutti gli operatori su C ∞ (M) che
soddisfano queste due proprietà. Ne segue un’alternativa alla definizione II.1: definendo un
vettore come un operatore X che soddisfa (3.23), (3.24), si dimostra che è necessariamente
del tipo X µ ∂µ |p . Dalla prop. II.2 segue che X è il vettore tangente in p a qualche curva.

Le proprietà di una curva non dipendono della scelta delle coordinate. Queste ultime
sono solo un modo per poter fare calcoli espliciti. Lo stesso vale per i vettori. Un vettore X
si scrive X µ ∂µ |p in una carta (Up , ψ, xµ ) e X α ∂α |p in una altra carta (Up , φ, xα ), ma data una
funzione f ∈ C ∞ (M), il numero X[f ] è independente della scelta della carta:

X[f ] = X µ ∂µ f|p = X α ∂α f|p (3.25)

dove f si identifica prima alla funzione f ◦ψ −1 (xµ ) , poi a f ◦φ−1 (xα ). Vedendo xα come delle
funzioni xα = xα (xµ ) delle coordinate della prima carta, le regole della derivata di funzione
α
composte danno (sempre con la convenzione di Einstein) ∂µ f|p = ∂α f |p ∂x ∂xµ |p . Segue

∂xα
X µ ∂µ f|p = X µ ∂α f | p . (3.26)
∂xµ |p

Da (3.25) e dall’indipendenza della base ∂α |p , il coefficiente di ∂α f |p in (3.26) si identifica
a X α in (3.25). Da qui la formula di cambiamento di base per un vettore di Tp M:

∂xα
Xα = Xµ . (3.27)
∂xµ |p

Esempio II.4. Sia M = R2 / {O} il piano senza l’origine, con carte (M, (r, θ)) e (M, (x, y))
(coordinate polari e cartesiane). Il cambiamento di coordinate è x = r cos θ, y = r sin θ. La
funzione
p f “distanza all’origine” si identifica nella seconda carta alla funzione f (x, y) =
2 2
x + y . Si verifica che

∂x ∂y x y r cos2 θ + r sin2 θ
∂ r f = ∂ x f |p + ∂ y f |p =p cos θ + p sin θ = = 1,
∂r |p ∂r |p x2 + y 2 x2 + y 2 r
∂x ∂y −xr sin θ yr cos θ −r2 cos θ sin θ + r2 sin θ cos θ
∂ θ f = ∂ x f |p + ∂ y f |p =p +p = = 0;
∂θ |p ∂θ |p x2 + y 2 x2 + y 2 r

in accordo con l’identificazione - nella prima carta - di f alla funzione f (r, θ) = r.


44 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Nella prima carta, il vettore ∂r |p ha componente X r = 1, X θ = 0. Nella seconda carta,


ha componenti X x , X y data da (3.27):

∂x ∂x ∂x
Xx = Xr + Xθ = = cos θ, (3.28)
∂r |p ∂θ |p ∂r |p
∂y ∂y ∂y
Xy = Xr + Xθ = = sin θ. (3.29)
∂r |p ∂θ |p ∂r |p

Il vettore ∂θ|p ha coordinate polari X r = 0, X θ = 1, e coordinate cartesiane

∂x ∂x ∂x
Xx = Xr + Xθ = = −r sin θ, (3.30)
∂r |p ∂θ |p ∂θ |p
∂y ∂y ∂y
Xy = Xr + Xθ = = r cos θ. (3.31)
∂r |p ∂θ |p ∂θ |p

Riassumendo, i vettori tangenti “polari” hanno espressione cartesiane

∂r |p = cos θ ∂x |p + sin θ ∂y |p , ∂θ|p = −r sin θ ∂x |p + r cos θ ∂y |p . (3.32)

II.3 Campo vettoriale

Supponiamo che ad ogni punto p di una varietà differenziale M viene associato un vettore
Vp ∈ Tp M. Componendo la mappa
V : p 7→ Vp (3.33)
con l’azione di un vettore su una funzione liscia f ∈ C ∞ (M), si ottiene una funzione reale

V [f ] : p → Vp [f ]. (3.34)

Se per ogni funzione liscia f questa funzione V [f ] è liscia, allora la mappa V in (3.33) è
chiamata un campo vettoriale su M. In una carta (Up , xµ ) intorno a p, si scrive

V = V µ ∂µ (3.35)
II. VETTORI 45

dove V µ ∈ C ∞ (M) sono le funzioni lisce† tale che V µ (p)∂µ |p coincida con Vp .
In un altro sistema di coordinate {xα }, usando (3.27) si dimostra che lo stesso campo
vettoriale si scrive V = V α ∂α con
∂xα
Vα = Vµ µ. (3.36)
∂x
Questo costituisce la formula di cambiamento di base per un campo vettoriale.
L’insieme dei campi vettoriali su M è denotato X(M), oppure T M. In quest’ultimo caso,
viene chiamato il fibrato tangente di M. Un campo vettoriale V su una varietà M può essere
visto in modo equivalente come

• l’assegnazione (3.33) ad ogni punto p ∈ M di un vettore nello spazio tangente Tp M;

• un operatore
V : C ∞ (M) → C ∞ (M ) (3.37)
µ
f 7→ V [f ] = V ∂µ f. (3.38)

Mentre un vettore associa ad una funzione un numero (la sua derivata direzionale), un campo
vettoriale manda una funzione su un altra funzione. Quest’operatore è lineare (segue da
(3.23))
V [f + λg] = V [f ] + λV [g] ∀f, g ∈ C ∞ (M), λ ∈ R, (3.39)
e soddisfa la regola di Leibniz

V [f g] = f V [g] + V [f ] g ∀f, g ∈ C ∞ (M), (3.40)

che segue da (3.24): per qualunque p ∈ M

V [f g](p) = Vp [f g] = f (p)Vp [g] + Vp [f ]g(p), (3.41)


= (f V [g]) (p) + (V [f ]g) (p) = (f V [g] + V [f ]g) (p) . (3.42)

Si nota che(3.40) è una identià tra funzioni, mentre (3.24) è un uguaglianza tra numeri.
Un operatore lineare che soddisfa la regola di Leibniz è detto operatore differenziale di
primo ordine. Il prodotto di due campi vettoriali è ben definito nel senso di prodotto di
operatori differenziali: possiamo definire (V W )[f ] := V [W [f ]]. Però un tale prodotto non è
un campo vettoriale, perchè V [W [f ]] = V µ ∂µ [W ν ∂µ f ] fa intervenire delle derivate seconde
∂2
∂xµ ∂xν f , mentre un campo vettoriale fa intervenire solo delle derivate di ordine 1. In altre
parole, un campo vettoriale è un operatore differenziale di ordine 1, mentre il prodotto V W
è un operatore differenziale di ordine 2.
Esiste tuttavia un modo di associare a due campi vettoriali un terzo campo vettoriale,
tramite la loro parentesi di Lie.

Definizione II.5. La parentesi di Lie di due campi vettoriali V , W è l’operatore [V, W ] di


C ∞ (M) in C ∞ (M) definito da

[V, W ]f := V [W [f ]] − W [V [f ]] ∀f ∈ C ∞ (M). (3.43)



f essendo liscia, si ha che ∂µ f è liscia. Si dimostra allora che V [f ] liscia implica che anche V µ deve essere
liscia.
46 CHAPTER 3. GEOMETRIA DIFFERENZIALE

La parentesi di Lie è un commutatore, nel senso degli operatori. Perciò soddisfa le stessa
proprietà del commutatore di matrici.
Proposition II.6. La parentesi di Lie è bilineare,
[V, λW + W 0 ] = λ[V, W ] + [V, W 0 ], (3.44)
0 0 0 0
[λV + V , W ] = λ[V, W ] + [V , W ] ∀ V, W, V , W ∈ X(M) e λ ∈ C, (3.45)
antisimmetrica,
[V, W ] = −[W, V ] ∀ V, W ∈ X(M), (3.46)
e soddisfa l’identità di Jacobi
[[V, W ], Z] + [[Z, V ], W ] + [[W, Z], V ] = 0 ∀ V, W, Z ∈ X(M). (3.47)
Proof.* L’antisimmetria è ovvia. La bilinearità segue dalla linearità di un campo vettoriale
(3.39): ponendo g = W [f ] e h = W 0 [f ] con f una qualunque funzione liscia, otteniamo
V [λW [f ] + W 0 [f ]] = V [λg + h] = λV [g] + V [h] = λV [W [f ]] + V [W 0 [f ]]. (3.48)
Perciò
[V, λW + W 0 ]f = V [λW [f ] + W 0 [f ]] − λW [V [f ]] − W 0 [V [f ]] (3.49)
0 0
= λV [W [f ]] + V [W [f ]] − λW [V [f ]] − W [V [f ]] (3.50)
0
= λ[V, W ]f + [V, W ]f. (3.51)
Queste uguaglianze valgono per ogni f , il cui significa che gli operatori [V, λW + W 0 ] e
λ[V, W ] + [V, W 0 ] sono uguali. L’eq. (3.45) si dimostra nello stesso modo.
L’identità di Jacobi si dimostra vedendo V [W [f ]] come il prodotto (nel senso degli oper-
atori) V W applicato su f . Allora
[[V, W ], Z] = [V W − W V, Z] = V W Z − W V Z − ZV W + ZW V, (3.52)
[[Z, V ], W ] = [ZV − V Z, W ] = ZV W − V ZW − W ZV + W V Z, (3.53)
[[W, Z], V ] = [W Z − ZW, V ] = W ZV − ZW V − V W Z + V ZW. (3.54)
Sommando, si trova (3.47).
Tocca adesso verificare che, comme annunciato, la parentesi di Lie è un campo vettoriale.
Proposizione II.7. Sia V = V µ ∂µ e W = W µ ∂µ due campi vettoriali. Allora
[V, W ] = Z µ ∂µ con Z µ = V ν ∂ν W µ − W ν ∂ν V µ . (3.55)
Proof. Uno ha
[V, W ]f = V ν ∂ν (W µ ∂µ f ) − W ν ∂ν (V µ ∂µ f ), (3.56)
ν µ µ ν µ µ
= V ((∂ν W ) ∂µ f + W ∂νµ f ) − W ((∂ν V ) ∂µ f + V ∂νµ f ) , (3.57)
ν µ ν µ
= V (∂ν W ) ∂µ f − W (∂ν V ) ∂µ f, (3.58)
ν µ ν ν
= (V (∂ν W ) − W (∂ν V )) ∂µ f (3.59)
2
dove ∂νµ f := ∂x∂ν ∂x
f
µ . Da (3.59) segue che [V, W ] è un campo vettoriale, la cui componente
µ
in ∂µ è data da Z in (3.55).
Nel passaggio da (3.57) a (3.58) si usa che V ν W µ ∂νµ f = W ν V µ ∂νµ f (per mostrarlo,
basta scambiare gli indice ν e µ nel membro di destra, poi commutare le funzioni W µ e V ν
e utilizzare ∂µν = ∂νµ ).
II. VETTORI 47

II.4 Curva integrale

Una curva integrale per un campo vettoriale V ∈ X(M) è una curva c(t) tale che il suo
vettore tangente in ogni c(t) sia il vettore Vc(t) . Per ogni punto p, questa curva è localmente
unica nel senso seguente.
Proposizione II.8. Sia V ∈ X(M). Per ogni punto p, esiste un intorno I ⊂ R di 0 e un
unica curva c : I → M con c(0) = p tale che c sia integrale per V .
Proof. Fissata una carta su un intorno di p, una curva integrale c per V che passa per p ha
come coordinate le soluzioni del sistema di m equazioni independenti
dcµ
= V µ (c(t)), cµ (0) = pµ µ = 1, ..., m, (3.60)
dt
dove pµ sono le coordinate del punto p. Le funzioni V µ essendo di classa C ∞ per definizione
di campo vettoriale, il teorema di esistenza e unicità delle equazioni differenziali ordinare
garantisce che esista, almeno localmente, un unica soluzione.
Esempio II.9. Let M = R2 . Identificando un punto p con le sue coordinate cartesiani x, y,
consideriamo il campo vettoriale V (x, y) = −y∂x +x∂y . La curva integrale c(t) = (cx (t), cy (t))
che passa per (x0 , y0 ) in t = 0 è soluzione del sistema di due equazioni
ċx = −cy , ċy = cx . (3.61)
d 2 cx
Questo implica dt2
= −cx , cioè cx (t) = A cos t + B sin t, e quindi cy (t) = A sin t − B cos t.
Le condizioni iniziali fissano A = x0 , B = −y0 . La curva integrale è
 
x0 cos t − y0 sin t
c(t) = , (3.62)
x0 sin t + y0 cos t
cioè il cerchio di centro l’origine che passa per (x0 , y0 ). Lo stesso risultato si trova immedi-
atamente notando che V (x, y) non è altro che il campo vettoriale ∂θ (cf (3.32)).

Similarmente, si mostra che la curva integrale al campo di vettore W = y∂x + x∂y è


 
x0 cosh t + y0 sinh t
c(t) = , (3.63)
x0 sinh t + y0 cosh t
cioè l’orbite di (x0 , y0 ) sotto i boost di rapidità −t ∈ R.
48 CHAPTER 3. GEOMETRIA DIFFERENZIALE

III Tensori
In questa sezione, utilizziamo i vettori introdotti precedentemente per costruire nuovi
oggetti matematici: i tensori. In modo informale, si tratta di “matrici con più indici”.
Saranno utili nelle sezioni successive per descrivere le proprietà geometriche di spazi al di là
del caso euclideo, in particolare la curvatura.

III.1 Duale

Sia V uno spazio vettoriale reale, di dimensione finita. Il suo duale V ∗ è l’insieme delle
forme lineari su V, cioè le mappe ϕ : V → R tale che

ϕ(u + λv) = ϕ(u) + λϕ(v) ∀u, v ∈ V, λ ∈ R. (3.64)

Ogni elemento di V ∗ è completamente determinato dalla sua azione su una base di V:

{ei , i = 1, ..., dim V} . (3.65)

Inoltre, il duale è un spazio vettoriale: ϕ + λψ ∈ V ∗ per ogni ϕ, ψ ∈ V ∗ e λ ∈ R. Segue che


ogni ϕ è una combinazione lineare ϕ = λi ei (con λi := ϕ(ei ) ∈ R) delle forme di base
 i
e , i = 1, ..., dim V , (3.66)

definite tramite la loro azione sulla base (3.65) di V:

ej (ei ) := δij . (3.67)

L’insieme (3.66) delle forme di base costituisce una base dello spazio vettoriale V ∗ , chia-
mata base duale. Questo dimostra che V ∗ ha la stessa dimensione che lo spazio V.
Spesso, invece di (3.67) si scrive hej , ei i = δij . L’azione di una forma lineare ϕ = λj ej ∈ V ∗
su un vettore v = v i ei ∈ V - detta azione per dualità - è

hϕ, vi = hλj ej , v i ei i = λj v i hej , ei i = λj v i δij = λi v i . (3.68)

In questa formula, il ruolo di ϕ e v è simmetrico: V ∗ è il duale di V, e V è il duale di V ∗ .


Esempio III.1. Il duale dello spazio dei vettori-colone di dimension n è lo spazio dei vettori-
righe di dimensione n. L’azione per dualità è semplicemente il prodotto riga per colonna.

III.2 1-forma

Il duale dello spazio tangente Tp M è lo spazio cotangente in p, denotato Tp∗ M, di di-


mensione m = dim M. Un suo elemento è una 1-forma (si incontra anche la terminologia
“covettore”). Una base molto utile di Tp∗ M è la base
 µ
dx |p , µ = 1, ..., m , (3.69)
n o
duale della base delle coordinate ∂µ |p introdotta in (3.18). È definita da

hdxµ |p , ∂ν |p i = δνµ . (3.70)


III. TENSORI 49

La differenziale in p di una funzione liscia f ∈ C ∞ (M) è la 1-forma

dfp := ∂µ f|p dxµ |p . (3.71)

La sua azione per dualità sul vettore X = X ν ∂ν |p in Tp M coincida con l’azione di esso su f :

hdfp , Xi = h∂µ f |p dxµ |p , X ν ∂ν |p i = X µ ∂µ f |p = X[f ]. (3.72)

Similarmente a un campo vettoriale, si definisce un campo di 1-forme ω su M come


l’assegnazione - in modo liscio - di una 1-forma ωp ad ogni punto p ∈ M:

ω : p → ωp . (3.73)

L’insieme dei campi di 1-forma su M è lo spazio cotangente T M, ancora denotato Ω1 (M).


In un sistema di coordinate {xµ }, un campo di 1-forma si scrive

ω = ωµ dxµ (3.74)

dove ωµ , µ = 1, ..., m, sono funzioni in C ∞ (M) tale che ωµ (p)dxµ |p coincida con ωp in (3.73).
Tale campo agisce per dualità su un campo vettoriale V = V ν ∂ν ,

hω, V i = ωµ V µ . (3.75)

Si nota che hω, V i è una funziona liscia su M.


L’azione (3.75) non dipende della carta: in un altro sistema di coordinate {xα } si ha

∂xα µ
hω, V i = ωα V α = ωα V (3.76)
∂xµ

dove abbiamo utilizzato la formula (3.36) di cambiamento di base per campi vettoriali.
L’uguaglianza tra (3.75) e (3.76) implica

∂xα
ωµ = ωα , (3.77)
∂xµ

che è la formula di cambiamento di base per le 1-forme.

Osservazione III.2. ∗ Entrambi lo spazio dei campi vettoriali e quello delle 1-forme sono
lineari su C ∞ (M), nel senso che

f V ∈ X(M) ∀f ∈ C ∞ (M) , V ∈ X(M); (3.78)


1 ∞ 1
f ω ∈ Ω (M) ∀f ∈ C (M) , ω ∈ Ω (M). (3.79)

Non vale solo per f costante (che sarebbe la linearità “normale”), ma anche per f una
qualunque funzione liscia. Tecnicamente, X(M) e Ω1 (M) sono dei moduli sull’algebra C ∞ (M).
50 CHAPTER 3. GEOMETRIA DIFFERENZIALE

III.3 Tensori di grado superiore

Un tensore di tipo (r, s), con r, s ∈ N, è un mappa multilineare che associa a r 1-forme
di Tp∗ M e s vettori di Tp M un numero reale. In altre parole, è una forma multilineare T sul
prodotto cartesiano di r copie di Tp∗ M con s copie di Tp M:

T : (Tp∗ M)r × (Tp M)s → R (3.80)


(ω1 , · · · , ωr ; X1 · · · , Xs ) 7→ T (ω1 , ..., ωr ; X1 , ..., Xs ) (3.81)

dove {ωi , i = 1, ..., r} è una collezione di r 1-forme in Tp∗ M, mentre {Xj , j = 1, ..., s} è una
collezione di s vettori in ∈ Tp M.
Ad esempio, una 1-forma è un tensore di tipo (0, 1), mentre un vettore è un tensore di
tipo (1, 0) (si ricorda che il duale di Tp∗ M è Tp M) . Un tensore T di tipo (1, 1) è una matrice
quadrata di dimensione dim M: manda (ω, X) ∈ Tp M∗ × Tp M in hω, T Xi.

Osservazione III.3. ∗ Contrariamente a quelle che si potrebbe intuire, lo spazio delle forme
bilineare su U ×V (con U, V due spazi vettoriali finito dimensionali) non è il prodotto U ∗ ×V ∗
dei spazi duali. Ogni elemento (ω ∈ U ∗ , ξ ∈ V ∗ ) di questo prodotto definisce una forma
bilineare su U × V,
u, v 7→ hω, ui hξ, vi ∀u ∈ U, v ∈ V. (3.82)
Ma per R 3 λ 6= 1, i due elementi distinti (λω, ξ) e (ω, λξ) di U ∗ × V ∗ definiscono la stessa
forma bilineare, siccome

hλω, ui hξ, vi = λhω, ui hξ, vi (3.83)


= hω, ui λhξ, vi = hω, ui hλξ, vi. (3.84)

Perciò, lo spazio delle forme bilineari su U × V è il quoziente di U ∗ × V ∗ dalla relazione di


equivalenza
(λω, ξ) ∼ (ω, λξ) ∀λ ∈ R. (3.85)
Questo spazio è chiamato il prodotto tensoriale di U ∗ con V ∗ , denotato U ∗ ⊗ V ∗ . L’insieme
dei tensori di tipo (r, s) è quindi il prodotto tensoriale
r s
⊗ Tp M ⊗ Tp∗ M. (3.86)

Un tensore è completamente determinato dal suo valore su gli elementi di base:

Tνµ11...ν
...µr
s
:= T (dxµ1 |p , ...dxµr |p ; ∂ν1 |p , ..., ∂νs |p ) (3.87)

dove gli r indici µi e gli s indici νj percorrono 1, 2, ..., m.


L’assegnazione di un tensore ad ogni punto di M in modo liscio definisce un campo
tensoriale su M:
T = Tνµ11...ν
...µr
s
∂µ1 ⊗ ... ⊗ ∂µr ⊗ dxν1 ⊗ ... ⊗ dxνs , (3.88)
le cui componenti Tνµ11...ν
...µr
s sono funzioni lisce. Un campo vettoriale è un campo tensoriale di
tipo (1, 0), un campo di 1-forma è un campo tensoriale di tipo (0, 1).
III. TENSORI 51

∗ In un modo simile alle trasformazioni dei campi vettoriali (3.36) e di 1-forme (3.77), la
formula di cambiamento di coordinate {xµ } → {xα } per un campo tensoriale è
m
∂xα1 ∂xαr ∂xν1 ∂xνs
Tβα11,...β
,...αr
X
= Tνµ11,...ν
,...µr
... ... . (3.89)
s s
∂xµ1 ∂xµr ∂xβ1 ∂xβs
µ1 ,....µr ,ν1 ,...,νs =1

Nella literatura, questa proprietà viene a volte utilizzata come definizione: un tensore è un
oggetto che si trasforma, sotto un cambiamento di coordinate, seguendo (3.89).

III.4 Mappa differenziale e pull back

Una mappa liscia φ tra due varietà M e N induce una mappa φ∗ tra spazi tangenti,
chiamata mappa differenziale:
φ∗ : Tp M → Tφ(p) N (3.90)
X 7→ φ∗ X, (3.91)
dove il vettore φ∗ X è definito da
(φ∗ X)[f ] := X[f ◦ φ] ∀f ∈ C ∞ (N ). (3.92)

Scegliendo carte (Up , xµ ) in M and (Uφ(p) , xα ) in N , viene l’espressione locale della mappa
differenziale.
Proposition III.4. Sia X = X µ ∂µ |p in Tp M. Allora φ∗ X = Y α ∂α |φ(p) dove
Y α = X µ ∂µ φα | p . (3.93)
Proof. Per qualunque funzione f ∈ C ∞ (N ), uno ha
(φ∗ X)[f ] = X[f ◦ φ] = X µ ∂µ (f ◦ φ)|p (3.94)
= X µ ∂α f|φ(p) ∂µ φα|p (3.95)
 
= X µ ∂µ φα |p ∂α f |φ(p) = (Y α ∂α |φ(p) )[f ].
52 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Esempio III.5.* Sia M il disco aperto di raggio 1, con carta (M, (x1 , x2 )), e N = R3 con
coordinate cartesiane y α . Sia φ la mappa da M in N definita da φ(x1 , x2 ) = (y 1 , y 2 , y 3 ) con
p
y 1 (x1 , x2 ) = x1 , y 2 (x1 , x2 ) = x2 , y 3 (x1 , x2 ) = 1 − (x1 )2 − (x2 )2 . (3.96)
Si considera il campo vettoriale costante V (x1 , x2 ) = a∂1 + b∂2 . Allora
 1
y2

y
f∗ V = (V µ ∂µ y α )∂α = a∂1 + b∂2 − a 3 + b 3 ∂3 . (3.97)
y y
La mappa differenziale si estende ai campi vettoriali. L’imagine di V = V µ ∂µ in X(M) è
il campo vettoriale W in X(N ) tale che
(φ∗ V )[f ] = V [f ◦ φ] ∀f ∈ C ∞ (N ). (3.98)
In componente, W = W α ∂α con
W α (φ(p)) = V µ (p) ∂µ φα |p . (3.99)
Per dualità, una mappa liscia φ : M → N definisce anche una mappa φ∗ tra spazi
cotangenti:
φ∗: Tφ(p) N → Tp M (3.100)

ω 7→ φ ω (3.101)
dove la 1-forma φ∗ ω è definita da
hφ∗ ω, Xi = hω, φ∗ Xi ∀X ∈ Tp M. (3.102)
Mentre la mappa differenziale φ∗ : Tp M → Tφ(p) M va nello stesso senso della mappa φ; la
mappa φ∗ : Tφ(p) ∗ M → T ∗ M va nel senso contrario. Per questo motivo è chiamata pull-back.
p
La sua espressione locale si trova usando le stesse carte di prima, (Up , xµ ) on M e
(Uφ(p) , X α ) in N .
∗ N . Allora φ∗ ω = ξ dxµ dove
Proposition III.6. Sia ω = ωα dxα |φ(p) in Tφ(p) µ |p

ξµ = ωα ∂µ φα |p . (3.103)
Proof. Per qualunque X = X µ ∂µ |p in Tp M, uno ha

hφ∗ ω, Xi = hω, φ∗ Xi = hωβ dxβ |φ(p) , (X µ ∂µ φα |p )∂α |φ(p) i (3.104)


= ωβ X µ ∂µ φα |p hdxβ |φ(p) , ∂α |φ(p) i = ωβ X µ ∂µ φα |p δαβ (3.105)
= ω α X µ ∂ µ φ α |p (3.106)
= ωα X ν ∂µ φα |p δνµ = ωα X ν ∂µ φα |p hdxµ |p , ∂ν |p i (3.107)
 
= h ωα ∂µ φα |p dxµ |p , X ν ∂ν |p i = hξµ dxµ |p , Xi
Il pull-back di un campo di 1-forma ω = ωα dxα è definito in modo analogo da
hφ∗ ω, V i = hω, φ∗ V i, (3.108)
e ha componente
ξµ (p) = ωα (φ(p)) ∂µ φα |p . (3.109)
Osservazione III.7. E possibile definire in modo analogo l’imagine di un qualunque tensore
di tipo (r, s) sotto un mappa φ : M → N (con la restrizione che dal momento che r e s siano
entrambi non nulli, bisogna che φ sia un diffeomorfismo).
IV. CONNESSIONE 53

IV Connessione
Definendo un vettore come tangente-a-una-curva-in-un-punto, si perde una proprietà im-
portante del vettore-freccia classico: il fatto che non importa dov’è attaccata la freccia. Come
spiegato sotto, legare cosı̀ un vettore a un punto impedisce di derivare un campo vettoriale,
che è pero necessario in fisica (pensare all’accelerazione, derivata della velocità). Per risolvere
questo problema, si introduce una nuova struttura matematica, chiamata connessione.‡

IV.1 Trasporto parallello

Sia c(t) = {cµ (t), µ = 1, 2} la traiettoria di un corpo in R2 . La sua velocità al tempo t è


il vettore Vp = ċµ (t)∂µ |p , tangente alla curva c nel punto p = c(t). L’accelerazione al tempo
t è il vettore di componenti

ċµ (t + δt) − ċµ (t)


c̈µ (t) = lim . (3.110)
δt→0 δt
Tuttavia, nell’ambito della geometria differenziale, l’interpretazione di (3.110) come compo-
nenti di un vettore è delicata: ponendo p0 = c(t + δt), il numeratore è la differenza tra le
componenti µ di Vp0 ∈ Tp0 R2 e Vp in Tp R2 . Ma la differenza tra due vettori in spazi tangenti
diversi non è definita. Per dare un senso geometrico a (3.110), conviene immaginare un modo
di trasportare Vp0 in un vettore § Ṽp0 in Tp R2 , poi considerare la differenza con Vp (ben definita
perchè Tp R2 è uno spazio vettoriale). Tale trasporto è chiamato trasporto parallelo.
Classicamente, nello spazio euclideo il trasporto parallelo da p0 a p di qualunque vettore
Vp0 = V x ∂x |p0 + V y ∂y | 0 ∈ Tp0 R2 (con V x , V y ∈ R) è il vettore Ṽp0 = V x ∂x |p + V y ∂y |p in Tp R2 :
p
due vettori sono uguali se hanno le stesse componenti cartesiani, indipendentemente del punto
di attacco. In particolare, il trasporto parallelo in p della base coordinate (cartesiane) di Tp0 R2
è la base coordinate in Tp R2 :

∂˜x |p0 := ∂x |p , ∂˜y |p0 := ∂y |p ∀p, p0 ∈ R2 . (3.111)

Non è vero per la base coordinata (polare) calcolata in (3.32). Seguendo (3.111), il
trasporto parallelo di ∂r |p0 = cos θ0 ∂x |p0 +sin θ0 ∂y | 0 è ∂˜r |p0 = cos θ0 ∂x |p +sin θ0 ∂y |p , che è diverso
p
da ∂r |p = cos θ∂x |p + sin θ∂y |p (almeno che p, p0 abbiano la stessa coordinata angolare θ = θ0 ).
Un argomento simile vale per ∂θ|p0 . Per non favorire la base cartesiana, si può definire un
trasporto parallelo tale che due vettori si identifichino quando hanno le stesse componenti
polari, cioè porre¶
∂˜r |p0 := ∂r |p , ∂˜θ|p0 := ∂θ|p ∀p, p0 ∈ R2 / {0} . (3.112)
Ovviamente questa prescrizione “polare” del trasporto parallelo non è equivalente a quella
“cartesiana” (cf figura 3.3(a)). La prescrizione (3.111) sembra più naturale. Tuttavia, se
vediamo il piano come imagine della sfera (meno il polo nord) sotto la proiezione stereografica,
allora la prescrizione (3.112) potrebbe sembrare più adeguata (cf figura IV.4).

Questa sezione si ispira del libro di Nakahara, “Geometry, topology and physics”, IOP 1990, §7.2, dove si
troveranno ulteriori dettagli e esempi.
§
Ṽp0 è un vettore in Tp M. L’indice p0 è per ricordare che si parte da un vettore in Tp0 M.

Si esclude l’origine perchè ∂r in (3.32) non è continuo in O.
54 CHAPTER 3. GEOMETRIA DIFFERENZIALE

(a) A sinistra, il trasporto parallelo (3.111): in nero, la base cartesiana di Tp0 M e la sua trasporta parallela in p, che coincide
con la base cartesiane di Tp R2 ; in rosso, le basi polari in p0 e p; in blu, il trasporto della base polare da p0 a p, che non coincide
con la base polare in p. A destra, gli stessi oggetti ma per il trasporto parallelo (3.112): la base polari (in rosso) è preservata,
mentre il trasporto della la base cartesiana da p0 in p (in blu) non coincida con la base cartesiana in p.

U U
V
S

S
V

(b) Due vettori U, V , tangenti sull’equatore a due meridiani di longi-


tudine ϕ e ϕ + π2 sono mandati, via le coordinate stereografiche, in
due vettori U, V sul piano, paralleli rispetto al trasporto naturale in
coordinate polari.

Figure 3.3: Due trasporti paralleli sul piano


IV. CONNESSIONE 55

In conclusione, la struttura di varietà differenziale non basta per individuare in modo


canonico un trasporto parallelo. Tale trasporto deve essere definito grazie a una struttura
aggiuntiva che permette di collegare spazi tangenti in punti diversi.

IV.2 Derivata covariante

Invece di definire direttamente il trasporto parallelo, si definisce la derivata covariante di


un campo vettoriale V , lungo un campo vettoriale U , come il campo vettoriale ∇U V tale che

Ṽp0 − Vp
(∇U V )p = lim (3.113)
δt→0 δt
dove p0 = c(δt) è sulla curva integrale c(t) di U che passa per p = c(0).

Affinche (3.113) abbia senso, l’operatore ∇U V deve soddisfare le proprietà di una derivata di-
rezionale. Ne segue la seguente definizione.
Definizione IV.1. Una connessione su una varietà differenziale M è una mappa

∇ : X(M) × X(M) → X(M) (3.114)


(U, V ) 7→ ∇U V (3.115)

tale che, per ogni U, U 0 e V, V 0 in X(M) e f ∈ C ∞ (M) uno abbia

∇(U +U 0 ) (V ) = ∇U V + ∇U 0 V, (3.116)
∇(f U ) V = f ∇U V, (3.117)
∇U (V + V 0 ) = ∇U V + ∇U V 0 , (3.118)
∇U (f V ) = U [f ]V + f ∇U V (3.119)
56 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Definendo l’azione di ∇U su una funzione f ∈ C ∞ (M) come la derivata direzionale,

∇U f := U [f ], (3.120)

la condizione (3.119) si legge come la regola di Leibniz

∇U (f V ) = ∇U (f ) V + f ∇U (V ). (3.121)

Cosı̀, l’operatore ∇U ha tutte le proprietà richieste da una derivata direzionale:


- è C ∞ (M)-lineare nella direzione di derivazione U (condizioni (3.116) e (3.117));

- è un operatore differenziale di ordine 1: l’azione su V è lineare per la somma (condizione


(3.118)), e soddisfa la regola di Leibniz (3.121).
Data una connessione ∇, il trasporto parallelo associato si trova risolvendo (3.113).
Le condizioni (3.116)-(3.119) garantiscono che, in una carta {xµ }, una connessione è
totalmente definita dalla sua azione su i campi vettoriali di base {∂µ }, cioè dalle m3 (con
m = dim M) funzioni lisce Γλµν ∈ C ∞ (M) definite da

∇µ ∂ν = Γλµν ∂λ (3.122)

dove poniamo
∇µ := ∇∂µ . (3.123)
Queste funzioni sono chiamati coefficienti della connessione. Ogni scelta di coefficienti Γλµν
definisce una connessione. Di conseguenza, su una varietà differenziale M esiste un numero
infinito di connessioni distinti, e quindi una scelta infinita di trasporto parallelo. Vedremmo
nella sezione VI come il teorema di Levi-Civita garantisce che esiste una connessione canonica
dal momento che si aggiunge una struttura metrica.
Le componenti della derivata covariante ∇U V in una carta si calcolano facilmente.
Proposizione IV.2. Sia Γλµν i componenti della connessione ∇ in una carta (Up , xµ ), e
U = U µ ∂µ , V = V µ ∂µ due campi vettoriali. Allora ∇U V è il campo vettoriale di componenti

 
(∇U V )λ = U µ ∂µ V λ + V ν Γλµν . (3.124)

Proof. Le condizioni (3.116) e (3.117) danno ∇U V = ∇U µ ∂µ = U µ ∇µ V . Dalle condizioni


(3.118) e (3.119), insieme a (3.122), segue
 
U µ ∇µ V = U µ ∇µ (V ν ∂ν ) = U µ ∂µ (V ν )∂ν + V ν Γλµν ∂λ . (3.125)

Scrivendo λ invece di ν nel primo termine, viene


 
∇U V = U µ ∂µ V λ + V ν Γλµν ∂λ .

Da cui segue (3.124).

Si nota che gli indici di Γλµν non giocano lo stesso ruolo: µ è legato alla direzione in cui si
deriva, ν al vettore che viene derivato, e λ è l’indice di componente.
IV. CONNESSIONE 57

IV.3 Geodetica

Un campo V è detto trasportato parallelamente lungo il campo U quando ∇U V = 0. In


modo equivalente, si dice che V è trasportato parallelamente lungo ogni curva integrale di U .

Definizione IV.3. Una geodetica è una curva c il cui vettore tangente U è trasportato
parallelamente lungo c: ‖
∇U U = 0. (3.126)

Le geodetiche sono le curve “più diritte possibile”, rispetto alla nozione di “diritto”
definita dalla connessione. Questa nozione non dipende di una qualunque metrica (più tardi,
vedremmo che data una metrica, esiste una particolare connessione per la quale una geodetica
è anche una curva estremale per la lunghezza).

Proposition IV.4. Una curva c = (cµ (t)) è una geodetica se e solo se i suoi componenti sod-
disfano
c̈µ + Γµνλ ċν ċλ = 0 ∀µ = 1, · · · , m. (3.127)

Proof. L’eq. (3.126) è equivalente a (∇U U )λ = 0 per ogni λ = 1, ..., m. Scrivendo (3.124)
con V µ = U µ = ċµ , viene
 
ċµ ∂µ ċλ + ċν Γλµν = 0. (3.128)

d
Ricordando che ċµ ∂µ = dt , quest’equazione si riscrive in modo equivalente

c̈λ + ċµ ċν Γλµν = 0. (3.129)

Il risultato segue della permutazione circolare µνλ → νλµ.

L’equazione (3.127) è l’equazione delle geodetiche. Si tratta di una delle due equazioni
più importanti in relatività generale (l’altra essendo le equazioni di Einstein che determinano
la curvatura dello spazio tempo). È un sistema di m equazioni differenziali di ordine 2, non
indipendenti e non lineari. Perciò non esiste un metodo sistematico di risoluzione. Grande
parte del lavoro in relatività generale consiste a risolvere quest’equazione, una volta fissata -
grazie ai requisiti fisici - i parametri della connessione.
Tutta via sono equazioni scritte in forma normale. Dalla teoria delle equazioni differenziali
ordinare sappiamo che fissato m coppie di condizioni iniziali (cµ (0) = pµ , ċµ (0) = V µ ), esiste
un unico m-tuple di soluzioni cµ (t) definite almeno per t in un intorno di 0 ∈ R. In altre
parole, abbiamo il seguente risultato.

Proposizione IV.5. Dato un punto p in M e qualunque vettore Vp in Tp M, esiste sempre


un unica geodetica che passa per p e sia tangente a Vp .

Stricto-sensu U non è un campo vettoriale, visto che è ben definito lungo la curva c ma non necessariamente
su tutto M. Lo stesso vale per ∇U V . Le sue componenti (∇U V )λ date in (IV.2) sono ben definita su c(t).
58 CHAPTER 3. GEOMETRIA DIFFERENZIALE

IV.4 Connessione e geodetiche per il trasporto parallelo “naturale” del piano

Calcoliamo le componenti della connessione associata al trasporto parallelo nel piano


(3.111), poi le geodetiche. L’eq. (3.113) per U = ∂x e V = ∂y si scrive

∂˜y | 0 − ∂y |p
p
(∇x ∂y )p = lim . (3.130)
δt→0 δt
Insieme a (3.111) dà ∇x ∂y = 0. Da (3.122) segue
Γxxy = Γyxy = 0. (3.131)
Similarmente, si ottiene che tutti gli altri coefficienti sono nulli:
Γxxx = Γyxx = 0, Γxyx = Γyyx = 0, Γxyy = Γyyy = 0. (3.132)
L’equazione delle geodetiche (3.127) si riduce a
ẍ = 0, ÿ = 0 (3.133)
le cui soluzione sono x(t) = at + b, y(t) = ct + d con a, b, c, d delle costanti reali. In caso
a = 0, otteniamo tutte le rete x = constante, e per a 6= 0 viene
c cb
y= x− + d, (3.134)
a a
cioè tutte le altre rette del piano.
Esempio IV.6. * È istruttivo fare lo stesso calcolo in coordinate polari (escludendo l’origine,
dove le coordinate polari non sono continue). I trasporti paralleli in p di ∂r |p0 e ∂θ|p0 si
calcolano come sotto 3.111, applicando la prescrizione (3.111) a (3.32):
∂˜r |p0 = cos θ0 ∂x |p + sin θ0 ∂y |p , ∂˜θ|p0 = −r0 sin θ0 ∂x |p + r0 cos θ0 ∂y |p . (3.135)

• Nel caso di un trasporto a θ costante, cioè p = (r, θ) e p0 = (r0 , θ0 = θ), viene ∂˜r |p0 = ∂r |p ,
0
∂˜θ| = r ∂θ| . Per un piccolo spostamento r0 = r + δr, otteniamo
p0 r p

1
∂˜r |p0 − ∂r |p = 0, ∂˜θ|p0 − ∂θ|p = δr ∂θ|p0 . (3.136)
r
Da (3.130) segue ∇r ∂r = 0 e ∇r ∂θ = 1r ∂θ . Paragonando con (3.122) otteniamo
1
Γrrr = 0 , Γθrr = 0, Γrrθ = 0 , Γθrθ = . (3.137)
r
• Similarmente, per un trasporto a r costante, cioè r0 = r e θ0 = θ + δθ, sviluppando
(3.135) nel primo ordine in δθ, poi usando (3.32) otteniamo
∂˜r |p0 = cos(θ + δθ)∂x |p + sin(θ + δθ)∂y |p (3.138)
1
= (cos θ − δθ sin θ)∂x |p + (sin θ + δθ cos θ)∂y |p = ∂r |p + δθ ∂θ|p , (3.139)
r
∂˜θ|p0 = −r sin(θ + δθ)∂x |p + r cos(θ + δθ)∂y |p (3.140)
= −r(sin θ + δθ cos θ)∂x |p + r(cos θ − δθ sin θ)∂y |p = ∂θ|p − rδθ ∂r |p . (3.141)
IV. CONNESSIONE 59

Da (3.130) segue ∇θ ∂r = 1r ∂θ , ∇θ ∂θ = −r∂r . Da (3.122) troviamo

1
Γrθr = 0, Γθθr = , Γθθθ = 0, Γrθθ = −r. (3.142)
r

Le equazioni delle geodetiche sono


2
r̈ − rθ̇θ̇ = 0, θ̈ + θ̇ṙ = 0. (3.143)
r
Si può verificare (ad esempio designando le soluzione numeriche), che quest’equazione de-
scrivo tutte le rette del piano. Ad esempio le soluzioni a θ̇ = 0 sono le rette θ = constante
tramite l’origine.

Esempio IV.7. ∗ Per curiosità, si possono calcolare le geodetiche per il trasporto parallelo
“polare” (3.112). Il calcolo è identico al quello dell’esempio precedente, con r e θ invece di x
e y. Otteniamo che i coefficienti della connessione (in coordinate polari), sono tutti nulli:

Γrrr = Γθrr = Γrrθ = Γθrθ = Γrθr = Γθθr = Γrθθ = Γθθθ = 0. (3.144)

Le geodetiche sono le soluzioni di r̈ = θ̈ = 0, cioè le rette nel piano (r, θ). Deisgnando queste
curve in coordinate polari, si trovano le rette tramite l’origine (θ̇ = 0), i cerchi centrato sul
origine (ṙ = 0), e delle elici.

Figure 3.4: Col traporto parallelo “polare”, le geodetiche che attraverano un punto p sono
di tre tipi: quando il vettore tangente alla geodetica in p è ċp = ∂θ|p , la geodetica è il
cerchio centrato sull’origine; quando ċp = ∂r |p , è la retta radiale; altrimenti è una curva che
rassomiglia a un elice al di fuori del cerchio, ed è più complicata all’interno.
60 CHAPTER 3. GEOMETRIA DIFFERENZIALE

IV.5 Trasformazione dei componenti della connessione ∗

Una connessione non è un campo tensoriale (non è lineare in V ). Di conseguenza, la


regola di trasformazione dei coefficienti Γλµν non è data da (3.89).

Proposizione IV.8. Sotto un cambiamento di coordinate {xµ , xν , xρ } → xα , xβ , xγ i co-




efficienti della connessione si trasformano seguendo

∂xµ ∂xρ ∂xγ ν ∂ 2 xν ∂xγ


Γγαβ = Γ + (3.145)
∂xα ∂xβ ∂xν µρ ∂xα ∂xβ ∂xν
∂xµ
Proof. Scrivendo ∂β = ∂
∂xβ µ
e usando la proprietà (3.119) della connessione, viene
 µ 
∂x
∇ ∂α ∂ β = ∇ ∂α ∂µ (3.146)
∂xβ
∂xµ ∂xµ ∂ 2 xµ ∂xµ
= ∂α ( β )∂µ + β ∇∂α ∂µ = ∂ µ + ∇∂ ∂µ . (3.147)
∂x ∂x ∂xα ∂xβ ∂xβ α
∂xρ
Poi scrivendo ∂α = ∂xα ∂ρ , la proprietà (3.117) dà

∂ 2 xµ ∂xµ
∇ ∂α ∂ β = ∂ µ + ∇ ∂xρ ∂µ , (3.148)
∂xα ∂xβ ∂xβ ∂xα ∂ρ
∂ 2 xµ ∂xµ ∂xρ ν ∂ 2 xν ∂xµ ∂xρ ν
 
= ∂ µ + Γ ∂ν = + β α Γρµ ∂ν . (3.149)
∂xα ∂xβ ∂xβ ∂xα ρµ ∂xα ∂xβ ∂x ∂x

Scrivendo ∂ν = ∂xγ
∂xν ∂γ e identificando il membro di sinistra di (3.146) con Γγαβ ∂γ , viene

∂ 2 xν ∂xγ ∂xµ ∂xρ ∂xγ ν


Γγαβ = + Γ . (3.150)
∂xα ∂xβ ∂xν ∂xβ ∂xα ∂xν ρµ
Scambiando gli indici µ con ρ, si trova (3.145).

Osservazione IV.9. ∗ Si verifica che la differenza ∇ − ∇0 da due connessioni è un campo


tensoriale (sotto cambiamento di coordinate, ∇0 contribuisce con un termine di derivata sec-
onda che cancella quello di ∇, quello che rimane si trasforma come un campo tensoriale di
tipo (1, 2)).
Osservazione IV.10. ∗ Si verifica che la legge di trasformazione (3.150) delle componenti
della connessione garantisce che le componenti (3.124) di ∇U V si trasformano seguendo
(3.36):
β
 ρ  α
 
α β α α γ ν ∂x ∂x η ∂x α γ

(∇U V ) = U ∂β V + Γβγ V = U ∂ρ V + Γβγ V ,
∂xν ∂xβ ∂xη
α ∂xβ α γ
 α
∂ 2 xα ∂xβ ∂xγ α ρ
    
ν ρ η ∂x ν ∂x η η
= U δν ∂ρ V + Γ V =U ∂ν V + η ν V + Γ V ,
∂xη ∂xν βγ ∂xη ∂x ∂x ∂xν ∂xρ βγ
 α  2 α
∂xβ ∂xγ α
 α
∂xα η ρ
  
ν ∂x η ∂ x ρ ν ∂x η
=U ∂ν V + + Γ V =U ∂ν V + Γ V ,
∂xη ∂xρ ∂xν ∂xν ∂xρ βγ ∂xη ∂xη νρ
 ∂xα η ∂x
α
= U ν ∂ν V η + Γηνρ V ρ = (∇ U V ) .
∂xη ∂xη
V. CURVATURA 61

V Curvatura
V.1 Curvatura di Gauss

La definizione più intuitiva di curvatura è quella di una curva c(s) = (x(s), y(s)) nel piano
euclideo. Il vettore tangente a c nel punto c(s) è t(s) = (ẋ(s), ẏ(s)). Ha norma 1 per ogni s
dal momento che il parametro s sia la lunghezza della curva.∗∗ . Visto che ds dt
·t = 12 (ẍẋ+ ÿ ẏ) =
1 d 2 2 d
2 dt (ẋ + ẏ ) = dt ||t|| = 0, si ha che
dt
= k(s) n(s) (3.151)
ds |s
dove n(s) è il versore ortogonale a t(s) tale che t(s) ∧ n(s) = x̂ ∧ ŷ, mentre il numero reale
1
k(s) definisce la curvatura di c in c(s) (il raggio di curvatura è k(s) ). Una retta ha curvartura
nulla in ogni suoi punti: la curvatura misura quindi quanto una curva non è una geodetica
per il trasporto naturale nel piano (3.111).

La nozione di curvatura si estende ad una superficie bi-dimensionale S in R3 . Ad ogni


punto p di S, si considera il piano Πp tangente alla superficie (esiste sempre se S è sufficien-
temente regolare, ad esempio liscia). Un piano normale in p è uno che contiene il vettore
normale a Πp in p. La sua intersezione con S definisce una curva in Πp , detta sezione normale.
Il valore della curvatura della sezione normale in p dipende della scelta del piano normale.
I valori massimali e minimali sono le curvature principali k1 , k2 (si dimostrano che sono ot-
tenute per due piani normali ortogonali). La curvatura di Gauss di S in p è per definizione
il prodotto k1 k2 . Ad esempio per un sfera di raggio R la curvatura di Gauss vale R12 ad ogni
p, mentre per una sella cavallo è negativa (cf figura 3.5).
Si dimostra inoltre che le curvature principali sono gli autovalori della matrice
 
L M
(3.152)
M N
dove L, M e N sono i coefficienti della seconda forma principale, definita dallo sviluppo di
Taylor di S intorno a p: scegliendo il sistema di riferimento (p, x̂, ŷ, ẑ) tale che (x̂, ŷ) sia il
piano tangente Πp , la superficie S intorno a p ha equazione
x2 y2
z=L
+ M xy + N . (3.153)
2 2
Quest’approccio locale della curvatura è quello che si generalizza nel ambito della geome-
tria differenziale, dove la curvatura è caratterizzata da un tensore. Permette di definire la
curvatura non solo da una curva o una superficie, ma per una varietà di dimensione arbitraria.
∗∗
Questo risultato di geometria euclidea sarà dimostrato in tutta generalità nella sezione I.2 del capitolo 4
62 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Figure 3.5: Sella cavallo, (preso su wikipedia Principal curvature, da Eric Gaba).

V.2 Tensori di Riemann e di torsione

Dal confronto tra il piano (piatto) e la sfera (curva), si intuisce che la curvatura ha a che
fare con il trasporto parallelo (cf figura 3.6). Tuttavia le componenti Γλµν della connessione
non definiscono un campo tensoriale, e non hanno un significo geometrico intrinseco. Ad
esempio, uno spazio piatto non si può caratterizzare dall’annullamento dei coefficienti di
connessione: la connessione naturale su R2 ha coefficienti nulli in coordinate cartesiani (cf
(3.131), (3.132)), ma non in coordinate polari (cf (3.137), (3.142)). Conviene quindi definire
uno o più tensori associati alla connessione.
Per farlo, sfruttiamo la dualità tra vettori e 1-forme per dare una definizione di tensori
alternativa (ma del tutto equivalente) a quella della sezione III. Un campo tensoriale T di tipo
(1, 1) è un forma C ∞ (M)-bilineare Ω1 (M)×X(M) → C ∞ (M). Fissato un campo vettoriale
V , allora T(·, V ) definisce una forma lineare Ω1 (M) → C ∞ (M), cioè un campo tensoriale
di tipo (1, 0), cioè un campo vettoriale. Ad ogni V viene associato un tale campo vettoriale.
In altre parole, un campo tensoriale di tipo (1, 1) è una mappa lineare X(M) → X(M). Un
campo tensoriale di tipo (1, s) è una mappa s-lineare X(M)s → X(M), e vice-versa.
Il tensore di Riemann, definito sotto, è un campo tensoriale R di tipo (1, 3),
R : Ω1 (M) × X(M)3 → C ∞ (M) , (3.154)
(ω; U, V, W ) 7→ R(ω; U, V, W ), (3.155)
visto come una mappa trilineare
R : X(M)3 → X(M ) (3.156)
U, V, W 7→ R(· ; U, V, W ). (3.157)
Il tensore di torsione è un campo tensoriale di tipo (1, 2), visto come una mappa bilineare
T : X(M)2 → X(M). (3.158)
V. CURVATURA 63

Figure 3.6: A sinistra, il trasporto parallelo lungo una curva chiusa di R2 : il trasportato
coincide con il vettore di partenza. A destra, il trasporto parallelo “naturale” sulla sfera,
lungo un meridiano, poi lungo l’equatore: quando si torna al punto di partenza, si ottiene un
vettore Ṽ nello stesso spazio tangente, ma opposto al vettore V di partenza. La curvatura
misura quanto un vettore trasportato parallelamente lungo una curva chiusa non coincide
con se stesso.

Definizione V.1. Sia M una varietà differenziale munita di una connessione ∇. Il tensore
di Riemann è la mappa R di X(M) × X(M) × X(M) in X(M) definata da

R(U, V, W ) := ∇U ∇V W − ∇V ∇U W − ∇[U,V ] W. (3.159)

Il tensore di torsione è la mappa di X(M) × X(M) in X(M) definata da

T (U, V ) := ∇U V − ∇V U − [U, V ]. (3.160)

Dalla definizione non è del tutto chiaro che le mappe R e T siano dei tensori, cioè siano
multilineari. Per dimostrarlo, utilizzeremmo il seguente lemma.
Lemma V.2. Sia U, V ∈ X(M) e f ∈ C ∞ (M). Allora

[f U, V ] = f [U, V ] − V [f ]U, (3.161)


[U, f V ] = f [U, V ] + U [f ]V. (3.162)

Proof. Dalla definizione (3.43) delle parentesi di Lie, l’azione di [f U, V ] su g ∈ C ∞ (M) è

[f U, V ][g] = f U [V [g]] − V [f [U [g]] (3.163)


= f U [V [g]] − f V [U [g]] − V [f ] U [g] = f [U, V ][g] − (V [f ]U )[g] (3.164)

dove utilizziamo la regola di Leibniz (3.40). Similarmente,

[U, f V ][g] = U [f V [g]] − f V [[U [g]] (3.165)


= U [f ] V [g] + f U [V [g]] − f V [U [g]] = (U [f ]V )[g] + f [U, V ]g.
64 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Proposizione V.3. Le mappe R, T in (3.159), (3.160) sono multilineari, in particolare


R (f U, gV, hW ) = f gh R (U, V, W ) , (3.166)
T (f U, gV ) = f gh T (U, V ) (3.167)
per ogni f, g, h ∈ C ∞ (M) e U, V, W ∈ X(M).
Proof. La derivata covariante è lineare rispetto alla somma (eq. (3.116) e (3.118)), di con-
seguenza lo stesso vale per i tensori R e T . La difficoltà viene della condizione (3.119),
che stabilisce che la derivata covariante non è lineare in V rispetto alla moltiplicazione per
f ∈ C ∞ (M). La linearità dei tensori di torsione e di curvatura è quindi equivalente alle
equazioni (3.166) e (3.167), che adesso dimostriamo.
Iniziamo dal tensore di Riemann, verificando la linerità nella prima variabile. Uno ha
R (f U, V, W ) = ∇f U ∇V W − ∇V ∇f U W − ∇[f U,V ] W. (3.168)
I due primi termini del membro di destra danno, usando (3.118),
∇f U ∇V W − ∇V ∇f U W = f ∇U (∇V W ) − ∇V (f ∇U W ) , (3.169)
= f ∇U ∇V W − f ∇V ∇U W − V [f ] ∇U W, (3.170)
mentre, da (3.161), l’ultimo termine si scrive
∇[f U,V ] W = ∇f [U,V ]−V [f ] U W = f ∇[U,V ] W − V [f ]∇U W. (3.171)
Sommando (3.170) e -(3.171) viene
R (f U, V, W ) = f ∇U ∇V W − f ∇V ∇U W − f ∇[U,V ] W = f R(U, V, W ). (3.172)
Questo dimostra la linerarità del tensore di Riemann nella prima variabile. La linearità nella
seconda variabile V si dimostra in modo uguale.
∗ La linearità in W segue da

∇U ∇V (hW ) = ∇U (V [h ]W + h∇V W ), (3.173)


= U [V [h]] W + V [h] ∇U W + U [h] ∇V W + h ∇U ∇V W (3.174)
∇V ∇U (hW ) = V [U [h]] W + U [h] ∇V W + V [h] ∇U W + h ∇V ∇U W (3.175)
∇[U,V ] (hW ) = ([U, V ]h) W + h∇[U,V ] W, (3.176)
= U [V [h]] W − V [U [h]] W + h∇[U,V ] W. (3.177)
Sommando (3.174), -(3.175) e -(3.177) viene

R(U, V, hW ) = h ∇U ∇V W − ∇V ∇U W − ∇[U,V ] W = h R(U, V, W ). (3.178)
∗ La prova per la torsione è simile, verifichiamo la linearità in U eV simultaneamente:
T (f U, gV ) = ∇f U (gV ) − ∇gV (f U ) − [f U, gV ], (3.179)
= f (U [g] V + g∇U V ) − g (V [f ] U + f ∇V U ) − (f [U, gV ] − gV [f ] U ) , (3.180)
= f g (∇U V − ∇V U ) + f U [g] V − gV [f ] U − (f U [g]V + f g[U, V ] − gV [f ]U ) ,
= f g (∇U V − ∇V U ) − f g[U, V ] = f g T (U, V ).
V. CURVATURA 65

V.3 Componenti dei tensori di Riemann e di torsione

Come ogni tensore, R e T sono determinati dai loro valori su i vettori di base, cioè ††

λ λ
R(∂µ , ∂ν , ∂ρ ) =: Rρµν ∂λ , T (∂µ , ∂ν ) =: Tµν ∂λ . (3.181)

Questi valori sono funzioni delle componenti della connessione e delle loro derivate.
λ
Proposition V.4. Le componenti Rµνρ λ dei tensori di Riemann e di torsione sono
e Tµν
λ
Rρµν = ∂µ Γλνρ − ∂ν Γλµρ + Γηνρ Γλµη − Γηµρ Γλνη , (3.182)
λ
Tµν = Γλµν − Γλνµ . (3.183)

Proof. Iniziamo dal tensore di Riemann. Uno ha


λ
Rρµν = hdxλ , R(∂µ , ∂ν , ∂ρ )i. (3.184)

Notando che [∂µ , ∂ν ] = 0, viene con (3.122)

R(∂µ , ∂ν , ∂ρ ) = ∇µ ∇ν ∂ρ − ∇ν ∇µ ∂ρ , (3.185)
= ∇µ (Γηνρ ∂η ) − ∇ν (Γηµρ ∂η ), (3.186)
= (∂µ Γηνρ )∂η + Γηνρ ∇µ ∂η − (∂ν Γηµρ )∂η − Γηµρ ∇ν ∂η , (3.187)
= (∂µ Γηνρ )∂η + Γηνρ Γκµη ∂κ − (∂ν Γηµρ )∂η − Γηµρ Γκνη ∂κ . (3.188)

Dal prodotto duale, otteniamo

hdxλ , R(∂µ , ∂ν , ∂ρ )i = ∂µ Γλνρ + Γηνρ Γλµη − ∂ν Γλµρ − Γηµρ Γλνη . (3.189)

Insieme a (3.184), dà (3.182).


∗ Per il tensore di torsione, abbiamo

λ
Tµν = hdxλ , T (∂µ , ∂ν )i. (3.190)

Usando di nuovo [∂µ , ∂ν ] = 0 insieme a (3.122), viene dalla definizione (3.160)

T (∂µ , ∂ν ) = ∇µ ∂ν − ∇ν ∂µ = Γρµν ∂ρ − Γρνµ ∂ρ . (3.191)

Sostituendo in (3.190), si ottiene (3.183).

Da (3.182) e (3.183) si verifica facilmente che le componenti dei tensori di Riemann e di


torsione sono anti-simmetrici nello scambio dei due ultimi indici bassi
λ λ λ λ
Rρµν = −Rρνµ , Tµν = −Tνµ . (3.192)

In particolare, la torsione associata a la connessione ∇ è nulla se e solo se le componenti della


connessione sono simmetrici nello scambio degli indici bassi, Γρµν = Γρνµ . In questo senso, la
torsione misura la parte anti-simmetrica della connessione.
††
Attenzione all’ordine degli indici bassi: nella definizione delle componenti del tensore di Riemann, viene
prima l’indice del vettore su cui agiscono le derivate covariante.
66 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Esempio V.5. Le componenti cartesiane della connessione associata al trasporto “naturale”


sul piano R2 sono tutte nulle, partendo i tensori di Riemann e di torsione corrispondente sono
nulli. Dalla legge di trasformazioni dei tensori, lo stesso vale in tutti i sistemi di coordinate.
∗ È istruttivo verificarlo esplicitamente in coordinate polari. Ricordiamo che tutte le

componenti della connessione sono nulle, trane

1
Γθrθ = Γθθr = , Γrθθ = −r. (3.193)
r

Da (3.192), sappiamo che Γλρµµ = 0, quindi dobbiamo solo calcolare

r
Rrrθ r
= −Rrθr = ∂r Γrθr − ∂θ Γrrr + Γηθr Γrrη − Γηrr Γrθη

= 0 − 0 + Γθθr Γrrθ − 0 = 0,
r
Rθrθ r
= −Rθrθ = ∂r Γrθθ − ∂θ Γrrθ + Γηθθ Γrrη − Γηrθ Γrθη

= −1 − 0 + Γrθθ Γrrr − Γθrθ Γrθθ


1
= −1 − 0 + 0 − .(−r) = 0,
r
θ
Rrθr θ
= −Rθr = ∂θ Γθrr − ∂r Γθθr + Γηrr Γθθη − Γηθr Γθrη
1 1 1
= 0 + 2 + 0 − · = 0.
r r r

Si verifica nello stesso modo che le componenti del tensore di torsione sono nulle.

V.4 Tensore di Ricci

Il tensore di Riemman avendo indici sia alti che bassi, è naturale prendere la traccia,
sommando l’indice alto con uno degli indici bassi. Si dimostrerà nel corollario II.8 del capitolo
4 che imponendo una torsione nulla (come sempre in relatività generale), la traccia sull’indice
λ
alto e il primo indice basso si annula: Rλµν = 0. Rimane la la traccia sull’indice alto e il
secondo indice basso (o il terzo: da (3.192) segue il risultato è lo stesso, almeno da un segno).

Definizione V.6. Il tensore di Ricci è il campo tensoriale di tipo (0, 2) definito da

m=dim
XM
Ric (U, V ) := hdxλ , R(∂λ , V, U )i. (3.194)
λ=1

Ha componenti
X X
Ricµν = Ric (∂µ , ∂ν ) = hdxλ , R(∂λ , ∂ν , ∂µ ) = λ
Rµλν . (3.195)
λ λ

Questo tensore avrà un ruolo importante nella scoperta delle equazioni di Einstein.
V. CURVATURA 67

V.5 Significato geometrico

Curvatura: Il tensore di Riemann misura la differenza tra il trasporto parallelo lungo due
curve distinte ma con le stesse estremità. Per mostrarlo, consideriamo quattro punti di una
varietà M di dimensione m,

p, q = p + , s = p + δ, r =p++δ (3.196)

dove p +  ha coordinate pµ + µ con pµ le coordinate di p e  = (µ ) ∈ Rm . I punti s = p + δ e


r = p +  + δ sono definiti similarmente. Trasportiamo in r un vettore X = X µ ∂µ |p di Tp M,
prima lungo la curva pqr, poi lungo la curva psr.

Figure 3.7: Il trasporto parallelo di un vettore X da p a r, lungo due curve distinti.

Proposizione V.7. La differenza tra il trasporto parallelo Vr di X in r lungo pqr, e quello


Wr lungo psr è un vettore in Tr M di componenti
µ
(Wr − Vr )µ = λ δ ν Rκλν (p) X κ . (3.197)

Proof. ∗ Sia c(t) = (1 − t)p + tq, con t ∈ [0, 1], la curva tra p = c(0) e q = c(1) con vettore
tangente ċ = ν ∂ν costante. Trasportando parallelamente X in c(t) lungo c, si definisce un
campo vettoriale V (definito su c) le cui componenti sono soluzioni di (cf (3.124))

0 = ∇ċ V = ν (∂ν V µ + Γµνκ V κ ) = 0 ∀µ = 1, ..., m, (3.198)

con condizioni iniziali Vc(0) = X. D’altra parte, per µ << 1, nel primo ordine in  abbiamo

V µ (q) = V µ (p) + ν ∂ν V µ |p . (3.199)

Ne segue che il trasporto parallelo di X in q è il vettore Vq di componenti

V µ (q) = V µ (p) − ν Γµνκ (p) V κ (p). (3.200)

Ripetiamo la procedura, trasportando Vq da q a r, lungo la curva c0 (t) = (1 − t)q + tr con


vettore tangente ċ0 = δ ν ∂ν . Similarmente a (3.200), troviamo che il trasporto Vr di Vq in r è
il vettore di componenti
V µ (r) = V µ (q) − δ ν Γµνκ (q) V κ (q). (3.201)
68 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Sostituendo V κ (q) dalla sua espressione (3.200), viene


 
V µ (r) = V µ (p) − ν Γµνκ (p) V κ (p) − δ ν Γµνκ (p) + λ ∂λ Γµνκ|p V κ (p) − η Γκηρ (p) V ρ (p) ,


= V µ (p) − ν Γµνκ (p) V κ (p) − δ ν Γµνκ (p)V κ (p) + δ ν η Γµνκ (p)Γκηρ (p) V ρ (p) − δ ν λ ∂λ Γµνκ|p V κ (p) + O(2 δ),

= V µ (p) − ν Γµνκ (p) V κ (p) − δ ν Γµνκ (p)V κ (p)


 
+ δ ν λ Γµνρ (p)Γρλκ (p) − ∂λ Γµνκ|p V κ (p) + O(2 δ), (3.202)

dove nella seconda riga sviluppiamo Γµνκ (q) = Γµνκ (p) + λ ∂λ Γµνκ |p .
Se invece si va da p a r passando dal punto s, dobbiamo considerare il trasporto parallelo
di X da p a s = p + δ, poi da s a r = s + . Si definisce cosı̀ sulla curva psr un campo
vettoriale parallelo W , con Wp = X = Vp . Le componenti del vettore Wr si calcolano come
sopra, basta semplicemente scambiare δ e  in (3.202):

W µ (r) = V µ (p) − δ ν Γµνκ (p) V κ (p) − ν Γµνκ (p)V κ (p)


 
+ δ λ ν Γµνρ (p)Γρλκ (p) − ∂λ Γµνκ|p V κ (p) + O(δ 2 ).

La differenza tra Vr e Wr , entrambi in Tr M, è il vettore di componenti


 
W µ (r) − V µ (r) = δ ν λ ∂λ Γµνκ (p) − ∂ν Γµλκ (p) + Γµλρ (p)Γρνκ (p) − Γµνρ (p)Γρλκ (p) V κ (p),
(3.203)
µ
= λ δ ν Rκλν (p) V κ (p) (3.204)

dove si usa la forma esplicita (3.182) dei componenti di R. L’equazione (3.197) segue ricor-
dandosi che Vp = X, e quindi V κ (p) = X κ .

Il tensore di Riemann associato a una connessione misura quindi la differenza nel trasporto
parallelo lungo due curve distinti, tra due punti fissi p e r. In modo equivalente, misura la
variazione di un vettore quando viene trasportato parallelamente lungo una curva chiusa
(nella teoria dei fibrati, questo è chiamato l’olonomia della connessione). Questo è coerente
con l’intuizione nata dell’esempio della sfera (cf figura 3.6).
Tuttavia non siamo ancora in grado di convincerci che il tensore di Riemann su una varietà
di dimensione 2 permette di ricuperare la curvatura di Gauss. Per questo abbiamo bisogno
di fissare una connessione particolare, che sarà possibile una volta introdotta la metrica.
Osservazione V.8. ∗ Nell’eq. (3.200) si considera solo lo sviluppo al primo ordine in ,
mentre (3.204) è uno sviluppo al secondo ordine. Per essere esatto, uno dovrebbe prendere in
conto tutti i termini al secondo ordine, cioè non solo quelli in λ δ ν ma anche quelli in λ ν
e δ λ δ ν . Il fatto è che questi termini spariscono quando si fa la differenza W µ (r) − V µ (r).
Infatti, se invece di (3.200) partiamo dallo sviluppo al secondo ordine,
1
V µ (q) = V µ (p) + ν ∂ν V µ |p + ν ρ ∂ν V µ |p ∂ρ V µ |p , (3.205)
2
otteniamo da (3.198)
1
V µ (q) = V µ (p) − ν Γµνκ (p) V κ (p) + ν ρ Γµνκ (p) Γµρλ (p) V κ (p) V λ (p). (3.206)
2
V. CURVATURA 69

Similarmente,
1
V µ (r) = V µ (q) − δ ν Γµνκ (q) V κ (q) + δ ν δ ρ Γµνκ (q) Γµρλ (q) V κ (q) V λ (q). (3.207)
2
Oltre ai termini del primo ordine in  and δ, e quelli del secondo ordine del tipo λ δ ν scritti
in (3.202), l’eq. (3.207) da un termine del secondo ordine
1 ν ρ µ 1
  Γνκ (p)Γµρλ (p) V κ (p) V λ (p) + δ ρ δ ν Γµνκ (p)Γµρλ (p) V κ (p) V λ (p). (3.208)
2 2

È simmetrico nello scambio δ ←→  e quindi sparisce nella differenza W µ (r) − V µ (r).

Torsione: ∗ L’interpretazione geometrica del tensore di torsione si ottiene paragonando


il trasporto parallelo D̃ di D := δ µ ∂µ |p da p in q, con il trasporto parallelo Ẽ di E = µ ∂µ |p
da p a s. Le componenti di D̃ e Ẽ sono

D̃µ = δ µ − ν δ κ Γµνκ (p), Ẽ µ = µ − δ ν κ Γµνκ (p), (3.209)

dove la prima equazione segue da (3.200) con V µ (p) = δ µ , e la seconda da lo scambio  ↔ δ.


Sia cD la curva che passa per q = cD (0) con vettore tangente costante uguale a D̃; e cE
la curva che passa per s = cE (0) con vettore tangente costante Ẽ. I punti rD := cD (1) e
rE := cE (1) hanno coordinate
Z 1
µ
rD = cµD (0) + D̃µ dt = q µ + δ µ − ν δ κ Γµνκ (p), (3.210)
0
Z 1
µ
rE = cµE (0) + Ẽ µ dt = sµ + µ − δ ν κ Γµνκ (p). (3.211)
0

Perciò
µ µ
rD − rE = −ν δ κ Γµνκ (p) + δ ν κ Γµνκ (p) = δ ν κ (Γµνκ (p) − Γµκν (p)) = δ ν k Tνκ
µ
. (3.212)

La torsione misura quindi la non-chiusura del parallelogramma costituito dalle curve tangente
ai due vettori E, D e ai loro trasporti paralleli.
70 CHAPTER 3. GEOMETRIA DIFFERENZIALE

VI Metrica
La costruzione dell’oggetto geometrico adeguato ad una descrizione della gravitazione
compatibile con la relatività ristretta ha iniziato dalla topologia. È stata aggiunta la strut-
tura differenziale, poi la connessione, a cui sono associati tre tensori: di Riemann, di torsione,
e di Ricci. Però, etimologicamente, geo-metria significa misurare distanza sulla Terra. Par-
lare di geometria differenziale significa essere in grado di misurare distanze su una varietà
differenziale. Questo richiede un’ulteriore - e ultima - struttura: la metrica.

VI.1 Tensore metrico

Definizione VI.1. Una metrica su una varietà differenziale M è un campo tensoriale g di


tipo (0, 2),
g(U, V ) ∈ C ∞ (M) ∀ U, V ∈ X(M); (3.213)
simmetrico,
g(U, V ) = g(V, U ) ∀ U, V ∈ X(M); (3.214)
e non degenerato: ad ogni punto p ∈ M vale

gp (Up , Vp ) = 0 ∀ Vp ∈ Tp M ⇐⇒ Up = 0. (3.215)

La metrica è detta riemanniana se ad ogni punto p ∈ M vale inoltre

gp (Up , Up ) ≥ 0 ∀ Up ∈ Tp M, (3.216)

con uguaglianza se e solo se Up = 0. Se non vale (3.216), la metrica è pseudo-riemanniana.


Una metrica riemanniana definisce uno prodotto scalare (i.e. definito positivo) su Tp M,
mentre una metrica pseudo-riemanniana definisce solo un prodotto non-degenerato.
Le componenti della metrica nelle coordinate {xµ } sono le funzioni lisce

gµν := g(∂µ , ∂ν ), (3.217)

simmetriche nello scambio degli indici

gµν = gνµ ∀µ, ν = 1, ..., m = dim M. (3.218)

Perciò, una metrica è definita da m(m+1)


2 componenti indipendenti (m sulla diagonale, più
m2 −m
2 fuori della diagonale). Come elemento di Ω1 (M) ⊗ Ω1 (M), il tensore metrico si scrive

g = gµν dxµ ⊗ dxν . (3.219)

Molto spesso il prodotto tensoriale è omesso e si scrive g = gµν dxµ dxν .


Ad ogni punto p, la matrice gp di componente gµν (p) è simmetrica, quindi diagonalizzabile
con autovalori reali e non zero (senno non vale (3.215)). Perciò gp è invertibile. Le componenti
della matrice inversa gp−1 sono denotati gpµν (la posizione degli indici basta per distinguere la
matrice dal suo inverse). Denotando g µν la funzione p → gpµν , si ottiene

gµν g νρ = δµρ , g µν gνρ = δρµ . (3.220)


VI. METRICA 71

La signatura della metrica è la coppia (i, j) dove i, j sono i numeri di autovalori positivi,
negativi di gp . Non dipende del punto p (le autovalori di gp dipendono in modo liscio di p;
visto che non si possono annullare in nessun punto, non possono cambiare segno). Modulo
un riscalamento dei vettori di base, si può limitare al caso di autovalori ±1. Se j = 0, la
metrica è riemanianna: ad ogni p esiste una base di Tp M tale che gp sia la metrica euclidea.
Se i = 1, la metrica è lorentziana e (per dim M = 4) esiste una base di Tp M tale che gp sia
la metrica di Lorentz (2.51). Altrimenti gp è diagonale con i coefficienti 1 e j coefficienti −1.
Nel caso lorentziano, un vettore Up ∈ Tp M è di tipo tempo, luce, spazio se gp (Up , Up ) >
0, = 0, < 0. La pseudo-norma di un vettore di tipo tempo è definito come per i quadri-vettori,
q
||Up || := gp (Up , Up ). (3.221)
Un campo vettoriale U è di tipo tempo/luce/spazio se Up è tempo/luce/spazio ad ogni p.
In una varietà riemanniana, la lunghezza di una curva tra c(t0 ) e c(t1 ) è definita come‡‡
Z t1 q
L(c(t0 ), c(t1 )) = gc(t) (ċ(t), ċ(t)) dt. (3.222)
t0

La stessa definizione vale nel caso lorentziano per una curva di tipo tempo (cioè tale che il
vettore tangente sia di tipo tempo ad ogni punto), e per una curva di tipo spazio (modulo un
segno - sotto la radice). Una curva di tipo luce a lunghezza zero. Per una curva il cui vettore
tangente non è sempre dello stesso tipo, la lunghezza non è definita.
Osservazione VI.2. Tipo e lunghezza di una curva non dipendono della parametrizzazione:
più precisamente, data una curva c(t) con t ∈ I ⊂ R, qualunque mappa liscia φ : I → R
tale che φ0 (t) non si annuli mai definisce una parametrizzazione s → c(φ−1 (s)) con s ∈ φ(I)
(essendo strettamente monotona, φ è invertibile). Il vettore tangente alla curva nella seconda
parametrizzazione,
d dφ−1
c ◦ φ−1 (s) = ċ(φ−1 (s))

c̃(s) := , (3.223)
ds ds |s
è dello stesso tipo di ct per t = φ−1 (s) perché
 dφ−1 2

−1 −1

gc(φ−1 (s)) (c̃(s), c̃(s)) = gc(φ−1 (s)) ċ φ (s) , ċ φ (s) . (3.224)
ds |s
Il cambiamento di variabile t → s = φ(t) in (3.222) dà
s −1 −2
Z s1 :=φ(t1 ) −1
dφ dφ
L(c(t0 ), c(t1 )) = gc(φ−1 (s)) (c̃(s), c̃(s))
ds |s ds,

s :=φ(t ) ds | s

Z 0s1 q 0
= gc(s) (c̃(s), c̃(s))ds = L(c(s0 ), c(s1 )).
s0

Esempio VI.3. ∗ La metrica euclidea del piano R2 è gµν = δµν . Il vettore tangente alla
retta (x = t, y = at + b), a, b ∈ R, ha coordinate ẋ(t) = 1, ẏ(t) = a. La lunghezza della retta
tra i punti x0 = (t0 , at0 + b) e x1 = (t1 , at1 + b) è
Z t1 p p p
1 + a2 dt = 1 + a2 (t1 − t0 ) = (t1 − t0 )2 + a2 (t1 − t0 )2 = dEuc (x0 , x1 ).
t0

La definizione (3.222) appare quindi come una generalizzazione della lunghezza euclidea.
‡‡
Scriviamo ċ(t) = ċµ (t)∂µ |t in Tc(t) M il vettore tangente a c in c(t).
72 CHAPTER 3. GEOMETRIA DIFFERENZIALE

VI.2 Isomorfismo musicale

Nello stesso modo che un tensore di tipo (1, s) può essere visto come una mappa da
X (M)s → X (M), la metrica definisce due mappe
[ : X(M) → Ω1 (M) ]: Ω1 (M) → X(M)
V 7→ V [ t.c. hV [ , U i := g(V, U ) ω 7→ ω ] t.c. hω, U i =: g(ω ] , U ).

Dato V = V µ ∂µ , scriviamo Vµ le componenti del campo di 1-forma V [ . Similarmente,


dato ω = ωµ dxµ , scriviamo ω µ le componenti del campo vettoriale ω ] (le mappe [, ] abbas-
sano/alzano le indici, nello stesso modo che in musica [, ] abbassano la nota di mezzo-tono).
Proposizione VI.4. Uno ha Vµ := gµν V ν , ω µ := g µν ων .
Proof. Abbiamo
Vµ = hV [ , ∂µ i = g(V, ∂µ ) = g(V ν ∂ν , ∂µ ) = V ν g(∂ν , ∂µ ) = gνµ V ν . (3.225)
Il risultato segue da (3.218). Per calcolare le componenti ω µ del vettore ω ] , si nota che da
una parte hω, ∂ν i = ων , d’altra parte g(ω ] , ∂ν ) = g(ω ρ ∂ρ , ∂ν ) = gρν ω ρ . Dalla definizione di ],
segue ων = gρν ω ρ . Moltiplicando da g µν , poi sommando su ν otteniamo da (3.220):
g µν ων = g µν gρν ω ρ = δρµ ω ρ = ω µ .
Le mappe musicale sono inverse una dall’altra, definendo cosı̀ un isomorfismo tra X(M)
e Ω1 (M).Di fatti, si verifica che il vettore W = (V [ )] abbia componenti
W µ = g µν Vν = g µν gνρ V ρ = δρµ V ρ = V µ , (3.226)

cioè (V [ )] = V . Similarmente, (ω ] )[ = ω.

VI.3 Derivata covariante di un tensore

La derivata covariante di un campo vettoriale, definita nella sezione IV.2, si estende a


campi tensoriali di qualunque tipo grazie alla regola di Leibniz. Ad esempio, la derivata
covariante ∇U ω di un campo di 1-forme ω ∈ Ω1 (M), lungo un campo vettoriale U ∈ X(M),
è definita in tale modo che valga
∇U (hω, V i) = h∇U ω, V i + hω, ∇U V i. (3.227)
In altre parole, si definisce ∇W U tramite la sua azione sui campi vettoriali
h∇U ω, V i := U [hω, V i] − hω, ∇U V i ∀U ∈ X (M). (3.228)
Proposition VI.5. h∇U ω, .i è un campo di 1-forma.
Proof. ∗ Il membro di destra (3.228) è in C ∞ (M), dunque ∇U ω è una mappa X(M) → C ∞ (M).
È una 1-forma se e solo se è lineare. La linearità rispetto alla somma è ovvia. Quella rispetto
al prodotto per f ∈ C ∞ (M) si verifica esplicitamente:
h∇U ω, f V i = U [hω, f V i] − hω, ∇U f V i,
= U [f hω, V i] − hω, U [f ]V + f ∇U V i,
= U [f ]hω, V i + f U [hω, V i] − U [f ]hω, V i − f hω, ∇U V i,
= f U [hω, V i] − f hω, ∇U V i = f h∇U ω, V i.
VI. METRICA 73

Le componenti di ∇U ω in una carta {xµ } si calcolano senza difficoltà.

Proposizione VI.6. Sia ω = ωµ dxµ e U = U µ ∂µ . Allora ∇U ω è la 1-forma di componenti


 
(∇U ω)ν = U µ ∂µ ων − Γλµν ωλ . (3.229)

Proof. Scrivendo in componenti entrambi membri di (3.228) per V = ∂ν , usando (3.124)


viene
(∇U ω)ν = U µ ∂µ ων − ωλ (∇U ∂ν )λ = U µ ∂µ ων − ωλ U µ Γλµν .

Si nota il segno − davanti a Γλµν . In particolare (paragonare con (3.122)):

∇µ dxν = −Γνµλ dxλ . (3.230)

La derivata covariante del tensore metrico (o di qualsiasi campo tensoriale di tipo (0, 2))
si definisce in modo analogo: ∇W g è tale che per ogni U, V valga la regola di Leibniz

∇W (g(U, V )) = (∇W g)(U, V ) + g(∇W U, V ) + g(U, ∇W V ). (3.231)

Dunque ∇W g è definito dalla sua azione su X (M) × X (M)

(∇W g)(U, V ) := W [g(U, V )] − g(∇W U, V ) − g(U, ∇W V ). (3.232)

Proposizione VI.7. ∇W g è un campo tensoriale di tipo (0, 2).

Proof. ∗ Si verifica senza difficoltà che il membro di destra di (3.232) è in C ∞ (M), quindi
∇W g è una mappa X (M) × X (M) → C ∞ (M), come aspettato. La bi-linearità in U e V
rispetto alla somma non è un problema. Tocca verificare la linerarità rispetto al prodotto da
una funzione. Lo facciamo per U , la linearità in V si dimostra nello stesso modo: per ogni
U, V ∈ X(M) e f ∈ C ∞ (M) abbiamo

(∇W g)(f U, V ) = W [g(f U, V )] − g(∇W f U, V ) − g(f U, ∇W V ),


= W [f g(U, V )] − g(W [f ]U + f ∇W U, V ) − f g(U, ∇W V ),
= W [f ]g(U, V ) + f W [g(U, V )] − W [f ]g(U, V ) − f g(∇W U, V ) − f g(U, ∇W V ),
= f (W [g(U, V )] − g(∇W U, V ) − g(U, ∇W V )) ,
= f (∇W g)(U, V ).

Inoltre, la mappa W 7→ ∇W g è lineare in W (si verifica con un calcolo esplicito che il


membro di destra di (3.232) è lineare in W ). Significa che il tensore ∇W g è completamente
determinato dai componenti di ∇ν g, cioè da

(∇ν g)λµ := (∇ν g)(∂λ , ∂µ ). (3.233)

Questi componenti si calcono senza difficoltà dalla definizione (3.232):

(∇ν g)(∂λ , ∂µ ) = ∂ν gλµ − g(∇ν ∂λ , ∂µ ) − g(∂λ , ∇ν ∂µ ), (3.234)


= ∂ν gλµ − g(Γρνλ ∂ρ , ∂µ ) − g(∂λ , Γρνµ ∂ρ ) = ∂ν gλµ − Γρνλ gρµ − Γρνµ gλρ . (3.235)
74 CHAPTER 3. GEOMETRIA DIFFERENZIALE

VI.4 Teorema di Levi-Civita

Oltre a definire un prodotto interno su X(M ) e un isomorfismo tra X(M) e Ω1 (M), la


metrica serve a individuare una classa di connessione. Una connessione è compatibile con
la metrica (o semplicemente è una connesione metrica) se la derivata covariante ∇W g del
tensore metrico lungo qualunque direzione W è nulla. Da (3.231), significa che
W (g(U, V )) = g(∇W U, V ) + g(U, ∇W V ) ∀ U, V, W ∈ X(M). (3.236)
Questo implica che il prodotto interno gp (Up , Vp ) tra due qualunque vettori Up , Vp ∈ Tp M sia
invariante per trasporto parallelo lungo qualunque direzione W : trasportando parallelamente
Up e Vp lungo la curva integrale di W in p, si costruiscono due campi vettoriali (definiti lungo
la curva integrale) tale che ∇W U = ∇W V = 0. Allora (3.236) garantisce che W (g(U, V )) = 0,
cioè il prodotto interno tra U e V è costante lungo la curva integrale di W . In particolare, la
norma di un vettore è conservata per trasporto parallelo.
Il teorema di Levi-Civita, teorema fondamentale della geometria (pseudo)-riemanniana
garantisce che se il tensore di torsione è nullo, allora esiste un’unica connessione metrica.
Teorema VI.8. Su una varietà M munita di una metrica (pseudo)-riemanniana, esiste un
unica connessione metrica di torsione nulla. Ha componenti
1
Γρλµ = g ρν (∂λ gµν + ∂µ gνλ − ∂ν gλµ ) , (3.237)
2
simmetriche nello scambio degli indici bassi: Γρµν = Γρνµ .
Proof. L’annullamento del campo tensoriale ∇W g per qualunque W significa che per tutti
µ, ν, λ, uno ha (∇ν g)λµ = 0. Per (3.235), è equivalente a
∂ν gλµ − Γρνλ gρµ − Γρνµ gλρ = 0. (3.238)
Permutazioni cicliche di νλµ danno
∂λ gµν − Γρλµ gρν − Γρλν gµρ = 0, (3.239)
∂µ gνλ − Γρµν gρλ − Γρµλ gνρ = 0, (3.240)
Facendo - (3.238) + (3.239) + (3.240) si ottiene, usando la simmetria della metrica gµν = gνµ ,
 
0 = −∂ν gλµ + ∂λ gµν + ∂µ gνλ − gρν Γρλµ + Γρµλ + gρµ Γρνλ − Γρλν + gλρ Γρνµ − Γρµν .
 

L’annullamento della torsione implica che i coefficienti della connessione siamo simmetrici
nello scambio dei due indici bassi (cf (3.183)). L’equazione sopra si riduce a
∂ν gλµ − ∂λ gµν − ∂µ gνλ + 2gρν Γρλµ = 0, (3.241)
la cui unica soluzione è (3.237).

Il termine di destra dell’equazione (3.237) è chiamato simbolo di Christoffel della metrica:


 
ρ 1
:= g ρλ (∂µ gνλ + ∂ν gµλ − ∂λ gµν ) . (3.242)
µν 2
È notevole che la connessione di Levi-Civita sia completamente determinata dalla metrica.
Significa che, assumendo la torsione nulla e la compatibilità con la metrica (cosa che faremmo
sempre in relatività generale), allora la metrica determina la curvatura dello spazio-tempo.
VI. METRICA 75

Esempio VI.9. Il tensore metrico del piano euclideo R2 è, in coordinate cartesiani,
g = dx ⊗ dx + dy ⊗ dy. (3.243)
Ha componenti gµν = δµν costanti, perciò tutti i simboli di Christoffel sono nulli: la con-
nessione di Levi-Civita del piano euclideo è quella con componenti cartesiane tutte nulle,
cioè la connessione “naturale” (3.132). Si verifica da (3.111) che questo p trasporto parallelo
preserva la norma dei vettori: in qualunque punto p, abbiamo ||∂x |p || = gxx (p) = 1, dunque
∂˜x |p0 = ∂x |p ha norma 1, come ∂x |p0 . Lo stesso vale per ∂y , e per qualunque vettore.
Esempio VI.10. L’espressione della metrica euclidea in coordinate polari si deduce da
∂x ∂x ∂y ∂y
dx = dr + dθ = cos θdr − r sin θdθ, dy = dr + dθ = sin θdr + r cos θdθ,
∂r ∂θ ∂r ∂θ
che dà
dx ⊗ dx + dy ⊗ dy = cos2 θ dr ⊗ dr + r2 sin2 θ dθ ⊗ dθ − (r cos θ sin θ)(dr ⊗ dθ + dθ ⊗ dr)
+ sin2 θ dr ⊗ dr + r2 cos2 θ dθ ⊗ dθ + (r cos θ sin θ)(dr ⊗ dθ + dθ ⊗ dr)
= dr ⊗ dr + r2 dθ ⊗ dθ. (3.244)
Le componenti polari della metrica euclidea sono quindi
grr = 1, gθθ = r2 , grθ = gθr = 0. (3.245)
Quelle della matrice inversa sono g rr = 1, g θθ = r12 , g rθ = g θr = 0. Da (3.242) si calcola che
     
r θ θ 1
= −r , = = (3.246)
θθ θr rθ r
sono gli unici simboli di Christoffel non nulli, in accordo con (3.137) e (3.142).
Osservazione VI.11. Dall’unicità della connessione di Levi-Civita, è chiaro che il trasporto
parallelo “naturale inpcoordinate polari” discusso in (3.112) non p è compatibile con la metrica
euclidea: ||∂θ|p0 || = gθθ (p0 ) = r0 mentre ||∂˜θ|p0 || = ||∂θ|p || = gθθ (p) = r.

VI.5 Identità di Bianchi

Il tensore di Riemann associato a la connessione di Levi-Civita soddisfa la prima idendità


di Bianchi :
λ λ λ
Rρµν + Rµνρ + Rνρµ = 0. (3.247)
Si verifica sommando le permutazioni circolari su gli indici bassi di (3.182) (sfruttendo la
simmetria dei coefficienti di connessione sotto lo scambio degli indici bassi):
λ
Rρµν = ∂µ Γλνρ − ∂ν Γλµρ + Γηνρ Γλµη − Γηµρ Γλνη , (3.248)
λ
Rµνρ = ∂ν Γλρµ − ∂ρ Γλνµ + Γηρµ Γλνη − Γηνµ Γλρη , (3.249)
λ
Rνρµ = ∂ρ Γλµν − ∂µ Γλρν + Γηµν Γλρη − Γηρν Γλµη . (3.250)
Esiste una seconda identità di Bianchi, soddisfatta dalla derivata covariante del tensore di
Riemann. Quest’ultima è definita tramite la regola di Leibniz, in modo analogo alla derivata
del tensore metrico in (3.232).
76 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Definizione VI.12. La derivata covariante del tensore di Riemann lungo il campo vettoriale
Z è il campo tensoriale di tipo (1, 3)†

∇Z R : X(M) ⊗ X(M ) ⊗ X(M) −→ X(M)


X, Y, V 7→ ∇Z (R(X, Y, V )) − R(∇Z X, Y, V ) − R(X, ∇Z Y, V ) − R(X, Y, ∇Z V ).

Proposition VI.13. La derivata covariante del tensore di Riemann (definito dalla connes-
sione di Levi-Cività) soddisfa la seconda idendità di Bianchi

(∇Z R)(X, Y, V ) + (∇X R)(Y, Z, V ) + (∇Y R)(Z, X, V ) = 0 ∀X, Y, Z, V ∈ X(M). (3.251)

Proof. Per ipotesi, il tensore di torsione è nullo. Per qualunque X, Y, Z, V ∈ X(M), abbiamo

0 = R (T (X, Y ) , Z, V ) = R(∇X Y, Z, V ) − R(∇Y X, Z, V ) − R([X, Y ], Z, V ), (3.252)


= R(∇X Y, Z, V ) + R(Z, ∇Y X, V ) − R([X, Y ], Z, V ), (3.253)

dove utilizziamo la definizione (3.160) della torsione, poi R(∇Y X, Z, V ) = −R(Z, ∇Y X, V )


che segue della definizione (3.159). Sommando sulle permutazioni circolari in X, Y, Z, viene

0 = S {R(∇X Y, Z, V )} + S {R(Z, ∇Y X, V )} − S {R([X, Y ], Z, V )} (3.254)


= S {R(∇Z X, Y, V )} + S {R(X, ∇Z Y, V )} − S {R([X, Y ], Z, V )} (3.255)
= S {R(∇Z X, Y, V ) + R(X, ∇Z Y, V ) − R([X, Y ], Z, V )} . (3.256)

dove S è il simmetrizzatore, definito per qualunque funzione f di X, Y, Z come

S {f (X, Y, Z)} := f (X, Y, Z) + f (Y, Z, X) + f (Z, X, Y ). (3.257)

Per ottenere (3.254) si usa la linearità di S per la somma,

S {f (X, Y, Z) + g(X, Y, Z)} = S {f (X, Y, Z)} + S {g(X, Y, Z)} ; (3.258)

eq. (3.255) segue dell’invarianza per permutazioni circolari S {f (X, Y, Z)} = S {f (Z, X, Y )}
e S {f (Z, Y, X)} = S {f (X, Z, Y )}; poi (3.256) scende di nuovo della linearità.
Sostituendo i due primi termini di (3.256) da ∇Z (R(X, Y, V ))−R(X, Y, ∇Z V )−(∇Z R)(X, Y, V )
grazie alla definizione VI.12, viene

S {∇Z (R(X, Y, V )) − R(X, Y, ∇Z V ) − R([X, Y ], Z, V )}−S {(∇Z R)(X, Y, V )} = 0. (3.259)

Scrivendo esplicitamente R(X, Y, V ) = ([∇X , ∇Y ] − ∇[X,Y ] )V , viene

∇Z (R(X, Y, V ))−R(X, Y, ∇Z V )−R([X, Y ], Z, V )



= ∇Z [∇X , ∇Y ] − ∇Z ∇[X,Y ] − [∇X , ∇Y ]∇Z + ∇[X,Y ] ∇Z − [∇[X,Y ] , ∇Z ] + ∇[[X,Y ],Z] V,

= [∇Z , [∇X , ∇Y ]] + ∇[[X,Y ],Z] V. (3.260)

Il simmetrizzatore applicato su quest’espressione dà 0 per via dell’indentità di Jacobi (3.47),


soddisfata sia da X, Y, Z che da ∇X , ∇Y , ∇Z . Perciò (3.259) si riduce a

S {(∇Z R)(X, Y, V )} = 0, (3.261)

che non è altro che la seconda identità di Bianchi (3.251).



Si dimostra che ∇Z R è multilineare in modo similare alla proposizione VI.7.
VI. METRICA 77

VI.6 Curvatura scalare

La metrica permette di contrattare i due indici del tensore di Ricci, definito in §V.4. Si
definisce la curvatura scalare R come la traccia (rispetto alla metrica) del tensore di Ricci

R := g µν Ricµν . (3.262)

Esempio VI.14. Dal cancellamento delle componenti della connessione di Levi-Civita in


coordinate cartesiani nel piano R2 , segue che il tensore di Riemann è nullo, e quindi sono
anche nulli il tensore di Ricci e la curvatura scalare.
Per concludere questo capitolo di geometria differenziale, e imparare a utilizzare i vari
strumenti introdotti finora, calcoliamo la curvatura scalare della sfera S 2 . Le coordinate
sferiche sono date da

x = r cos θ cos ϕ, y = r cos θ sin ϕ, z = r sin θ (3.263)

dove θ e ϕ sono gli angoli di Euler. Le 1-forme dx, dy, dz in coordinate sferiche sono
∂x ∂x ∂x
dx = dr + dθ + dϕ = cos θ cos ϕ dr − r sin θ cos ϕ dθ − r cos θ sin ϕ dϕ , (3.264)
∂r ∂θ ∂ϕ
∂y ∂y ∂y
dy = dr + dθ + dϕ = cos θ sin ϕ dr − r sin θ sin ϕ dθ + r cos θ cos ϕ dϕ , (3.265)
∂r ∂θ ∂ϕ
∂z ∂z ∂z
dz = dr + dθ + dϕ = sin θ dr + r cos θ dθ, (3.266)
∂r ∂θ ∂ϕ
da cui si deduce

dx ⊗ dx = (cos θ cos ϕ)2 dr ⊗ dr + (r sin θ cos ϕ)2 dθ ⊗ dθ + (r cos θ sin ϕ)2 dϕ ⊗ dϕ


− r sin θ cos θ cos2 ϕ(dr ⊗ dθ + dθ ⊗ dr) − r cos2 θ cos ϕ sin ϕ (dr ⊗ dϕ + dϕ ⊗ dr)
+ r2 sin θ cos θ sin ϕ cos ϕ (dθ ⊗ dϕ + dϕ ⊗ dθ);
dy ⊗ dy = (cos θ sin ϕ)2 dr ⊗ dr + (r sin θ sin ϕ)2 dθ ⊗ dθ + (r cos θ cos ϕ)2 dϕ ⊗ dϕ
− r sin θ cos θ sin2 ϕ(dr ⊗ dθ + dθ ⊗ dr) + r cos2 θ cos ϕ sin ϕ (dr ⊗ dϕ + dϕ ⊗ dr)
− r2 sin θ cos θ sin ϕ cos ϕ (dθ ⊗ dϕ + dϕ ⊗ dθ);
dz ⊗ dz = sin2 θ dr ⊗ dr + (r cos θ)2 dθ ⊗ dθ + r sin θ cos θ(dr ⊗ dθ + dθ ⊗ dr).

Sommando, viene

dx ⊗ dx + dy ⊗ dy + dz ⊗ dz = dr ⊗ dr + r2 dθ ⊗ dθ + r2 cos2 θ dϕ ⊗ dϕ. (3.267)

Perciò la metrica indotta sulla sfera dalla metrica euclidea di R3 ha componenti, in coordinate
sferiche (∂θ , ∂ϕ ),
gθθ = R2 , gϕϕ = R2 cos2 θ, gϕθ = gθϕ = 0. (3.268)
Calcolando i simboli di Christoffel (3.242), si trova

Γθθθ = Γθϕθ = Γθθϕ = 0, Γθϕϕ = sin θ cos θ, (3.269)


Γϕ
ϕϕ = Γϕ
θθ = 0, Γϕ
θϕ = Γϕ
ϕθ = − tan θ. (3.270)
78 CHAPTER 3. GEOMETRIA DIFFERENZIALE

Per quanto riguarda le componenti del tensore di Riemann, da (3.192) sappiamo che quelli
con i due ultimi indici bassi identici sono zero. Il calcolo esplicito degli altri, usando (3.182),
dà
ϕ ϕ ϕ ϕ
Rϕϕθ = −Rϕθϕ = 0, Rθϕθ = −Rθθϕ =1 (3.271)
θ θ θ θ
Rϕθϕ = −Rϕϕθ = cos2 θ, Rθθϕ = −Rθϕθ = 0. (3.272)

Le componenti non-nulle del tensore di Ricci sono


X X
λ λ
Ricθθ = Rθλθ = 1, Ricϕϕ = Rϕλϕ = cos2 θ. (3.273)
λ=θ,ϕ λ=θ,ϕ

La curvatura scalare è
1 1 2
R = g θθ Ricθθ + g ϕϕ Ricϕϕ = 2
+ 2 2
cos2 θ = 2 . (3.274)
R R cos θ R
1
La curvatura scalare di Riemann è due volte la curvatura di Gauss K = R2
. Questo vale per
qualunque superficie bidimensionale.
Chapter 4

Fondamenti della relatività generale

La geometria differenziale studiata nel capitolo precedente fornisce gli strumenti matem-
atici per dare una forma precisa al principio di relatività generale discusso nell’ ”interludio”.
In accordo col principio di equivalenza, la prima asserzione della relatività generale con-
siste a descrivere lo spazio-tempo come varietà lorentziana di dimensione 4, cioè una varietà
differenziale M munita di una metrica pseudo-riemanniana g di signatura∗ (+−−−). Questo
dà un senso matematico all’idea che l’effetto della gravitazione si possa annulare, lavorando
in un sistema di coordinate in cui (M, g) rassomigli localmente allo spazio-tempo della rel-
atività ristretta, i.e. lo spazio di Minkowski. Tale coordinate esistono sempre (cf. §VI.1 del
capitolo 3). Un modo di costruirle esplicitamente sarà investigato nella sezione I.5.
La seconda asserzione è che gli effetti della gravitazione sono effetti geometrici, dovuti alla
curvatura della connessione di Levi-Civita associata alla metrica g. Si sceglie la curvatura
come grandezza significativa, perchè la differenza tra lo spazio di Minkowski (cioè l’assenza
di gravità), e una qualsiasi varietà lorentziana è precisamente che lo spazio di Minkowski è
piatto: le componenti cartesiani della metrica di Lorentz η sono costanti,
η00 = 1, ηii = −1 ∀i = 1, 2, 3, ηµν = 0 ∀µ 6= ν, (4.1)
quindi le componenti della connessione di Levi-Civita sono zero, ne segue che i tensori di
Riemann, di Ricci e la curvatura scalare R sono nulli. Questo non dipende del sistema di
coordinate (in virtù di (3.89), se un tensore ha tutte le sue componenti nulle in un sistema di
coordinate, lo stesso vale in altre coordinate), perciò. la piattezza dello spazio di Minkowski
caratterizza in modo intrinseco l’assenza di gravitazione.
La scelta della connessione di Levi-Civita è motivata dalla richiesta naturale che la norma
di un vettore sia conservata per trasporto parallello (compatibilità con la metrica); e dalla
semplicità (torsione nulla). Esistono variazioni della relatività generale che considerano con-
nessioni con torsione, come la teoria di Einsten-Cartan. Non le studieremo qui.
Le due domande a cui si devono rispondere per dare senso a queste asserzioni sono:
• qual’è il moto di un corpo in un spazio-tempo curvo ?
• qual’è la legge che lega la curvatura alla gravitazione ?
Iniziamo con la prima domanda. La risposta alla seconda sono le equazioni di Einstein,
studiate nella sezione II del presente capitolo.

Secondo l’ambito (matematica, cosmologia, astroparticelle), una scelta equivalente è (−, + + +).

79
80 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

I Moto nel campo gravitazionale


I.1 Geodetiche come traiettoria di caduta libera

La risposta alla prima domanda è il seguente principio: la traiettoria nello spazio-tempo


(M, g) di un corpo (puntiforme) in caduta libera è una geodetica per la connessione di Levi-
Civita associata a g, di tipo tempo per un corpo massivo, di tipo luce per un raggio di luce.
Questo principio è motivato dal caso piatto. In assenza di gravitazione, “caduta libera”
significa non essere sottomesso a nessun forza, cioè essere in moto rettilineo uniforme. Tale
traiettorie sono proprio le geodetiche dello spazio di Minkowski: l’annullamento delle compo-
nenti cartesiani della connessione di Levi-Civita produce le equazioni geodetiche ẍµ = 0, ∀µ =
0, 1, 2, 3, le cui soluzioni sono le rete†
µ µ
xµ (t) = aµ t + a0 con aµ , a0 costanti. (4.2)

Una geodetica di tipo tempo è tale che η(ẋ, ẋ) = (a0 )2 − (a1 )2 − (a2 )2 − (a3 )2 > 0, il cui
implica a0 6= 0, e permette di riscrivere (4.2) come

ai
 
i
x = x0 + α0i con α0i dei costanti, ∀i = 1, 2, 3. (4.3)
a0

Identificando xc0 alla coordinata temporale dello spazio di Minkowski, (4.3) è la traiettoria di
dxi ai
un corpo in moto rettilineo uniforme, con velocità v i = c dx0 = c a0 costante.

In seguito, secondo il principio di equivalenza, si può sempre descrivere localmente una


caduta libera come una traiettoria rettilinea uniforme, cioè localmente una geodetica. Ma
una curva che è localmente geodetica ad ogni dei suoi punti è globalemente geodetica. Ne
segue il principio di sopra.

Osservazione I.1. Si nota che nello spazio di Minkowski, l’identificazione delle geodetiche
alle traiettorie rettilinee uniforme non dipende dalla scelta delle coordinate: ad esempio, se la
parte spaziale della metrica di Lorentz è scritta in coordinate sferica, non tutte le componenti
della connessioni sono nulle e l’equazione delle geodetiche non è semplice come (4.2). Però,
le soluzioni sono le stesse rete (4.3), ma scritte in coordinate sferiche (in modo analogo a
quello che succede per le geodetiche nel piano scritte in coordinate polari in (3.143)). Lo
stesso vale nello spazio-tempo (M, g): una geodetica c è caratterizzata dall’equazione

∇ċ ċ = 0, (4.4)

independentemente delle coordinate (se il campo vettoriale ∇ċ ċ è nullo in un sistema di co-
ordinate, lo è in qualunque).

Si potrebbe obiettare che l’eq.(4.4) non è intrinseca perchè dipende della parametriz-
zazione della curva. Dimostriamo nella seguente proposizione un’equazione delle geode-
tiche“generalizzata”, valida per qualunque parametrizzazione. Tuttavia, si mostra anche
che per ogni geodetica, esiste sempre una parametrizzazione tale che valga (4.4).

Qui t è il parametro della curva, non la coordinata temporale dello spazio di Minkowski.
I. MOTO NEL CAMPO GRAVITAZIONALE 81

Proposizione I.2. Sia c una geodetica con un parametro t che soddisfa (4.4). Sia t̃ = t̃(t)
un altra parametrizzazione di c, con vettore tangente c̃. Allora

∇c̃ c̃ = f c̃ (4.5)

con f una funzione di t̃. Inversamente, data una geodetica parametrizzata da t̃ che soddisfa
(4.5) con f liscia, allora esiste sempre un parametro t tale che valga (4.4).

Proof. Uno ha
d dt d dt
= c̃ == ċ. (4.6)
dt̃ dt̃ dt dt̃
Le proprietà della derivata covariante danno
     
dt dt dt dt dt
∇c̃ c̃ = ∇ċ ċ = ∇ċ ċ + ċ . ċ . (4.7)
dt̃ dt̃ dt̃ dt̃ dt̃
h i h i
La condizione (4.4) insieme a (4.6) danno ∇c̃ c̃ = ċ dt
dt̃
c̃, cioè l’equazione (4.5) con f = ċ dt
dt̃
.
Inversamente, si considera una curva c(t̃) che soddisfa (4.5) per una certa funzione f (t̃)
liscia. Qualunque funzione t(t̃) strettamente monotona in t (i.e. tale che t0 = ddtt̃ non si annuli
mai), definisce una parametrizzazione c(t) della stessa curva. Lo stesso calcolo (4.7) dà
2  2
d2 t
  
dt dt dt dt
f c̃ = ∇c̃ c̃ = ∇ċ ċ + ċ . ċ = ∇ċ ċ + 2 . ċ . (4.8)
dt̃ dt̃ dt̃ dt̃ dt̃

Quindi
−2    −2 
d2 t dt d2 t
 
dt dt
∇ċ ċ = f c̃ − 2 . ċ = f − 2 . ċ (4.9)
dt̃ dt̃ dt̃ dt̃ dt̃
è zero dal momento che la funzione t(t̃) è soluzione di t00 −f t0 = 0. Per f liscia, quest’equazione
ha sempre una soluzione (localmente), tale che t0 non si annuli mai.

Esempio I.3. * Sia una geodetica c(t) dove t è un parametro affine (cf definizione qui sotto).
Un esempio di parametro non-affine è t̃(t) = argsinh t (è una buona parametrizzazione perchè
la funzione t̃ è monotona e invertibile). Scrivendo t = sinh t̃, l’eq. (4.5) viene verificata con
 
d dt d   d hp i t
f= = cosh t̃ = 1 + t2 = √ = tanh t̃, (4.10)
dt dt̃ dt dt 1 + t2
p √
dove si usa cosh t̃ = 1 + sinh2 t̃ = 1 + t2 .

Un parametro t di una geodetica tale che valga (4.4) è chiamato parametro affine. La
proposizione I.2 mostra che per qualunque geodetica, esiste almeno una parametrizzazione
affine. In pratica si considererà sempre (4.4) come equazione delle geodetiche, senza preoc-
cuparsi di (4.5).
Inoltre, l’eq. (4.4) indica che in qualunque parametrizzazione affine, il vettore tangente
ċ è trasportato parallelamente lungo la geodetica, quindi ha norma costante (conseguenza
della compatibilità della connessione di Levi-Civita con la metrica). In particolare ċ non può
cambiare tipo (tempo, spazio, luce). Perciò una geodetica è sempre una curva di tipo definito.
82 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

I.2 Tempo proprio e quadri-velocità

Un corpo massivo in caduta libera segue in (M, g) una geodetica di tipo tempo. Un corpo
massivo sottoposto a forze segue una curva (non geodetica) di tipo tempo. In entrambi casi
(geodetica o no), denotiamo
Z tq
s(t) = gc(u) (ċ(u), ċ(u)) du (4.11)
0

la lunghezza (3.222) della curva di tipo tempo c tra il punto c(0) e il punto c(t). Questa
lunghezza non dipende della scelta delle coordinate. In particolare, nelle coordinate locale in
cui lo spazio-tempo rassomiglia allo spazio di Minkowski‡ , sc è il tempo proprio misurato da
un orologio comovente. Concatenando tutti questi pezzi locale, viene che
s
τ := (4.12)
c
valutato in t è il valore indicata in c(t) da un orologio comovente, messa a zero in c(0). In
altre parole, τ è il tempo proprio lungo tutta la curva. Questa definizione è intrinseca alla
curva e non dipende della sua parametrizzazione (cf l’osservazione VI.2).
Per definizione di curva di tipo tempo, ||ċ|| non è mai nullo, dunque la funzione s(t) (e
il tempo proprio τ (t)) sono strettamente crescenti e possono servire di parametro. Il vettore
tangente a c(τ ),
d d
=c , (4.13)
dτ ds
è la quadrivelocità dell’osservatore la cui traiettoria è la curva c. È un ovvio corollario del
seguente lemma che ha norma costante uguale a c, come in relatività ristretta (cf (2.78)).

Lemma I.4. La norma del vettore c0 , tangente ad un curva di tipo tempo parametrizzata
dalla sua lunghezza s, è 1 lungo tutta la curva.
ds 0
Proof. Sia t una altra parametrizzazione, con vettore tangente ċ. Uno ha ċ = dt c . Da (4.11)
segue
ds q
= gc(t) (ċ(t), ċ(t)) = ||ċ(t)||. (4.14)
dt |t
Perciò ċ = ||ċ|| c0 . Quindi ||ċ|| = k||c||
˙ c0 k = ||c||
˙ ||c0 ||, da cui segue ||c0 || = 1.

Lo stesso risultato vale per una curva di tipo spazio (modulo il segno sotto la radice). Per
una curva di tipo luce, il vettore tangente ha norma costante, ma uguale a zero.

Proposizione I.5. Il tempo proprio lungo una geodetica di tipo tempo è un parametro affine.

Proof. Sia c(t) una geodetica con t un parametro affine (esiste sempre secondo Prop. I.2).
Sia τ il tempo proprio e c̃ il vettore tangente a c(τ ). Siccome t è affine, ċ è trasportato
parallelamente lungo c, quindi la sua norma è costante. Insieme a (4.14), questo indica che
dτ 1 ds dt dt
dt = c dt è costante lungo la curva. Lo stesso vale per dτ , quindi ċ[ dτ ] = 0. L’eq. (4.7) (con
τ invece di t̃) insieme a (4.4) dà ∇c̃ c̃ = 0. Cioè τ è un parametro affine.

Attento: in quest equazione c è la velocità della luce, non la curva !
I. MOTO NEL CAMPO GRAVITAZIONALE 83

I.3 Geodetiche come curve di lunghezza estremale

Oltre ad essere le traiettorie seguite dai corpi in caduta libera, le geodetiche hanno una
notevole caratteristica: sono le curve la cui lunghezza è estremale.
Per mostrarlo si usa il principio di Hamilton, lo stesso che, in meccanica classica, permette
di ritrovare le leggi della dinamica cercando le curve che rendono stazionare un determinato
funzionale d’azione. Più precisamente, data una funzione lisce

L(q 1 , ..., q m , q̇ 1 , .., q̇ m ) (4.15)

di 2m variabili§ q i , q̇ i , i = 1, .., m, il funzionale d’azione SL è la mappa che ad ogni curva


liscia
c : t ∈ [0, T ] 7−→ (c1 (t), · · · , cm (t)) (4.16)
associa il numero Z T
L c1 (t), ..., cm (t), ċ1 (t)..., ċm (t) dt,

SL [c] := (4.17)
0
dove T è un numero reale positivo e la curva c è nel dominio di L (i.e. c è tale che l’integrante
in (4.17) sia ben definito per ogni t).
Una deformazione a estremi fissati di c è una curva (nel dominio di L)

cλ : t ∈ [0, T ] 7−→ (c1 (t) + λa1 (t), · · · , cm (t) + λam (t)), (4.18)

dove le ai sono delle funzioni lisce [0, T ] → R tale che

ai (0) = ai (T ) = 0 ∀i = 1, ..., m, (4.19)

e λ è un parametro reale a valore in un intorno I di 0. Fissati le funzioni ai , si considera la


famiglia cλ , λ ∈ I, di deformazioni. Un valore λ0 del parametro è detto punto stazionario del
funzionale d’azione SL se

d SL [λ]
=0 dove SL [λ] := SL [cλ ]. (4.20)
dλ λ
0

Si dimostra allora (per la prova, rinviamo al corso di meccanica analitica) il

Teorema I.6. (Principio di Hamilton) Una curva c(t) soddisfa le equazioni di Euler-Lagrange
 
d ∂L ∂L
− k =0 ∀k = 1, ..., m, (4.21)
dt ∂ q̇ k ∂q |c(t)

ad ogni suo punto c(t), se e solo se il funzionale d’azione SL ha un punto stazionario in λ = 0


per tutte le deformazioni cλ a estremi fissati.

Per estensione, diremmo che la curva c è una curva stazionaria per il funzionale SL .

§
In meccanica analitica, L è la Lagrangiana e i q̇ i sono m variabili indipendenti, senza relazione con i q i
(in particolare non sono necessariamente le derivate dei q i ). E solo nella definizione (4.17) dell’azione che
scegliamo per i q i le coordinate ci della curva, e per i q̇ i le componente ċi del vettore tangente a c.
84 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Le geodetiche (di tipo tempo) per la connessione di Levi-Cività sono le curve stazionarie
per il funzionale d’azione dato della lunghezza (4.11).
Teorema I.7. Una curva c di tipo tempo è un punto stazionario per la lunghezza se e solo
se è una geodetica per la connessione di Levi-Civita.
Proof. Sia c una curva di tipo tempo, parametrizzata dalla sua lunghezza s, con vettore
tangente c0 (s) = c0µ (s)∂µ . Consideriamo il funzionale d’azione definita dalla lunghezza, cioè
Z T
SL [c] = L(cµ (s), c0µ (s)) ds (4.22)
0

con (omettendo la dipendenza in s)


L(cµ , c0µ ) =
p p
g(c0 , c0 ) = gµν c0µ c0ν . (4.23)
Secondo il principio di Hamilton, la curva c è un punto stazionario per SL se e solo se ad ogni
suo punto le equazioni di Euler-Lagrange sono soddisfate da L, o - in modo equivalente - da
L2 1
F := = gµν c0µ c0ν . (4.24)
2 2
Di fatti, siccome L = 1 lungo la curva (cf il lemma I.4), abbiamo dL
ds = 0, perciò
       
d ∂F ∂F d ∂L ∂L d ∂L ∂L
− λ = L 0λ − L λ = L − λ . (4.25)
ds ∂c0λ ∂c ds ∂c ∂c ds ∂c0λ ∂c
Basta quindi studiare il problema per F. Da (4.24) si calcola
∂F 1

= gµν (δλµ c0ν + c0µ δλν ) = gµλ c0µ , (4.26)
∂c 2
da cui segue
 
d ∂F d
= (gµλ )c0µ + gµλ c00µ = c0ν ∂ν (gµλ )c0µ + gµλ c00µ , (4.27)
ds ∂c0λ ds
1
= (∂ν gµλ + ∂µ gνλ ) c0µ c0ν + gµλ c00µ . (4.28)
2
Di conseguenza
 
d ∂F ∂F 1

− λ = gµλ c00µ + (∂ν gµλ + ∂µ gνλ − ∂λ gµν ) c0µ c0ν . (4.29)
ds ∂c ∂c 2
Denotando Fλ il termine di destra di (4.29), uno ha che le equazioni di Euler-Lagrange
Fλ = 0 ∀λ (4.30)
sono soddisfate se e solo se
g κλ Fλ = 0 ∀κ. (4.31)
Ma ricordandosi da (3.220) e che le componenti della connessione di Levi-Civita sono i simboli
di Christoffel (3.242), troviamo che (4.31) non è altro che
c00κ + Γκνµ c0µ c0ν = 0 ∀κ, (4.32)
cioè l’equazione delle geodetiche (3.127). Di conseguenza, F soddisfa le equazioni di Euler-
Lagrange (e c è stazionario per la lunghezza) sse c soddisfa l’equazione delle geodetiche.
I. MOTO NEL CAMPO GRAVITAZIONALE 85

R2
θ02 + cos2 θ ϕ02 . Le equazioni di

Esempio I.8. La metrica della sfera (3.268) dà F = 2
Euler-Lagrange sono

d d
R2 θ0 + R2 sin θ cos θ ϕ02 = 0, cos2 θ ϕ0 = 0.
 
per θ: per ϕ: (4.33)
ds ds
Una soluzione è l’equatore Eq = (θ = 0, ϕ(s) = s). Dall’invarianza per rotazione, tutte le
rotazioni di Eq intorno all’asse (OE) (E sull’equatore, O il centro della sfera) sono delle
geodetiche. I loro vettori tangenti (insieme ai loro multipli) coprono la totalità di TE S 2 , da
cui segue che non esistono in E altre geodetiche che i grandi cerchi. Per simmetria sferica,
lo stesso vale per qualunque punto della sfera.

Figure 4.1: Tra due punti x, y sulla sfera esistono due curve geodetiche, la cui unione
costituisce un grande cerchio. Se x, y non sono diametralmente opposti, l’arco più corto è la
curva di lunghezza minima. L’altro arco è una geodetica, di lunghezza non minimale.

Osservazione I.9. Le equazioni di Euler-Lagrange forniscono un modo alternativo al calcolo


della connessione, senza usare i simboli di Christoffel: per θ 6= π2 , (4.29) equivale a

θ00 + sin θ cos θ ϕ02 = 0, ϕ00 − tan θ θ0 ϕ0 − tan θ ϕ0 θ0 = 0. (4.34)

Paragonando con l’eq. delle geodetiche (4.32) viene, in accordo con (3.269) e (3.270):

Γθϕϕ = sin θ cos θ, Γθϕθ = Γθθϕ = Γθθθ = 0, e Γϕ ϕ


θϕ = Γϕθ = − tan θ, Γϕ ϕ
θθ = Γθθ = 0.

È importante sottolineare che essere un punto stazionario per la lunghezza non significa
essere una curva di lunghezza minima. Questo è vero nello spazio euclideo, dove le due nozioni
di “curva più dritta” e “curva più corta” coincidono (sono le rete). Ma non vale in generale:

• Nel caso riemanniano, se tra x e y esiste una curva la cui lunghezza è minima, per forza
è una geodetica. Ma non tutte le geodetiche sono di lunghezza minima (cf fig. 4.1).
86 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

• Nel caso Lorentziano, tra x, y che possono essere collegati da un curva di tipo tempo,
si può sempre trovare una curva di tipo tempo di lunghezza arbitrariamente piccola
(cf l’esempio sotto). Se esiste una curva di lunghezza massima, è necessariamente una
geodetica, ma non tutte le geodetiche sono di lunghezza massima.

Esempio I.10. Nello spazio di Minkowski (t, x), l’orbite del punto A = (ct, 0) sotto i boost
di origine O con rapidità u ∈ R è la curva
    
ch u sh u ct ch u
A(u) = = ct . (4.35)
sh u ch u 0 sh u

La lunghezza del segmento OA(u) è la radice dell’intervallo I(O, A(u)) = c2 t2 .† Perciò tutti
i punti dell’orbite (4.35) sono alla stessa distanza ct dall’origine.
Dato un punto P sull’asse t, si considera un punto Q tale che i segmenti OQ e P Q siano
di tipo tempo (cf figura sotto). Le orbiti di Q sotto i boost di origine O e P intersecano l’asse
t in Q1 , Q2 . Dalla rimarca precedente, |OQ| = |OQ1 | e |P Q| = |P Q2 |. Quindi la curva OQP
ha lunghezza
|OQ| + |QP | = |OQ1 | + |Q2 P |, (4.37)
che è inferiore alla lunghezza |OP | della geodetica tra O e P . Lo stesso vale per qualunque
curva di tipo tempo liscia tra O e P (approssimandola da una successione di segmenti). Di
conseguenza la geodetica OP è una curva di lunghezza massima.

Le curve di lunghezza arbitrariamente piccole


tra O e P si trovano scegliendo

Q = Q̃

sull’intersezione del cono futuro di O con il


cono passato di P .
I segmenti OQ̃ e Q̃P essendo di tipo luce, la
curva (non liscia) OQ̃P ha lunghezza zero, e
può essere approssimata da curve lisce (di tipo
tempo) di lunghezza arbitrariamente piccola.


Parametrizzando il segmento OA(u) da (v, v tanh u), 0 ≤ v ≤ ct chu, la sua lunghezza è
Z ctchu p p p
|OAu | = 1 − tanh2 u dv = ct chu 1 − tanh2 u = ct ch2 u − sh2 u = ct. (4.36)
0
I. MOTO NEL CAMPO GRAVITAZIONALE 87

I.4 Forze di marea

La descrizione della caduta libera in termine di geodetiche, cioè in un modo puramente


geometrico, fa che la gravitazione non è più una forza. Cadono quindi le contraddizioni con
la relatività ristretta dovute all’ipotesi newtoniana di azione istantanea a distanza.
Inoltre permette di spiegare il principio di Galileo di universalità della caduta libera: come
già notato, una geodetica è completamente determinata dalle sue condizioni iniziali (un punto
e il vettore tangente in questo punto). Perciò la caduta libera di un corpo dipende solo delle
sue posizione e quadri-velocità iniziali, non della sua massa.
Un altro risultato classico che si ri-interpreta geometricamente è la forza di marea. Classi-
camente, in un campo gravitazionale uniforme, due corpi in caduta libera con velocità iniziali
parallele seguono delle traiettorie parallele. Non è più il caso in un campo gravitazionale non
uniforme: due traiettorie inizialmente parallele avranno tendenza a avvicinarsi o allontanarsi
uno dall’altro, come già discusso nell’interludio a proposito dell’ascensore di Einstein. Si
osservà un accelerazione relativà tra i corpi, chiamata “forza di marea gravitazionale”. Il
nome viene del fato che che la marea vera (quella del mare !) è dovuto al fato che la Terra
è in caduta libera nel campo gravitazionale non-uniforme creato dalla Luna e da Sole: la
superficie del mare segue una traiettoria non parallela a quella del fondale.
In relatività generale, questo fenomeno è descritto geometricamente come accelerazione
relativa tra geodetiche, anche chiamata deviazione geodetiche. Nello spazio piatto di Minkowski,
due geodetiche (i.e. due rete) parallele in un aperto rimangono parallele in tutto lo spazio.
Non è più vero in uno spazio curvo: sulla sfera, due meridiani sono paralleli intorno all’equatore,
ma si incontrano ai poli. Quindi ci si aspetta che la deviazione geodetica sia legata alla cur-
vatura. Lo dimostriamo in questa sezione. Questo risultato sarà molto utile più avanti per
trovare le equazioni del campo gravitazionale.

Consideriamo una famiglia di corpi in caduta libera,


parametrizzata da un parametro continuo s ∈ I ⊂ R,
con condizioni iniziali - posizione e velocità - molte
vicine (tale configurazione è possibile perchè ad ogni
punto p e per qualunque quadri-velocità iniziale, es-
iste sempre una geodetica). Otteniamo cosı̀ una
famiglia γs di geodetiche (di tipo tempo) vicine una
dall’altra, la cui unione forma una superficie Σ.
Assumiamo che la dipendenze nel parametro s sia tale
che la mappa

ϕ : (s, t) 7−→ γs (t) (4.38)

sia liscia con inversa ϕ−1 liscia, dove t varia in un


aperto J ⊂ R di 0 e parametrizza ogni geodetica in
modo affine.
La superficie Σ è l’imagine dell’aperto I × J di R2
sotto la mappa ϕ. Si tratta quindi di una sottovarietà
bidimensionale di M. La mappa ϕ−1 ne fornisce una
carta, con coordinate (s, t).
88 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Denotiamo
X := ∂s , T := ∂t (4.39)
la base dello spazio X (Σ) dei campi vettoriali su Σ, associata alle coordinate (s, t). Essendo
tangente a delle geodetiche di tipo tempo, il campo T è di tipo tempo. Invece, si assuma
che X sia di tipo spazio (il cui significa che a t fissato, un punto γs (t) con s arbitrario non si
trova nel passato, ne nel futuro, di qualunque altro punto γs0 (t), s0 6= s).
La derivata covariante di X lungo la geodetica è chiamata il vettore velocità di deviazione,

v := ∇T X. (4.40)

Permette di misurare la distanza tra due geodetiche γs0 , γs1 : fissato un valore t del parametro
affine, l’insieme deiqpunti {γs (t), s0 ≤ s ≤ s1 } forma una curva c(s) = (s, t) tangente a X. La
Rs
sua lunghezza s01 −gc(s) (Xc(s) , Xc(s) )ds misura la distanza a t fissato tra le due geodetiche.
Al variare di t, dalla compatibilità con la metrica (3.236) segue

d
(g(X, X)) = T [g(X, X)] = g(∇T X, T ) + g(X, ∇T X). (4.41)
dt
Se la velocità di deviazione (4.40) è nulla, g(X, X) è costante e la distanza tra le geodetiche
non cambia al variare di t: le geodetiche sono parallele.
Tuttavia, questa condizione non basta a caratterizzare un spazio piatto: nel piano Eu-
clideo, esistono delle geodetiche la cui distanza rispettiva cresce proporzionalmente al parametro
affine (cf esempio I.13). In questo caso v è non zero, ma costante. Per caratterizzare uno
spazio curvo, tocca considerare la derivata seconda del vettore X, cioè l’accelerazione relative
delle geodetiche,
a := ∇T v = ∇T (∇T X). (4.42)

Proposizione I.11. L’accelerazione relative delle geodetiche è data dal tensore di Riemann:

a = R(T, X, T ). (4.43)

Proof. In una carta, le derivate associate alle coordinate commutano: ∂t ∂s = ∂s ∂t . In termine


di parentesi di Lie, significa [T, X] = 0. La derivata covariante ∇ associata alla connessione
di Levi -Civita avendo connessione nulla, segue dalla definizione (3.160) della torsione che

∇X T = ∇T X. (4.44)

Dalla definizione (3.159) del tensore di Riemann, viene

R(T, X, T ) = ∇T ∇X T − ∇X ∇T T − ∇[T,X] T = ∇T ∇T X, (4.45)

dove, oltre a [T, X] = 0 e (4.44), si utilizza l’equazione geodetica (3.126) per T .

L’eq. (4.43) è detta equazione delle deviazione delle geodetiche.

Osservazione I.12. Il campo X è un esempio di campo di Jacobi, definito in geometria


differenziale come soluzione dell’equazione

∇T ∇T J + R(J, T, T ) = 0. (4.46)
I. MOTO NEL CAMPO GRAVITAZIONALE 89

Esempio I.13. ∗ Nello spazio di Minkowski (x0 , x1 ), si considera la famiglia di osservatori


con stessa velocità c tanh β costante, e posizioni iniziali (s sinh β, s cosh β) dove s ∈ I ⊂ R (cf
a sinistra nella figura sotto). Le loro traiettorie sono le geodetiche parallele γs (t) di coordinate

x0 (s, t) = t cosh β + s sinh β, x1 (s, t) = t sinh β + s cosh β. (4.47)

Il campo
d ∂x0 ∂x1
X = = ∂0 + ∂1 = sinh β ∂0 + cosh β ∂1 (4.48)
ds ∂s ∂s
è di tipo spazio (g(X, X) = sinh2 β − cosh2 β = −1) e costante. Siccome la connessione di
Levi-Civita è nulla, per qualunque campo vettoriale V = V µ ∂µ uno ha

d µ d
∇T V = (V )∂µ + V µ ∇T ∂µ = (V µ )∂µ . (4.49)
dt dt
In particolare la velocità v = ∇T X e l’accelerazione ∇T v di deviazione sono nulli. La distanza
a t fissato tra le geodetiche γs0 , γs1 rimane costante al variare di t:
Z s1 p
−g(X, X)ds = s1 − s0 , (4.50)
s0

Invece, una famiglia di osservatori con velocità c tanh s, s ∈ I ⊂ R, e posizione iniziale 0


(a destra nella figura) descrivono le geodetiche γs (t) di coordinate

x0 (t) = t cosh s, x1 (t) = t sinh s. (4.51)

Uno ha
X = t sinh s ∂x0 + t cosh s ∂x1 = x1 ∂x0 + x0 ∂x1 , (4.52)
Siccome g(X, X) = −t, la distanza a t fissato tra γs0 e γs1 è t(s1 − s0 ), proporzionale al
parametro affine. Da (4.49) segue v = ∇T X = sinh s ∂x0 + cosh s ∂x1 , mentre a = ∇T v = 0.
90 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

I.5 Coordinate normali

Ad ogni punto p di una varietà Lorentziana (M, g) esiste una base dello spazio tangente
Tp M tale che gp sia la metrica di Lorentz η (cf Cap. 3 §VI.1). Le geodetiche forniscono
un modo per dedurne delle coordinate locale, chiamate coordinate normali, nelle quale lo
spazio-tempo intorno a p rassomiglia allo spazio di Minkowski. Si usa la mappa esponenziale
exp : Tp M −→ Up ⊂ M (4.53)
V 7−→ cV (1) (4.54)
dove cV è la geodetica con vettore tangente V in cV (0) = p.
Il dominio di exp non è per forza tutto Tp M (e.g. se cV incontra una singolarità prima
di raggiungere il valore 1 del parametro), e exp non è necessariamente iniettiva (se, per
0 < t ≤ 1, cV incrocia un altrà geodetica passando per p). Tuttavia, si dimostra (cf Wald
§3.3), che esiste un intorno T0 del vettore nullo in Tp M tale che la mappa esponenziale sia
biunivoca tra T0 e la sua imagine Up := exp (T0 ).
d
Osservazione I.14. Il nome “esponenziale” si giustifica scrivendo V = ċµ ∂µ := dt . Viene
" #
1 d 2
   
µ µ µ 1 µ d µ d
cV (1) = cV (0) + ċV (0) + c̈V (0) + · · · = 1 + + + · · · cV |0 = exp cµ .
2 dt 2! dt dt V |0

Lemma I.15. Fissato un vettore V ∈ Tp M, per ogni valore t tale che tV ∈ T0 , abbiamo
cV (t) = exp tV. (4.55)
Proof. Sia cV la geodetica (4.54) e λ ∈ R∗ tale che λV ∈ T0 . La curva
cλ (t) := cV (λt) (4.56)
descrive la stessa traiettoria di quella descritta da cV , ma con vettore tangente diverso:
ċλ|t = λ c˙V |λt . (4.57)
Presa in t = 0, e ricordandosi che per ipotesi c˙V |0 = V , quest’equazione dà ċλ|0 = λV . In
altre parole, nella notazione (4.54), la curva cλ non è altra che cλV . In particolare, per t = 1
abbiamo cλ (1) = cλV (1). Insieme a (4.56) e (4.54) dà
cV (λ) = exp λV. (4.58)
Questo vale qualunque sia il valore del parametro λ tale che λ ∈ T0 . Ne segue (4.55).
n o  
Sia ∂µ |p , µ = 1...., m una base ortonormale di Tp M, cioè tale che gp ∂µ |p , ∂ν |p = ηµν .
con ηµν le componenti della metrica di Lorentz. Per costruzione, ogni punto q ∈ Up è
l’esponenziale di un unico vettore V = V µ ∂µ in T0 . Le coordinate normale di q sono ‡
xµ (q) := V µ . (4.59)
In particolare, per qualunque V ∈ T0 , segue da (4.56) che la geodetica cV è la retta in Rm di
vettore direttore V :
xµ (cV (t)) = tV µ . (4.60)

In modo più formale, xµ = X µ ◦ ϕ dove ϕ è l’inverso della mappa esponenziale, e {X µ } sono le funzioni
coordinate associate alla base ortonormale.
I. MOTO NEL CAMPO GRAVITAZIONALE 91

Proposizione I.16. Al punto p e nelle coordinate normale, la metrica coincida con quella
di Lorentz; mentre le componenti della connessione di Levi-Civita sono tutte nulle.

Proof. Per definizione di base coordinate, il vettore ∂x∂ µ |p è tangente in p alla curva c(t) di
coordinate
xµ (c(t)) = t, xν (c(t)) = 0 ∀µ 6= ν. (4.61)
Da (4.60) segue che c = cV per V il vettore con unica componente non nulla V µ = 1, cioè
V = ∂µ . Cosı̀, il vettore tangente a c in p è ∂µ |p , cioè ∂x∂ µ |p = ∂µ |p . Perciò gp ( ∂x∂ µ |p , ∂x∂ ν |p ) =
gp (∂µ |p , ∂ν |p ) = ηµν .
Per la seconda, asserzione, fissato V ∈ T0 , l’equazione delle geodetiche per cV si scrive

0 = ẍµ (cV (t)) + Γµνλ (cV (t)) ẋν (cV (t)) ẋλ (cV (t)) = Γµνλ (cV (t)) V ν V λ ∀µ, (4.62)

dove si usa (4.60) per calcolare le derivate. Per t = 0, otteniamo

Γµνλ (p) V ν V λ = 0, (4.63)

che vale per qualunque V ∈ T0 . Ad esempio, per V con tutte le componenti nulli tranne V ρ
per un valore ρ fissata, otteniamo
Γµρρ (p) = 0. (4.64)
Ma allora, per V con due sole componenti non nulli V ρ = V η , otteniamo

Γµηρ (p) + Γµρη (p) + Γµρρ (p) + Γµηη (p). = 0, (4.65)

Tenendo conto di (4.65) e della simmetria dei Christoffel, viene Γµρη (p) = 0.

Questa proposizione non significa che l’aperto Up si identifica ad un aperto dello spazio
di Minkowski. † Siccome (cf 3.182)
λ
Rρµν (p) = ∂µ Γλνρ | − ∂ν Γλµρ | . (4.66)
p p


(4.62) non implica che Γµνλ si annuli in un punto q diverso da p. Per t 6= 0, due scelte di componenti
V 0µ
6= V µ danno delle condizioni su Γµ µ
νλ (cV (t)V ) e Γνλ (cV 0 (t)) in punti cV 0 (t), cV (t) distinti.
92 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Dal momento che R non è nullo in p, almeno uno dei due ∂µ Γλνρ | o ∂ν Γλµρ | non è zero,
p p
quindi la connessione non può rimanere costantemente nullaessere tutta nulla intorno a p.
Invece, l’annullamento della connessione in p fa che le derivate prime della metrica sono nulle
(utilizzando la compatibilità con la metrica (3.238)), ma non le derivate seconde. Si dimostra
che nella vicinanza di p,
1
gµν (p + x) = ηµν + Rµνλρ xλ xρ + .... (4.67)
3
La curvatura induce correzioni alla metrica di Lorentz nel 2ndo ordine nelle coordinate normali.

II Le equazioni del campo gravitazionale


Il primo passo verso la relatività generale è stato di promuovere in principio - il principio
di equivalenza - l’osservazione sperimentale secondo cui due corpi in caduta libera nel vuoto
cadono alla stessa velocità, independentemente della loro massa. Ponendo l’uguaglianza tra
masse inerte e masse pesante, si identifica l’effetto della gravità terrestre ad un accelerazione,

FG = minerte g = minerziale a =⇒ g = a. (4.68)

Generalizzando a una forza di gravitazione qualunque (non specificamente terrestre) ci porta


a rinunciare all’idea che la gravitazione sia una forza, e a postulare che lo spazio-tempo è una
varietà Lorentzianna di dimensione 4, dentro la quale le traiettorie di cadute libere sono le
geodetiche per la connessione di Leci-Civita.
Qual’è la legge che determinata questa curvatura ? Per capirlo, riteniamo che la legge di
gravitazione universale di Newton (1.1) stipola che la forza di gravitazione sentita dal corpo
m dipende della presenza di una massa M ad una distanza r. Nel ambito relativistico, ci
aspettiamo che la curvatura dello spazio-tempo sia determinata del suo contenuto in materia.
Cerchiamo quindi due oggetti G e T che portano uno - G - l’informazione geometrica, l’altro
- T - l’informazione sul contenuto in materia, e che soddisfino l’equazione

G = T. (4.69)

Il legame tra materia e geometria non deve dipendere della scelta del sistema di coordinate:
entrambi latti di (4.69) si devono trasformare nello stesso modo sotto una trasformazione di
coordinate. Perciò cerchiamo G e T come tensori. Iniziamo con lo studio dell tensore T .

II.1 Tensore energia-impulso

Il modo di trattare la materia in relatività generale è ispirato della fisica dei fluidi. Può
sembrare strano: uno si aspeterrebbe piuttosto di vedere la materia come un corpo rigido.
Oltre al fatto che tanta materia nell’universo è fluida (il plasma che costituisce le stelle, i
pianeti gassosi, anche l’universo stesso visto come un fluido di galassie), è importante sotto-
lineare che la nozione di corpo rigido è problematica nell’ambito relativistico: ad esempio,
come descrivere in relatività una sbarra rigida di lunghezza L, in rotazione intorno ad una
sua estremità O con velocità angolare ω ? Il vincolo di rigidità fa che il punto a distanza r
di O ha una velocità rω. Ma se L > ωc , tutti i punti con r > ωc hanno velocità superiore a
quella della luce. In questo senso, non possono esistere corpi rigidi in relatività.
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 93

Iniziamo da qualche elemento di fisica dei fluidi, in particolare le equazioni di conservazione


della massa e di bilancio della quantità di moto di Euler. La formulazione di queste equazioni
in forma tensoriale motiverà la definizione del tensore d’energia-impulso T in relatività.
È chiamato fluido qualunque sostanza che si deforma in modo continuo quando sottoposto
a uno sforzo di taglio. Si distingue di un corpo rigido (che, per definizione, non si deforma)
ma anche di sostanze granulare (tipo la sabbia) che non fluiscono in modo continuo. Si
caratterizza anche un fluido dal fato che presenta una superficie libera indipendentemente
del contenitore (al contrario di un gas): dell’acqua in un bottiglia presenta una superficie,
mentre aria nella stessa bottiglia non presenta nessun “superficie d’aria”. In altre parole, un
gas tende a occupare tutto il volume accessibile, uno fluido no.
Conservazione della massa: si considera un volume V
difluido di densità ρ, delimitato da una superficie S. Sia
n dA l’elemento infinitesimale di superficie, dove dA è un
elemento di superficie intorno ad un punto q di S, e n il
vettore normale uscente in q. Una “particella” di fluido è
caratterizzata dalla sua posizione x(t) = (x(t), y(t), z(t)) e
velocità v(t) = (ẋ(t), ẏ(t), ż(t)).
Il volume e la superficie possono cambiare nel tempo (pensare
ad una sacca acqua stagna), ma se il sistema non scambia
materia
R con l’esterno (non c’è bucco nella sacca) la massa
V (t) ρ(x, t)dx all’interno del volume si conserva nel tempo.
Abbiamo quindi
d
Z Z Z
0= ρ dx = ∂t ρ dx + ρv·n dA, (4.70)
dt V (t) V (t) S(t)
Z Z Z
= ∂t ρ dx + ∇·ρv dx = ∂t ρ + ∇·ρv dx
V (t) v(t) V (t)
dove‡ la prima equazione è il teorema di trasporto di Reynolds e la seconda il teorema di
Gauss (cf osservazione sotto). Per un volume V (t) arbitrariamente piccolo, otteniamo che
l’integrante è zero, cioè l’equazione di conservazione della massa

∂t ρ + ∇ · ρv = 0. (4.71)

Osservazione II.1. ∗ Il teorema di Reynolds segue della formula di Leibniz sullo scambio
tra integrale su x e derivata in t, per una funzione f (x(t), t), quando le limite d’integrazione
a, b dipendono di t: per f , a, b sufficientemente regolari (ad esempio lisce) uno ha
b(t) b(t)
d ∂f
Z Z
f (x(t), t)dx = ḃ(t) f (b(t), t) − ȧ(t) f (a(t), t) + dx. (4.72)
dt a(t) a(t) ∂t |(x(t),t)
P
I due primi termini si interpretano come ∂V f ẋ·n dove ∂V = {a, b} è il bordo dell intervalo
[a, b] e n è la funzione n(b) = 1, n(a) = −1 che determina un orientazione di questo bordo.
 ∂ 
∂x
‡ ∂
Scriviamo ∇ =   da non confondere con una derivata covariante !
 
∂y

∂z
94 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Si dimostra allora che la formula di Leibniz in tre dimensioni si scrive


d ∂f
Z Z Z
f (x(t), t) dx = f ẋ · n dA + dx (4.73)
dt V (t) S(t) V (t) ∂t |(x(t),t)

dove S(t) è il bordo del volume V (t), e ẋ è la velocità del punto x su questo bordo. Assumendo
che questa velocità è la velocità v del fluido stesso, si arriva a (4.70) (con f = ρ).
Il teorem di Gauss indica che il flusso di un campo vettoriale v attraverso una superficie
chiusa S è uguale all’integrale della divergenza di v nel volume V definita da questa superficie:
Z  
∂vx ∂vy ∂vz
Z Z
3
v · n dA = + + d x= ∇ · vdx. (4.74)
S V ∂x ∂y ∂z V
P d
Bilancio della quantità di moto: la seconda legge di Newton F = ma = dt p con
p = mv la quantità di moto, viene formulata come
   
cambiamento nel tempo della quantità di moto somma delle forze che agiscono
=
di una regione di fluido sulla regione di fluido
Usando come sopra i teoremi del trasporto e di Gauss, la variazione nel tempo della
componente i della quantità di moto è
d
Z Z
i
ρv dx = ∂t ρv i + ∇ · (ρv i v) dx. (4.75)
dt V (t) V (t)
74 CHAPTER 3. THE EQUATIONS OF FL
Per quanto riguarda le forze, si dividono i due tipi: forze
di volume (gravitazione, forza elettromagnetica se il flu- p
ido è fatto da particelle caricate, scambio di calore etc)
τ yy
e forze di superficie. Queste ultime sono descritte da
una matrice T (x, t) di dimensione 3 × 3 (chiamata ten-
sore di Cauchy), la cui componente Txy rappresenta la τ yx
forza esercita sul lato x di un elemento cubico di fluido τ yz
(i.e. il lato ortogonale all’asse x) da un altro elemento
di fluido che si muove nella direzione y. Considerazioni τ xy p
y τ zy
generali (e.g. continuità quando il volume V tende a
zero), conducono a imporre che il tensore di Cauchy sia τ zx τ xx
simmetrico, τ xz

Tij = Tji ∀i, j = 1, 2, 3, (4.76) τ zz

e si divida in due componenti T = −P I + Tvisc dove P


è la pressione del fluido, I la matrice identità di dimen- p
sione 3 e Tvisc rende conto delle forze viscose. x
Per un elemento di fluido di forma arbitraria, la forza
che se esercita sull’elemento di superficie n dA è
z

dFs = T n dA Figura da Lectures in elementary fluid mechanics,


Figure 3.9: Schematic of pressure and viscous stresses acting on a fluid elem
J.M. Mc Donough.
(con T n il prodotto usuale matrice × vettore). La forza
di superficie totale Fs si trova integrando su tutta la
for a one-dimensional flow in the x direction changing only in the y direction.
superficie S(t) dell’elemento di fluido. generalize this formula to the present multi-dimensional situation.
If we imagine another fluid element in contact with the one of Fig. 3.9 and, say
so that it is sliding past the top y plane in the x direction, then we see that the abo
of Newton’s law of viscosity is associated with (but as we shall see below, not equ
shear stress component τyx . Similarly, if we were to imagine another fluid element s
x face of the cube in the y direction, we would expect this to generate x-direction ch
component of velocity; hence, it follows that τxy is associated with µ ∂v/∂x. The par
(instead of ordinary ones) are now necessary notation for all contributions to shear
the flow is no longer 1D, and specific indication of this will be required for later dev
We next note that it can be proven from basic physical considerations that the v
nents of the shear stress shown in Fig. 3.9 are related as follows:

τxy = τyx , τxz = τzx , τyz = τzy .


II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 95

Qui consideriamo un fluido perfetto, definito come una distribuzione continua di materia,
senza conduzione di calore ne deformazione (quindi consideriamo solo le forze di superficie
Fs e la gravitazione), ne sforzi dovuti alla viscosità (Tvisc = 0). Dunque T n = −P n e la
componente i della forza di superficie Fs è
∂P
Z Z
− P ei · n dA = − i
dx. (4.77)
S(t) V (t) ∂x

In assenza di gravitazione, la seconda legge di Newton è equivalente all’uguaglianza tra (4.75)


e (4.77). Considerando un V (t) arbitrario, otteniamo le equazioni del bilancio della quantità
di moto

∂t ρv i + ∇ · (ρv i v) + i P = 0 ∀i = x, y, z. (4.78)
∂x
Insieme a (4.71), queste equazioni costituiscono le equazioni di Euler dell’idrodinamica
(per un fluido viscoso, si ottengono le equazioni di Navier-Stokes, di alto interesso sia in fisica
che matematica). Definendo

∂ ∂ ∂ ∂
∂0 = , ∂1 = , ∂2 = , ∂3 = , (4.79)
∂t ∂x ∂y ∂z

le quattro equazioni di Eulero (4.71) e (4.78) si scrivono come un unica equazione tensoriale,
µν
∂µ TEuler =0 ∀ν = 0, 1, 2, 3, (4.80)

dove il tensore di Euler è la matrice 4 × 4

ρv i
 
µν ρ
TEuler := (T ) = i, j = 1, 2, 3. (4.81)
ρv i ρv i v j + δ ij P
µν
In analogia con la divergenza di un vettore, ∂µ TEuler è chiamata divergenza del tensore TEuler .

Queste considerazioni suggeriscono di descrivere un fluido perfetto in relatività ristretta


da un simile oggetto, cioè un tensore simmetrico di divergenza nulla.

Definizione II.2. Il tensore energia-impulso di un fluido perfetto con 4-velocità U , densità


ρ e pressione P (misurate da osservatori comoventi) è il tensore simmetrico di tipo (0, 2)§
1 
T (V, W ) = ρ η(U, V ) η(U, W ) + P η(U, V )η(U, W ) − η(V, W ) ∀ V, W ∈ X(M).
c2
In componenti, T = Tµν dxµ ⊗ dxν dove (scrivendo Uµ := ηµν U ν con U ν le componente di U )
1 
Tµν = T (∂µ , ∂ν ) = ρ Uµ Uν + P U U
µ ν − ηµν . (4.82)
c2
Si verifica che ρ essendo una densità volumica di massa e P una pressione (quindi di dimen-
sione N m−2 = Jm−3 ), Tµν ha la dimensione di una densità volumica d’energia Jm−3 . Dalla
definizione II.2, si verifica anche che T è lineare sia in V che in W , quindi è un tensore.
§
In Wald §4.2 il tensore è definito come ρ uµ uν + P (ηµν + uµ uν ), perchè con la sua convenzione di metrica
di Lorentz η = diag(−, + + +), un vettore unitale di tempo tempo a norma −1.
96 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Nel limite classico T permette di ritrovare le equazioni di Euler. Di fatto, per c >> v con
v = |v| la velocità (nello spazio) del fluido, il fattore di Lorentz γ tende a 1 e il limite della
4-velocità è      
d ct d ct c
U= =γ −→ . (4.83)
dτ x dt x v

Cioè, in componenti, U 0 → c e U i → v i . In modo equivalente

U0 → c, Ui → −v i ∀i = 1, 2, 3. (4.84)

Trascurando i termini in 1
c2
P vivj e 1
c2
P v i c, il tensore energia-impulso (4.82) tende a

ρc2 −ρc v i
 
T −→ . (4.85)
−ρc v i ρv i v j + P δ ij

Questo limite (4.85) non è uguale al tensore di Euler (4.81) per colpa dei coefficienti c e di
segni diversi. Tuttavia, le equazioni di Eulero si ritrovano come limite classico del equazione
relativistica
∂ µ Tµν = 0 ∀ν, (4.86)
dove
3 3
X 1 X
∂ µ := η µν ∂xν = ∂x0 − ∂ xi = ∂ t − ∂ xi . (4.87)
c
i=1 i=1

Per mostrarlo, uno può calcolare (4.86), poi prendere il limite delle piccole velocità. Op-
pure, assumendo che limite e derivata commutano, basta scrivere (4.86) come

3
1 X
∂xi Ti0 = c ∂t ρ + ∂xi ρv i = c (∂t ρ + ∇ · ρv) ,

0 = ∂t T00 − per ν = 0
c
i=1
3
1 X
0 = ∂t T0j − ∂xi Tij = −∂t ρv j − ∂xi ρv i v j − ∂xj P = −(∂t ρv j + ∇ · ρvv j + ∂xj P ), per ν = j,
c
i=1

che non sono altre che le equazioni di Euler (4.71)-(4.78).


In relatività generale, il tensore d’energia-impulso per un fluido perfetto è definito in
modo analogo alla definizione II.2, sostituendo la metrica di Lorentz η dalla metrica g dello
spazio-tempo. In componenti, abbiamo

1
Tµν = ρ Uµ Uν + P ( Uµ Uν − gµν ). (4.88)
c2
Una distribuzione continua di materia qualunque (non-necessariamente un fluido perfetto)
viene descritta da un tensore di energia-impulso simile, con componenti possibilmente più
complicate che tengono conto di ulteriori tipi di interazione tra le particelle del fluido.
In ogni caso, si richiede che il tensore energia-impulso T

• sia simmetrico,
Tµν = Tνµ ∀µ, ν, (4.89)
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 97

• abbia divergenza covariante nulla, cioè soddisfi la versione covariante di (4.86),¶

(∇µ T )µν = 0 ∀ν. (4.90)

Quest’ultima asserzione si può giustificare per motivi di conservazione dell’energia (cf Wald §4.2).
Per concludere, notiamo che queste due richieste non si limitano a campi di materia, ma
sono soddisfate ad esempio dal tensore di energia-impulso del campo elettromagnetico.

II.2 Primo tentativo per un equazione del campo gravitazionale

Avendo stabilizzato la forma del tensore T dell’equazione (4.69), tocca trovare G. Il


senso di (4.69) è che la materia detta alla spazio-tempo la sua geometria (in particolare la
sua metrica), in cambio la geometria detta alla materia come muoversi (lungo le geodetiche).
Per trovare il tensore G, analizziamo un esempio in cui questo dialogo tra materia e geometria
è gia stato stabilizzato, ossia le forze di marea.
Come visto nella proposizione I.11, l’accelerazione di deviazione dipende in una quan-
tità geometrica: il tensore di Riemann. Dal punto di vista newtoniano, l’accelerazione di
deviazione corrisponde all’accelerazione relativa tra corpi in caduta libera nel campo gravi-
tazionale, e dipende nella materia all’origine di questo campo. Paragonando questa due
dipendenze, si può sperare svelare la forma della relazione tra materia e geometria.
La descrizione newtoniana delle forze di marea è basata sul potenziale gravitazionale.
Ricordiamo che una distribuzione di massa D nello spazio (R3 euclideo), con densità ρ, crea
al punto x al di fuori di D un potenziale gravitazionale

1
Z
Φ(x) := −G ρ(x0 ) dx0 (4.91)
D |x − x0 |

dove G è la costante di Newton. Da questo potenziale scende il campo gravitazionale ‖

x − x0
Z
g(x) := −∇Φ|x = −G ρ(x0 ) dx0 . (4.92)
D |x − x0 |3

La forza gravitazionale che D esercita su un corpo di massa m localizzato in x è

x − x0
Z
mg(x) = −mG ρ(x0 ) dx0 , (4.93)
D |x − x0 |3

cioè la somma (continua) su tutti i punti x0 di D della forza Fg introdotta in (1.1).


Definendo ∂ µ T come la matrice di componenti (∂ µ T )λν := ∂ µ Tλν , (4.86) si scrive in modo equivalente
µ
(∂ T )µν = 0. Sostituendo la derivata parziale dalla derivata covariante, otteniamo (4.90).

Per D la Terra, (4.92) dà il campo gravitazionale terrestre gT della formula della forza peso P = mgT (in
realtà gT contiene correzioni dovute alla rotazione della Terra e alla presenza degli altri astri del sistema solare).
98 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Come nella sezione I.4, si considera una famiglia di corpi in caduta libera
nel campo gravitazionale, lungo traiettorie (nello spazio R3 )

γ(s, t) = (γ x (s, t), γ y (s, t), γ z (s, t)) (4.94)

dove t è il tempo (universale di Newton) e s il parametro continuo della


famiglia di corpi. Definiamo i vettori deviazione X, velocità di deviazione
v e accelerazione relative a in modo simile a (4.39), (4.40) e (4.42):

∂γ ∂X ∂v ∂2X
X := , v= , a= = .
∂s ∂t ∂t ∂t2
Dalla legge di Newton, l’accelerazione lungo le traiettorie (4.94) è

γ̈(s, t) = −∇Φ|s,t (4.95)

dove Φ(s, t) è il potenziale gravitazionale al punto γ(s, t).


Per fare apparire l’accelerazione relative a, guardiamo come varia l’accelerazione (4.95) quando
ci si sposta a t costante su una traiettoria vicina s + δs. Da una parte, sviluppando al primo
ordine in δs il membro di sinistra di (4.95), la componente i dell’accelerazione in s + δs è

γ̈ i (s + δs, t) = γ̈ i (s, t) + δs γ̈ i |s,t = γ̈ i (s, t) + δs ai (s, t),

(4.96)
∂s
dove si usa
∂2γi ∂ 2 ∂γ i ∂2X i
 
i ∂
∂s γ̈ = = = = ai . (4.97)
∂s ∂t2 ∂t2 ∂s ∂2t
D’altra parte, sviluppando il membro di destra di (4.95) viene

γ̈ i (s + δs, t) = −∂i Φ|s+δs,t = −∂i Φ|s,t − δs

∂i Φ |s,t , (4.98)
∂s
= γ̈ (s, t) − δs X j (s, t) ∂j ∂i Φ|s,t ,
i
(4.99)

dove si usa che lungo la curva a t costante γ(u, t), u ∈ [s, s + δs], uno ha

∂  ∂γ j
(∂i Φ) = ∂j ∂i Φ = X j ∂j ∂i Φ. (4.100)
∂s ∂s
L’uguaglianza tra (4.99) e (4.96) implica

ai = −X j ∂j ∂i Φ = X j ∂j ∂ i Φ (4.101)

dove ∂ i := η iµ ∂µ = −∂i con η la metrica di Lorentz, µ = 0, x, y, z.


Ci si aspetta che quest’espressione dell’accelerazione relativa tra corpi in caduta libera
coincidi con l’espressione relativistica (4.43) dell’accelerazione di deviazione, nel limite delle
piccole velocità. Però l’espressione newtoniana (4.101) vive in uno spazio tridimensionale.
Per poterla paragonare all’espressione della deviazione geodetica in una varietà Lorentziana,
tocca ri-scrivere (4.101) nello spazio-tempo di dimensione 4. Nell’ipotesi delle piccole ve-
locità, è naturale porre γ 0 (s, t) = ct come componente temporale della traiettoria γs (in ac-
cordo con l’ipotesi di tempo assoluto di Newton). In conseguenza, la componente temporale
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 99

d 2
dell’accelerazione relativa si annula: a0 = dt 0
2 γ (s, t) = ct = 0. Assumendo che il potenziale
gravitazionale non dipende da t (o varia nel tempo, ma con una velocità di variazione molto
inferiore a quella della luce), l’eq. (4.101) si riscrive in 4-dimensione come
aµ = X ν ∂ν ∂ µ Φ con µ, ν = 0, x, y, z. (4.102)
Le traiettorie γ(s, t) in (4.94) non sono delle geodetiche dello spazio Euclideo, perchè
non descrivono dei corpi accelerati, e quindi non in moto rettilineo (ad esempio γ(s, t) può
descrivere l’orbite
 di un pianete intorno al Sole). Per lo stesso motivo, le linee d’universo
0
γ (s, t), γ(s, t) non sono delle geodetiche dello spazio di Minkowski. L’idea centrale della
relatività generale è che esiste una metrica g tale che queste linee d’universo siano delle
geodetiche per la connessione di Levi-Civita associata a g. Ma allora sappiamo dalla formula
(4.43) dell’accelerazione relativi tra geodetiche,
µ
a = −R(X, T, T ) = −X ν T ρ T λ Rλνρ ∂µ (4.103)
che le componente dell’accelerazione relativa sono
µ
aµ = −X ν Rλνρ T λT ρ. (4.104)
L’analogia formale tra (4.102) e (4.104) suggerisce di identificare
µ
Rλνρ T λ T ρ ←→ −∂ν ∂ µ Φ. (4.105)
Quest’equazione stabilizza una relazione tra grandezze geometrica - il tensore di Riemann
e la quadrivelocità T µ ∂µ lungo geodetiche - e un parametro gravitazionale - il potenziale Φ.
È un progresso significativo, ma non permette ancora di legare la geometria al tensore di
energia-impulso T , perchè in quest’ultimo appaiono la densità di materia ρ e la pressione P ,
ma non il potenziale Φ. Fortunatamente, esiste nella teoria Newtoniana una relazione tra il
potenziale gravitazionale e la densità di materia: l’equazione di Poisson.
Proposizione II.3. Il potenziale gravitazionale soddisfa l’equazione di Poisson
∆Φ = 4πGρ (4.106)
dove ∆ = ∂x2 + ∂y2 + ∂z2 è il Laplaciano.
Proof. Si considera la divergenza del campo gravitazionale (4.92): da un parte otteniamo
∇ · g = −∇ · (∇Φ) = −∆Φ, (4.107)
e dall’altra
x − x0 x − x0
Z  Z  
0
−G div ρ(x ) 0 |3
dx0 = −G ρ(x ) div0
dx0 , (4.108)
D |x − x D |x − x0 |3
Z
= −4πG ρ(x0 ) δ(x − x0 ) dx0 = −4πG ρ(x) (4.109)
D
dove scambiamo la divergenza e l’integrale perchè la prima è relativa a x mentre la seconda
è in x0 , e utilizziamo
x − x0
 
div = 4πδ(x − x0 ) (4.110)
|x − x0 |3
con δ(x − x0 ) la distribuzione di Dirac, definita da R3 f (x)δ(x − x0 )dx0 = f (x) per ogni
R

funzione f a sopporto compatto.


100 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Osservazione II.4. L’equazione (4.110) viene dimostrata nella teoria delle distribuzioni.
Tuttavia se ne può capire il senso grazie al teorema di Gauss (o della divergenza) (4.74)
Z Z
∇ · F dr = F · ndA (4.111)
V S

dove F è una funzione vettoriale sufficientemente regolare, definita su un volume V delimitato


da una superficie S. Nel caso V è la sfera di raggio R e F(r) := |r|r3 , il membro di destra di
(4.111) è
Rn 1 1
Z Z Z
3
· ndA = 2
dA = 2 dA = 4π. (4.112)
S |R| S R R S
Il membro di sinistra non è a ben definito, siccome si calcola - con un po di sforzo - che
x x x
∇ · F = ∂x 3 + ∂x 3 = 0
3 + ∂x
(4.113)
(x2 + y2 + z2) 2 (x2 + y2 z2) 2
+ y2 + z2) 2
+ (x2
R
trane in r = 0 dove non è definito. Tuttavia, si da senso all’equazione V ∇ · Fdr = 4π,
interpretando ∇ · F come la distribuzione 4πδ(r).

Siccome nello spazio di Minkowski ∂µ ∂ µ = η µν ∂µ ∂ν = ∂02 − ∆, per un potenziale Φ


independente del tempo, l’equazione di Poisson si scrive in forma quadridimensionale come

∂µ ∂ µ Φ = −4πGρ. (4.114)

L’identificazione (4.105) diventa allora, ponendo ν = µ,


µ
Rλµρ T λ T ρ ←→ 4πGρ. (4.115)

Per fare il legame con il tensore di energia-impulso, basta estrarre da quest’ultimo la


densità ρ. Per osservatori comoventi col fluido (cioè tale che le loro linee d’universo siano le
curve integrali della 4-velocità U = U µ ∂µ del fluido), segue da (4.88)

1
T (U, U ) = Tµν U µ U ν = ρUµ Uν U µ U ν + P µ ν µ ν

Uµ Uν U U − gµν U U , (4.116)
c2
1
= ρc4 + P 2 c4 − c2 = ρc4

(4.117)
c
dove si usa che gµν U µ U ν = Uµ U µ = ||U || = c2 . In altre parole, T (U, U ) è (modulo un fattore
c4 ) la densità di fluido, misurata da osservatori comoventi. Più generalmente, per un campo
vettoriale V = V µ ∂µ arbitrario, in idrodinamica-relativistica

1 1
T (V, V ) = 4 Tλρ V λ V ρ (4.118)
c4 c
si interpreta come la densità misurata da osservatori con 4-velocità V .
È naturale assumere che la densità di materia ρ in (4.115), responsabile del campo grav-
itazionale sentito dagli osservatori in caduta libera con 4-velocità T , sia la densità da loro
misurata, cioè
1
ρ = 4 Tλρ T λ T ρ . (4.119)
c
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 101

Sostituendo quest’ultima equazione dentro (4.115), otteniamo finalmente

µ 4πG
Rλµρ T λ T ρ ←→ Tλρ T λ T ρ . (4.120)
c4
Questo suggerisce che l’equazione del campo gravitazionale (4.69) sarebbe semplicemente
4πG
Ricλρ = Tλρ . (4.121)
c4
dove si usa la formula (3.195) per le componenti del tensore di Ricci.
Quest’equazione è stata postulata da Einstein in un primo tempo. Però ha un defetto
dovuto alla richiesta di conservazione dell’energia (4.90): per ipotesi (∇µ T )µν = 0 per ogni ν.
Quindi se (4.121) fosse l’equazione del campo gravitazionale, dovremmo avere che (∇µ Ric)µν
si annula per qualunque ν. Vediamo nel sezione seguente che non è il caso, almeno di costrin-
gere esageratamente il tipo di materia accettabile.

II.3 Divergenza del tensore di Ricci

Per calcolare (∇µ Ric)µν , servono un paio di risultati tecnici.


Lemma II.5. La derivata covariante associata alla connessione di Levi-Civita commuta con
gli isomorfismi musicali (3.225):
[
∇µ V [ = ∇µ V

∀ V ∈ X(M), (4.122)
]
 ] 1
∇µ ω = ∇µ ω ∀ ω ∈ Ω (M). (4.123)

Proof. Sia V ∈ X(M) fissato. Per definizione, (∇µ V )[ è la 1-forma definita da

(∇µ V )[ , U = g(∇µ V, U )


∀U ∈ X(M), (4.124)

mentre ∇µ (V [ ) è la derivata covariante della 1-forma V [ , definita in (3.228) come


 
h∇µ (V [ ), U i = ∂µ hV [ , U ) − hV [ , ∇µ U i, (4.125)
  
= ∂µ g V, U ) − g V, ∇µ U ∀U ∈ X(M). (4.126)

La differenza (4.126) - (4.124) dà


 
∇µ (V [ ) − (∇µ V )[ , U = ∂µ g V, U ) − g V, ∇µ U − g(∇µ V, U ),


(4.127)
 
= (∇µ g) V, U = 0, (4.128)

dove ∇µ g (cf (3.232)) è zero dalla compatibilità metrica. Questo vale per qualunque U , quindi
la 1-forma ∇µ (V [ ) − (∇µ V )[ è nulla, perciò (4.122). Si dimostra (4.123) in modo simile.

Definiamo la derivata covariante V;µν della componente V ν di un campo vettoriale V come


la componente ν del campo vettoriale ∇µ V . Similarmente per la derivata covariante ων;µ
della componente ων di un campo di 1-forma ω. Ricordandosi (3.124), (3.229), si ha

V;µν := (∇µ V )ν = ∂µ V ν + Γνµλ V λ , ων;µ := (∇µ ω)ν = ∂µ ων − Γλµν ωλ . (4.129)


102 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Dal lemma (II.5), la componente ν di ∇µ (V [ ) è la componente ν di (∇µ V )[ , cioè gνλ (∇µ V )λ


(cf Prop. VI.4 del capitolo 3). Con le notazioni sopra
[ λ
Vν;µ = gνλ V ;µ . (4.130)

Siccome Vν[ = gνλ V λ dxν , otteniamo che la metrica commuta con la derivata covariante:

(gνλ V λ );µ = gνλ V ;µ


λ
. (4.131)

Le notazioni precedenti si estendono a tensori di qualunque tipo. Inoltre, si dimostra che


per qualunque tensore T le cui componenti sono prodotte di componenti di altri tensori Q, R
ρ
- ad esempio Tµλ = Rµκη Qκη
ρν - vale la regola di Leibniz:

ρ
Tµλ;µ = Rµκη;µ Qκη ρ κη
ρν + = Rµκη Qρν;µ . (4.132)

Nel nostro caso, viene (gνλ V λ );µ = gνλ;µ V λ + gλν V;µλ = gλν V;µλ , perchè gνλ;µ è la componente
µν del tensore ∇µ g, nulla per compatibilità con la metrica.

Lemma II.6. Uno ha (∇ρ R)λνλµ = (∇ρ Ric)νµ .

Proof. Calcoliamo i componenti del tensore ∇µ R, partendo della definizione VI.12:

(∇ρ R)κνλµ = hdxκ , ∇ρ (R(∂λ , ∂µ , ∂ν )) − R(∇ρ ∂λ , ∂µ , ∂ν ) − R(∂λ , ∇ρ ∂µ , ∂ν ) − R(∂λ , ∂µ , ∇ρ ∂ν )i


η
= hdxκ , ∇ρ (Rνλµ ∂η )i − hdxκ , R(∇ρ ∂λ , ∂µ , ∂ν )i − hdxκ , R(∂λ , ∇ρ ∂µ , ∂ν )i − hdxκ , R(∂λ , ∂µ , ∇ρ ∂ν )i
η
κ
= ∂ρ Rνλµ + Rνλµ Γκρη − Γηρλ Rνηµ
κ
− Γηρµ Rνλη
κ
− Γηρν Rηλµ
κ
. (4.133)
∗ Le componenti di ∇µ Ric si calcolano in modo analogo a quelle della derivata di g in (3.235):

(∇ρ Ric)νµ = ∂ρ Ricνµ − Γηρν Ricηµ − Γηρµ Ricνη . (4.134)


η
Per κ = λ, la differenza tra (4.133) e (4.134) è Rνλµ Γλρη −Γηρλ Rνηµ
λ η
= Γλρη (Rνλµ η
−Rνλµ ) = 0.

Lo stesso risultato si ritrova dalla regola di Leibniz (4.132):

Ricµν;ρ = (δκλ Rµλν


κ λ
);ρ = δκ;ρ κ
Rµλν + δκλ Rµλν;r
κ
= δκλ Rµλν;r
κ
(4.135)

dove δκλ è il simbolo di Kronecker, la cui derivata covariante è nulla.∗∗


Nel terzo lemma, consideriamo il tensore R[ di tipo (0, 4), definito abbassando l’indice
alto di R:
R[ (U, V, W, Z) := g(R(U, V, W ), Z) ∀ U, V, W, Z ∈ X(M), (4.136)
L’interesse è che le simmetrie di R[ sono più trattabili di quelle del tensore di Riemann.
∗∗
Il tensore le cui componenti sono δκλ è D := δκλ dxκ ⊗ ∂λ . La sua derivata covariante è

∇ρ (D) = (∂ρ δκλ )dxκ ⊗ ∂λ + δκλ ∇ρ dxκ ⊗ ∂λ + δκλ dxκ ⊗ ∇ρ ∂λ ,


= 0 − δκλ Γκρη dxη ⊗ ∂λ + δκλ dxκ ⊗ Γηρλ ∂η = −Γλρη dxη ⊗ ∂λ + Γηρλ dxλ ⊗ ∂η = 0.
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 103

Lemma II.7. Il tensore R[ ha componenti Rλµνκ = gλσ Rµνκ


σ . Soddisfano

Rλµνκ = Rνκλµ , simmetria nello scambio 12 ←→ 34, (4.137)


Rλµνκ = −Rµλνκ , Rλµνκ = −Rλµκν , antisimmetria nei scambi 1 ↔ 2 e 3 ↔ 4, (4.138)
Rλµνκ + Rλκµν + Rλνκµ = 0, ciclicita. (4.139)

Proof. La forma esplicita dei componenti di R[ si calcola della definizione

Rλµνκ := R[ (∂ν , ∂κ , ∂µ , ∂λ ) = g(R(∂ν , ∂κ , ∂µ ), ∂λ ) = g(Rµνκ


σ
∂σ , ∂λ ), (4.140)
σ σ
= Rµνκ g(∂σ , ∂λ ) = gλσ Rµνκ . (4.141)

La proprietà (4.139) segue dalla prima identità di Bianchi (3.247).


∗ Per il resto, tocca calcolare esplicitamente le componenti di R[ . Usando la formula

esplicite (3.182) per le componenti di R, e la formula dei simboli di Christoffel (3.237),


otteniamo
!
1    
Rλµνκ = gλσ ∂ν g σρ (∂κ gρµ + ∂µ gρκ − ∂ρ gµκ ) − ∂κ g σρ (∂ν gρµ + ∂µ gρν − ∂ρ gµν )
2
 
+ gλσ Γηµκ Γσνη − Γηµν Γσκη . (4.142)

Inserendo in (4.142)

gλσ ∂κ g σρ = −g σρ ∂κ gλσ = −g σρ Γηκλ gησ + Γηκσ gηλ



(4.143)

(la prima uguaglianza viene da 0 = ∂κ δλρ = ∂κ (gλσ g σρ ) = g σρ ∂κ gλσ + gλσ ∂κ g σρ , la seconda


da (3.238)), otteniamo
1 2 2 2 2

Rλµνκ = ∂κλ gµν − ∂κµ gλν − ∂νλ gµκ + ∂νµ gλκ (4.144)
2  
+ Γηκλ gησ + Γηκσ gηλ Γσνµ − Γηνλ gησ + Γηνσ gηλ Γσκµ + gλσ Γηµκ Γσνη − Γηµν Γσκη ,
 

1 2 
2 2 2
gλκ + gησ Γηκλ Γσνµ − Γηνλ Γσκµ .

= ∂κλ gµν − ∂κµ gλν − ∂νλ gµκ + ∂νµ (4.145)
2
Le proprietà (4.137) e (4.138) si verificano direttamente su (4.145).

Quest’ultimo lemma ha un corollario immediato e importante.


Corollario II.8. Il tensore di Ricci è simmetrico.
Proof. Dalle definizioni del tensore di Ricci e di R[ , insieme a (4.137), otteniamo
κ
Ricµν = Rµκν = g κλ Rλµκν = g κλ Rκνλµ = Rνλµ
λ
= Ricνµ .
Con i tre lemmi precedenti, siamo in grado di mostrare che la divergenza del tensore di
Ricci non è altro che la derivata della curvatura scalare R.
Proposizione II.9. La divergenza del tensore di Ricci è
1
(∇µ Ric)µν = ∇ν R. (4.146)
2
104 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Proof. Valutando la 1-forma dxλ sul vettore nullo, scritto come membro di sinistra dell’identità
di Bianchi (3.251) con X = ∂ρ , Y = ∂λ , Z = ∂µ , V = ∂ν , poi sommando su λ otteniamo

0 = hdxλ , (∇µ R)(∂ρ , ∂λ , ∂ν ) + (∇ρ R)(∂λ , ∂µ , ∂ν ) + (∇λ R)(∂µ , ∂ρ , ∂ν )i, (4.147)

= hdxλ , (∇µ R)κνρλ ∂κ i + hdxλ , (∇ρ R)κνλµ ∂κ i + hdxλ , (∇λ R)κνµρ ∂κ i, (4.148)

= (∇µ R)λνρλ + (∇ρ R)λνλµ + (∇λ R)λνµρ , (4.149)

= − (∇µ Ric)νρ + (∇ρ Ric)νµ + (∇λ R)λνµρ ∀µ, ν, ρ. (4.150)

dove nell’ultima riga si usa il lemma II.6 insieme a (∇µ R)λνρλ = −(∇µ R)λνλρ (quest’ultima
proprietà si si verifica sulla forma esplicita delle componenti di ∇µ R, calcolata in (4.133).
Moltiplicando (4.150) per g νρ , poi sommando su νρ, il primo termine dà:

− g νρ Ricνρ;µ = −(g νρ Ricνρ );µ = −R;µ (4.151)

dove si usa la notazione (4.131), la regola di Leibniz (4.132) con g νρ ;µ = 0, e la definizione


(3.262) di R†† . Definendo ∇κ := g κρ ∇ρ , il secondo termine dà

g νρ (∇ρ Ric)νµ = g νρ (gρκ ∇κ Ric)νµ = g νρ gρκ (∇κ Ric)νµ (4.152)


= δκν (∇κ Ric)νµ ν
= (∇ Ric)νµ =: ;ν
Ricνµ , (4.153)

mentre il terzo fa
 ;κ
g νρ Rνµρ;λ
λ
= g νρ gλκ Rνµρ
λ;κ
= g νρ gλκ Rνµρ
λ
, (4.154)
= (g νρ Rκνµρ );κ = (g νρ Rνκρµ );κ = (g νρ Rρµνκ );κ (4.155)
ν;κ
= Rµνκ = Ric;κ
µκ = Ric;κ
κµ , (4.156)

dove nella prima uguaglianza si alza l’indice di derivazione grazie alla metrica (in modo simile
a (4.154)) poi si usa la regola di Leibniz per la derivata covariante; nella le seconda riga si
usa il lemma II.7, e nell’ultima la simmetria del tensore di Ricci (corollario II.8). Sommando
(4.151), (4.153) e (4.156), troviamo che (4.150) si scrive

−R;µ + 2Ricνµ = 0. (4.157)

Scambiando ν e µ, non è altro che (4.146).

Osservazione II.10. ∗ Per dimostrare (4.151) dal calcolo diretto, si moltiplica la forma
esplicita delle componenti di ∇ρ Ric, calcolata in (4.134), da g νµ . Scambiando poi ν ↔ η nel
penultimo termine, e µ ↔ η nel ultimo, viene

g νµ (∇ρ Ric)νµ = g νµ ∂ρ Ricνµ − g ηµ Γνρη Ricνµ − g νη Γµρη Ricνµ . (4.158)

Usando R;ρ = ∂ρ (g νµ Ricνµ ) = ∂ρ (g νµ ) Ricνµ + g νµ ∂ρ Ricνµ , osserviamo che

R;ρ − g νµ (∇ρ Ric)νµ = ∂ρ g νµ + g ηµ Γνρη + g νη Γµρη Ricνµ .



(4.159)
††
per un calcolo diretto, cf l’osservazione II.10.
II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 105

Per dimostrare che il fattore tra parentesi è nullo, si parte dalla compatiblità con la metrica
∂ρ gηδ = gλδ Γλρη + gηλ Γλρδ . (4.160)
Moltiplicando entrambi membri da g µδ g ην e sommando su δ e η viene
g µδ g ην ∂ρ gηδ = g ην δλµ Γλρη + g µδ δλν Γλρδ = g ην Γµρη + g µδ Γνρδ . (4.161)
Il membro di sinistra è −g µδ (∂ρ g ην )gηδ = −δηµ (∂ρ g ην ) = −∂ρ g µν . Sostituendo l’indice muto δ
da η nell’ultimo termine di (4.161), si trova che (4.159) è nullo.

Se l’equazione (4.121) fosse l’equazione del campo gravitazionale, allora la condizione


(∇µ G)µν = 0 sarebbe equivalente a ∇ν R = 0, cioè R = Ricµµ = costante. Ma allora (4.121)
fa che anche T µµ sarebbe costante, il cui significa - tornando alla definizione (4.88) del tensore
energia impulso -
1
T µµ = g µν Tµν = ρ g µν Uµ Uν + P 2 g µν Uµ Uν − g µν gµν ,

(4.162)
c
= ρc2 + P (1 − 4) = ρc2 − 3P = costante, (4.163)
dove si usa g µν Uµ Uν = U ν Uν = c2 e g µν gµν = δµµ = 4 (cf (3.220)).
Ma ρc2 − 3P = costante costituisce una restrizione troppo forte sul tipo di materia
trattabile nel ambito della relatività generale. Per questo motivo (4.121) non può essere
l’equazione generale del campo gravitazionale (tuttavia vedremmo che costituisce il caso
particolare dell’equazione di Einstein nel vuoto).

II.4 Equazioni di Einstein

Definizione II.11. Il tensore di Einstein (o tensore geometrico) è il tensore di tipo (0, 2)


1
G := Ric − Rg (4.164)
2
Dalla proposizione II.9 segue che
1
(∇µ G)µν = G;µ ;µ
µν = Ricµν − (Rgµν ) ;µ , (4.165)
2
;µ 1 1
= Ricµν − gµν R ;µ = Ricµν ;µ
− R ;ν = 0. (4.166)
2 2
Inoltre, dal corollario II.8 il tensore di Einstein è simmetrico. Quindi è candidato per essere
il tensore geometrico dell’equazione (4.69).
Di fatti, nel 1915, Einstein scrisse l’equazione della relatività generale

8π G
G= c4
T (4.167)

Quest’equazione, anche chiamata equazioni di Einstein è l’equazione di tipo (4.69) tra mate-
ria e geometria che stavamo cercando. Stricto sensu non l’abbiamo dimostrata, ma ottenuta
come versione relativistica dell’equazione di Poisson, usando da una parte l’analogia tra de-
viazione geodetiche/accelerazione relativa newtoniana per legare il potenziale gravitazionale
alla curvatura, e dall’altra parte l’interpretazione fisica del tensore di energia impulso.
Quello che “dimostra” la validità dell’equazione di Einstein è la sua pertinenza in fisica:
106 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

• rida le equazioni di Newton in un limite adeguato (cf il prossimo capitolo);

• conduce a delle predizioni originali, che sono state verificate: perielio dei pianeti, devi-
azione della luce, redshift gravitazionale (cf capitolo 6), onde gravitazionali;

• produce oggetti nuovi come i bucchi neri, quasi scoperti sperimentalmente, (cf cap. 6);

• permette lo sviluppo di un modello di cosmologia - il Big-Bang - da cui certe predizione


sono state verificate di maniera spettacolare (e.g. la radiazione di fondo cosmologica);

• la dove le correzioni relativistiche alla teoria newtonniana sono rilevante (fisica delle
stelle, GPS etc), la relatività generale non è mai stata, finora, contradetta dall’esperimento.

Esistono altri modi di arrivare all’eq.(4.164). In particolare Hilbert l’ha ottenuta dall’azione
Z p
SEH [g] := R |det g| dV (4.168)
M
p
dove |det g| dV è la forma volume su M. Le metriche per cui quest’azione è estremale sono
le soluzioni dell’equazione di Einstein. Si può anche arrivare a (4.167) cercando il tensore
più generale che dipende solo della metrica e delle sue derivate al più del secondo ordine.
Variazioni su questi requisiti permettono di sviluppare modelli alternativi alla relatività gen-
erale. Finora nessuna variazione sembra portare a dei risultati sperimentalmente testati,
all’eccezione notevole dell’introduzione della costante cosmologica.
Nei tempi recenti, emerge anche l’idea che il problema della materia scura in cosmologia
potrebbe essere un indicazione che l’equazione di Einstein dovrebbe essere corretta.

Osservazione II.12. ∗ Il fattore 8 (invece di 4 che si aspettasse da (4.121)) si spiega nel


modo seguente. Prendendo la tracia di entrambi membri dell’equazione di Einstein, viene che
1
g µν Gµν = g µν Ricµν − Rg µν gµν = R − 2R = −R (4.169)
2
8πG
è uguale c4
T , con (cf (4.162))

T := g µν Tµν = ρc2 − 3P. (4.170)

Sostituendo R da − 8πG
c4
T in (4.167), otteniamo

8πG 1 8πG 1 
Ric = 4
T + Rg = 4 T − gT . (4.171)
c 2 c 2
Consideriamo osservatori comoventi col fluido, cioè con quadrivelocità U = U µ ∂µ uguale a
quella del fluido. Contrattando (4.171) viene

8πG 1 8πG c2
Ricµν U µ U ν = Tµν U µ ν
U − gµν U µ ν
U T ) = ρc4
− T) (4.172)
c4 2 c4 2
dove si nota che gµν U µ U ν = ||U ||2 = c2 e si usa (cf eq. (4.116))

Tµν U µ U ν = ρc4 . (4.173)


II. LE EQUAZIONI DEL CAMPO GRAVITAZIONALE 107

Gli osservatori comoventi sono al riposo rispetto al fluido, ed è ragionevole assumere che
l’energia di massa del fluido da loro misurata è ben superiore alle forze di taglio, cioè ρc2 >> P .
In questo caso, abbiamo da (4.170) che T ' ρc2 , e (4.172) diventa

ρc4
 
µ ν 8πG 4πG  4πG
Ricµν U U = 4 4
ρc − = 4 ρc4 = 4 Tµν U µ U ν . (4.174)
c 2 c c

Ritroviamo l’eq. (4.121) che ha motivato la forma delle equazioni della relatività generale.

Possiamo riassumere l’intero contenuto del corso finora dalle nelle seguente asserzioni.

• Lo spazio-tempo degli eventi è un varietà Lorentziana, la cui metrica è soluzione


delle equazioni di Einstein.

• Le linee d’universo di un corpo massivo sono delle curve di tipo tempo (delle geode-
tiche in caso di caduta libera ). Il tempo proprio lunghe queste traiettorie è (modulo
un fattore c) la lunghezza di queste curve.

• La luce segue delle geodetiche di tipo luce.

In realtà, si può dimostrare (cf referenze in Wald §4.3) che le equazioni di Einstein im-
plicano che un corpo sufficientemente leggero (cioè tale che la sua propria energia-impulso
non modifica tropo la geometria ambiente) deve seguire geodetiche. Le equazioni di Einstein
da solo contengono l’ipotesi geodetica. Le traiettorie di corpi più grandi, che sono sensibili
a effetto di marea, saranno deviazione intorno alle geodetiche. Però le loro traiettorie sono
sempre determinate dalle equazioni di Einstein.

Concludiamo questo capitolo sui fondamenti della relatività generale da un paio di osser-
vazioni, sia matematiche che fisiche.

• Le componenti del tensore di Riemman dipendono delle componenti gµν della metrica e
delle sue derivate fino al secondo ordine (incluso). Questa dipendenza è altamente non
lineare. Quindi le equazioni di Einstein sono equivalente ad un sistema di equazioni
alle derivate parziali di ordine 2, non lineari e non indipendenti, per i gµν . Inoltre non
sono in forma normale. Di conseguenza sono difficili da risolvere.
Un altrà difficoltà viene dal fatto che la metrica appare anche nel tensore energia im-
pulso. Data una certa situazione fisica, non è facile scrivere il tensore energia-impulso
associato senza conoscere a priori la geometria secondo la quale si organizza la materia.
Ma questo conoscenza a priori non è possibile, visto che la geometria è determinata
dall’equazione stessa. Vedremmo nei capitoli seguenti qualche esempio in cui le simme-
trie del problema permettono di risolvere esplicitamente le equazioni di Einstein.

• Principio di Mach: nella fisica pre-relativistica, e anche in relatività ristretta, la strut-


tura dello spazio-tempo è data una volta per bene. È vero che in relatività ristretta
la distinzione fra spazio e tempo dipende dall’osservatore, ma la struttura di spazio di
108 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE

Minkowski è fissata a priori. In particolare, questa struttura non dipende della presenza,
o no, di materia.
Questo discorso si può analizzare alla luce del principio di Mach che stipula che la
nozione d’“osservatore inerziale” ha senso solo rispetto a l’intera distribuzione di materia
nell’universo. Di fatti, il sistema di riferimento solidale alla Terra è un sistema d’inerzia
(cioè in cui vale il principio d’inerzia: un corpo sottomesso a nessun forza ha un moto
rettilineo uniforme) solo se si trascurano gli effetti dovuti alla rotazione della Terra
sul suo asse e intorno al Sole. Lo stesso vale per il sistema di riferimento solidale al
Sole, in cui si trascurano gli effetti del moto del Sole dentro la galassia, e cosi vià. Per
Newton, il principio d’inerzia vale rispetto a uno spazio assoluto. Ma nel universo non
c’è nessun corpo reale a cui attaccare questo spazio assoluto. E quindi Mach , al inizio
del 900, aveva sviluppato l’idea che tutta la materia nell’universo dovrebbe contribuire
alla nozione locale di “sistema inerziale”. In un certo senso (cf discussion in Weinberg
§3.7), la relatività generale realizza questa idea, dando un modello fisico e matematico
preciso secondo cui la materia determina la geometria dello spazio-tempo.

• La rivoluzione incompleta: con la relatività generale, lo spazio-tempo diventa un attore


dinamico della fisica. Prima della relatività, lo spazio-tempo fornisce il palcoscenico su
cui si svolge la fisica; con la relatività generale, il palcoscenico stesso è un attore della
rappresentazione teatrale (cf ad esempio in vari testi di Rovelli). Questo costituisce
un cambiamento importante nella fisica, e ha delle conseguenze che ancora non sono
tutte capite. In particolare l’aspetto dinamico dello spazio-tempo rende molto difficile
l’elaborazione di una teoria che incorpore gli effetti dell’altrà rivoluzione in fisica del
XXsimo secolo, la fisica quantistica. Ancora oggi, l’elaborazione di una teoria quantis-
tica della gravitazione è un problema aperto.
Parte 2
Soluzioni e applicazioni

109
110 CHAPTER 4. FONDAMENTI DELLA RELATIVITÀ GENERALE
Chapter 5

Soluzione linearizzata

Come prima applicazione, studiamo la versione linearizzata dell’equazione di Einstein,


cioè lo sviluppo della teoria nel primo ordine di perturbazione, intorno alla metrica piatta di
Lorentz. Questa teoria linearizzata permette di ritrovare poi la teoria newtoniana nel limite
delle piccole velocità. Inoltre, la soluzione linearizzata mette in evidenza una prima novità
della relatività generale: l’esistenza di onde gravitazionale.

I Linearizzazione delle equazioni di Einstein


I.1 Sviluppo nel primo ordine del tensore geometrico

Si considera una varietà Lorentziana M munita da una carta {xµ }, insieme a una famiglia
di metriche g(λ) con λ un parametro reale in un intervallo [0, λmax ) tale che g(0) = η sia la
metrica di Lorentz (2.51). Per  un piccolo valore del parametro, abbiamo

dgµν
gµν () = ηµν + hµν + O 2

dove hµν :=  . (5.1)
dλ |0

L’approssimazione lineare consiste a sviluppare la metrica, la connessione di Levi-Civita, i


tensori di Riemann, Ricci, la curvatura scalare, i tensori geometrico e energia-impulso, e
finalmente l’equazioni di Einstein nel primo ordine in .
Iniziamo dalla metrica, la cui deviazione dal piatto, nel primo ordine in  è

gµν = ηµν + hµν . (5.2)

Si nota che hµν = hνµ , quindi (5.2) sono le componenti di un tensore simmetrico.
Per evitare confusione nel ordine in  quando contrattiamo gli indici, useremmo η µν per
alzare gli indici (e ηµν per abbassarli). Ad esempio

hλµ := η λν hµν , hλρ = η λµ hλµ . (5.3)

Fa eccezione il tensore metrico stesso: le componenti di g −1 sono sempre denotate g µν . Al


primo ordine abbiamo
g µν = η µν − hµν . (5.4)

111
112 CHAPTER 5. SOLUZIONE LINEARIZZATA

Di fatti, si verifica che

gµν g νλ = ηµν + hµν η νλ − hνλ = δµλ − ηµν hνλ + hµν η νλ + O(2 ),


 

= δµλ − hλµ + hλµ + O(2 ) = δµλ + O(2 ). (5.5)

Per calcolare le componenti dei vari tensori al primo ordine, notiamo che ηµν essendo
costante, ∂λ gµν = ∂λ hµν è del primo ordine in  e omogeneo (cioè non contiene termine di
ordine 0). Perciò, calcolando i coefficienti (3.242) della connessione di Levi-Civita con gµν ,
g µν dati da (5.2) e (5.4), otteniamo nel primo ordine in 

(1) ρ 1
= η ρλ ∂µ hνλ + ∂ν hµλ − ∂λ hµν .

Γµν (5.6)
2
Quest’espressione è omogenea di ordine 1 in , perciò lo sviluppo dei coefficienti (3.182) del
tensore di Riemann dà
(1) λ
Rρµν = ∂µ (1) Γλνρ − ∂ν (1) Γλµρ . (5.7)
Seguono i sviluppi del tensore di Ricci,
ρ
(1)
Ric µν =(1) Rµρν = ∂ρ (1) Γρνµ − ∂ν (1) Γρρµ , (5.8)
1  1
= η ρλ ∂ρ ∂ν hµλ + ∂µ hνλ − ∂λ hνµ − η ρλ ∂ν ∂ρ hµλ + ∂µ hρλ − ∂λ hρµ

2 2
1 λ  1
= ∂ ∂ν hµλ + ∂µ hνλ − ∂λ hνµ − ∂ν ∂ λ hµλ + ∂µ hλλ − ∂ ρ hρµ

(5.9)
2 2
1 λ
 
= ∂ (∂ν hµλ + ∂µ hνλ ) − ∂ λ ∂λ hνµ − ∂ν ∂µ h , (5.10)
2
dove si definisce
h := hλλ ; (5.11)
della curvatura scalare,
(1)
R = η µν (1) Ricµν , (5.12)
1 λ µ 
= ∂ (∂ hµλ + ∂ ν hνλ ) − ∂ λ ∂λ hµµ − ∂ µ ∂µ h = ∂ λ ∂ µ hµλ − ∂ λ ∂λ h; (5.13)
2
e del tensore di Einstein (4.164)

(1) 1
Gµν =(1) Ricµν − ηµν (1) R, (5.14)
2
1 λ  1
= ∂ (∂ν hµλ + ∂µ hνλ ) − ∂ λ ∂λ hνµ − ∂ν ∂µ h − ηµν ∂ λ ∂ σ hσλ − ∂ λ ∂λ h ,

(5.15)
2 2
1 λ λ
 1 λ σ
= ∂ (∂ν h̃µλ + ∂µ h̃νλ ) − ∂ ∂λ h̃νµ − ηµν ∂ ∂ h̃σλ (5.16)
2 2
dove si definisce
1
h̃µν = hµν − ηµν h. (5.17)
2
Si nota che (5.16) è lineare in h̃µν , e contiene oltre al termine “laplaciano” ∂ λ ∂λ dei termini
di “divergenza” del tipo ∂ λ h̃λν . Mostriamo nel paragrafo seguente che è possibile cancellare
questi termini “di divergenza” scegliendo in modo giudizioso le coordinate.
I. LINEARIZZAZIONE DELLE EQUAZIONI DI EINSTEIN 113

I.2 Gauge armonica

Consideriamo un cambiamento di coordinate xµ 7−→ x0µ := xµ + f µ (x), dove le funzioni


f µ sono del primo ordine in , cioè f µ = F µ per qualche F µ ∈ C ∞ (M).
Proposizione I.1. Nelle coordinate {x0µ }, la metrica g ha componenti
0
gµν = ηµν + h0µν dove h0µν = hµν − ∂ν fµ − ∂µ fν . (5.18)

Proof. Le componenti di g 0 seguono dalla legge (3.89):

0 ∂x0α ∂x0β 0
δµα + ∂µ f α δνβ + ∂ν f β .
 
gµν = gαβ µ ν
= gαβ (5.19)
∂x ∂x
Sostituendo gµν da (5.2) e gαβ0 da ηαβ + h0αβ dove h0αβ denota la differenza tra g e η scritta
nelle coordinate {x0α }, viene (sempre nel primo ordine in )

ηµν + hµν = ηαβ + h0αβ δµα + ∂µ f α δνβ + ∂ν f β ,


  
(5.20)
α β α β α β 0 α β 0

= ηαβ δµ δν + δµ ∂ν f + ∂µ f δν + hαβ δµ δν = ηµν + ∂ν fµ + ∂µ fν + hµν . (5.21)

Il cui significa hµν = h0µν + ∂ν fµ + ∂µ fν , cioè (5.18).

In modo analogo a (5.11) e (5.17), si definiscono


1
h0 := h0λ
λ e h̃0 µν := h0µν − ηµν h0 . (5.22)
2

Lemma I.2. Uno ha ∂ν h̃0 µν = ∂ν h̃µν − ∂ν ∂ ν f µ .


Proof. * Dalla forma (5.18) di h0µν , viene h0 = h − 2∂ λ fλ . Cosı̀,

1
h̃0 µν := hµν − ∂ν fµ − ∂µ fν − ηµν (h − 2∂ λ fλ ) = h̃µν − ∂ν fµ − ∂µ fν + ηµν ∂ λ fλ , (5.23)
2
dove la seconda uguaglianza viene dalla definizione (5.17) di h̃µν . Alzando gli indice con la
metrica di Lorentz, e derivando rispetto a ν, otteniamo
µν
∂ν h̃0 = ∂ν h̃µν − ∂ν ∂ ν f µ − ∂ν ∂ µ f ν + η µν ∂ν ∂ λ fλ , (5.24)
µν ν µ µ ν µ λ µν ν µ
= ∂ν h̃ − ∂ν ∂ f − ∂ν ∂ f + ∂ ∂ fλ = ∂ν h̃ − ∂ν ∂ f , (5.25)

dove nell’ultima equazione si usa ∂ν f ν = ηλν ∂ λ f ν = ∂ λ ηλν f ν = ∂ λ fλ .

Scegliendo f µ tale che∗ ∂ν ∂ ν f µ = ∂ν h̃µν per ogni µ, viene

∂ν h̃0µν = 0 ∀µ. (5.26)

Questa scelta di coordinate {x0µ } è chiamata gauge armonica, analogo per la relatività gen-
erale della gauge di Lorenz ∂ µ Aµ = 0 in elettromagnetismo. Le coordinate tale che valga
(5.26) sono le coordinate armoniche.

Si dimostra che per una perturbazione hµν sufficientemente regolare - che è il caso nei problemi fisici che
ci interessano - esiste sempre una soluzione all’equazione ∂ν ∂ ν f µ = ∂ν h̃ ν .
114 CHAPTER 5. SOLUZIONE LINEARIZZATA

Lo sviluppo del tensore di Einstein in queste coordinate è dato da (5.16) con coordinate
“prime”. Usando (5.26) - riscritto come ∂ ν h̃0µν = 0 - rimane solo il termine laplaciano

1
(1)
G0µν = − ∂ λ ∂λ h̃0νµ . (5.27)
2
0 lo sviluppo al primo ordine in  del tensore energia-impulso nelle coordinate
Denotando (1) Tµν
armoniche,  
0 0 0 1 0 0 0
Tµν = ρ Uµ Uν + P U U − gµν (5.28)
c2 µ ν
0
con gµν dato da (5.18) e U 0µ la quadri-velocità del fluido di materia nelle coordinate ar-
moniche; l’equazione di Einstein nel primo ordine in  si scrive

16πG
∂ λ ∂λ h̃0µν = − (1) 0
Tµν ∀µ, ν. (5.29)
c4

Si tratta da un sistema di equazioni differenziali lineari in h0µν (al contrario dell’equazione


originale (4.167), fortemente non-lineare in gµν ), chiamata equazioni di Einstein linearizzate.
Costituiscono il limite della relatività generale quando la metrica è quasi-piatta, e sono le
equazioni rilevante per descrivere un sistema fisico in situazione di campo gravitazionale
debole. Studiarne le soluzioni generali esce dell’ambito di questo corso. Ci limiteremo a due
applicazioni: il limite newtoniano e le onde gravitazionali.
Da adesso in poi scriviamo {xµ } (senza prime) le coordinate armoniche. Tutte le componenti
dei tensori sono scritte - senza prime - rispetto a queste coordinate.

II Approssimazione Newtonianna
Un primo interesse della teoria linearizzata è che permette di ritrovare la teoria newtoniana
nel limite in cui le velocità degli ossevatori e della materia (descritta dal tensore energia-
impulso), rispetto al sistema di coordinate armoniche, è trascurabile davanti alla velocità
0
della luce. Significa che il tempo proprio τ si identifica alla coordinata temporale t = xc del
sistema di coordinate armonica. Perciò le componenti U 0µ della quadrivelocità nel sistema
armonica sono quasi-uguale alla loro espressione nel sistema comovente:

U 00 ' c, U 0i << 1. (5.30)

Questo vale sia per gli osservatori che per la distribuzione di materia.

II.1 Potenziale gravitazionale

Nell’approssimazione (5.30) il termine dominante in (5.28) è

T00 ' ρc2 . (5.31)

Tutti gli altri termini in (5.28) sono al più in c, e le trascuriamo: Tµν ' 0 per µ 6= 0 e/o
ν 6= 0. Inoltre, la sorgente del campo gravitazionale (i.e. la distribuzione di materia) avendo
II. APPROSSIMAZIONE NEWTONIANNA 115

velocità piccola, si aspetta che la geometria dello spazio-tempo cambia lentamente. Ci invita
a cercare soluzioni dell’equazione linearizzata (5.29) tale che

∂0 hµν = 0 ∀µ, ν. (5.32)

Questo implica ∂0 h̃µν = 0: le funzioni h̃µν dipendono solo dalle coordinate spaziali xi , dunque
∂ λ ∂λ h̃µν = ∂ i ∂i h̃µν = −∆h̃µν dove ∆ è il Laplaciano (spaziale). L’equazione di Einstein
generalizzata (5.29) è allora equivalente al sistema

16πG
∆h̃µν = 0 ∀ µ, ν tranne ∆h̃00 = ρ. (5.33)
c2

• La prima eq. (5.33) indica che le funzioni h̃µν (trane per µ = ν = 0) sono armoniche. Si
sa dall’analisi armonica che tale funzioni raggiungono i loro valori estremali sul bordo
del loro dominio. Per motivi di isotropia, è naturale imporre h̃µν (x) = h̃µν (−x). Ma
allora h̃µν deve essere costante, senno presenterebbe un estremum locale in 0 (che non
è sul bordo del dominio). Modulo un ulteriore cambiamento di coordinate, si può
assumere che tutte le funzioni h̃µν (tranne h̃00 ) sono nulle.

• La seconda eq. (5.33) non è altra che l’equazione di Poisson ∆φ = 4πGρ per il potenziale

c2
φ := h̃00 . (5.34)
4

La dipendenza di questo potenziale nella perturbazione iniziale h00 si calcola facilmente.


c2
Proposizione II.1. Uno ha φ = 2 h00 .

Proof. Dalla definizione (5.17) di h̃µν abbiamo

1
h̃µµ = hµµ − δµµ h = h − 2h = −h. (5.35)
2

L’annullamento di tutte le h̃µν tranne h̃00 fa che h̃µµ = η µν h̃µν = η 00 h̃00 = h̃00 . Quindi (5.35)
dà
h̃00 = −h. (5.36)
Inserendo quest’uguaglianza in (5.17) (ricordandosi che η00 = 1), otteniamo

1 1
h̃00 = h00 − η00 h = h00 + h̃00 , (5.37)
2 2
c2
oppure h̃00 = 2h00 . Inserto in (5.34) dà φ = 2 h00 .

Il potenziale φ cosı̀ definito soddisfa rispetto alla densità di materia le stesse proprietà del
potenziale gravitazionale newtonianno (i.e. l’equazione di Poisson), e ha la dimensione giusta
(una velocità al quadrato, visto che h00 è senza dimensione). Quindi è un buon candidato
per essere il potenziale gravitazionale. Però tocca verificare che il suo gradiente dà la forza
di gravitazione di Newton.
116 CHAPTER 5. SOLUZIONE LINEARIZZATA

II.2 Legge di Newton

Sia un corpo un caduta libera lungo una geodetica γ, parametrizzata dal suo tempo
proprio. Lo sviluppo nel primo ordine in  di Γλµν γ̇ µ γ̇ ν è (1) Γµνλ γ̇ ν γ λ . Nell’approssimazione
delle piccole velocità (5.30), l’equazione delle geodetiche (3.127) si reduce a
(1) µ 2
γ̈ µ + Γ00 c =0 ∀µ. (5.38)
Usando l’ipotesi (5.32) di “cambiamento lento” nella formula (5.6) della connessione, viene
(1) µ 1 1 1
Γ00 = − η µλ ∂λ h00 = − ∂ µ h00 = − 2 ∂ µ φ. (5.39)
2 2 c
Da (5.32) e la proposizione II.1, viene ∂ 0 φ = 0. Perciò per µ = 0, l’eq. (5.39) dà (1) Γ000 = 0,
dunque γ̈ 0 = 0. Invece, per µ = i = 1, 2, 3 otteniamo dall’equazione delle geoedetiche
(ricordandosi che ∂i = −∂ i )
γ̈ i = −∂i φ. (5.40)
Identificando γ̈i con la componenti ai dell’accelerazione lungo la traiettoria, viene
a = −∇φ, (5.41)
cioè la legge di gravitazione di Newton nella forma (4.92).
Per avere un idea di quanto lo spazio-tempo viene curvato dal campo gravitazionale,
2
sostituiamo h00 da g00 − η00 = g00 − 1 nell’espressione di φ. Viene φ = c2 (g00 − 1), cioè

g00 = 1 + . (5.42)
c2
Si trova che 2φ
c2
è dell’ordine di 10−39 alla superficie di un protone, 10−9 a quella della Terra,
10−6 a quella del Sole, e 10−4 alla superficie di una nana bianca: la deviazione dalla metrica
piatta dovuto a campi gravitazionali “deboli” è molto piccola.

III Onde gravitazionale


L’equazione di Einstein linearizzata (5.29) nel vuoto è
∂ λ ∂λ h̃µν = 0. (5.43)
∂λ∂ ∂02 − 2
P
L’operatore λ = i ∂i
è l’operatore di d’Alembert, e l’equazione (5.43) è un equazione
di propagazione d’onda. Significa che le perturbazioni della metrica si propagano. In altre
parole, esistono delle onde gravitazionali !
Questo è una novità della relatività generale (nella teoria di Newton, la gravitazione
essendo un interazione instantanea non si propaga). Circa cento anni dopo la loro predizione,
le onde gravitazionali sono state osservate nel 2015 dalle esperienze LIGO-VIRGO.
Osservazione III.1. L’equazione (5.43) è anche quella scritta in 1939 da Fierz e Pauli per
descrivere la propagazione di una particelle senza massa di spin 2. Se esistesse una particella
associata alle onde gravitazionale, sarebbe quindi la prima particella elementare di spin 2:
i fermioni (elettrone, neutrino, quarks) hanno spin 21 , il fotone spin 1 (come i bosoni W e
Z dell’interazione debole, e i gluoni dell’interazione forte), il bosone di Higgs ha spin 0. A
notare che quest’interpretazione a senso solo nell’approssimazione lineare. Senza una metrica
piatta “di fondo”, non è chiaro cosa significa lo spin.
Chapter 6

Soluzione di Schwarzschild

Nel 1916, Schwarzschild trovò la prima - e fino a oggi forse la più importante - soluzione
esatta delle equazioni di Einstein nel vuoto,
1
Ric − gR = 0. (6.1)
2
La soluzione di Schwarzschild descrive il campo gravitazionale al di fuori di una massa sferica.
Permette il calcolo esatto degli effetti post-newtoniani più famosi della relatività generale:
perielio dei pianeti nel sistema solare, deviazione della luce dovuto al Sole, spostamento verso
il rosso della luce dentro il campo gravitazionale (ed altri effetti che non studieremmo qui,
come l’effetto Shapiro o la precessione dei giroscopi in orbite).

Osservazione I.1. Contrattando (6.1) scritta in componenti con g µν , viene


 
µν 1
0=g Ricµν − gµν R = R − 2R = 0, (6.2)
2

cioè R = 0. Ma allora (6.1) implica Ricµν = 0. Le soluzioni dell’equazione di Einstein nel


vuoto sono gli spazi-tempi con tensore di Ricci nullo.

I Metrica di Schwarzschild
I.1 Spazio-tempo stazionario, statico e a simmetria sferica

Come trattare l’idea di una “massa sferica” nel formalismo della geometria differenziale ?
Ovviamente l’idea di simmetria sferica non si rapporta allo spazio-tempo-intero, ma alla sua
parte spaziale. Però quest’asserzione ha senso solo se siamo in gradi di dividere lo spazio-
tempo quadridimensionale M in famiglia continua di sotto-varietà tridimensionali Mt di tipo
spazio (cioè tale che ogni curva in Mt - t fissato - sia di tipo spazio). Tecnicamente si tratta
di effettuare una fogliazione di M (cf figura 6.1).
Affinché il parametro t della fogliazione possa essere interpretato come tempo, deve es-
istere una nozione di traslazione temporale, cioè dato un valore ∆t, esiste una mappa definita
su tutto M tale che ogni Mt sia mandato in Mt+∆t . Lo spazio-tempo è detto stazionario se
sotto l’azione di questa traslazione temporale la geometria non cambia (al passare del tempo
non cambia niente, trane il fatto che si va più avanti nella coordinata t).

117
118 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

Figure 6.1: Due fogliazioni di R3 : a sinistra, le foglie sono dei piani e la restrizione della
metrica euclidea di R3 induce su ognuna la metrica euclidea R2 . A destra, le foglie sono delle
sfere (con parametro t il raggio r), la metrica indotta è un multiplo r2 gsf della metrica gsf
della sfera unità.
Matematicamente, quest’idea viene implementata dalla nozione di isometria. Si comincia
per estendere il pull-back (definito per un campo di 1-forma in cap. 3, §III.4) a qualunque
tensore di tipo (0, k). Ad esempio, il pullback della metrica sotto un diffeomorfismo φ ∈
Diff(M) è il tensore φ∗ g di tipo (0, 2) definito da

(φ∗ g)(U, V ) := g(φ∗ U, φ∗ V ) ∀ U, V ∈ X(M), (6.3)

con φ∗ la mappa differenziale associata a φ.


Definizione I.1. Un isometria è un diffeomorfismo φ di M tale che φ∗ g = g.
Le isometrie sono stabili sotto composizione di diffeomorfismi: datti due isometrie φ, ψ
allora φ ◦ ψ è un isometria. È un ovvio corollario del seguente lemma.
Lemma I.2. Per ogni φ, ψ ∈ Diff(M), uno ha (φ ◦ ψ)∗ g = ψ ∗ φ∗ g .


Proof. * Sia ψ, φ ∈ Diff(M). Da (6.3), il tensore φ∗ g valutato in p ha componenti

(φ∗ g)µν (p) = (φ∗ g)p (∂µ |p , ∂ν |p ) = gφ(p) (φ∗ ∂µ |p , φ∗ ∂ν |p ) = gαβ (φ(p)) ∂µ φα|p ∂ν φβ|p , (6.4)

dove si usa (3.93): φ∗ ∂µ |p = ∂µ φα|p ∂α |φ(p) , φ∗ ∂ν |p = ∂ν φβ|p ∂β | . Cosı̀, (φ◦ψ)∗ g ha componenti


φ(p)

(φ ◦ ψ)∗ g (p) = gαβ φ(ψ(p) ∂µ (φ ◦ ψ)α|p ∂ν (φ ◦ ψ)β|p ,


 
µν
(6.5)
  
= gαβ (φ ψ(p) ∂κ φα|ψ(p) ∂µ ψ|κp ∂λ φβ| ∂ν ψ|λp , (6.6)
ψ(p)
   
∗ κ
ψ(p) ∂µ ψ|p ∂ν ψ|p = ψ φ∗ g
λ ∗

= φ g (p). (6.7)
κλ µν

Questo dimostra che (φ ◦ ψ)∗ (g) = ψ ∗ (φ∗ g) per qualunque diffeomorfismi φ, ψ.

L’insieme Iso(M, g) delle isometrie di (M, g) è un gruppo per la composizione di diffeomor-


fismi (con inverso l’inverso dei diffeomorfismi, e elemente neutro il diffeomorfismo p 7→ p).
I. METRICA DI SCHWARZSCHILD 119

Oltre a preservare la geometria, l’evoluzione temporale è transitiva: una traslazione tem-


porale di ampiezza ∆t1 seguita da una di ampiezza ∆t2 è uguale ad una traslazione di
ampiezza ∆t1 + ∆t2 . Per questo motivo, si richiede che la traslazione temporale venga im-
plementata come gruppo a 1-parametro di isometrie, cioè una mappa

φ : R → Iso(M, g) (6.8)
t 7→ φt tale che φt+s = φt ◦ φs ∀s, t ∈ R. (6.9)

Ovviamente, per descrivere un evoluzione temporale, une tale gruppo deve essere tale che le
orbite di qualunque punto p, cioè la curva

t 7→ φt (p) t ∈ R, (6.10)

siano di tipo tempo. Arriviamo cosı̀ alla definizione precisa di stazionarità.

Definizione I.3. Uno spazio-tempo è stazionario se esiste un gruppo a 1-parametro di isome-


trie, le cui orbite sono sone delle curve di tipo tempo.

Tocca poi definire le sezioni spaziali. Uno spazio tempo-tempo è statico se è stazionario e se
esiste un’ipersuperficie Σ (i.e. una sotto-varietà tridimensionale)
n ortogonale alle o orbite (6.8),
cioè ad ogni punto p di Σ, esiste una base ortonormale ∂t |p , ∂x1 |p , ∂x2 |p , ∂x3 |p di Tp M tale
che ∂t |p sia tangente all’orbite (6.10) di p in t = 0, mentre i vettori ∂xi |p siano in Tp Σ.
L’ipersuperficie Σ costiuisce la sezione spaziale dello spazio statico al tempo 0. La sezione
spaziale al tempo t è l’unione
Σt := ∪ φt (p). (6.11)
p∈Σ

La forma generale della metrica in uno spazio statico è

ds2 = V 2 (x) dt2 − dl2 (6.12)

dove
dl2 = hij (x) dxi dxj i, j = 1, 2, 3 (6.13)
è una metrica riemanniana tridimensionale su ogni Σt . Che V e hij siano delle funzioni solo
dei xi e non di t è caratteristico dai spazi-tempi stazionari. L’assenza di termini in dxi dt è
dovuto all’aspetto statico (garantische che ∂t sia ortogonale a ∂i )∗
Uno spazio statico (M, g) è a simmetria sferica se il suo gruppo di isometrie Iso(M, g)
contiene un sottogruppo isomorfo al gruppo delle rotazioni spaziali SO(3), tale che l’orbita

Op := ∪ φ(p) (6.15)
φ∈SO(3)


(Per una discussione approfondita, cf capitolo 9 di Rindler, Relativity, Oxford University Press, 2001). Da
adesso in poi, utilizziamo la notazione molto diffusa ds2 = gµν dxµ dxν per specificare la metrica, invece della
notazione tensoriale g = gµν dxµ ⊗ dxν . Uno chiama ds elemento di lunghezza, in referenza (4.14):
r
ds dcµ dcν p
ds = dt = gµν dt = gµν dcµ dcν . (6.14)
dt dt dt
120 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

forma una sotto-varietà bidimensionale della sezione spaziale Σt a cui appartiene p. La


metrica (6.12) induce una metrica su ogni Op , p ∈ M, che per motivo di invarianza per
SO(3), deve essere un multiplo della metrica della sfera unità,

ds2sf = dθ2 + sin2 θdφ2 .



(6.16)

Per passare dalla metrica bidimensionale ds2sf a quella tridimensionale dl2 , serve una terza
coordinata oltre a θ e φ. Nello spazio euclideo R3 , è il raggio r della sfera (di fatti la metrica
in coordinate sferiche è dr2 + r2 ds2sf , cf (3.267)† ). In uno spazio statico arbitrario, non è
possibile definire la terza coordinata nello stesso modo, perchè non è detto che le sfere Op
abbiano un centro rispetto a cui misurare il raggio.‡ Tuttavia, ognuna di queste sfere ha
un’area A, la cui permette di definire in modo intrinseco la coordinate radiale
r
A
r := . (6.17)

Si dimostra allora che la metrica di un qualunque spazio statico a simmetria sferica è

ds2 = eA(r) dt2 − eB(r) dr2 − r2 (dθ2 + sin2 θ dφ2 ) (6.18)

dove A B sono delle funzioni reali della coordinate radiale r.

Esempio I.4. ∗ Con A(r) = B(r) = 0, si ritrova la metrica di Lorentz: ds2 = dt2 − dr2 −
r2 ds2sf : lo spazio di Minkowski è statico a simmetria sferica.
La fogliazione di R3 a sinistra della figura 6.1, munita della metrica dt2 − (dx2 + dy 2 ),
costituisce uno spazio statico. Invece, la fogliazione di destra munità della metrica ds2 = dt2 −
t2 d2sf non è stazionaria (le metriche su ogni foglia non sono uguali, ma solo proporzionali).

I.2 Soluzione delle equazioni di Einstein nel vuoto

Il calcolo del tensore di Ricci per una metrica (6.18) qualunque dà §

1 1 1 B0
Ricrr = A00 − A0 B 0 + A02 − , (6.19)
2 4 4 r
1 1 1 A0 
Rictt = −eA−B A00 − A0 B 0 + A02 + , (6.20)
2 4 4 r
 1 
Ricθθ = e−B 1 + r A0 − B 0 − 1,

(6.21)
2
Ricφφ = Rθθ sin2 θ, (6.22)
Ricµν = 0 per µ 6= ν. (6.23)
d
dove primato “ ’ ” significa dr . L’annullamento del tensore di Ricci (cf osservazione I.1)
implica che −e−(A−B) Rictt = 0 sia uguale a Ricrr , da cui segue

A0 = −B 0 , (6.24)

θ in (3.267) corrisponde a θ − π2 in (6.16).

cf Wald “General Relativity”, §6.1, dopo eq. (6.1.4).
§
cf capitolo 11 di W. Rindler, “Relativity”, Oxford University Press 2009.
I. METRICA DI SCHWARZSCHILD 121

k
cioè A = −B + k, con k una constante che si assorbi in (6.18), ri-definendo t → e− 2 t (difatti:
eA dt2 diventa eA−k dt2 ). Quindi
A = −B. (6.25)
Con (6.24) e (6.25), l’eq. (6.21) si scrive eA (1 + rA0 ) = 1 oppure, definendo α := eA :

α + rα0 = (rα)0 = 1 (6.26)

che - per r 6= 0 - si integra in


C
α(r) = 1 + con C una constante. (6.27)
r
Per r tale che α(r) 6= 0, sostituendo eA , eB da α(r), α(r)−1 in (6.18), troviamo la metrica di
Schwarzschild

C 2  C −1 2  
ds2 = 1 + dt − 1 + dr − r2 dθ2 + sin2 θ dφ2 . (6.28)
r r

Questa metrica non è definita in r = 0, −C, e tende alla metrica di Lorentz per r → ∞:
C C −1 C
gtt = 1 + → 1, grr = −(1 + ) → −(1 − ) → 1. (6.29)
r r r
Lo spazio di Schwarzschild (i.e. M munito da la metrica (6.28)) ha quindi due singolarità,
ed è assimptoticamente piatto. Le singolarità saranno discusse nella sezione III.4. Per quanto
riguarda il limite piatto invece, alla luce del capitolo precedente (cf (5.42)), interpretiamo
gtt = 1 + Cr a r grande come 1 + 2φ c2
, dove φ è il potenziale gravitazionale sentito da un
osservatore a r grande. Siccome il potenziale gravitazionale generato - classicamente - in r
da una massa M è φ = − GM r , invece di C definiamo la costante M ponendo

GM
C =: −2 . (6.30)
c2
Il raggio di Schwarzschild è il valore rs di r per cui Cr = −1, cioè
 
2GM M
rs = ' 3 km (6.31)
c2 M◦

dove M◦ è la massa del Sole. Se la distribuzione di materia all’origine della massa M ha un


raggio superiore al suo raggio di Schwarzschild, allora là dove la metrica di Schwarzschild
presenta una singolarità, la soluzione di Schwarzschild non è più valida perchè lo spazio non
è più vuoto. Di conseguenza, la metrica di Schwarzschild descrive il campo gravitazionale al
di fuori di un corpo sferico di massa M - con velocità di rotazione piccola rispetto a c, e senza
carica elettrica - dal momento che il suo raggio è superiore al suo raggio di Schwarzschild.
Ad esempio: il Sole (il suo raggio è ' 700000km, ben superiore a rs =' 3km).

Osservazione I.5. Si dimostra (teorema di Birkhoff ) che la soluzione di Schwarzschild è


la soluzione generale dell’equazione di Einstein nel vuoto per uno spazio a simmetria sferica
(senza assumere a priori che sia stazionario statico).
122 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

I.3 Campo di Killing

Un campo di Killing è un campo tangente alle orbite (6.10) di un gruppo a 1-parametro


di isometrie (vale per qualunque isometrie, non necessariamente di tipo tempo).
Proposizione I.6. Un campo di Killing V = V µ ∂µ soddisfa l’equazione di Killing
(∇µ V )ν + (∇ν V )µ = 0. (6.32)
Proof. * Un isometria infinitesimale φ manda il punto p di coordinate pµ in p0 di coordinate
φ (p)µ = pµ + Vpµ . La mappa differenziale manda ∂µ |p nel vettore V∗ := φ∗ (∂µ |p ) in Tφ (p) M
di componenti (cf (3.93)):
∂φ (p)α
V∗α = = δµα +  ∂µ V α |p . (6.33)
∂xµ
Nel primo ordine in , abbiamo
gφ (p) (V∗ , V∗ ) = gαβ (p + Vp ) V∗α V∗β ,

= gαβ (p)δµα δνβ +  V σ (p) ∂σ gαβ |p δµα δνβ + gαβ (p)∂µ V α |p δνβ + gαβ (p)∂ν V β |p δµα ,

 
σ α β
= gµν (p) +  V (p) ∂σ gµν |p + gαν (p)∂µ V |p + gµβ ∂ν V |p . (6.34)
φ essendo un isometria, gφ (p) (V∗ , V∗ ) = gp (∂µ , ∂ν ) = gµν (p), dunque il termine del primo
ordine in (6.34) si deve annullare. Ma questo termine non è altro che
(∇µ V )ν + (∇ν V )µ = ∂µ Vν + ∂ν Vµ − Γλµν Vλ − Γλνµ Vλ , (6.35)
= ∂µ (gνα V α ) + ∂ν (gµβ V β ) − g λσ ∂µ gνσ + ∂ν gµσ − ∂σ gµν Vλ ,

(6.36)
α α β β σ

= V ∂µ gνα + gνα ∂µ V + V ∂ν gµβ + gµβ ∂ν V − V ∂µ gνσ + ∂ν gµσ − ∂σ gµν ,
= gνα ∂µ V α + gµβ ∂ν V β + V σ ∂σ gµν ,

Esempio I.7. I campi di Killing dello spazio di Minkowski sono i campi tangenti alle trasfor-
mazioni del gruppo di Lorentz: 4 traslazioni spazio-temporali, 3 rotazioni spaziali e 3 boosts.
Se i componenti della metrica non dipendono della coordinata xλ , allora il campo ∂λ è
di Killing (si dimostra calcolando il pullback della metrica (6.4) sotto la traslazione φµ (p) =
pµ + δλµ ). In particolare, nello spazio di Schwarzschild, ∂t e ∂φ sono di Killing.
L’importanza dei campi di Killing è che definiscono delle quantità conservata.
Proposizione I.8. Sia V un campo di Killing e γ una geodetica, con vettore tangente Y = γ̇
(in una parametrizazione affine). Allora g(Y, V ) è costante lungo la geodetica, cioè
∇Y (g(Y, V )) = 0. (6.37)
Proof. Siccome (∇g) = 0, abbiamo

∇Y g(Y, V ) = g(∇Y Y, V ) + g(Y, ∇Y V ), (6.38)
µ ρ µ ρ
= g(Y, ∇Y V ) = Y (Y ∇ρ V )µ = Y Y (∇ρ V )µ (6.39)
µ ρ ρ µ
= −Y Y (∇µ V )ρ = −Y Y (∇ρ V )µ = −∇Y (g(Y, V )), (6.40)
dove la seconda riga scende dall’eq. delle geodetiche, e la terza dall’eq. di Killing (6.32).
Nel caso (M, g) abbia un numero sufficiente di campi di Killing, queste costanti associate
bastanno a caratterizzare le geodetiche (senza dover risolvere l’equazione delle geodetiche).
II. I TEST DELLA RELATIVITÀ 123

II I test della relatività


La metrica di Schwarzschild mette in evidenza delle predizioni originali della relatività
generale rispetto alla teoria newtoniana, tra cui tre “test storici”: lo spostamento verso il
rosso, la precessione di Mercurio, la deviazione della luce.

II.1 Spostamento verso il rosso gravitazionale

Un segnale di luce è descritto da un 4-vettore d’onda K di tipo luce, tangente alla geodetica
seguita dal segnale, tale che la frequenza misurata da un osservatore con 4-velocità U sia
ω = g(U, K). (6.41)
ω
 
Osservazione II.1. Nello spazio di Minkowski {ct, x}, uno ha K = c dove ω e k sono
k
 
¶ c
la frequenza e il vettore d’onda misurati da osservatori fissi, i.e. con 4-velocità U0 = .
0
Si verifica che ω = η(U0 , K). In un sistema di riferimento {ct0 , x0 } in moto rettilineo uniforme
rispetto al primo (con Λ il boost  le due), il vettore d’onda ha espressione ΛK e osservatori
 tra
c
fissi hanno 4-velocità U00 = . Misurano la frequenza
0
ω 0 = η(U00 , ΛK) = η(Λ−1 U00 , K) = η(U, K), (6.42)
dove U = Λ−1 U00 è l’espressione della 4-velocità U00 nel primo sistema di coordinate.
Un osservatore è stazionario nello spazio di Schwarzschild quando la sua 4-velocità U è
proporzionale al campo di Killing T := ∂t tangente all’evoluzione temporale:
cT
U= . (6.43)
|T |
La sua posizione (r, θ, φ) nello spazio rimane fissa al variare di t. Consideriamo un tale osser-
vatore che emette dal punto p dello spazio di Schwarzschild un segnale luminoso di frequenza
c
ωp = g(U, K)|p = g(T, K)|p , (6.44)
|Tp |
Il segnale è ricevuto al punto q da un altro osservatore stazionario, che misura una frequenza
c
ωq = g(U, K)|q = g(T, K)|q . (6.45)
|Tq |
Dalla prop.I.8 (con Y = K, e V = T ) abbiamo g(T, K)|p = g(T, K)|q , perciò
v
1 − 2GM 1
p u
ωp |Tq | |∂t |q | gtt (q) u c2 rq
= = =p = t (6.46)
ωq |Tp | ∂t |p | gtt (p) 1 − 2GM 1
c2 rp

dove l’espressione di gtt segue da (6.28) e (6.30).


Per rp < rq (emittente p più vicino al centro di attrazione gravitazionale dal ricevitore q),
viene ωp > ωq : la frequenza osservata è inferiore a quella di emissione, cioè la luce è spostata
verso il rosso. In altre parole, la luce “si stanca” risalendo il potenziale gravitazionale.

ω = 2π
T
con T il periodo, k = 2π
λ
n con λ = cT la lunghezza d’onda e n il versore nella direzione di
ω2
propagazione. Ne segue |K| = c2 − |k|2 = (2π)2 ( c21T 2 − λ12 ) = 0.
2
124 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

II.2 Geodetiche nello spazio di Schwarzschild

Sia una geodetica γ(τ ) = (t(τ ), r(τ ), θ(τ ), φ(τ )) nello spazio di Schwarzschild, parametriz-
zata dal suo tempo proprio τ , tale che θ(τ ) = π2 per ogni τ .
Osservazione II.2. Tale geodetiche, dette “equatoriale”, esistono perchè la metrica (6.28)
(e quindi l’equazione delle geodetiche) è invariante sotto la mappa Ξ : θ → π − θ. Fissando
delle condizioni iniziali θ(0) = π2 , θ̇(0) = 0 invarianti sotto Ξ, si trova una geodetica anche
lei invariante sotto Ξ. Significa θ(τ ) = π − θ(τ ) per ogni τ , cioè θ(τ ) = π2 . Per motivi di
simmetria, si può sempre mandare una qualunque geodetica in una geodetica equatoriale.
Sostituendo in (6.28) C da −rs (dato in (6.31)), la metrica di Schwarzschild ha componenti
rs rs −1
gtt = 1 − , grr = − 1 − , gθθ = gφφ = −r2 . (6.47)
r r
Essendo τ un parametro affine, la norma quadrata di γ̇ = (ṫ, ṙ, 0, φ̇) è costante: ‖
 2
rs  2 rs −1 2 2 2 c per γ di tipo tempo,
g(γ̇, γ̇) = 1− ṫ − 1− ṙ −r φ̇ = κ con κ = (6.48)
r r 0 per γ di tipo luce.

Altre costanti scendono dalle simmetrie dello spazio di Schwarzschild. Via la propo-
sizione I.8, i due campi di Killing ∂t e ∂φ forniscono due quantità costanti lungo γ:
 rs
h :=g ∂t , γ̇ = gtt ṫ = (1 − )ṫ, (6.49)
r
l :=g ∂φ , γ̇ = gφφ φ̇ = −r2 φ̇.

(6.50)
rs l2 rs
= h2 − ṙ2 −
 
Sostituendo in (6.48), otteniamo κ 1 − r r2
1− r . Si riscrive

 l2 κ
ṙ2 = h2 − V (r) con V (r) := r − rs + . (6.51)
r3 r
Le geodetiche (equatoriali) sono completamente determinate dalle tre costanti κ, h, l: fissati
i loro valori, si calcola r(τ ) risolvendo (6.51), poi t(τ ) e φ(τ ) risolvendo (6.49) e (6.50).
Per capire il senso di queste costanti, è utile ricordare la teoria newtoniana. Una massa
m in un potenziale centrale −GM r - col vincolo θ = costante - ha energia e momento angolare

1 mM
E = m(ṙ2 + r2 φ̇2 ) − G , L = mr2 φ̇. (6.52)
2 r
Eliminando φ̇ otteniamo un equazione analoga a (6.51):

2E 2GM L2
ṙ2 = − VN (r) con VN (r) := − + 2 2. (6.53)
m r m r
Cosı̀, la costante h2 appare come l’analogo relativistico di 2E ∗∗ Per interpretare l, conviene
m.
paragonare i potenziali relativistico V e newtoniano VN . Iniziamo dal caso tempo κ = c2 .

Il punto denota la derivata rispetto a τ , tranne nel ultimo paragrafo dove si riferisce al tempo newtoniano.
∗∗
Il parametro
q di Killing t avendo dimensione una lunghezza, segue da (6.49) che h ha dimensione una
velocità, come 2E
m
. La costante l ha dimensione m2 s−1 , cioè momento angolare per unità di massa.
II. I TEST DELLA RELATIVITÀ 125

II.3 Geodetiche di tipo tempo: il perielio di Mercurio

Il potenziale relativistico (6.51) per κ = c2 è (sostituendo rs dalla sua espressione (6.31)

2GM  l2 c2  2 2GM l2 2GM l2


V (r) = r − + = c − + − . (6.54)
c2 r3 r r r2 c2 r3
Paragonando con (6.53), osserviamo che la legge oraria r(τ ) lungo la geodetica (h, l) è analoga
alla legge radiale newtoniana in un potenziale centrale −GM r , per un un corpo di massa m,
energia E = 12 M h2 e momento angolare L = ml; con una differenza cruciale: il potenziale
2
relativistico V contiene un termine aggiuntivo in rl 3 (il termine costante c2 è irrelevante),
senza equivalente newtoniano.
Per capirne l’effetto sull’orbite dei pianeti, tocca studiare la parte spaziale della geodetica,
cioè la dipendenza di r in ϕ. Per farlo, è comodo usare u := 1r . Assumendo l 6= 0, viene
 d 1  2 −u̇ 2 u̇2 2 u̇
2 du 2
(ṙ)2 = = 2
= 4
= l = l2 (6.55)
dτ u u u φ̇2 dφ
u̇ du
dove nella quarta uguaglianza usiamo (6.50) riscritta come u2 = −φ̇ l−1 , insieme a φ̇
= dφ .
du
Sostituendo in (6.51) con V dato da (6.54), e scrivendo u0 := dφ , otteniamo

2 h2 c2
u0 = − 2 + 2G1 u − u2 + 2G2 u3 (6.56)
l2 l
dove scriviamo
GM GM
G1 := , G2 := . (6.57)
l2 c2
du
Derivando rispetto a φ e cancellando un fattore 2 dφ viene

u00 + u = G1 + 3u2 G2 . (6.58)

Quest’equazione è l’equazione esatta che descrive la parte spaziale di una geodetica equa-
toriale di tipo tempo (valida dal momento che r > max (rs , rM ), con rM il raggio della
distribuzione di massa M ). Non è lo scopo di questo corso risolverla in modo generale, ci
contentiamo di studiare le modifiche portate da quest’equazione alle orbiti newtoniane.

• Anzitutto, le orbiti newtoniane si trovano eliminando il tempo tra ṙ e φ̇ in (6.52)(6.53)


L
in modo analogo a sopra: scrivendo l = m il momento angolare per unità di massa,
−1
dalla seconda eq. (6.52) scende φ̇ = u l , e quindi (6.55). Sostituendo (ṙ)2 in (6.53),
2

poi derivando rispetto a φ e cancellando un fattore 2u0 , viene

u00 + u = G1 . (6.59)

Le soluzioni di quest’equazione sono† le coniche di eccentricità e:

uN (φ) = G1 (1 + e cos φ). (6.60)



La somma
√ della soluzione generale A cos φ + B sin φ e di quella particolare G1 fa G1 (1 + e cos φ̃), dove
e := G11 A2 + B 2 , φ̃ := φ − α con α := arctan BA
. È la stessa curva da (6.60), con un spostamento della
coordinata angolare φ → φ̃.
126 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

• Una volta identificata la costante l, caratteristica della geodetica, alla quantità di moto
L
per unita massa m , osserviamo che la differenza tra l’orbite newtoniana (6.60) e quella
relativistica (6.58) risiede nel termine 3u2 G2 . Siccome L = rmv con v la velocità
L
(newtoniana) del corp, abbiamo l = m = uv . Per Mercurio, pianeta più veloce del
sistema solare, v ' 5.104 ms−1 , quindi
u2 G2 u2 l2 v2
= 2 = 2 ' 10−8 . (6.61)
G1 c c

In queste condizioni, il termine G2 può essere trattato in modo perturbativo. Cerchiamo allora
una soluzione perturbativa dell’equazione relativistica (6.58) del tipo u = uN + u∗ , dove uN
è la soluzione generale (6.60) dell’equazione (6.59), mentre u∗ è una soluzione particolare
dell’equazione approssimata

(u∗ )00 + u∗ = 3G2 (u2∗ + uN )2 ' 3G2 u2N , (6.62)


3G2 G21 2 2

' 1 + 2e cos φ + e cos φ . (6.63)

Le soluzioni particolari sono di tre tipi: u∗1 , u∗2 , u∗3 , soluzioni di

(u∗ )00 + u∗ = A1 , = A2 cos φ, = A3 cos2 φ (6.64)

con A1 = 3G2 G21 , A2 = 2eA1 e A3 = e2 A1 . Esplicitamente, si verifica che


1 1 1
u∗1 (φ) = A1 , u∗2 (φ) = A2 φ sin φ , u∗3 (φ) = A3 − A3 cos 2φ. (6.65)
2 2 6
Le funzioni u∗1 e u∗3 aggiungono all’orbite newtoniana delle perturbazioni periodiche, di
periodo 2π. Tale perturbazioni sono difficilemente osservabili, perchè piccole. Invece, u∗2
aggiunge una correzione non periodica. Il suo effetto, anche se piccolo, è cumulativo. Con-
siderando solo questa contribuzione, la soluzione perturbativa dell’equazione relativistica è
   
u(φ) = uN (φ) + u∗2 (φ) = G1 1 + e cos φ + 3eG1 G2 φ sin φ ' G1 1 + e cos (φ (1 − 3G1 G2 ))

dove si usa cos(φ−βφ) = cos φ cos βφ+sin φ sin βφ ' cos φ+βφ sin φ per β = 3G1 G2 piccolo.‡ .
Si tratta da una funzione di periodo

≥ 2π. (6.66)
1−β
Rispetto alle orbiti newtoniane, la relatività generale induce una precessione del perielio

GM 2
 

∆= − 2π ' 2πβ = 6π . (6.67)
1−β cl
Per Mercurio, questa precessione è dell’ordine di 0, 100 per rivoluzione. Ma visto che Mercurio
effetua circa 415 rivoluzioni per secolo, quest’effetto è osservabile sul lungo termine e era ben
noto già dal tempo di Newton. Tuttavia, prima dei lavori di Einstein non ne esisteva una
spiegazione convincente.
‡ GM
2 rs c 2 1 rs c 2
La distanza media r di Mercurio al Sole è dell’ordine 50.106 km

G1 G2 = cl
= 2l
= (
4 r v
) .
3.108
mentre il raggio di Schwarzschild del Sole è circa 3km. Quindi GM
cl
' 1 3
2 50.106 5.104
= 59 .10−4 .
II. I TEST DELLA RELATIVITÀ 127

II.4 Geodetiche di tipo luce: deviazione della luce dal Sole

Con κ = 0, il potenziale relativistico in (6.51) è (con u := 1r ):

V (u) = l2 u2 − rs l2 u3 . (6.68)

Cancellando τ tra u e φ come fatto precedentemente (i.e. sostituendo (6.55) in (6.51) con
V dato sopra, poi derivando rispestto a φ), troviamo che la parte spaziale della geodetica di
tipo luce è descritta dall’equazione

3
u00 + u = rs u2 . (6.69)
2
Assumendo r >> rs (è il caso nel sistema solare perchè r>> rSole >> rs ), il termine di destra in
2
(6.69) viene piccolo rispetto a u: rsuu = rrs << 1. Si cerca allora una soluzione perturbativa
uN + u∗ , dove
sin φ
uN (φ) = (6.70)
R
è la soluzione dell’equazione omogenea u00 + u = 0, con R la costante d’integrazione§ ; mentre
u∗ è soluzione particolare dell’equazione approssimata, ottenuta come in (6.62):

3 3rs
(u∗ )00 + u∗ = rs u2N = (1 − cos2 φ). (6.71)
2 2R2

Una tale soluzione è u∗ (φ) = 4R


3rs 1

2 1 + 3 cos 2φ . La soluzione perturbativa di (6.69) è dunque

sin φ 3rs 1
u(φ) = uN (φ) + u∗ (φ) =

+ 2
1 + cos 2φ . (6.72)
R 4R 3
La soluzione omogenea (6.70) è la retta di equazione cartesiana y = r sin φ = R. Descrive
la propagazione newtoniana della luce (i.e. non sensibile alla gravitazione), in linea retta.
Invertendo (6.70), viene φ = arcsin Rr : i punti della reta con grande coordinate r hanno
coordinate angolare φ che tende a limr→∞ arcsin Rr = 0.

Osservazione II.3. La costante R è il parametro d’impatto, cioè la distanza minima tra


la traiettoria uN e il centro di massa. Di fati, nell’approssimazione r >> rs , la parte spaziale
della metrica di Schwarzschild è euclidea (grr ' −1), in tale modo che la distanza dal punto
P = (r, φ) della reta (6.70) al centro O della distribuzione di massa è r = sinRφ ≥ R (con
uguaglianza per φ = π2 ).

§ 1
La soluzione A cos φ + B sin φ si riscrive 1
R
sin φ̃ dove R := (A2 + B 2 )− 2 e φ̃ = φ − α con α = arctan B
A
.
128 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

Per quanto riguarda l’orbite relativistica, è difficile invertire (6.72)¶ . Tuttavia, per r
grande, il valore limite φ∞ della coordinata angolare è tale che
• il membro di destra di (6.72) tenda a zero (perchè cosı̀ fa il termine di sinistra u = r−1 );
• φ∞ sia piccolo: assumendo R >> rs (il parametro d’impatto è superiore al raggio della
distribuzione di massa, nel nostro caso R > rSole >> rs ), il termine dominante nel
membro di destra di (6.72) è sinRφ . Essendo quest’ultimo piccolo, anche φ∞ è piccolo.
Approssimando sin φ∞ ' φ∞ e cos 2φ∞ ' 1, il membro di destra di (6.72) tende a R1 (φ∞ + rRs ),
quindi
rs
φ∞ = − . (6.73)
Gravitational lenses 251
R

Per un osservatore all’infinito, la deviazione totale da una raggio


di luce venendo dall’infinito è
2rs 4GM
Θ= = 2 .
R c R
Nel caso del Sole, si trova Θ = 100 .75, misurato da Eddington nel
1919. Questo è stato una conferma spettacolare della relatività
generale.
La deviazione della luce è all’origine del fenomeno di lente grav-
itazionale, molto utile in astrofisica (cf figura accanto, presa dal
libro Rindler, Relativity: special, general and cosmological ).

Fig. 11.9

theorem of Etherington [cf. after (17.20) below.] Some of the most distant known
galaxies were observed only because foreground clusters magnified their images.
With point-like lenses (because the light paths are plane) there can only be two
paths (except when the alignment is perfect) for the light from a source to us. But
with extended transparent lenses, such as galaxies or clusters of galaxies, there can
be more than two images, depending on the exact configuration; and at least one of
them will be magnified (‘magnification theorem’).
The way multiple images can be identified as such is by comparing their redshifts
(which must be the same), their spectra, and also their light curves, if available.
Fortunately, quasars undergo irregular but rapid changes in luminosity. So if two
images display the same redshift and congruent light curves (possibly displaced by
a constant time interval !t of a few years corresponding to the difference in the
optical path length) they can be assumed to represent the same source. The number
of confirmed cases of double or multiple quasar images grows yearly and lies in the
dozens.
Lensing, when perfected (though preliminary results exist already), should allow
among other things direct determinations of cosmological distances and thus of the

Due lente gravitazionali, fotografate dal telescopio


spaziale Hubble.


cf Wald p. 143, eq. (6.3.29) in poi, or Weinberg Chap. 8§5.
III. BUCHI NERI 129

III Buchi neri


La metrica di Schwarschild è ben definita ovunque al di fuori della distribuzione sferica di
materia all’origine dell’attrazione gravitazionale, se quest’ultima ha un raggio rM superiore
al suo raggio di Schwarzschild rs . È il caso per il Sole. Però, una stella in fine di vita subisce
un collasso gravitazionale, quando l’energia delle reazioni nucleari al suo cuore non basta a
compensare la contrazione sotto il suo proprio peso. Il suo raggio diminuisce e, se la stella
è abbastanza massiva, diminuisce al di sotto di rs . In questo caso, esiste una porzione dello
spazio-tempo con r < rs dove non c’è materia, e dove ci si può aspettare che valga ancora
la soluzione di Schwarzschild. Tanto più che la metrica di Schwarzschild è ben definita per
0 < r < rs , non lo è solo in r = rs .
In questa sezione, studiamo cosa succede in r = rs , e in che senso si possono collegare le
due zone r > rs e 0 < r < rs dove la metrica di Schwarzschild è ben definita. Cosı̀ si scopre
uno dei concetti più originali della relatività generale: il buco nero.

III.1 Singolarità

I punti i cui la metrica di Schwarzschild non è definita sono chiamati singolarità. Come già
discusse sotto (6.28), sono di due tipi: quelli per cui r = rs in cui diverge la componente grr ,
e quelli con r = 0 dove divergono entrambi gtt e grr . Tuttavia, le componenti della metrica
dipendono della scelta delle coordinate. Quando un coefficiente gµν tende all’infinito in un
punto, non significa per forza che in questo punto la geometria presenti qualche patologia;
potrebbero esistere altre coordinate in cui gµν è ben definito.
Per capirlo, è istruttivo studiare un esempio semplice. Si considera l’unione disgiunta
P1 ∪ P2 dei due semipiani aperti di R2

P1 =: (x, t) ∈ R2 , −∞ < x < +∞, 0 < t < +∞ ,



(6.74)
2

P2 =: (x, t) ∈ R , −∞ < x < +∞, −∞ < t < 0 , (6.75)

munita della metrica


1 2
ds2 = dt − dx2 . (6.76)
t4
Questa metrica non si può estendere a tutto il piano R2 per colpa della singolarità in t = 0.
Sotto il cambiamento di coordinate
1
t0 = , (6.77)
t
i semi-piani P1 e P2 sono globalemente invarianti, mentre
  
dt dt 1 −1 −1 1
gt0 t0 = gtt 0 0 = 4 02 02
= 4 t2 t2 = 1. (6.78)
dt dt t t t t

La metrica (6.76) scritta nelle coordinate (t0 , x) non è altro che la metrica piatta di Minkowski
(in dimensione 2)
ds2 = dt02 − dx2 . (6.79)
In altre parole, lo spazio iniziale P1 ∪ P2 viene mandato nell’unione delle due porzioni t0 > 0
e t0 < 0 dello spazio di Minkowski.
130 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

Figure 6.2: Un viaggio oltre all’infinito.


La retta t = 0 corrisponde a t0 → ∞ nello spazio di Minkowski. La divergenza della
metrica (6.76) non è una patologia dello spazio-tempo, ma è dovuto a una scelta poco naturale
delle coordinate: si intende coprire due porzioni infinite dello spazio di Minkowski (i semi-
piani t0 > 1 e t0 < −1) da due intervalli limitati della coordinata t (0 < t < 1, −1 < t < 0).
Nella coordinata t0 , la metrica (6.79) non presenta singolarità, si può estendere all’intero R2 .
Quest’estensione “attraverso t0 = 0” nello spazio di Minkowski corrisponde ad un estensione
“oltre a t = ∞” nello spazio iniziale. In particolare, un osservatore che viaggia tra i punti
1 1
p : (t = −1, x = − ), q : (t = 1, q = ) (6.80)
2 2
invarianti sotto (6.77), seguendo il segmente [p, q] (geodetica di tipo tempo, cf a sinistra
nella figura 6.2), impiega una quantità finita di tempo proprio. Invece nelle coordinate (t, x),
impiega una quantità infinita di coordinata t0 (figura 6.2 a destra).
Per capire se una singolarità si possa rimuovere da un’opportuna scelta di coordinate, toc-
ca calcolare una quantità geometrica che non ne dipende, ad esempio il scalare di Kretschmann ‖
rs2
Rµνλρ Rµνλρ = (6.81)
r6
tende all’infinito in r = 0, ma è ben definita in r = rs . Significa che la singolarità in 0 è
una vera patologia dello spazio-tempo, ma suggerisce che quella in rs si possa eliminare da
un’opportuna modifica delle coordinate. Vedremmo nella sezione III.3 come trovare queste
coordinate adeguate, grazie alle geodetiche. Prima, studiamo cosa succede quando un osser-
vatore attraversa il raggio di Schwarzschild...

Cf Rindler “Relativity”, Oxford University Press 2006, §12.1.
III. BUCHI NERI 131

III.2 Orizzonte

Consideriamo lo spazio-tempo di Schwarzschild in cui il raggio rM della distribuzione di


materia è inferiore al suo raggio di Schwarzschild rs . Siamo interessati in un osservatore O
che parte da una zona dov’è la metrica di Schwarzschild approssima quella di Minkowski
- cioè r0 >> rs - e si avvicina della distribuzione di materia, fino a raggiungere r = rs .
Come visto nel §II.2, la geodetica γ(τ ) che segue è completamente definita da tre costanti:
κ = c2 (essendo massivo, O segue una geodetica di tipo tempo), h (il cui quadrato è l’analogo
dell’energia classica) e l (il momento angolare):
- Classicamente, il moto più semplice per raggiungere r = rs partendo da r0 > rs è quello
radiale, cioè il moto di un corpo con momento angolare nullo, che cade dritto verso il centro di
attrazione gravitazionale. Nel ambito relativistico, ci suggerisce di fissare l = 0. La geodetica
γ è allora detta radiale, perchè (6.50) dà φ̇ = 0.
- Scegliamo h > 0, in tale modo che (6.49) implichi ṫ > 0. Questa scelta garantisce che il
tempo t scorri nella stessa direzione di τ . Si nota che h = 0 è escluso perchè darebbe ṫ = 0,
e γ sarebbe di tipo spazio: g(γ̇, γ̇) = grr ṙ2 = −(1 − rrs )−1 < 0.
In queste condizioni, l’eq. (6.51) che descrive la parte radiale della geodetica si scrive
rs
ṙ2 = (h2 − c2 ) + c2 . (6.82)
r
Ponendo le condizioni iniziali r(0) = r0 > rs , ṙ(0) = 0 (velocità radiale iniziale nulla),
l’equazione sopra fissa il valore di h tale che
rs
h2 − c2 = −c2 . (6.83)
r0
Sostituendo in (6.82), viene che la legge oraria r(τ ) è soluzione di
1 1
ṙ2 = rs c2 ( − ). (6.84)
r r0
dr
Si verifica che il membro di destra è positivo se e solo se r(τ ) < r0 per τ > 0, cioè dτ < 0.
Questo significa che O cade verso il centro di attrazione gravitazionale (segue una geodetica
entrante). Quanto tempo impiega per raggiungere rs ?

• Dal punto di vista dell’osservatore O in caduta libera, la risposta si ottiene integrando


da r0 a rs la variazione del tempo proprio in funzione di r, cioè
 2 −1 √
s 
dτ dr 1 rr0
=−   = −q =− p (6.85)
dr dτ r c2 ( 1 − 1 ) c rs (r0 − r)
s r r0

(ottenuto imponendo che sia negativo, poi da (6.84)). Ponendo u := rr0 , viene∗∗
dr

√ Z 1 √
s s 
rs 3
rr0 1 r03
r r r 
1 1 r0 u rs rs rs
Z
∆τ := − p dr = √ du = arccos + 1− .
c r0 rs (r0 − r) c rs rs 1 − u c rs r0 r0 r0
r0

Quindi O impiega un intervallo di tempo proprio finito per raggiungere rs .


∗∗ d √
√ √ √
x
Si verifica che dx
( x 1 − x + arccos x) = − √1−x
132 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

• Per un osservatore fisso in r0 , la metrica di Schwarzschild (assimptoticamente piatta),


si confonde con quella di Minkowski, e il tempo proprio coincida col tempo di Killing t.
Per un tale osservatore, il tempo che mette O per raggiungere rs è l’integrale da r0 a
rs di  
dt dt dτ dτ 1
= = h (6.86)
dr dτ dr dr 1 − rrs
dt
dove dτ è dato in (6.49). Quest’integrale diverge (cf l’osservazione sotto). Quindi dal
punto di vista dell’osservatore fisso in r0 , O impiega una quantità di tempo t infinita
per raggiungere il raggio di Schwarzschild.

Osservazione III.1. ∗ In r0 , l’integrante (6.86) diverge come dτ dt


dr (mentre dτ non diverge),
ma questa divergenza è “sotto controlo”, come nel calcolo precedente. Invece in rs , la diver-
r dt
genza proviene dal fattore r−rs in dτ (mentre dτdr non diverge). Questa divergenza non è sotto
controlo, perchè
Z rs Z rs
r rs
dr = 1+ dr = rs − r0 + rs ln(r − rs )|rrs0 . (6.87)
r0 r − rs r0 r − rs

tende a −∞ quando r → rs .
La sottovarietà tridimensionale r = rs è chiamata orizzonte. L’osservatore in r0 non lo
vede mai raggiunto da O, perchè l’evento “O raggiunge l’orizzonte” ha coordinata t = ∞ (in
più, si deve aggiungere la quantità di tempo t impiegata dall’imagine di O per tornare in r0 ).
Dal punto di vista di r0 , l’osservatore O si “congela” mentre si sta avvicinando dell’orizzonte.
Questo è coerente con lo spostamento verso il rosso (6.46): si considera una sequenza di
emittente pi stazionari in ri , con r1 > r2 > ... > rs eqlimi→∞ ri = rs . Tutti emettono un
segnale con la stessa frequanza ωp . Siccome gtt (pi ) = 1 − rrsi tende a zero, le frequenze ωi0
osservate da un osservatore stazionario in r0 tendono a zero.

III.3 Buco nero

Anche se l’osservatore in r0 non vede mai O attraversare l’orizzonte, niente impedisce a


O di attraversarlo: ha impiegato solo una quantità finita di tempo proprio per cadere da r0 a
rs e il suo orologio proprio non si ferma in rs . Però in r = rs , la componente gtt della metrica
si annula e il campo di Killing ∂t diventa di tipo luce. Dentro l’orizzonte, cioè per r < rs , gtt
e grr cambiano segno:
• gtt passa negativa, il cui significa che il campo di Killing ∂t diventa di tipo spazio;

• grr passa positiva, dunque ∂r diventa di tipo tempo. Tuttavia non è di Killing perchè
la metrica dipende di r.
In altre parole, dentro l’orizzonte le variabili r e t cambiano ruolo. In particolare, visto
che grr è l’unica componente della metrica positiva, la componente V r di qualunque campo
vettoriale V 6= 0 di tipo tempo (o luce) non si annula mai (altrimenti g(V, V ) = gtt (V t )2 +
grr (V r )2 + gθθ (V θ )2 + gφφ )(V φ )2 sarebbe strettamente negativo).
Questo vale per il vettore tangente a una geodetica di tipo tempo (o luce): la sua compo-
nente γ̇ r non si annula mai, ed è quindi di segno costante. Nello spazio di Minkowski, questa
III. BUCHI NERI 133

proprietà è soddisfata dalla componente ṫ del vettore tangente a una geodetica di tipo tempo
(ṫ > 0 per una traiettoria verso il futuro, ṫ < 0 per una traiettoria verso il passato). Dentro
l’orizzonte, l’evoluzione temporale diventa la traslazione in r. E la direzione futura significa
andare verso r = 0.
Di conseguenza, tutte le traiettorie di tipo tempo o luce dentro l’orizzonte finiscono per
incontrare la singolarità r = 0. Nessun osservatore dentro l’orizzonte ne può uscire, ne
mandare un segnale che ne esce. Per questo motivo l’interiore dell’orizzonte viene chiamato
buco nero.
La lunghezza di una curva c(τ ) = (r(τ ), t(τ ), θ(τ ), φ(τ )) di tipo tempo tra un punto
p = c(0) sull’orizzonte e l’origine O è
Z O q
∆s = grr ṙ2 + gtt ṫ2 + gθθ θ̇2 + gφφ φ̇2 dτ (6.88)
p
O O rs rs
√ √ rs π
Z Z Z Z
p − 1
≤ 2
grr ṙ dτ = − grr ṙ dτ = grr dr = − 1 2 dr = rs . (6.89)
p p 0 0 r 2

Un osservatore dentro l’orizzonte mette al massimo π2 rcs unità di tempo proprio prima di
incontrare la singolarità in r = 0. Una stella di massa quella del Sole, una volta dentro il suo
orizzonte di Schwarzschild (' 3km), collasserebbe fino a r = 0 in circa 10−5 s.

Osservazione III.2. Bucchi neri sono creati dal collasso gravitazionale delle stelle con una
massa sufficiente. Per prendere in conto la rotazione delle stelle, conviene lavorare con una
metrica non a simmetrica sferica, ma a simmetria assiale. Il risultato è la metrica di Kerr.
Aggiungendo la carica elettrica, si ottiene la metrica di Nördstrom. Si dimostra che la massa,
il momento angolare e la carica elettrica sono gli unici parametri caratterizzando un buco nero
(“no hair” theorem).

Un campo di tipo tempo dentro l’orizzonte non può essere di Killing (siccome la metrica
dipende da r, un diffeomorfismo che implica una traslazione nella coordinata r non può essere
un isometria). Di conseguenza l’interiore dell’orizzonte di Schwarzschild non è uno spazio
stazionario.

III.4 Singolarità di coordinate∗

Per raggiungere l’orizzonte, un osservatore impiega una quantità infinita di “tempo di


Minkowski” t, ma una quantità finita di tempo proprio τ . La situazione è simile a quella
della figura 6.2, dove l’osservatore impiega una quantità finita di tempo proprio per andare
da p all’origine O, ma una quantità infinita della coordinata t. Questa rinforza l’idea che la
singolarità in r = rs potrebbe essere eliminata da un’opportuna scelta di coordinate.
Ci si aspetta che queste coordinate siano date da un oggetto intrinseco (i.e. la cui
definizione non dipende della carta), come nel §I.5 del capitolo 4 dove le coordinate nor-
mali sono state costruite grazie alle geodetiche. Qui, le coordinate che cerchiamo sono date
dalle geodetiche radiale di tipo luce, cioè le soluzioni di (6.82) e (6.49) con κ = 0:
rs
ṙ2 = h2 con h = (1 − )ṫ. (6.90)
r
134 CHAPTER 6. SOLUZIONE DI SCHWARZSCHILD

Segue
dt ṫ rs −1
= =± 1− . (6.91)
dr ṙ r
Fissando il segno meno (cioè una geodetica entrante: quando t aumenta, r diminuisce),
quest’equazione ha per soluzione
 
r
t = −r − rs ln − 1 + const. (6.92)
rs
La parte angolare della metrica non pone problema, perciò ci focalizziamo sulla metrica
indotta dalla metrica di Schwarzschild, sul piano (r, t):
rs  2 rs −1 2
ds2 = 1 − dt − 1 − dr . (6.93)
r r
Per r > rs e r < rs , si definiscono le coordinate di Eddington-Finkelstein (r, v) dove

r
v := t + r∗ con r∗ = r + rs ln − 1 . (6.94)
rs

Proposizione III.3. La metrica di Schwarzschild nelle coordinate (r, v) è


rs
ds2 = (1 − )dv 2 − 2 dv dr. (6.95)
r
Proof. Per non confondere r nelle coordinate iniziale e in quelle finale, scriviamo il cambia-
mento di coordinate come (t, r) 7→ (v, w) con

v := t + r∗ (r), w := r. (6.96)

Le trasformazioni inverse sono (v, w) 7→ (t, r) con

t = v − r∗ (w), r = w. (6.97)

Quindi ∂v t = 1, ∂v r = 0, ∂w r = 1 e ∂w t = −(r∗ )0 (w) dove “primo” denota la derivata.


Esplicitamente, uno calcola

 1 + r 1 = 1 − rs −1 = α−1

−1 r per r > rs rs
0
r∗ (r) = rs
−1 con α := (1 − ), (6.98)
 1 − 1−1 r = 1 − rrs −1

=α per r < rs r
rs

perciò ∂w t = −α−1 . La formula di trasformazione di un tensore sotto cambiamento di


coordinate dà

gvv = gtt ∂v t ∂v t + grr ∂v r ∂v r = α, (6.99)


−1 −1 −1
gww = gtt ∂w t ∂w t + grr ∂w r∂w r = α(−α )(−α )−α = 0, (6.100)
gvw = gtt ∂v t ∂w t + grr ∂v r ∂w r = α(−α−1 ) = −1. (6.101)

Quindi ds2 = gvv dv 2 + gww dw2 + 2gvw dvdw è dato da (6.95).

Scritta nelle coordinate (r, v), la metrica di Schwarzschild (6.95) non presenta più una
singolarità in rs . Rimane solo quella in r = 0.

Potrebbero piacerti anche