Sei sulla pagina 1di 339

Dodici lezioni

sulla Relatività

lezioni del prof. F. Magri,


scritte, integrate e organizzate da D. Ghisi
Lezione 1

L’eredità di Newton

1.1 Concetti fondamentali

La Relatività è lo studio della geometria dello spaziotempo, cioè lo stu-


dio delle strutture di questo spaziotempo che non dipendono dalle modalità
dei processi di misura. I processi di misura dipendono infatti dall’osserva-
tore che li esegue: l’obiettivo della Relatività (cosı̀ come quello di queste
lezioni) è dunque individuare le caratteristiche che si presentano indipenden-
temente dall’osservatore e dai processi di misura. Le proprietà manifestate in
comune dalle misure eseguite dai possibili osservatori vengono interpretate
come proprietà dello spaziotempo e ne definiscono la struttura.
Lo spaziotempo è l’insieme degli eventi, cioè dei fenomeni localizzati
nello spazio (a cui si può attribuire una localizzazione spaziale) e di bre-
vissima durata (per cui si può attribuire loro un tempo di accadimento).
Un osservatore è quindi un sistema di coordinate sullo spaziotempo. Gli
osservatori sono definiti (operativamente) dalle modalità dei processi di mi-
sura che determinano le coordinate dell’evento. La nozione di osservatore
ha visto un’ampia evoluzione nel corso del tempo; tale evoluzione è sostan-
zialmente andata di pari passo con un’evoluzione della geometria. Il cam-
biamento sostanziale nella concezione di osservatore che si è verificato con il
passaggio dalla Relatività newtoniana alla Relatività di Einstein è associato
al passaggio dalla geometria euclidea alla geometria di Riemann.

Relatività di Newton Geometria euclidea


Relatività di Einstein Geometria di Riemann

3
4 LEZIONE 1. L’EREDITÀ DI NEWTON

1.2 L’osservatore newtoniano


La concezione newtoniana di osservatore è basata sulla nozione di corpo
rigido (tipica nozione della geometria euclidea proveniente dalla fisica ter-
restre). Inizialmente un osservatore newtoniano è una piccola piattaforma
rigida, che costituisce il supporto dell’osservatore e che definisce il concetto
di localizzazione, nel senso che un evento avviene in un punto di tale piat-
taforma. In ogni punto della piattaforma è situato un orologio in quiete. In
breve, si dice che un osservatore newtoniano è una rete di orologi posti ai
vertici di un reticolato di regoli rigidi.

Figura 1.1: L’osservatore newtoniano come rete di orologi posti ai vertici di


un reticolato di regoli rigidi.

In questa definizione si ammette tacitamente (e dal punto di vista mate-


matico questa è un’ipotesi topologica sulla struttura dello spaziotempo) che
tale reticolato possa essere esteso indefinitamente in tutte le direzioni (per
questo si parla di coordinate globali ), e che per le misure spaziali tra punti
in quiete rispetto ai reticolati valgano le regole della geometria euclidea.
Per completare la definizione dell’osservatore newtoniano, bisogna infine
sincronizzare gli orologi posti nei diversi punti del reticolato: possiamo pen-
sare che ogni punto abbia un suo piccolo “laboratorio”, e bisogna fare in
modo che tutti questi “laboratori” siano sincronizzati. Il processo di sincro-
nizzazione può essere fatto, ad esempio, per trasporto di un orologio cam-
pione, e qui ipotizziamo tacitamente che la sincronizzazione non dipenda dal
trasporto e che orologi sincronizzati rimangano sincronizzati.
1.3. GLI ASSIOMI DELLA RELATIVITÀ NEWTONIANA 5

Il processo di sincronizzazione definisce il concetto di tempo relativo


all’osservatore, definito come il tempo misurato dall’orologio - in quiete
(rispetto alla piattaforma dell’osservatore) e sincronizzato nella rete di orologi
- nel punto in cui avviene l’evento. È chiaro che questa nozione ha significato
solo se gli orologi sono stati precedentemente sincronizzati.

1.3 Gli assiomi della Relatività newtoniana


Definito il singolo osservatore come un sistema di coordinate globali sullo
spaziotempo (dove l’aggettivo “globali” rende conto del fatto che ogni evento
può essere localizzato poiché la piattaforma è estendibile all’infinito), rimane
da fare il confronto tra i diversi osservatori, il che equivale a porsi il problema
di un cambio di coordinate sullo spaziotempo.
Nella Relatività newtoniana si ammettono due assiomi, detti del tempo
assoluto e dello spazio assoluto (in quest’ordine).

1.3.1 L’assioma del tempo assoluto


L’assioma del tempo assoluto afferma il carattere invariantivo delle durate:
gli intervalli temporali tra due eventi misurati da due diversi osservatori new-
toniani in moto relativo coincidono sempre, indipendentemente dalla natura
del moto relativo (questo vale, ad esempio, anche per moti non inerziali). In
particolare, eventi simultanei in un riferimento sono simultanei in ogni altro
riferimento: il concetto di simultaneità è dunque un concetto assoluto (ove
questo vocabolo è utilizzato nel modo in cui il termine “intrinseco” è usato
in geometria, nel senso di “proprietà che non dipende dall’osservatore”) -
non nuoce ribadire che la Relatività è lo studio di ciò che non dipende dagli
osservatori a partire da ciò che dipende da tali osservatori. Se il concetto
di simultaneità è assoluto, la simultaneità è una relazione di equivalenza,
che determina una partizione nello spaziotempo in classi di equivalenza1 , i
cosiddetti piani di simultaneità (relativi a ciascun “istante”).

1.3.2 L’assioma dello spazio assoluto


Se il concetto di tempo assoluto è intuitivo e immediato, il concetto di spa-
zio assoluto è più problematico. Consideriamo un treno in moto rettilineo
uniforme, un osservatore A posto a terra e un osservatore B all’interno del
1
Si intende nell’insieme degli eventi: un evento A è chiaramente simultaneo a sé stesso,
la relazione di simultaneità tra due eventi è simmetrica e infine se A e B sono simultanei
e B e C sono simultanei, allora anche A e C sono simultanei.
6 LEZIONE 1. L’EREDITÀ DI NEWTON

treno che lasci cadere una pallina in terra. È chiaro che per l’osservatore B
(concepito come piattaforma) la coordinata “orizzontale” del punto di lan-
cio corrisponderà a quella del punto di arrivo; viceversa, per l’osservatore A,
durante la caduta, la pallina avrà percorso orizzontalmente un certo spazio.

Figura 1.2: Per l’osservatore B la X iniziale e la X finale della pallina


coincidono; per l’osservatore A questo non è vero.

Chiaramente, quindi, non possiamo affermare che la distanza spaziale


tra ogni coppia di eventi è invariante (affermazione che sarebbe palesemente
falsa), ma dobbiamo prendere in considerazione solamente eventi simultanei.
L’assioma dello spazio assoluto, infatti, afferma che la distanza tra le loca-
lizzazioni spaziali di due eventi simultanei è invariante. Questo enunciato
ha senso perché il concetto di simultaneità, in base al primo postulato, ha
carattere assoluto (ecco dunque la necessità di mantenere questo ordine tra
i due postulati).
Si può dare una forma più intuitiva a questo assioma mediante la nozione
di lunghezza di un corpo in movimento - per corpi in quiete valgono, come
già detto, le regole della geometria euclidea. Per definizione, la lunghezza di
un regolo in moto è la distanza tra una qualsiasi coppia di punti in quiete
nella piattaforma che allo stesso istante nel tempo relativo coincidono con
gli estremi del regolo. Dunque la lunghezza di un corpo in moto è la distanza
tra due eventi simultanei (tipicamente eventi di coincidenza, come mostrato
in figura 1.3).
Con questo linguaggio si può dire che l’assioma dello spazio assoluto
afferma l’invarianza della lunghezza dei corpi in movimento.

1.4 Interpretazione geometrica


Interpretiamo geometricamente gli assiomi precedenti, introducendo le prime
strutture dello spaziotemo newtoniano. Lo spaziotempo è una varietà qua-
dridimensionale (tre dimensioni spaziali, una temporale) che gode di certe
proprietà dettate dai due assiomi newtoniani.
1.4. INTERPRETAZIONE GEOMETRICA 7

Figura 1.3: Lunghezza di un corpo in moto: la lunghezza del regolo in


movimento, nell’istante in cui A0 ≡ A e B 0 ≡ B, è la distanza tra i due punti
A e B sulla piattaforma.

• L’assioma del tempo assoluto, stabilendo che la simultaneità è una re-


lazione di equivalenza, definisce i piani di simultaneità e quindi afferma
che lo spaziotempo ha una struttura fibrata sull’asse dei tempi, ov-
vero divisa in classi di equivalenza. Possiamo rappresentare questo
fatto graficamente utilizzando uno spaziotempo bidimensionale invece
che quadridimensionale (nascondendo due dimensioni spaziali).

Figura 1.4: La struttura fibrata dello spaziotempo newtoniano: ad ogni


istante ti è associato un piano di simultaneità.

• L’assioma dello spazio assoluto precisa poi che i singoli piani di simulta-
neità hanno (singolarmente) struttura di spazio euclideo. Esiste quindi
una nozione di distanza tra due eventi, ma limitatamente a ciascun
piano di simultaneità.
In sintesi, lo spaziotempo newtoniano è uno spazio fibrato in spazi eucli-
dei.
Nello spaziotempo newtoniano ha senso parlare di simultaneità di due
eventi, parlare di intervallo di tempo tra due eventi, parlare di distanza tra
8 LEZIONE 1. L’EREDITÀ DI NEWTON

Figura 1.5: La nozione di distanza tra eventi esiste, ma solo limitatamente


a ciascun piano di simultaneità.

eventi simultanei. Non ha invece senso dire che due eventi avvengono nello
stesso luogo, né ha senso parlare di distanza tra due eventi qualsiasi. In
quest’ottica, lo spaziotempo newtoniano non è affatto uno spazio metrico, è
solo parzialmente metrizzato (è fibrato in spazi metrici).
Per comprendere meglio che la nozione di “eventi che avvengono nello
stesso luogo” è relativa, possiamo visualizzare tale nozione mediante il con-
cetto di linea di universo di un orologio.

Figura 1.6: Linea di universo di A: i punti sulla linea sono i “battiti”


dell’orologio di A.

Detto M lo spaziotempo, un orologio definisce una successione unidi-


mensionale di eventi che rappresentiamo come una linea parametrizzata (il
parametro è il tempo misurato dall’orologio) in M , tale linea è detta linea di
1.4. INTERPRETAZIONE GEOMETRICA 9

universo. Un osservatore è rappresentato da una congruenza di linee di uni-


verso (che taglino i piani di simultaneità), ciascuna associata ad un orologio
del reticolato che rappresenta l’osservatore.

Figura 1.7: Un osservatore come famiglia di linee di universo.

Questa congruenza definisce la relazione di equivalenza “essere nello stesso


luogo”: due eventi E1 ed E2 avvengono nello stesso luogo rispetto all’osser-
vatore O se appartengono a una stessa linea di universo delle congruenze di
O.

Figura 1.8: Gli eventi E e F avvengono nello stesso luogo rispetto all’os-
servatore O, ma non avvengono nello stesso luogo nel giudizio dell’osservatore
O0 .

In quest’ottica possiamo definire lo spazio relativo a un osservatore O


come lo spazio quoziente di M rispetto alla relazione di equivalenza “essere
nello stesso luogo”, e il moto relativo a un osservatore O come la curva
ottenuta per proiezione sullo spazio quoziente (v. fig. 1.9).
10 LEZIONE 1. L’EREDITÀ DI NEWTON

Figura 1.9: Spazio relativo e moto relativo in un universo tridimensionale.


1.5. CAMBIO DI COORDINATE 11

1.5 Cambio di coordinate


I due assiomi della cinematica newtoniana sono sufficienti a risolvere il pro-
blema delle formule di cambiamento di coordinate sullo spaziotempo. Due
diversi osservatori attribuiscono a uno stesso evento coordinate diverse, di-
ciamo (x, t) e (x0 , t0 ) (per semplicità stiamo considerando uno spaziotempo
bidimensionale). Queste coordinate, essendo riferite allo stesso evento, de-
vono essere legate da relazioni che dipendono dal moto degli osservatori, che
nello schema classico è necessariamente un moto rigido: la “piattaforma”
dell’osservatore può infatti solo traslare o ruotare.
Nel caso di moto traslatorio, rettilineo ed uniforme, si ricavano le formule
di Galileo:  0
t =t
x0 = x − ut
dove u = v(R0 |R) è la velocità del riferimento R0 rispetto al riferimento R.
Tali trasformazioni, come noto, formano un gruppo2 e implicano la forma
additiva del teorema di composizione delle velocità. Per moti traslatori vale
infatti che
~v (P |R) = ~v (P |R0 ) + ~v (R0 |R).
Ciò si verifica dal fatto che (nel caso unidimensionale)

∆t0 = ∆t

∆x0 = ∆x − u∆t
implicano che
∆x0 ∆x
v0 = = − u = v − u,
∆t0 ∆t
da cui
v(P |R0 ) = v(P |R) − v(R0 |R).
Ne discende che in cinematica classica non esistono né velocità invarianti né
velocità limite.

1.6 Altri assiomi della Relatività classica


Lo schema della Relatività classica è completato da due ulteriori assiomi.
2
In questo semplice caso di traslazione lungo un asse questo gruppo ha 1 solo parametro
(la velocità u); in generale sono 10 i parametri coinvolti: il posizionamento dell’origine, i
3 spostamenti degli assi, i 3 angoli di Eulero per le rotazioni e le 3 velocità di traslazione.
12 LEZIONE 1. L’EREDITÀ DI NEWTON

1.6.1 L’assioma delle particelle libere


Il primo assioma afferma l’esistenza di una classe privilegiata di particelle,
dette particelle libere, le cui linee di universo sono quindi delle linee pri-
vilegiate sullo spaziotempo. Quindi lo spaziotempo newtoniano non solo è
munito della struttura fibrata dei piani di simultaneità, ma anche di questa
classe privilegiata di curve che saranno successivamente interpretate come
geodetiche3 dello spaziotempo. Questa ulteriore struttura permette di sele-
zionare una classe privilegiata di osservatori, detti inerziali, rispetto ai quali
tali particelle si muovono di moto rettilineo uniforme.4

1.6.2 Il Principio di Relatività


L’ultimo assioma è il Principio di Relatività, che ha una duplice valenza.
• Puntando l’attenzione sugli osservatori, esso afferma una impossibilità,
nella fattispecie l’impossibilità, sulla base di esperienze meccaniche, di
selezionare un osservatore nella classe degli osservatori inerziali. Tutti
gli osservatori inerziali sono quindi equivalenti dal punto di vista della
meccanica.
Formulazioni equivalenti di questo asserto sono:
– non esiste il “moto assoluto” (che sarebbe, per l’appunto, il moto
rispetto all’osservatore privilegiato);
– lo spaziotempo classico è una varietà fibrata sull’asse dei tempi,
ma non è il prodotto cartesiano di spazio e di tempo. Se infatti
lo spaziotempo fosse il prodotto cartesiano di spazio e di tempo
(v. fig. 1.10), potremmo dare ad ogni evento una localizzazione
assoluta, ovvero dire in che punto avviene quando avviene. Ciò
non è possibile, poiché se ha senso parlare di “stesso istante”, non
ha senso parlare di “stesso luogo”.
• D’altro canto, dando uno sguardo alle leggi fisiche, il Principio di Rela-
tività afferma anche qualcosa di costruttivo: esso è un vincolo a priori
3
Una delle definizioni di geodetica era quella di “curva autoparallela”; ma per la no-
zione di parallelismo abbiamo bisogno, in generale, di una derivata covariante, cioè di una
connessione, la quale, nel caso newtoniano, non è metrica (non è definito alcun prodotto
interno).
4
Il che corrisponde (in un universo bidimensionale) a dire che ẍ = 0, cioè che tutti i
simboli di Christoffel Γijk = 0, e dunque in definitiva che il tensore di Riemann è identica-
mente nullo: R = 0. Lo spaziotempo di Newton è dotato quindi di una struttura piatta.
Questo equivale ad ammettere che la connessione per cui le linee di universo delle particelle
libere sono geodetiche è piatta, cfr. [2]
1.6. ALTRI ASSIOMI DELLA RELATIVITÀ CLASSICA 13

Figura 1.10: Se lo spaziotempo classico fosse il prodotto cartesiano di spazio


e di tempo, ogni evento avebbe due coordinate assegnate univocamente.

sulla forma delle leggi fisiche, che può diventare costruttivamente un


criterio per la loro selezione. Perché, infatti, i fenomeni meccanici non
permettono di selezionare un osservatore inerziale privilegiato? Perché
i fenomeni meccanici avvengono nello stesso identico modo in due di-
versi riferimenti inerziali, a parità di condizioni iniziali ed ambientali.
Ma i fenomeni fisici sono retti dalle leggi della fisica, e quindi tali leggi
devono essere le stesse in due diversi riferimenti inerziali. Infine, poiché
gli osservatori inerziali sono legati dalle leggi di Galileo, ne concludiamo
che le leggi della fisica devono essere invarianti in forma rispetto alle
trasformazioni galileiane.
Un modo di garantire questa invarianza consiste nel verificare che le
leggi della fisica siano scritte come relazioni tensoriali tra grandezze
fisiche rappresentate da tensori (relativamente al gruppo di Galileo).
14 LEZIONE 1. L’EREDITÀ DI NEWTON
Lezione 2

Origine della crisi e prime


soluzioni

2.1 L’esperimento di Michelson e Morley


Il principio di equivalenza degli osservatori inerziali è rotto dalla scoperta di
Maxwell1 che la luce è un’onda elettromagnetica. Come tutte le onde, storica-
mente si dedusse che essa doveva propagarsi in un mezzo (detto etere) rispetto
a cui la terra è probabilmente in moto.2 Questo etere fornisce dunque un si-
stema di riferimento privilegiato, nel quale la luce si propaga isotropicamente
con velocità c. In ogni altro riferimento (ad esempio nel riferimento terrestre)
la velocità della luce sarà necessariamente diversa a seconda della direzione di
propagazione.3 Quindi la luce percorrerà distanze uguali in direzioni diverse
1
James Clerk Maxwell (1831-1879), fisico scozzese le cui famose equazioni mostrarono
la natura elettromagnetica della luce.
2
Scrive H. Bondi in [3]:
L’etere serviva a uno scopo, e a uno solo: rendere conto della pro-
pragazione della luce, essere per la luce ciò che l’aria è per il suono.
Ma l’aria può venir pesata, può venir messa in moto, può venir pom-
pata fuori di un recipiente o può venir messa sotto pressione in esso;
nulla di tutto ciò può essere fatto con questo ipotetico etere. [...]
Quindi l’etere non ha che una proprietà: aiuta a costruire una ana-
logia tra propagazione della luce e propagazione del suono; [...] una
falsa analogia.
(Hermann Bondi, La relatività e il senso comune,
Zanichelli, pp.36-37)
3
O, il che è la stessa cosa, si può dire che la terra, essendo in moto rispetto all’etere e
non trascinandolo, deve risentire di un “vento d’etere”.

15
16 LEZIONE 2. ORIGINE DELLA CRISI E PRIME SOLUZIONI

in tempi diversi, e ciò comporterà necessariamente il verificarsi di fenomeni


di interferenza. Michelson4 e Morley5 , nel periodo 1882-1888, hanno cercato
di dedurre proprio da esperimenti di interferometria la velocità della terra
rispetto all’etere. Per fare ciò hanno creato un’apparecchiatura come quella
riportata in figura 2.1.

Figura 2.1: Il dispositivo P1 invia un fascio luminoso che viene parzialmente


riflesso dallo specchio Q. Il raggio si spezza quindi in un raggio trasverso e in
un raggio longitudinale, riflessi rispettivamente dagli specchi S1 e S2 . I raggi
ritornano poi allo specchio Q per confluire all’interfereometro P2 . Dato che la
terra è in moto rispetto all’etere con una certa velocità ~v , l’interferometro P2
dovrebbe rilevare frange d’interferenza.

Possiamo calcolare i tempi di percorrenza per i due diversi segnali lumi-


nosi. Contando che tali raggi hanno in comune il primo e l’ultimo tratto,
per il confronto ci basterà considerare il tratto trasverso (perpendicolare alla
velocità ~v , in verticale nel disegno) e il tratto longitudinale (parallelo a ~v , in
orizzontale nel disegno), entrambi di lunghezza l.
4
Albert Abraham Michelson (1852-1931), primo scienziato americano a ricevere il pre-
mio Nobel (nel 1907); ha misurato la velocità della luce e ha inventato, sfruttando la
lunghezza d’onda della luce, un interferometro per misure precise.
5
Edward W. Morley (1838-1923), chimico americano e collaboratore di Michelson nel
celeberrimo esperimento sull’etere.
2.1. L’ESPERIMENTO DI MICHELSON E MORLEY 17

Raggio trasverso
Sappiamo che il segnale luminoso si propaga nell’etere con velocità c. Chia-
miamo T⊥ il tempo totale in cui il raggio percorre (andata e ritorno) il tratto
trasverso; chiamiamo T⊥and il tempo di andata e T⊥rit il tempo di ritorno.
Notiamo che il tratto l misurato in laboratorio o nell’etere ha comunque lun-
ghezza uguale, per la definizione data di lunghezza di un regolo in moto.
Analogamente, per l’assioma del tempo assoluto, non fa differenza misurare
i tempi T⊥ , T⊥and e T⊥rit in laboratorio o nell’etere.
Per calcolare T⊥and e T⊥rit ci mettiamo quindi dal punto di vista dell’etere.
Dato che conosciamo la velocità della luce nel sistema di riferimento dell’etere
(è c), ne ricaviamo la figura 2.2.

Figura 2.2: Raggio trasverso nel sistema di riferimento dell’etere.

Abbiamo dunque che


2 2
T⊥and c2 = v 2 T⊥and + l2 ,

da cui
l 1
T⊥and = q .
c 1− v2
c2

Analogamente otteniamo che

l 1
T⊥rit = q ,
c 1− v2
c2

da cui
l 1
T⊥ = T⊥and + T⊥rit = 2 q .
c 1− v2
c2
18 LEZIONE 2. ORIGINE DELLA CRISI E PRIME SOLUZIONI

1
Il termine q è detto fattore di Lorentz 6 . In questo esercizio ab-
v2
1− c2
biamo ridotto al teorema di Pitagora il teorema di composizione delle velo-
cità.

Raggio longitudinale
Analogamente chiamiamo Tk il tempo totale in cui il raggio percorre (andata
e ritorno) il tratto longitudinale; chiamiamo Tkand il tempo di andata e Tkrit
il tempo di ritorno. In questo caso è facile calcolare la velocità relativa,
poiché le velocità si comportano come scalari anziché come vettori, e quindi
possiamo utilizzare il punto di vista del laboratorio. Abbiamo che
l
Tkand = ,
c−v
l
Tkrit = ,
c+v
da cui
l l l 1
Tk = Tkand + Tkrit = + =2 6= T⊥ .
c−v c+v c 1 − vc22
Ancora a volta compare il fattore di Lorentz, ma stavolta al quadrato.
È chiaro che i due tempi di percorrenza sono diversi, e la loro differenza
vale
−1  − 12 !
v2 v2

l
Tk − T⊥ = 2 1− 2 − 1− 2
c c c
v2 1 v2
  4 
l v
=2 1+ 2 −1− 2 +O 4
c c 2c c
 2  4 
l v v
= + O .
c c2 c4
Diciamo che lo sfasamento è un effetto del second’ordine (poiché va come
v2
c2
), meccanicamente non rilevabile, ma otticamente sı̀ (mediante appunto
l’analisi delle interferenze). Tuttavia l’esperimento di Michelson e Morley
non rileva alcuna interferenza nei raggi luminosi, al contrario mostra che
T⊥ = Tk . Anche ruotando la piattaforma di 90 gradi, non si rileva alcuna
interferenza tra i raggi luminosi. Come si spiega questo effetto?
6
Hendrik Antoon Lorentz (1853-1928), fisico olandese che, per tener conto di nuovi ri-
sultati sperimentali, sviluppò un tipo di teoria della relatività (precedentemente a Einstein)
mentre era al lavoro sulle equazioni di Maxwell.
2.2. SPIEGAZIONE DI FITZGERALD 19

2.2 Spiegazione di Fitzgerald


La coincidenza delle due durate può essere spiegata ripetendo formalmente i
calcoli con l’accortezza di indicare le distanze longitudinali e trasversali con
due simboli diversi (rispettivamente lk e l⊥ ). Troviamo che
2 l 2 lk
T⊥ = q ⊥ = = Tk .
c 1− v2 c 1 − vc22
c2

L’esperienza di Michelson e Morley mostra che T⊥ = Tk , e tale risultato si


spiega se ammettiamo che
r
v2
lk = l⊥ 1 − 2 ,
c
ovvero che lk < l⊥ . Fitzgerald, nel 1892, conclude che il moto rispetto al-
l’etere deve comportare un fenomeno di distorsione a livello degli elettroni
(che compongono la materia, che interagiscono con forze elettromagnetiche
le quali riconoscono l’etere come osservatore privilegiato) per cui ogni regolo
si contrae nella direzione longitudinale del fattore di Lorentz (contrazione
delle lunghezze).

2.3 Spiegazione di Lorentz


2.3.1 Problemi della spiegazione di Fitzgerald
Se la spiegazione di Fitzgerald (che invoca un’interazione fino a quel tempo
sconosciuta tra materia ed etere responsabile del processo di contrazione)
dà conto dell’esperimento nullo di Michelson e Morley, rimane aperto un se-
condo problema. L’esperimento di Michelson e Morley, infatti, è il primo
di una serie di esperimenti che mostrano che il campo elettromagnetico si
comporta nel laboratorio terrestre come previsto dalle leggi di Maxwell nel-
l’etere. In sostanza, è come se le leggi di Maxwell valessero invariate in forma
sia nell’etere, sia nel laboratorio terrestre.
Nel 1895 Lorentz si pone dunque il problema di determinare matema-
ticamente la più generale trasformazione di coordinate spaziotemporali che
lasci invariate in forma le equazioni di Maxwell. Per semplicità conside-
riamo come prototipo delle equazioni di Maxwell l’equazione delle onde (che
in realtà è una conseguenza) su una componente qualsiasi. Consideriamo il
campo E = E(x, t), in un universo bidimensionale. L’equazione delle onde è
1 ∂2E ∂2E
− = 0.
c2 ∂t2 ∂x2
20 LEZIONE 2. ORIGINE DELLA CRISI E PRIME SOLUZIONI

Prima di mostrare la soluzione di Lorentz, come introduzione al problema,


mostriamo che tale equazione non è affatto invariante rispetto alle trasfor-
mazioni galileiane.  0
t =t
Ipotizzando infatti la trasformazione di coordinate e la
x0 = x − vt
trasformazione della legge fisica E 0 (x0 , t0 ) = E(x, t), otteniamo quindi che

E 0 (x − vt, t) = E(x, t)

e dunque, calcolandoci le derivate parziali, abbiamo che


∂E ∂E 0 ∂E 0

 (x, t) = (x − vt, t) − v (x − vt, t)
∂t0 ∂x0

∂t ,
0
 ∂E (x, t) = ∂E (x − vt, t)

∂x ∂x0
e derivando nuovamente (sottintendendo i punti di calcolo delle derivate), si
ha che  2
∂ E ∂2E 0 ∂2E 0 2 0
2∂ E
= − 2v + v


∂t2 ∂t02 ∂x0 ∂t0 ∂x02 .

 ∂2E ∂2E 0

 =
∂x2 ∂x02
Quindi, l’equazione delle onde nelle nuove coordinate assume la forma
1 ∂2E 0 ∂2E 0 v ∂2E 0 v2 ∂ 2E 0
− − 2 + = 0.
c2 ∂t02 ∂x02 c2 ∂x0 ∂t0 c2 ∂x02
Come si nota, tale forma è differente dalla precedente, poiché nella deri-
vazione sono comparsi gli ultimi due termini che precedentemente non esi-
stevano. L’equazione delle onde non è invariante in forma rispetto alle tra-
sformazioni galileiane.
Sempre in quest’ottica, proviamo a tener conto dell’osservazione di Fitz-
gerald, immaginando che la relazione tra le coordinate dei due osservatori
sia  0
 t =t

r
2 ,
 1 − v x0 = x − vt

c2
ove le coordinate non primate si riferiscono al riferimento dell’etere e le coor-
dinate primate al riferimento terrestre. Il fattore di Lorentz rende conto della
contrazione delle lunghezze constatata da Fitzgerald. In questo caso, sempre
supponendo
 che la legge fisica si trasformi come E 0 (x0 , t0 ) = E(x, t), ovvero
che E qx−vt , t , troviamo che
2
1− v2
c
2.3. SPIEGAZIONE DI LORENTZ 21

∂E ∂E 0 v ∂E 0


 = 0
−q
 ∂t

 ∂t 1− v2 ∂x0
c2
∂E 0 ,
 ∂E = q 1

 ∂x 0
1 − v ∂x

 2
c2

e derivando nuovamente:
∂2E 0 ∂2E 0 v2 ∂ 2E 0
 2
∂ E v
 = − 2 +
∂x0 ∂t0 1 − vc22 ∂x02

∂t02
q
 ∂t2

v2
1− c2 ,
 ∂2E 1 ∂2E 0
=

 2
∂x2 1 − vc2 ∂x02

e sostituendo nell’equazione delle onde otteniamo

1 ∂2E 0 v ∂2E 0 v2 ∂ 2E 0 c2
− 2 √ + − ∂ 2 E 0 ∂x02 = 0,
c2 ∂t02 2
c c −v 2 ∂x 0 ∂t0 c 2 − v 2 ∂x02 c 2 − v2

e sommando gli ultimi due termini

1 ∂2E 0 v ∂2E 0 ∂2E 0


− 2 √ − = 0.
c2 ∂t02 c c2 − v 2 ∂x0 ∂t0 ∂x02

Notiamo che uno dei due termini aggiuntivi che avevamo con le trasfor-
mazioni di Galileo è scomparso, ma rimane pur sempre una correzione.

2.3.2 Le trasformazioni di Lorentz


Seguendo questa linea, Lorentz ha cercao una trasformazione di coordi-
nate adatta per mantenere l’invarianza in forma. L’ha trovata correggendo
l’equazione dei tempi e ipotizzando la trasformazione
 r
v2 v
 1 − 2 t0 = t − 2 x


r c c .
2
 v
 1 − x0 = x − vt

c2
Come notiamo, Lorentz ha apportato due modifiche alle trasformazioni
di Fitzgerald. Ha lasciato invariata la contrazione delle lunghezze, ma ha
aggiunto una dilatazione dei tempi. Il fattore davanti a t0 (inserito per
analogia) non bastava infatti per avere l’invarianza in forma: Lorentz ha
22 LEZIONE 2. ORIGINE DELLA CRISI E PRIME SOLUZIONI

dovuto anche introdurre il termine − cv2 x (che è a tutti gli effetti un tempo)
nell’equazione dei tempi.
Con questa nuova trasformazione si verifica che

∂E v ∂E 0 1 ∂E 0


 = −q 0
− q 0
 ∂t 1 − vc2 ∂x 1 − vc2 ∂t

 2 2

∂E 1 ∂E 0 v ∂E 0 ,
= −


0 0
q q
 ∂x 1 − v ∂x c2 1 − v ∂t

 2 2
c2 c2

e derivando nuovamente:

∂2E v2 ∂ 2E 0 v ∂2E 0 1 ∂2E 0


 = 2 2 2 + 2
1 − vc2 ∂x02 1 − vc2 ∂x0 ∂t0 1 − vc2 ∂t02

 ∂t2
,
∂2E 1 ∂2E 0 v ∂2E 0 v2 ∂2E 0
 ∂x2 = 1 − v2 ∂x02 − 2 c2 1 − v2 ∂x0 ∂t0 + c4 1 −


v2 ∂t02
  
c2 c2 c2

e sostituendo nell’equazione delle onde otteniamo

v2 ∂2E 0 v ∂2E 0 1 ∂2E 0 1 ∂2E 0


v2 02
−2 v2
+ 2 − 2 +
∂x0 ∂t0 c2 1 − vc2 ∂t02 1 − vc2 ∂x02
  
c2 1− c2
∂x 2
c 1− c2
v ∂2E 0 v2 ∂2E 0
+2 2 − 2 .
c2 1 − vc2 ∂x0 ∂t0 c4 1 − vc2 ∂t02
 

Le derivate miste si semplificano. Inoltre notando che

v2 1 v2 c2
v2
− 2 = − = −1
1 − vc2 c2 − v 2 c2 − v 2

c2 1− c2

e che
1 v2 c2 v2 1
v2
− v2
= 2 2 2
− 2 2 2
= 2,
c2 1− c2
c4 1− c2
c (c − v ) c (c − v ) c

otteniamo l’equazione delle onde nelle nuove coordinate,

1 ∂2E 0 ∂2E 0
− = 0,
c2 ∂t02 ∂x02
equazione che ha conservato intatta la forma che aveva come conseguenza
delle equazioni di Maxwell. Le trasformazioni di Lorentz nascono proprio
per mantenere questa invarianza in forma.
2.3. SPIEGAZIONE DI LORENTZ 23

2.3.3 Ragioni algebriche


Vi è un’ulteriore ragione per credere nelle trasformazioni di Lorentz, ed è
una ragione algebrica: non ci si poteva accontentare delle trasformazioni di
Fitzgerald, poiché esse non formavano un gruppo. Componendo due trasfor-
mazioni, infatti, in generale non se ne otteneva un’altra della stessa forma.
Dunque le trasformazioni di Fitzgerald erano sicuramente parziali e dovevano
essere completate. Le trasformazioni di Lorentz costituiscono il loro comple-
tamento anche algebrico, poiché esse costituiscono un gruppo. Dimostriamo
tale asserto.
Detto infatti L = {λv } l’insieme delle trasformazioni di Lorentz
 r
v2 v
 1 − 2 t0 = t − 2 x


r c c
2
 1 − v x0 = x − vt


c2

dipendenti dall’unico parametro v (in uno spaziotempo bidimensionale) ab-


biamo che in L c’è l’identità (è la trasformazione λ0 corrispondente a v = 0).
Scrivendo le trasformazioni in forma matriciale, come

q 1 q v
 
 0 2 2
 
x 1− v2 1− v2
 x ,
= c c
t0 qv
2
q 1
v2
t
c2 1− v2 1−
c c2

notiamo che il determinante della matrice di sistema


 1
q v

q
2 2 v2
1− v2 1− v2 1 c2
det  qv 2 −
c
1
c = =1
v v2
c 2 1− v2
q
1− v2 1 − c 2 1 − c 2
c2 c2

è identicamente unitario, quindi per ogni trasformazione esiste la relativa


inversa. Infine componiamo due generiche trasformazioni λv e λw , esplicita-
mente
1 1
 
0


 x =q (x − vt) 

 x00 = q (x0 − wt0 )
v 2 w2
1 − c2 1 − c2

 

1 e 1  ,
0 v 00 0 w 0



 t = q t − c 2 x 

 t = q t − c 2 x
2 2
1− v 1− w

 

c2 c2

dipendenti da due parametri velocità v e w.


24 LEZIONE 2. ORIGINE DELLA CRISI E PRIME SOLUZIONI

Otteniamo che la composta è


 r 2
r
w v2  vw 
 1 − 2 1 − 2 x00 = 1 + 2 x − (v + w)t


r c r c c ,
2 2
 w v  vw  v + w
 1− 1 − 2 t00 = 1 + 2 t − x

c2 c c c2
ovvero  s  
2 2
 1− w2 1− v2 v+w
c c
x00 = x − t


vw 2
1 + vw

 (1+ c2 ) c 2
s
2
 2
 v+w ,
 1− w2 1− v2 1+ vw
2
c c
t00 = t − 2c t


 2
 (1+ vwc 2 ) c
e chiamando
c2 (v + w) v+w
u= = ,
2
c + vw 1 + vw
c2
notando che il fattore ai primi membri può essere riscritto come
v  s
u 1 − wc22 1 − vc22 2 2 2
1 + v cw4 − vc2 − wc2
2
u 
t 2 = 2 2
1 + vw
c 2
1 + v cw4 + 2 vw c2
s 2 2
2 vw
c2
+ vc2 + wc2
= 1− 2 2
1 + v cw4 + 2 vw c2
r
1 c4 (v + w)2
= 1− 2 4
c c + v 2 w2 + 2vwc2
r
u2
= 1− 2,
c
abbiamo che la composta
 r
u2 00
 1 − 2 x = x − ut


r c
2
 1 − u t00 = t − u x


c2 c2
mantiene la forma delle trasformazioni di Lorentz. Dunque abbiamo che

λw ◦ λv = λ v+w , (2.1)
1+ vw
c2

e le trasformazioni di Lorentz formano in effetti un gruppo.


Lezione 3

Osservatori inerziali e
spaziotempo di Minkowski

Abbiamo ripreso il punto di vista newtoniano su spazio e tempo e le ragioni


della sua crisi seguendo un ordine approssimativamente cronologico. Per
spiegare il superamento della crisi dei concetti newtoniani abbandoniamo
ora questo cammino storico e presentiamo la soluzione dal punto di vista
moderno, tenendo conto anche delle informazioni che ci vengono dalla Rela-
tività Generale, cioè della teoria del campo gravitazionale einsteiniano. In
sostanza, partiamo dalla fine.
Il punto cruciale è la discussione del concetto di osservatore. Si abbandona
il meccanismo delle piattaforme newtoniane e si parte da una nozione di
osservatore locale.

3.1 L’osservatore locale


Un osservatore locale è semplicemente una piccola stazione radar, indivi-
duata da una piccola piattaforma locale di supporto, da un orologio e da un
dispositivo che permette di emettere e ricevere segnali luminosi. Trascurando
per il momento il dispositivo elettromagnetico, si può dire che l’osservatore
locale è un orologio che data gli eventi che accadono nelle sue vicinanze. Geo-
metricamente questo osservatore è rappresentato nello spaziotempo dalla sua
linea di universo parametrizzata dal tempo misurato dall’orologio.
Questo osservatore ha tutte le caratteristiche dell’osservatore newtoniano,
ma in piccolo. Quindi il primo passo per superare la crisi della concezione
newtoniana è la localizzazione dell’osservatore: si abbandona il concetto di
osservatore globale e si localizza l’osservatore nello spazio.
Per indagare l’universo fuori dalla sua piattaforma, l’osservatore non usa

25
26 LEZIONE 3. OSSERVATORI INERZIALI E SPAZIOTEMPO

Figura 3.1: Linea di universo di un osservatore. I punti sono i “battiti” del


suo orologio.

più i regoli rigidi di Newton, bensı̀ i segnali luminosi, scelti per la loro ca-
ratteristica di essere i segnali che si propagano con la velocità limite. Per
individuare un evento E fuori dalla linea di universo dell’orologio, l’osser-
vatore invia un segnale luminoso al tempo T1 , misurato dal suo orologio, in
modo tale che il segnale arrivi nel punto di accadimento dell’evento E esat-
tamente quando E accade, e poi misura il tempo di arrivo T2 dell’eco riflessa.
La situazione è chiarita anche dalla figura 3.2.1

Figura 3.2: Individuazione di un evento. Per convenzione indicheremo i


segnali luminosi con queste particolari frecce trattopuntate.

I regoli di Newton sono stati sostituiti da “regoli di luce” e tutte le misure


1
In un universo quadridimensionale dovremmo tener conto anche degli angoli tra il
raggio e gli assi; in questa sede, nel nostro universo bidimensionale, li trascureremo.
3.1. L’OSSERVATORE LOCALE 27

sono ricondotte a misure di tempo eseguite con un unico orologio posto nella
piattaforma dell’osservatore locale.

3.1.1 Misure di spazio, misure di tempo


Il fatto di ricondurre tutte le misure spaziali a misure di tempo (cosa che
accade con questo “metodo radar”), è un’ampliamento di prospettive e una
semplificazione concettuale. Possiamo portare come esempio quanto scrive
H. Bondi in [3]:
Immaginiamo una civiltà in cui il metro sia sconosciuto e ogni di-
stanza espressa in secondi-luce o millimicrosecondi-luce o in qualsiasi
altra unità opportuna; i membri di questa società considererebbero
piuttosto sciocco chi chiedesse il valore della velocità della luce, essi
non la considererebbero una quantità da esprimere in metri al secondo
o chilometri al secondo, ma semplicemente come una unità, l’unità
naturale di velocità. La velocità di un oggetto verrebbe misurata pa-
ragonandola a quella della luce: tutte le velocità ordinarie sarebbero
espresse in termini di questo campione. [...] In altre parole accet-
tando come campione di velocità [...] la velocità della luce, questa
civiltà avrebbe eliminato la necessità di costruire oltre a un campione
di tempo anche uno di lunghezza, e di usare uno scomodo numero per
esprimere la velocità della luce. In questa civiltà esisterebbe solo un
campione di tempo, i suoi componenti ci considererebbero delle per-
sone che lavorano con lunghezze e tempi nel modo più complicato e
assurdo.

(Hermann Bondi, La relatività e il senso comune,


Zanichelli, pp.36-37)

Si consideri infatti
[...] una civiltà in cui la direzione nord-sud viene considerata sacra
ed è sempre misurata in miglia, mentre quella est-ovest viene consi-
derata volgare e profana ed è sempre misurata in yarde. Se la gente
venisse abituata a vedere le cose sotto questo aspetto fin dalla prima
età, occorrerebbe una mente audace per suggerire l’esistenza di un
qualche legame tra le distanze nella direzione nord-sud e quelle nella
direzione est-ovest.

(ibidem, p.37)

La stessa cosa accade dunque per noi: abbiamo sempre concepito spazio
e tempo come entità separate, cosicché ci è costata fatica vederle come varie
declinazioni di un unico spaziotempo. In un’ottica unitaria di questo tipo
28 LEZIONE 3. OSSERVATORI INERZIALI E SPAZIOTEMPO

non c’è alcuna ragione di considerare anche un campione di lunghezza (come


ad esempio un regolo graduato): ci basta usare un campione di tempo, che
legheremo poi mediante c alle quantità spaziali.

Questo modo di procedere appare corretto, soprattutto se pen-


siamo a come sono fatte in realtà le cordelle metriche e le righe gra-
duate che usiamo per misurare le distanze. Sappiamo che esse sono
fatte da atomi la cui struttura è determinata da forze elettriche; sap-
piamo che questi atomi hanno determinati periodi di vibrazione e sap-
piamo che, nei corpi che chiamiamo rigidi, gli atomi assumono una
distanza relativa definita come conseguenza dei particolari periodi di
vibrazione. Quindi possiamo concludere che la lunghezza di una riga
è in realtà determinata dal periodo di oscillazione degli atomi di cui è
composta, tradotto poi al solito modo in una distanza, per mezzo della
velocità della luce. Se concludiamo, come in effetti possiamo fare, che
le distanze tra gli atomi di quelli che noi chiamiamo corpi rigidi sono
le distanze corrispondenti alle oscillazioni degli atomi, possiamo allora
dire che anche queste distanze sono determinate in realtà con metodi
radar.

(ibidem, p.38)

3.2 Osservatori localmente inerziali


Fin qui non vi è alcun modo di privilegiare un osservatore rispetto ad un
altro. Però possiamo constatare fisicamente che esiste una classe privilegiata
di osservatori locali, che chiameremo osservatori localmente inerziali.
Consideriamo, ad esempio, una navicella spaziale che navighi a motori spenti
in un’orbita interplanetaria. L’esperienza mostra che all’interno della navi-
cella tutto avviene come previsto dalla teoria newtoniana degli osservatori
inerziali: due particelle lasciate libere o stanno ferme o si muovono di moto
rettilineo uniforme, un giroscopio messo in rotazione ha l’asse in direzione
invariabile, e cosı̀ via. Ammettiamo perciò, come primo assioma, l’esistenza
di osservatori localmente inerziali (ove l’avverbio “localmente” si riferisce al
fatto che le osservazioni sono sempre locali, in un intorno dell’osservatore),
gli osservatori che cioè, sulla loro piattaforma, vedono le particelle libere sod-
disfare al principio di inerzia, i giroscopi in rotazione avere l’asse in direzione
fissa, e cosı̀ via.
Una questione interessante è comprendere l’origine degli osservatori iner-
ziali. La risposta accettata oggi è che gli osservatori inerziali sono determi-
nati dalla distribuzione di massa nell’universo (principio o punto di vista di
3.3. ASSEMBLAMENTO 29

Mach2 ). Una conferma di questo punto di vista viene dall’osservazione spe-


rimentale la quale mostra che, rispetto a tali osservatori, il complesso delle
stelle che popolano l’universo appare fisso (e non ruotante): questo ci dice che
c’è una relazione misteriosa tra questi osservatori e la materia nell’universo.
Quindi l’origine degli osservatori localmente inerziali, detti anche osservatori
in caduta libera, starebbe in una proprietà globale dell’universo e dello spa-
ziotempo che lo rappresenta. Riprenderemo questa breve divagazione nella
sezione 10.2.3, in questo momento accettiamo semplicemente l’esistenza di
tali osservatori come un principio base della teoria.
Gli osservatori localmente inerziali si riconoscono sperimentalmente fa-
cendo semplici esperienze meccaniche con particelle libere (devono essere o
ferme o muoversi di moto uniforme) oscillatori (non devono allungarsi) e
giroscopi (il cui asse non deve cambiare direzione).

3.3 Assemblamento
Introdotti gli osservatori localmente inerziali, si studia poi il loro assembla-
mento (ossia come essi sono collegati). Consideriamo due osservatori inerziali
O e O0 . Mediante il metodo dei segnali radar ognuno dei due può decidere se
l’altro è in quiete o in moto rispetto a lui. La condizione di quiete è espressa
dall’invarianza dell’intervallo di tempo T tra emissione e ricezione del segnale
radar, scambiato tra i due osservatori (come mostra la figura qui sotto).

Figura 3.3: Scambio reciproco di segnali luminosi tra osservatori.

La proprietà vale tanto per il primo quanto per il secondo osservatore. Si


2
Ernst Mach (1838-1916), filosofo e fisico austriaco di grande influenza su Einstein e su
tutto il pensiero moderno.
30 LEZIONE 3. OSSERVATORI INERZIALI E SPAZIOTEMPO

constata inoltre che se gli osservatori sono “sufficientemente” vicini (situa-


zione corrispondente a periodi T e T 0 “sufficientemente” piccoli) è possibile
calibrare gli orologi dei due osservatori in modo tale che T = T 0 . Questo
processo di calibrazione prende il nome di sincronizzazione degli orologi
inerziali in quiete relativa.
Riepilogando: l’esperienza mostra che esistono osservatori localmente
inerziali in quiete relativa che possono essere sincronizzati tra loro. Rimane
aperto il problema dell’estensione di questo processo. Il processo di sincro-
nizzazione di osservatori inerziali in grande è in generale impossibile. Tale
processo funziona solo per osservatori “sufficientemente” vicini: quando si
superano certe distanze e certi intervalli di tempo, cominciano a compa-
rire delle discrepanze e si manifesta l’impossibilità di sincronizzare in grande
osservatori localmente inerziali nel modo prima descritto.

3.4 Lo spaziotempo di Minkowski


Si chiama spaziotempo di Minkowski uno spaziotempo ideale in cui si am-
mette che il processo di sincronizzazione prima descritto valga in grande. Lo
spaziotempo di Minkowski è quindi il modello di spaziotempo dove esistono
osservatori globalmente inerziali, costituiti da una rete di osservatori lo-
calmente inerziali in quiete relativa (sempre nel senso dello scambio di segnali
luminosi) e sincronizzati tra loro.
Lo spaziotempo di Minkowski è quindi un’approssimazione dello spazio-
tempo fisico che può essere paragonata all’approssimazione che lo spazio tan-
gente fornisce di una superficie curva in un suo punto (fig. 3.4), come vedremo
meglio alla Lezione 10.
Nello spazio tangente possiamo parlare di rette e di rette parallele, mentre
sulla superficie possiamo solo parlare di geodetiche. Infatti le rette riman-
gono parallele in ogni punto dello spazio tangente, mentre le corrispondenti
geodetiche divergono sulla superficie a causa della curvatura della superficie.
Le rette e le geodetiche devono essere confrontate con le linee di universo degli
osservatori localmente inerziali nello spaziotempo. Rette parallele corrispon-
dono ad osservatori inerziali in quiete relativa. Nello spaziotempo di Minko-
wski (corrispondente allo spazio tangente) queste linee di universo rimangono
sempre parallele, nello spaziotempo fisico invece no, a significare che dopo
un po’ il processo di sincronizzazione diventa impossibile. L’impossibilità di
definire mediante il processo di sincronizzazione un osservatore globalmente
inerziale è quindi una misura della “curvatura” dello spaziotempo.
Nel modello di Minkowski, invece, si assume che esistano osservatori glo-
balmente inerziali; ciò corrisponde a sviluppare una teoria dello spaziotempo
3.4. LO SPAZIOTEMPO DI MINKOWSKI 31

Figura 3.4: Lo spazio di Minkowski come approssimazione tangente della


superficie curva dello spazio fisico: rette parallele su TP S divergono su S per
effetto della curvatura.
32 LEZIONE 3. OSSERVATORI INERZIALI E SPAZIOTEMPO

piatto. Questa teoria è la Relatività Ristretta. Essa è una buona ap-


prossimazione del mondo fisico in una scala di misure sulla quale si possono
trascurare gli effetti delle forze gravitazionali. La fisica nello spazio di Min-
kowski è, in sostanza, una fisica in assenza di gravità: in questa situazione è
possibile il processo di sincronizzazione prima descritto.
Su scale più grandi, dove non è possibile trascurare l’effetto delle forze
gravitazionali prodotte dalle grandi masse distribuite nell’universo, le forze
gravitazionali si manifestano come cause distorcenti il processo di sincroniz-
zazione (influenti sul moto dei segnali luminosi), cosicché l’approssimazione
dello spaziotempo di Minkowski non risulta più valida e bisogna passare a
uno schema più generale, cui si dà il nome di Relatività Generale. In
sostanza, la Relatività Generale è la geometria dello spazio tempo quando si
tiene conto dell’impossibilità della sincronizzazione in grande di osservatori
localmente inerziali.
Riassumendo:

• il concetto di osservatore ha validità locale ed esistono degli osservatori


privilegiati detti localmente inerziali;

• in una prima approssimazione, è possibile parlare di osservatori local-


mente inerziali in quiete relativa e sincronizzare i rispettivi orologi in
modo che misurino lo stesso periodo nei segnali scambiati;

• questo processo di sincronizzazione è solamente locale. Una buona


approssimazione dello spaziotempo reale è fornita dal modello ideale
in cui si ammette che la nozione di quiete relativa e il processo di
sincronizzazione abbiano validità globale. Questa proprietà definisce lo
spaziotempo di Minkowski.

3.5 Postulati
Lo spaziotempo di Minkowski è quindi uno spaziotempo su cui sono definiti
osservatori globalmente inerziali. Si assume che per questi osservatori valgano
due postulati fondamentali imposti dall’evidenza sperimentale con i fenomeni
elettromagnetici.

3.5.1 Invarianza della velocità della luce


Il primo postulato afferma che la luce si propaga nel vuoto con la stessa
velocità rispetto ad un qualsiasi osservatore inerziale.3 Oppure, in forma leg-
3
Non era forse questo il risultato dell’esperimento di Michelson e Morley?
3.5. POSTULATI 33

germente diversa ma equivalente, possiamo dire che la velocità della luce nel
vuoto è indipendente dalla velocità della sorgente che la emette. Si noti che
possiamo parlare di velocità di un segnale solamente perché nello spaziotempo
di Minkowski abbiamo un osservatore globale.
Oltre che invariante, la velocità della luce è anche una velocità limite,
nel senso che non esistono sistemi o segnali fisici che possano superare tale
velocità. Questo discende, se vogliamo, dal fatto che la composizione di
velocità di oggetti e segnali fisici non può mai superare la velocità della luce,
come mostra la legge gruppale (2.1) e come vedremo meglio più avanti.

3.5.2 Principio di Relatività


Il secondo postulato è il cosiddetto Principio di Relatività. Esso afferma
che tutti gli osservatori globalmente inerziali che esistono nello spaziotempo
di Minkowski sono fra loro equivalenti e indistinguibili, in quanto tutti i
fenomeni meccanici ed elettromagnetici avvengono in due osservatori glo-
balmente inerziali con le stesse modalità, a parità di condizioni iniziali e
di situazioni ambientali. Di conseguenza, le leggi della fisica devono avere la
stessa forma in tutti gli osservatori inerziali. La novità di questa formulazione
forte del principio rispetto alla formulazione newtoniana sta nel riferimento
ai fenomeni elettromagnetici.
La Relatività Ristretta è lo studio delle implicazioni che questi due postu-
lati hanno sulla geometria dello spaziotempo e sulla forma delle leggi della fi-
sica. Riassumendo, abbiamo localizzato l’osservatore, introdotto i concetti di
osservatori localmente inerziali e di osservatori localmente inerziali in quiete
relativa, abbiamo introdotto l’invarianza della velocità della luce (aspetto
completamente nuovo) e abbiamo esteso il Principio di Relatività.
34 LEZIONE 3. OSSERVATORI INERZIALI E SPAZIOTEMPO
Lezione 4

La struttura dello spaziotempo


di Minkowski

Ciò che vogliamo fare adesso è determinare la geometria dello spaziotempo M


di Minkowski a partire dagli assiomi fondamentali che caratterizzano questo
spazio. Ci serviremo dapprima dei due seguenti assiomi:

• esistenza di osservatori inerziali globali (costruiti assemblando osserva-


tori inerziali locali in quiete relativa, mediante il processo di sincroniz-
zazione);

• invarianza della velocità della luce (che è velocità limite per sistemi e
segnali fisici).

Più avanti, quando analizzeremo l’effetto Doppler ci servieremo anche del


terzo postulato fondamentale, il Principio di Relatività.
Si tratta perciò di determinare le strutture geometriche intrinseche della
varietà M , strutture su cui tutti gli osservatori concordano. Vale la pena
ripeterlo: si parte dal relativo (ossia dalle misure fatte da un singolo osser-
vatore) per giungere all’assoluto, tramite confronto tra le diverse descrizioni
relative. Individueremo sostanzialmente tre strutture: la struttura causale,
la struttura metrica e la struttura affine.
Nella nostra analisi ci serviremo del cosiddetto “k-calcolo” (introdotto
alla metà degli anni Cinquanta da H. Bondi), che è semplicemente la geo-
metria dei segnali luminosi, nella misura in cui la geometria euclidea è la
geometria dei regoli rigidi. Diamo qualche riferimento bibliografico: un’e-
sposizione bella e non tecnica del k-calcolo e della Relatività si può trovare
in [3], un trattato più tecnico e più esaustivo è [4]; infine un libro che tratta
l’aspetto più matematico della faccenda, confrontando la geometria euclidea
con la geometria dello spazio di Minkowski, è [5].

35
36 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

4.1 Il cono luce


La prima cosa da fare è geometrizzare l’assioma riguardo all’invarianza di c
(velocità della luce nel vuoto): tale velocità è il primo invariante che abbiamo
(all’interno della classe degli osservatori inerziali) e dunque corrispone dalla
prima struttura geometrica di M , detta “struttura di causalità”, poiché
essa regola il segno del divario temporale tra gli eventi, e quindi stabilisce
l’ordinamento temporale che è alla base del principio di causa-effetto. Se
vogliamo affermare, infatti, che un evento A è causa di un evento B, deve
quantomeno sussistere il fatto che A accada prima di B. Per confronto con
la cinematica newtoniana, vediamo che cosa implica l’assioma dell’invarianza
di c nella geometria di M .
Immaginiamo di considerare nello spaziotempo di Newton due osservatori
inerziali in moto relativo l’uno rispetto all’altro, muniti dello stesso dispo-
sitivo per lanciare palline (pensate come punti materiali). Supponiamo che
a un certo istante i due osservatori si trovino nello stesso luogo (chiamiamo
questo evento O), e che lancino insieme le due palline. Le figure qui sotto
mostrano che cosa accade e che cosa accadrebbe se invece di lanciare pal-
line nello spazio newtoniano lanciassero segnali luminosi secondo la visione
di Einstein.

Figura 4.1: A sinistra: palline lanciate da osservatori inerziali in moto rela-


tivo in un universo newtoniano. A destra: segnali luminosi inviati dagli stessi
osservatori inerziali in moto relativo in un universo einsteiniano.

Nel caso newtoniano, la velocità degli oggetti lanciati dipende dalla ve-
locità della sorgente, e quindi le linee di universo delle palline lanciate da A
e B nell’evento O, in generale, differiscono. Dunque non vi è alcuna linea di
universo privilegiata rispetto alle altre: tutte le linee di universo che tagliano
i piani di simultaneità sono percorribili da una qualche pallina lanciata da
una sorgente a una certa velocità.
4.1. IL CONO LUCE 37

Viceversa, nel caso di Einstein, il postulato riguardo all’invarianza di c


richiede che la velocità della luce non dipenda dalla velocità della sorgente.
Quindi due raggi luminosi, inviati in una data direzione da due sorgenti
che viaggiano con velocità diverse, viaggeranno comunque con la medesima
velocità. Il che equivale a dire che per ogni direzione spaziale vi è un’unica e
ben determinata linea di universo del segnale luminoso. L’insieme di queste
linee di universo forma il cono luce associato all’evento considerato (v. fig.
4.2). Nel caso di un universo bidimensionale, essendoci solo due direzioni
possibili per il raggio luminoso, il cono luce degenera a una sorta di triangolo.
Nel caso di un universo tridimensionale le direzioni possibili dipendono da
un angolo, e in generale l’insieme dei raggi possibili è la superficie laterale di
un cono. Nel caso di un universo quadridimensionale, le direzioni possibili
dipendono da due angoli e la proiezione sulle dimensioni spaziali del cono
luce è un cono pieno (sulla superficie e all’interno di quel cono vi sono tutte
le direzioni possibili).

Figura 4.2: Coni luce in universi (rispettivamente) bidimensionale, tridimen-


sionale e quadridimensionale. In un universo bidimensionale i possibili raggi
inviati sono solamente due.
38 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

I coni luce sono il corrispettivo einsteiniano dei piani di simultaneità new-


toniani (con Einstein, infatti, non essendoci più un tempo assoluto non ha
senso parlare di superfici di simultaneità): si immagina infatti facilmente (v.
fig. 4.3) che i piani di Newton debbano essere pensati come il limite dei coni
di Minkowski quando si ammetta che c → +∞ (questo è il cosiddetto “limite
classico 1 ”).

Figura 4.3: Piani di simultaneità come limite dei coni luce.

4.2 c come velocità limite


La velocità della luce è invariante, ma abbiamo anche postulato che sia una
velocità limite, ovvero che non esistano sistemi o segnali fisici che possano
oltrepassare tale velocità. Questa proprietà ci è utile per stabilire la relazione
tra osservatori inerziali e coni luce.
La questione che ci poniamo è: come sono disposte le linee di universo
degli osservatori inerziali rispetto ai coni luce? La risposta è che le linee
di universo di tali osservatori devono necessariamente cadere all’interno del
cono, poiché essendo c velocità limite, un segnale che viaggiasse al di fuori
dal cono avrebbe pendenza minore, e dunque una velocità maggiore di c.
Il carattere di velocità limite di c implica quindi che le linee di universo de-
gli ossevatori inerziali siano contenute nel cono luce.2 Queste linee di universo
sono dette linee del genere tempo.
Da questa osservazione segue subito la divisione (relativamente a un
evento prefissato O) dello spaziotempo M in tre regioni distinte (v. fig.
4.7):
Più in generale, si parla di limite classico quando vc → 0; si parla di limite relativistico
1

invece se vc → 1.
2
Se invece di considerare osservatori inerziali consideriamo osservatori qualsiasi, la pro-
prietà si ripercuote sul vettore tangente, il quale deve essere contenuto nel cono luce in
ogni punto della linea (fig. 4.6).
4.2. C COME VELOCITÀ LIMITE 39

Figura 4.4: Il segnale deve rimanere all’interno del cono luce.

Figura 4.5: Possibili linee di universo di osservatori in moto nel caso


bidimensionale e nel caso tridimensionale.
40 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

Figura 4.6: Per osservatori qualsiasi, in ogni punto la tangente alla linea di
universo deve rimanere all’interno del cono luce.

• futuro: è la falda del cono che contiene le linee del genere tempo, nel
senso dell’orientamente delle linee di universo degli osservatori;

• passato: è l’altra falda del cono;

• altrove (dall’inglese elsewhere): è tutta la parte rimanente dello spa-


ziotempo.

Questa distinzione ha un significato fisico profondo: distingue gli eventi


che possono essere influenzati da O (futuro) dagli eventi che possono aver
influenzato O (passato) e da quelli che non possono essere messi in relazione
causale con O (altrove). Vedremo infatti che, se possiamo dare un ordina-
mento temporale per gli eventi del futuro e del passato (possiamo dire quindi
univocamente se E avviene prima o dopo O, nel senso che tutti gli osservatori
concordano su ciò), a eventi situati nell’altrove non riusciremo ad attribuire
una consequenzialità temporale: ci saranno osservatori che li diranno simul-
tanei a O, altri che li vedranno accadere prima di O, altri ancora che li
vedranno accadere dopo O.

4.3 Coordinate di un evento


Stabilita la traduzione geometrica degli assiomi, cominciamo a vedere come
ogni osservatore inerziale individua, con le sue coordinate relative, ogni evento;
in linguaggio geometrico, costruiamo il sistema di coordinate globali su M
4.3. COORDINATE DI UN EVENTO 41

Figura 4.7: Tripartizione dello spaziotempo.

Figura 4.8: Non possiamo dire se E accada prima o dopo O.


42 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

associato ad un dato osservatore inerziale. Non ci sono più regoli, e quindi il


meccanismo è interamente basato sui segnali luminosi.
Dato un osservatore A, innanzitutto introduciamo le coordinate radar
(T1 , T2 ) dell’evento E, definite come segue:
T1 : è il tempo di emissione (rispetto all’orologio dell’osservatore A) del
segnale luminoso emesso da A che giunge in E;
T2 : è il tempo di ricezione del segnale riflesso (sempre nel giudizio di A).

Figura 4.9: Le coordinate radar di un evento.

In linguaggio geometrico, le coordinate radar non sono nient’altro che le


intercette del cono luce di vertice E con la linea di universo dell’osservatore
A.
Si passa poi alle coordinate spaziotemporali (x, t) dell’evento mediante le
seguenti definizioni:3
1

 ct = 2 c(T2 + T1 )


(4.1)
 x = 1 c(T2 − T1 )


2
Sostanzialmente stiamo definendo il tempo dell’evento E come media dei
due tempi (tempo di emissione e tempo di ricezione), e come spazio lo spazio
percorso dal raggio luminoso nella semisomma dei tempi, ossia nella metà
del periodo emissione-ricezione.
3
Preferiremo sempre ricondurre le espressioni temporali a espressioni di lunghezza,
moltiplicando per la costante c. Ad esempio, nelle equazioni (4.1) abbiamo scritto ct =
1 1
2 c(T2 + T1 ) in luogo della più semplice t = 2 (T2 + T1 ). Questa notazione ci sarà comoda
in seguito.
4.4. RELATIVITÀ DELLA SIMULTANEITÀ 43

Figura 4.10: t come media tra T1 e T2 .

Occorre puntare l’attenzione sul fatto che tali definizioni sono le uniche
definizioni plausibili con le informazioni in nostro possesso (solo T1 , T2 e
c), ipotizzando tacitamente che lo spazio sia isotropo, ossia che la velocità
della luce non cambi tra andata e ritorno.4 Non abbiamo altra scelta che
prendere come tempo il tempo medio di riflessione: secondo il punto di vista
dell’osservatore A, la luce, per giungere ad E, deve impiegare lo stesso tempo
che impiega per tornare indietro.

4.4 Relatività della simultaneità


Diamo innanzitutto una definizione. Diremo che due eventi E1 ed E2 sono
simultanei nel giudizio di A se t(E1 ) = t(E2 ) ovvero (il che è la stessa cosa)
se i due eventi hanno coordinate radar che differiscono per una costante (v.
fig. 4.11).
In particolare, consideriamo due eventi che abbiano le stesse coordinate
radar (T1 , T2 ) nel giudizio dell’osservatore A. Ne consegue che, rispetto a
tale osservatore, E1 ed E2 sono necessariamente simultanei (è un caso parti-
colare della definizione data sopra). Prendiamo ora un osservatore B in moto
relativo rispetto ad A verso destra, nel nostro universo bidimensionale: per
B gli eventi non sono più simultanei, dal momento che E1 accade dopo E2 .
Analogamente considerando C in moto relativo rispetto ad A verso sinistra:
per C l’evento E1 accadrà prima dell’evento E2 .
La situazione è simile a quella incontrata in geometria al momento della
scoperta delle geometrie non euclidee. Si può sviluppare una geometria dello
4
Questa ipotesi, dopotutto, è già stata formulata, dal momento che è parte del postulato
di invarianza di c.
44 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

Figura 4.11: Eventi simultanei hanno coordinate radar che differiscono per
una costante (|T20 − T2 | = |T10 − T1 |).

spaziotempo tanto assumendo l’invarianza del concetto di simultaneità (con


Newton) quanto assumendo l’invarianza della velocità della luce (con Ein-
stein): in entrambi i casi si hanno sistemi senza incoerenze logiche interne.
L’unica cosa che non si può fare è sviluppare una geometria in cui valgano
entrambi i tipi di invarianza: se accettiamo il postulato di Newton non ci
può essere una velocità invariante, se accettiamo l’esistenza di una velocità
invariante non ci può essere una simultaneità assoluta. I due assiomi sono
mutuamente esclusivi.

4.5 L’effetto Doppler longitudinale


Veniamo ora al problema centrale, al cuore della nostra analisi: il problema
del confronto tra diversi osservatori inerziali in moto relativo, passo indispen-
sabile per la scoperta delle caratteristiche comuni ai vari osservatori e della
geometria dello spaziotempo.
Il nucleo della questione è il confronto tra gli orologi dei due osservatori
in moto. Questo confronto è fatto misurando il periodo di emissione e il
periodo di ricezione (ognuno nel giudizio del corrispondente osservatore) in un
processo di scambio di segnali luminosi periodici - essendo i segnali luminosi
l’unico mezzo che gli osservatori hanno a disposizione per confrontarsi.
Sia Te il periodo di emissione nel giudizio di A, e sia Tr il periodo di
ricezione valutato da B. Se B si allontana da A con velocità relativa5 v,
5
Si presti attenzione a questo particolare: se trattassimo con l’effetto Doppler acustico
(cioè il fenomeno per cui un suono cambia frequenza all’avvicinarsi/allontanarsi di sorgente
o osservatore) non potremmo considerare solo la velocità relativa tra sorgente e osservatore.
4.5. L’EFFETTO DOPPLER LONGITUDINALE 45

Figura 4.12: Per A gli eventi E1 e E2 sono simultanei; per B, E2 accade


prima di E1 ; per C, E1 accade prima di E2 .
46 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

Figura 4.13: Scambio di segnali luminosi periodici tra osservatori inerziali


in moto relativo.

deve necessariamente essere che Tr > Te , poiché il secondo segnale ha dovuto


percorrere una distanza maggiore per raggiungere B. In generale, poniamo
Tr = k(v) · Te , con k(v) > 0 funzione della velocità relativa v tra i due
osservatori. Avremo che k > 1 se i due osservatori si allontanano, k = 1 se
i due osservatori sono in quiete relativa, 0 < k < 1 se i due osservatori si
avvicinano. Il fattore k, termine centrale nel nostro studio (da cui, appunto,
il nome di k-calcolo), viene detto fattore Doppler6 longitudinale, ove
l’aggettivo “longitudinale” sta ad indicare che i segnali luminosi sono emessi
nella direzione del moto relativo dei due osservatori.7 Il problema centrale
(semplice, ma bello e profondo) è la determinazione di k in funzione della
velocità relativa v. Per risolvere il problema disponiamo solamente di due
informazioni:
(i) B si muove di moto relativo con velocità v rispetto a A, e dunque vale
che
x=v·t
se (x, t) sono le coordinate di B nel giudizio di A;
Avendo, infatti, l’onda sonora bisogno di un mezzo (l’aria) per propagarsi, è necessario
considerare le velocità rispetto all’aria sia della sorgente, sia dell’osservatore. Nella nostra
analisi radar, invece, tutto questo non è necessario: l’onda elettromagnetica non ha bisogno
di alcun mezzo per propagarsi.
6
Christian Johann Doppler (1803-1853), fisico austriaco.
7
Chiaramente in un universo bidimensionale non poteva essere altrimenti: la dire-
zione è una sola, e dunque sarà quella sia del moto relativo, sia dei segnali luminosi;
ergo: l’effetto Doppler è sempre longitudinale. Viceversa, in universi tridimensionali e
quadridimensionali la specificazione “longitudinale” è importante.
4.5. L’EFFETTO DOPPLER LONGITUDINALE 47

(ii) il Principio di Relatività (che finora non abbiamo usato).

Queste informazioni sono sufficienti per risolvere il problema. Si consideri


infatti la figura 4.14: essa mostra il moto relativo di B rispetto ad A.

Figura 4.14: Moto di B relativo ad A. I tempi T1 e T2 sono misurati


dall’orologio di A, il tempo τ è misurato dall’orologio di B.

Il nodo centrale è interpretare questa figura dal punto di vista dell’effetto


Doppler, convenendo che A e B si scambino un primo segnale (una sorta di
“azzeramento” degli orologi) in O. In questo modo convertiamo le coordinate
radar in periodi.8 Esattamente, il passaggio interpretativo è chiaro nel pas-
saggio dalla figura 4.14 alla figura 4.15, ovvero nel passaggio dal diagramma
del moto relativo di B nel giudizio di A al diagramma del doppio scambio
Doppler tra A e B.
Ciò che succede è che A e B sincronizzano gli orologi quando si incontrano;
dopo un tempo T1 (nel giudizio di A), A lancia un segnale luminoso che arriva
al tempo τ (nel giudizio di B) all’osservatore B, il quale lo rispedisce subito
indietro. Il segnale ritorna al tempo T2 (nel giudizio di A) all’osservatore A.
Il diagramma 4.14 del moto relativo serve a localizzare B nel giudizio di
A. Infatti (T1 , T2 ) sono esattamente le coordinate radar di B (in particolare

8
Si faccia sempre molta attenzione alla differenza tra coordinate e periodi. Nelle figure
le lettere riferite alle coordinate radar si distingueranno da quelle dei periodi dal fatto che,
mentre le prime sono poste in prossimità dei punti che denotano gli eventi, le seconde sono
poste lungo i segmenti individuati dai punti.
48 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

Figura 4.15: Doppio scambio Doppler. Gli istanti temporali della figura 4.14
sono stati reinterpretati come periodi di tempo del doppio scambio Doppler
tra A e B: T1 è il periodo di emissione da parte di A di un segnale periodico
ricevuto da B con un periodo di ricezione τ ; T2 è il periodo di ricezione da
parte di A di un segnale periodico emesso da B con un periodo τ

sono le coordinate dell’evento E) rispetto ad A. Quindi le equazioni


1

 ct = c(T2 + T1 )

2
1
 x = c(T2 − T1 )

2
ci forniscono la posizione e il tempo di B nel giudizio di A. Unendo questo
risultato all’informazione (i), possiamo scrivere che
v x T2 − T1
= = .
c ct T2 + T1
Ora colleghiamo le coordinate radar con il fattore Doppler, osservando
che τ è, nel grafico dello scambio Doppler, esattamente il periodo di ricezione
da parte di B di un treno d’onde emesso da A con periodo T1 (pensando,
come detto, che la prima emissione avvenga in O, e dunque coincida con la
ricezione). Quindi
τ = kAB (v) · T1 ,
con kAB (v) fattore Doppler longitudinale quando A emette e B riceve. Allo
stesso modo, posso interpretare T2 come periodo di ricezione da parte di A di
un treno d’onde emesso da B con periodo τ (ancora una volta, come detto,
pensiamo il primo segnale emesso in O, come “azzeramento” degli orologi).
4.5. L’EFFETTO DOPPLER LONGITUDINALE 49

Ne deduciamo che
T2 = kBA (v) · τ,
con kBA (v) fattore Doppler longitudinale quando B emette e A riceve.
Ma il Principio di Relatività9 impone che ci sia completa simmetria tra
A e B, ovvero che
kBA (v) = kAB (v) =: k(v).
Se non fosse cosı̀, infatti, avremmo modo di scegliere un osservatore privi-
legiato (ad esempio, l’osservatore che ha il minor k quando emette i segnali
luminosi).10
Ne deduciamo che devono valere le seguenti tre equazioni:
v T − T1

 = 2

 c
 T2 + T1
 T1 = k −1 · τ .


T2 = k · τ

Sostituendo le due ultime equazioni nella prima e semplificando τ , si ricava


che
v k − k −1 k2 − 1
= = ,
c k + k −1 k2 + 1
ovvero vk 2 + v = ck 2 − c, da cui
r
c+v
k= . (4.2)
c−v
Dunque, se B si allontana da A, abbiamo che v > 0, ovvero k > 1. Se A
e B sono in quiete relativa, abbiamo che v = 0, ovvero k = 1. Se infine B si
avvicina ad A, abbiamo che v < 0, k < 1.
9
Si presti attenzione: è la prima volta che questo principio entra seriamente in gioco
nella nostra analisi.
10
Per dirla con le parole di H. Bondi:
Si noti che il Principio di Relatività, insistendo sulla equivalenza
di tutti gli osservatori inerziali, rende chiaro il fatto che il rapporto [k]
deve essere lo stesso per ogni coppia di osservatori inerziali, chiunque
sia quello che trasmette. È per questa regola che il caso della luce
differisce in maniera cosı̀ netta dal caso del suono, [...] in cui [...]
occorre tener conto anche delle velocità di chi trasmette e di chi riceve
rispetto all’aria.
(Hermann Bondi, La relatività e il senso comune,
Zanichelli, pp.73-74)
50 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

4.6 La dilatazione dei tempi


Questo era il fulcro della faccenda: iniziamo a trarne le prime conclusioni.
Senza aspettare l’introduzione delle trasformazioni di Lorentz possiamo met-
tere subito in luce il carattere relativo delle durate11 : ogni osservatore at-
tribuisce a una coppia di eventi una durata, ma il valore di queste durata
cambia in dipendenza dall’osservatore. Consideriamo due eventi che avven-
gano nello stesso luogo per un osservatore, o analogamente: due eventi sulla
lina di universo di un osservatore inerziale (eventi cosiddetti “separati da un
vettore del genere tempo”). Quindi i due eventi selezionano un osservatore
inerziale privilegiato, quello che li vede appunto accadere nello stesso luogo.
Si chiama tempo proprio τ la durata misurata dall’osservatore inerziale
che vede i due eventi avvenire nello stesso luogo. Si chiama tempo relativo
t la durata misurata da un qualunque altro osservatore inerziale.

Figura 4.16: B è l’unico osservatore inerziale che vede accadere E1 ed E2


nello stesso luogo. Pertanto, la durata del periodo tra E1 ed E2 misurata da
B sarà il tempo proprio τ .

Sotto le ipotesi newtoniane avremmo che t = τ . Qui, invece, le cose


1
cambiano: t > τ , in particolare t = γτ , con γ = q ≥ 1 detto fattore
2
1 − vc2
di Lorentz. Vediamo perché succede ciò.
Con riferimento alla figura 4.17, conosciamo le coordinate radar di E1 (è
l’origine, l’“azzeramento degli orologi”). Dobbiamo procurarci le coordinate
11
Al contrario di quanto accadeva nel caso newtoniano, in cui le durate erano invarianti
e, in particolare, lo era la simultaneità. Qui, avendo visto che la simultaneità non è
invariante, è logico aspettarci che non lo siano nemmeno le durate.
4.6. LA DILATAZIONE DEI TEMPI 51

Figura 4.17: Il tempo proprio è sempre minore del tempo relativo.

di E2 rispetto ad A. Per quanto visto sull’effetto Doppler abbiamo che

T1 = k −1 τ,

T2 = kτ.
Per definizione delle coordinate spaziotemporali, abbiamo che il tempo t
di accadimento dell’evento è uguale a
1 1
t = (T1 + T2 ) = (k + k −1 )τ.
2 2
q
Ma d’altro canto, ricordando che k = c+vc−v
, si ha che

c+v 2c
1 −1
 1 k2 − 1 1 c−v − 1 1 c−v
k+k = = q = q =
2 2 k 2 c+v 2 c+v
c−v c−v
c 1 1
=p =q =q = γ, (4.3)
(c + v)(c − v) c2 −v 2
1− v2
c2 c2

in base a come avevamo precedentemente definito il fattore γ ≥ 1 di Lorentz.


Dunque, il tempo relativo è sempre maggiore o uguale al tempo proprio; in
particolare τ = t se e solo se v = 0, ovvero se i due osservatori sono in quiete
relativa.12
12
En passant, si noti che, se τ > 0, anche t > 0, il che significa che almeno il segno del
divario temporale tra due eventi il cui vettore cade all’interno del cono luce è invariante.
52 LEZIONE 4. LO SPAZIOTEMPO DI MINKOWSKI

Figura 4.18: “Tachimetro” di Lorentz: in uno scambio ripetuto di segnali


luminosi, le coordinate temporali sono in progressione geometrica di ragione
k.

Potrebbe sorgere spontanea un’obiezione: se τ è il minimo tempo misura-


bile, e tutti i t sono maggiori di τ , ho un criterio per scegliere un osservatore
inerziale privilegiato rispetto ad altri; in altre parole, pare esserci un’incon-
gruenza interna: se τ è minimo, sembra non valere più il Principio di Relati-
vità. Dove è l’inghippo? L’inghippo è nel fatto che il Principio di Relatività
ci garantisce che a parità di condizioni, tutti gli osservatori (globalmente)
inerziali sono equivalenti. Ma in questo caso le condizioni non sono affatto
le stesse! Abbiamo rotto la simmetria scegliendo l’osservatore per cui E1 ed
E2 accadono nello stesso luogo: per gli altri osservatori questo non succede,
e dunque è logico che essi non siano equivalenti, dal momento che abbiamo
deliberatamente affidato ad essi diverse condizioni iniziali. Non c’è quindi
contraddizione: il Principio di Relatività continua a valere per osservatori
che si trovino nelle stesse condizioni.

4.7 Come misurare k e v con il metodo radar


Con il metodo degli scambi ripetuti di segnali radar, abbiamo anche un modo
per misurare k (e conseguentemente v) servendoci delle coordinate radar.
Come mostra la figura 4.18, la successione delle coordinate radar in uno
scambio ripetuto di segnali luminosi è una progressione di tipo geometrico
e di ragione k (potremmo chiamare questo fatto “tachimetro” di Lorentz ).
Tenendo presente la somiglianza con il teorema di Talete della geometria,
possiamo anche affermare che: in un triangolo del genere tempo avente per
base un raggio luminoso, gli altri due lati sono in proporzione k.
Lezione 5

Trasformazioni di Lorentz

Abbiamo già visto alla sezione 2.3.2 che le trasformazioni di Lorentz sono
un completamento idoneo delle trasformazioni di Fitzgerald; reintroduciamo
adesso le stesse equazioni dal nostro nuovo punto di vista.
Il problema che ci poniamo è il problema del cambio di coordinate, ovvero
di legare le coordinate spaziotemporali di uno stesso evento in due riferimenti
inerziali diversi. Le equazioni che otteniamo nello spaziotempo di Minkowski
sono dette, appunto, trasformazioni di Lorentz. Esse possono essere dedotte
come semplice conseguenza dell’effetto Doppler. Consideriamo il diagramma
riassuntivo di figura 5.1.
Facendo riferimento alla terza figura (Lorentz), notiamo che essa mette in
evidenza le coordinate radar di uno stesso evento E rispetto a due osservatori
A e B. Per l’analogo del teorema di Talete, visto alla sezione precedente,
abbiamo immediatamente che T10 = kT1 e T2 = kT20 , ovvero che
 0
 T1 = kT1

. (5.1)
 T 0 = 1 T2

2
k
Bene: abbiamo già finito. Abbiamo già trovato le trasformazioni di Lo-
rentz (speciali) per uno spaziotempo di Minkowski bidimensionale.1 Tutto
quello che possiamo fare, ora, è mettere queste equazioni in altre forme, che
mostrino altri aspetti di queste trasformazioni. Ad esempio, dalle equazioni
(5.1) si deducono immediatamente altre espressioni delle trasformazioni di
Lorentz in coordinate spaziotemporali.
1
Se fossimo in uno spaziotempo quadridimensionale, le trasformazioni di Lorentz spe-
ciali corrisponderebbero a quelle per cui gli osservatori hanno gli assi paralleli e sono in
moto relativo lungo un solo asse comune, dunque tale moto dipende dall’unico parametro
v. Vedremo meglio queste trasformazioni alla sezione 5.3.2.

53
54 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.1: Diagramma riassuntivo. A sinistra il diagramma della localiz-


zazione radar di un evento E; al centro il diagramma del doppio scambio
Doppler tra due osservatori inerziali A e B; a destra il diagramma delle tra-
sformazioni di Lorentz, vale a dire di come un evento E viene localizzato
da due osservatori inerziali diversi A e B.

Ricordando che, per definizione,


x = 21 c(T2 − T1 )

,
ct = 12 c(T2 + T1 )
ovvero sommando e sottraendo membro a membro,

ct + x = cT2
,
ct − x = cT1
considerando che dalle (5.1) si ha che
cT10 = k · cT1

,
cT20 = k1 · cT2
sostituendo troviamo che
ct0 − x0 = k(ct − x)

,
ct0 + x0 = k1 (ct + x)
e sommando e sottraendo membro a membro, troviamo la nuova forma delle
equazioni di Lorentz:
 0 1
ct = 2 (k + k −1 )ct − 21 (k − k −1 )x
. (5.2)
x0 = 21 (k − k −1 )ct + 21 (k + k −1 )x
Ricordando che 21 (k + k −1 ) = γ(v), e definendo
v
β(v) := ,
c
5.1. PROPRIETÀ DELLE TRASFORMAZIONI DI LORENTZ 55

abbiamo che
1
1 1 k− k2 − 1 v
(k − k −1 ) = (k + k −1 ) k
1 = γ(v) 2
= γ(v) = γ(v)β(v),
2 2 k+ k
k +1 c

k2 −1 v
dal momento che, per quanto visto con l’effetto Doppler, k2 +1
= c
= β(v).
Abbiamo quindi la nuova e più comune forma

ct0 = γ(ct − βx)



, (5.3)
x0 = γ(x − βct)

sottointendendo la dipendenza delle funzioni β e γ dalla velocità relativa v.


Infine osserviamo che

v2
 
2 2 2 2 2 1
γ − β γ = γ (1 − β ) = 2 1 − 2 = 1.
1 − vc2 c

In virtù di questo fatto, esiste un parametro θ(v), detto parametro di


rapidità2 tale che
γ(v) = cosh θ, (5.4)

β(v)γ(v) = sinh θ, (5.5)


ovvero
β(v) = tanh θ. (5.6)

La trasformazione di Lorentz, con il nuovo parametro rapidità θ, assume


la forma di una rotazione iperbolica:

ct0
       
γ −γβ ct cosh θ − sinh θ ct
= = , (5.7)
x0 −γβ γ x − sinh θ cosh θ x
 
cosh θ − sinh θ
ove la matrice è la matrice di rotazione iperbolica, il
− sinh θ cosh θ
cui determinante è giustamente γ 2 − β 2 γ 2 = 1.

5.1 Proprietà delle trasformazioni di Lorentz


Le trasformazioni di Lorentz godono di diverse proprietà importanti.
2
Il termine rapidità è qui inteso nel significato di modulo della velocità.
56 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

5.1.1 Linearità
La prima proprietà significativa è la linearità: le trasformazioni di Lorentz
sono lineari nelle coordinate. Denotando con L l’insieme delle trasformazioni
di Lorentz, possiamo dunque scrivere che

L ⊆ GL(4, R)

(GL(2, R) nel nostro caso particolare; del caso generale parleremo meglio in
seguito), dove con GL si intende il gruppo lineare.
Tale proprietà ha una conseguenza diretta sulla struttura geometrica dello
spaziotempo: è infatti lecito attribuire a tale spazio la struttura di uno spazio
affine quadridimensionale.3 Quindi l’assioma dell’esistenza degli osservatori
inerziali globali, combinato con il Principio di Relatività, implica la struttura
affine dello spaziotempo di Minkowski. Ecco dunque che è lecito rappresen-
tare gli osservatori inerziali come rette (del genere tempo in M ) e rappresen-
tare osservatori inerziali in quiete relativa come rette parallele - nello spazio
affine è infatti ben definita la nozione di parallelismo.

5.1.2 Struttura algebrica di gruppo


Le trasformazioni di Lorentz formano un gruppo. Tale fatto è una con-
seguenza diretta del principio di relatività: gli osservatori inerziali sono in-
distinguibili, e quindi le trasformazioni che li collegano devono essere dello
stesso tipo (più formalmente: devono formare un gruppo). Nel caso speciale
in cui ci siamo messi (spaziotempo bidimensionale, osservatori con assi paral-
leli in moto lungo un asse comune), si tratta di un gruppo ad un parametro
(la velocità relativa tra i due osservatori). Ne segue che la legge gruppale ha
il significato fisico di legge di composizione delle velocità relativisitiche. Alla
sezione 2.3.3 abbiamo già dimostrato che le trasformazioni di Lorentz for-
mano un gruppo, e abbiamo anche dedotto la legge gruppale (se v e w erano
v+w
le velocità relative, la velocità della composta era 1+ vw ). Vediamo di ricavare
c2
nuovamente questa legge di composizione a partire però dalle trasformazioni
di Lorentz nella forma Doppler.
Nello schema Doppler (con k come parametro del gruppo), infatti, lo
schema di composizione gruppale è ovvio:

kAC = kAB · kBC ,


3
Infatti la linearità delle equazioni, implica che le loro soluzioni siano uno spazio affine
(fatto basilare nell’algebra lineare). In sostanza, ci è possibile introdurre un’operazione
coerente e ben definita di somma tra vettori (infatti la somma di soluzioni è ancora una
soluzione) e farne conseguire un’operazione di prodotto di un vettore per uno scalare.
5.1. PROPRIETÀ DELLE TRASFORMAZIONI DI LORENTZ 57

dove il primo dei pedici indica l’osservatore che emette il raggio luminoso e
2
il secondo indica l’osservatore dello riceve. Ricordandoci ora che vc = kk2 −1
+1
,
tornando alle velocità, abbiamo che
c+vAB c+vBC
vAC k2 − 1 2
kAB 2
kBC −1 c−vAB c−vBC
−1
= AC
2
= 2 2
= c+vAB c+vBC =
c kAC + 1 kAB kBC + 1 c−vAB c−vBC
+1
c2 +cvAB +cvBC +vAB vBC −c2 +cvAB +cvBC −vAB vBC
(c−vAB )(c−vBC )
= c2 +cvAB +cvBC +vAB vBC +c2 −cvAB −cvBC +vAB vBC
=
(c−vAB )(c−vBC )
2c(vAB + vBC ) vAB + vBC 1 vAB + vBC
= = v v = ,
2(c2 + vAB vBC ) c+ AB
c
BC
c 1 + vABc2vBC

e abbiamo dunque ritrovato la stessa legge gruppale già ricavata in prece-


denza:
vAB + vBC
vAC = .
1 + vABc2vBC
Questa legge di composizione ha una proprietà molto interessante: com-
patibilmente con l’assioma di invarianza della velocità della luce, se una delle
due velocità è pari a ±c, allora necessariamente anche la nuova velocità deve
essere pari a ±c. Il che equivale a dire: se un oggetto si muove con velocità
pari a c, anche componendo tale velocità con il moto relativo di un osserva-
tore, quello che si ha è che tale oggetto mantiene la sua velocità c, indipen-
dentemente dalla velocità relativa dell’osservatore, cioè indipendentemente
dal giudizio dell’osservatore. Questo non è difficile da vedere: supponiamo
infatti che vBC = ±c, e che vAB sia una velocità generica (per fissare le idee,
possiamo pensare che C sia un fotone che si muove con velocità c rispetto a
un osservatore inerziale B, e che A sia un altro osservatore inerziale in moto
rispetto a B). Abbiamo che
vAC 1 vAB ± c 1 vAB ± c vAB ± c
= vAB c = c±vAB = = ±1,
c c 1 ± c2 c c
c ± vAB

da cui si deduce immediatamente che vAC = ±c (ovvero: l’oggetto C conti-


nua a muoversi con velocità c anche rispetto al nuovo osservatore). Analoga-
mente accadrebbe se vAB = ±c: la legge di trasformazione gruppale è infatti
completamente simmetrica nelle velocità, coerentemente con il Principio di
Relatività. Questo significa che le trasformazioni hanno dunque due punti
fissi: c e −c, il che mostra la compatibilità delle trasformazioni di Lorentz
con il secondo assioma.
Notiamo anche che componendo velocità minori di c si continua ad ot-
tenere una velocità minore di c - compatibilmente con l’asserto che c è una
58 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

velocità limite. Il che non è a prima vista banale: se due osservatori A e B


viaggiano, rispetto a un terzo osservatore C, alla velocità di 0, 8c, entrambi
in allontanamento da parti opposte (vAC = 0, 8c, vBC = −0, 8c, per fissare le
idee), la loro velocità relativa non sarà 1, 6c, ma sarà solo

0, 8 + 0, 8
vAC = 0,82 c2
≈ 0, 976c.
1+ c2

Naturalmente ciò significa che sommare velocità elevate non è cosı̀


semplice come sommare piccole velocità, ma questa è una conseguenza
diretta dell’aver definito le velocità in un modo che tiene conto del
metodo effettivamente usato per misurarle.

(Hermann Bondi, La relatività e il senso comune,


Zanichelli, p.93)

La velocità c è dunque una velocità limite, una barriera al di là della quale
nessun segnale o oggetto fisico (gli unici che possiamo considerare) può
andare.
Notiamo infine che, se vediamo le trasformazioni di Lorentz come rota-
zioni iperboliche (punto di vista di Minkowski) la legge gruppale è ovvia, e
coincide con la somma degli angoli di rotazione. Possiamo dunque riassumere
le varie forme delle trasformazioni di Lorentz nella seguente tabella:

schema Doppler schema di Lorentz schema di Minkowski


 0  0  0
T1 = kT1 ct = γ(ct − βx) ct = coshθ·ct−sinhθ·x
Trasf.
T20 = k1 T2 T20 = γ(x − βct) x0 = −sinhθ·ct+coshθ·x
Param. k v θ
vAB +vBC
Legge kAC = kAB · kBC vAC = 1c 1+ vAB vBC θAC = θAB + θBC
c2
Gruppo moltiplicativo
q additivo
2
k = c+vc−v v= c kk2 −1
+1
θ = log k
Relaz.
k = eθ v = c tanh θ θ = 12 log 1+θ
1−θ

Di fatto, però, le trasformazioni di Lorentz non sono le più generali4


trasformazioni che mantengono invariate c e −c; ci si può chiedere quindi
se non sia possibile caratterizzare meglio queste trasformazioni, o meglio,
identificare più compiutamente quale è il loro posto all’interno del gruppo
lineare.
4
La più generale trasformazione che svolge questa funzione è una proiettività, cioè una
funzione non lineare, razionale.
5.1. PROPRIETÀ DELLE TRASFORMAZIONI DI LORENTZ 59

5.1.3 Invarianza dell’intervallo spaziotemporale


Questo è possibile mediante la terza proprietà delle trasformazioni di Lo-
rentz, la proprietà più importante, da cui le altre discendono, la proprietà
che le caratterizza completamente: l’esistenza di una forma quadratica
invariante per tali trasformazioni. In particolare scriveremo che
L = SO(3, 1) ⊂ GL(4, R)
(o, nel caso particolare di un universo bidimensionale, L = SO(1, 1) ⊂
GL(2, R)), con questo intendendo che le trasformazioni di Lorentz sono esat-
tamente il gruppo ortogonale (da cui la O) speciale (da cui la S) che, in
quanto ortogonale, lascia invariata una forma quadratica di segnatura (3, 1),
il che significa che gli addendi della forma quadratica sono quattro, tre dei
quali hanno segno positivo e uno dei quali ha segno negativo5 . I gruppi
di trasformazioni che lasciano invariata una forma sono solitamente detti
classici.
L’esistenza di questa forma invariante è del tutto ovvia nella rappresen-
tazione Doppler6 ; infatti se

 T10 = kT1
1 ,
 T20 = T2
k
moltiplicando membro a membro si ha subito che
T10 T20 = T1 T2 ,
ovvero che la forma quadratica T1 T2 è invariante, indipendente quindi dal-
l’osservatore inerziale considerato.
Con riferimento alla figura 5.2, il prodotto T1 T2 delle coordinate radar
è sostanzialmente un “numero” associato alla coppia di eventi OE, cioè al
−−→
vettore 7 OE dello spaziotempo M , un numero invariante al cambiare dell’os-
servatore inerziale. Chiamiamo questa forma quadratica T1 T2 , prodotto delle
coordinate radar, intervallo spaziotemporale tra O ed E.
5
Ma sarebbe completamente equivalente dire che tre addendi hanno segno negativo e
uno positivo: se una forma è invariante, è invariante anche la sua opposta. Si tratta solo
di mettersi d’accordo: noi assumeremo che i tre termini spaziali abbiano segno positivo,
mentre il termine temporale avrà segno negativo.
6
Si noti come, ancora una volta, le cose siano davvero semplicissime quando ci serviamo
delle coordinate radar e della rappresentazione Doppler. La fatica è sostanzialmente tra-
sferire quanto trovato per le coordinate radar alle altre coordinate e alle altre rappresenta-
zioni. Questo dovrebbe far comprendere l’estrema utilità dell’introduzione delle coordinate
radar.
7
Possiamo parlare di vettori e possiamo disegnare vettori dal momento che lo
spaziotempo M ha una struttura affine.
60 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.2: La struttura affine dello spazio di Minkowski ci consente di


disegnare vettori nel piano M2 .

L’implicazione fondamentale di questa scoperta sulla geometria dello spa-


ziotempo è che M risulta essere uno spazio semieuclideo, cioè:

• non solo è munito di una struttura di causalità, a seguito dell’invarianza


della velocità della luce;

• non solo è uno spazio affine, a seguito della linearità delle trasforma-
zioni;

• ma soprattutto è uno spazio munito di una struttura metrica, nel senso


di un prodotto scalare sui vettori, detto semieuclideo poiché è rap-
presentato da una forma non definita positiva, l’intervallo spaziotem-
porale. La forma esplicita di questo prodotto scalare sarà chiara tra
poco.

Il fatto che l’intervallo spaziotemporale non sia definito positivo è evi-


dente: possono benissimo esserci situazioni in cui una coordinata radar è
negativa, e dunque il prodotto T1 T2 ha segno negativo. Pur non essendo
definito positivo, questo prodotto scalare è essenziale nella geometria dello
spaziotempo, poiché ha messo in luce l’ultima struttura che ci mancava da
scoprire, la struttura metrica, appunto.
5.2. CONFRONTO CON IL CASO EUCLIDEO 61

5.2 Confronto con il caso euclideo


Per confrontare la geometria dello spaziotempo M con quella del piano eucli-
deo è comodo passare a coordinate spaziotemporali. Invertendo le definizioni
1

 x = c(T2 − T1 )

2
 ct = 1 c(T2 + T1 )

2
ricaviamo che 
cT1 = ct − x
,
cT2 = ct + x
e dunque possiamo scrivere

c2 T1 T2 = (ct − x)(ct + x) = (ct0 − x0 )(ct0 + x0 ) = c2 T10 T20 ,

ove l’uguale in mezzo è dovuto all’invarianza della forma T1 T2 . In coordi-


nate spaziotemporali possiamo dire quindi che la forma invariante, ovvero
l’intervallo spaziotemporale, è8

S 2 (O, E) := x2 − c2 t2 = x02 − c2 t02 ,

e scegliamo di indicare la quantità invariante come norma al quadrato, pro-


prio come se discendesse da un prodotto scalare, anche se abbiamo ben pre-
sente che questa forma non è affatto definita positiva, e quindi anche la
norma al quadrato9 in generale non sarà una quantità positiva. La notazione
convenzionale è dunque
−−→
kOEk2 := x2 − c2 t2 . (5.8)

A questa norma è naturalmente legato il prodotto scalare associato alla


metrica dello spaziotempo M : se ~u e ~v sono vettori dello spaziotempo,

~u · ~v = ux vx + uy vy + uz vz − c2 ut vt . (5.9)

Abbiamo detto che dalla struttua metrica discendono le proprietà già


viste.
Ma, ad esempio, in che senso la struttura metrica congloba la struttura di
causalità? In questo senso: possiamo dividere i vettori di M in tre categorie:
8
Ovviamente potevamo benissimo scegliere la forma opposta. Questa scelta è coerente
con la decisione iniziale di attribuire segnatura positiva ai termini spaziali e segnatura
negativa ai termini temporali.
9
Che, d’ora innanzi, in generale chiameremo semplicemente norma.
62 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.3: A sinistra il caso del piano euclideo E2 : la metrica è S 2 =


x2 + y 2 , e i luoghi dei punti t.c. S 2 = cost sono circonferenze. A destra il caso
iperbolico: nello spaziotempo bidimensionale di Minkowski M2 la metrica è
S 2 = x2 − c2 t2 e i luoghi in cui S 2 è costante sono le iperboli di calibrazioni -
caso particolare è l’iperbole degenere del cono luce, in cui S 2 = 0, formata da
tutti i vettori del genere luce.

−−→
• i vettori aventi kOEk2 < 0, quelli in cui quindi prevale la parte tempo-
rale, che vengono detti vettori del genere tempo.
−−→
• i vettori aventi kOEk2 > 0, quelli in cui quindi prevale la parte spaziale,
che vengono detti vettori del genere spazio.
−−→
• i vettori aventi kOEk2 = 0, detti vettori del genere luce.

Il cono luce è esattamente il cono formato dai vettori del genere tempo.
Questo cono è immaginario nel piano euclideo, poiché la forma quadratica
del piano euclideo è definita positiva (e quindi non c’è modo di avere una tri-
partizione dei vettori in base al segno del quadrato della norma). L’intervallo
spaziotemporale è chiaramente l’analogo della distanza nel piano euclideo: le
iperboli di calibrazione (ovvero il luogo dei punti in cui S 2 = cost) sono
l’analogo minkowskiano delle circonferenze (v. fig. 5.3).
A meno di traslazioni, il gruppo delle trasformazioni che lasciano invariata
la forma S 2 del piano euclideo E2 è il gruppo delle rotazioni SO(2) (con questa
scrittura intendiamo che i due termini hanno uguale segnatura, ad esempio
nel caso delle rotazioni che conservano S 2 = x2 + y 2 = 1), il cui generico
rappresentante è la matrice antisimmetrica
 
cos θ sin θ
,
− sin θ cos θ
5.2. CONFRONTO CON IL CASO EUCLIDEO 63

con θ ∈ [0, 2π] angolo di rotazione. Analogamente, il gruppo delle trasforma-


zioni che lasciano invariata la forma S 2 di M2 (lo spaziotempo di Minkowski a
due dimensioni) è il gruppo delle rotazioni iperboliche SO(1, 1), il cui generico
rappresentante è la matrice simmetrica
 
cosh θ − sinh θ
,
− sinh θ cosh θ

con θ ∈ R parametro di rapidità.10


Raccogliendo tutte le informazioni sulla struttura geometrica dello spa-
ziotempo M di Minkowski, arriviamo alle seguenti definizioni.

Definizione 5.1 (Minkowski). Lo spaziotempo di Minkowski è uno


spazio affine quadridimensionale munito di una forma quadratica di tipo
lorentziano (ovvero di segnatura 3,1: + + + −).

Definizione 5.2 (Poincaré). Il gruppo di Poincaré11 è il gruppo delle


isometrie dello spaziotempo di Minkowski. Il gruppo di Lorentz è il sotto-
gruppo del gruppo di Poincaré che tiene fissa un’origine prestabilita (ovvero:
evita le traslazioni).

Definizione 5.3 (Osservatori inerziali). Un osservatore inerziale è un


sistema di coordinate “cartesiane” (con i versori ortonormati nel senso della
10
Per questo B. Finzi, in [9], riferendosi allo spaziotempo della Relatività Ristretta,
scrive che

Spazio e tempo non sono separatamente assoluti, ma lo è l’insieme


dei due, lo spazio-tempo, precisamente come nel piano xy non sono
separatamente assolute né la differenza d’ascissa ∆x né la differenza di
ordinata ∆y di due punti [che cambiano al ruotare del sistema], bensı̀
la distanza ∆s tra i due punti, perché essa sola non cambia mutando
gli assi x, y di riferimento.
(Bruno Finzi, Teoria dei campi,
Cesare Tamburini ed., p.245)
Usando invece le parole di Hermann Minkowski,

Lo spazio in sé e il tempo in sé sono destinati a divenire mere ombre,


e solo una sorta di unione dei due preserverà una realtà indipendente.
(Hermann Minkowski, 1908)
11
Jules Henri Poincaré (1854-1912), massimo matematico francese a cavallo tra il XIX
e il XX secolo.
64 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

~ J,
metrica) su M , definito da una tetrade di vettori base (I, ~ K,
~ L),
~ i primi
tre spaziali, l’ultimo temporale, tali che
~ 2 = kJk
kIk ~ 2 = kKk
~ 2 = +1 e kLk
~ 2 = −1

I~ · J~ = I~ · K
~ = I~ · L
~ = J~ · K
~ = J~ · L
~ =K
~ ·L
~ = 0.

5.3 Cenno al gruppo di Poincaré


Rovesciamo il punto di vista fino ad ora adottato, e partiamo dalla struttura
metrica di M , analizzando il gruppo delle sue isometrie, per riottenere in
questo modo le trasformazioni di Lorentz come caso particolare. In altre
parole, vogliamo mostrare che la proprietà di lasciare invariata la forma S 2 =
x2 + y 2 + z − c2 t2 caratterizza completamente le trasformazioni di Lorentz
(non vi sono altre condizioni da imporre), ovvero che

L = SO(3, 1),

e non L ( SO(3, 1).

5.3.1 Linearità delle isometrie


Il primo punto è un fatto di algebra. Prendiamo una generica trasformazione
di coordinate su uno spazio affine
0 0
xj = F j (xj ) per i = 1, . . . , n, (5.10)

e poniamo un’ipotesi di regolarità della trasformazione (nella fattispecie, F ∈


C 2 ). Mostriamo che la richiesta di invarianza della forma quadratica12

ds2 = gjk dxj dxk (5.11)


 
1 0 0 0
0 1 0 0 
con g = diag(1, 1, 1, −1) =  0 0 1 0 , implica che la trasformazione

0 0 0 −1
(5.10) sia lineare.13 Ciò equivale ad affermare che tutti i gruppi di isometria
12
Ci serviremo in questa sezione della notazione tensoriale, sottointendendo quindi i
simboli di sommatoria per indici in posizione covariante e controvariante. Introdurremo
meglio più avanti il concetto di tensore.
13
Si noti che chiedere l’invarianza della forma S 2 (o ds2 nella notazione della geometria
differenziale) equivale a chiedere l’invarianza della metrica, e dunque che la trasformazione
sia un’isometria.
5.3. CENNO AL GRUPPO DI POINCARÉ 65

di spazi semieuclidei (con la matrice g della metrica simmetrica e invertibile,


ma in generale diversa dall’identità) sono gruppi lineari. Dimostriamo questa
affermazione.14
Per derivazione di funzione composta abbiamo che
0 0
ds02 = gj 0 k0 dxj dxk
0 0
∂F j ∂F k

= gj 0 k0 j k
dxj dxk
∂x ∂x
= gjk dx dxk = ds2
j

dove l’ultima eguaglianza vale poiché stiamo imponendo che la trasforma-


zione sia un’isometria, ovvero che conservi la metrica, e dunque ds02 = ds2 .
Ne deduciamo la legge di trasformazione della metrica:
0 0
∂F j ∂F k
gjk = gj 0 k0 .
∂xj ∂xk
Essendo la matrice g una matrice costante, per derivazione di ambo i
membri rispetto al generico xl (ovvero applicando ∂x∂ l ) otteniamo
0 0 0 0
∂ 2 F j ∂F k ∂F j ∂ 2 F k
0 = gj 0 k0 j l + gj 0 k0 , (5.12)
∂x ∂x ∂xk ∂xj ∂xk ∂xl
che è un vincolo sulle derivate seconde della trasformazione (stiamo suppo-
nendo che la trasformazione sia C 2 ).
Vediamo perché questo vincolo impone che le derivate seconde siano tutte
identicamente nulle (ovvero che la trasformazione sia lineare). Gli indici j, k, l
dell’equazione (5.12) sono tutti indici muti (designano elementi generici):
possiamo
 quindi permutarli ciclicamente. Se applichiamo la permutazione
 j→k
k → l otteniamo
l→j

0 0 0 0
∂ 2 F j ∂F k ∂F j ∂ 2 F k
0=g j 0 k0 + gj k
0 0 . (5.13)
∂xk ∂xj ∂xl ∂xk ∂xl ∂xj

 j→k
Ora applicando nuovamente k → l otteniamo
l→j

0 0 0 0
∂ 2 F j ∂F k ∂F j ∂ 2 F k
0 = gj 0 k0 l k + gj 0 k0 . (5.14)
∂x ∂x ∂xj ∂xl ∂xj ∂xk
14
Si noterà in questa dimostrazione una somiglianza non accidentale con la dimostrazione
usuale per il Lemma di Ricci della geometria differenziale.
66 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Le equazioni (5.12), (5.13) e (5.14), combinate opportunamente ci for-


niscono la soluzione. Notando che gli indici j 0 e k 0 sono anch’essi muti,
poiché sottointendono il simbolo di sommatoria, possiamo scambiare questi
due indici nella prima sommatoria dell’equazione (5.14), e otteniamo cosı̀ il
seguente sistema:
 0 0 0 0
∂ 2 F j ∂F k ∂F j ∂ 2 F k
 0 = gj 0 k0 ∂xj ∂x0l ∂xk 0 + gj 0 k0 ∂xj 0 ∂xk ∂x0l

∂ 2 F j ∂F k ∂F j ∂ 2 F k (5.15)
0 = gj 0 k0 ∂x k ∂xj ∂xl + gj 0 k 0 ∂xk ∂xl ∂xj
 2 k 0 j 0 j 0 2 k 0
 ∂ F ∂F ∂F ∂ F
0 = gk0 j 0 ∂x l ∂xk ∂xj + gj 0 k 0 ∂xl ∂xj ∂xk

Per la simmetria della matrice gj 0 k0 e per l’eguaglianza delle derivate


seconde miste (F infatti è C 2 ), sommando membro a membro la prima
equazione con la seconda, e quindi sottraendo la terza, otteniamo che
0 0
∂F j ∂ 2 F k
2gj 0 k0 k = 0.
∂x ∂xj ∂xl
j0
Essendo la matrice jacobiana Jj 0 k = ∂F∂xk
invertibile, ed essendo analoga-
mente la metrica g invertibile, necessariamente
0
∂2F k
= 0, (5.16)
∂xj ∂xl
e per la generalità degli indici abbiamo che tutte le trasformazioni hanno
derivate seconde nulle, dunque sono lineari.

5.3.2 Le trasformazioni speciali


Per analizzare la struttura del gruppo SO(3, 1), cioè il gruppo lineare delle
trasformazioni che lasciano invariata S 2 = x2 + y 2 + z 2 − c2 t2 , partiamo
dall’osservazione che questo gruppo contiene un certo sottogruppo, detto
gruppo dei “boosts”.15 Consideriamo le trasformazioni della forma
 0

 ct = Act + Bx
 0
x = Cct + Dx
0 (5.17)

 y =y
 0
z =z
a patto che la metrica sia conservata, ovvero che
x02 + y 02 + z 02 − c2 t02 = x2 + y 2 + z 2 − c2 t2 ,
15
Potremmo tradurre “boost” come “calcione”, “spinta”; il termine designa il passaggio
di un’osservatore A da uno stato di moto relativo rispetto a B a uno stato di quiete relativa,
mediante un “calcione” che lo mette in movimento alla stessa velocità di B.
5.3. CENNO AL GRUPPO DI POINCARÉ 67

e dunque che x02 − c2 t02 = x2 − c2 t2 , ossia, andando a inserire le espressioni


date da (5.17):
C 2 c2 t2 + D2 x2 + 2CDctx − A2 c2 t2 − B 2 x2 − 2ABctx = x2 − c2 t2 ,
ed eguagliando i coefficienti dei termini in x2 , ctx e c2 t2 abbiamo che deve
essere verificato il sistema
 2
 D − B2 = 1
CD − AB = 0 (5.18)
 2 2
C − A = −1
Le differenze di quadrati uguali identicamente a 1 ci suggeriscono di ri-
solvere queste equazioni mediante le sostituzioni A = cosh θ, B = − sinh θ,
C = − sinh ϕ, D = cosh ϕ. La prima e la terza equazione del sistema (5.18)
sono automaticamente verificate. La seconda equazione ci dice invece che
sinh ϕ cosh θ − cosh ϕ sinh θ = sinh(ϕ − θ) = 0,
da cui si ricava immediatamente che θ = ϕ. Se ne conclude che le trasforma-
zioni  0

 ct = cosh θ · ct − sinh θ · x
 0
x = − sinh θ · ct + cosh θ · x
(5.19)

 y0 = y
 0
z =z
formano un gruppo ad un parametro di rotazioni iperboliche, e che tale
gruppo è sicuramente un sottogruppo di SO(3, 1), poiché mantiene invariata
(per costruzione!) la metrica S 2 . Notiamo che il gruppo dei boosts è il
gruppo di trasformazioni quando supponiamo che due osservatori inerziali
abbiano gli assi paralleli e che il movimento avvenga solo lungo l’asse delle x,
in comune tra i due osservatori. In sostanza, è quello che abbiamo chiamato
il gruppo delle trasformazioni di Lorentz speciali.
Per legare ora θ al moto relativo, si osserva che l’origine x0 = 0 del secondo
riferimento deve viaggiare con legge x = vt rispetto al primo riferimento.
Sostituendo nella seconda equazione di (5.19) questa informazione, otteniamo
che
0 = − sinh θ · ct + cosh θ · vt,
da cui si ricava nuovamente la vecchia relazione sulla tangente iperbolica:
v
tanh θ = .
c
Dato inoltre che
2 cosh2 θ cosh2 θ 1
cosh θ = = 2 2 = , (5.20)
1 cosh θ − sinh θ 1 − tanh2 θ
68 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

ricaviamo che
r s
1 1
cosh θ = = 2 = γ(v)
1 − tanh2 θ 1 − vc2

e che
v
sinh θ = tanh θ · cosh θ = γ(v) = β(v)γ(v).
c
Si ottengono in questo modo le trasformazioni di Lorentz speciali, che si
interpretano, lo ripetiamo, come cambiamenti di coordinate tra osservatori
inerziali con assi paralleli in moto relativo lungo il comune asse x.

5.3.3 Il gruppo di Lorentz


Per ricostruire la più generale trasformazione tra osservatori inerziali R e R0 ,
con assi non paralleli e in moto relativo con velocità ~v (supponiamo che ~v
sia la velocità di R0 nel giudizio di R) di direzione arbitraria si procede nel
modo seguente.

Figura 5.4: Come ottenere la più generale trasformazione di Lorentz.

(i) Eseguiamo una rotazione spaziale di R, per riorientare il suo asse x


nella direzione del moto relativo (la direzione di ~v ). Non si tratta della
più generale rotazione nello spazio: si tratta di un gruppo di rotazioni
a due parametri.

(ii) Eseguiamo un boost, per conferire all’osservatore R la velocità ~v , e


dunque portarlo in uno stato di quiete relativa rispetto a R0 . Si tratta
di un gruppo ad un solo parametro, la velocità del boost.
5.3. CENNO AL GRUPPO DI POINCARÉ 69

(iii) Riorientiamo gli assi di R nello spazio, per renderli paralleli a quelli
di R. Si tratta di un gruppo a tre parametri (i cosiddetti angoli di
Eulero).

Questa analisi ci permette di concludere che il gruppo di Lorentz è un


gruppo a sei parametri: i parametri relativi a (i) e (ii) definiscono la velocità ~v
del moto relativo - infatti, sostanzialmente (i) ne dà la direzione (2 parametri)
e (ii) ne dà il modulo (1 parametro) - mentre i parametri relativi a (iii)
servono a riorientare parallelamente i sistemi di riferimento. In generale,
possiamo quindi concludere che la più generale trasformazione di Lorentz
ortocrona (ossia che preserva l’orientazione degli assi dei tempi: se ∆t >
0, anche ∆t0 > 0, e viceversa) e propria (cioè che preserva l’orientazione
spaziale) si decompone come due rotazioni inframmezzate da un boost. Più
precisamente:
L = R0 ◦ Lv ◦ R,
dove R è una rotazione spaziale a due parametri, Lv è una trasformazione di
Lorentz speciale (un boost) di velocità v e R0 è una rotazione spaziale a tre
parametri.
Questa legge di composizione è piuttosto complicata e porta a fenomeni
interessanti; la legge delle velocità longitudinali ne è solo un caso particolare.
Possiamo ottenere trasformazioni ancora più generali, non ortocrone o
non proprie, mediante le operazioni di parità e di time-reversal16 , come
illustrato nella figura 5.5.

5.3.4 Il gruppo di Poincaré


Al gruppo di Poincaré si arriva poi con un’ulteriore generalizzazione. Il
gruppo di Poincaré (gruppo delle isometrie sullo spazio di Minkowski) è
il prodotto semidiretto17 del gruppo di Lorentz e del gruppo delle traslazioni
16
Operazioni che sono in sostanza moltiplicazioni rispettivamente per le matrici
diag(+1, −1, −1, −1) e diag(−1, +1, +1, +1), se pensiamo al tempo come primo elemento
della quaterna (ct, x, y, z). Cioè: la parità conserva il verso del procedere temporale,
mentre inverte tutti quelli spaziali, il time-reversal mantiene l’orientamento spaziale, ma
cambia l’orientazione temporale.
17
Ricordiamo che preso un gruppo G, un suo sottogruppo normale N E G e un altro
sottogruppo H, diciamo che G è prodotto semidiretto di N e H se

G = N H = {nh : n ∈ N, h ∈ H}

e N ∩ H = {id}, intendendo con id l’elemento neutro dell’operazione di G. In sostanza,


un gruppo G è prodotto semidiretto di N e H se ogni elemento di G può essere scritto
univocamente come prodotto di due elementi di N e H. Dicendo che il gruppo di Poin-
caré è il prodotto semidiretto del gruppo di Lorentz e del gruppo delle traslazioni, in-
70 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.5: Diagramma delle trasformazioni di Lorentz all’interno del


Gruppo Lineare GL(4, R). La freccia verso l’alto ↑ indica l’ortocronia delle
trasformazioni, il + indica la proprietà delle stesse. Viceversa, la freccia verso
il basso ↓ e il − indicano rispettivamente l’inversione dello scorrere del tempo
e l’inversione delle coordinate spaziali. L’identità è contenuta nel sottogruppo
di Lorentz ortocrono e proprio (L↑+ ). Tramite parità otteniamo il gruppo di
Lorentz ortocrono, ma con coordinate spaziali invertite (L↑− ); tramite opera-
zione di time-reversal otteniamo il gruppo di Lorentz proprio, ma con opposta
orientazione temporale (L↓+ ). Combinando parità e time reversal, otteniamo
il gruppo di Lorentz avente tutti gli orientamenti spaziotemporali cambiati
(L↓− ).
5.4. AZIONE DEL GRUPPO DI LORENTZ SU UNA TETRADE 71

spaziotemporali. Sostanzialmente, stiamo aggiungendo una parte affine alle


trasformazioni di Lorentz (omogenee). Pertanto, il gruppo di Poincaré è un
gruppo a 6+4=10 parametri (6 provengono dalle trasformazioni di Lorentz,
4 sono i parametri di traslazione spaziotemporale).
Ricapitolando:
Lv ⊂ L ⊂ P ⊂ TGL(4, R),
ovvero il gruppo di Lorentz speciale (dei boosts) è un sottogruppo del gruppo
di Lorentz, che è un sottogruppo del gruppo di Poincaré, che è un sottogruppo
del gruppo delle trasformazioni lineari non omogenee (che abbiamo indicato
con TGL(4, R)).18

5.4 Azione del gruppo di Lorentz su una te-


trade
Lo spaziotempo di Minkowski è uno spaziotempo affine munito della forma
quadratica
S 2 (OE) = x2 + y 2 + z 2 − c2 t2 .
A tale forma quadratica è associato in modo naturale il prodotto scalare

~u · ~v = ux vx + uy vy + uz vz − c2 ut vt

tra due vettori ~u, ~v di M .


~ J,
Gli osservatori inerziali sono rappresentati da tetradi (I, ~ K,
~ L)
~ in questo
spazio. Fissato un evento E e un origine O, le coordinate spaziotemporali
−−→
sono le componenti (x, y, z, t) del vettore posizione OE su questa tetrade:
−−→
OE = xI~ + y J~ + z K
~ + ctL,
~

dove, come visto, kIk ~ 2 = kJk


~ 2 = kKk
~ 2 = 1, kLk
~ 2 = −1, I~ · J~ = I~ · K
~ =
I~ · L
~ = J~ · K
~ = J~ · L
~ =K ~ ·L
~ = 0. Conoscendo l’azione del gruppo di Lorentz
sulle coordinate possiamo risalire alla sua azione sulle tetradi dei vettori di
base. Tipicamente, si parla di passaggio da un punto di vista “passivo” a un
punto di vista “attivo”. Ponendo
−−→
OE = xI~ + y J~ + z K
~ + ctL ~ 0 + ct0 L
~ = x0 I~0 + y 0 J~ 0 + z 0 K ~0 (5.21)
tendiamo quindi dire che ogni elemento del gruppo di Poincaré è la composizione di una
trasformazione di Lorentz e di una traslazione.
18
Si noti che la scrittura P ⊂ GL(4, R) sarebbe errata, poiché nel gruppo lineare
GL(4, R) non sono previste traslazioni, solo trasformazioni lineari omogenee. Il gruppo
di Poincaré, invece, ha una parte affine.
72 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

e applicando una trasformazione di Lorentz (per semplicità utilizziamo una


trasformazione speciale, al massimo dovremo comporre con rotazioni)
 0

 ct = γ(ct − βx)
 0
x = γ(x − βct)
,

 y0 = y
 0
z =z
per sostituzione nell’equazione (5.21) otteniamo

xI~ + y J~ + z K
~ + ctL
~ = γ(x − βct)I~0 + y J~ 0 + z K
~ 0 + γ(ct − βx)L
~0

ed eguagliando i termini in x, y, z e ct troviamo che




 ~ = γ(L
L ~ 0 − β I~0 )
 ~
I = γ(I~0 − β L ~0)


 J~ = J~ 0
~ =K ~0

 K

o anche, invertendo 

 L~ 0 = γ(L ~ + β I)
~
 ~0
I = γ(I~ + β L) ~

. (5.22)

 J~ 0 = J~
~0 = K ~

 K

Da queste trasformazioni si vede che (nel caso di β > 0, ovvero nel caso
~ 0 si ottiene:
in cui R0 si muova nel senso positivo degli assi di R) il vettore L
(i) anzitutto sommando a L ~ il vettore β I~ e dunque stringendolo verso il
19
cono luce (figura 5.6, sinistra);
(ii) poi dilatando il vettore precedente del fattore γ > 1 per riportarlo a
avere norma -1 (cosicché, dunque, l’estremo di L ~ 0 continui ad apparte-
nere all’iperbole di calibrazione S 2 = 1) (figura 5.6, destra);
~ 0 ha ancora norma pari a −1; infatti
Cosı̀ costruito, L
~ 0 k2 = L
kL ~0 · L
~ 0 = γ(L
~ + β I)
~ · γ(L ~ + β I)
~ = γ2L ~ ·L
~ + 2γ 2 β L
~ · I~ + γ 2 β 2 I~ · I~ =
1
= γ 2 · (−1) + 2γ 2 β · 0 + γ 2 β 2 · 1 = γ 2 (β 2 − 1) = (β 2 − 1) = −1.
1 − β2

Per avere I~ si ripete la medesima costruzione, come illustrato nella figura


5.7.
19
Senza mai raggiungere il cono luce, però; questo infatti avverrebbe solo per β = 1.
5.4. AZIONE DEL GRUPPO DI LORENTZ SU UNA TETRADE 73

~ 0 (primo e secondo passo).


Figura 5.6: Costruzione di L

Figura 5.7: Costruzione di I~0 (primo e secondo passo).


74 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Da questa costruzione si vede che una rotazione iperbolica corrisponde a


stringere i vettori di una base ortonormata attorno alla direzione del cono
luce, in maniera simmetrica, nel piano bidimensionale (figura 5.8)

Figura 5.8: Confronto tra una rotazione nel piano euclideo E2 e una rotazione
iperbolica nel piano M2 .

5.4.1 Autovalori nelle trasformazioni di Lorentz


Possiamo anche cercare gli autovalori e gli autovettori delle di Lorentz spe-
ciali. In forma matriciale, abbiamo che
 0   
ct γ −βγ 0 0 ct
 x0  −βγ γ 0 0  x 
 
 0 =  . (5.23)
y   0 0 1 0  y 
z0 0 0 0 1 zy
 
γ −βγ 0 0
−βγ γ 0 0
Detta A =   0
 la matrice di sistema, dobbiamo cercare
0 1 0
0 0 0 1
 
ct
x
quei vettori ~v =  y  t.c. A~v = λ~v , ovvero che (A − λI4 )~v = 0 (con I4

z
matrice identità 4 × 4), e dunque i ~v appartenenti al nucleo di A − λI4 .
5.4. AZIONE DEL GRUPPO DI LORENTZ SU UNA TETRADE 75

Innanzitutto A − λI4 ha nucleo non banale se e solo se il suo determinante è


nullo, quindi imponiamo questa nullità.

 
γ − λ −βγ 0 0
 −βγ γ − λ 0 0  = (1−λ)2 (γ − λ)2 − β 2 γ 2 =
 
det(A−λI4 ) = det 
 0 0 1−λ 0 
0 0 0 1−λ
= (1 − λ)2 (λ2 − 2γλ + γ 2 (1 − β 2 ),

e questo si annulla per gli autovalori λ1 = λ2 = 1 (doppio), λ3 = γ(1 − β) =


1
k
, λ4 = γ(1 + β) = k.20 Gli autovettori interessanti (quelli associati agli
autovalori k1 e k) sono poi il nucleo delle matrici A − k1 I4 = A − γ(1 − β)I4
e A − kI4 = A − γ(1 + β)I4 . Per quanto riguarda la prima matrice, la sua

20
Infatti il determinante del secondo fattore è 4γ 2 − 4γ 2 + 4β 2 γ 2 = 4β 2 γ 2 > 0, e le
soluzioni sono appunto λ3,4 = 2γ±2βγ
2 = γ(1 ± β). Inoltre

r
1 + vc c+v c2 + v 2 + 2vc
γ(1 + β) = q =√ = =
2
1 − vc2 c2 − v 2 c2 − v 2
r s r r
c2 − v 2 + 2v 2 + 2cv 2v(v + c) 2v c+v
= = 1 + = 1 + = = k,
c2 − v 2 (c + v)(c − v) c−v c−v

e analogamente

r
1 − vc c−v c2 + v 2 − 2vc
γ(1 − β) = q =√ = =
2
1 − vc2 c2 − v 2 c2 − v 2
r s r r
c2 − v 2 + 2v 2 − 2cv 2v(v − c) 2v c−v 1
= = 1 − = 1 − = = .
c2 − v 2 (c + v)(c − v) c+v c+v k
76 LEZIONE 5. TRASFORMAZIONI DI LORENTZ
 
ct
x
azione sul generico elemento ~v = 
 y  è

z
  
  βγ −βγ 0 0 ct
1  −βγ βγ 0 0  x
 
A − I4 ~v = (A − γ(1 − β)I4 ) ~v =  =
k  0 0 1−λ 0 y
0 0 0 1−λ z
   
βγct − βγx m
−βγct + βγx −m
= = 
 y   y 
z z

al variare di m.
Il nucleo quindi è formato da tutti quei vettori per cui y = 0, z = 0 e
x = t = m generico.
 Chiaramente ha dimensione 1, e il suo generico elemento
m
−m
è della forma 
 0 .

0
Notiamo che, per proiezione sul piano x − ct, l’autovettore coincide con lo
spazio vettoriale della bisettrice II-IV quadrante, ed è dunque diretto come
il cono luce.21 Del tutto analogamente, per l’altro autovettore
  non banale:
ct
x
l’azione della matrice A − kI4 sul generico vettore ~v =  y  è

z
  
−βγ −βγ 0 0 ct
−βγ −βγ 0 0  x
 
(A − kI4 ) ~v = (A − γ(1 + β)I4 ) ~v =  =
 0 0 1−λ 0 y
0 0 0 1−λ z
   
−βγct − βγx m
−βγct − βγx m
= = 
 y  y
z z
21
Infatti notiamo che le rette con pendenza maggiore di 1, nel piano (x, ct) sono del ge-
nere tempo (corrispondono a velocità minori di c: la variabile temporale è sulle “ascisse”!),
e viceversa le rette con pendenza minore di 1 sono del genere spazio.
5.4. AZIONE DEL GRUPPO DI LORENTZ SU UNA TETRADE 77

al variare di m.
Il nucleo quindi è formato da tutti quei vettori per cui y = 0, z = 0 e
x = ct = m generico. Ancora
  una volta ha dimensione 1, e il suo generico
m
m 
elemento è della forma  0 .

0
Per proiezione sul piano x − ct, l’autovettore coincide con lo spazio vet-
toriale della bisettrice I-III quadrante, ed è dunque diretto come il cono
luce.

5.4.2 Deduzione delle trasformazioni dalla geometria


iperbolica
Possiamo anche dedurre le trasformazioni di Lorentz facendo uso della trigo-
nometria iperbolica (ossia lo studio dei triangoli rettangoli nel piano iperbo-
lico di Minkowski).
Con riferimento alla figura 5.9, notiamo che gli assi sono ortogonali per
ipotesi22 e che quindi possiamo individuare nel grafico altri angoli retti (quelli
formati dalle parallele degli assi). Con riferimento al triangolo OP R, vista
la posizione dell’angolo retto, OP è l’ipotenusa, e possiamo quindi scrivere
che
OR = OP cosh θ = (OV + V P ) cosh θ = (OV + V E tanh θ) cosh θ,
dove l’ultima uguaglianza vale in riferimento al triangolo V P E, in cui P E è
l’ipotenusa e V P e V E sono i cateti. Abbiamo dunque che ct = cosh θ(ct0 +
x0 tanh θ). Analogamente, con riferimento ai triangoli OQT e EW Q, si ha
che
OT = OQ cosh θ = (OW + W Q) cosh θ = (OW + W E tanh θ) cosh θ,
da cui ricaviamo che x = cosh θ(x0 + ct0 tanh θ). Se ora usiamo la relazione
v
tanh θ = = β
c
22
Si badi che il concetto di ortogonalità non è mutuato dalla geometria euclidea del
piano, ma dal prodotto scalare trovato precedentemente. Non ci si lasci quindi confondere
dal disegno: angoli che euclideamente non sono rettangoli, lo sono però nella geometria
iperbolica. La geometria iperbolica, essendo la geometria nello spaziotempo di Minkowski,
si serve dunque del prodotto scalare scritto nella (5.9):
~u · ~v = ux vx + uy vy + uz vz − c2 ut vt ,
e non del prodotto scalare canonico. Due rette saranno ortogonali (e diremo che formano
un angolo retto) se due loro vettori non nulli avranno questo prodotto scalare nullo.
78 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.9: Diagramma della localizzazione di un evento E da parte di


due osservatori A e B nel piano iperbolico. A e B posseggono le relative
piattaforme spaziali SA e SB , perpendicolari all’asse temporale nel senso del
prodotto scalare sopra definito (e non a caso le abbiamo disegnate come se si
corrispondessero in una rotazione iperbolica intorno all’origine: la rotazione
iperbolica mantiene la perpendicolarità). Nel disegno sono evidenziati tutti i
segmenti ortogonali.
5.5. PIÙ VELOCI DELLA LUCE? 79

e la relazione trovata nell’equazione (5.20), ovvero


r s
1 1
cosh θ = 2 = 2 = γ,
1 − tanh θ 1 − vc2

riotteniamo le trasformazioni di Lorentz nella forma con cui le abbiamo già


trovate:  0

 ct = γ(ct − βx)
 0
x = γ(x − βct)

 y0 = y
 0
z =z

5.5 Più veloci della luce?


Appuntamento fisso di ogni scritto sulla Relatività, eccoci a trattare il caso
di oggetti che viaggiano più veloci della luce. La Relatività Ristretta ci dice
che la velocità della luce c è una velocità limite per qualsiasi particella o
segnale fisico. Ma che cosa accadrebbe se un segnale viaggiasse per un certo
periodo fuori dal cono luce? L’esempio mostrato in figura ?? non lascia adito
a dubbi: la struttura causale per fenomeni di questo tipo non avrebbe più
senso.
Se in E1 viene inviato un segnale che viaggia più veloce della luce sino
a raggiungere E2 , la consequenzialità temporale tra i due eventi non è più
invariante. Ci saranno osservatori (come A) per cui il segnale è arrivato
correttamente dopo che è stato inviato; ci saranno però osservatori anche
come B che vedranno il segnale arrivare istantaneamente, e osservatori come
C che vedranno il segnale arrivare addirittura prima (!) di partire.
È chiaro dunque che segnali più veloce della luce romperebbero la strut-
tura causale dello spaziotempo, cosa che allo stato attuale è inconcepibile.
80 LEZIONE 5. TRASFORMAZIONI DI LORENTZ

Figura 5.10: Se un segnale si propaga più veloce della luce da un evento


E1 a un evento E2 , crolla il concetto di causalità: se infatti per l’osservatore
A il segnale è partito da E1 ed è arrivato a E2 dopo un certo tempo, per
l’osservatore B il segnale è arrivato nello stesso istante in cui è partito, e per
l’osservatore C, invece, il segnale addirittura è arrivato prima di partire.
Lezione 6

I paradossi relativistici

Dedichiamo una lezione ai paradossi relativistici, o meglio a scoprire quale è


la struttura paradossale che sta alla loro base e quale è invece la spiegazione
della Relatività Ristretta.

6.1 La contrazione delle lunghezze longitudi-


nali
Incominciamo con la contrazione delle lunghezze longitudinali, scoperta già
da Fitzgerald nel 1895 per spiegare l’esperimento nullo di Michelson e Morley.
Nella visione di fine secolo, la contrazione era attribuita a un fenomeno fisico
di natura elettromagnetica dovuto al moto relativo del corpo rigido rispetto
all’etere. Nell’interpretazione di Einstein, invece, dove l’etere è scomparso,
questo effetto è una conseguenza immediata della definizione del processo
di misura e del postulato di invarianza della velocità della luce. Insomma,
dobbiamo abituarci a vederlo come qualcosa di connaturato nella definizione
di lunghezza.
Consideriamo un corpo rettilineo. Chiameremo lunghezza propria del
regolo la distanza fra gli estremi misurata da un osservatore per cui il regolo è
in quiete relativa. Chiameremo lunghezza relativa la lunghezza del regolo
rispetto ad ogni osservatore che vede il regolo in moto.
Bisogna ricordare che la misura di una lunghezza presuppone una misura
di tempo: la lunghezza di un corpo è infatti per definizione la distanza tra
le posizioni assunte dagli estremi allo stesso istante nel giudizio dell’osser-
vatore che misura il regolo.1 In altre parole, la lunghezza di un regolo è la
1
Ci permettiamo di sottolineare come quel “allo stesso istante” sia il punto cruciale:
se teniamo presente bene questa idea, non troveremo alcun carattere paradossale nella
contrazione delle lunghezze longitudinali.

81
82 LEZIONE 6. I PARADOSSI RELATIVISTICI

distanza spaziale tra due eventi simultanei. Il diagramma spaziotemporale


del processo di misura delle lunghezze di un corpo in moto è quindi quello
riportato in figura 6.1.

Figura 6.1: Contrazione della lunghezza longitudinale di un regolo in moto.


B e B 0 sono gli estremi del regolo. L0 è la lunghezza propria, L è la lunghezza
relativa all’osservatore A.

I dati che abbiamo sono i seguenti: le linee di universo parallele degli


estremi del regolo e la linea di universo dell’osservatore A (da cui ricaviamo
immediatamente la sua piattaforma spaziale, ortogonale alla linea di universo
nel senso della geometria di Minkowski). Questi dati definiscono i tre eventi
di coincidenza E1 , E2 ed E3 :

• E1 : passaggio dell’estremo B per A al tempo t = 0 (nel giudizio


dell’orologio di A);

• E2 : passaggio dell’estremo B 0 per A0 (osservatore che si muove alla


velocità di A, sincronizzato con A e posto a distanza L da A sulla
piattaforma spaziale di A), al tempo t = 0 (nel giudizio dell’orologio di
A);
6.1. LA CONTRAZIONE DELLE LUNGHEZZE LONGITUDINALI 83

• E3 : passaggio dell’estremo B 0 per il punto a distanza L0 da B sulla


piattaforma spaziale di B, al tempo t = 0 (nel giudizio dell’orologio di
B).

Il confronto tra le misure fatte da A e da B si condensa attorno al diagramma


riportato in figura 6.2.

Figura 6.2: Particolare della figura 6.1; triangolo rettangolo del genere
spazio.

Risolviamo il problema in quattro modi:

1. con l’intervallo spaziotemporale (ossia con il Teorema di Pitagora nello


spazio di Minkowski);

2. con le trasformazioni di Lorentz;

3. con il metodo radar;

4. con la trigonometria iperbolica

6.1.1 Risoluzione con l’intervallo spaziotemporale


L’idea è quella di calcolare l’intervallo spaziotemporale S 2 = x2 − c2 t2 nel
giudizio di A e nel giudizio di B; essi dovranno poi necessariamente coinci-
dere, visto che S 2 è indipendente dall’osservatore che esegue le misure.
Nel giudizio di A si avrà che

SA2 (E1 , E2 ) = L2 − 0 = L2 ,

mentre nel giudizio di B sarà

SB2 (E1 , E2 ) = L20 − c2 ∆t2B .

L’eguaglianza dei due ci fornisce la relazione

L2 = L20 − c2 ∆t2B . (6.1)


84 LEZIONE 6. I PARADOSSI RELATIVISTICI

Bisogna infatti osservare che i due eventi E1 ed E2 (localizzazione degli


estremi del regolo da parte di A), simultanei per A (∆tA = 0), non sono
affatto simultanei nel giudizio di B. Si tratta quindi di valutare ∆tB : sarà
determinato dalla condizione di simultaneità di E1 ed E2 rispetto ad A.
Questa condizione può essere ricavata in due modi.
(i) Possiamo operare una trasformazione di Lorentz speciale da B ad A, e
scrivere quindi che2
c∆tA = γ(v) (c∆tB + β∆xB ) = γ(v) (c∆tB + βL0 ) . (6.2)
Dato che ∆tA = 0, abbiamo che3
v v
∆tB = − 2 ∆xB = − 2 L0 . (6.3)
c c
La (6.3) è esattamente la condizione di simultaneità: due eventi che nel
giudizio di B avvengono in luoghi separati da una distanza ∆xB , dopo
un intervallo di tempo ∆tB sono simultanei rispetto ad un osservatore
A, che si muove rispetto a B con velocità v nel senso negativo, se e solo
se vale appunto la relazione (6.3).
(ii) Possiamo utilizzare la trigonometria iperbolica, facendo riferimento al
diagramma di figura 6.1. Se E1 ed E2 sono simultanei per A, la retta
E1 E2 rappresenta la piattaforma spaziale di A. Dunque l’angolo θ è
l’angolo tra la piattaforma spaziale di A e quella di B. Per la simmetria
delle rotazioni iperboliche (v. fig. 6.3), esso coincide con l’angolo tra
gli assi temporali, e quindi
v
tanh θ = .
c
Sempre dalla figura 6.1 deduciamo quindi la seguente relazione sui
valori assoluti
v
c|∆tB | = L0 tanh θ = L0 ,
c
ottenendo la condizione di simultaneità sul valore assoluto
v
|∆tB | = L0 2 . (6.4)
c

2
Si tenga presente che v è la velocità di B rispetto ad A; dunque nel giudizio di B, A
si muove con velocità −v, da cui il segno + dinanzi al fattore β nella (6.2). Il fattore γ
naturalmente non viene toccato da questo cambiamento, poiché, comparendo in esso solo
la seconda potenza di v, rimane invariato dopo la sostituzione v → −v.
3
Notiamo che ∆tB è negativo, fatto che è coerente con quanto mostrato nel diagramma
in figura 6.1.
6.1. LA CONTRAZIONE DELLE LUNGHEZZE LONGITUDINALI 85

Figura 6.3: Simmetria delle rotazioni iperboliche.

Le condizioni (6.3) e (6.4) sono del tutto equivalenti all’atto pratico,


poiché inserendo una qualsiasi di esse nella relazione (6.1) otteniamo

v2 v2
 
2
L = L20 −c 2
∆t2B = L20 −c 2
L20 4 = L20 1− 2 < L20 . (6.5)
c c

Notiamo che al primo passaggio (cioè per ottenere la relazione (6.1)) ab-
biamo usato l’analogo del Teorema di Pitagora nello spazio di Minkowski, nel
passaggio successivo abbiamo invece utilizzato la condizione di simultaneità.
Abbiamo ottenuto che la lunghezza del regolo nel giudizio di A è minore della
lunghezza propria del regolo.

6.1.2 Risoluzione con le trasformazioni di Lorentz


Un metodo molto più immediato è operare una trasformazione di Lorentz
da A a B, per sfruttare direttamente la condizione di simultaneità. Per ogni
coppia di eventi, infatti si ha che

c∆tB = γ(v)(c∆tA − β∆xA )
.
∆xB = γ(v)(∆xA − βc∆tA )

Per la coppia di eventi (E1 , E2 ) si ha che ∆xA = L, ∆tA = 0 (sono


simultanei per A), ∆xB = L0 , e dunque dalla seconda equazione ricaviamo
86 LEZIONE 6. I PARADOSSI RELATIVISTICI

immediatamente che
L0
L0 = γ(v) · L =⇒ L = < L0 , (6.6)
γ(v)
riottenendo come risultato la contrazione delle lunghezze. Notiamo anche
che la prima delle due equazioni di Lorentz ribadirebbe la condizione di
simultaneità.

6.1.3 Risoluzione con il metodo radar

Figura 6.4: Contrazione delle lunghezze longitudinali, analizzata con il


metodo radar.

Le coordinate radar di E1 sono note in entrambi i riferimenti A e B. Il


problema è dunque studiare le coordinate radar di E2 ; per farlo ci serviamo
del diagramma in figura 6.4. Al solito, utilizziamo il “trucco” di trasformare
l’invio di un segnale radar in uno scambio Doppler, supponendo che in E1 A
e B si scambino un segnale. Possiamo quindi pensare a T10 come periodo di
emissione da parte di B si un segnale che viene ricevuto da A con periodo
T1 ; dato che A e B sono in avvicinamento, vale la relazione Doppler
1
T1 = · T 0.
k(v) 1
6.1. LA CONTRAZIONE DELLE LUNGHEZZE LONGITUDINALI 87

Inoltre, del tutto analogamente, possiamo pensare che T20 sia il periodo di
emissione da parte di B di un segnale che A riceve con periodo T2 . Dato che
ora i due osservatori sono in allontanamento, vale che

T2 = k(v) · T20 .

Abbiamo trovato quindi le relazioni tra le due coordinate. Ora dobbiamo


imporre la condizione di simultaneità per E1 ed E2 nel giudizio di A. Tali
eventi sono infatti simultanei per A se e solo se

T1 + T2
T (E2 ) = = T (E1 ) = 0,
2
da cui ricaviamo che
T1 + T2 = 0.
Poniamo quindi T1 = T e T2 = −T , e calcoliamoci ora la lunghezza nel
giudizio di A e in quello di B. Abbiamo che
1 1
∆xA = L = c(T2 − T1 ) = c(T + T ) = cT,
2 2
   
1 0 0 1 1 1 1 1
∆xB = L0 = c(T2 −T1 ) = c T1 − kT2 = c T + kT = (k+k −1 )ct = γ(v)cT.
2 2 k 2 k 2
Dunque, in definitiva otteniamo nuovamente che

L0
L0 = γ(v) · cT = γ(v) · L =⇒ L = < L0 .
γ(v)

6.1.4 Risoluzione con la trigonometria iperbolica


Per risolvere il problema basta riferirsi alla già vista figura 6.2 e scrivere la
relazione tra cateto e ipotenusa nel triangolo rettangolo E1 E2 E3 . Essa è

L0 = L cosh θ = γ(v) · L,

da cui si ha immediatamente che


L0
L= < L0 .
γ(v)

La condizione di simultaneità di E1 ed E2 qui è stata usata per individuare


l’angolo θ ed esprimerlo quindi in funzione della velocità relativa: cosh θ =
γ(v).
88 LEZIONE 6. I PARADOSSI RELATIVISTICI

6.1.5 Ciò che si misura, ciò che si vede


Riprendiamo l’esempio della sezione precedente, dove abbiamo visto che,
detta L la lunghezza del regolo nel giudizio di A,

L0
L= < L0 ,
γ(v)

con L0 lunghezza propria del regolo. Dunque A misura una lunghezza del
regolo minore a quella che potrebbe misurare un osservatore in quiete relativa
rispetto al regolo.

Figura 6.5: Per trovare quello che A vede a un dato istante dobbiamo
supporre che i raggi di ritorno arrivino ad A contemporaneamente.
6.1. LA CONTRAZIONE DELLE LUNGHEZZE LONGITUDINALI 89

Ora supponiamo che il regolo sia già passato e si stia allontanando dal
traguardo: ciò che A vede è qualcosa di diverso. Se si facesse un’istantanea del
regolo, A vedrebbe l’estremo più lontano B in una posizione corrispondente
a un tempo precedente a quello cui corrisponde la posizione dell’estremo più
vicino B 0 (v. fig. 6.5). Infatti, affinché i raggi arrivino contemporaneamente
ad A a un tempo tf , essi devono essere stati inviati a due diversi tempi.
Precisamente, il raggio inviato all’estremo più lontano B 0 deve essere inviato
a un tempo t0 < t, dove t è il tempo a cui è inviato il raggio destinato
all’estremo più vicino B. D’altro canto, supponendo che A e B azzerino gli
orologi quando si incontrano, possiamo interpretare nella solita maniera il
grafico come uno scambio Doppler: i tempo di ricezione per B dei due raggi
saranno kt0 e kt. Dato che per B la lunghezza del regolo è la lunghezza propria
L0 , e dato che (kt0 , kt) sono le coordinate radar dell’evento E di localizzazione
del secondo estremo B 0 del regolo, ne consegue (per la definizione) che, nel
giudizio di B, la lunghezza del regolo è pari alla coordinata spaziale del
secondo estremo, cioè

1 1
L0 = c(kt − kt0 ) = kc(t − t0 ),
2 2
da cui
2L0
t − t0 =
kc
e dunque l’osservatore A vedrà il regolo di lunghezza4

1 1 1 L0 γ(v)L
L = c(tf − t0 ) − c(tf − t) = c(t − t0 ) = = =
2 2 2 k k
1 1 1 1 1 1
=q ·q L= q ·q L= q ·q L=
v2 c+v c2 −v 2 c+v (c+v)(c−v) c+v
1 − c2 c−v c2 c−v c2 c−v
1 c 1
=q L= L= L.
(c+v)2 c+v 1 + β(v)
c2

Dunque la lunghezza che A vede (L) è diversa dalla lunghezza che A


misura (L). In particolare, A vede una lunghezza ancora minore di quella
che misura. Sussiste dunque la seguente catena di disuguaglianze:

L < L < L0 .
4
Stiamo prendendo la differenza delle coordinate x0 e x relative ai due estremi B 0 , B
del regolo, nel giudizio di A.
90 LEZIONE 6. I PARADOSSI RELATIVISTICI

Possiamo anche trovare l’espressione di L in funzione di L0 . Sappiamo infatti


L0
che L = γ(v) , e dunque

1 1
L= L= L0 ,
1 + β(v) γ(v)(1 + β(v))
da cui

1 + vc c+v
c
L0 = γ(v)(1 + β(v))L = q L= √ L=
2 c2 −v 2
1 − vc2 c
r
c+v c+v
=p L= L = k(v) · L.
(c + v)(c − v) c−v

Riassumiamo il tutto nel diagramma riportato in figura 6.6.

Figura 6.6: Schema riassuntivo. L delle relazioni tra lunghezza propria L0


di un regolo, lunghezza L misurata da un osservatore inerziale A e lunghezza
L che lo stesso osservatore inerziale vede.

6.2 Dilatazione dei tempi


Si tratta del fenomeno duale della contrazione delle lunghezze longitudinali
- a tale problema abbiamo già accennato alla sezione 2.3.2. Secondo questo
fenomeno, “gli orologi vanno più lenti” nel giudizio dell’osservatore che li
vede in moto. Non può esistere la contrazione delle lunghezze senza che
esista la dilatazione dei tempi: i due fenomeni sono indissolubilmente legati
e spesso uno stesso fenomeno può essere spiegato o con l’uno o con l’altro
dei due effetti, a seconda del punto di vista (come vedremo più avanti) - ad
6.2. DILATAZIONE DEI TEMPI 91

esempio un fenomeno che si spiega con la contrazione delle lunghezze in un


riferimento, si spiega con la dilatazione dei tempi in un altro riferimento.
Geometricamente questa dualità è una manifestazione delle proprietà delle
rotazioni iperboliche di ruotare simmetricamente gli assi spaziale e temporale:
non può avvenire una rotazione dell’asse temporale senza che vi sia anche una
rotazione della piattaforma spaziale (fig. 6.3)

Figura 6.7: Battito dell’orologio di due diversi osservatori inerziali in moto


relativo. Fissata la coppia di eventi (E1 , E2 ), T0 è il tempo proprio tra i due
eventi (poiché è il tempo misurato dall’osservatore B che li vede accadere nello
stesso luogo,) T è il tempo relativo all’osservatore A.

Il primo problema che consideriamo è quello del “battito dell’orologio”.


Fissiamo due eventi E1 ed E2 . Sappiamo che esiste un solo osservatore iner-
ziale che li vede accadere nello stesso luogo, chiamiamolo B. Il tempo T0 che
intercorre tra i due eventi, misurato nel giudizio di B, è detto (come abbiamo
già visto) tempo proprio, poiché per B i due eventi accadono nello stesso
luogo. Consideriamo ora un altro osservatore inerziale A che coincida con
B in E1 , e che veda accadere l’evento E2 in un certo punto ∆xA della sua
piattaforma spaziale. Il tempo T che intercorre tra i due eventi, misurato
da quest’altro osservatore inerziale, è detto tempo relativo ad A. Sia E3
l’evento che avviene contemporaneamente a E2 e nello stesso luogo di E1 nel
giudizio dell’osservatore A.
La situazione è riportata nel diagramma in figura 6.7. In questo caso la
condizione “essere nello stesso luogo” sostituisce la condizione di simultaneità
92 LEZIONE 6. I PARADOSSI RELATIVISTICI

della sezione precedente: se daremo il giusto peso a questo concetto, nulla ci


apparirà paradossale. Nuovamente, possiamo risolvere il problema in quattro
modi:
1. con l’intervallo spaziotemporale (ossia con il Teorema di Pitagora nello
spazio di Minkowski);
2. con le trasformazioni di Lorentz;
3. con il metodo radar;
4. con la trigonometria iperbolica

6.2.1 Risoluzione con l’intervallo spaziotemporale

Figura 6.8: Particolare della figura 6.7; triangolo rettangolo del genere
spazio.

L’idea è quella di calcolare l’intervallo spaziotemporale degli eventi E1 ed


E2 nel giudizio di A e nel giudizio di B; essi dovranno poi necessariamente
coincidere, visto che S 2 è indipendente dall’osservatore che esegue le misure.
Mediante il “Teorema di Pitagora” (figura 6.8) prestato allo spaziotempo
di Minkowski, abbiamo che, nel giudizio di A,
SA2 (E1 , E2 ) = ∆x2A − c2 T 2 ,
mentre nel giudizio di B
SB2 (E1 , E2 ) = 0 − c2 T02 = c2 T02
(gli eventi per B accadono infatti nello stesso luogo). L’eguaglianza dei due
ci fornisce la relazione
c2 T02 = c2 T 2 − ∆x2A (6.7)
6.2. DILATAZIONE DEI TEMPI 93

Sappiamo inoltre l’osservatore B si muove rispetto ad A con velocità


relativa v, dunque deve valere la legge del moto uniforme

∆xA = vT,

che possiamo notare essere la condizione di localizzazione nello stesso luogo


per B. Cioè: due avvenimenti accadono nello stesso luogo per B se e solo se
per un osservatore A, in moto relativo con velocità v, essi accadono a distanza
temporale T e a distanza spaziale ∆xA . Inserendo questa condizione nella
(6.7) otteniamo che
c2 T02 = T 2 (c2 − v 2 )
e quindi che r
c2
T = T0 = γ(v) · T0 =⇒ T > T0 . (6.8)
c2 − v 2
Possiamo immaginare che l’osservatore B sia un orologio che batte pe-
riodicamente: abbiamo trovato che il tempo nel giudizio di un osservatore A
in moto relativo rispetto all’orologio B trascorre più lentamente, ovvero che
il tempo misurato da un orologio solidale con A è minore rispetto al tempo
misurato dall’orologio B.

6.2.2 Risoluzione con le trasformazioni di Lorentz


Un metodo più diretto è operare una trasformazione di Lorentz da B ad A,
per inserire direttamente la condizione di concordanza spaziale degli eventi
per B (cioè ∆xB = 0). Per ogni coppia di eventi, infatti si ha che

c∆tA = γ(v)(c∆tB − β∆xB )
.
∆xA = γ(v)(∆xB − βc∆tB )

Per la coppia di eventi (E1 , E2 ), in particolare, vale ∆tA = T , ∆tB = T0 ,


∆xB = 0 (gli eventi accadono nello stesso luogo per B), e dunque dalla prima
equazione ricaviamo immediatamente che cT = γ(v) · cT0 , ovvero che

T = γ(v) · T0 =⇒ T > T0 , (6.9)

riottenendo come risultato la dilatazione dei tempi.


Notiamo anche che la seconda equazione diventa

∆xA = γ(v)β(v) · cT0 = β(v) · cT = vT

ed esprime quindi la condizione (ovvia) su ∆xA e su T affinché i due eventi


avvengano nello stesso luogo nel giudizio di B (appartenenza alla linea di
universo di B).
94 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.9: Dilatazione dei tempi, analizzata mediante il metodo radar.

6.2.3 Risoluzione con il metodo radar


Le coordinate radar di E1 sono note in entrambi i riferimenti A e B. Il
problema è dunque studiare le coordinate radar di E2 ; per farlo ci serviamo
del diagramma in figura 6.9. Le coordinate di E2 rispetto a B sono ovvie:
E2 accade infatti sulla linea di universo di B. Per trovare le coordinate radar
(T1 , T2 ) di E2 rispetto ad A, al solito, utilizziamo il “trucco” di trasformare
l’invio di un segnale radar in uno scambio Doppler, supponendo che in E1 A
e B si scambino un segnale.
Possiamo quindi pensare a T1 come periodo di emissione da parte di A si
un segnale che viene ricevuto da B con periodo T0 ; vale la relazione Doppler
T0 = k(v) · T1 .
Inoltre, del tutto analogamente, possiamo pensare che T0 sia il periodo di
emissione da parte di B di un segnale che A riceve con periodo T2 . Vale che
T2 = k(v) · T0 .
Quindi abbiamo che
1 1
T = (T1 + T2 ) = (k + k −1 )T0 = γ(v) · T0 =⇒ T > T0 ,
2 2
e ritroviamo la dilatazione dei tempi. Notiamo che la condizione di localiz-
zazione è già incorporata nella scelta di B come unico osservatore inerziale
che vede accadere E1 ed E2 nello stesso luogo.
6.2. DILATAZIONE DEI TEMPI 95

6.2.4 Risoluzione con la trigonometria iperbolica


Ancora più velocemente, per risolvere il problema basta riferirsi nuovamente
alla figura 6.8 e scrivere la relazione tra cateto e ipotenusa nel triangolo
rettangolo E1 E2 E3 . Essa è

T = T0 cosh θ = γ(v) · T0 =⇒ T > T0 .

Nuovamente, la condizione di simultaneità di E1 ed E2 qui è stata usata


per individuare l’angolo θ ed esprimerlo quindi in funzione della velocità v.

6.2.5 Il metodo del traguardo


Riconduciamo il metodo della contrazione delle lunghezze a quello della di-
latazione dei tempi utilizzando il “metodo del traguardo” per definire la
lunghezza di un corpo in moto. L’interesse di questo metodo sta nel fatto
che esso fa uso di un solo orologio, riconducendo la misura di una lunghezza
a una misura di tempo.
La situazione è rappresentata in figura 6.10. Sia A un osservatore iner-
ziale (il “traguardo”), dotato di un orologio (asse temporale) e sia SA la sua
piattaforma spaziale. Consideriamo un regolo che si avvicini di moto iner-
ziale da sinistra, e siano B e B 0 gli estremi di tale regolo. Quando il primo
estremo del regolo va a coincidere con A si determina l’evento di coincidenza
E1 , quando il secondo estremo del regolo va a coincidere con A si determina
l’evento di coincidenza E2 . Tali eventi avvengono nello stesso luogo per A,
sulla linea di universo di A. Essi fissano quindi due fotogrammi dell’orologio
di A. Per definizione, nel giudizio di A, la lunghezza del regolo è

L = v∆tA ,

dove ∆tA è il tempo (misurato dall’orologio di A) che intercorre tra il pas-


saggio degli estremi del regolo. Nel giudizio di B, invece, l’orologio di A
ha percorso la distanza L0 in un tempo ∆tB muovendosi alla velocità5 v.
Dunque deve valere questa volta che

L0 = v∆tB .

∆tB è il tempo trascorso tra i due eventi E1 ed E2 nel giudizio di B.


5
Si noti che l’unica cosa che possiamo tenere in comune nei giudizi dei due osservatori
è la loro velocità relativa: per il resto dobbiamo stare molto attenti a scindere ciò che è
misurato da A con ciò che è misurato nel giudizio di B.
96 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.10: Situazione del “metodo del traguardo”. Un regolo BB 0 si muove


con velocità v verso il traguardo A. T0 è il tempo intercorso tra il passaggio
del primo e del secondo estremo, nel giudizio di A.
6.3. IL DECADIMENTO DEI MESONI 97

In questo caso, ∆tB non è il tempo proprio, ma lo è ∆tA = T0 , poiché gli


eventi avvengono nello stesso luogo nel giudizio di A. Per la dilatazione dei
tempi, dunque, deve accadere che

T = γ(v) · T0 .

Possiamo quindi riassumere il tutto nel diagramma riportato in figura 6.11.

Figura 6.11: Schema riassuntivo. L è la lunghezza del regolo nel giudizio di


A, L0 è la lunghezza propria del regolo; T0 è il tempo intercorso tra il passaggio
del primo e del secondo estremo del regolo nel giudizio di A (tempo proprio),
T è lo stesso tempo nel giudizio del regolo.

6.3 Il decadimento dei mesoni


I raggi cosmici, quando arrivono al bordo superiore dell’atmosfera, ad un’al-
tezza di circa h = 20km rispetto al livello del mare, producono nell’urto con
l’atmosfera delle particelle instabili, dette mesoni (e solitamente indicati con
la lettera greca µ), che viaggiano nell’atmosfera con velocità v ≈ 0.99c (pari
alla velocità dei raggi cosmici che li producono). Queste particelle instabili
hanno una vita media τ che è legata alla legge di decadimento

N (t) = N0 e−λt

1
dal fatto che τ = . Nell’equazione, N (t) è il numero di particelle a un
λ
istante t, N0 è il numero di particelle iniziali.
La vita media τ può essere misurata in laboratorio (quando i mesoni
sono a riposo), valutando la porzione di popolazione iniziale che dopo un
dato tempo t non è decaduta in elettroni e neutrini. Abbiamo quindi tutti i
dati del problema: altezza h, velocità v e vita media τ .
Secondo la fisica newtoniana, lo spazio percorso dal mesone µ tra la
nascita e la morte è
s = vt.
98 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.12: Produzione e decadimento dei mesoni µ. Il mesone viene pro-


dotto dall’urto dei raggi cosmici con l’atmosfera, a un’altezza h. Dopo un
tempo τ esso decade in un elettrone e un neutrino.
6.3. IL DECADIMENTO DEI MESONI 99

Se si inseriscono i dati, si trova che vt < h, cioè che s < h, e quindi non
dovrebbe essere possibile rilevare mesoni di origine cosmica al livello del mare.
Al contrario, tali mesoni sono rilevati.6 Vogliamo quindi dare una spiegazione
a questo fenomeno, usando in modo duale sia la dilatazione dei tempi, sia la
contrazione delle lunghezze.

6.3.1 Punto di vista della terra


Dal punto di vista della terra, la spiegazione si basa sulla dilatazione dei
tempi: la vita media τ è un tempo misurato dall’orologio interno del mesone.
Possiamo schematizzare la faccenda nel diagramma di figura 6.13.

Figura 6.13: Diagramma spaziotemporale della vita del mesone. L’evento


E1 è la produzione del mesone, l’evento E2 è il suo rilevamento a terra.

Il punto fondamentale è prestare attenzione, al fine di non confondere le


misure di spazio e di tempo fatte dall’osservatore terrestre con quelle fatte dal
mesone, poiché entrambe le misure hanno valore relativo. Dato che l’espe-
rienza ci dice che riusciamo a trovare mesoni al livello del mare, ribatteziamo
τ il tempo (minimo) tra la produzione e il rilevamento del mesone nel giu-
dizio del mesone. Sia invece t il tempo tra gli stessi eventi nel giudizio del
laboratorio terrestre. I due eventi E1 (produzione del mesone) ed E2 (rileva-
mento del mesone) avvengono sulla linea di universo del mesone, quindi τ è
il tempo proprio. Per la dilatazione dei tempi abbiamo che
t = γ(v) · τ.
6
Questa è stata una delle prime verifiche sperimentali della validità della Relatività
Ristretta.
100 LEZIONE 6. I PARADOSSI RELATIVISTICI

La legge di moto rispetto all’osservatore terrestre7 è

h = vt,

e quindi la legge corretta è

h = (γ(v) · v) · τ,

che è compatibile con i dati sperimentali.


Il fenomeno si spiega dunque, rispetto all’osservatore terrestre, con la
dilatazione dei tempi: sbagliavamo nel ritenere τ il tempo di vita del mesone
nel nostro giudizio; lo era nel giudizio del mesone.

6.3.2 Punto di vista del mesone


Dal punto di vista del mesone, il tempo trascorso tra gli eventi E1 (produ-
zione, cioè “nascita” del mesone) ed E2 (rilevamento del mesone al livello del
mare) è proprio τ , e la velocità con cui la terra precipita addosso al mesone è
sempre v. Dunque abbiamo ancora il paradosso che, sulla carta, dovremmo
avere8
vτ < h,
quando invece accade il contrario. Qui non possiamo più far valere la dila-
tazione dei tempi: il tempo τ è il tempo proprio, non c’è scampo.
Il paradosso è ancora dovuto al fatto che nella legge vτ < h stiamo impie-
gando grandezze eterogenee: τ è infatti misurato dal mesone, h è misurato
dalla terra. Il paradosso nasce quindi dal mischiare nella stessa equazione
del moto uniforme
spazio = velocità · tempo
grandezze misurate da osservatori diversi. Se ci poniamo nel punto di vista
del mesone, dobbiamo usare sı̀ il tempo τ , ma anche la distanza d che il
mesone attribuisce alla terra al momento della sua nascita (anche le lunghezze
sono infatti relative). La situazione è riassunta nel diagramma di figura 6.14.

Sia E1 l’evento della nascita del mesone, E2 il suo rilevamento. Per deter-
minare le distanze, dobbiamo considerare l’evento E3 che si trova sulla linea
7
Prestiamo attenzione: è vero che le leggi di moto devono avere la stessa forma nel
giudizio del mesone e in quello della terra, ma dobbiamo stare attenti che in ciascuna di
esse tutte le grandezze devono essere misurate dallo stesso osservatore. La disomogeneità
delle misure porta inevitabilmente all’invalidità delle equazioni.
8
Si badi bene: questa equazione è sbagliata, poiché disomogenea nelle misure.
Successivamente viene spiegata la questione.
6.3. IL DECADIMENTO DEI MESONI 101

Figura 6.14: Diagramma spaziotemporale modificato aggiungendo il punto


di vista del mesone. In particolare, quando il mesone viene prodotto (E1 ), nel
giudizio del mesone la terra si trova in E3 . Viceversa, nel giudizio della terra,
essa si trova in E4 . Quindi k è la distanza tra punto di produzione e terra,
nel giudizio del mesone; h è la stessa distanza nel giudizio terrestre. θ è il
parametro di rapidità.
102 LEZIONE 6. I PARADOSSI RELATIVISTICI

di universo della terra e che è simultaneo ad E1 nel giudizio del mesone. Sia
inoltre E4 l’evento che avviene sulla terra contemporaneamente ad E1 nel
giudizio dell’osservatore terrestre. Dal triangolo E1 E3 E4 ricaviamo che

h = d cosh θ = γ(v) · d,

fatto che traduce la contrazione delle lunghezze. Quindi, nel giudizio del
mesone, la terra si trovava inizialmente a una distanza d < h contratta del
fattore cosh θ = γ(v) rispetto alla distanza valutata dalla terra. La legge di
moto va dunque riscritta come

d = vτ,

formulazione che è compatibile con i dati sperimentali.


Dunque, l’esperimento del mesone, dal punto di vista del mesone, è spie-
gato in maniera simmetrica, dalla contrazione delle lunghezze. Dilatazione
dei tempi e contrazione delle lunghezze sono perciò fenomeni duali che non
possono sussistere separatamente: l’uno implica l’altro. Vale la pena ricor-
dare di nuovo che, dal punto di vista della geometria dello spaziotempo di
Minkowski, questa dualità è legata alla peculiarità delle rotazioni iperboliche
per cui, se ruota l’asse dei tempi di un osservatore, deve contemporaneamente
ruotare anche la piattaforma spaziale, in modo simmetrico rispetto al cono
luce, cosı̀ da rispettare la condizione di ortogonalità (figura 6.15).

Figura 6.15: Dilatazione dei tempi e contrazione delle lunghezze sono feno-
meni duali, poiché, in un cambio di osservatore, se ruota l’asse dei tempi deve
ruotare simmetricamente anche la piattaforma spaziale, e viceversa.
6.4. IL PARADOSSO DEI GEMELLI 103

6.4 Il paradosso dei gemelli


6.4.1 Situazione
Consideriamo tre osservatori inerziali A, B, C tali che B e C si muovano
rispetto ad A con la stessa velocità v ma da parti opposte. La situazione è
quella rappresentata in figura 6.16.

Figura 6.16: Situazione del paradosso dei gemelli. B e C si avvicinano con


velocità v ad A; C è più lontano da A rispetto a B (nel giudizio di A.

Possiamo pensare che A sia la torre di controllo di un aeroporto, e che


B e C siano due aerei in avvicinamento. Supponiamo che, nel giudizio di A,
inizialmente C sia molto più lontano.
Disegnamo il diagramma spaziotemporale (figura 6.17) e consideriamo i
seguenti eventi. B si sta avvicinando da sinistra ad A, sino a quando lo
incontra.

• E1 : al tempo tA (E1 ) = 0 (misurato da A) B passa per A, e concorda


di tarare il suo orologio in modo tale da segnare anch’esso tB (E1 ) = 0
(azzeramento degli orologi di A e B).

Poi B si allontana da A, viaggiando verso destra, e incrocia C.

• E2 : B incrocia C che si sta avvicinando ad A quando il suo orologio


segna tB (E2 ) = 1 h (per fissare le idee). B e C concordano di regolare
l’orologio di C in modo tale che tC (E2 ) = 1 h anch’esso (regolazione
degli orologi di B e C).

Abbandoniamo ora B e seguiamo C nel suo avvicinamento ad A. Poiché la


distanza da percorrere è (nel giudizio di A) la stessa di quella percorsa da B,
e dato che C si avvicina ad A con la stessa velocità con cui B si allontanava,
è chiaro che C ci metterà ad avvicinarsi lo stesso tempo che B ci ha messo
ad allontanarsi (nel giudizio di A).

• E3 : C passa per A, quando l’orologio di C segnerà tC (E3 ) = 2h.


104 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.17: Diagramma spaziotemporale del paradosso dei gemelli.


6.4. IL PARADOSSO DEI GEMELLI 105

La domanda paradossale è: quanto tempo è trascorso per A tra gli eventi E1
ed E3 ?
Innanzitutto spieghiamo perché abbiamo chiamato questo paradosso “pa-
radosso dei gemelli”. Supponiamo che vi siano due gemelli; il primo (A) sta
fermo in terra nella torre di controllo di un aeroporto, il secondo invece viag-
gia con velocità relativa v rispetto ad A e poi se ne torna indietro. Questo
gemello corrisponde all’unione dei gemelli B e C; B per la fase di andata, C
nella fase di ritorno: è come se, incrociando C, B “saltasse sul suo aereo” e
ritornasse indietro.9 Chiameremo perciò questo secondo gemello B + C.
Ora cerchiamo di rispondere alla domanda precedente: appurato che per
il gemello B + C tra gli eventi E1 ed E3 sono trascorse due ore, quanto tempo
è trascorso per il gemello A tra gli stessi eventi? Rispondiamo alla domanda
con il metodo radar (figura 6.18).

Figura 6.18: Quanto tempo è trascorso tra E1 ed E3 nel giudizio di A?


Rispondiamo mediante il diagramma del metodo radar.

Per confrontare i tempi trascorsi usiamo il metodo dello scambio di segnali


luminosi (metodo che sta alla base della geometria di Minkowski). Suppo-
niamo che, mentre si allontana, B invii n segnali luminosi con periodo T
9
Tutto questo è un “trucco” per evitare di parlare di accelerazioni: se dovesse il gemello
B invertire rotta, dovrebbe decelerare, e quindi non saremmo più in regime di relatività
ristretta, poiché non sarebbe più un osservatore inerziale. Ci inventiamo quindi un altro
osservatore C da abbinare a B, un osservatore che si occupi del viaggio di ritorno.
106 LEZIONE 6. I PARADOSSI RELATIVISTICI

(ad esempio, n = 6 e T = 10min, per fissare le idee). L’ultimo segnale ar-


riva ad A al suo tempo t1 . Supponiamo poi che C faccia la stessa cosa nel
suo avvicinarsi ad A: anch’esso invierà n segnali con periodo T , l’ultimo dei
quali è scambiato quando C incrocia A, al tempo t2 nel giudizio di A (con
riferimento ancora alla figura 6.18).
Il tempo totale trascorso per il gemello B + C è la somma dei periodi di
emissione dei segnali luminosi. Il tempo totale trascorso per A è invece la
somma dei periodi di ricezione. Scindiamo le due diverse fasi.
Durante l’allontanamento di B si ha che

Tric = k · Temiss = kT

e dunque
t1 = nTric = kn · Temiss = knT = kTB
ove TB è la durata del tempo di viaggio di B.
Durante l’avvicinamento di C si ha che
1 T
Tric = · Temiss =
k k
e dunque
n n
t2 − t1 = nTric = · Temiss = T = k −1 TC
k k
ove TC è la durata del tempo di viaggio di C.
Dato che, per simmetria, i due tempi di viaggio di B e C devono essere
uguali, TB = TC , ricaviamo che

1
t2 = t1 + (t2 − t1 ) = kTB + k −1 TC = (k + k −1 )TB = (k + k −1 )2TB =
2
1
= (k + k −1 )(TB + TC ) = γ(v) · (TB + TC ).
2
Dunque il tempo totale trascorso per A è γ(v) volte la somma dei tempi
trascorsi per B e per C, cioè γ(v) volte il tempo totale trascorso per il
gemello B + C. Evidentemente, i due tempi coincidono solo se v = 0; ne
concludiamo che il gemello A (che non si è allontanato) è invecchiato di più
rispetto all’altro gemello B + C.

6.4.2 Carattere paradossale e smascheramento


Nasce però un’obiezione sensata: questa conclusione sembra violare il Prin-
cipio di Relatività! Il moto è infatti relativo, quindi non si può dire se sia
il gemello B + C ad allontanarsi da A o se sia invece A che si allontana a
6.4. IL PARADOSSO DEI GEMELLI 107

sinistra da B + C e poi si riavvicina. Se le due situazioni sono indistinguibili,


allora gli effetti devono essere uguali, e perciò B + C deve invecchiare più di
A! C’è una contraddizione logica nella geometria di Minkowski? Quindi la
geometria di Minkowski non sta in piedi? Dove sta l’inghippo?
Sia A sia B + C vedono accadere E1 ed E3 nello stesso luogo, ma tra
questi due gemelli c’è una differenza fondamentale: uno dei due non è un
vero e proprio osservatore inerziale, o meglio, c’è un istante in cui egli cessa
di essere un osservatore inerziale. Il punto chiave è l’inversione del moto:
nel punto di inversione del moto, il gemello B + C smette infatti per un
attimo di essere inerziale: i suoi pendoli e i suoi giroscopi impazziranno,
onde poi riprendere il normale comportamento nella fase di ritorno. Questa
differenza che pare microscopica, è in realtà assai significativa: A è sempre
un osservatore inerziale, B + C, per un pur breve istante, non lo è.
La risposta è quindi che la situazione non è simmetrica. Per rimanere nel
campo degli osservatori inerziali dobbiamo confrontare A con due osservatori
(B e C), situazione palesemente asimmetrica! Se invece vogliamo confrontare
A con il gemello B + C (la cui linea di universo è l’unione dei tratti di linee
di universo di B e C), dobbiamo riconoscere che uno tra i due gemelli, per
un breve intervallo di tempo, ha cessato di essere inerziale,10 fatto che si
manifesta nella presenza dell’angolo nella sua linea di universo.
Stiamo quindi confrontando un osservatore inerziale con un osservatore
non inerziale, e perciò non possiamo invocare il Principio di Relatività.
Nella geometria di Minkowski, questa asimmetria si manifesta nel fatto
che confrontiamo un segmento del genere tempo (quello di A) con una spez-
zata del genere tempo (quella di B+C) - v. fig. 6.19. Abbiamo quindi trovato
che nella geometria di Minkowski, per triangoli del genere tempo, vale la di-
suguaglianza triangolare invertita: un lato è maggiore o uguale della somma
degli altri due lati. Questo è il significato geometrico del paradosso dei ge-
melli. Da questo punto di vista, tale paradosso non è altro che lo studio
della geometria di un triangolo del genere tempo in M e la scoperta della
disuguaglianza triangolare invertita.

6.4.3 Reinterpretazione del paradosso


Abbiamo analizzato il paradosso dei gemelli utilizzando i coni luce (ossia
la struttura causale): infatti per confrontare gli osservatori ci siamo serviti
del metodo dello scambio di segnali luminosi. Reinterpretiamo ora lo stesso

10
Potremmo dire: ha dovuto accendere i motori per invertire il moto.
108 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.19: Il gemello B + C non è un osservatore inerziale: la sua linea di


universo non è una retta, ma una spezzata.

paradosso utilizzando però la struttura metrica, cioè l’intervallo spaziotem-


porale.11
Consideriamo la linea di universo di uno dei due gemelli e poniamoci il
problema di come è misurato il tempo lungo questa linea dell’orologio proprio,
cioè comobile con il gemello. Notiamo innanzitutto che tale linea di universo
è una linea del genere tempo (dunque c’è una relazione causale tra gli eventi
sulla linea), interamente contenuta nel cono luce di uno qualsiasi dei suoi
punti. Generalizziamo anche il caso precedente, supponendo, in generale,
che questa linea non sia una retta (cioè che il gemello in generale non sia
inerziale). Prendiamo la metrica con la solita segnatura lorentziana (3, 1),
e per coerenza continuiamo ad attribuire il + alla parte temporale. Divi-
dendo per c2 la definizione della metrica, onde avere tutti termini temporali,
abbiamo che
ds2 1
2
= 2 (dx2 + dy 2 + dz 2 ) − dt2 ,
c c
ove x, y, z, t sono le coordinate di un certo evento E sulla linea di universo
11
Vale la pena ribadire che è proprio la struttura metrica la struttura centrale nella
geometria dello spaziotempo di Minkowski: gli osservatori sono riferimenti ortonormati
che senza struttura metrica, però, non servirebbero a gran che! Il fulcro della nostra
analisi sta appunto nella presenza di questa metrica S 2 invariante al cambio di osservatore
inerziale.
6.4. IL PARADOSSO DEI GEMELLI 109

del gemello (per un qualunque osservatore inerziale: infatti ds2 è invariante).


Considerando poi un evento E 0 infinitamente prossimo ad E e situato an-
ch’esso sulla linea di universo del gemello12 (figura 6.20): dx, dy, dz, dt sa-
ranno le variazioni infinitesime delle coordinate attribuite agli eventi E ed
E 0 da un qualsiasi osservatore inerziale.

Figura 6.20: Gemello (o particella) e osservatore inerziale.

In particolare, possiamo considerare l’osservatore inerziale istantanea-


mente comobile con il gemello13 (principio del moto incipiente): istante per
istante, infatti, esiste un osservatore inerziale B che ha sulla sua linea di uni-
verso gli eventi infinitamente prossimi E ed E 0 (in particolare essi accadono,
nel suo giudizio, nello stesso luogo). Tale osservatore inerziale, naturalmente,
cambierà di istante in istante, ma ciò che ci interessa è che esso esiste - in
particolare sarà rappresentato dalla retta tangente in ogni punto alla curva
del gemello.
Considerando l’osservatore inerziale comobile con il gemello alla stregua
del gemello stiamo tacitamente ammettendo che le misure di tempo, per
intervalli di tempo infinitesimi, dipendano dalla velocità ma non dall’accele-
razione. Se cosı̀ è, il tempo dτ misurato da questo osservatore inerziale tra gli
eventi E ed E 0 coincide necessariamente con il tempo misurato dall’orologio
del gemello. Sia A un qualsiasi altro osservatore inerziale.
Per l’invarianza dell’intervallo spaziotemporale rispetto al cambiamento
di osservatore inerziale e per la localizzazione nello stesso punto degli eventi
E ed E 0 rispetto all’osservatore inerziale D, abbiamo che
ds2A (E, E 0 ) 1
2
= 2 (dx2 + dy 2 + dz 2 ) − dt2 ,
c c
12
Gemello che, a questo punto, può essere considerato anche una qualsiasi particella che
viaggi di moto non necessariamente inerziale nello spaziotempo.
13
O, se si preferisce, con la particella accelerata.
110 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.21: Principio del moto incipiente: B è l’osservatore di quiete


istantanea.

ds2B (E, E 0 ) 1
2
= 2
(0) − dτ 2 ,
c c
e in particolare, per l’osservatore di quiete istantanea troviamo che

ds2B = −c2 dτ 2 . (6.10)

Dunque la variazione infinitesima di tempo misurata dall’orologio del


gemello coincide con quella misurata dall’orologio di B, ed è quindi data
dall’uguaglianza SA2 (E, E 0 ) = SB2 (E, E 0 ), che conduce a

1
dτ 2 = c2 dt2 − (dx2 + dy 2 + dz 2 ).
c2
Il tempo totale di un percorso da E0 ad E1 (con E0 ed E1 situati sulla linea
di universo del gemello) sarà quindi ottenuto per integrazione:
Z t1 Z t1
r
1
τ (E0 , E1 ) = dτ = dt − (dx2 + dy 2 + dz 2 )
t0 t0 c2

Nel piccolo, il moto è uniforme, cioè possiamo pensare che



 dx = vx dt
dy = vy dt ,
dz = vz dt

dove supponiamo che il gemello si muova con velocità variabile ~v (t) = (vx (t), vy (t), vz (t)).
Allora
dx2 + dy 2 + dz 2 = (vx2 + vy2 + vz2 )dt2 = v 2 dt2 ,
6.4. IL PARADOSSO DEI GEMELLI 111

e l’integrale precedente si riconduce a


Z t1 Z t1 r 2
Z t1 r 2
Z t1
v v dt
τ (E0 , E1 ) = dτ = dt2 − 2 dt2 = dt 1 − 2 = .
t0 t0 c t0 c t0 γ(v(t))
(6.11)
Per capire l’importanza e il significato di questa formula, bisogna con-
frontarla con la formula delle durate di Newton (figura 6.22). Avendo infatti
per Newton le durate carattere assoluto (le misure di intervalli di tempo in
sistemi inerziali diversi coincidono), si ha che
Z t1 Z t1
τ (E0 , E1 ) = dτ = dt. (6.12)
t0 t0

Il tutto è sintetizzato nei diagrammi di figura 6.22.

Figura 6.22: Differenza nella concezione degli intervalli di tempo tra lo


schema classico e lo spaziotempo di Minkowski. Nello spaziotempo newto-
niano le durate hanno carattere assoluto, e gli intervalli infinitesimi di tempo
sono differenziali esatti. Nello schema minkowskiano, le durate sono lunghezze
d’arco.

La differenza è che, nello schema newtoniano, la funzione durata che


ad ogni coppia di eventi infinitamente prossimi associa l’intervallo di tempo
(proprio) intercorso è un differenziale esatto:

durata(E, E 0 ) = dt(E, E 0 ),

mentre invece, nello schema minkowskiano, la stessa funzione ha il carattere


di una lunghezza d’arco, e quindi non è un differenziale esatto:
dt(E, E 0 )
durata(E, E 0 ) = .
γ(v(t))
112 LEZIONE 6. I PARADOSSI RELATIVISTICI

La forte dipendenza da t nel denominatore di quest’ultima relazione fa si


che il differenziale non sia esatto e che dunque la durata totale dipenda dal
cammino di integrazione. In Minkowski, il tempo è la lunghezza d’arco delle
linee di universo del genere tempo.
Il paradosso dei gemelli non fa altro che ribadire questa natura del tempo
relativistico: il tempo è una lunghezza d’arco.

6.4.4 Esperimento di Hafele-Keating


Nel 1972 si è avuta la prima verifica sperimentale del paradosso dei gemelli
fuori dai laboratori,14 con l’esperimento di Hafele-Keating. Essi hanno preso
tre orologi atomici identici, ne hanno lasciato uno a terra (a Baltimora) e
hanno posto gli altri due in volo su aerei di linea, lanciati in versi opposti a
fare il giro equatoriale della terra.15 Ciò costringe i tre orologi a percorrere tre
linee di universo diverse nello spaziotempo, ma avendo due eventi coincidenti:
l’evento E0 di partenza di due aerei e l’evento E1 di ritrovo dei tre oroloogi
dopo il giro del mondo degli aerei.
La figura 6.23 riporta le linee di universo di tali orologi in uno spazio
bidimensionale (supponiamo che lo spazio sia la sezione terrestre, tagliata
equatorialmente con il piano su cui circolano ambedue gli aerei in moto). Sia
A l’orologio dermo a Baltimora, siano B e C gli orologi in viaggio sugli aerei.
La linea di universo di A sarà in prima approssimazione un’elica cilindrica:
A non è inerziale, si muove con la rotazione terrestre. Per quanto riguarda
gli orologi B e C, anche le loro linee di universo saranno eliche cilindriche,
ma aventi passi diversi, strutturate in modo diverso. Ciò che accomuna le tre
linee di universo è il fatto che esse differiscono solamente nei tratti compresi
tra gli eventi E0 ed E1 : prima della partenza e dopo l’arrivo, infatti, i tre
orologi sono tutti situati a Baltimora, nel medesimo luogo, ove ritornano alla
fine del viaggio.
Il fatto significativo è che nel tratto in cui le tre linee si distinguono,
i tre orologi battono diversamente: all’arrivo a Baltimora, gli orologi B e
C in viaggio hanno battuto più lentamente, e segnano di conseguenza un
tempo leggermente inferiore all’orologio A, sempre solidale con la terra -
una differenza leggera, ma rilevabile e rilevata dall’esperimento. Se al posto
dell’orologio e degli aerei, avessimo tre macchine e tre contachilometri non ci
stupiremmo affatto di questo risultato: ci sembrerebbe assai naturale che le
14
Il carattere relativistico del tempo era stato già precedentemente esplorato, ma sempre
in laboratorio. L’esperimento di Hafele-Keating ha il pregio di portare la relatività a un
livello “quotidiano”.
15
L’utilizzo di due aerei in luogo di uno solo è per ovviare ad alcuni effetti gravitazionale
inevitabilmente presenti e dovuti alla rotazione terrestre.
6.4. IL PARADOSSO DEI GEMELLI 113

Figura 6.23: Esperimento di Hafele-Keating. A (linea nera) è l’orologio


fermo a Baltimora; B è l’orologio collocato sull’aereo in viaggio equatoriale
nello senso di rotazione terrestre. C è l’orologio collocato sull’aereo in viaggio
in verso contrario rispetto al senso di rotazione terrestre. Tutte le linee di
universo sono, in prima approssimazione eliche cilindriche. Prima di E0 (par-
tenza) e dopo E1 (ritrovo) esse coincidono completamente. Tra i due eventi, le
eliche degli osservatori hanno passi diversi. La differenza dei percorsi fatti da
A, B e C tra E0 ed E1 si ripercuote in una differenza di cammino percorso, ma
anche di tempo trascorso - essendo il tempo in tutto e per tutto una lunghezza
d’arco, esso dipende infatti dal cammino di integrazione.
114 LEZIONE 6. I PARADOSSI RELATIVISTICI

tre auto, partite da E0 , giunte a E1 tramite percorsi diversi, abbiano percorso


un diverso numero di chilometri. Questo accade in maniera del tutto analoga
anche per i tempi, poiché il tempo nello spaziotempo di Minkowski è una
lunghezza d’arco, e come tale va trattata. Integrando su cammini diversi,
otteniamo risultati diversi.

6.5 Paradosso dell’asta nel granaio


L’ultimo paradosso che trattiamo è un paradosso molto simpatico e non ba-
nale, detto “paradosso dell’asta nel granaio” (che potremmo ribattezzare
più concretamente “paradosso dell’auto nel garage”). Esso è giocato sulla
contrazione delle lunghezze, anziché sulla dilatazione dei tempi.
Prendiamo un’asta (ovvero un √regolo) di lunghezza a riposo l0 = 10m,
che si avvicina con velocità v = 23 c (cosicché γ(v) = q 1 3c2 = 2) verso
1−
4c2
un granaio di lunghezza L = 5m (nel giudizio dell’osservatore terrestre). La
situazione è quella descritta nella figura 6.24.

6.5.1 Punto di vista della terra


Poniamoci sulla la terra (che supponiamo essere un osservatore inerziale).
L’asta ha lunghezza a riposo l0 = 10m e viaggia con una velocità v per cui
γ(v) = 2. La lunghezza relativa (nel giudizio della terra) è quindi contratta di
un fattore 2: L’osservatore terrestre, misurando la lunghezza dell’asta, trova
che essa è lunga esattamente 5m, come il granaio. Siano A e B i due estremi
dell’asta. Quando B raggiunge la parete del granaio, l’asta è interamente
contenuta in esso, e supponiamo quindi che l’osservatore terrestre chiuda la
porta del granaio.
Nel giudizio di tale osservatore gli eventi

• E1 : B raggiunge la parete posteriore del granaio,

• E2 : A raggiunge la porta d’ingresso del granaio

sono simultanei, e quindi l’asta è effettivamente contenuta nel granaio.


6.5. PARADOSSO DELL’ASTA NEL GRANAIO 115

Figura 6.24: Situazione del paradosso dell’asta nel granaio. Un regolo di


estremi A, B è in moto con velocità ~v verso un granaio di lunghezza L (nel
giudizio dell’osservatore terrestre).
116 LEZIONE 6. I PARADOSSI RELATIVISTICI

6.5.2 Punto di vista dell’asta


Ma anche l’asta è un osservatore inerziale: per il Principio di Relatività
c’è dunque completa simmetria tra i due osservatori.16 Dunque possiamo
descrivere simmetricamente la stessa situazione dal punto di vista dell’asta.
Un’asta di lunghezza l0 = 10m vede un granaio che le corre incontro a
una velocità v t.c. γ(v) = 2. Il granaio, nel giudizio dell’asta, ha quindi una
lunghezza contratta di 2, 5m. Ergo: l’asta non può entrare nel granaio.

6.5.3 Carattere paradossale e smascheramento


La situazione in questo caso è palesemente paradossale: secondo l’osservatore
terrestre l’asta entra (a filo) nel granaio, secondo l’osservatore solidale con
l’asta, assolutamente no, anzi, il granaio addirittura si accorcia. Il Princi-
pio di Relatività postula completa simmetria tra i due sistemi inerziali: che
significa allora questa apparente asimmetria? Che c’è una contraddizione
logica nello spaziotempo di Minkowski? O forse che abbiamo fatto un’analisi
un po’ affrettata e incompleta?
Naturalmente la risposta esatta è quest’ultima: abbiamo affrettato alcune
conclusioni e ci siamo completamente dimenticati di altri problemi. Analiz-
ziamo la faccenda più nel dettaglio. Il paradosso nasce sostanzialmente da
tre fatti:

(i) una sottovalutazione dell’importanza del concetto di simultaneità: la


simultaneità di eventi in luoghi distinti è sempre relativa;

(ii) una sopravvalutazione del concetto di rigidità: siamo abituati a pen-


sare ai regoli (o alle aste) come a corpi rigidi, di lunghezza invariabile.
Ma i corpi rigidi non possono esistere in relatività: a causa del carat-
tere limite della velocità della luce tutti i corpi sono deformabili. Si
presti attenzione: con questo “deformabili” non intendiamo riferirci al-
l’effetto della contrazione delle lunghezze17 , bensı̀ a un effetto di altro
tipo. Si prenda un regolo, e siano A e B i suoi estremi. Nel momento
in cui uno dei due estremi (supponiamo A) si mette in moto, l’altro
estremo B non può iniziare il suo movimento fintanto che non gli è
giunta l’informazione circa il fatto che A si è messo in moto. Ma que-
sta informazione viaggia a velocità finita, poiché la velocità di questo
16
In questo caso non è come nel paradosso dei gemelli, in cui uno dei due osservatori non
era a tutti gli effetti inerziale; qui entrambi gli osservatori sono completamente inerziali.
17
Pensare che un corpo rigido possa avere lunghezza diversa in moto potrebbe essere già
più intuitivo.
6.5. PARADOSSO DELL’ASTA NEL GRANAIO 117

segnale non può superare c. Dunque la lunghezza del regolo è sicu-


ramente variata, poiché il regolo si è deformato, “microcontratto” o
“microdilatato” a seconda che lo stiamo tirando (allontanando i due
estremi) o spingendo (avvicinando i due estremi).18 Tutti i corpi sono
quindi deformabili in relatività. La nozione di corpo rigido, per aver
senso, richiederebbe l’esistenza di un segnale che si propaga a velo-
cità infinita (la cosiddetta interazione istantanea a distanza che non è
possibile nello spaziotempo di Minkowski).19
(iii) una terminazione precoce dell’analisi del fenomeno: abbiamo seguito
infatti l’asta finché A entra nel granaio nel giudizio dell’osservatore
terrestre, ma non abbiamo affatto analizzato cosa accade successiva-
mente.
Quello che succede è rappresentato nel diagramma spaziotemporale di
figura 6.25.
Gli eventi E1 ed E2 rappresentano la posizione degli estremi dell’asta
nel giudizio terrestre quando B raggiunge la parete di fondo: il diagramma
mostra che in quel momento, per l’osservatore terrestre, l’asta è contenuta
nel granaio.
Nel giudizio dell’asta, di contro, quando B arriva alla parete, A si trova
in E3 : nel giudizio dell’asta sono gli eventi E1 ed E3 ad essere simultanei, e
non gli eventi E1 ed E2 . Il diagramma mostra che quando B raggiunge la
parete, l’asta è fuori dal granaio: E3 non ha infatti ancora raggiunto la linea
di universo del granaio, e quindi l’asta è inequivocabilmente fuori (e ciò è
compatibile con l’analisi precedente, secondo cui l’asta era fuori dal granaio
per ben 7, 5m). L’evento E2 è quindi posteriore all’evento E1 nel giudizio di A.
Ci chiediamo: di quanto è posteriore? Usiamo la condizione di simultaneità di
E2 con E1 rispetto all’osservatore terrestre. Dalle trasformazioni di Lorentz
abbiamo infatti che
c∆tasta = γ(v)(c∆tterra − β(v)∆xterra ) = −γ(v)β(v)L,
18
Ribadiamo per chiarezza che queste “microdilatazioni” e “microcontrazioni” sono in
realtà delle semplici deformazioni, che nulla hanno a che fare con la contrazione delle
lunghezze. Sono effetti di tipo diverso: se questa avviene tra due corpi inerziali in moto
relativo, quelle avvengono sempre, in generale, indipendentemente dal moto dei corpi in
questione; tirando un’asta, tale asta viene inevitabilmente deformata.
19
Per inciso: si noti che questo fatto ha conseguenze molto importanti e drastiche,
per certi versi. Ad esempio, ciò invalida il principio newtoniano di azione-reazione: tale
principio infatti prevede che a ogni “azione” corrisponda istantaneamente una “reazione”,
ma questa istantaneità è inevitabilmente persa in regime relativistico, dato che qualsiasi
segnale si propaga nello spazio e nel tempo con velocità finita, minore o uguale alla velocità
della luce. L’invalidità del principio di azione-reazione (cardine della meccanica classica)
non è affatto cosa da poco.
118 LEZIONE 6. I PARADOSSI RELATIVISTICI

Figura 6.25: Dopo l’urto con la parete del granaio (evento E1 ) la linea
di universo dell’estremo B dell’asta (in blu) va a coincidere con la linea di
universo della parete del granaio. Nel giudizio della terra, quando B è in E1 ,
l’estremo A si trova in E2 , quindi l’asta è (a filo) nel granaio. Nel giudizio
dell’asta, quando B è in E1 , A si trova in E3 , quindi abbondantemente fuori
dal granaio. La contraddizione, come si vede, è solo apparente, e data dal
fatto che nel giudizio dell’asta, l’evento simultaneo a E1 non è E2 , bensı̀ E3 .
Ma che cosa succede all’estremo A dopo che B ha urtato la parete?
6.5. PARADOSSO DELL’ASTA NEL GRANAIO 119

dove abbiamo usato il fatto che ∆tterra = ∆tterra (E1 , E2 ) = 0, proprio per la
simultaneità dei due eventi rispetto all’osservatore terrestre. L è la lunghezza
propria del granaio (cioè la distanza spaziale tra gli eventi simultanei E1 ed
E2 nel giudizio della terra. Abbaimo quindi immediatamente che

β(v) v
∆tasta = −γ(v) L = −γ(v)L 2 ,
c c

ove ∆tasta è l’intervallo di tempo tra E1 ed E2 per un generico osservatore


inerziale che non vede i due eventi simultanei, L è la distanza propria dei
due eventi (rispetto cioè all’osservatore inerziale che li vede simultanei) e v
è la velocità relativa tra questi due osservatori inerziali. L’estremo A dell’a-
sta, dopo che B ha raggiunto la parete, deve quindi viaggiare ancora ∆tasta
secondi per raggiungere la porta.
Ora, se l’asta AB fosse rigida, quando B urta la parete e si ferma, anche
A dovrebbe istantaneamente arrestarsi, e quindi il grafico di ciò che accade
dovrebbe essere quello riportato in figura 6.26.

Figura 6.26: Se l’asta fosse rigida, non appena B urtasse la parete del gra-
naio, anche A si fermerebbe (rispetto alla terra), e tutti i punti dell’asta di-
venterebbero istantaneamente (nel giudizio dell’asta) in quiete relativa rispetto
alla terra. L’asta non entrerebbe nel granaio. Ma cosı̀ non può essere.
120 LEZIONE 6. I PARADOSSI RELATIVISTICI

Perciò l’asta non potrebbe entrare dalla porta, e da qui il paradosso. Si


esce dal paradosso poiché l’asta non può essere rigida: quando B urta la
parete, manda un segnale (la cosiddetta onda di shock ) che raggiunge mano
a mano tutti gli altri punti dell’asta. Ma questo segnale viaggia con velocità
finita, di sicuro non maggiore di c; dunque impiegherà un tempo finito a
pervenire a ciascun punto dell’asta. Fin quando a un certo punto dell’asta non
arriva l’informazione dell’onda di shock, tale punto continua a viaggiare di
moto rettilineo uniforme, onde fermarsi bruscamente quando l’informazione
sullo stop gli giunge. Il grafico dello spaziotempo relativisticamente corretto
è dunque riportato in figura 6.27.

Figura 6.27: L’asta non è rigida: l’informazione che B si è fermato (l’onda


di shock ) viaggia a velocità finita minore di c (quindi all’interno del cono
luce). Dunque raggiunge tutti i punti dell’asta in un certo tempo non nullo.
Quando l’onda di shock raggiunge l’estremo A, l’asta è già abbondantemente
nel granaio.

È chiaro dalla figura che, dato che l’onda di shock arriva alla porta del
granaio in un tempo successivo al tempo ∆tasta , non solo l’asta entrerà nel
granaio, ma ci sarà ancora un po’ di spazio residuo nel granaio, poiché l’asta
non occuperà il granaio nella sua interezza: urtata la parete B, l’asta si defor-
6.5. PARADOSSO DELL’ASTA NEL GRANAIO 121

merà sino a lasciare altro spazio nel granaio. Si noti che questo è vero sia nel
giudizio dell’osservatore terrestre, sia nel giudizio dell’osservatore sull’asta.
122 LEZIONE 6. I PARADOSSI RELATIVISTICI
Lezione 7

Quadrivettori e meccanica

Abbiamo analizzato e smascherato alcuni tra i più famosi paradossi della


Relatività Ristretta; riprendiamo ora le fila del discorso. In base al Principio
di Relatività tutti gli osservatori sono equivalenti. Questo implica che le
leggi della fisica devono avere la stessa forma in tutti i riferimenti inerziali
(cosiddetta invarianza in forma).
Il problema è che le leggi di Newton sono, in forma per trasformazioni di
Galileo, non sono affatto invarianti in forma per trasformazioni di Lorentz.
Quindi non verificano la condizione posta dal Principio di Relatività: il pro-
blema base della meccanica relativistica è dunque quello di modificare (senza
stravolgere) le equazioni di Newton, per renderle compatibili con il Principio
di Relatività (ossia per renderle invarianti in forma rispetto a trasformazioni
di Lorentz), in modo tale che per vc → 0 si ottengano nuovamente le equazioni
di Newton (condizione del limite classico).

7.1 Innalzamento
Il metodo più semplice per risolvere questo problema è di formulare le leggi
della meccanica senza far ricorso alla nozione di osservatore inerziale e uti-
lizzando solamente la struttura geometrica dello spaziotempo di Minkowski.
Si tratta quindi di innalzare 1 lo studio del moto dallo spazio relativo di un
osservatore (spazio quoziente) allo spaziotempo M . In sintesi: abolizione
degli osservatori inerziali, innalzamento dell’analisi.
1
Questo vocabolo “innalzare” è una traduzione approssimativa del verbo inglese che
tipicamente è usato in letteratura: il verbo “to lift”. In questo significato particolare, tale
verbo risulta quasi intraducibile: esso esprime proprio il passaggio dallo studio di un moto
nello spazio quoziente allo studio del moto in tutto lo spaziotempo. L’“innalzamento”
corrisponde in sostanza a una sorta di antiproiezione.

123
124 LEZIONE 7. QUADRIVETTORI E MECCANICA

Lo strumento base per realizzare questo programma è la teoria dei 4-vettori


(cioè dei quadrivettori2 ) dello spaziotempo di Minkowski. Partiamo dal con-
fronto tra la descrizione relativa (ad un osservatore) e la descrizione assoluta
del moto di una particella, riassunto in figura 7.1.

Figura 7.1: Descrizione relativa (a sinistra) e descrizione assoluta (a destra)


del moto di una particella. Preso un osservatore A, il moto di una particella
sullo spazio quoziente SA è descritto da una curva parametrizzata con il tempo
relativo t. Da un punto di vista assoluto, il moto è una linea di universo del
genere tempo e l’unico parametro a disposizione è il tempo proprio τ .

• Nella descrizione assoluta il moto di una particella è una linea di uni-


verso Q(τ ) del genere tempo, parametrizzata mediante il tempo pro-
prio. Infatti il tempo proprio è l’unico strumento che abbiamo a di-
sposizione3 , nonché il più naturale: teniamo infatti conto che il tempo
proprio, nella geometria di Minkowski, è una lunghezza d’arco. Come
è uso comune nella geometria euclidea, anche qui stiamo quindi para-
metrizzando la curva mediante il suo parametro arco (a meno di un
fattore c), cioè il tempo proprio.
• Nella descrizione relativa ad un osservatore, invece, il moto di una par-
ticella (che per definizione è la “variazione della posizione nel tempo”)
2
Scriveremo 4-vettori per designare appunto i quadrivettori.
3
E dato che per la (6.10) l’intervallo spaziotemporale misurato dall’osservatore di quiete
istantanea è ds2 = −c2 dτ 2 , dall’invarianza di ds2 segue l’invarianza di dτ 2 .
7.2. VELOCITÀ 125

è una linea P (t) nello spazio relativo all’osservatore4 parametrizzata


mediante il tempo relativo t associato all’osservatore.

Il primo passo per passare dallo spazio relativo allo spazio assoluto è di
collegare le due descrizioni. Si utilizza l’interpretazione geometrica di un
osservatore come tetrade nello spaziotempo. Fissata un origine, infatti, la
struttura vettoriale dello spaziotempo ci permette di scrivere che

Q(τ ) = x(t)I~ + y(t)J~ + z(t)K


~ + ctL
~ = P (t) + ctL.
~ (7.1)

Cioè: la curva P (t) sullo spazio quoziente è la proiezione spaziale della


linea di universo Q(τ ), la quale però ha anche una coordinata in più, quella
temporale.

7.2 Velocità
Se seguiamo la descrizione relativa, siamo portati a introdurre la velocità
relativa
dP (t)
~v := .
dt
Se invece seguiamo la descrizione assoluta, siamo portati ad introdurre la
velocità assoluta (o 4-velocità5 ) della particella

dQ(τ )
V~ := .

Nella geometria dello spazio di Minkowski, questa 4-velocità ha il significato
di versore tangente alla linea di universo della particella 6 , dal momento che
τ è il parametro arco della curva.
Possiamo derivare rispetto al parametro arco τ la formula (7.1), che lega
la descrizione relativa a quella assoluta, ottenendo che

dQ(τ ) d ~ = d (P (t) + ctL)


~ · dt = γ(v)(~v + cL),
V~ = = (P (t) + ctL) ~
dτ dτ dt dτ
4
Cioè nello spazio quoziente rispetto alle linee di universo dell’osservatore, spazio che
si può identificare con la piattaforma spaziale dell’osservatore, ossia con l’ortogonale alla
linea di universo dell’osservatore.
5
Analogamente a prima: questo si leggerà “quadrivelocità”. Utilizzeremo sempre le
lettere minuscole per gli enti nello spazio relativo, le lettere maiuscole per i corrispettivi
enti nello spaziotempo di Minkowski.
6
Sempre a meno di un fattore c; ma non c’è nessun problema a identificare un vettore
a norma costante con il versore tangente.
126 LEZIONE 7. QUADRIVETTORI E MECCANICA

Figura 7.2: 4-velocità e velocità relativa in uno spazio di Minkowski


bidimensionale.

dove l’ultimo passaggio vale per il fatto che, come mostrato in figura 7.3,
dt = dτ · cosh θ, da cui
dt
= cosh θ = γ(v). (7.2)

Ricaviamo quindi che

V~ = γ(v)(~v + cL).
~ (7.3)

E se precedentemente P (t) era la componente spaziale di Q(τ ), vediamo


che ora ~v non è propriamente la componente spaziale di V~ , poiché differisce da
questa per il fattore di dilatazione di Lorentz. Questo fatto è una conseguenza
della decisione di parametrizzare Q(τ ) con il tempo proprio (unico tempo a
disposizione, se non vogliamo introdurre alcun osservatore) e P (t) con il
tempo relativo.
Possiamo renderci conto della necessità del fattore γ(v) nella (7.3) calco-
lando la norma di V~ in due modi distinti. Dalla definizione di V~ ricaviamo
che 2
kdQ(τ )k2 ds2

kdQ(τ )k
kV~ k =
2
= = = −c2 ,
dτ dτ 2 dτ 2
ove la penultima uguaglianza vale poiché la norma di dQ è la metrica ds2 e
l’ultima uguaglianza vale perché ds2 = −c2 dτ 2 per la (6.10). Si noti che la
norma di V~ è negativa, poiché V~ è un vettore del genere tempo.
7.2. VELOCITÀ 127

Figura 7.3: Relazione tra dt e dτ .

D’altro canto, possiamo anche scrivere che

kV~ k = V~ · V~ = γ 2 (~v + cL)(~


~ v + cL)
~ =

~ + c2 L
~ · L)
~ = γ 2 (v 2 − c2 ) = c2
= γ 2 (~v · ~v + 2c~v · L 2 2
(v 2 − c2 ) = −c2 ,
c −v
(7.4)

dove abbiamo usato il fatto che ~v ⊥ L ~ (cioè ~v · L


~ = 0, visto che ~v è legato
alla piattaforma spaziale, mentre L ~ è legato all’asse temporale) e il fatto che
~ ·L
L ~ = −1.
Notiamo quindi che il fattore γ(v) è essenziale per continuare ad avere un
vettore a norma costante (a meno di un fattore c possiamo dire - e diremo
a tutti gli effetti - che V~ è un versore7 ). A causa di questo fattore γ(v)
la relazione tra velocità relativa ~v e 4-velocità V~ è altamente non lineare.
Tale non linearità è tuttavia proprio quella necessaria a rendere semplice la
legge di composizione delle velocità. Mostriamo la superiorità del punto di

7
I fattori c spesso sono un inutile e fastidioso impiccio quando si trattano questi argo-
menti. Non è raro infatti trovare in letteratura frasi come “Poniamoci in un riferimento
per cui c = 1”, al fine di evitare inutili complicazioni nei conti. D’altro canto tale fattore c
non è perso, poiché può sempre essere reintrodotto nelle equazioni mediante ragionamenti
dimensionali.
128 LEZIONE 7. QUADRIVETTORI E MECCANICA

vista assoluto rispetto a quello relativo studiando, per l’appunto, la legge di


composizione delle velocità.8

7.2.1 Punto di vista relativo


Prendiamo due osservatori inerziali che studiano il moto della stessa parti-
cella. Essi daranno una descrizione mediante le funzioni, rispettivamente,
(x(t), y(t), z(t)) e (x0 (t0 ), y 0 (t0 ), z 0 (t0 )) (ciascuno utilizzerà il proprio tempo t).
Sia u la velocità relativa tra i due osservatori, che supponiamo (al solito) in
moto lungo il comune asse delle x - di modo da poter operare trasformazioni
di Lorentz speciali. Le velocità della particella rispetto a questi osserva-
tori saranno, rispettivamente, v = (vx , vy , vz ) e v 0 = (vx0 , vy0 , vz0 ). Il nostro
problema, ora, è trovare le formule che legano queste due terne di numeri.
I due osservatori sono collegati da una trasformazione di Lorentz speciale
(ipotesi sul moto relativo) di parametro u; dunque vale
 0

 ct = γ(u)(ct − β(u)x)
 0
x = γ(u)(x − β(u)ct)
.

 y0 = y
 0
z =z
Dunque, differenziando, otteniamo che


 cdt0 = γ(u)(cdt − β(u)dx)
 0
dx = γ(u)(dx − β(u)cdt)
0 ,

 dy = dy
 0
dz = dz
e quindi, per divisione membro a membro,
dx0

0 dx − β(u)c · dt vx − u

 v x 0 = = =
dt0 dt − β(u) 1 − uv x



 c
dx c2
0
dy 1 dy 1 vy


[2pt]vy0 0 = 0 = = . (7.5)
dt γ(u) dt − β(u)
dx γ(u) 1 − uvc2
x
c


dz 0 1 dz 1 vz


0
[2pt]v = = =


z 0
0 β(u) γ(u) 1 − uv

 dt γ(u) dt − dx c2
x
c

Osserviamo che il ruolo privilegiato della x nelle tre equazioni è dovuto


al fatto che il moto avviene lungo l’asse delle x.9
8
Abbiamo già studiato la legge di composizione delle velocità longitudinali ai para-
grafi 2.3.3 e 5.1. Qui la studiamo nuovamente da un punto differente e più in generale -
componiamo velocità qualsiasi, non solo velocità longitudinali.
9
In essa ritroviamo la formula ricavata in precedenza per le composizioni delle velocità
longitudinali (a megno del segno della velocità relativa u).
7.2. VELOCITÀ 129

Figura 7.4: Cambiare osservatore inerziale significa operare una rotazione


iperbolica nel piano dei vettori I~ e L
~ (supponendo i due osservatori in moto
relativo lungo il comune asse delle x).

Queste equazioni forniscono il teorema completo di composizione delle


velocità relativistiche. Sono formule di tipo proiettivo, ben lungi dall’essere
lineari.

7.2.2 Punto di vista assoluto


Da un punto di vista assoluto i due osservatori inerziali sono rappresentati da
due tetradi ortonormate nello spaziotempo di Minkowski. Nel caso speciale,
queste tetradi sono disposte come indicato in figura 7.4.
Le trasformazioni di Lorentz agiscono sulle tetradi nel seguente modo


 ~ = γ(u)(L
L ~ 0 − β(u)I~0 )
 ~
I = γ(u)(I~0 − β(u)L ~0)

,

 J~ = J~ 0
~ =K ~0

 K

con u velocità relativa tra i due osservatori.


Il 4-vettore V~ della linea di universo di una particella in moto rispetto ad
entrambi gli osservatori potrà essere scomposto sulle due tetradi, ovvero

V~ = Vx I~ + Vy J~ + Vz K
~ + Vt L
~ = Vx00 I~0 + Vy00 J~ 0 + Vz00 K
~ 0 + Vt00 L
~0,

e dunque possiamo associare a tale 4-vettore le sue componenti nel riferimento


considerato.
130 LEZIONE 7. QUADRIVETTORI E MECCANICA

Dalla legge di trasformazione della base si deduce immediatamente la


legge di trasformazione delle componenti, ovvero
 0
V 0 = γ(u)(Vt − β(u)Vx )
 t0


Vx0 = γ(u)(Vx − β(u)Vt )
, (7.6)

 Vy00 = Vy
 0
Vz0 = Vz

o, in equivalente forma matriciale,


 0   
Vt0 γ(u) −γ(u)β(u) 0 0 Vt
Vx00   −γ(u)β(u) γ(u) 0 0  Vx 
 
 0= .
Vy0   0 0 1 0  Vy 
0
Vz0 0 0 0 1 Vz

A differenza della legge di trasformazione delle velocità relative, questa


legge è lineare. Si dice che le componenti di V~ si trasformano con legge
lineare al cambiare dell’osservatore, o che V~ ha carattere vettoriale.

7.2.3 Confronto
Tenendo conto delle relazioni


 Vt = γ(v) · c
Vx = γ(v) · vx

(7.7)

 Vy = γ(v) · vy
Vz = γ(v) · vz

che derivano dalla relazione

V~ = γ(v)(~v + cL),
~

e delle analoghe relazioni nel sistema dell’osservatore primato


 0
V 0 = γ(v 0 ) · c
 t0

Vx0 = γ(v 0 ) · vx0 0

V 00 = γ(v 0 ) · vy0 0
 y0


Vz0 = γ(v 0 ) · vz0 0

che derivano, naturalmente, da

V~ 0 = γ(v 0 )(~v 0 + cL
~ 0 ),
7.2. VELOCITÀ 131

si vede immediatamente che il sistema (7.6) condensa il sistema (7.5), cioè lo


implica. Infatti da (7.6) otteniamo, sostituendo, che

γ(v 0 )c = γ(u)(γ(v)vt − γ(v)β(u)vx ) = γ(u)γ(v)(c − β(u)vx )




γ(v 0 )vx0 0 = γ(u)(γ(v)vx − γ(v)β(u)vt ) = γ(u)γ(v)(vx − β(u)c)


. (7.8)
 γ(v 0 )vy0 0 = γ(v)vy

γ(v 0 )vz0 0 = γ(v)vz

Dalla prima equazione si ricava la legge di trasformazione dei fattori γ,


cioè
γ(v 0 ) = γ(u)γ(v)(c − β(u)vx ), (7.9)

il che significa che, se v è la velocità relativa tra un osservatore e una parti-


cella e u è la velocità relativa tra l’osservatore e un altro osservatore, la ve-
locità relativa tra quest’ultimo osservatore e la particella sarà v 0 che verifica
l’equazione (7.9).
Dalle altre equazioni del sistema (7.8) si ottiene, dividendole per la prima,

vx0 0 vx − β(u)c vy0 0 1 vy − β(u) vz0 0 1 vz − β(u)


= , = , = .
c c − β(u)vx c γ(u) c − β(u)vy c γ(u) c − β(u)vz

e non ci vuole molto (basta moltiplicare per c) per vedere che esse sono
equivalenti a

vx − β(u)c vx − uc c vx − u

0

 v x0 = c = c− u vx =
c − β(u)vx 1 − uv x

 c

 c c2
1 1 vy 1 vy

 vy
vy0 0 = c = u =
 γ(u) c−β(u)vx
γ(u) c− c vx γ(u) 1 − uv
c2
x
 c
1 1 vz 1 vz


0 vz
 vz0 = c γ(u) c−β(u)vx = γ(u) c− uc vx = γ(u) 1 − uvx



c c2

cioè al sistema (7.5).


Dunque le trasformazioni “assolute” condensano quelle relative, ma hanno
un notevole ulteriore vantaggio: sono lineari omogenee nelle 4-velocità. In
altre parole, passando da ~v a V~ si linearizza la legge di trasformazione delle
velocità. Nello spaziotempo di Minkowski la velocità non è descritta da
un vettore nello spazio relativo dell’osservatore, bensı̀ da un 4-vettore del
genere tempo (e tale che kV~ k2 = −c2 ), tangente alla linea di universo della
particella, le cui componenti si trasformano con legge lineare al cambiare
dell’osservatore.
132 LEZIONE 7. QUADRIVETTORI E MECCANICA

7.2.4 Ricapitolazione
Ricapitoliamo quanto abbiamo fatto, per tirare le fila del discorso. Abbiamo
innanzitutto posto un problema: rendere le equazioni della dinamica compa-
tibili con il Principio di Relatività (questione fisica) cioè invarianti in forma
per trasformazioni di Lorentz (questione matematica).

Programma
Per risolvere questo problema abbiamo deciso di seguiere un metodo: scri-
vere le equazioni della dinamica indipententemente dalla scelta di un qua-
lunque osservatore inerziale, e quindi automaticamente invarianti in forma
per cambiamento di osservatore inerziale (ossia trasformazioni di Lorentz),
sfruttando a questo scopo la struttura geometrica dello spazio di Minkowski -
spazio affine quadridimensionale muito di una struttura semieuclidea di tipo
lorentziano, segnatura 3,1.

Primo passo
Il primo passo (sezione 7.1) nella realizzazione di questo programma è stato
quello di “innalzare” la descrizione del moto dallo spazio relativo ad un os-
servatore inerziale nello spaziotempo. Questo innalzamento si è basato su
due idee.
(i) La prima è banale: passare dalla traiettoria parametrizzata P (t) nello
spazio relativo, alla linea di universo nello spaziotempo.
(ii) La seconda è essenziale: parametrizzare la linea di universo con il tempo
proprio, che è l’unico parametro naturale (del genere tempo) che ab-
biamo a disposizione sullo spaziotempo, in assenza di osservatori iner-
ziali. È proprio l’introduzione e l’uso sistematico del tempo proprio è
l’aspetto qualificante della relatività!

Secondo passo
Il secondo passo (sezione 7.2) nella realizzazione del programma ha riguardato
le velocità. Siamo passati dalla velocità relativa
dP (t)
~v =
dt
(vettore nello spazio quoziente associato all’osservatore, ma non nello spa-
ziotempo) al 4-vettore velocità
dQ(τ )
V~ = ,

7.2. VELOCITÀ 133

Figura 7.5: Relazione tra spazio assoluto e spazio relativo per uno spazio-
tempo di Minkowski tridimensionale. L’innalzamento di una curva P (t) nello
spazio relativo corrisponde sostanzialmente a proiettarla su M3 e “attribuirle
un tempo”. Nello spazio relativo c’è il tempo relativo all’osservatore A (l’oro-
logio). Nello spazio assoluto non c’è nulla di tutto ciò: non ci sono più orologi,
ma c’è la metrica ds2 con la struttura causale data dai coni luce.
134 LEZIONE 7. QUADRIVETTORI E MECCANICA

che abbiamo visto avere carattere vettoriale (cioè: le sue componenti si tra-
sformano con legge lineare al cambiare dell’osservatore). Tale carattere vet-
toriale di V~ è una conseguenza del carattere invariante10 di dτ e del carattere
vettoriale di dQ: il rapporto tra un vettore e una quantità invariante11 rimane
un vettore, e ciò si manifesta nella scoperta della linearità nelle trasformazioni
di coordinate:
 0   
Vt0 γ(u) −γ(u)β(u) 0 0 Vt
Vx00   −γ(u)β(u) γ(u) 0 0  Vx 
 
 0= =
Vy0   0 0 1 0  Vy 
Vz00 0 0 0 1 Vz
  
cosh θ − sinh θ 0 0 Vt
 − sinh θ cosh θ 0 0  Vx 
=  .
 0 0 1 0  Vy 
0 0 0 1 Vz

Il carattere non vettoriale della velocità relativa ~v , simmetricamente, è


dovuto al carattere non invariante di dt (il quale si trasforma da osservatore
a osservatore con legge complicata) e si manifesta nella proiettività (in parti-
colare nella non linearità) delle leggi di trasformazione delle sue componenti,
che abbiamo trovato essere leggi di composizione delle velocità:
vx − u

 vx0 0 =
1 − uv

 x

 c2
1 vy


vy0 0 = .
 γ(u) 1 − uv c2
x

1 vz


0

 vz0 = γ(u) 1 − uvx


c2

A livello delle velocità, le descrizioni relativa ed assoluta sono legate dalla


formula12
V~ = γ(v)(~v + cL).
~
10
Difatti, dato che per la (6.10) ds2 = −c2 dτ 2 , dall’invarianza di ds2 segue l’invarianza
di dτ 2 , nel senso che tutti gli osservatori, concordando su ds2 , devono concordare anche
su dτ 2 .
11
Si può pensare all’analogia con il prodotto di un vettore per uno scalare.
12
In questa formula il fattore γ(v) è assolutamente essenziale, perché rende conto del
cambiamento di parametrizzazione. Inoltre si presti attenzione al fatto che l’argomento
v non è la velocità relativa tra due osservatori (non ci sono due osservatori, qui: ce ne
basta uno solo), ma semplicemente la velocità della particella nello spazio relativo ad un
osservatore, cioè il modulo del vettore ~v = dP ~
dt . Infine L è il versore unitario dell’asse
temporale dell’osservatore.
7.3. LEGGI DI MOTO 135

~ è il versore della linea di universo dell’osservatore scelto, che verifica


dove L

~ ·L
L ~ = −1,

dove ~v appartiene alla piattaforma spaziale dell’osservatore, e quindi

~ =0
~v · L

e dove γ(v) è il fattore di Lorentz essenziale per tenere conto del cambiamento
di parametrizzazione da t a τ .
Questa formula trasforma la legge di composizione delle velocità nella
legge di trasformazione lineare delle componenti di un quadrivettore.

7.3 Leggi di moto


7.3.1 Innalzamento delle leggi
Eccoci dunque al terzo passo: si tratta ora di innalzare le leggi di moto di
Newton13
d~p
p~ = m~v f~ = (7.10)
dt
in equazioni aventi la stessa struttura (cosiddetto principio di permanenza
del limite classico: per vc → 0 dobbiamo riottenere le equazioni di Newton
nella forma a noi nota) scritte però sullo spaziotempo, utilizzando solo la
struttura geometrica di tale spazio - e non la decomposizione relativa.
Vediamo di spiegare meglio la faccenda. Le leggi del moto di Newton sono
leggi nello spazio relativo all’osservatore. E finché rimaniamo nello spazio
newtoniano, gli enti p~ e f~ hanno a tutti gli effetti carattere vettoriale, poiché
la quantità dt mediante la quale essi sono definiti14 è invariante al cambiare
dell’osservatore. Ma nello spaziotempo di Minkowski questo non è più vero:
né p~ né f~ hanno più carattere vettoriale nello spaziotempo di Minkowski; essi
restano vettori dello spazio relativo ad un osservatore. Il fatto essenziale è
innalzare queste equazioni, scrivendole in forma assoluta nello spaziotempo.
L’idea più naturale è quella di postulare ancora il carattere invariantivo
della massa (ogni particella ha una sua massa indipentemente dall’osserva-
tore e tutti gli osservatori inerziali concordano sulla misura di tale massa) e
13
Rimaniamo fedeli al vecchio proposito di notare con caratteri minuscoli le grandezze
nello spazio relativo e con caratteri maiuscoli quelle nello spaziotempo. È chiaro, quindi,
che p~ sarà la quantità di moto “usuale” e che f~ sarà analogamente la forza con cui siamo
abituati ad avere a che fare, trattando le equazioni di Newton.
14
Anche p~ è definito mediante dt, essendo p~ = m~v = m dPdt(t)
136 LEZIONE 7. QUADRIVETTORI E MECCANICA

sostituire le relazioni precedenti con15

~
P~ = mV~ ~ = dP .
K (7.11)

Notiamo che P~ è il prodotto di uno scalare che, per il postulato precedente,


è invariante (la massa) e un 4-vettore, dunque è anch’esso un 4-vettore; ana-
logamente K ~ è il rapporto tra un 4-vettore16 dP~ e l’invariante dτ , dunque è
anch’esso un 4-vettore.
Il 4-vettore P~ è detto 4-vettore energia-momento (o quantità di
moto), mentre il 4-vettore K ~ è detto 4-vettore forza di Minkowski17 .
Il processo di innalzamento e di conquista dell’indipendenza dall’osserva-
tore inerziale si manifesta soprattutto nella sostituzione ovunque del tempo
relativo con il tempo proprio. È proprio tale processo che ci ha suggerito la
cosiddetta forma relativistica delle equazioni di moto:

dQ(τ ) ~
V~ := P~ = mV~ ~ = dP .
K (7.12)
dτ dτ

Possiamo riassumere il tutto nel piccolo schema in figura 7.6.

7.3.2 Ricerca dei legami


Il problema successivo è di legare i nuovi personaggi Q(τ ), V~ (τ ), P~ (τ ), K(τ
~ )
alla descrizione relativa fatta da un qualsiasi osservatore inerziale - in so-
stanza ora stiamo “scendendo” dal punto di vista assoluto a quello relativo.
Fissato un osservatore inerziale (cioè una tetrade), ogni 4-vettore potrà es-
sere decomposto su questa tetrade; in particolare potremo distinguere la sua
parte spaziale dalla sua parte temporale. Dunque gli enti assoluti potranno

15
Rompiamo la simmetria, e scriviamo K ~ in luogo di F~ per due ragioni: innanzitutto
perché la F maiuscola ci servirà in seguito per indicare il tensore di Faraday, e poi per
~ è infatti la nomenclatura usata da Minkowski nei suoi lavori.
ragioni storiche - K
16
Ci rendiamo conto che potrebbero sorgere conflitti di notazioni tra P (t) curva nello
spazio relativo e P~ 4-vettore nello spaziotempo. Per ovviare a tali ambiguità porremo
sempre la freccina di vettore sul secondo di questi due enti.
17
Per analogia dovremmo dire “4-vettore potenza-forza”, ma tale nomenclatura non è
comune e non la useremo.
7.3. LEGGI DI MOTO 137

~ devono
Figura 7.6: Relazioni tra gli enti assoluti introdotti. Sia Q(τ ) sia V
~
contribuire nella legge di forza per K.

essere scritti nella forma18


~


 Q(τ ) = P (t) + ct · L
~ ~

 V (τ ) = γ(v)(~v + c · L)



E ~ . (7.13)
P~ (τ ) = p~ + · L
c


 

 ~ ~ Π ~
 K(τ ) = γ(v) f + · L

c

Specifichiamo immediatamente che queste relazioni per noi hanno carat-


tere di definizioni : in questo modo stiamo definendo le componenti relative 19
rispetto ad un dato osservatore, rappresentato da L. ~ I membri di sinistra del
sistema (7.13) sono già stati introdotti, e sono intrinseci: ora stiamo ritor-
nando indietro! Stiamo ridefinendo il modo in cui chiameremo le componenti.
Ad esempio chiameremo posizione relativa P (t) la proiezione di Q(τ ) sullo
spazio relativo ad un osservatore, chiameremo E la componente temporale
del 4-vettore quantità di moto, moltiplicata per c, e cosı̀ via. Da ora in poi
si penserà che i quadrivettori Q(τ ), V~ (τ ), P~ (τ ), K(τ
~ ) siano definiti assioma-
ticamente come indicato dal diagramma in figura 7.6, e da essi si torna alla
descrizione relativa mediante il sistema (7.13).
L’unica cosa veramente importante nelle definizioni del sistema (7.13) è
la comparsa del fattore di Lorentz γ(v) in V~ (τ ) e in K(τ ~ ). Questa è stata
18
I vettori Q(τ ) e P (t) vanno intesi come punti (nello spazitempo o nello spazio relativo),
ma anche come vettore posizione - una volta introdotte due origini O e O0 .
19
Anche E e Π sono componenti relative, essendoci la presenza del vettore L, ~ cioè
dell’osservatore.
138 LEZIONE 7. QUADRIVETTORI E MECCANICA

una nostra scelta, ma una scelta assolutamente sensata, dato che questi due
personaggi sono definiti per derivazione, e dunque γ(v) serve per render conto
del passaggio dalla parametrizazione naturale con τ alla parametrizzazione
relativa con t.

7.3.3 Vincoli
Prima di analizzare il significato delle componenti dei 4-vettori, bisogna os-
servare che ognuno di essi soddisfa un vincolo, per cui le tre componenti
spaziali determinano univocamente la componente temporale. Insomma, le
quattro componenti di ciascun 4-vettore sono hanno in realtà tre gradi di
libertà, essendo esse legate da un vincolo. I vincoli derivano dall’equazione
(7.4), cioè dal fatto che il 4-vettore V~ ha il carattere di un versore tangente
alla linea di universo, cioè ha norma costante:
kV~ k2 = −c2 , (7.14)
che è già il vincolo sulla 4-velocità.
Di conseguenza abbiamo che
E ~ E2 ~ ~ E2
  
~ 2 E ~ E ~ 2 2
kP k = p~ + L p~ + L = p + 2 p~ · L + 2 L · L = p − 2 ,
c c c c c
~ e kLk
dove l’ultimo passaggio vale perché p~ ⊥ L ~ 2 = −1. D’altra parte, dalla
forma relativistica delle equazioni del moto sappiamo che P~ = mV~ , da cui
kP~ k2 = kmV~ k2 = m2 kV~ k2 = −m2 c2

ed eguagliando i risultati di questi due diversi modi di calcolo per kP~ k2


otteniamo
E2
p2 − 2 = −m2 c2 , (7.15)
c
che è il vincolo sulle componenti del 4-vettore quantità di moto.20
In particolare, anche P~ ha norma costante (questo deriva dal fatto che
P~ = mV~ e dal fatto che m ha carattere invariantivo, come postulato in
precedenza) pari a −m2 c2 . Dunque la derivata della sua norma si annullerà,
cioè
dkP~ k2 dP~ · P~
= = 0.
dτ dτ
20
In realtà già
kP~ k2 = −m2 c2
era già il vincolo cercato, abbiamo però voluto trovare un’importante relazione relativistica
calcolando in due diversi modi la norma del 4-vettore quantità di moto.
7.3. LEGGI DI MOTO 139

Ma per la regola di Leibnitz

dP~ · P~ dP~ ~ ~ dP~ dP~ ~


0= = ·P +P · =2 · P,
dτ dτ dτ dτ
~ ~ ~
e l’annullarsi di dPdτ·P forza l’annullarsi di ddτP · P~ = K
~ · P~ = K
~ · mV~ . In
definitiva, abbiamo che
~ · V~ = 0,
K (7.16)
cioè che (esplicitando il prodotto scalare, tenendo conto che gli unici termini
che “si salvano” sono il prodotto tra le parti spaziali e il prodotto tra le parti
temporali)
   
~ ~ ~ Π~ ~ 2 ~ Π ~ ~
K · V = γ(v) f + L γ(v)(~v + cL) = γ (v) ~v · f + cL · L =
c c
= γ 2 (v)(~v · f~ − Π) = 0,

e dunque
f~ · ~v = Π (7.17)
da cui deduciamo che la componente Π è a tutti gli effetti una potenza.
Questo è il vincolo sul 4-vettore forza di Minkowski.
Ci permettiamo di rimarcare il fatto che l’equazione (7.16) afferma che
K e P~ sono ortogonali, cioè lo sono K
~ ~ e V~ , il che è equivalente a dire che
K~ è ortogonale in ogni punto alla linea di universo della particella. Mentre
i vincoli su V~ e su P~ sono vincoli di costanza della norma, il vincolo su K ~ è
dunque un vincolo di ortogonalità.
Possiamo anche portare avanti un’analogia con la geometria tradizionale:
possiamo pensare a Q(τ ) come alla curva parametrizzata, a V~ (o equivalen-
temente a P~ ) come al versore tangente21 e a K ~ come al vettore curvatura, in
quanto sostanzialmente costruito con la derivata del versore tangente.

7.3.4 Forma relativa


Una volta introdotte le componenti relative (cioè: una volta “ritornati” alla
dipendenza da un osservatore) è facile scrivere le equazioni assolute della
dinamica relativistica in forma relativa. Dall’equazione assoluta P~ = mV~ ,
mediante la scrittura per componenti
E~ ~
p~ + L = mγ(v)(~v + cL)
c
21
Sempre a meno di una costante: intenderemo sempre per versore tangente un vettore
tangente a norma costante.
140 LEZIONE 7. QUADRIVETTORI E MECCANICA

Figura 7.7: Situazione dei 4-vettori V ~ , P~ , K.


~ I primi due hanno il carattere
di versori tangenti, a norma costante, del genere tempo. L’ultimo è un vettore
del genere spazio, ortogonale ai precedenti.

Figura 7.8: Vincolo sulle componenti di P~ (a sinistra) e vincolo di


ortogonalità tra P~ e K
~ (a destra).
7.3. LEGGI DI MOTO 141

si ricavano immediatamente le cosiddette equazioni di Einstein:

p~ = mγ(v)~v , (7.18)

??E = mγ(v)c2 . (7.19)

La componente spaziale di P~ viene detta quantità di moto relativa. La


prima equazione è dunque la definizione relativistica della quantità di moto
relativa. Esplicitando il fattore γ(v) e sviluppando in serie abbiamo che
− 21
v2 1 v2
  
p~ = mγ(v)~v = m~v 1 − 2 = m~v 1 + 2 + . . . = m~v + O(β 2 ).
c 2c

Dunque la definizione di p~ è ben posta, poiché soddisfa il principio di limite


classico (per β → 0 infatti p~ → m~v ).
La componente temporale E è detta energia relativa della particella.
Esplicitando γ(v) e sviluppando in serie in modo analogo a quanto fatto in
precedenza, troviamo che
− 12
v2 1 v2
  
2 2 2 1
p~ = mγ(v)c = mc 1− 2 = mc 1 + 2 + ... = mc2 + mv 2 +O(β 4 ).
c 2c 2

Questo risultato è fondamentale. Abbiamo scritto infatti la componente


E come somma di un termine costante mc2 , dell’energia cinetica classica
1
2
mv 2 e di un termine che va a zero per β → 0. Facciamo quindi qualche
osservazione.

1. Nel limite classico, a meno di una costante additiva, E restituisce l’e-


nergia cinetica della particella, a meno di correzioni del 4◦ ordine in β.
Questo giustifica il nome di “energia” dato ad E.

2. Tutte le energie classiche sono definite a meno di una costante addi-


tiva 22 . Ciò è dovuto al fatto che solitamente le energie sono introdotte
come potenziali di un campo conservativo, con formule del tipo

F~ · dP~ = dU,
22
Questo è chiaro per il potenziale di un campo conservativo (come il campo gravita-
zionale terrestre), è meno chiaro per energie quali l’energia cinetica, per la quale siamo
più propensi a porre automaticamente la costante additiva a zero. Ma tutta la meccanica
classica sta perfettamente in piedi definendo ogni energia (anche quella cinetica) a meno
di una costante additiva.
142 LEZIONE 7. QUADRIVETTORI E MECCANICA

per cui il potenziale (e quindi l’energia) è sempre definita a meno di


una costante. Classicamente, importano solo le differenze di energia, i
salti di energia.23

3. L’energia relativistica è invece definita univocamente, non c’è dunque


l’ambiguità della scelta di una costante arbitraria. La scoperta che
l’energia non è solamente un potenziale, ma è soprattutto la compo-
nente temporale di un quadrivettore fissa univocamente la costante ad-
ditiva, obbligandola a coincidere con la cosiddetta energia di massa
a riposo:
E0 = mc2 . (7.20)

La profonda differenza, il discrimine, tra meccanica classica e mecca-


nica relativitica (conenuta nel principio della formulazione 4-vettoriale
della dinamica) è che energia e quantità di moto sono legate dal fatto di
essere componenti di un quadrivettore: non c’è più alcuna arbitrarietà
possibile!

4. Alla stessa conclusione si arriva ricordando il vincolo (7.15) sul 4-vettore


2
P~ : da Ec2 − p2 = m2 c2 otteniamo che
p
E=c m2 c2 + p2 (7.21)

e dunque E è univocamente determinato nota che sia p. Per p = 0, E


non si annulla (altrimenti sarebbe violato il vincolo sulla norma di P~ ),
ma assume il valore di energia di massa a riposo E0 = mc2 .

7.3.5 Il 4-vettore energia-momento


L’introduzione del concetto di 4-vettore energia-momento (o quantità di
moto) ha portato alla fusione di tre concetti (massa, quantità di moto ed
energia), noti dalla fisica classica e fra loro correlati ma senza comporre un
unicum, in un unico ente. Abbiamo quindi visto che massa, energia e quantità
di moto possono essere definite a partire da questo ente nel modo seguente24 :

• massa: norma del 4-vettore energia-momento (che è invariante, per


quanto già visto);
23
Si pensi ad esempio a una persona che tocchi un filo della luce: se il potenziale del filo
equivale al potenziale della terra, per quanto grandi possano essere questi potenziali, non
accadrà nulla. Ciò che conta è la differenza di potenziale (ddp).
24
Si intende sempre a meno di fattori c; oppure, nuovamente, possiamo metterci in un
sistema di riferimento di modo che c = 1.
7.3. LEGGI DI MOTO 143

Figura 7.9: Il 4-vettore impulso P~ . Se c = 1, m è esattamente la norma di


P~ (a meno del segno che, ovviamente, è negativo per un vettore del genere
tempo); la quantità di moto relativa p e l’energia relativa E sono poi le sue
proiezioni rispettivamente sulla piattaforma spaziale e sull’asse dei tempi.

• quantità di moto: componente spaziale del 4-vettore energia-momento;

• energia: componente temporale del 4-vettore energia-momento (e que-


sta è la parte dirompente della teoria einsteiniana: l’energia non è più
uno scalare, è la quarta componente).

Ciò che deve rimanere saldo è che massa, energia e quantità di moto sono
solo aspetti differenti di un unico ente intrinseco, il vettore P~ .

7.3.6 Particelle a massa nulla


Notiamo anche questo fatto: se la massa è la norma di un 4-vettore, d’ora in
poi non ci sarà nulla di strano nel parlare di particelle a massa nulla, proprio
come non c’è nulla di strano nel parlare di vettori a norma nulla. Tali par-
ticelle di massa nulla, potranno però comunque avere energia e quantità di
moto: infatti la nostra norma discende da un prodotto scalare non definito
positivo, dunque in generale kwk ~ 2 = 0 non implica affatto che w ~ = 0. Tut-
tavia, questo implica però che w ~ sia un vettore del genere luce, e quindi tro-
viamo che tutte le particelle a massa nulla devono necessariamente viaggiare
alla velocità della luce (ad esempio i fotoni).
144 LEZIONE 7. QUADRIVETTORI E MECCANICA

Alternativamente, se introduciamo m = 0 nell’equazione (7.15) del vin-


colo per P~ , abbiamo che
E2
p2 − 2
= −m2 c2 = 0,
c
cioè che
E = pc, (7.22)
e notando che
E
p~ = mγ(v)~v = ~v
c2
troviamo che
c2
~v = p~, (7.23)
E
espressione interessante e utile, che (passando ai moduli) nel caso in cui
E = pc ci restituisce
v = c,
e ritroviamo che ogni particella di massa nulla deve muoversi alla velocità
della luce. È dunque possibile avere particelle di massa nulla, e sono quelle
per cui la parte temporale del 4-momento (l’energia) deve eguagliare la parte
spaziale, cioè quelle per cui vale la (7.22).
Ancora diversamente, possiamo notare che nella (??) si può avere massa
nulla ed energia non nulla se e solo se γ(v) = +∞, il che accade per v = ±c.

7.3.7 Trasporto di massa mediante fotoni


Un fatto curioso e interessante, conseguenza di quanto appena trovato, è
chiarito da un piccolo esperimento mentale.
Consideriamo una scatola di lunghezza L e massa M , posata a riposo su
una superficie liscia, senza attrito (fig. ()). Supponiamo che un fotone di
energia E  mc2 sia emesso dall’estremità sinistra della scatola e assorbito
dall’altra estremità.
Sappiamo dalla (7.22) che un fotone porta con sé una quantità di moto
pari a p = Ec : per la conservazione della quantità di moto, dunque, la scatola
dovrà scivolare leggermente verso sinistra, con una velocità v data da
E
mv = − ,
c
che traduce la semplice conservazione della quantità di moto.
Quando il fotone viene assorbito dall’estremità destra, analogamente, per
conservazione del momento, la scatola dovrà fermarsi. Intanto, però, la sca-
tola ha percorso una certa distanza ∆x 6= 0 verso sinistra: dato che le forze
7.3. LEGGI DI MOTO 145

associate con l’emissione e l’assorbimento del fotone sono completamente in-


terne alla scatola, ci aspettiamo che il centro di massa del sistema non si
sia mosso, e dunque necessariamente il fotone deve avere portato con sé una
qualche massa µ da un’estremità all’altra della scatola.
Questo non significa affatto che il fotone abbia massa (la massa a riposo
del fotone è nulla), ma significa solamente che quando esso esso è emesso
l’emettitore perde una piccola quantità ∆m di massa, e quando il fotone
viene assorbito l’oggetto assorbente incrementa la sua massa esattamente di
∆m.

7.3.8 La 4-forza di Minkowski


A differenza dei 4-vettori V~ e P~ , che sono del genere tempo (perché tangenti
~ è del genere
alla linea di universo della particella), la 4-forza di Minkowski K
spazio, poiché è ortogonale alla linea di universo della particella - come ci
mostra l’equazione (7.16) e la figura 7.7.
Analizziamo il significato delle componenti relative di K ~ in un generico
sistema inerziale. Nel sistema (7.13) abbiamo scritto che
 
~ = γ(v) f~ + L Π ~ ,
K
c

ove l’unica idea sta nel fatto che, proveniendo K ~ da una derivazione rispetto
al tempo proprio e volendo interpretare le sue componenti nel tempo re-
lativo dell’osservatore inerziale, conviene introdurre nella definizione delle
dt
componenti il fattore di conversione γ(v) = dτ dal tempo proprio al tempo
relativo.
Riscalato cosı̀ il tempo, a meno del fattore γ(v) possiamo dare le seguenti
definizioni.

• forza relativa: componente spaziale della 4-forza di Minkowski;

• potenza relativa: componente temporale della 4-forza di Minkowski.

La spiegazione di queste definizioni sta nella decomposizione della legge


di moto (che porta a interpretare f~ come l’analogo della forza newtoniana,
almeno nel limite classico) e nel vincolo (7.16) di ortogonalità.
Infatti, tenendo conto che P~ = p~ + EC
~ dalla legge di moto abbiamo che
L,

dP~
 
~ ⇒ d~
p 1 dE def ~ Π
~ = γ(v) f + L~
=K + L
dτ dτ c dτ c
146 LEZIONE 7. QUADRIVETTORI E MECCANICA

dτ 1
e dunque moltiplicando per dt
= γ(v)
m

d~p 1 dE ~ Π~
+ L = f~ + L,
dt c dt c
ed eguagliando componente spaziale e temporale, ricaviamo che

d~p dE
= f~, = Π, (7.24)
dt dt

da cui segue il significato dato a f~ di forza relativa.25


Inoltre dall’ortogonalità abbiamo visto che

~ = 0 ⇒ ~v · f~ − Π = 0,
V~ · K (7.25)

da cui segue il significato dato a Π di potenza.


Infine dalla seconda equazione delle (7.24) segue l’interpretazione di E
come energia.

7.3.9 Significato dell’ortogonalità


Quale significato profondo ha il fatto che K ~ e V~ siano ortogonali? Significa
che la 4-forza di Minkowski non può non dipendere dalla velocità! In un certo
senso, K~ deve adattarsi alla linea di universo, restando sempre ortogonale alla
tangente; per far ciò dovrà necessariamente dipendere dal versore tangente.
In particolare, tutte le 4-forze dipenderanno dalle 4-velocità.

7.3.10 Schema riassuntivo


Riassumiamo i legami tra le grandezze assolute e relative nello schema rias-
suntivo riportato in figura 7.10.

7.4 Scrittura delle 4-forze


Affinché l’equazione
dQ ~
=K

25
Si presti attenzione: f~ non è la forza newtoniana! f~ varia da osservatore a osservatore:
soltanto per piccole velocità (in particolare nel limite classico) avrà senso confrontare f~ con
la forza newtoniana. In particolare avrà senso farlo per l’osservatore di quiete istantanea.
7.4. SCRITTURA DELLE 4-FORZE

Figura 7.10: Schema riassuntivo tra le grandezze della cinematica.


147
148 LEZIONE 7. QUADRIVETTORI E MECCANICA

~ è necessario
sia un’effettiva equazione di moto26 e non solo la definizione di K
che K~ sia data esplicitamente, da specifiche leggi di forza, in funzione della
posizione Q(τ ) e della 4-velocità27 V~ (τ ) e inoltre in funzione di assegnati
campi esterni 28 (come ad esempio il campo elettromagnetico) che precisino
la situazione ambientale in cui la particella si muove.
Per il vincolo di ortogonalità (7.16), per conoscere K ~ basterà conoscere
la funzione
f~(P, ~v )

che descrive la forza relativa nel riferimento inerziale. Infatti la componente


temporale sarà poi automaticamente dedotta dal vincolo.
Per procurarci tale funzione (che non è invariante, ma varia al variare del-
l’osservatore) si usa il metodo degli osservatori di quiete istantanea. In ogni
punto della linea di universo della particella, il 4-vettore V~ definisce un osser-
vatore inerziale rispetto al quale la particella è istantaneamente in quiete.29
Rispetto a questo osservatore possiamo ammettere (cioè lo postuliamo) che
valga la legge di forza classica (che valgano le leggi di Newton). Dato che la
potenza in questo riferimento è nulla30 e dato che la velocità relativa è nulla
(v = 0 ⇒ γ(v) = 1), la 4-forza di Minkowski si scriverà come
 
~ = 1 · f~Newton + 0 · L
K ~ oqi = f~Newton . (7.26)

~ in un qualsiasi altro riferimento si utilizza


Per avere l’espressione di K
poi la legge di traformazione al cambiare dell’osservatore. K~ si trasforma

~
26
Se definiamo K ~ := dQ
dτ , poi come diavolo facciamo a usare questa definizione come
equazione? Non possiamo, essa resta ovviamente una definizione; possiamo sfruttare tale
uguaglianza solo nel momento in cui K ~ viene precisato in un altro modo, mediante una
legge di forza.
27
Abbiamo visto nella sezione 7.3.9 che questa dipendenza è necessaria.
28
Non possiamo studiare la meccanica come interazione a distanza. Classicamente tra
due particelle si sviluppa un’interazione istantanea; questo non è più vero in relatività.
Dobbiamo ricorrere al concetto di campo. In sostanza, in relatività, non si può parlare
di dinamica senza fare riferimento alla teoria dei campi - il che è un serio problema alle
fondamenta della meccanica.
29
Cioè l’osservatore la cui linea di universo sarà la tangente alla linea di universo della
particella.
30 ~ oqi il versore dell’asse temporale delll’osservatore di quiete istantanea,
Infatti, detto L
~ oqi ha la direzione di V
L ~ , e dunque anche ~v ha la direzione di V~ . Dato che K
~ ⊥V ~, K
~ non
~
può avere componenti lungo L, da cui l’annullarsi della potenza.
7.5. PARTICELLE SOGGETTE A FORZA COSTANTE 149

Figura 7.11: Per l’osservatore di quite istantanea A, la 4-forza di Minkowski


~ eV
coincide con la forza di Newton, per il vincolo di ortogonalità tra K ~.

infatti come un 4-vettore, seguendo dunque la legge



 Kt = γ(v) (Kt0 − β(v)Kx0 )

Kx = γ(v) (Kx0 − β(v)Kt0 )

,

 Ky = Ky 0
Kz = Kz 0

ove v è la velocità relativa tra osservatore e particella31 e (Kx0 , Ky0 , Kz0 , Kt0 )
sono le componenti della 4-forza nel riferimento istantaneamente comobile
con la particella, ovvero


 Kt0 = 0 


 x0
 K = ~
f Newton
x
.

K y = ~Newton
f
 0


  y
 Kz = f~Newton

0
z

7.5 Particelle soggette a forza costante


Applichiamo questo procedimento per studiare il moto di una particella sog-
getta a forza costante - l’analogo della caduta dei gravi. Dato che la mi-
31
Più precisamente v è la velocità relativa tra un certo osservatore e l’osservatore di
quiete istantanea con la particella; ma la velocità relativa tra quest’ultimo osservatore e
la particella è nulla, e dunque mediante la legge di composizione delle velocità abbiamo
che v è anche la velocità tra l’osservatore scelto e la particella.
150 LEZIONE 7. QUADRIVETTORI E MECCANICA

sura della forza dipende dalla scelta dell’osservatore inerziale (la forza non
è più una grandezza assoluta, come nella meccanica newtoniana), bisogna
innanzitutto precisare che cosa si intende per “forza costante”.
Diremo che una particella è soggetta a forza costante se è costante la
componente spaziale f della 4-forza K ~ in ogni riferimento di quiete istanta-
nea.
Per comodità di notazione, introduciamo un nuovo ente, la 4-accelerazione
~
A definita come

~ ~ ~ ~
~ := K = 1 dP = 1 d(mV ) = dV .
A
m m dτ m dτ dτ

Sotto l’azione di una forza costante nel riferimento di quiete istantanea, A ~


~ in particolare non avrà componente lungo l’asse
avrà la stessa direzione di K,
dei tempi e si potrà scrivere come

~ ~
~ = K = f = ~a,
A
m m

intendendo con
d~v
~a =
dt

l’accelerazione relativa. Naturalmente f è costante in ogni riferimento di


quiete istantanea se e solo se è costante f~ · f~, cioè se e solo se è costante
~a · ~a = a2 . Ne segue che
~ 2=A
kAk ~·A
~ = a2

in un moto a forza costante deve essere costante.


Dunque la proprietà caratteristica di un moto a forza costante è che la 4-
accelerazione, pur variando da istante a istante, mantiene norma costante32
(v. fig. 7.12).
Poniamoci ora, per semplicità, in un spazitempo bidimensionale. Par-
tendo da questa caratterizzazione, vogliamo ricavare le equazioni parametri-
che x(τ ) e t(τ ) delle linee di universo delle particelle che si muovono sotto
l’azione di una forza costante. Nell’analogia tra lo spaziotempo di Minkowski

32
Si confronti il caso classico in cui forza costante significava accelerazione costante.
7.5. PARTICELLE SOGGETTE A FORZA COSTANTE 151

Figura 7.12: La proprietà caratteristica di un moto a forza costante è che la


~ pur variando, mantiene norma costante.
4-accelerazione A,

e il piano euclideo sappiamo che valgono le seguenti corrispondenze:

τ tempo proprio ←→ arco s


Q(τ ) linea di universo ←→ curva parametrizzata P (s)
V~ (τ ) 4-velocità ←→ versore tangente ~t(s) = vers(~v (s))
dV~ ~
~ ) 4-accelerazione ←→ versore curvatura ~k = dt
= A(τ
dτ ds
~ norma della 4-accelerazione ←→ curvatura k
kAk 2 2

moto a norma costante ←→ moto a curvatura costante


iperboli ←→ circonferenze

Questa analogia porta ad aspettarci che i moti di particelle sotto l’azione


di una forza costante (nel senso sopra specificato) siano moti iperbolici, cioè
moti descritti da linee di universo che sono iperboli nello spaziotempo di
Minkowski (l’analogo delle circonferenze euclidee).33 Abbiamo due incognite,
x(τ ) e t(τ ), dunque abbiamo bisogno di due equazioni differenziali di moto per
trovare tali funzioni. Queste equazioni differenziali ci sono date dalla costanza
della norma di V~ (che deve essere sempre soddisfatta) e dalla costanza della
33
Si noti che, classicamente, la linea di universo per tali moti sarebbe la parabola x =
1 2
2 at .
152 LEZIONE 7. QUADRIVETTORI E MECCANICA

norma di A ~ (che è vera perché il moto è a forza costante). Dato che Q(τ ) =
(x(τ ), t(τ )) e che V~ (τ ) = dQ(τ

)
= (x0 (τ ), t0 (τ )), dalla condizione34

V~ · V~ = −c2

otteniamo che
x0 (τ )2 − t0 (τ )2 = −c2 .
~
~ = dV = (x00 (τ ), y 00 (τ )), dalla condi-
Analogamente, tenendo presente che A dτ
zione35
A~·A~ = a2

otteniamo che
x00 (τ )2 − t00 (τ )2 = a2 .
Si tratta quindi ora di integrare il sistema di equazioni differenziali
 0 2
x (τ ) − t0 (τ )2 = −c2
. (7.27)
x00 (τ )2 − t00 (τ )2 = a2

Chiamando X(τ ) := x0 (τ ) e T (τ ) := t0 (τ ), il sistema diventa un sistema


di due equazioni differenziali ordinarie in due incognite, del second’ordine e
non lineare36 :
 2
X − T 2 = (X + T )(X − T ) = −c2
.
X 02 − T 02 = (X 0 + T 0 )(X 0 − T 0 ) = a2

Chiamando ora W (τ ) := X(τ ) + T (τ ) e Z(τ ) := X(τ ) − T (τ ), possiamo


riscrivere il sistema come 
W Z = −c2
. (7.28)
W 0 Z 0 = a2
Dalla prima equazione otteniamo

c2
W =−
Z
e, per derivazione,
c2 0
W0 = Z.
Z2
34
Questa condizione ci ricorda che V ~ è un vettore del genere tempo, avendo norma
negativa.
35
Questa condizione invece ci ricorda che A~ è un vettore del genere spazio, avendo norma
positiva.
36
Tralasciamo nella risoluzione la dipendenza delle variabili dal parametro τ .
7.5. PARTICELLE SOGGETTE A FORZA COSTANTE 153

Sostituendo nella seconda abbiamo quindi che


c2 02
Z = a2 .
Z2
Prendiamo la radice di ambo i membri, per fissare le idee consideriamo
solamente il segno positivo:
c 0
Z = a,
Z
cioè
a
Z 0 = Z,
c
equazione differenziale che si risolve facilmente:
a
Z(τ ) = De c τ ,
con D costante arbitraria. Allora
a c2 c2 a
Z(τ ) = De c τ W (τ ) = − = − e− c τ .
Z D
Dunque, invertendo il sistema (7.28), troviamo

D a c2 − a τ
 X = W 2+Z = e c τ − e c


2 2D .
 W −Z D aτ c2 − a τ
 T =
 = ec + e c
2
2 2D
Compiamo un’opportuna scelta della costante arbitraria: se D = c, infatti
c aτ a 

a 
 X = x0 =
 e c − e− c τ = c sinh τ
2  ac  .
0 c aτ − a 
τ
 T =t =
 e c + e c = c cosh τ
2 c
Si tratta ora di risolvere le due equazioni differenziali
dx a 


 = c sinh τ
dτ c
 dt a  ,
 = c cosh τ
dτ c
il che non è difficile, sapendo che la primitiva del seno iperbolico è il co-
seno iperbolico, e viceversa. Integrando ambo i membri delle due equazioni
otteniamo quindi che

a

 cosh c
τ c2 a 
 x(τ ) = c + E = cosh τ +E

 a
c
a c
.
sinh ac τ

 c2 a 
 t(τ ) = c

a + F = sinh τ + F

c
a c
154 LEZIONE 7. QUADRIVETTORI E MECCANICA

Figura 7.13: Confronto tra la linea di universo di un corpo soggetto a forza


costante nel caso classico e nel caso relativistico. Nel caso classico la curva
è la parabola x = 12 vt2 , la cui tangente si approssima sempre più all’oriz-
zontale. Nel caso relativistico questo non può accadere: il vettore tangente
deve rimanere in ogni punto all’interno del cono luce; la traiettoria risultante
è un’iperbole nello spaziotempo.

A questo punto è già piuttosto chiaro che (x, t) descrive un’iperbole, ma


per vederlo ancora meglio scegliamo E = F = 0. Dunque

c2 a 
 x(τ ) = cosh τ


a c .
2
 c  a 
 t(τ ) = sinh τ

a c
Elevando al quadrato ambo i membri di tutte e due le equazioni, e poi
prendendo la loro differenza membro a membro riusciamo a eliminare la
dipendenza da τ . Infatti:

2 c4 
2 2 a
    c4
2 a
x − t = 2 cosh τ − sinh τ = 2,
a c c a
ovvero !2 !2
x t
c2
− c2
= 1, (7.29)
a a

che è proprio l’equazione di un’iperbole nello spaziotempo di Minkowski. Il


confronto tra la traiettoria classica e relativistica di un corpo soggetto a forza
costante è mostrata in figura 7.13.
Lezione 8

Dalla dinamica
all’elettromagnetismo

8.1 Moto di una particella nel campo elettro-


magnetico
8.1.1 Lo “statuto speciale” della forza di Lorentz
Ora vogliamo studiare il moto di una particella carica in un campo elettro-
magnetico. In un certo senso questo esempio è più semplice del precedente,
grazie a una particolare proprietà della forza di Lorentz.
Sappiamo infatti che, classicamente, una particella di carica q che viaggia
a una velocità ~v in un campo elettromagnetico è soggetta a una forza, detta
forza di Lorentz, data da

f~ = q(E
~ + ~v ∧ B),
~ (8.1)

~ e B
ove E ~ sono rispettivamente il campo elettrico e il campo induzione
magnetica.1
1
Notiamo che, mentre E ~ non ha bisogno di una particolare orientazione dello spazio
~
per essere definito, B, cui si perviene mediante un prodotto vettoriale, necessita della
regola della mano destra per essere completamente definito, o - il che è identico - di una
scelta particolare dell’ordine delle coordinate. In generale i vettori si possono dividere in
~ sono
due classi: i vettori che non risentono dell’orientazione spaziale (come il vettore E)
detti vettori polari, i vettori definiti nel momento in cui fissiamo una orientazione nello
spazio (come il vettore B)~ sono detti vettori assiali. Quando vorremo sottolineare più
y
esplicitamente che un vettore è assiale e non polare, scriveremo ad esempio B in luogo di
y
~ facendo incurvare la freccina sulla lettera del vettore. Che B sia un vettore assiale è
B,
dovuto sostanzialmente al fatto che esso è definito mediante la forza di Lorentz, dunque

155
156 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Ci dovremmo chiedere in quale riferimento questa formula valga. La


peculiarità è che questa forza (già dipendente, tra l’altro, dalla velocità)
vale per qualsiasi osservatore inerziale, a patto di mettere nella formula la
~ e B
velocità della particella rispetto all’osservatore e i campi E ~ osservati
dall’osservatore.

In sostanza, la forza di Lorentz ha uno “statuto speciale”, legato alla pro-


prietà del campo elettromagnetico di comportarsi allo stesso modo in tutti
i riferimenti inerziali; ciò accade in conformità con il Principio di Relatività
einsteiniano, il quale è esteso (appunto) anche a tutti i fenomeni elettroma-
gnetici. Quindi formula (8.1) è valida in tutti i riferimenti inerziali; per un
qualsiasi riferimento primato si ha infatti che

f~ = q(E
~ + ~v ∧ B)
~ = q(E
~ 0 + ~v 0 ∧ B
~ 0 ).

Al cambiare dell’osservatore inerziale, f~ cambia secondo la legge di tra-


sformazione delle componenti spaziali di K ~ (dato che f~ è la componente
~ q rimane invariata, ~v cambia con la legge di composizione
spaziale di K),
delle velocità, ed anche B~ e E ~ cambiano, poiché entrambi dipendono dal-
l’osservatore inerziale scelto. Su come cambino, a priori, non possiamo dire
molto, se non che la loro legge di trasformazione deve essere tale da mante-
nere valida l’espressione di Lorentz (8.1) in ogni riferimento inerziale. Quindi
implicita nell’invarianza della legge di Lorentz c’è una legge di trasformazione
opportuna dei campi E ~ eB ~ che vogliamo esplicitare. In sintesi: sappiamo
che la formula (8.1) rimane invariata in forma in ogni riferimento inerziale,
sappiamo come si trasformano f~ e ~v , e da questo vorremmo ricavare come si
trasformano i campi al variare dell’osservatore.

mediante un prodotto vettoriale, che necessita di una fissata orientazione spaziale. Tutti
i vettori introdotti mediante il prodotto vettoriale risentiranno dell’orientazione spaziale,
e dunque saranno vettori assiali.
8.1. MOTO DI UNA PARTICELLA 157

8.1.2 Il tensore di Faraday


Avendo a disposizione la forma di f~ è facile procurarsi l’espressione della
4-forza di Minkowski:
 
~
~ = γ(v) f + L Π ~
K
c
!
~ · ~v
f
= γ(v) f~ + ~
L
c
!
q( E~ + ~v ∧ B)
~ · ~v
= γ(v) q(E ~ + ~v ∧ B)~ + ~
L
c
!
E~ · ~v
= qγ(v) E ~ + ~v ∧ B ~+ ~
L
c
!
~
E ~ · γ(v)~v
E
= q γ(v)c + γ(v)~v ∧ B ~+ ~ .
L
c c

Tenendo conto delle relazioni (7.7)




 γ(v)c = Vt
γ(v)vx = Vx

,

 γ(v)vy = Vy
γ(v)vz = Vz

~ come
riusciamo a scrivere K
!
~
E q ~ · V~s
E
~ = q Vt + V~s ∧ B
K ~+ ~ ,
L (8.2)
c c

essendo V~s = (Vx , Vy , Vz ), o equivalentemente in componenti, sviluppando i


prodotti vettoriali, come
 
E E E

x y z

 Kt = q Vx + Vy + Vz



  c c c 

 Ex
 Kx = q

 Vt + Vy Bz − Vz By
c  .
 (8.3)
Ey
Ky = q Vt + Vz Bx − Vx Bz





  c 


 Ez
 Kz = q
 Vt + Vx By − Vy Bx
c
158 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Dunque la 4-forza di Lorentz (cioè la 4-forza di Minkowski nel caso di


una particella in moto in un campo elettromagnetico) è una funzione della
4-velocità della particella. Che dipendesse dalla velocità già lo sapevamo
(doveva dipendervi per il vincolo di ortogonalità), ma in più notiamo che la
dipendenza è lineare omogenea. Possiamo infatti scrivere il sistema (8.3) in
forma matriciale come
   Ex Ey Ez
 
Kt 0 c c c Vt
Kx   − Ex 0 Bz −By  Vx 
 
  = q  Ec
 Vy  , (8.4)

 Ky   − y
−B z 0 B x
c
Kz − Ecz By −Bx 0 Vz
dove i segni meno nella prima colonna derivano dal fatto che il prodotto
matrice-vettore è definito mediante i prodotti scalari tra le righe della matrice
e il vettore. In tali prodotti scalari, per la segnatura (1,3) della metrica
minkowskiana, la prima componente va presa con il segno opposto rispetto
al caso del prodotto scalare euclideo canonico.
L’applicazione lineare data dalla matrice
 
0 Ex /c Ey /c Ez /c
 −Ex /c 0 Bz −By 
Fjk =  −Ey /c −Bz
 (8.5)
0 Bx 
−Ez /c By −Bx 0

è detta applicazione lineare di Faraday2 , e si indica con F̂. La matrice


che la rappresenta è detta tensore di Faraday. Tale ente sintetizza il campo
magnetico dal punto di vista dello spaziotempo.
La forma finale della 4-forza di Lorentz che agisce su una particella di
carica q in moto con una 4-velocità V~ è, in definitiva,
~ Lorentz = q F̂(V~ ).
K (8.6)

Vediamo di capire che cosa è successo. Dal punto di vista relativo, dalla
(8.1) notiamo subito che la forza di Lorentz f~ è una funzione affine della
velocità relativa. Quando siamo passati alla 4-forza associata, abbiamo invece
ottenuto che K ~ è una funzione lineare omogenea della 4-velocità. Per quale
ragione diventa lineare? In che modo? È stata la moltiplicazione per il fattore
γ(v) (necessario per passare da f~ a K)~ che ha realizzato il “miracolo”: tale
fattore è proprio ciò che serviva per passare dalle velocità relative a quelle
assolute, e dalla velocità c alla componente temporale della 4-velocità.
2
Michael Faraday (1791-1867), fisico inglese che scoprı̀ l’induzione elettromagnetica e
sviluppò il concetto di campo, che sostituisce l’idea dell’azione a distanza.
8.1. MOTO DI UNA PARTICELLA 159

8.1.3 La 2-forma di Faraday


L’innalzamento della forza relativa alla 4-forza ha fatto dunque nascere una
funzione lineare F̂ che, fissato un punto P su M , associa a un elemento dello
spazio tangente in P a M un altro elemento dello stesso spazio tangente
TP M .3
Sappiamo inoltre che la 4-forza K ~ è sempre ortogonale alla linea di uni-
verso della particella considerata, cioè vale

~ · V~ = 0 ⇔ F̂(V~ ) · V~ = 0.
K (8.7)

Questo cosa significa? Per capirlo meglio, supponiamo che V~ sia somma di
due altri vettori, cioè V~ = V~1 + V~2 . Allora possiamo scrivere che

0 = F̂(V~1 + V~2 ) · (V~1 + V~2 )


= (F̂(V~1 ) + F̂(V~2 )) · (V~1 + V~2 )
= F̂(V~1 ) · V~1 + F̂(V~1 ) · V~2 + F̂(V~2 ) · V~1 + F̂(V~2 ) · V~2
= F̂(V~1 ) · V~2 + F̂(V~2 ) · V~1 ,

dove l’ultimo passaggio vale in virtù della (8.7). Dunque

F̂(V~1 ) · V~2 = −F̂(V~2 ) · V~1 . (8.8)

La (8.8) ci dice che F̂ agisce in modo antisimmetrico sulle coppie di vet-


tori. O meglio4 : a F̂ : T M → T M possiamo associare una applicazione
bilineare sui vettori a valori in R (cioè una forma bilineare). Tale funzione,
chiamiamola F, è definita quindi come F : T M × T M → R e dalla legge

F(V~1 , V~2 ) := F̂(V~1 ) · V2 . (8.9)

In generale, su tutti gli spazi vettoriali muniti di prodotto scalare, ogni


applicazione lineare dallo spazio in sé induce naturalmente un’applicazione
bilineare costruita in maniera analoga a quanto visto per l’equazione (8.9).
L’equazione (8.8) mostra che la forma bilineare costruita con il campo
elettromagnetico (cioè la forma F) è antisimmetrica. Ciò si poteva capire
già dal fatto che la matrice F̂ era antisimmetrica, ma con il procedimento
riportato l’abbiamo mostrato più esplicitamente.
3
In sostanza, F̂ va dal fibrato tangente a M nello stesso fibrato tangente T M .
4
Si noti che, fissato un punto P , lo spazio tangente in P a M non è esattamente M
stesso. Infatti M non è uno spazio vettoriale, ma è solo uno spazio affine, mentre TP M è
a tutti gli effetti uno spazio vettoriale.
160 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Una forma bilineare antisimmetrica5 viene detta 2-forma.


Abbiamo quindi ottenuto come risultato che i campi B ~ eE
~ sono le com-
ponenti di una 2-forma, detta 2-forma di Faraday. Che cosa significa?
Significa che non devono essere visti separatamente, come campi disgiunti,
ma devono essere concepiti come componenti di un unico ente, la 2-forma,
appunto. Dalla condizione di ortogonalità K~ · V~ = 0 abbiamo dunque trovato
che il tensore di Faraday dà luogo a una 2-forma che ingloba in sé il campo
elettrico e il campo magnetico.
Studiamo il comportamento di questa 2-forma. Siano V~1 e V~2 due vettori
nello spazio di Minkowski, applicati allo stesso punto. Allora6

F(V~1 , V~2 ) = F̂(V~1 ) · V~2


   
Ex Ey
= V2x Bz V1y − By V1z + V1t + V2y −Bz V1x − Bx V1z + V1t +
c c
   
Ez Ez
+ V2z −By V1x − Bx V1y + V1t + V2z −By V1x − Bx V1y + V1t
c c
= Bx (V2y V1z − V2z V1y ) + By (V1x V2z − V2x V1z ) + Bz (V1y V2x − V2y V1x )+
Ex Ey Ez
+ (V1t V2x − V2t V1x ) + (V1t V2y − V2t V1y ) + (V1t V2z − V2t V1z )
c c c
V V V V V V
= Bx 2y 2z + By 2z 2x + Bz 2x 2y +
V1y V1z V1z V1x V1x V1y

Ex V2x V2t Ey V2y V2t Ez V2z V2t
+ + + .
c V1x V1t c V1y V1t c V1z V1t

Questa espressione ci insegna che la nostra forma bilineare antisimmetrica


F è una funzione lineare su quei determinanti, cioè sulle speciali forme del
tipo
V2y V2z
V1y V1z .

5
Richiamiamo i significati di questi termini: dato uno spazio vettoriale, una forma
è una applicazione a valori nel campo (in questo caso in R). È bilineare se è lineare
separatamente in entrambe le componenti. È antisimmetrica se, cambiando l’ordine di
ingresso delle due componenti, la forma cambia segno.
6
Va prestata sempre attenzione che il prodotto scalare nello spazio di Minkowski non
è il prodotto scalare canonico di R4 : siamo in uno spazio semieuclideo. In particolare,
il segno della componente temporale va cambiato. Ricordiamo che in generale, presi due
vettori ~a = (ax , ay , az , at ) e ~b = (bx , by , bz , bt ), si ha che

~a · ~b = ax bx + ay by + az bz − at bt .
8.2. L’ALGEBRA TENSORIALE 161

Tutto è quindi ricondotto allo studio di queste forme particolari. Ad esse si


dà una collocazione precisa introducendo nuovi operatori.
Se vogliamo però addentrarci più approfonditamente nello studio di questi
concetti, dobbiamo entrare nel campo dello studio delle forme, che è un
sottocampo dell’algebra tensoriale. Si rende quindi necessario, in questo
momento, un excursus di natura matematica.

8.2 L’algebra tensoriale


8.2.1 Primo approccio
Preso uno spazio vettoriale V su un campo K, l’algebra tensoriale è lo
studio delle forme multilineari (cioè dei tensori, che vengono classificati
in base al numero di argomenti in V e nel suo duale V ∗ ) su tale spazio
vettoriale. Nel prosieguo supporremo sempre che K = R.
Chiameremo forme le funzioni a valori in R. Tali forme saranno dette
multilineari se sono separatamente lineari in ogni argomento7 . Forme mul-
tilineari saranno in generale dette tensori. Il dominio di tali forme sarà
sia lo spazio vettoriale V , sia il suo duale V ∗ . In sostanza: queste forme
sono funzioni che prendono in ingresso un certo numero di vettori e un certo
numero di funzionali lineari e restituiscono un valore reale.
Se il dominio di una forma multilineare è solamente lo spazio V (cioè,
come si suole dire, se tale forma non ha ingressi nel duale), la forma si dice
tensore covariante di rango p (o p-tensore), essendo p il numero degli
argomenti della forma - cioè il numero di vettori di V che tale forma esige in
ingresso.
Se un tensore covariante è totalmente antisimmetrico, ovvero se cam-
bia segno scambiando ogni coppia di argomenti, tale tensore è detto p-forma,
essendo p, nuovamente, il numero degli argomenti in ingresso. Il numero na-
turale p è detto grado della forma, e - detta α la forma - si indica sovente
con la notazione |α|. Per convenzione le 0-forme sono le comuni funzioni.
Introduciamo qualche notazione. Indicheremo con Tpq (V ) le forme multili-
neari (tensori) aventi q ingressi nel duale V ∗ e p ingressi nello spazio vettoriale
V . Diremo che l’indice q è in posizione controvariante, mentre l’indice p
è in posizione covariante. Indicheremo, di conseguenza, con Tp (V ) i ten-
sori covarianti di ordine p, cioè aventi p ingressi nello spazio vettoriale V
(e nessuno nel duale). Infine indicheremo con Ωp (V ) l’insieme dei p-tensori

7
Cioè: lineari in ogni argomento, una volta supposti fissati gli altri argomenti.
162 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

totalmente antisimmetrici, vale a dire, lo spazio delle p-forme aventi ingressi


nello spazio vettoriale V (fig. 8.1).8

Figura 8.1: L’insieme Ωp delle p-forme è un sottoinsieme dell’insieme Tp dei


tensori covarianti di ordine p, che a sua volta è un sottoinsieme dell’insieme
Tqp delle forme multilineari (tensori).

L’utilità matematica delle p-forme è notevole, poiché sono uno strumento


comodissimo per lavorare sulle varietà e in particolare da integrare su tali va-
rietà (linee, superfici, volumi...). Per loro natura sono oggetti (relativamente)
facili da maneggiare e facili da integrare.
Dal punto di vista della fisica, le p-forme sono importanti perché molte
leggi di bilancio si scrivono mediante esse, come nel caso dell’elettromagne-
tismo.
Una volta definiti i tensori e le p-forme, bisogna spiegare perché si parla di
“algebra tensoriale”. La ragione è l’esistenza di un prodotto, detto prodotto
tensoriale, che induce un prodotto sulle forme, detto prodotto esterno.
Possiamo dire che l’algebra tensoriale è lo spazio vettoriale di tutte le
forme multilineari su V munito del prodotto tensoriale ⊗. Chiameremo poi
algebra di Grassmann lo spazio vettoriale di tutte le p-forme su V munito
del prodotto esterno.
La funzione del prodotto (tensoriale o esterno) sarà quella di permettere
la ricostruzione di ogni tensore come combinazione lineare di prodotti di 1-
forme 9 .
I mattoni essenziali della teoria sono le forme lineari, e in particolare
le 1-forme lineari esatte, cioè i differenziali delle funzioni.10 A partire dai
8
Quando non vi sarà ambiguità sullo spazio vettoriale V , scriveremo anche più
semplicemente Tpq , Tp , Ωp .
9
Si noti che le 1-forme sono naturalmente sia tensori sia forme.
10
Richiamiamo e riadattiamo un po’ di terminologia che poi preciseremo meglio e più
in generale. Per il momento basti tener presente che una 1-forma è esatta se essa è il
8.2. L’ALGEBRA TENSORIALE 163

differenziali delle funzioni coordinate x, definiti da

dxj (~v ) = v j

dobbiamo imparare a costruire un qualsiasi p-tensore o una qualsiasi p-forma


usando, rispettivamente, il prodotto tensoriale o il prodotto esterno. Per
dirla in linguaggio matematico: dobbiamo imparare a costruire una base
dello spazio dei p-tensori e delle p-forme.

8.2.2 Rappresentazione di vettori


Prima di partire a costruire p-forme e p-tensori, conviene chiarire brevemente
il perché nella scrittura delle componenti di un vettore ~v sovente abbiamo
usato la notazione v i in luogo della notazione classica vi . Questo è dovuto al
fatto che un vettore ~v può essere in generale individuato mediante due tipi
di componenti:

(i) le componenti covarianti vi , date da

∂P
vi = ~v · ,
∂xi
∂P
essendo ∂xi i vettori della base naturale. Tali componenti covarianti si

trasformano, al variare delle coordinate con la legge della covarianza

∂P ∂P ∂xi ∂xi
vh0 = ~v · = ~
v · = v i ;
∂x0h ∂xi ∂x0h ∂x0h

(ii) le componenti controvarianti v i , che sono definite dalla relazione

∂P
~v = v i
∂xi
e che sono dunque i coefficienti dei vettori della base naturale nella
scomposizione naturale di ~v . Essi si trasformano con legge della con-
trovarianza
∂P ∂P ∂P ∂x0h
~v = v 0h 0h = v i i = v i 0h ,
∂x ∂x ∂x ∂xi
da cui
∂P
v 0h = v i 0h .
∂x
differenziale di una qualche funzione; cioè tutte e sole le forme esatte sono del tipo dg con
g funzione scalare.
164 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

In coordinate cartesiante ortogonali le due scritture naturalmente si equi-


valgono (v i = vi ) e le componenti covarianti e controvarianti si identificano
con le componenti cartesiane del vettore. Ma in coordinate generali questo
non è vero: basta solo prendere ad esempio coordinate oblique per rompere
questa eguaglianza, come mostra chiaramente la figura 8.2.

Figura 8.2: Le coordinate v1 e v2 (in blu) sono le componenti covarianti,


cioè il prodotto scalare del vettore ~v con i versori ~i e ~j degli assi - sono date
sostanzialmente da proiezioni ortogonali. Le componenti v 1 e v 2 (in rosso)
sono le componenti covarianti, cioè la scomposizione del vettore ~v sulla base
naturale - sono date sostanzialmente da proiezioni parallele, e generano un
parallelogramma di cui ~v è la diagonale. Dato che in coordinate cartesiane or-
togonali proiezioni parallele e proiezioni ortogonali coincidono, le componenti
covarianti e controvarianti si confondono. Passando a coordinate qualsiasi
dobbiamo stare attenti alla differenza.

8.2.3 Le 1-forme
Si parte dalle 1-forme. Per definizione, tali forme sono le funzioni che pren-
dono in ingresso un vettore di V e restituiscono una numero reale.
Scelto un sistema di coordinate (x1 , . . . , xn ), abbiamo già notato il ruolo
piuttosto particolare svolto dai differenziali delle funzioni coordinate. In
generale, fissata una funzione f a valori nel campo, il suo differenziale in
un punto P è una forma lineare sui vettori, cioè un’applicazione che a ogni
8.2. L’ALGEBRA TENSORIALE 165

vettore ~v associa un numero reale. Tale numero è sostanzialmente la derivata


direzionale di f lungo la direzione fissata. In simboli11 ,
d ∂f j
dP f (~v ) = f (P + t~v ) t=0 = ∇f · ~v = v . (8.10)
dt ∂xj
Ciò è vero in particolare per le funzioni coordinate xj . Dalla (8.10) abbiamo
quindi che
dxj (~v ) = v j
In pratica, differenziali delle funzioni coordinate sono particolari funzioni
sui vettori: quelle che associano al vettore in ingresso una sua componente.
Proprio per questo essi sono detti solitamente “proiettori”.
È chiaro allora che i dxj costituiscono una base per lo spazio delle 1-forme.
La generica 1-forma infatti può essere scritta come

α = αj dxj ,

con gli αj funzioni scalari.


Un particolare tipo di 1-forma è il differenziale di una funzione sca-
lare f , per il quale vale la già citata
∂f j
df = dx .
∂xj

8.2.4 Prodotto tensoriale e prodotto esterno


Ora: siano α e β due 1-forme su V . Possiamo quindi definire il loro prodotto
tensoriale, che indicheremo con12 α ⊗ β, come una funzione bilineare che,
presi in ingresso due vettori ~v1 , ~v2 ∈ V ad essi associa la quantità

(α ⊗ β)(~v1 , ~v2 ) = α(~v1 ) · β(~v2 ), (8.11)

dove il puntino indica il prodotto scalare in R.


Insomma: date due 1-forme, possiamo sempre costruire una forma bili-
neare, associando alla generica coppia di vettori (~v1 , ~v2 ) il prodotto dei valori
11
Utilizzeremo la cosiddetta notazione tensoriale: la presenza di uno stesso indice in due
posizioni diverse (covariante e controvariante) sottointenderà automaticamente il simbolo
di sommatoria su tale indice. Ad esempio
∂f j X ∂f j
v = v .
∂xj j
∂xj

12
Da leggersi: “df tensor dg”.
166 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

che la prima forma associa al primo vettore e la seconda forma associa al


secondo. Questa nuova forma è chiaramente bilineare: è infatti separata-
mente lineare in ~v1 e ~v2 , per la linearità delle forme di partenza. Notiamo
inoltre che, nonostante la moltiplicazione al secondo membro della (8.11) sia
una moltiplicazione tra scalari, quindi commutativa, il prodotto tensoriale
in generale non è commutativo, poiché dipende dall’ordine delle due forme,
cioè da quale dei due vettori in ingresso viene “dato in pasto” a α e quale a
β.
Per questo motivo è possibile antisimmetrizzare non banalmente, cioè
associare alla coppia di p-forme α ⊗ β e β ⊗ α (in generale diverse) una 2-
forma che sia la loro differenza. Questa sarà in generale non nulla e, per
costruzione, antisimmetrica.
Quindi, alle p-forme α e β, possiamo associare una nuova p-forma, il
prodotto esterno13 α ∧ β, cioè la forma antisimmetrica che a ogni coppia
di vettori ~v1 , ~v2 ∈ V associa14 la quantità

α ∧ β = α ⊗ β − β ⊗ α, (8.12)

ovvero esplicitamente:

(α ∧ β)(~v1 , ~v2 ) = (α ⊗ β − β ⊗ α)(~v1 , ~v2 )


= α(~v1 )β(~v2 ) − α(~v2 )β(~v1 )

cioè, in definitiva:

α(~v1 ) β(~v1 )
(α ∧ β)(~v1 , ~v2 ) = . (8.13)
α(~v2 ) β(~v2 )

Il determinante al secondo membro della (8.13) è detto determinante


plückeriano.
13
Questo non è esattamente la restrizione del prodotto tensoriale alle p-forme. Anche se
in effetti lo spazio delle p-forme è un sottospazio di quello dei p-tensori, se ci limitiamo a
restringere il prodotto tensoriale alle p-forme usciremmo dallo spazio: il prodotto tensoriale
di due p-forme, in generale, non sarebbe una p-forma. Ad esempio, il prodotto tensoriale

(dx ⊗ dy)(~v , w)
~ = vx · wy

chiaramente non è simmetrico. Per avere ancora una p-forma, dobbiamo


antisimmetrizzare:

(dx ∧ dy)(~v , w)
~ = (dx ⊗ dy − dy ⊗ dx)(~v , w)
~ = vx · wy − vy · wx .

14
Il prodotto esterno (o “wedge”, dall’inglese) di fatto estende a spazi di dimensione
arbitraria quasi tutti quello che riguarda il prodotto vettoriale. E questa è la ragione per
cui, nel designarlo, si usa lo stesso simbolo del prodotto vettoriale.
8.2. L’ALGEBRA TENSORIALE 167

Il prodotto tensoriale e il prodotto esterno permettono sostanzialmente


di prolungare (estendere) le 1-forme dxj in una base rispettivamente dei
p-tensori e delle p-forme (che prende il nome di base esterna).

8.2.5 Base per i 2-tensori


Iniziamo a calcolare la base esterna in un caso particolare, cioè nel caso della
base per i 2-tensori su uno spazio vettoriale V tridimensionale. Conside-
riamo su tale spazio tridimensionale le coordinate (x1 , x2 , x3 ). Sia β(~u, ~v ) il
generico tensore covariante di ordine 2. L’idea è quella di scrivere β come fun-
zione delle componenti di ~u e ~v sulla base naturale associata alle coordinate
(x1 , x2 , x3 ). Infatti possiamo scomporre i due vettori come
∂P 2 ∂P 3 ∂P
~u = u1 + u + u
∂x1 ∂x2 ∂x3
∂P ∂P ∂P
~v = v 1 1
+ v2 2 + v3 3
∂x ∂x ∂x
e dunque possiamo scrivere che
 
1 ∂P 2 ∂P 3 ∂P 1 ∂P 2 ∂P 3 ∂P
β(~u, ~v ) = β u +u +u , ~v = v +v +v
∂x1 ∂x2 ∂x3 ∂x1 ∂x2 ∂x3
     
1 1 ∂P ∂P 1 2 ∂P ∂P 1 3 ∂P ∂P
=u v β , +u v β , +u v β , +
∂x1 ∂x1 ∂x1 ∂x2 ∂x1 ∂x3
     
2 1 ∂P ∂P 2 2 ∂P ∂P 2 3 ∂P ∂P
+u v β , +u v β , +u v β , +
∂x2 ∂x1 ∂x2 ∂x2 ∂x2 ∂x3
     
3 1 ∂P ∂P 3 2 ∂P ∂P 3 3 ∂P ∂P
+u v β , +u v β , +u v β , =
∂x3 ∂x1 ∂x3 ∂x2 ∂x3 ∂x3
 
j k ∂P ∂P
= u v β( , . (8.14)
∂xj ∂xk
Quest’ultima scrittura chiaramente è più generale, dal momento che vale
su un qualsiasi spazio vettoriale n-dimensionale, e non necessariamente sullo
spazio tridimensionale.
I valori  
∂P ∂P
βjk := β , (8.15)
∂xj ∂xk
che il 2-tensore assume sui vettori della base naturale sono detti componenti
del tensore.
Dal momento che
uj v k = (dxj ⊗ dxk )(~u, ~v ),
168 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

possiamo riscrivere la (8.14) come


n
X
β(~u, ~v ) = βjk (dxj ⊗ dxk )(~u, ~v ), (8.16)
j,k=1

dove per una volta abbiamo esplicitato la sommatoria, per mostrare che gli
indici corrono da 1 alla dimensione dello spazio (cioè al numero di coordinate
necessarie).
Per l’arbitrarietà degli argomenti ~u e ~v , la (8.16) implica che
β = βjk dxj ⊗ dxk . (8.17)
La formula (8.17) sostanzialmente dimostra che i prodotti tensoriali del
tipo dxj ⊗ dxk , cioè i prodotti tensoriali dei proiettori base per le 1-forme,
costituiscono una base per lo spazio dei 2-tensori.

8.2.6 Base per le 2-forme


E per le 2-forme? Nel caso in cui β oltre che un 2-tensore sia anche una
2-forma, l’antisimmetria implica un vincolo sulle componenti tensoriali. Si
avrà che    
∂P ∂P ∂P ∂P
β , = −β , ,
∂xj ∂xk ∂xk ∂xj
il che in generale implica che
βjk = −βkj
e in particolare che
βjj = 0.
Le componenti tensoriali indipendenti sono solo quelle con j < k, dette
componenti strette della 2-forma β. Infatti per j = k si hanno entrate
nulle, e per j > k, per antisimmetria, le entrate sono le stesse del caso j < k,
ma cambiate di segno. Tornando al caso particolare di n = 3, le componenti
strette della 2-forma β sono solo tre: (β12 , β13 , β23 ).
A causa del vincolo di antisimmetria possiamo scrivere la 2-forma come
funzione delle sole componenti strette. Dalla (8.14), ricordandoci delle defi-
nizioni (8.15), abbiamo che
β(~u, ~v ) = (β11 u1 v 1 + β12 u1 v 2 + β13 u1 v 3 ) + (β21 u2 v 1 + β22 u2 v 2 + β23 u2 v 3 )+
+ (β31 u3 v 1 + β32 u3 v 2 + β33 u2 v 3 )
= β12 (u1 v 2 − u2 v 1 ) + β13 (u1 v 3 − u3 v 1 ) + β223 (u2 v 3 − u3 v 2 )
X
= βjk (uj v k − uk v j ),
j<k
8.3. APPLICAZIONE ALLA 2-FORMA DI FARADAY 169

dove il penultimo passaggio vale per l’antisimmetria e l’ultimo passaggio è


un’immediata generalizzazione al caso n-dimensionale.
Osserviamo che
j k
u u
u v − u v = j k = (dxj ∧ dxk )(~u, ~v ),
j k k j
v v
e dunque concludiamo che per le 2-forme vale
X
β(~u, ~v ) = βjk (dxj ∧ dxk )(~u, ~v ), (8.18)
j<k

e nuovamente, dalla generalità dei vettori in ingresso otteniamo che


X
β= βjk dxj ∧ dxk . (8.19)
j<k

La formula (8.19) afferma che i prodotti esterni tra i proiettori, cioè del
tipo dxj ∧ dxk , con j < k formano una base nello spazio delle due forme.

8.2.7 Significato geometrico del prodotto esterno


Torniamo al caso delle coordinate cartesiane. Abbiamo visto che, presi due
vettori ~u, ~v
ux uy
(dx ∧ dy)(~u, ~v ) = = u x v y − uy v x , (8.20)
vx vy
risultato che ha il seguente significato geometrico. I vettori ~u e ~v , nell’ordine
prefissato, definiscono un parallelogramma (orientato) nello spazio vettoriale,
parallelogramma di cui possiamo considerare le proiezioni sui piani coordi-
nati. La quantità ux vy − uy vx è esattamente l’area con segno della proiezione
sul piano xy.
Dunque geometricamente (con riferimento alla figura 8.3):
• dx proietta sugli assi il vettore ~u e il vettore ~v ;
• dx ∧ dy proietta sui piani coordinati il parallelogramma (~u, ~v )

8.3 Applicazione alla 2-forma di Faraday


8.3.1 Riscrittura della 2-forma
Torniamo ora all’elettromagnetismo, e applichiamo il formalismo sino a qui
sviluppato alla 2-forma di Faraday. Consideriamo all’uopo un osservatore
170 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Figura 8.3: Significato geometrico del prodotto esterno come proiezione.

inerziale sullo spaziotempo, quindi in sostanza una tetrade composta dai


vettori della base naturale
∂P ~ ∂P ~ ∂P ~ ∂P
I~ = J= K= L= .
∂x ∂y ∂z ∂t
La base duale corrispondente è la base formata dai proiettori
(dx, dy, dz, dt).
La sua funzione è di associare ad ogni 4-vettore, che scomposto sulla base
naturale ha la forma
∂P ∂P ∂P ∂P
V~ = Vx + Vy + Vz + Vt = Vx I~ + Vy J~ + Vz K
~ + Vt L,
~
∂x ∂y ∂z ∂t
la corrispondente componente:15
Vt
dx(V~ ) = Vx dy(V~ ) = Vy dz(V~ ) = Vz dt(V~ ) = .
c
15
Si presti attenzione alla coordinata temporale: infatti avevamo scritto il vettore
posizione nella forma
Q = xI~ + y J~ + z K
~ + ctL,
~
scegliendo come quarta componente la quantità ct. Dunque, presa la 4-velocità
~ = Vx I~ + Vy J~ + Vz K
V ~ + Vt L,
~

risulta che
~ ) = Vt .
d(ct)(V
Ciò significa che il proiettore non è il differenziale dt, ma è il differenziale della nostra
quarta componente del vettore posizione, ovvero d(ct). Dato che il differenziale è una
funzione lineare e che c è costante, è quindi automatico che

~)= Vt
dt(V .
c
8.3. APPLICAZIONE ALLA 2-FORMA DI FARADAY 171

Disponiamo ora di un nuovo concetto: il prodotto esterno delle 1-forme


base dx, dy, dz e dt. Sappiamo che i prodotti esterni delle 1-forme base (pro-
iettori) formano una base nello spazio delle 2-forme: possiamo quindi pensare
di riscrivere la 2-forma F come combinazione delle 2-forme di base. In parti-
colare, tutti quei determinanti ora possono essere riscritti mediante prodotti
esterni16 :

F(V~1 , V~2 ) = Bx (dy ∧dz)(V~2 , V~1 )+By (dz ∧dx)(V~2 , V~1 )+Bz (dx∧dy)(V~2 , V~1 )+
+ Ex (dx ∧ dt)(V~2 , V~1 ) + Ey (dy ∧ dt)(V~2 , V~1 ) + Ez (dz ∧ dt)(V~2 , V~1 ),

e per antisimmetria dei prodotti esterni

F(V~1 , V~2 ) = −Bx (dy∧dz)(V~1 , V~2 )−By (dz∧dx)(V~1 , V~2 )−Bz (dx∧dy)(V~1 , V~2 )+
− Ex (dx ∧ dt)(V~1 , V~2 ) − Ey (dy ∧ dt)(V~1 , V~2 ) − Ez (dz ∧ dt)(V~1 , V~2 ). (8.21)

Dall’arbitrarietà dei vettori V~1 e V~2 , a meno di un segno17 ,

F = Bx dy∧dz+By dz∧dx+Bz dx∧dy+(Ex dx + Ey dy + Ez dz)∧dt, (8.22)

che ci fornisce l’espressione generale della 2-forma di Faraday.


Guardiamo in faccia gli elementi in gioco nell’equazione (8.22). Sappiamo
il significato geometrico dei prodotti esterni del tipo dy ∧ dz: essi forniscono
sostanzialmente delle aree. Bx dy ∧ dz è dunque il flusso del campo magne-
tico18 attraverso la faccia infinitesima dydz; e analogamente possiamo dire
per By dz ∧ dx e per Bz dx ∧ dy, rispettivamente per le facce dzdx e dxdy.
Dunque i termini in cui compaiono le componenti di B rendono conto del
flusso magnetico. Il termine tra le parentesi tonde, nella (8.22), invece è
sostanzialmente la tensione elettrica.
Sottolineiamo il fatto che il tensore elettromagnetico F esiste ed è presente
indipendentemente dall’uso di cariche di prova.
Questo modo di procedere ha un vantaggio immediato: siamo in grado di
risolvere il problema (all’apparenza molto ostico) della determinazione della
legge di trasformazione per il campo elettromagnetico.
16 ~)=
Si noti che i denominatori c scompaiono perché dt(V Vt
c , da cui, ad esempio
V2t

~1 ) = V2x
~2 , V
1 V2x V2t
(dx ∧ dt)(V c
V1t = .
V1x
c c V1x V1t

17
Scegliamo infatti di considerare positiva tutta la forma, è una convenzione che non
inficia alcun ragionamento e che ci sarà utile più avanti.
18
Più brevemente: il flusso magnetico.
172 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

8.3.2 Legge di trasformazione del campo elettroma-


gnetico
Aver scoperto che B ed E sono le 6 componenti di una 2-forma sullo spazio-
tempo di Minkowski ci fornisce immediatamente la legge di trasformazione
del campo elettromagnetico al cambiare dell’osservatore inerziale. Dall’inva-
rianza in forma della forza di Lorentz siamo giunti alla legge di trasformazione
di E e B.
Mostriamo innanzitutto in un modo efficace che i concetti di campo elet-
trico e campo magnetico devono necessariamente compenetrarsi in virtù del
Principio di Relatività.
Consideriamo il caso particolare di un’unica carica q in quiete nell’origine
di un osservatore inerziale. Dato che la carica è in quiete rispetto a tale osser-
vatore, esiste solo il campo elettrostatico coulombiano, e il campo magnetico
è nullo.
~ = 1 q ~er

 E
4πε0 r2 (8.23)
 ~
B=0

Consideriamo ora un secondo osservatore inerziale, in moto relativo ri-


spetto al precedente: per questo osservatore, la carica q è in moto, esiste
quindi una corrente e dunque oltre al campo elettrico si genera un campo
magnetico associato a questa corrente. Inoltre il campo elettrico non sarà
più il campo coulombiano.
Questo piccolo esperimento concettuale mostra che un campo elettrico in
un riferimento inerziale R genera inevitabilmente un campo magnetico B ~0
0
in un altro riferimento ineraziale R : riscopriamo dunque che campi elettrici
e campi magnetici sono indissolubilmente intrecciati. Non può esistere un
campo elettrico per un osservatore senza che per qualche altro osservatore vi
sia anche un campo magnetico, e viceversa.
La scoperta che (E,~ B)
~ sono le componenti della 2-forma di Faraday ci
permette di calcolare immediatamente19 i campi (E ~ 0, B
~ 0 ), noti i campi (E,
~ B).
~
Basta decomporre la 2-forma F sulle basi esterne delle 2-forme associate ai
due riferimenti: la forma F è unica, e dunque deve rimanere invariata.20

19
E senza tutto il formalismo che abbiamo introdotto non sarebbe stato affatto facile
trovarli! Come avremmo potuto fare? Risolvere le equazioni di Maxwell tenendo conto
della legge del movimento delgi osservatori? Non ne saremmo venuti a capo. Questo
dimostra la potenza del formalismo che abbiamo introdotto.
20
Esattamente perché uno stesso vettore in uno spazio vettoriale può essere espresso
equivalentemente come combinazione lineare di due basi diverse.
8.3. APPLICAZIONE ALLA 2-FORMA DI FARADAY 173

F = Bx dy ∧ dz + By dz ∧ dx + Bz dx ∧ dy + (Ex dx + Ey dy + Ez dz) ∧ dt =
= Bx0 0 dy 0 ∧dz 0 +By0 0 dz 0 ∧dx0 +Bz0 0 dx0 ∧dy 0 + Ex0 0 dx0 + Ey0 0 dy 0 + Ez0 0 cdz 0 ∧dt0 .


(8.24)

Le trasformazioni di Lorentz21 , detta u la velocità relativa tra gli osser-


vatori, sono  0
 cdt0 = γ(u)(cdt − β(u)dx)

dx = γ(u)(dx − β(u)cdt)


 dy 0 = dy
 0
dz = dz
Quindi

F = Bx0 0 dy∧dz+By0 0 dz∧(γ(u)(dx−β(u)cdt))+Bz0 0 γ(u)(dx−β(u)cdt)∧dy+


  
0 0 0
 β(u)
+ Ex0 γ(u)(dx − β(u)cdt) + Ey0 dy + Ez0 dz ∧ γ(u) dt − dx ,
c
e raccogliendo i prodotti esterni di base, ricordandoci che per antisimmetria
dx ∧ dx = 0 (analogamente per y e z) e dx ∧ dy = −dy ∧ dx (analogamente
per le altre combinazioni), otteniamo
 
0 β(u) 0
F = γ(u)Bz0 + γ(u) Ey0 (dx ∧ dy) + Bx0 0 (dy ∧ dz)+
c
 
0 β(u) 0
Ez0 (dz∧dx)+ γ(u)2 Ex0 0 − γ(u)2 β(u)2 Ex0 0 (dx∧dt)+

+ γ(u)By0 − γ(u)
c
+ Bz0 γ(u)β(u)c + γ(u)Ey0 0 (dy∧dt)+ −By0 0 γ(u)β(u)c + γ(u)Ez0 0 (dz∧dt).
0
 

Ricordandoci della (8.24), eguagliamo ora ciascuna componente, per otte-


nere le leggi di trasformazione delle componenti del campo elettromagnetico:


 Ex = γ(u)2 (Ex0 0 − β(u)2 Ex0 0 ) = Ex0 0
 0 0
 0 0

E = γ(u) E + B β(u)c = γ(u) E + uB

y 0 0 0 0


 y z y z
0 0 0 0
  
E = γ(u) E − B β(u)c = γ(u) E + uB

z 0 0 0 y0

 z y z

Bx = Bx0 0

(8.25)
0
 
 β(u)E z 0
 u 
By = γ(u) By0 0 − = γ(u) By0 0 − 2 Ez0 0



c c



0 
β(u)E
 

y 0
 u 
 Bz = γ(u) Bz0 0 + = γ(u) Bz0 0 + 2 Ey0 0



c c
21
Al solito, supponiamo gli osservatori in moto lungo il comune asse delle x.
174 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Per la simmetria invocata dal Principio di Relatività, abbiamo immedia-


tamente anche la trasformazione inversa: basta infatta sostituire ovunque la
velocità relativa u con la velocità relativa −u, da cui

 0
 Ex0 = Ex


Ey0 0 = γ(u) (Ey − uBz )







0
 Ez0 = γ(u) (Ez − uBy )



Bx0 0 = Bx (8.26)




 0
 u 
B = γ(u) B + E

y 2 z

y0
c



 B 0 0 = γ(u) B − u E

  

z z y
c2

Notiamo che in ciascuna espressione (eccezion fatta per le componenti


lungo cui avviene il moto, cioè le componenti x) i campi elettrico e magnetico
inevitabilmente si mescolano, sovrapponendosi - possiamo vedere questo fatto
come una sorta di fenomeno di induzione.
Dunque l’utilità della 2-forma F ha già iniziato a dare i suoi frutti: ab-
biamo risolto un problema a priori “difficile”. Ma c’è di più: F è effettiva-
mente la rappresentazione più conveniente del campo elettromagnetico22 in
quanto permette di riscrivere in un’elegantissima forma intrinseca le equa-
zioni di Maxwell, come vedremo nella prossima lezione. Per arrivare a questo,
però, abbiamo prima ancora bisogno di una nozione matematica, il concetto
di differenziale esterno.

8.4 Il differenziale esterno

8.4.1 Derivazione di campi tensoriali


Riprendiamo il filo del discorso con i nostri campi tensoriali. Su di essi non è
definita alcuna operazione intrinseca di derivazione semplicemente mediante
l’uso di un sistema di coordinate. Per definire la derivazione di un campo
tensoriale bisogna introdurre una struttura aggiuntiva, detta connessione,
caratterizzata dai coefficienti di connessione. Questa struttura aggiuntiva

22 ~ è la rappresentazione più conveniente per la velocità.


Cosı̀ come V
8.4. IL DIFFERENZIALE ESTERNO 175

permette di definire la derivata dei campi tensoriali a partire dagli assiomi


di Koszul (cosiddetta derivazione covariante alla Koszul23 ).

8.4.2 Derivazione di p-forme


Al contrario, sulle p-forme è possibile definire un’operazione di derivazione
naturale, detta differenziale esterno, che non richiede l’introduzione di
strutture geometriche aggiuntive.24
Il differenziale esterno è un’operazione

d : Ωp (V ) → Ωp+1 (V )

che aumenta di una unità il grado della forma che viene differenziata. Esso
estende il differenziale di una funzione (cioè di una 0-forma) ad una generica
p-forma.
Conviene definire tale operazione in forma assiomatica, dando le sue pro-
prietà, ricalcando il modello della definizione assiomatica della derivazione
covariante alla Koszul25 .
Definiamo dunque il differenziale esterno come un’operazione di deriva-
zione, che prende una p-forma e la trasforma in una p + 1-forma verificante
le seguenti quattro proprietà (α, β ∈ Ωp (V ); f, g sono funzioni):

(i) linearità: d(α + β) = dα + dβ;

(ii) leibnitzianità: d(α ∧ β) = dα ∧ β + (−1)|α| α ∧ dβ;


∂f j
(iii) definizione sulle funzioni : df = dx ;
∂xj
(iv) definizione sulle 1-forme esatte: d(dg) = 0.

Possiamo subito fare alcuni commenti riguardo a questa definizione.

(i) La prima proprietà ha lo scopo di ricondurre il differenziale al solo caso


dei monomi di base (ad esempio, del tipo f dxi ∧ dxj ).
23
Per maggiori informazioni sull’argomento e in generale per approfondimenti sulle no-
zioni di geometria delle curve o delle superfici si rimanda alle “Nozioni di Geometria
Differenziale” che si possono scaricare dal seguente indirizzo:

http://www.webalice.it/dghisi/scritti/geometria.pdf

24
Ecco un’altra bella proprietà delle p-forme: abbiamo automaticamente, e in modo
assolutamente naturale, un’operazione di differenziale esterno, senza dovere introdurre
alcunché.
25
Si veda la nota 23 a pag. 175.
176 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

(ii) La seconda proprietà ha lo scopo di ricondurre la derivazione di un


monomio (ad esempio f dxi ∧ dxj ) a quella delle funzioni (f ) e delle
1-forme esatte (dxi , o in generale del tipo dg).
Tale proprietà è l’analogo della regola di Leibnitz per la comune deri-
vazione. Il fattore (−1)|α| , dove vale la pena di ricordare che |α| è il
grado della forma α, è simile al fattore che compare se per computare
un determinante scambiamo un certo numero di colonne o righe; esso
rende conto del fatto che, in un certo senso e molto informalmente, il
differenziale deve “attraversare” una forma di grado |α|.
(iii) La terza proprietà definisce il differenziale sulle funzioni, nel modo in
cui è definito il differenziale usuale.
(iv) La quarta proprietà conclude l’opera, definendo il differenziale sulle
1-forme esatte.
La definizione del differenziale sulle 1-forme esatte ci mostra che d(dg) =
d g = 0, dove g è una funzione. Abbiamo imposto l’annullarsi di d2 su tutte
2

le funzioni. Si dimostra facilmente che tale proprietà vale per ogni p-forma,
cioè che per ogni α ∈ Ωp (V )
d2 α = 0.
Ciò è una diretta conseguenza dell’eguaglianza delle derivate seconde miste
per funzioni C 2 . Infatti ogni p-forma α può essere scritta come combinazione
lineare di prodotti esterni dei proiettori nel modo seguente
X
α= αi1 i2 ...ip dxi1 ∧ dxi2 ∧ . . . ∧ dxip ,
i1 <i2 <...<ip

e il suo differenziale, utilizzando la (ii), quindi come26


X X ∂αi1 i2 ...ip
dα = j
dxj ∧ dxi1 ∧ dxi2 ∧ . . . ∧ dxip .
i <i <...<i j
∂x
1 2 p

Differenziando nuovamente otteniamo


X X X ∂ 2 αi1 i2 ...ip
d(dα) = d2 α = j ∂xk
dxj ∧ dxk ∧ dxi1 ∧ dxi2 ∧ . . . ∧ dxip .
i <i <...<i j k
∂x
1 2 p

Ora: se tutte le funzioni αi1 i2 ...ip ∈ C 2 , vale l’eguaglianza delle derivate miste,
cioè
∂ 2 αi1 i2 ...ip ∂ 2 αi1 i2 ...ip
= ,
∂xj ∂xk ∂xk ∂xj
26
La seconda parte della scomposizione leibnitziana si annulla per la (iv), ossia perché
il differenziale di forme esatte è nullo.
8.4. IL DIFFERENZIALE ESTERNO 177

e dunque, per antisimmetria delle p-forme di base,


∂ 2 αi1 i2 ...ip j k ∂ 2 αi1 i2 ...ip
dx ∧ dx = − dxk ∧ dxj ,
∂xj ∂xk ∂xk ∂xj
e risulta chiaro che per ogni termine della sommatoria, esiste nella stessa
sommatoria anche il termine opposto, per cui alla fine d2 α = 0. Per la
genericità della forma α si ha che d2 = 0.
Questo asserto è noto in letteratura come Lemma di Poincaré.27 Esso
sancisce che ogni forma esatta è chiusa, cioè che d2 = 0.
Che la definizione di differenziale, come l’abbiamo data, sia ben definita
(cioè non dipenda dalle coordinate scelte) è immediato: l’unico punto in
cui essa dipende dalle coordinate è il (iii), ma tale punto è la definizione
usuale del differenziale di una funzione, che sappiamo non dipendere dalle
coordinate.
Dalla definizione e dalla rappresentazione delle p-forme sulla base na-
turale segue l’espressione esplicita del differenziale di una qualsiasi p-forma,
mediante l’utilizzo delle semplificazioni successive introdotte ai punti (i), (ii),
(iii) e (iv). Vediamolo per esteso nel caso p = 1.
Se p = 1, la generica forma α si può scrivere come

α = αj dxj ,

con le αj funzioni scalari. Dunque28


n
! n n
X X  X
j j
d αj ∧ dxj =

dα = d αj dx = d αj dx =
j=i j=i j=i
n
X n
X
= dαj ∧ dxj + (−1)0 αj ∧ d(dxj ) = dαj ∧ dxj
j=i j=i

dove al secondo passaggio abbiamo usato la linearità (i), e quindi ci siamo


ricondotti ai monomi, al terzo passaggio abbiamo visto il monomio aj dxj
come il prodotto esterno di una 0-forma e di una 1-forma, al quarto passaggio
abbiamo utilizzato la leibnitzianità (iii) e infine abbiamo utilizzato la regola
(iv) di autonullificazione, caso particolare del Lemma di Poincaré. Abbiamo
cosı̀ ottenuto l’espressione esplicità del differenziale di una generica 1-forma.
27
Altri chiamono Lemma di Poincaré in realtà l’affermazione inversa (quello che noi
chiameremo l’Inverso del Lemma di Poincaré), cioè che ogni forma chiusa è esatta, la
quale affermazione però, come vedremo, vale solo in insiemi topologicamente banali. Noi
chiameremo Lemma di Poincaré l’asserto per cui d2 = 0.
28
Scriviamo esplicitamente le sommatorie per mostrare chiaramente dove intervengono,
nelle varie fasi, le proprietà (i), (ii), (iii) e (iv).
178 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

8.4.3 Integrazione
Mediante l’utilizzo del differenziale esterno possiamo ottenere un risultato
che generalizza una classe di teoremi dell’analisi matematica.
Il punto di partenza è che le forme differenziali sono gli oggetti naturali
della teoria dell’integrazione sulle varietà pararametrizzate orientate29 . Dal
nostro punto di vista, non si integrano campi vettoriali, ma si integrano
forme differenziali. Integreremo le 1-forme su linee orientate P = P (u), le
2-forme su superfici orientate P = P (u, v), le 3-forme su volumi orientati
P = P (u, v, w), e cosı̀ via. Dicendo questo, possiamo immaginare tali curve,
superfici, volumi immersi nello spazio euclideo; tale immersione però non è
assolutamente necessaria: la teoria delle p-forme è una teoria intrinseca.
Come definiamo gli integrali di p-forme? Nel modo più naturale, ricor-
dandoci della definizione di prodotto esterno e del suo significato geometrico:

• se α è una 1-forma,
u1
dxj
Z Z X Z
j
α= αj (x(u))dx (u) = αj (x(u)) du;
+C +C j u0 du

• se β è una 2-forma,
Z Z X
β= βjk (x(u, v))dxj (u, v) ∧ dxk (u, v) =
+S +S j<k
j
ZZ ∂x ∂xj
∂u ∂v
= βjk (x(u, v)) ∂x dudv
D k ∂xk
∂u ∂v

• se γ è una 3-forma,
Z Z X
γ= γjkl (x(u, v, w))dxj (u, v, w)∧dxk (u, v, w)∧dxl (u, v, w) =
+V +V j<k<l
∂xj ∂xj ∂xj


ZZZ ∂u ∂v ∂w
k ∂xk ∂xk
= γjkl (x(u, v, w)) ∂x dudvdw;
D ∂ul ∂v ∂w
∂x ∂xl l
∂x
∂u ∂v ∂w

29
Per avere l’orientazione basta fissare un ordine nella scelta delle coordinate; in questo
modo, ad esempio, mediante la regola della mano destra o similia, abbiamo l’orientazione
richiesta.
8.4. IL DIFFERENZIALE ESTERNO 179

e cosı̀ via. Qualche precisazione notazionale: le scritture x(u), x(u, v), x(u, v, w)
sono quantità vettoriali, cioè x(u) = (x1 (u), . . . , xn (u)), e analogamente per
le altre. Inoltre la scritture +C, +S e +V designano rispettivamente una
curva orientata,Zuna superficie orientata e un volume orientato.
L’integrale α è detto “circolazione (o circuitazione) della 1-forma
+C ZZ
α lungo la curva C”; l’integrale β è detto “flusso della 2-forma β
+S
attraverso la superficie S”.
Nel caso di una 0-forma f , ossia di una funzione, possiamo definire il suo
integrale coerentemente con il resto come
Z

f = f (a+
1 ) − f (a2 ),

+A={a+
1 ,a2 }

dove +A è un certo insieme di punti, tipicamente due. Tale insieme è orien-


tato nel senso che è stabilito un ordine tra i punti, tipicamente a un punto
viene associato il segno +, all’altro il segno −. Tale definizione è piuttosto
naturale perché ci ricorda il Teorema fondamentale del Calcolo, la qual cosa
non è affatto casuale, scopriamo meglio perché.

8.4.4 Orientazione del bordo


Innanzitutto bisogna precisare più sensatamente la questione dell’orienta-
zione. In particolare, dobbiamo precisare come l’orientazione di una varietà
si riflette sull’orientazione del suo bordo.
• Se consideraiamo una linea orientata, il bordo della linea sono i suoi
estremi. Essi vengono orientati associando ad essi un segno: + se la
linea entra nell’estremo, − se la linea esce dall’estremo (fig. 8.4).

Figura 8.4: Gli estremi di una linea orientata ereditano l’orientazione della
linea mediante la differenziazione tra l’estremo da cui la linea esce e l’estremo
in cui la linea entra.
180 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

• Se consideraiamo una superficie orientata, il bordo della superficie è


una linea chiusa. Dire che la superficie è orientata significa dire che
è fissato un verso positivo di circolazione su ogni parallelogramma che
giace sulla superficie. Il bordo erediterà questa orientazione, nel senso
che sarà orientato coerentemente con il verso positivo di circolazione
dei parallelogrammi della superficie (fig. 8.5).

Figura 8.5: Il bordo di una superfice eredita l’orientazione coerentemente


con l’orientazione dei parallelogrammi sulla superficie.

• Se consideraiamo un volume orientato, il bordo del volume è una super-


ficie chiusa. Dire che il volume è orientato significa fissare l’ordine degli
spigoli di un cubetto A contenuto del volume.30 Consideriamo ora un
altro cubetto B che abbia la base giacente sulla superficie di contorno
del nostro volume e il terzo spigolo uscente dal volume. L’orientazione
della superficie orientata sarà data dall’orientazione della base di questo
cubetto B, che a sua volta sarà quella per cui questo cubetto (giacente
sul bordo) è equiorientato rispetto al cubetto A contenuto nel volume
(fig. 8.6).

Figura 8.6: Il bordo di un volume eredita l’orientazione del volume di modo


che il cubetto B che esce dalla superficie di contorno sia equiorientato al
cubetto A contenuto nel volume.

30
Questo equivale sostanzialmente a fissare il senso di avanzamento di una vite, cioè
oltre a fissare un senso di rotazione serve anche un verso di avanzamento.
8.4. IL DIFFERENZIALE ESTERNO 181

D’ora in poi considereremo quindi varietà con bordo e supporremo che


la varietà ed il suo bordo siano orientati compatibilmente (nel senso esposto
sopra).

8.4.5 Il Teorema di Stokes generalizzato


Consideriamo ora una p-forma31 αp ed il suo differenziale esterno dαp , che è
una p + 1 forma. Un risultato importante (Teorema di Stokes generaliz-
zato) collega l’integrale di dαp su una certa regione +Vp+1 e l’integrale di αp
calcolato sul bordo (orientato) di tale regione, cioè su Sp = ∂Vp+1 .
Teorema di Stokes generalizzato. Se αp è una p-forma, allora
Z Z
dαp = αp . (8.27)
+Vp+1 Sp =∂Vp+1

+Vp+1 è un volume p + 1-dimensionale orientato; Sp è il suo contorno, che


ne eredita (nel senso precedentemente specificato) l’orientazione; infine αp
è una p-forma qualsiasi. Possiamo riassumere l’enunciato del teorema nello
schema in figura 8.7.

Figura 8.7: Schematizzazione del Teorema di Stokes generalizzato. Vp+1 è un


volume orientato, Sp è il suo bordo; αp è una p-forma, βp+1 è il suo differenziale.
Integrare αp su Sp vuol dire calcolare una certa quantità (indicata tra parentesi
angolari, con pedice p) dipendente sia da αp sia da Sp ; analogamente per βp+1
e Vp+1 . Il Teorema di Stokes generalizzato afferma che queste due quantità
calcolate coincidono.

8.4.6 Declinazioni del Teorema di Stokes


Esemplifichiamo il Teorema di Stokes generalizzato nel caso di R3 . Notiamo
innanzitutto il fatto che nell’enunciato del teorema non si richiede alcuna
31
L’indice che metteremo a pedice starà solo ad esplicitare il grado della forma.
182 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

nozione di distanza né di prodotto scalare. Il teorema, per essere valido, non
ha bisogno di alcuna struttura metrica. Nel caso di R3 , però, queste nozioni
esistono, poiché esso è munito di una struttura euclidea, cioè di un prodotto
scalare definito positivo che induce quindi una distanza.
Nel di R3 possiamo considerare al massimo fino alle 3-forme (per le quali
esisterà un’unica funzione di base, ad esempio dx∧dy∧dz), in particolare var-
ranno le seguenti corrispondenze tra forme integrande e luoghi di integrazione
di tali forme:

0-forme ←→ punti
1-forme ←→ linee
2-forme ←→ superfici
3-forme ←→ volumi

Ad esempio, prendendo una 1-forma α, il suo differenziale sarà una 2-


forma. Per il Teorema di Stokes generalizzato abbiamo un legame tra i loro
integrali. Nel caso di R3 , quindi, ci saranno in totale tre declinazioni del Teo-
rema di Stokes generalizzato, che sono note come Teorema del Gradiente,
Teorema del Rotore e Teorema della Divergenza. In apparenza, le
tre declinazioni del Teorema di Stokes generalizzato e i teoremi sopra citati
dell’analisi sembrerebbero avere aspetti diversi, come mostrato dalla tabella
comparativa 8.1.

Declinazioni del Teorema di Stokes Teoremi dell’analisi


Teorema del Gradiente32 .
3
Z f ∈ Ω0Z(R ) è una 0-forma:
Se Se
Z f è una funzione:
df = f grad f · dP = f (P )|PP10 = f (P1 ) − f (P0 )
+C ∂C +C
Teorema del Rotore.
(R3 ) è una 1-forma: ~
Z α ∈ Ω1 Z
Se Se
Z A è un campo vettoriale:
Z
dα = α ~
rot A · ~n dS = A~ · dP
+S C=∂S +S +C=∂S
Teorema della Divergenza.
Se β ∈ Ω2 (R 3 ~
Z Z ) è una 2-forma: Se
Z B è un campoZ vettoriale:
dβ = β ~ dV =
divB B~ · ~n dS
+V S=∂V +V +S=∂V

Tabella 8.1: Tabella comparativa tra le declinazioni del Teorema di Stokes


generalizzato e i teoremi dell’analisi.
8.4. IL DIFFERENZIALE ESTERNO 183

Per spiegare queste corrispondenze bisogna comprendere il legame tra


l’unica 33 operazione di differenziale esterno definita sulle forme e i tre ope-
ratori differenziali del calcolo vettoriale.
Questa corrispondenza (caso particolare di una dualità più generale, nota
con il nome di dualità di Hodge) utilizza sia la struttura metrica dello spa-
zio euclideo, sia la sua orientazione. Se facciamo uso di queste nozioni, infatti,
possiamo associare a 0-forme, 1-forme, 2-forme e 3-forme rispettivamente
funzioni, campi vettoriali polari34 , campi vettoriali assiali e pseudofunzioni.

Dualità tra forme e campi vettoriali


È chiaro che a una 0-forma f (x1 , x2 , x3 ) = f (x, y, z) associeremo banalmente
la funzione F = f , essendo f stessa una funzione.
Focalizziamoci sulla prima riga della tabella (8.1). Mediante la diffe-
renziazione di f perveniamo a una 1-forma α = df . Tale forma si potrà
scomporre sulla base dei proiettori come

α = a1 dx1 + α2 dx2 + α3 dx3 = αx dx + αy dy + αz dz,

dove nell’ultimo passaggio abbiamo solamente rinominato le componenti della


1-forma per conformarle alla scelta di coordinate (x, y, z). Chiamiamo A ~=
grad F il gradiente della funzione F prima trovata. Vogliamo scoprire il
legame che c’è tra questo df = α e il grad F = A,~ di modo da esplicitare la
relazione nella prima riga della tabella 8.1. Essendo
 
∂F ∂F ∂F
grad F = , ,
∂x ∂y ∂z

il vettore delle derivate parziali, ed essendo F = f , dalla scrittura


∂f ∂f ∂f
df = dx + dy + dz
∂x ∂y ∂z
e dall’uguaglianza f = F discende per confronto che
∂f ∂f ∂f
αx = , αy = , αz =
∂x ∂y ∂z
e dunque che
~ = αx~i + αy~j + αz~k.
A (8.28)
33
Ecco dunque un altro vantaggio di utilizzare le forme: l’operazione di derivazione
naturale è una sola: tutti gli operatori del calcolo vettoriale si riconducono ad essa.
34
Per le precisazioni su vettori polari e assiali si veda la nota 1 a pagina 155.
184 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Passiamo ora alla seconda riga della tabella (8.1). Ora supponiamo di
considerare una 1-forma α generica ed il campo vettoriale A~ associato ad essa
come descritto dalla (8.28). Differenziamo questa35 1-forma α, ottenendo una
y
2-forma β = dα. Consideriamo ora la quantità B = rot A. ~ Come prima, se
~
riusciamo a trovare il legame tra dα e rot A abbiamo trovato il nesso coesivo
per la seconda riga della tabella (8.1). Innanzitutto notiamo che

β = β12 dx1 ∧ dx2 + β13 dx1 ∧ dx3 + β23 dx2 ∧ dx3


= βz dx ∧ dy − βy dx ∧ dz + βx dy ∧ dz
= βz dx ∧ dy + βy dz ∧ dx + βx dy ∧ dz

dove abbiamo rinominato le componenti di β adottando la convenzione nu-


merica di associare all’1 la x, al 2 la y e al 3 la z, e di chiamare la componente
con l’unica lettera non associata ad alcuno dei suoi pedici. Per convenzione
diamo segno positivo alle componenti le cui funzioni di base rispettano l’or-
dine naturali delle permutazioni tra x, y e z, segno negativo altrimenti.36
Inoltre se scomponiamo α come

α = αx dx + αy dy + αz dz

35
Chiaramente questa 1-forma α non sarà la 1-forma definita precedentemente come
α = df , altrimenti differenziandola si perverrà al risultato banale di

dα = d(df ) = d2 f = 0,

per il Lemma di Poincaré. α sarà una generica 1-forma.


36
Ad esempio, la componente βy è stata presa con segno negativo perché la sua forma di
base dx∧dz non rispetta l’ordine delle permutazioni della prima forma dx∧dy. Permutando
infatti mediante

 x→y
y→z
z→x

perveniamo prima alla forma dy ∧ dz e quindi alla forma dz ∧ dx, la quale non coincide
con la forma di base per βy , ma ne è l’antisimmetrica:

dz ∧ dx = −dx ∧ dz,

da cui l’immediata sensatezza della convenzione da noi adottata di anteporre un segno


meno alle componenti che non rispettano l’ordine della permutazione.
8.4. IL DIFFERENZIALE ESTERNO 185

risulta che

β = dα = d(αx dx + αy dy + αz dz)
= d(αx ∧ dx + αy ∧ dy + αz ∧ dz)
= dαx ∧ dx + dαy ∧ dy + dαz ∧ dz
   
∂αx ∂αx ∂αx ∂αy ∂αy ∂αy
= dx + dy + dz ∧ dx + dx + dy + dz ∧ dy+
∂x ∂y ∂z ∂x ∂y ∂z
 
∂αz ∂αz ∂αz
+ dx + dy + dz ∧ ∧dz
∂x ∂y ∂z
     
∂αy ∂αx ∂αx ∂αz ∂αz ∂αy
= − dx ∧ dy + − dz ∧ dx + − dy ∧ dz,
∂x ∂y ∂z ∂x ∂y ∂z
e per confronto con la scomposizione precedente di β abbiamo che
∂αy ∂αx ∂αx ∂αz ∂αz ∂αy
βz = − , βy = − , βx = − .
∂x ∂y ∂z ∂x ∂y ∂z
Dato che
~ = αx~i + αy~j + αz~k,
A
~
il vettore (βx , βy , βz ) va a coincidere con il rotore di A:

βx~i + βy~j + βz~k = rot A,


~
y
e per la definizione di B, tenendo presente la regola sopra esposta per le
componenti di β, vale la relazione
y
B = βx~i + βy~j + βz~k. (8.29)

Infine focalizziamoci sulla terza riga della tabella (8.1). Supponiamo di


y
considerare una 2-forma β generica ed il campo vettoriale B associato ad
essa come descritto dalla (8.28). Tale campo vettoriale sarà in sostanza
y
B = βx~i + βy~j + βz~k.

Differenziamo la 2-forma β, ottenendo37 una 3-forma γ = dβ. Chiamiamo g


y y
la divergenza del vettore assiale B: g = divB. Notiamo che γ ha una sola
componente, cioè che

γ = γ123 dx1 ∧ dx2 ∧ dx3 = γ123 dx ∧ dy ∧ dz.


37
Di nuovo: questa 2-forma β non sarà la 2-forma definita precedentemente come β =
dα, altrimenti differenziandola si otterrebbe solo una forma nulla.
186 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Ancora una volta, se scomponiamo β come

β = βz dx ∧ dy + βy dz ∧ dz + βx dy ∧ dz

risulta che

γ = dβ = d(βz dx ∧ dy + βy dz ∧ dz + βx dy ∧ dz)
= d(βz ∧ dx ∧ dy + βy ∧ dz ∧ dz + βx ∧ dy ∧ dz)
= dβz ∧ dx ∧ dy + dβy ∧ dz ∧ dz + dβx ∧ dy ∧ dz
 
∂βz ∂βz ∂βz
= dx + dy + dz ∧ dx ∧ dy+
∂x ∂y ∂z
 
∂βy ∂βy ∂βy
+ dx + dy + dz ∧ dz ∧ dx+
∂x ∂y ∂z
 
∂βy ∂βy ∂βy
+ dx + dy + dz ∧ dy ∧ dz
∂x ∂y ∂z
 
∂βx ∂βy ∂βz
= + + dx ∧ dy ∧ dz
∂x ∂y ∂z
y
= divB dx ∧ dy ∧ dz
= g dx ∧ dy ∧ dz

dove l’ultimo passaggio vale per la definizione di g. Dal confronto con la


precedente scomposizione di γ si ha immediatamente che

g = γ123 . (8.30)

Che cosa è g = γ123 ? Una funzione? Certo, è una funzione, la quale però
dipende dall’orientazione dello spazio. Dalla scomposizione di γ, è chiaro che
scambiando il ruolo di dx e dy, la funzione γ123 cambia di segno - per com-
pensare all’antisimmetria del prodotto esterno è essa stessa antisimmetrica.
Diremo che g = γ123 è una pseudofunzione, cioè una funzione che cambia
segno al cambiare dell’orientazione spaziale.
Tutto quello che abbiamo fino a qui trovato può essere riassunto nel
diagramma di figura 8.8.

Intervento della metrica


y
Nelle corrispondenze tra β e B e tra γ e g si vede chiaramente interve-
nire il fatto che stiamo lavorando in uno spazio euclideo, che quindi ha
un’orientazione fissata. Sembrerebbe invece che la proprietà metrica di
8.4. IL DIFFERENZIALE ESTERNO 187

Figura 8.8: Corrispondenze tra p-forme e funzioni (caso particolare della


dualità di Hodge). I coefficienti αx , αy , αz , βx , βy , βz , γ123 si intendono definiti
come spiegato nella trattazione. Il diagramma deve essere letto con la seguente
convenzione: la 1-forma α che viene differenziata per ottenere β sarà una
generica 1-forma, e non il differenziale di f - altrimenti, banalmente, β sarebbe
nullo per il Lemma di Poincaré. Questa convenzione vale anche per tutti gli
altri enti in gioco.
188 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

R3 non intervenga da nessuna parte. Ma, come spesso, l’apparenza in-


ganna. Mostriamo ad esempio l’intervento (essenziale!) della metrica nella
~
corrispondenza tra α ed A.
Se non lavorassimo in coordinate cartesiane ortogonali, la metrica dello
spazio euclideo non avrebbe la forma pitagorica

ds2 = dx2 + dy 2 + dz 2 ,

ma avrebbe una forma più generale

ds2 = gjk (x1 , x2 , x3 )dxj dxk

che è nota col nome di prima forma fondamentale38 . La matrice dei gjk ,
con j, k = 1, 2, 3 è detta tensore metrico e ha la caratteristica di essere una
matrice simmetrica.
Ad esempio in coordinate sferiche, la metrica è

ds2 = dr2 + r2 (dθ2 + sin2 θdϕ2 ),

e dunque il tensore metrico è la matrice diagonale


 
1 0 0
gjk = 0 r2 0 
0 0 r sin2 θ
2

La struttura metrica dello spazio è sempre racchiusa in questo tensore.


La forma di gjk cambia con una legge ben determinata al cambiare delle
coordinate (legge della covarianza):

∂xj ∂xk
gj 0 k0 = gjk
∂xj 0 ∂xk0
Dunque la struttura metrica dello spazio euclideo è descritta da una
matrice simmetrica in ogni sistema di coordinate.
Usando la corrispondenza che c’è tra α e A,~ possiamo scrivere che in
generale
Aj = g jk αk , (8.31)
dove g jk è la metrica in forma controvariante, ovvero

g jk = (gjk )−1 ,
38
Per tutte le precisazioni e gli esempi riportati in questa sezione si rimanda alla nota
23 a pagina 175.
8.4. IL DIFFERENZIALE ESTERNO 189

cioè g jk è l’inverso del tensore metrico. La (8.31) è del tutto equivalente


a dire che αk = gkj Aj . Sempre dalla (8.31) notiamo che dunque che la j-
esima componente del vettore A ~ non è esattamente la j-esima componente
di α, ma entra in gioco il tensore metrico. Se usiamo le coordinate cartesiane
ortogonali, questo gioco viene mascherato dal fatto che la metrica è la matrice
identica, cioè gjk = δjk , ma allora anche g jk = δjk , e l’unico termine che si
salva nella sommatoria al secondo membro della (8.31) è solo il j-esimo, per
il quale g jj = 1, e dunque ritroviamo che Aj = αj . Ma in generale non è cosı̀!
Questo ci dice che il differenziale α di una funzione f in generale non è il
gradiente A ~ della funzione. Anzi, vale che

df = grad f · dP, (8.32)


dove dP è il vettore dello spostamento infinitesimale, e · è il prodotto scalare
- che palesa l’intervento della metrica. La (8.32) è una bella definizione per
il gradiente di f , poiché mostra la dipendenza del gradiente da un prodotto
scalare, dunque dalla metrica.
La differenza sostanziale tra differenziale e gradiente è che, mentre il
differenziale è una 1-forma, il gradiente è un campo vettoriale. Lo scarto
è nel fatto che le componenti di questi due enti si trasformano in maniera
diversa e si rende necessaria la metrica per collegarli. Mentre il differenziale
è definito intrinsecamente, il gradiente ha bisogno della metrica. La metrica
è dunque essenziale per compensare la diversa legge di trasformazione delle
∂P
componenti di 1-forme e di campi vettoriali sulle basi naturali dxj e ∂x j

associate (rispettivamente nello spazio duale e nello spazio tangente) alle


coordinate xj prescelte. Le componenti di A ~ si trasformano come
j0
j0 j ∂x
A =A ,
∂xj
mentre le componenti della 1-forma α si trasformano come
∂xk
αk0 = αk .
∂xk0
Di conseguenza:

∂xk k
∂xk
 
j ∂x
= gkj k0 Aj =

αk0 = αk k0 = gkj A
∂x ∂xk0 ∂x
k j
∂xk ∂xj
   
∂x j 0 ∂x 0 0
= gkj k0 A j 0 = gkj k0 j 0 Aj = gk0 j 0 Aj ,
∂x ∂x ∂x ∂x
dove il primo passaggio vale per la legge di trasformazione delle componenti
di α, il secondo passaggio vale per l’ipotesi che α sia associato a un campo
190 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

~ il terzo passaggio commutatività e associatività del prodotto


vettoriale A,
scalare, il quarto passaggio per la legge di trasformazione delle coordinate
~ il quinto ancora per commutatività e associatività del prodotto scalare
di A,
e l’ultimo passaggio vale per la legge di trasformazione del tensore metrico.
Dunque
0
αk = gkj Aj ⇐⇒ αk0 = gk0 j 0 Aj , (8.33)
e abbiamo toccato con mano il fatto che la metrica sia risultata essenziale
~
per mantenere invariata la legge che lega le componenti di α a quelle di A.
L’intervento della metrica nella definizione del gradiente spiega perché il
gradiente di una funzione F in coordinate polari non abbiamo come compo-
nenti le derivate parziali ∂F
∂r
e ∂F
∂θ
.
Supponiamo infatti che

f (x, y) = F (r, θ),

dove per convenienza abbiamo usato lettere diverse per una stessa funzione
scritta in due coordinate differenti. Allora si ha che
∂f ~ ∂f ~ ∂F 1 ∂F ∂F ∂F
grad f = i+ j= ~er + ~eθ 6= ~er + ~eθ .
∂x ∂x ∂r r ∂θ ∂r ∂θ
Perché?
Diamo due spiegazioni. La prima spiegazione mantiene la metrica carte-
siane, e trae le mosse dalla (8.32). Dato, che

df = grad f · dP,

dette (Gr , Gθ ) le componenti del gradiente di F , il dP è dato da

dP = ds + rdθ,

e dunque risulta che39

∂F ∂F
dr + dθ = grad f · dP = (Gr~er + Gθ~eθ ) · (dr~er + rdθ~eθ ) =
∂r ∂θ
= Gr dr + Gθ (rdθ) = Gr dr + (Gθ r)dθ,

e dunque
∂F 1 ∂F
Gr = , Gθ = .
∂r r ∂θ
39
Qui il prodotto scalare è il prodotto scalare canonico: stiamo mantenendo la metrica
cartesiana.
8.4. IL DIFFERENZIALE ESTERNO 191

Figura 8.9: Metrica in coordinate cartesiane mediante il teorema di Pitagora:


ds2 = dr2 + r2 dθ2 .

Oppure possiamo assumere come metrica la metrica in coordinate polari


del piano euclideo. Dalla figura 8.9 ricaviamo che essa vale

ds2 = dr2 + r2 dθ2 ,

e dunque  
1 0
gjk = ,
0 r2
o anche, in forma controvariante (matrice inversa),
 
jk 1 0
g = .
0 r12

Perciò, per la (8.31), le componenti del gradiente sono40


   ∂F   ∂F 
1 0 ∂r
= 1∂r∂F .
0 r12 ∂F
∂θ r2 ∂θ

Ma come! Abbiamo asserito e abbiamo anche trovato prima che la seconda


componente del gradiente era 1r ∂F
∂θ
e ora troviamo che invece essa è r12 ∂F
∂θ
?
Dove è l’inghippo? L’inghippo sta nel fatto che scegliendo dr e dθ come
proiettori di base per la 1-forma α, e scegliendo di utilizzare la metrica in
40
Abbiamo infatti che la j-esima componente del gradiente è data da g jk αk , dove α = df .
Le αk , componenti della forma, hanno il notevole vantaggio di non dipendere dalla scelta
delle coordinate, perciò esse saranno esattamente ∂f ∂f
∂r e ∂θ indipendentemente dal fatto che
stiamo scegliendo coordinate polari. Il compito di ricollegare queste componenti a quelle
del gradiente viene demandato alla metrica.
192 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

coordinate polari, abbiamo trovato le componenti del vettore A ~ sulla base


naturale, che è diversa dalla base dei versori ~er e ~eθ , poiché non è ortonormata!
Il calcolo con la metrica restituisce le componenti sulla base naturale. La
discrepanza con il calcolo precedente è dunque dovuta al diverso significato
dato al termine “componenti”. Prima avevamo calcolato le componenti del
gradiente sulla base ortonormata (~er , ~eθ ). Ora, con la regola della metrica
abbiamo calcolato le componenti del gradiente sulla base naturale ∂P ∂P

,
∂r ∂θ
,
che non è affatto ortonormata. Dalla doppia scrittura
∂P ∂P
dP = dr~er + rdθ~eθ = dr + dθ
∂r ∂θ
segue che
∂P ∂P
~er =
, r~eθ = .
∂r ∂θ
Dunque ∂P∂θ
non è unitario, ma cresce in lunghezza all’allontanarsi di P dall’o-
rigine. Ne deduciamo, a partire da quanto avevamo calcolato sulla metrica,
che
∂F ∂P 1 ∂F ∂P
grad F = + 2
∂r ∂r r ∂θ ∂θ
∂F 1 ∂F
= ~er + 2 r~eθ
∂r r ∂θ
∂F 1 ∂F
= ~er + ~eθ ,
∂r r ∂θ
e ci siamo, poiché abbiamo ritrovato lo stesso risultato precedente.
y
Di fatto la metrica compare anche nelle relazioni che legano B a β e g
a γ, ma non è il caso di analizzarle nel dettaglio. L’importante è tenere
presente che divergenza, gradiente e rotore richiedono tutti la presenza e l’in-
tervento del tensore metrico. Il differenziale esterno invece non ha questo
problema: in questo senso generalizza e sublima i tre operatori dell’analisi.
Vedremo anche, nella prossima lezione, che le leggi di Maxwell, usualmente
scritte mediante tali operatori, si possono riscrivere in maniera elegante e
intrinseca utilizzando il differenziale esterno; ma prima di entrare nei det-
tagli, concludiamo questo excursus matematico accennando alla teoria dei
potenziali.

8.4.7 La teoria dei potenziali


Come ultima applicazione della teoria delle forme differenziali discutiamo la
teoria dei potenziali. Diamo innanzitutto le seguenti definizioni.41
41
Qualche accenno per il caso delle 1-forme era già stato dato nella nota 10 a pag. 162.
8.4. IL DIFFERENZIALE ESTERNO 193

Definizione 8.1. Una (p+1)-forma42 βp+1 si dice chiusa se il suo differen-


ziale è nullo:
dβp+1 = 0.

Definizione 8.2. Una (p+1)-forma βp+1 si dice esatta se è il differenziale


di una qualche forma αp di grado inferiore:

βp+1 = dαp .

La forma αp è detta potenziale di βp+1 .

Notiamo che i potenziali, in generale, non sono più funzioni scalari (solo
nel caso particolare di p = 0 lo sono). Questa definizione generalizza dunque
la comune definizione di potenziale. Non solo: non trattiamo più con poten-
ziali di campi vettoriali (questo è possibile solo in presenza di una metrica):
i potenziali sono potenziali di forme differenziali ; quanto accade con i campi
vettoriali accade solo di riflesso.43
A causa del Lemma di Poincaré, per cui d2 = 0, è chiaro che ogni forma
esatta è anche chiusa. Se infatti βp+1 = dαp , è immediato che

dβp+1 = d(dαp ) = 0.

Quindi la condizione dβp+1 = 0 è necessaria affinché esista il potenziale


di βp+1 . Nella dualità tra forme e campi vettoriali, possiamo ricavare alcune
condizioni in R3 . Sia α una 1-forma, f una funzione. L’implicazione

α = df ⇒ dα = 0,

vista “di riflesso” nella teoria dei campi vettoriali, per le analogie trovate
nella sezione 8.4.6, significa che44

~ = grad f ⇒ rot A
A ~ = 0,
y
(infatti B = rot A~ è il duale di dα) e dunque ricaviamo che rot grad f = 0, e
per la generalità di f abbiamo che

rot grad = 0. (8.34)


42
Anche in questa sezione useremo i pedici per specificare i gradi delle forme.
43
Questa osservazione è volutamente polemica: nella nostra impostazione i campi
vettoriali sono un’ombra della teoria delle forme differenziali.
44 ~ = grad f , f è detto “potenziale scalare” del campo A.
Se A ~ Analogamente, se
y y
~ A
B = rot A, ~ è detto “potenziale vettoriale” del campo B.
194 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO

Analogamente sia β una 2-forma e α una 1-forma. L’implicazione

β = dα ⇒ dβ = 0,

di riflesso diventa y y
~ ⇒ divB = 0,
B = rot A
y
~ = 0, e per
(infatti g = divB è il duale di dβ) da cui ricaviamo che div rot A
~
la generalità di A abbiamo che

div rot = 0. (8.35)

Quindi le identità differenziali del calcolo vettoriale sono casi particolari


dell’identità generale d2 = 0 (del Lemma di Poincaré).
Abbiamo visto che ogni forma esatta è chiusa, cioè che la condizione dβp+1
è necessaria affinché β ammetta potenziale. Ma è anche sufficiente?
La risposta è no.45 La sufficienza dipende dalla topologia dello spazio
in cui stiamo studiando le forme. In particolare, il “numero” (inteso come
45
Ad esempio la 1-forma
y x
α=− dx + 2 dy
x2 + y 2 x + y2
è una forma chiusa, poiché ha differenziale nullo. Infatti, dette
y x
αx = − , αy = ,
x2 + y2 x2 + y2
si ha che

dα = d(αx dx + αy dy) = d(αx ∧ dx + αy ∧ dy) = dαx ∧ dx + dαy ∧ dy =


   
∂αx ∂αx ∂αy ∂αy ∂αx ∂αy
dx + dy ∧ dx + dx + dy ∧ dy = dy ∧ dx + dx ∧ dy,
∂x ∂y ∂x ∂y ∂y ∂x
∂α
e per antisimmetria questa quantità si annulla allorché le derivate parziali ∂α ∂y e ∂x
x y

coincidono; fatto che risulta vero in questo caso - basta un semplice esercizio di derivazione
per mostrarlo. Ma α non può ammettere potenziale. Se lo ammettesse, a meno di una
costante, dovrebbe essere la 0-forma
y
f = arctan ,
x
la quale derivata rispetto a x e y restituisce rispettivamente αx e αy ; ma tale funzione non
può essere un potenziale per α. Infatti se α ammettesse potenziale, il campo A ~ ad essa
legato sarebbe conservativo, e dunque la sua circuitazione lungo cammini chiusi sarebbe
sempre nulla. Ma consideriamo γ, circonferenza unitaria in R2 ; su di essa si ha x = cos t
e y = sin t, e dunque cambiando variabile nell’integrale
Z Z 2π
α= (sin2 t + cos2 t)dt = 2π
γ 0
8.4. IL DIFFERENZIALE ESTERNO 195

dimensione di un sottospazio vettoriale) delle forme chiuse che non sono


esatte è un invariante topologico, detto “numero di Betti”.46
Se lo spazio in cui si lavora è topologicamente banale (ad esempio se è
uno spazio stellato47 rispetto ad un suo punto) l’ostruzione topologica viene
meno, e quindi ogni forma chiusa ammette potenziale.
Questa affermazione è nota come Inverso del Lemma di Poincaré, ed
equivale all’asserto che localmente 48 ogni p + 1-forma βp+1 chiusa ammette
potenziale αp , definito a meno del differenziale di una p − 1 forma. È infatti
chiaro che la p-forma αp è potenziale per βp+1 se e soltanto se lo è la p-
forma αp + dδp−1 (con δp−1 generica p − 1-forma) - infatti il differenziale di
quest’ultima quantità, per il Lemma di Poincaré, coincide con il differenziale
di αp . Vale in sintesi lo schema riportato in figura 8.10.

Figura 8.10: Relazioni tra forme chiuse e forme esatte.

notiamo che l’integrale su un cammino chiuso non è nullo, e dunque la forma non è esatta.
Come si vedrà fra poco, questo dipende dal fatto che α non è definita nell’origine, cioè è
definita in R2 r {0}, dominio che non è stellato.
46
Il fatto che la sufficienza dipenda dalla topologia dell’insieme su cui si lavora non
deve stupire: basti pensare che le forme differenziali sono per loro natura oggetti che si
integrano, dunque devono sposarsi con gli insiemi su cui le si integra.
47
Ricordiamo che un insieme A è stellato (rispetto a un suo punto p ∈ A) se, comunque
preso a ∈ A, il segmento che congiunge a con p è tutto contenuto in A. Ad esempio la sfera
unitaria è stellata rispetto ad ogni suo punto; viceversa R2 r{0} (in generale Rn r{0}) non
è stellato (rispetto a nessun punto), poiché, fissato (x, y) ∈ R2 , il segmento che congiunge
(x, y) con (−x, −y) passerà per l’origine e dunque non sarà contenuto completamente
nell’insieme.
48
Con “localmente” si intende in un opportuno aperto, dunque in un insieme
topologicamente banale.
196 LEZIONE 8. DALLA DINAMICA ALL’ELETTROMAGNETISMO
Lezione 9

Equazioni di Maxwell

La scoperta che il campo magnetico è una 2-forma permette di scrivere


in forma assoluta (cioè indipendentemente dall’osservatore) le equazioni di
Maxwell e di scoprirne la struttura.1

9.1 Relazioni fondamentali


Le equazioni di Maxwell descrivono le interazioni tra cariche elettriche sia
in quiete, sia in moto. In presenza di materia è conveniente distinguere le
cariche e le correnti in due categorie: quelle controllabili direttamente dallo
sperimentatore, dette libere o accessibili, e quelle invece vincolate alla materia
e prodotte dai fenomeni di polarizzazione e magnetizzazione, dette legate.
Questa distinzione ha senso soprattutto in una teoria macroscopica, dove
non si faccia un’analisi microscopica della distinzione di carica.
Cariche e correnti verificano la prima legge fondamentale dell’elettroma-
gnetismo, che in forma differenziale si scrive come
∂ρ
+ div~j = 0, (9.1)
∂t
che è la cosiddetta “equazione di continuità” e che traduce il principio di
conservazione della carica. Essa è un vincolo tra la derivata temporale della
densità volumica di carica ρ e la divergenza del vettore densità di corrente
~j. Per vedere più chiaramente che la (9.1) traduce la conservazione della
carica, possiamo notare che integrandola in un volume V attorno al punto
considerato otteniamo che
Z Z
∂ρ
dV + div~j dV = 0,
V ∂t V
1
Abbiamo incominciato dalla forza di Lorentz per scoprire il campo elettromagnetico,
e dal campo elettromagnetico scopriamo ora le equazioni di Maxwell.

197
198 LEZIONE 9. EQUAZIONI DI MAXWELL

e applicando il Teorema della Divergenza


Z Z
∂ ~j · ~n dS = 0,
ρ dV + (9.2)
∂t V ∂V

equazione che si riscrive immediatamente come2

∂q
+ i = 0, (9.3)
∂t
secondo cui ogni variazione di carica deve essere controbilanciata da una
corrente attraverso la superficie di contorno.3
Parallelamente alla distinzione delle cariche in due categorie, conviene in-
y y
~ e con (E,
trodurre due diversi campi elettromagnetici, indicati con (D, H) ~ B),
e detti rispettivamente:
y
D : campo di induzione elettrica
~ : campo magnetico
H
~ : campo elettrico
E
y
B : campo di induzione magnetica

~ E
I campi H, ~ sono vettori polari (insensibili alla variazione dell’orien-
tamento spaziale) e di essi si considera sempre la circolazione4 . I campi di
y y
induzione D, B sono vettori assiali (definiti scegliendo un’orientazione dello
spazio) e di essi si considera sempre il flusso5 .
2
Nella (9.1) ρ è la densità volumica di carica, che quindi integrata sul volume restituisce
la carica totale.
3
Possiamo generalizzare l’equazione (9.1) a un’equazione di bilancio

∂ρ
+ div~j = π,
∂t
dove π è un termine di produzione di carica. Cosı̀ facendo la conservazione della carica si
riduce a dire
π = 0.

4
La circolazione (o circuitazione) è intesa come integrale di linea. Se portata al limite
su circuiti infinitesimi restituisce il rotore del campo.
5
Per flusso si intende un integrale di superficie. Se portato al limite per superfici
infinitesime restituisce la divergenza del campo.
9.1. RELAZIONI FONDAMENTALI 199

y
Il primo campo elettromagnetico (D, H), ~ che convenzionalmente chiame-
remo “campo elettromagnetico di Maxwell”6 , è legato direttamente alle
sorgenti libere (cariche e correnti) dalle prime due equazioni di Maxwell
y
divD = ρ
y (9.4)
~ − ∂ D = ~j
rot H
∂t
che sono, nell’ordine, l’equazione di Gauss per il campo d’induzione elet-
y
trica D e la legge di Maxwell-Ampère. I termini ρ e ~j che compaiono sono
rispettivamente la densità volumica di carica libera e la densità delle cor-
renti libere. Insomma, queste due equazioni legano i campi di induzione alle
sorgenti libere.
Notiamo il fatto che l’equazione di continuità (9.1) si può ricavare dalle
equazioni (9.4). Se consideriamo la seconda di queste equazioni e prendiamo
la divergenza di ambo i membri, ricordando l’identità (8.35) per cui div rot =
0, si ha che
y y
~ − div ∂ D = 0 − ∂divD = − ∂ρ ,
div~j = div rot H
∂t ∂t ∂t
dove l’ultimo passaggio vale per la prima delle equazioni (9.4).
y
Il secondo campo elettromagnetico (E, ~ B), che convenzionalmente chia-
meremo “campo elettromagnetico di Faraday”7 , serve invece ad espri-
mere le azioni sulle cariche di prova, attraverso la legge di Lorentz
y
f~ = qprova (E
~ + ~v ∧ B). (9.5)

Tale campo elettromagnetico è poi caratterizzato dalle due condizioni di


vincolo imposte dal secondo blocco delle equazioni di Maxwell, secondo cui
y
divB = 0
y (9.6)
~ + ∂B = 0
rot E
∂t
che sono, nell’ordine, l’equazione di Gauss per il campo magnetico e l’equa-
zione di induzione magnetica di Faraday-Neumann-Lenz, per cui un campo
6
Poiché è il campo che compare nella equazione di Maxwell-Ampère (generalizzazione
della legge della circuitazione di Ampère con un termine correttivo di Maxwell).
7
Poiché è quello le cui componenti sono i coefficienti della 2-forma di Faraday.
200 LEZIONE 9. EQUAZIONI DI MAXWELL

magnetico variabile induce un campo elettrico non conservativo (cioè il cui


rotore è non nullo). In particolare il segno più nella seconda equazione (che
diventa naturalmente meno spostando il termine al di là dell’uguale) è dovuto
a Lenz, ed è fondamentale nella comprensione del significato dell’induzione.8
I due blocchi (9.4) e (9.6) formano, presi complessivamente, le quattro
equazioni di Maxwell. Per simmetria ci aspetteremmo due termini di carica
e corrente magnetiche ai secondi membri della (9.6); tuttavia troviamo solo
termini nulli. Sovente si dice che questi zeri possono essere letti come
y
divB = ρmagnetica = 0
y
~ + ∂ B = ~jmagnetica = 0
rot E
∂t
cioè come l’assenza di monopoli magnetici e di sorgenti del campo magnetico.
Il quadro delle equazioni di Maxwell è infine completato dalle relazioni
fenomenologiche tra i due campi elettromagnetici: una carica di prova risente
dell’azione esercitata da tutte le cariche elettriche presenti, sia libere, sia le-
y
gate. Dunque i campi (E, ~ B), che servono a calcolare le azioni sulla carica
di prova, dovranno necessariamente tenere conto di tutte le cariche presenti,
sia libere, sia legate. In presenza di materia (e quindi di fenomeni di polariz-
zazione e magnetizzazione), essi non potranno quindi coincidere con i campi
y
~ In generale si avrà che
(D, H).
y y
~ +P
D = ε0 E
y y (9.7)
~ +M
B = µ0 H

y
dove P è detto vettore di polarizzazione (legato alla creazione di dipoli
y
all’interno dei dielettrici) e M è detto vettore di magnetizzazione. Queste
y
decomposizioni esprimono la dipendenza dei campi E ~ e B da tutte le cariche:
y y
~ e dalle cariche legate attraverso P
dalle cariche libere attraverso D e H
y
e M . Questi ultimi due vettori devono essere precisati attraverso equazioni
costitutive che caratterizzano le proprietà della materia presente nella regione
di spazio considerata. Tali equazioni, a differenza delle equazioni generali
di Maxwell, possono avere una forma molto complicata, dove è realmente
racchiusa tutta la fisica del problema.
8
Quel segno infatti ci dice che il campo indotto si oppone alla variazione che l’ha
generato.
9.1. RELAZIONI FONDAMENTALI 201

Il caso più semplice si ha naturalmente se ci poniamo nel vuoto, dove


y y
P = 0 e M = 0. Ma possiamo scrivere equazioni semplici anche nel caso
di un mezzo omogeneo, isotropo e in quiete rispetto al riferimento conside-
rato; in questo caso possiamo postulare delle equazioni costitutive di semplice
proporzionalità, e sostituire alle equazioni (9.7) le equazioni
y
~
D = εE
y , (9.8)
~
B = µH

dove ε = ε0 εr è la costante dielettrica del mezzo in quiete e µ = µ0 µr è la


sua permeabilità magnetica.
A queste equazioni bisogna poi aggiungere una terza equazione costitutiva
che precisa la densità di corrente ~j. Nello stesso ordine di semplificazione, si
assume solitamente che valga la legge di Ohm e dunque9

~
~j = σ E, (9.9)

ove la costante di proporzionalità σ è detta conducibilità.


Riassumendo il tutto, finora abbiamo trovato il seguente sistema di equa-
zioni di Maxwell (quattro fondamentali e tre costitutive):
 y


 divD =ρ

 y
  y

~ − ∂ D D = εE ~
= ~j

 rot H

y
∂t  y
 B = µH ~


 divB = 0 ~
~j = σ E

 y

~ + ∂B = 0


 rot E

∂t
9
È da questa relazione che si ricava la forma più nota della legge di Ohm. Infatti
mettendoci nel caso particolare di un conduttore omogeneo e isotropo, di lunghezza L e
sezione traversale uniforme di area A alle cui estremità viene applicata una differenza di
potensiale ∆V , si ha che il campo è E = ∆V
L . Ammettendo anche che la densità di corrente
~j sia uniforme su tutta l’area A si ha allora che j = i . Sostituendo quanto trovato nella
A
(9.9) si ha che Ai = σ ∆V
L da cui
L
∆V = i,

e chiamando
L
R :=

la resistenza si ha la ben nota forma ∆V = Ri.
202 LEZIONE 9. EQUAZIONI DI MAXWELL

9.2 I potenziali di Hertz


Le rimanenti equazioni della teoria elettromagnetica sono le equazioni della
teoria dei potenziali di Hertz. Esse sono conseguenze matematiche delle
y
~ B).
equazioni di vincolo sui campi (E,
y
Dalla prima delle (9.6), cioè dal fatto che il campo B ha divergenza
~ tale per cui
nulla10 , segue che esiste sempre11 un campo vettoriale A
y
~
B = rot A. (9.10)

Tale campo è detto potenziale vettore del campo elettromagnetico.


Unendo questo risultato all’equazione di Faraday-Neumann-Lenz, la se-
conda delle (9.6), abbiamo che
y !
~ ~
rot E ~ + ∂A
~ + rot ∂ A = rot E
~ + ∂ B = rot E = 0,
∂t ∂t ∂t

e dunque il campo E ~ + ∂ A~ è irrotazionale, da cui discende immediatamente


∂t
che esiste una funzione scalare ϕ t.c.12
~
~ = − ∂ A − grad ϕ.
E (9.11)
∂t
Tale funzione è detta potenziale scalare del campo elettrico - laddove,
in effetti, non è proprio il potenziale del campo elettrico poiché, come ab-
biamo visto, quest’ultimo viene mediato attraverso una derivata parziale del
potenziale vettore.
La coppia (ϕ, A)~ è detta coppia dei potenziali di Hertz. Questi poten-
ziali non sono univocamente determinati: essi sono fissati a meno del gra-
diente di una funzione scalare ψ (detta funzione di calibrazione, o funzione
di “gauge”, dall’inglese) secondo le formule

~0 = A
A ~ + grad ψ
∂ψ . (9.12)
ϕ0 = ϕ −
∂t
10
En passant: un campo a divergenza nulla è detto solenoidale.
11
Se vogliamo, nella nostra analogia con le p-forme, questo discende dal fatto che ogni
p-forma chiusa è localmente anche esatta, dunque localmente ammette potenziale.
12 ~ è obbligato, mentre il
Nella (9.11) il segno meno davanti alla derivata parziale di A
segno meno davanti al gradiente di ϕ è una questione di convenzioni: possiamo sempre
prendere ϕ = −ϕ e tale segno diventa un più.
9.2. I POTENZIALI DI HERTZ 203

~ 0 ) è ancora una coppia di poten-


È immediato verificare che la coppia (ϕ, A
ziali di Hertz; basta tenere presente la (8.34) e invertendo il sistema (9.13),
notare che la riscrittura delle equazioni (9.10) e (9.11) resta invariata in
forma:
y
~ = rot(A
B = rot A ~ 0 − grad ψ) = rot A
~ 0 − rot grad ψ = rot A
~0

~
∂A ∂ ~0

∂ψ

~
E=− − grad ϕ = − (A − grad ψ) − grad ϕ + 0
=
∂t ∂t ∂t
∂A~ 0 ∂ grad ψ ∂ grad ψ ∂A~0
=− + − grad ϕ0 − =− − grad ϕ0
∂t ∂t ∂t ∂t
La funzione di calibrazione è del tutto arbitraria, poiché nessuna condi-
zione su di essa è imposta. Utilizzando questa arbitrarietà (cioè la scelta di
ψ) possiamo sempre enucleare una coppia (ϕ, A) ~ che verifichi un certo parti-
colare vincolo scalare. Per fissare una funzione ψ, insomma, possiamo sempre
porre un vincolo scalare che lega tale funzione ai potenziali. Per ragioni che
saranno molto chiare più avanti, è assai opportuno scegliere il vincolo scalare
sui potenziali dato da
divA~ + εµ ∂ϕ = 0, (9.13)
∂t
detto “gauge di Lorentz ”.13 Si noti il fatto che la funzione ψ non compare
esplicitamente nel vincolo, ma agisce nella “calibrazione” di (A,~ ϕ), nel senso
che tra gli infiniti valori che questa coppia di potenziali può assumere (al
variare appunto di una certa funzione ψ), scegliamo l’unico valore per cui la
(9.13) è verificata.
Riassumendo, abbiamo fino ad ora sette gruppi di equazioni:
Equazioni di Maxwell
(informazioni fisiche)
 y
divD = ρ ∂ρ
[3] + div~j = 0
[1]  ∂t
 y
~ − ∂ D = ~j
rot H
∂t  y
 y D = εE ~
divB = 0  y
[4]  B = µH ~
[2] 
 y
~ + ∂B = 0
rot E ~
~j = σ E
∂t
13 ~ = 0, che è detto “gauge di
In situazioni statiche esso si riduce al vincolo divA
Coulomb”.
204 LEZIONE 9. EQUAZIONI DI MAXWELL

Potenziali di Hertz
(conseguenze matematiche)

 y
~
B = rot A
[5] 

~
~ = − ∂ A − grad ϕ
E
∂t ~ + εµ ∂ϕ
[7] divA =0
 ∂t
~0 = A
A ~ + grad ψ
[6]  ∂ψ
ϕ0 = ϕ −
∂t

y
~ di Maxwell
[1] Equazioni di Maxwell per il campo elettromagnetico (D, H)
y
[2] Equazioni di Maxwell per il campo elettromagnetico (E,~ B) di Faraday
[3] Equazione di continuità (conservazione della carica)
[4] Equazioni costitutive
[5] Ruolo dei potenziali
[6] Arbitrarietà nella scelta dei potenziali
[7] Gauge di Lorentz

9.3 Equazioni delle onde


Se andiamo a tracciare il diagramma dei personaggi in gioco e delle loro tra-
sformazioni, ricaviamo la figura 9.1. L’intero schema è riassunto nel legame
~ e le sorgenti (ρ, ~j). Le equazioni che danno
tra i potenziali di Hertz (ϕ, A)
questo legame sono le equazioni delle onde elettromagnetiche. Per trovarle,
partiamo dalla seconda equazione di (9.4)

y
~ − ∂D .
~j = rot H
∂t

Supponendo il mezzo omogeneo, uniforme e in quiete rispetto al riferimento,


y y
possiamo sostituire D e H ~ con i campi E ~ e B di Faraday, ottenuti mediante
le equazioni costitutive (9.8) e quindi passare ai potenziali mediante la (9.10)
9.3. EQUAZIONI DELLE ONDE 205

e la (9.11). Abbiamo che


y
~ − ∂D
~j = rot H
∂t
1 ~
= rot B ~ − ε ∂E
µ ∂t
!
2~
1 ~ − ε − ∂ A − ∂ grad ϕ
= rot rot A
µ ∂t2 ∂t
2~
1 ~ + ε ∂ A + grad ∂ϕ .
= rot rot A
µ ∂t2 ∂t
Se ora usiamo l’identità14
~ = grad divA
rot rot A ~ − div grad A
~ (9.15)
otteniamo che
2~
~j = 1 div grad A ~ + ε ∂ A + grad ∂ϕ ,
~ − grad divA
µ ∂t2 ∂t
ovvero, moltiplicando ambo i membri per −µ e raccogliendo il gradiente:
∂2A~ 
∂ϕ

~ ~ ~
−µj = div grad A − εµ 2 − grad divA + εµ . (9.16)
∂t ∂t
Ecco che ora entra in gioco l’opportuna scelta della funzione arbitraria
ψ di cui alle (9.12): utilizzando l’arbitrarietà di questa ψ possiamo scegliere
i potenziali A~ e ϕ in modo tale che risultino calibrati secondo il gauge di
Lorentz, ovvero in modo tale che valga la (9.13):
∂ϕ ~ + εµ
divA= 0.
∂t
Dunque il termine nella parentesi della (9.16) si annulla, e l’equazione
assume la forma più semplice
2~
~ − εµ ∂ A .
−µ~j = div grad A (9.17)
∂t2
14
Identità che deve essere intesa componente per componente. Infatti non abbiamo
~ la (9.14) deve essere dunque intesa
definito alcun gradiente di un campo vettoriale A;
componente per componente, nel senso di
~ x = (grad divA)
(rot rot A) ~ x − div grad Ax
~ y = (grad divA)
(rot rot A) ~ y − div grad Ay . (9.14)
~ z = (grad divA)
(rot rot A) ~ z − div grad Az
206 LEZIONE 9. EQUAZIONI DI MAXWELL

~ non è altro che il laplaciano15 di A,


Ma la divergenza del gradiente di A ~
~ Si ha dunque che
sovente indicato con 4A.
2~
~ − εµ ∂ A .
−µ~j = 4A (9.18)
∂t2
A questo punto si devono ricordare le relazioni che definiscono la velocità
di propagazione nel vuoto e in un mezzo del campo elettromagnetico. Esse
sono
√ √
c ε0 µ0 = v εµ = 1, (9.19)
dove c è la velocità di propagazione nel vuoto e v è la velocità di propagazione
in un mezzo generico. Si ha che
1 1
c= √ v=√ ,
ε 0 µ0 εµ

per cui l’equazione (9.17) si può scrivere come

1 ∂2A~
~−
4A = −µ~j.
2
v ∂t2

~
o anche, introducendo l’operatore di D’Alembert (il d’alembertiano di A)
2~
~− 1 ∂ A
~ := 4A
A
v 2 ∂t2
possiamo scrivere
~ = −µ~j.
A (9.20)
15
Utilizzando l’operatore  
∂ ∂ ∂
∇= , ,
∂x ∂y ∂z
si ha immediatamente che per ogni ψ,
 
∂ψ ∂ψ ∂ψ
grad ψ ≡ ∇ψ = , ,
∂x ∂y ∂z

~
e per ogni campo A
~ ≡∇·A= ∂Ax ∂Ay ∂Az
divA + + ,
∂x ∂y ∂z
 
~ ≡∇∧A= ∂Az ∂Ay ∂Ax ∂Az ∂Ay ∂Ax
rot A − , − , − .
∂y ∂z ∂z ∂x ∂x ∂y
Dunque
~ := ∇2 A
4A ~ = ∇ · ∇A
~ = div(∇A)
~ = div grad A.
~
9.3. EQUAZIONI DELLE ONDE 207

Analogamente, dalla prima equazione delle (9.4), ricordando le equazioni


costitutive (9.8), nel caso di un mezzo isotropo, omogeneo e in quiete rispetto
al riferimento, otteniamo che

~ = ρ,
~ = ρ ⇒ divE
divD
ε

e ricordando l’equazione (9.11) relativa al potenziale scalare, possiamo scri-


vere che
!
ρ ∂A~ ~
∂A ~
∂A
= div − − grad ϕ = −div − div grad ϕ = −div − ∇2 ϕ.
ε ∂t ∂t ∂t

Utilizziamo a questo punto il gauge di Lorentz (9.13), cioè il fatto che

~ = −εµ ∂ϕ 1 ∂ϕ
divA =− 2 .
∂t v ∂t
Dunque possiamo scrivere che

1 ∂2ϕ ρ
2 2
− ∇2 ϕ = ,
v ∂t ε
cioè che
1 ∂2ϕ ρ
4ϕ − 2 2
=− , (9.21)
v ∂t ε
o, utilizzando la definizione di d’alembertiano, che
ρ
ϕ = − . (9.22)
ε

Le equazioni (9.20) e (9.22) sono dette equazioni delle onde, e prese


insieme formano il sistema delle onde

 A ~ = −µ~j
ρ (9.23)
 ϕ = −
ε

~ e le sorgenti (ρ, ~j).


che fornisce il legame tra i potenziali (ϕ, A)
Il diagramma in figura 9.1 fornisce il quadro completo (a meno delle
equazioni che descrivono gli scambi energetici) della teoria di Maxwell.16
16
Per un riferimento bibliografico, si confronti la tabella I3 di [8].
LEZIONE 9. EQUAZIONI DI MAXWELL
208
Figura 9.1: Diagramma riassuntivo della teoria di Maxwell.
9.4. FORMA ASSOLUTA DELLE EQUAZIONI DI MAXWELL 209

9.4 Forma assoluta delle equazioni di Max-


well
Il formalismo delle forme differenziali permette di scrivere in modo compatto
e trasparente le equazioni di Maxwell, ad eccezione delle equazioni costitutive,
nel caso generale di mezzi materiali in moto.
Per semplicità,17 ci limiteremo a presentare la formulazione assoluta nel
caso del vuoto, cioè quando tutte le cariche sono cariche libere.

9.4.1 La 3-forma delle sorgenti


Il punto di partenza è la descrizione delle sorgenti del campo magnetico.
Ci lasciamo guidare dall’osservazione che le cariche sono associate a volumi
spaziali (si parla infatti di carica contenuta in un certo volume), mentre le
correnti sono associate a superfici spaziali e a intervalli di tempo (si parla di
carica che attraversa la superficie in un certo intervallo di tempo). Per questo
scegliamo di caratterizzare le sorgenti mediante la 3-forma sullo spaziotempo
di Minkowski

J = ρ dx ∧ dy ∧ dz − (jx dy ∧ dz + jy dz ∧ dx + jz dx ∧ dy) ∧ dt. (9.24)

Infatti, cosı̀ facendo, la densità di carica ρ (che è relativa all’osservatore,


in quanto componente sulla base scelta) è associata a un volume infinitesimo,
e ciascuna componente della densità di corrente a una superficie infinitesima
e a un tempo infinitesimo. La 3-forma J è dunque una sorta di sorgente del
campo generalizzata, con le dimensioni di una carica.
Questa scelta di J è anche e soprattutto giustificata dall’osservazione che
la legge di conservazione della carica (9.1) si scrive nella forma elegante di18

dJ = 0, (9.25)
17
La teoria è vasta, e non è nostro scopo in questa sede fare una trattazione completa e
generale dell’elettromagnetismo. Preferiamo soffermarci sui particolari che ci interessano,
particolari che emergono perfettamente anche nel caso del vuoto.
18
Ci si potrebbe chiedere il perché del segno meno alle componenti di ~j: tale segno
è messo apposta per far sı̀ che il differenziale esterno di J si annulli se e solo se vale
l’equazione di continuità. Non è superfluo notare che, cosı̀ come abbiamo fatto per la
2-forma F, potremmo definire anche J a meno del segno, cioè considerare ogni termine con
il segno opposto a quello con cui compare nella (9.24). Infatti di J (e poi, come vedremo,
anche di F) dobbiamo imporre l’annullarsi del differenziale, il che equivale completamente
all’annullarsi del differenziale di −J. Scegliamo convenzionalmente di prendere i segni
come nella (9.24), la scelta contraria non sarebbe però stata un problema.
210 LEZIONE 9. EQUAZIONI DI MAXWELL

poiché, in effetti, differenziando, tenendo presente che per il Lemma di Poin-


caré d2 = 0 e l’antisimmetria del prodotto esterno19 , troviamo20

dJ = d (ρ dx ∧ dy ∧ dz − (jx dy ∧ dz + jy dz ∧ dx + jz dx ∧ dy) ∧ dt)


= dρ ∧ dx ∧ dy ∧ dz − (djx ∧ dy ∧ dz + djy ∧ dz ∧ dx + djz ∧ dx ∧ dy) ∧ dt
 
∂ρ ∂ρ ∂ρ ∂ρ
= dx + dy + dz + dt ∧ dx ∧ dy ∧ dz+
∂x ∂y ∂z ∂t
 
∂jx ∂jx ∂jx ∂jx
− dx + dy + dz + dt ∧ dy ∧ dz ∧ dt+
∂x ∂y ∂z ∂t
 
∂jy ∂jy ∂jy ∂jy
− dx + dy + dz + dt ∧ dz ∧ dx ∧ dt+
∂x ∂y ∂z ∂t
 
∂jz ∂jz ∂jz ∂jz
− dx + dy + dz + dt ∧ dx ∧ dy ∧ dt
∂x ∂y ∂z ∂t
∂ρ ∂jx
= dt ∧ dx ∧ dy ∧ dz − dx ∧ dy ∧ dz ∧ dt+
∂t ∂x
∂jy ∂jz
− dy ∧ dz ∧ dx ∧ dt − dz ∧ dx ∧ dy ∧ dt
∂y ∂z
 
∂ρ ~
= + divj dt ∧ dx ∧ dy ∧ dz,
∂t

espressione che si annulla se e solo se vale la conservazione della carica


espressa dalla (9.1).
19
Stiamo imponendo l’annullarsi di tutte le forme del tipo dx∧dx, e notando che valgono
le eguaglianze del tipo dy ∧ dz ∧ dx = dx ∧ dy ∧ dz, poiché esse corrispondono a un doppio
scambio tra i differenziali. Una doppia antisimmetria non cambia il segno della forma:

dy ∧ dz ∧ dx = −dy ∧ dx ∧ dz = dx ∧ dy ∧ dz.

20
In pratica, si usa la regola che se α è una forma chiusa, cioè se

dα = 0,

e in particolare se α è un elemento della base canonica, cioè

α = dxi ∧ dxj ∧ . . . ,

(e quindi di sicuro dα = 0 per il Lemma di Poincaré), presa una qualsiasi funzione f , si


avrà che
d(f α) = df ∧ α.
Notiamo in questo caso l’effetto immediato del differenziale esterno, che delega al prodotto
esterno il compito aumenta di un’unità il grado della forma.
9.4. FORMA ASSOLUTA DELLE EQUAZIONI DI MAXWELL 211

9.4.2 La 2-forma di Maxwell


In sostanza, la legge di conservazione della carica impone che J sia una forma
chiusa. Per l’Inverso del Lemma di Poincaré, se J è chiusa, localmente è anche
esatta. Quindi, localmente vale che

J = dM, (9.26)

dove M è una certa 2-forma. Vediamo bene di capire come è fatta questa
2-forma M.
In linea del tutto generale, essa ha la forma

M = Mx dy∧dz+My dz∧dx+Mz dx∧dy+Nx dx∧dt+Ny dy∧dt+Nz dx∧dt,


(9.27)
con (Mx , My , Mz , Nx , Ny , Nz ) funzioni scalari che vogliamo determinare. Pos-
siamo riunire tali funzioni in due vettori M ~ = (Mx , My , Mz ) e N
~ = (Nx , Ny , Nz ),
le cui componenti troviamo grazie alla (9.26), calcolando il differenziale esterno
di M e imponendo che coincida con J. Differenziando la (9.27), le uniche
derivate parziali delle componenti di M ~ eN ~ che si salvano sono quelle cor-
risponenti a coordinate che non sono presenti nella relativa 2-forma di base.
Ad esempio

d(Mx dy ∧ dz) = d(Mx ∧ dy ∧ dz) = dMx ∧ (dy ∧ dz) + Mx ∧ d(dy ∧ dz).

Il secondo termine si annulla per il Lemma di Poincaré, e otteniamo


 
∂Mx ∂My ∂Mx ∂Mx
d(Mx dy∧dz) = dMx ∧dy∧dz = dx + dy + dz + dt ∧dy∧dz,
∂x ∂y ∂z ∂t

e le uniche derivate parziali che non scompaiono per antisimmetria21 sono


quelle rispetto alla x e alla t. Analogamente si opera per tutti gli altri
termini, ottenendo che

dM = d(Mx dy ∧ dz + My dz ∧ dx + Mz dx ∧ dy + Nx dx ∧ dt + Ny dy ∧ dt + Nz dx ∧ dt)
   
∂Mx ∂My ∂Mz ∂Mx ∂Ny ∂Nz
= + + dx ∧ dy ∧ dz + − + dy ∧ dz ∧ dt+
∂x ∂y ∂z ∂t ∂z ∂y
   
∂My ∂Nz ∂Nx ∂Mz ∂Nx ∂Ny
+ − + dz ∧ dx ∧ dt + − + dx ∧ dy ∧ dt.
∂t ∂x ∂z ∂t ∂y ∂x

La 3-forma dM deve soddisfare l’uguaglianza (9.26), per cui dM = J. Ciò


significa che le sue componenti sulla base delle 3-forme devono soddisfare il
21
Infatti dy ∧ dy = dz ∧ dz = 0.
212 LEZIONE 9. EQUAZIONI DI MAXWELL

sistema 
∂Mx ∂My ∂Mz

 + + =ρ
∂x ∂y ∂z





 ∂Mx ∂Ny ∂Nz
− + = −jx


∂t ∂z ∂y

(9.28)
∂My ∂Nz ∂Nx
− + = −jy





 ∂t ∂x ∂z
 ∂Mz − ∂Nx + ∂Ny = −jz




∂t ∂y ∂x
che possiamo riscrivere vettorialmente come

~ =ρ

 divM
~ . (9.29)
 ∂ M + rot N
~ = −~j
∂t

Confrontando il sistema (9.29) con il primo blocco (9.4) delle equazioni


~ =D
di Maxwell si verifica subito che M ~ eN ~ = −H,~ da cui

M = (Dx dy ∧ dz + Dy dz ∧ dx + Dz dx ∧ dy) − (Hx dx + Hy dy + Hz dz) ∧ dt.


(9.30)
dove il segno meno al secondo membro è un riflesso della discrepanza di segno
tra le seconde equazioni dei due blocchi (9.4) e (9.6).22
M è detta 2-forma di Maxwell. Essa rappresenta per il campo elet-
tromagnetico di Maxwell ciò che la 2-forma di Faraday rappresenta per il
campo elettromagnetico di Faraday. Anche nella versione di Maxwell, dun-
y
que, le componenti del campo elettromagnetico (D, H) ~ non vanno intese
separatamente, ma all’interno di una 2-forma.
Sussiste quindi la seguente coimplicazione:
 y
 divD = ρ

dM = J ⇐⇒ y , (9.31)
 ~ − ∂ D = ~j
 rot H
∂t

cioè l’identità dM = J è una riscrittura del primo blocco delle equazioni di


Maxwell.
22
Si noti che, a differenza di J e F, M non può essere definita a meno del segno, se
vogliamo che l’equazione dM = J traduca il sistema di equazioni non omogenee di Maxwell.
Il segno di M dovrà essere preso coerentemente con il segno dato a J.
9.4. FORMA ASSOLUTA DELLE EQUAZIONI DI MAXWELL 213

9.4.3 La 2-forma di Faraday


y
~ B) sono le
D’altro canto, già sappiamo dalla sezione 8.1.3 che anche (E,
componenti di una 2-forma, la 2-forma di Faraday, appunto

F = (Bx dy∧dz+By dz∧dx+Bz dx∧dy)+(Ex dx+Ey dy+Ez dz)∧dt, (9.32)

la quale è completamente analoga a M, non fosse che per quel già discusso
segno meno.
Proviamo ora a prendere il differenziale esterno della 2-forma F.

dF = d(Bx dy ∧ dz) + d(By dz ∧ dx) + d(Bz dx ∧ dy) + d ((Ex + Ey + Ez ) ∧ dt)


= dBx dy ∧ dz + dBy dz ∧ dx + dBz dx ∧ dy+
+ dEx ∧ dx ∧ dt + dEy ∧ dy ∧ dt + dEz ∧ dz ∧ dt
 
∂Bx ∂Bx ∂Bx ∂Bx
= dx + dy + dz + dt ∧ dy ∧ dz+
∂x ∂y ∂z ∂t
 
∂By ∂By ∂By ∂By
+ dx + dy + dz + dt ∧ dz ∧ dx+
∂x ∂y ∂z ∂t
 
∂Bz ∂Bz ∂Bz ∂Bz
+ dx + dy + dz + dt ∧ dx ∧ dy+
∂x ∂y ∂z ∂t
 
∂Ex ∂Ex ∂Ex ∂Ex
+ dx + dy + dz + dt ∧ dx ∧ dt+
∂x ∂y ∂z ∂t
 
∂Ey ∂Ey ∂Ey ∂Ey
+ dx + dy + dz + dt ∧ dy ∧ dt+
∂x ∂y ∂z ∂t
 
∂Ez ∂Ez ∂Ez ∂Ez
+ dx + dy + dz + dt ∧ dz ∧ dt
∂x ∂y ∂z ∂t
 
∂Bx ∂By ∂Bz
= + + dx ∧ dy ∧ dz+
∂x ∂y ∂z
 
∂Bz ∂Ey ∂Ex
+ + − dx ∧ dy ∧ dt+
∂t ∂x ∂y
 
∂By ∂Ex ∂Ez
+ + − dz ∧ dx ∧ dt+
∂t ∂z ∂x
 
∂Bx ∂Ez ∂Ey
+ + − dy ∧ dz ∧ dt
∂t ∂y ∂z

Abbiamo scritto scomposto dF sulla base delle 2-forme composte dal pro-
dotto esterno dei differenziali delle funzioni coordinate. Se prestiamo ben
214 LEZIONE 9. EQUAZIONI DI MAXWELL

attenzione ai coefficienti possiamo anche scrivere che23


 
y ∂Bz ~
dF = divB dx ∧ dy ∧ dz + + (rot E)z dx ∧ dy ∧ dt+
∂t
   
∂By ~ ∂Bx ~
+ + (rot E)y dz ∧ dx ∧ dt + + (rot E)x dy ∧ dz ∧ dt.
∂t ∂t
(9.33)

Ora: che cosa succede se dF = 0? Quando dF si annulla, si devono


annullare tutti i suoi coefficienti, in particolare (condensando i termini in un
unica equazione vettoriale)
y
divB = 0
e y
~ + ∂ B = 0.
rot E
∂t
Abbiamo trovato la seguente coimplicazione:
 y
 divB = 0

dF = 0 ⇐⇒ y . (9.34)
 ~ =−
 rot E ∂ B
∂t
Cioè: imporre dF = 0 equivale a scrivere le equazioni differenziali24 che
costituiscono il secondo blocco (9.6) delle equazioni di Maxwell.

9.4.4 La 1-forma dei potenziali


Se valgono le equazioni di Maxwell, dunque, si ha che

dF = 0, (9.35)

da cui deduciamo che F è chiusa, e quindi localmente esatta. Localmente,


cioè, ammette potenziale. Esiste perciò una 1-forma

Φ = Px dx + Py dy + Pz dz + Pt dt.
23
Ricordiamo che la freccia curva messa come segno di vettore per il campo magnetico
y
sta ad indicare che il vettore B è un vettore assiale. Per le precisazioni su vettori polari e
assiali si veda la nota 1 a pagina 155.
24
La forma compatta mostra solo due equazioni, ma le relazioni sono in realtà quattro.
Infatti una 3-forma in uno spazio 4-dimensionale ha 4 componenti. Sono infatti quattro
le funzioni di base per le 3-forme in uno spazio 4-dimensionale. In generale non è difficile
vedere che in uno spazio n-dimensionale, le funzioni di base per le p-forme sono np .

9.4. FORMA ASSOLUTA DELLE EQUAZIONI DI MAXWELL 215

Questa forma dovrà verificare dΦ = F, e dato che


   
∂Px ∂Px ∂Px ∂Py ∂Py ∂Py
dΦ = dy + dz + dt ∧ dx + dx + dz + dt ∧ dy+
∂y ∂z ∂t ∂x ∂z ∂t
   
∂Pz ∂Pz ∂Pz ∂Pt ∂Pt ∂Pt
+ dx + dy + dt ∧ dz + dx + dy + dz ∧ dt =
∂x ∂y ∂t ∂x ∂y ∂z
     
∂Py ∂Px ∂Pz ∂Py ∂Px ∂Pz
= − dx ∧ dy + − dy ∧ dz + − dz ∧ dx+
∂x ∂y ∂y ∂z ∂z ∂x
     
∂Pt ∂Px ∂Pt ∂Py ∂Pt ∂Pz
+ − dx ∧ dt + − dy ∧ dt + − dz ∧ dt,
∂x ∂t ∂y ∂t ∂z ∂t

dall’uguaglianza con le componenti di F, detto P~s = (Px , Py , Pz ), otteniamo


che
rot P~s = B
~

e
∂ P~s ~
grad Pt − = E,
∂t
e per confronto con le equazioni (9.10) e (9.11) dei potenziali di Hertz otte-
niamo immediatamente che P~s = A ~ e Pt = −ϕ.
La 1-forma dei potenziali dunque è costituita dunque (potevamo in effetti
~ ϕ)
aspettarcelo) dalle componenti dei potenziali di Hertz (A,

Φ = Ax dx + Ay dy + Az dz − ϕdt (9.36)

e verifica
F = dΦ. (9.37)
Quest’unica equazione (9.37) quindi riassume e condensa le equazioni di
Hertz dei potenziali.
Infine, è ovvio che la 1-forma Φ è definita a meno del differenziale di una
0-forma ψ, nel senso che
Φ0 = Φ + dψ (9.38)
è ancora un potenziale per F in virtù del Lemma di Poincaré - infatti

dΦ0 = d(Φ + dψ) = dΦ + d2 ψ = dΦ.

9.4.5 Conclusione
Possiamo riassumere le relazioni trovate nel diagramma finale di figura 9.2.
LEZIONE 9. EQUAZIONI DI MAXWELL

Figura 9.2: Diagramma riassuntivo dell’elettromagnetismo dal punto di vista delle p-forme.
216
9.5. LE EQUAZIONI COSTITUTIVE 217

Alla luce di (9.34) e (9.31), le equazioni di Maxwell sono del tutto equi-
valenti al sistema 
dM = J
. (9.39)
dF = 0

C’è una considerazione molto interessante da fare: è vero che, per come
abbiamo ripensato la teoria elettromagnetica alla luce della Relatività Ri-
stretta, sicuramente le leggi dell’elettromagnetismo sono invarianti al cam-
biare dell’osservatore inerziale. Ma c’è anche qualcosa di più. Usando le
parole di B. Finzi25 :
Il carattere tensoriale delle leggi elettromagnetiche [(9.14)] formu-
late nello spazio-tempo ne assicura l’invarianza di fronte ad un gene-
rico cambiamento del riferimento spazio-temporale: di fronte, in par-
ticolare, al passaggio da un osservatore ad un altro in moto traslatorio
rettilineo uniforme rispetto al primo, ma di fronte anche al passaggio
da un osservatore ad un altro in moto qualsivoglia rispetto al primo. Si
dice, brevemente, che le equazioni elettromagnetiche soddisfano nello
spazio-tempo al principio di relatività generale

(Bruno Finzi, Teoria dei campi,


Cesare Tamburini ed., p.251)

9.5 Le equazioni costitutive


9.5.1 I problemi delle equazioni costitutive
Riprendiamo ora lo schema riassuntivo della teoria di Maxwell (figura 9.1):
siamo quindi riusciti nella sezione 9.4 a ritrascrivere in forma assoluta (con-
formemente con il principio di relatività) le equazioni dei collegamenti “ver-
ticali” nello schema. Per far ciò abbiamo utilizzato la teoria delle forme
differenziale, e abbiamo scoperto che con tale formalismo:

• i campi elettromagnetici sono 2-forme

F = (Bx dy ∧dz +By dz ∧dx+Bz dx∧dy)+(Ex dx+Ey dy +Ez dz)∧dt,

M = (Dx dy∧dz+Dy dz∧dx+Dz dx∧dy)−(Hx dx+Hy dy+Hz dz)∧dt,


ove il segno meno nell’espressione di M è dovuto sostanzialmente alla
differenza di segno tra le seconde equazioni dei blocchi di Maxwell (9.4)
e (9.6);
25
Il corsivo è nostro.
218 LEZIONE 9. EQUAZIONI DI MAXWELL

• le sorgenti sono una 3-forma

J = ρ dx ∧ dy ∧ dz − (jx dy ∧ dz + jy dz ∧ dx + jz dx ∧ dy) ∧ dt;

• i potenziali sono una 1-forma

Φ = Ax dx + Ay dy + Az dz − ϕdt.

Alla luce di questo nuovo formalismo abbiamo ricavato lo schema in figura


9.2.
È importante sottolineare che in tutte queste espressioni sono contenute
tutte le trasformazioni relativistiche. Abbiamo mostrato esplicitamente come
y
ricavare le trasformazioni per E ~ e B: il procedimento che abbiamo usato è
valido in generale. Ad esempio, data ρ in un sistema di riferimento, per cono-
scere ρ in un altro sistema di riferimento basta sostituire in J le trasformazioni
di Lorentz.
Rimangono da ritrascrivere in forma assoluta le equazioni costitutive26
“orizzontali” dello schema in figura 9.1, dove compaiono le costanti fenome-
nologiche del mezzo. Nel caso del vuoto, a cui ci restringiamo per semplicità,
si tratta delle due equazioni “elementari”
y
~
D = ε0 E
y , (9.40)
~
B = µ0 H

che paradossalmente sono le più complesse da ritrascrivere in forma asso-


luta, poiché richiedono l’utilizzo della metrica e dell’orientazione attraverso
la cosiddetta dualità di Hodge.
Si può capire che le equazioni (9.40) siano ostiche da trattare osservando
che:

(i) da un punto di vista relativo esse collegano vettori di tipo diverso, col-
legano cioè un vettore polare con un vettore assiale (e certamente l’uno
non può essere trasformato nell’altro semplicemente con la moltiplica-
zione per uno scalare);

(ii) da un punto di vista assoluto vi è un incrocio (chiamato nei libri di


y
~ B)
elettromagnetismo “rotazione di dualità”) tra la posizione di (E,
y y
~ nei due tensori elettromagnetici - in sostanza D corrisponde
e di (D, H)
26
Tali equazioni sono dette “costitutive” poiché per formularle è necessario avere notizie
sperimentali sul mezzo, quindi è necessaria un’analisi in laboratorio.
9.5. LE EQUAZIONI COSTITUTIVE 219

y
aBeH ~ corrisponde a E,~ a meno di un segno. Dunque se l’equazione
costitutiva si traducesse in una proporzionalità tra le 2-forme F e M, i
y y
ruoli dei quattro campi E,~ B, D, H
~ sarebbero scambiati, in particolare
y y
avremmo proporzionalità27 tra D e B e poi tra E ~ e H,
~ cosa che non
rispecchia affatto le equazioni costitutive (9.40). È chiaro che prima di
confrontare F e M, una delle due 2-forme deve essere “girata” in modo
da scambiare parte elettrica e parte magnetica. Questo è proprio la
funzione della dualità di Hodge, cui ora è necessario accennare a livello
matematico.

9.5.2 La dualità di Hodge


Da un punto di vista prettamente matematico, la dualità di Hodge è un
processo puramente algebrico che agisce su uno spazio vettoriale - nel caso
avessimo una varietà differenziabile invece di uno spazio vettoriale, possiamo
considerare lo spazio tangente alla varietà in un generico punto e quindi far
agire la dualità di Hodge punto per punto.
Consideriamo dunque uno spazio vettoriale V su R, di dimensione n =
dim(V ) e munito di un prodotto scalare (eventualmente semieuclideo)
h , i : V × V → R.
Notiamo che lo spazio vettoriale delle n-forme su V ha dimensione 1
(infatti vi è un’unica n-forma di base) e quindi tutte le n-forme sono multiple
tra loro. Dunque se ω, ω 0 ∈ Ωn (V ) necessariamente
ω 0 = λω
per un qualche λ ∈ R.
Le n-forme si possono dividere in due classi distinte, a seconda del segno
del fattore λ. Per far ciò definiamo innanzitutto la nozione di equiorientazione
di due n-forme.
Diremo che due n-forme (su uno spazio vettoriale V n-dimensionale) sono
equiorientate se il fattore λ che le lega è positivo. Viceversa, se λ < 0 diremo
che le due n-forme non sono equiorientate.
Definire un’orientazione su uno spazio vettoriale significa scegliere una
di queste due classi, prendendo ad esempio un suo rappresentante.28 In pra-
27
In realtà anche il segno non funzionerebbe: avremmo un segno meno che non è
contemplato nelle (9.40).
28
Stiamo privilegiando, sostanzialmente una di queste due classi, esattamente nel modo
in cui con la regola della mano destra privilegiamo un certo orientamento spaziale e non
un altro.
220 LEZIONE 9. EQUAZIONI DI MAXWELL

tica, perciò, fissare l’orientazione significa scegliere una forma volume.29 Ad


esempio, sullo spaziotempo di Minkowski prenderemo la forma volume di
Minkowski
ω = dx ∧ dy ∧ dz ∧ cdt,
che chiameremo forma volume di Minkowski. Fissare una forma volume
equivale a fissare l’ordine in cui le coordinate devono essere considerate.
Ogni volta che su V fissiamo un prodotto scalare e una forma volume
(cioè l’ordine delle coordinate), risulta definita una corrispondenza30

∗ : Ωp (V ) → Ωn−p (V ) (9.41)

chiamata dualità di Hodge.


Ad esempio per V = R3 si instaurerà una corrispondenza tra le 0-forme e
le 3-forme, e tra le 1-forme e le 2-forme. Usando tale corrispondenza fornita
dalla dualità di Hodge, possiamo limitarci a considerare solo i seguenti tipi
di forme:

0-forme, 1-forme, 1-forme duali, 0-forme duali,

ove le due ultime tipologie di forme sono a tutti gli effetti 1-forme e 0-forme,
solo che sono definite a meno dell’orientazione, nel senso che per definirle
serve avere fissata un’orientazione spaziale, cioè una forma volume. Per
ricordarsi di ciò si aggiunge l’aggettivo “duali”.
Sullo spaziotempo M di Minkowski, invece, considereremo

0-forme, 1-forme, 2-forme, 2-forme duali, 1-forme duali, 0-forme duali,

e dunque nelle ipotesi di Hodge (cioè la definizione di una forma volume)


possiamo limitarci all’analisi di 0-forme, 1-forme e 2-forme.
In altre parole, la dualità di Hodge è un modo per dimezzare il numero
di forme da considerare.
29
Dove per forma volume intendiamo una forma che coinvolga tutte le coordinate dello
spazio; ad esempio in R3 una forma volume sarebbe dx ∧ dy ∧ dz o anche −2 dx ∧ dy ∧ dz, e
cosı̀ via. Le forme volume sono quindi le p-forme di grado massimo su uno spazio vettoriale.
30
Si noti che infatti, per l’osservazione riportata nellanota 24 a pag. 214, le funzioni di
base per le p-forme in uno spazio n-dimensionale sono np , e per le proprietà del coefficiente
binomiale np = n−p
 
p , da cui lo spazio delle p-forme e lo spazio delle (n−p)-forme hanno lo
stesso numero di funzioni di base, cioè hanno la stessa dimensione. Sappiamo dall’algebra
lineare che due spazi vettoriali aventi la stessa dimensione sono isomorfi, ma in generale
non lo sono in una maniera privilegiata. La dualità di Hodge, invece, ci fornisce una
corrispondenza privilegiata tra questi due spazi. L’operatore ∗ è detto “operatore star
di Hodge”.
9.5. LE EQUAZIONI COSTITUTIVE 221

Per il momento, diciamo che il prodotto scalare


h , i:V ×V →R
definito sui vettori di V si estende in modo naturale prima sulle 1-forme (cioè
sugli elementi dello spazio duale di V ) con
h , i1 : V ∗ = Ω1 (V ) × V ∗ = Ω1 (V ) → R
e poi, nuovamente per estensione, sulle p-forme con
h , ip : Ωp (V ) × Ωp (V ) → R.
Quindi, date due p-forme α e β, a loro possiamo associare il numero reale
hα, βip ∈ R
che verrà detto ancora prodotto scalare (il pedice p sta a ricordare che le
due forme sono p-forme).
Con questi strumenti (prodotto scalare e forma volume), possiamo definire
con semplicità il duale di Hodge di una data p-forma α, vale a dire quella
(n − p)-forma β che corrisponde ad α mediante la relazione ∗.
Fissiamo una p-forma α di cui vogliamo costruire il duale e facciamone il
prodotto esterno con una (n − p)-forma β arbitraria. Otteniamo, in generale,
una n-forma α ∧ β che deve necessariamente essere un multiplo della forma
volume ω.31 Esiste perciò uno scalare λα (β), che dipende esplicitamente da
β ma anche dalla scelta32 di α, t.c.
α ∧ β = λα (β)ω. (9.42)
Il nodo è che lo scalare λα (β), dipende linearmente da β,33 e come ogni
funzione lineare su uno spazio vettoriale munito di prodotto scalare34 , può
essere scritta nella forma35
λα (β) = h∗α, βin−p . (9.43)
31
Chiaramente se α e β condividono una qualche funzione di base, il loro prodotto
esterno sarà banalmente nullo, e quindi sarà anche banalmente multiplo della forma
volume; ma questo caso è quello meno interessante.
32
Ecco perché scriviamo α come parametro a pedice e β come variabile esplicita.
33
Al raddoppiare della forma β chiaramente raddoppia α ∧ β e dunque anche il secondo
membro della (9.42). Essendo la forma volume ω fissata, è chiaro che deve raddoppiare la
funzione λα (β) - e cosı̀ via.
34
In questo caso lo spazio delle (n − p)-forme, munito del prodotto scalare h , in−p .
35
Dobbiamo pensare ad α e β come elementi di uno spazio vettoriale: lo scalare λα (β) è
quindi un funzionale lineare dello spazio duale. E sappiamo, come espliciteremo meglio tra
poco, che esiste una corrispondenza biunivoca privilegiata tra gli elementi di uno spazio
vettoriale e gli elementi del suo duale. Dunque la forma ∗α è unica.
222 LEZIONE 9. EQUAZIONI DI MAXWELL

In altre parole, per la linearità di λα (β) e per le proprietà del prodotto


scalare, fissata una forma α esiste un’unica (n − p)-forma ∗α associata ad α
t.c.
α ∧ β = h∗α, βin−p ω (9.44)
comunque scelta una (n − p)-forma β, e quindi, in generale:

α ∧ · = h∗α, ·in−p ω. (9.45)

La (n − p)-forma ∗α sarà detta duale di Hodge di α.

9.5.3 Applicazioni sullo spaziotempo di Minkowski


Ritorniamo ora a considerare uno spazio vettoriale particolare: lo spazio-
tempo M di Minkowski. Abbiamo introdotto la dualità di Hodge parlando
della necessità di avere un prodotto scalare; abbiamo accennato nel paragrafo
precedente al fatto che sulle p-forme è definito un certo prodotto scalare,
senza però mostrarlo esplicitamente. Ora è giunto il momento di mostrare
come questo prodotto scalare possa essere costruito grazie alla metrica di M .
Si procede in due passi.

(i) Innanzitutto si osserva che il prodotto scalare, ovvero la metrica dello


spaziotempo di Minkowski, avente la forma36
 
1 0 0 0
0 1 0 0 
η = diag(1, 1, 1, −1) = 
0 0 1 0  ,

0 0 0 −1

stabilisce una corrispondenza uno a uno tra un V = TP M e il suo


duale V ∗ = TP M ∗ . In breve, il prodotto scalare identifica un spazio
V con il suo duale V ∗ . Questa corrispondenza è definita dal teorema
di rappresentazione delle forme lineari usato in precedenza. Più espli-
citamente: fissato un certo ~u ∈ V , con V spazio vettoriale munito di
prodotto scalare, a questo ~u è sicuramente associata una forma lineare
α(·) := h~u, ·i : V → R che a ogni vettore in ingresso associa uno scalare
del campo. In simboli:

V 3 ~u  h~u, ·i = α(·)  α ∈ V ∗ .
36
Indicheremo, come è divenuta ormai consuetudine, con η la metrica dello spaziotempo
di Minkowski.
9.5. LE EQUAZIONI COSTITUTIVE 223

Questo ci dice che ogni vettore definisce una forma lineare, e - sim-
metricamente - ogni forma lineare si può rappresentare come prodotto
scalare per un opportuno vettore.
In componenti rispettivamente sulla base naturale e sulla base duale,
possiamo scrivere che
∂P
~u = uj α = αk dxk
∂xj
e dato che
αk ·k = αk dxk (·) = α(·) = h~u, ·i = ηjk uj ·k ,
abbiamo che
αk = ηkj uj , (9.46)
il che palesa un abbassamento degli indici, e che
uj = η jk αk , (9.47)
il che mostra un innalzamento degli indici, dove η jk è la metrica in
forma controvariante, cioè l’inverso del tensore metrico.
Indicando la corrispondenza precedente con η : V → V ∗ e la sua inversa
con η −1 : V ∗ → V , è facile vedere che si ha
~
η −1 (dx) = I, ~
η −1 (dy) = J, ~
η −1 (dz) = K, ~
η −1 (cdt) = −L,
(9.48)
o, del tutto analogamente,
~ = dx,
η(I) ~ = dy,
η(J) ~ = dz,
η(K) ~ = −cdt.
η(L) (9.49)

Le formule (9.48) e (9.49) danno, in concreto, la rappresentazione del


precedente isomorfismo sulla base associata alla tetrade ortonormata
di un osservatore inerziale.
• A questo punto si usa la corrispondenza η : V ∗ → V per “riportare
indietro” il prodotto scalare da V in V ∗ , ponendo, comunque scelte le
1-forme α, β ∈ Ω1 (V ),
hα, βi1 := hη −1 (α), η −1 (β)i = η jk αj βk . (9.50)

Si usa cioè la corrispondenza biunivoca η per trasportare le forme in


vettori, di cui poi siamo in grado di calcolare il prodotto scalare. In-
somma: in virtù della corrispondenza tra forme e vettori siamo in grado
di definire un prodotto scalare sulle 1-forme (cioè sugli elementi del
duale), riconducendo queste ultime a vettori mediante la metrica.
224 LEZIONE 9. EQUAZIONI DI MAXWELL

• Infine si estende questo prodotto scalare alle 2-forme, 3-forme e in


generale alle p-forme ponendo sui monomi

hα1 , β1 i hα1 , β2 i
hα1 ∧ α2 , β1 ∧ β2 i = (9.51)
hα2 , β1 i hα2 , β2 i

e quindi estendendo poi per linearità.37

9.5.4 Tavole per lo spaziotempo di Minkowski


Riportiamo di seguito alcune tavole riassuntive del calcolo di prodotti scalari
e dell’azione della dualità di Hodge nello spaziotempo M di Minkowski.

Tavola dei prodotti scalari


Gli unici prodotti scalari non nulli tra i proiettori (1-forme) di base sono:

hdx, dxi = 1,
hdy, dyi = 1,
(9.52)
hdz, dzi = 1,
hcdt, cdti = −1.

Gli unici prodotti scalari non nulli tra gli elementi della base per le 2-forme
sono:
hdx ∧ dy, dx ∧ dyi = 1,
hdy ∧ dz, dy ∧ dzi = 1,
hdz ∧ dx, dz ∧ dxi = 1,
(9.53)
hdx ∧ cdt, dx ∧ cdti = −1,
hdy ∧ cdt, dy ∧ cdti = −1,
hdz ∧ cdt, dz ∧ cdti = −1.
Gli unici prodotti scalari non nulli tra gli elementi della base per le 3-forme
sono:
hdx ∧ dy ∧ dz, dx ∧ dy ∧ dzi = 1,
hdx ∧ dy ∧ cdt, dx ∧ dy ∧ cdti = −1,
(9.54)
hdy ∧ dz ∧ cdt, dy ∧ dz ∧ cdti = −1,
hdz ∧ dx ∧ cdt, dz ∧ dx ∧ cdti = −1.
Infine
hdx ∧ dy ∧ dz ∧ cdt, dx ∧ dy ∧ dz ∧ cdti = −1.
37
Non stiamo a dimostrare nel dettaglio qui che tale estensione è effettivamente un
prodotto scalare, poiché sarebbe superfluo, ai fini della trattazione.
9.5. LE EQUAZIONI COSTITUTIVE 225

Tavola della dualità di Hodge


Duali dei proiettori di base:

∗dx = −dy ∧ dz ∧ cdt,


∗dy = −dz ∧ dx ∧ cdt,
(9.55)
∗dz = −dz ∧ dy ∧ cdt,
∗cdt = −dx ∧ dy ∧ dz.

Duali degli elementi di base per le 2-forme:38

∗(dx ∧ dy) = −dz ∧ cdt,


∗(dy ∧ dz) = −dx ∧ cdt,
∗(dz ∧ dx) = −dy ∧ cdt,
(9.56)
∗(dx ∧ cdt) = dy ∧ dz,
∗(dy ∧ cdt) = dz ∧ dx,
∗(dz ∧ cdt) = dx ∧ dy.

Duali degli elementi di base per le 3-forme:

∗(dx ∧ dy ∧ dz) = −cdt,


∗(dx ∧ dy ∧ cdt) = −dz,
(9.57)
∗(dy ∧ dz ∧ cdt) = −dx,
∗(dz ∧ dx ∧ cdt) = −dy,

9.5.5 Forma assoluta delle equazioni costitutive


Con la nozione di duale di Hodge torniamo ora alla scrittura assoluta delle
equazioni di Maxwell. Proviamo ad esempio a calcolare il duale della 2-forma
F di Faraday. Abbiamo che

∗F = ∗ (Bx dy ∧ dz + By dz ∧ dx + Bz dx ∧ dy + (Ex dx + Ey dy + Ez dz) ∧ dt) =


 
1
= ∗ Bx dy ∧ dz + By dz ∧ dx + Bz dx ∧ dy + (Ex dx + Ey dy + Ez dz) ∧ cdt =
c
1
= −(Bx dx + By dy + Bz dz) ∧ cdt + (Ex dy ∧ dz + Ey dz ∧ dz + Ez dx ∧ dy)
c
1
= −c(Bx dx + By dy + Bz dz) ∧ dt + (Ex dy ∧ dz + Ey dz ∧ dz + Ez dx ∧ dy).
c
38
Già ora possiamo intuire l’utilità di questa corrispondenza: ad esempio nella prima
delle (9.56) notiamo la “rotazione” da due coordinate spaziali a una coordinata spaziale
più una coordinata temporale. Comprendiamo già da ora che la relazione ∗ potrà risultarci
utile per passare da F a M e viceversa.
226 LEZIONE 9. EQUAZIONI DI MAXWELL

Servendoci ora delle equazioni costitutive (9.40)


y y
~
D = ε0 E, ~
B = µ0 H

e sostituendole nell’espressione trovata per ∗F si ha che


1
∗F = (Dx dy ∧dz +Dy dz ∧dz +Dz dx∧dy)−µ0 c(Bx dx+By dy +Bz dz)∧dt.
ε0 c
(9.58)
Teniamo ora conto della relazione elettromagnetica (9.19) che individua
della velocità della luce, secondo cui
√ 1
c ε0 µ0 = 1 ⇐⇒ cµ0 = . (9.59)
cε0
Unendo la (9.58) alla (9.59) troviamo subito che
r
1 µ
∗F = M = µ0 cM = M, (9.60)
ε0 c ε
relazione che lega la 2-forma di Faraday alla 2-forma di Minkowski. Essa tra-
duce in forma assoluta il sistema (9.40) delle equazioni costitutive. Tuttavia
vale la pena notare che, mentre le altre leggi assolute che avevamo trovato
non richiedevano alcuna ipotesi aggiuntiva sullo spazio di lavoro, per scrivere
la (9.60) abbiamo avuto bisogno di richiedere l’intervento sia della metrica
sia dell’orientazione. Non possiamo scrivere in forma assoluta le equazioni
costitutive senza introdurre un prodotto scalare e senza scegliere un ordine
delle coordinate.

9.6 Formulazioni alternative


Nelle sezioni precedenti abbiamo sviluppato sostanzialmente due sole idee:

• l’esistenza di un isomorfismo, indotto dalla metrica, tra le 1-forme e i


campi vettoriali;

• la dualità di Hodge.

Tali concetti possono essere utilizzati per dare altre formulazioni delle
equazioni di Maxwell, alternative alle formulazioni viste nella sezione (9.4).
In particolare, la dualità di Hodge e l’esistenza della metrica permettono di
riscrivere le equazioni di Maxwell non omogenee (quelle in cui compaiono
cariche e correnti) in una “forma vettoriale” particolarmente saliente.
9.6. FORMULAZIONI ALTERNATIVE 227

Il nostro obiettivo è sostituire all’equazione


dM = J,
che condensa le equazioni vettoriali
y
~ − ∂ D = ~j
rot H
y
∂t
divD = ρ
una nuova equazione

~
divG = S, (9.61)

dove G sarà un’entità chiamata bivettore di Maxwell e S ~ un vettore detto
vettore corrente.
Conviene accennare sin d’ora alla definizione di bivettore: se le 2-forme
sono tensori doppi covarianti antisimmetrici nello scambio tra due qualsiasi
entrate, i 2-tensori (o bivettori), sono tensori doppi controvarianti antisim-
metrici nello scambio tra due qualsiasi entrate.39 In sostanza i bivettori sono
oggetti antisimmetrici a due indici controvarianti, corrispondenti due ingressi
nel duale (e nessuno nello spazio di partenza).40
L’idea che sta alla base di questo cambiamento di formalismo è la stessa
idea che presiede al passaggio dalla teoria delle forme su R3 al calcolo vet-
toriale su R3 (v. schema in figura 8.8), e quindi all’utilizzo degli operatori
gradiente, rotore e divergenza.
Possiamo riassumere l’idea fondamentale di questo passaggio nello schema
in figura 9.3.
Abbiamo definito S ~ cosı̀ come appare nello schema di figura 9.3, cioè
eseguendo il duale di J, allo scopo di passare da una 3-forma a una 1-
forma, e quindi innalzando gli indici41 , per ricondurre la 1-forma a un campo
vettoriale:42
~ := cη −1 (∗J).
S (9.62)
39
Dato che i tensori sono oggetti multilineari, cioè separatamente lineari nelle entrate, i
bivettori saranno oggetti bilineari.
40
Altrove i bivettori sono definiti semplicemente come tensori doppi antisimmetrici, indi-
pendentemente dal fatto che siano controvarianti o covarianti. Noi preferiremo distinguere
tra le 2-forme (covarianti) e i bivettori (controvarianti), ben sapendo però che gli uni e gli
altri sono strettamente legati, e che possiamo sempre innalzare o abbassare gli indici con
la metrica.
41
Ricordiamo infatti che il passaggio da forma a vettore si esegue attraverso la moltipli-
cazione per la metrica in forma controvariante, e quindi mediante un innalzamento degli
indici (v. equazione (9.47)).
42
L’utilità della moltiplicazione per c apparirà evidente quando calcoleremo
esplicitamente il campo S. ~
228 LEZIONE 9. EQUAZIONI DI MAXWELL

Figura 9.3: Passaggio dalla teoria delle p-forme alla teoria vettoriale.


La definizione di G segue per analogia, per chiudere lo schema.
L’equazione

~
divG = S (9.63)
è la definizione della divergenza di un bivettore.
La scrittura
~=0
divS (9.64)
traduce la legge di continuità (conservazione della carica), tuttavia è solo la
parte alta dello schema che ci interessa analizzare.

9.6.1 Vettore densità di corrente


Rendiamo concreta, nel caso delle equazioni di Maxwell, la corrispondenza
tra la 3-forma delle sorgenti J e il campo vettoriale S.~ Cioè sostituiamo (per
un principio di economia sugli indici) la 3-forma J delle sorgenti dapprima
nella 1-forma ∗J, la cui esistenza ci è garantita dalla dualità di Hodge, e poi,
utilizzando la metrica, in un campo vettoriale
~ := cη −1 (∗J).
S
9.6. FORMULAZIONI ALTERNATIVE 229

Dato che

∗J = ∗ (ρdx ∧ dy ∧ dz − (jx dy ∧ dz + jy dz ∧ dx + jz dx ∧ dy) ∧ dt) =


 
1
= ∗ ρdx ∧ dy ∧ dz − (jx dy ∧ dz + jy dz ∧ dx + jz dx ∧ dy) ∧ cdt =
c
1
= −ρcdt + (jx dx + jy dy + jz dz),
c
si ha che
~ + (jx I~ + jy J~ + jz K),
cη −1 (∗J) = cρL ~

e quindi la definizione (9.62) si traduce in


~ = ~j + cρL.
S ~ (9.65)
~ è il vettore densità di corrente, che ha un significato fisico
Il vettore S
molto pregnante. Ricordando che per cariche libere nel vuoto vale43
~j = ρ · ~v , (9.66)

si ha che
~ = ρ(~v + cL)
~ = ρ ~ = ρ V~ ,
S · γ(v)(~v + cL) (9.67)
γ(v) γ(v)
dove V~ è naturalmente la 4-velocità della carica contenuta nell’elemento di
volume considerato.

Contrazione dei volumi


Dobbiamo ora chiarire il ruolo svolto dal fattore γρ ; per far ciò partiamo
dall’invarianza della carica elettrica. Carica e densità di carica sono legate
dalla relazione differenziale
dq = ρdV, (9.68)
ove con dV intendiamo un volume infinitesimo44 . Poiché la misura del volume
è relativa (e dq è fissato45 ), anche la misura della densità di carica ρ è relativa.
Conviene introdurre pertanto la nozione di densità propria ρ0 .
43
Infatti, senza troppi formalismi, in modulo
i dq dq dl dq dl
j= = = = = ρv,
S dt · S S · dl dt dV dt
essendo dV il volume infinitesimo; infine ~j ha per definizione direzione e verso della velocità
~v delle cariche.
44
E non, naturalmente, la variazione della 4-velocità.
45
Postuliamo infatti l’invarianza della carica.
230 LEZIONE 9. EQUAZIONI DI MAXWELL

Figura 9.4: Tubo di universo delle particelle contenute in un volume dV ,


misurato nel giudizio dell’osservatore inerziale A

Per farlo notiamo innanzitutto che le particelle contenute nel volume dV


considerato generano un tubo di universo nello spazio di Minkowski (figura
9.4). Il volume dV valutato da un osservatore inerziale è l’intersezione del
tubo di universo con la piattaforma dell’osservatore. In particolare possiamo
chiamare volume dV misurato dall’osservatore di quiete istantanea volume
proprio dV0 - l’osservatore di quiete istantanea sarà caratterizzato dall’avere
4-velocità V~ pari alla 4-velocità dell’elemento di volume, cioè pari alla 4-
velocità del tubo di universo nel punto considerato (figura 9.5).
Con riferimento alla figura 9.6, per il teorema della proiezione nella geo-
metria iperbolica vale la formula di contrazione dei volumi

dV
dV0 = dV · cosh θ = q = γ(v) · dV. (9.69)
v2
1− c2

Da un punto di vista fisico si interpreta la forma di contrazione dei vo-


lumi come una conseguenza della contrazione delle lunghezze longitudinali e
dell’invarianza delle lunghezze trasversali. Pensando che il volume abbia due
spigoli trasversali e uno spigolo longitudinale, si arriva immediatamente alla
formula

dV0 = γ(v) · dV.


9.6. FORMULAZIONI ALTERNATIVE 231

Figura 9.5: Il volume proprio dV0 è il volume misurato dall’osservatore


privilegiato comobile con il centro di massa delle particelle.

Figura 9.6: Particolare della figura 9.5: relazione tra volume proprio dV0 e
volume relativo dV .
232 LEZIONE 9. EQUAZIONI DI MAXWELL

Dilatazione delle densità

Dall’invarianza della carica dq e dalla contrazione dei volumi segue subito la


formula di dilatazione delle densità. Infatti se

dV0
dq = ρdV = ρ ,
γ(v)

è chiaro che
dq
ρ = γ(v) · = γ(v) · ρ0 , (9.70)
dV0
chiamando
dq
ρ0 :=
dV0
la densità propria di carica, cioè la densità di carica misurata dall’osser-
vatore di quiete istantanea. La (9.70) traduce il fatto che per osservatori in
moto relativo rispetto all’osservatore di quiete inerziale, la densità di carica
apparirà sempre minore della densità propria.
Dato che dalla (9.70) si ricava immediatamente che

ρ
= ρ0 ,
γ(v)

ne discende che
~ = ρ0 V~ ,
S (9.71)

~ densità di corrente è direttamente proporzionale alla


cioè che il 4-vettore S
4-velocità del tubo di universo (cioè alla 4-velocità dell’elemento di volume
considerato) e la costante di proporzionalità è la grandezza propria ρ0 .

9.6.2 Bivettore di Maxwell


In modo del tutto simile a quanto fatto prima, rendiamo ora concreto il

collegamento tra la 2-forma M di Maxwell e il bivettore di Maxwell G. Cioè
sostituiamo la 2-forma M di Maxwell dapprima nella 2-forma ∗M, la cui
esistenza ci è garantita dalla dualità di Hodge, e poi nel campo vettoriale


G := cη −1 (∗M).
9.6. FORMULAZIONI ALTERNATIVE 233

Dato che
∗M = ∗ (Dx dy ∧ dz + Dy dz ∧ dx + Dz dx ∧ dy − (Hx dx + Hy dy + Hz dz) ∧ dt) =
 
1
= ∗ Dx dy ∧ dz + Dy dz ∧ dx + Dz dx ∧ dy − (Hx dx + Hy dy + Hz dz) ∧ cdt =
c
1
= −(Dx dx + Dy dy + Dz dz) ∧ cdt − (Hx dy ∧ dz + Hy dz ∧ dx + Hz dx ∧ dy) =
c

si ha che
cη −1 (∗M) = −(Hx η −1 (dy ∧ dz) + Hy η −1 (dz ∧ dx) + Hz η −1 (dx ∧ dy))+
− c(Dx η −1 (dx ∧ cdt) + Dy η −1 (dy ∧ cdt) + Dz η −1 (dy ∧ cdt)) =
= −(Hx · J~ ∧ K~ + Hy · K~ ∧ I~ + Hz · I~ ∧ J)
~ − c(Dx · I~ + Dy · J~ + Dz · K)
~ ∧ L,
~

dove ciascun elemento della forma I~ ∧ J~ è un bivettore, cioè un tensore


doppio controvariante, avente entrate nello spazio duale. Esplicitamente,
I~ ∧ J~ prende in ingresso due 1-forme α, β ∈ Ω1 (V ) = V ∗ e restituisce

~ ~

I(α) I(β)
I~ ∧ J(α,
~ β) =
~
J(α) ~ = αx βy − αy βx
(9.72)
J(β)
Identifichiamo le componenti tensoriali del bivettore di Maxwell46 :
 
0 −cDx −cDy −cDz
cDx 0 −Hz Hy 
Gjk =   (9.73)
cDy Hz 0 −Hx 
cDz −Hy Hx 0
Notiamo un fatto interessante e importante: il bivettore Gjk p propor-
zionale al tensore di Faraday Flm . Se andiamo a confrontare infatti la (9.73)
con la forma del tensore di Faraday data dalla (8.5), cioè
 
0 Ex /c Ey /c Ez /c 0
−Ex /c 0 Bz −By 
Fjk = 
−Ey /c −Bz
 (9.74)
0 Bx 
−Ez /c By −Bx 0
e se ci ricordiamo delle equazioni costitutive (9.40) del vuoto, per cui
y
~
D = ε0 E
y
~
B = µ0 H
46
Si pensi sempre al tempo come prima componente: nella prima riga e colonna dunque
~ nella seconda le entrate relative a I,
le entrare relative a L, ~ quindi J~ e K.
~
234 LEZIONE 9. EQUAZIONI DI MAXWELL

e della relazione
1
c= µ0 ,
ε0
troviamo che possiamo scrivere il bivettore di Maxwell come

− √εε00µ0 Ex − √εε00µ0 Ey − √εε00µ0 Ez


 
0
 √ ε0 Ex 0 − µ10 Bz 1
B 
jk  ε0 µ0 µ0 y
G =  ε0 =

1 1

 ε0 µ0 y E µ0 z
B 0 − B
µ0 x 
√ ε0 Ez − µ10 By 1
B 0
ε0 µ0 µ0 x
 √ √ √ 
0 ε0 µ0 Ex ε0 µ0 Ey ε0 µ0 Ez

1 − ε0 µ0 Ex 0 Bz −By 
=−  √ =
µ −√ε0 µ0 Ey
 −Bz 0 Bx 
− ε0 µ0 Ez By −Bx 0
 
0 Ex /c Ey /c Ez /c
1 −Ex /c 0 Bz −By 
=−  
µ −Ey /c −Bz 0 Bx 
−Ez /c By −Bx 0
da cui
1
Gjk = − δ jl δ km Flm , (9.75)
µ
dove i tensori doppi individuati dai delta di Kronecker servono solo ad ag-
giustare gli indici. Ogni componente del tensore di Maxwell (controvariante)
si ottiene dalla componente del tensore di Faraday (covariante) moltiplicata
per −1/µ.

9.6.3 Forma vettoriale delle equazioni non omogenee


Mostriamo ora che l’equazione di Maxwell non omogenea
dM = J
si può effettivamente riscrivere nella forma vettoriale
∂Glk
l
= Sk (9.76)
∂x
o, in forma intrinseca, come47

~
divG = S. (9.77)
47
Formalmente stiamo estendendo (in modo naturale) la definizione di divergenza dai
vettori ai tensori doppi. La divergenza di un tensore doppio dà un vettore.
9.6. FORMULAZIONI ALTERNATIVE 235

~ = ~j + cρL,
Infatti, ricordando che S ~ prendiamo componente per compo-
nente la (9.77):48
⇒ ∂Gtt ∂Gxt ∂Gyt ∂Gzt
(divG)t = + + + =
∂ct ∂x ∂y ∂z
 
∂Dx ∂Dy ∂Dz
=c + + = cρ
∂x ∂y ∂z

⇒ ∂Gtx ∂Gxx ∂Gyx ∂Gzx


x
(divG) = + + + =
∂ct ∂x ∂y ∂z
∂Dx ∂Hz ∂Hy
=− + − = jx ,
∂t ∂y ∂z

⇒ ∂Gty ∂Gxy ∂Gyy ∂Gzy


y
(divG) = + + + =
∂ct ∂x ∂y ∂z
∂Dy ∂Hz ∂Hx
=− − + = jy ,
∂t ∂x ∂z
⇒ ∂Gtz ∂Gxz ∂Gyz ∂Gzz
(divG)z = + + + =
∂ct ∂x ∂y ∂z
∂Dz ∂Hy ∂Hx
=− + − = jz ,
∂t ∂x ∂y
Dalle prime tre componenti ritroviamo che
y
~ − ∂ D = ~j.
rot H
∂t
Dalla quarta componente ritroviamo che
y
ρ = divD.
Dunque, in definitiva, la (9.77) effettivamente riassume e coimplica le
equazioni di Maxwell non omogenee, cioè le equazioni che coinvolgono la
densità di corrente e la densità di carica:
 y

 div D =ρ
⇒ 
divG = S~ ⇐⇒ y

~ − ∂ D
 rot H = ~j

∂t
48
Scriveremo ad apice t per la componente temporale (quella della prima riga e colonna),
legata alla funzione di base ct, scriveremo ad apice x, y, z rispettivamente per le colonne o
righe 2,3 e 4.
236 LEZIONE 9. EQUAZIONI DI MAXWELL

Notiamo che la (9.76) è esattamente la riscrittura della (9.77) componente


per componente - al primo membro la notazione tensoriale sottointende il
simbolo di sommatoria.

9.6.4 Forma per componenti delle equazioni omogenee


Anche il blocco di equazioni omogenee di Maxwell ha una riscrittura per
componenti.
Dato che, a meno di fattori c,
 
0 Ex Ey Ez
 −Ex 0 Bz −By 
Fjk =  −Ey −Bz
,
0 Bx 
−Ez By −Bx 0

derivando le componenti di F si può verificare che la relazione49

∂Fjk ∂Fkl ∂Flj


+ + =0 (9.78)
∂xl ∂xj ∂xk
è del tutto equivalente al secondo sistema (9.6) delle equazioni di Maxwell.50
Notando che
∂Fii ∂Fij ∂Fji
+ + =0
∂xj ∂xi ∂xi
per antisimmetria del tensore di Faraday, non sono poi molte le equazioni da
scrivere per verificare quanto affermato.51

∂Fxy ∂Fyz ∂Fzx ∂Bz ∂Bx ∂By y


+ + = + + = divB,
∂z ∂x ∂y ∂z ∂x ∂y
49
Tale relazione si trova sovente scritta in notazione tensoriale anche come

Fij,k + Fjk,i + Fki,j = 0,

dove le virgole sono una notazione piuttosto comune per la derivata parziale rispetto
all’indice che segue la virgola (in contrapposizione con il punto e virgola che, come vedremo,
sarà usato per la derivata covariante). Ancora più sinteticamente si può scrivere che

F[jk,l] = 0

a sottointendere la permutazione ciclica dei tre elementi.


50
Il calcolo risulterà analogo a quello fatto per scoprire che dF = 0 traduce lo stesso
blocco omogeneo delle equazioni di Maxwell.
51
Usiamo la stessa (naturale) convenzione di prima riguardo agli indici: t, x, y, z indicano
rispetticamente le colonne o righe 1, 2, 3, 4.
9.7. IL TENSORE ENERGIA-MOMENTO 237

∂Fxy ∂Ftx ∂Fyt ∂Bz ∂Ey ∂Ex


+ + = − + ,
∂t ∂y ∂x ∂t ∂x ∂y
∂Fyz ∂Fty ∂Fzt ∂Bx ∂Ez ∂Ey
+ + = − + ,
∂t ∂z ∂y ∂t ∂y ∂z
∂Fzx ∂Ftz ∂Fxt ∂Bz ∂Ex ∂Ez
+ + = − + ,
∂t ∂x ∂z ∂t ∂z ∂x
e, in scrittura compatta vettoriale, l’annullarsi delle quantità scritte sopra
y y
~ − ∂ B , e dunque in definitiva
equivale quindi all’annullarsi di divB e di rot E ∂t
al blocco omogeneo delle equazioni di Maxwell.

9.6.5 Ricapitolazione
Possiamo quindi ricapitolare nella tabella 9.1 le varie forme in cui abbiamo
visto scritti i due blocchi di equazioni di Maxwell.

2-forme bivettori componenti



~ ∂Glk
Maxwell I (9.4) dM = J divG = S = Sk
∂xl
∂Fjk ∂Fkl ∂Flj
Maxwell II (9.6) dF = 0 + + =0
∂xl ∂xj ∂xk

Tabella 9.1: Diversi modi di scrittura dei due blocchi delle leggi di Maxwell.

9.7 Il tensore energia-momento


9.7.1 Aspetti energetici
Vogliamo infine indagare gli aspetti energetici del campo elettromagnetico,
mostrando che è possibile associare al campo una energia e una quantità
di moto. Se per una particella gli aspetti energetici erano descritti da un 4-
vettore P~ detto 4-impulso, per il campo elettromagnetico ci vuole un tensore
doppio (simmetrico) detto tensore energia-momento52 .
Sappiamo che il 4-impulso P~ è legato alla 4-forza di Minkowski dalla
relazione
~
~ = dP .
K
dt
52
Di fatto il tensore energia-momento è una matrice simmetrica le cui componenti furono
scoperte poco a poco grazie ai contributi di diversi fisici, tra cui Poynting; ma il tutto non
prese una forma unitaria sino all’intervento di Minkowski nel 1908.
238 LEZIONE 9. EQUAZIONI DI MAXWELL

Passando al caso di un campo invece che di una particella, le grandezze in


gioco sono distribuite nello spazio, e dunque bisogna considerarne la densità.
Dato che i volumi, come visto nella sezione 9.6.1, dipendono dall’osservatore
che li misura, bisogna decidere quale volume e quale densità considerare.
L’unica possibilità per avere grandezze intrinseche (indipendenti dall’os-
servatore) è quella di considerare l’osservatore di quiete istantanea, che è ben
definito, e quindi il volume proprio V0 , cioè il volume misurato da tale osser-
vatore. Introdurremo perciò la densità propria di 4-forza di Lorentz53
e dimostreremo che varrà la relazione

~
dK
= divT. (9.79)
dV0

A ben vedere, in realtà la (9.79) può essere assunta come definizione per
il tensore T : il tensore energia-momento del campo elettromagnetico è quel
tensore doppio e simmetrico54 la cui divergenza è la densità propria di 4-forza
di Lorentz.
Dall’equazione (8.6) che definisce la 4-forza di Lorentz, passando agli
incrementi infinitesimali, ricaviamo che

~ = dq F̂(V~ ) = dq
dK dV0 F̂(V~ ) = (ρ0 dV0 ) · F̂(V~ ),
dV0

dove V0 è il volume proprio e ρ0 è la densità propria (misurata cioè dall’os-


servatore di quiete istantanea). Segue che

~
dK
= ρ0 F̂(V~ ) = F̂(ρ0 V~ ) = F̂(S)
~ = F · S,
~ (9.80)
dV0

~ è il vettore densità di corrente.


dove S
Sviluppiamo questa espressione componente per componente, a partire

53
Ricordiamo che nel caso di un campo elettromagnetico la 4-forza di Minkowski prende
il nome di 4-forza di Lorentz.
54
Non approfondiamo il perché T sia un tensore simmetrico: la ragione di ciò trae le
mosse dalla conservazione del momento angolare.
9.7. IL TENSORE ENERGIA-MOMENTO 239

dalla definizione della 4-forza di Lorentz:


!
dK~
= Fjk S k
dV0
j
∂Glk
= Fjk
∂xl
∂ ∂Fjk
= l
(Fjk Glk ) − Glk l
∂x ∂x
 
∂ lk 1 lk ∂Fjk ∂Fjl
= (Fjk G ) − G −
∂xl 2 ∂xl ∂xk

poiché
 
1 lk ∂Fjk ∂Fjl 1 ∂Fjk 1 lk ∂Fjl 1 ∂Fjk 1 kl ∂Fjk
G − = Glk − G = Glk − G =
2 ∂xl ∂xk 2 ∂x l 2 ∂x k 2 ∂xl 2 ∂xl
1 ∂Fjk 1 lk ∂Fjk xl lk ∂Fjk
= Glk + G G ,
2 ∂xl 2 ∂= ∂xl
e dunque
!
~
dK ∂ 1 lk

∂Fjk ∂Fjl

lk
= (F jk G ) − G −
dV0 ∂xl 2 ∂xl ∂xk
j
 
∂ 1 lk ∂Fjk ∂Flj
= (Fjk Glk ) − G +
∂xl 2 ∂xl ∂xk
 
∂ 1 lk ∂Fjk ∂Flj ∂Fkl 1 ∂Fkl
= (Fjk Glk ) − G + + + Glk j ,
∂xl 2 ∂x l ∂x k ∂x j 2 ∂x
∂ 1 lk ∂Fkl
= (Fjk Glk ) + G ,
∂xl 2 ∂xj

poiché, se valgono le equazioni di Maxwell, vale anche la (9.78), e quindi


andando avanti
!
dK~ ∂ 1 ∂Flk
= l
(Fjk Glk ) − Glk j ,
dV0 ∂x 2 ∂x
j

Nel complesso abbiamo utilizzato la definizione di 4-forza di Lorentz, il


primo blocco delle leggi di Maxwell (scritte componente per componente, v.
tabella 9.1) e ripetutamente l’antisimmetria del bivettore G e della 2-forma
240 LEZIONE 9. EQUAZIONI DI MAXWELL

F. A questo punto conviene notare che per la (9.75) F e G sono proporzionali,


in particolare
1
Glk = − δ lp δ kq Fpq ,
µ
e dunque possiamo scrivere che
!
~
dK ∂ ∂

1 lk

lk
= (Fjk G ) − j G Flk ,
dV0 ∂xl ∂x 4
j

poiché

1 ∂Glk
 
∂ 1 lk 1 ∂Flk 1 ∂Fpq 1 ∂Flk
j
G F lk = j
Flk + Glk j = − δpl δqk j
Flk + Glk j =
∂x 4 4 ∂x 4 ∂x 4µ ∂x 4 ∂x
   
1 1 ∂Fpq 1 lk ∂Flk 1 1 ∂Flk 1 lk ∂Flk
= − δ lp δ kq Flk j
+ G j
= − δ pl δ qk Fpq + G =
4 µ ∂x 4 ∂x 4 µ ∂xj 4 ∂xj
1 ∂Flk 1 ∂Flk 1 ∂Flk
= Glk j + Glk j = Glk j
4 ∂x 4 ∂x 2 ∂x
Infine si osserva che il gradiente di una funzione si può scrivere come
divergenza del tensore doppio f δjl (δ jk è il solito tensore doppio identico):
∂f ∂
j
= (f δjl ),
∂x ∂xl
∂f
poiché quest’ultimo è non nullo solo per l = j, e per tale valore vale ∂x j.
1 lk
Dato che la contrazione 4 G Flk è a tutti gli effetti una funzione scalare, si
ha che    
∂ 1 lk ∂ 1 lk l
G Flk = G Flk δj ,
∂xj 4 ∂xl 4
da cui !
dK~ ∂

1

lk pq l
= Fjk G − Fpq G δj .
dV0 ∂xl 4
j

Il tensore doppio simmetrico di componenti


1
Tjl = Fjk Glk − Fpq Gpq δjl (9.81)
4
è detto tensore energia-momento del campo elettromagnetico. Esso è
chiaramente bilineare nei due termini elettromagnetici. Per come l’abbiamo
costruito esso verifica l’eguaglianza per componenti
!
~
dK ∂Tjl
= (9.82)
dV0 ∂xl
j
9.7. IL TENSORE ENERGIA-MOMENTO 241

oppure l’analoga eguaglianza


!p
~
dK ∂T lp
= (9.83)
dV0 ∂xl

ottenuta componendo con la metrica.55 Assemblando le componenti, otte-


niamo la cercata relazione
dK~
= divT, (9.84)
dV0
che lega la densità propria di 4-forza di Lorentz e la divergenza del tensore
doppio simmetrico T .

9.7.2 Bilancio energetico


Per interpretare l’eguaglianza 9.84 e per mostrare che il tensore T è legato al
bilancio energetico e di quantità di moto del campo elettromagnetico, ripe-
tiamo lo stesso calcolo dal punto di vista del formalismo vettoriale introdotto
nella sezione 9.6.
Consideriamo il campo elettromagnetico prodotto da una certa distribu-
zione di carica in un riferimento inerziale. La densità di potenza dissipata
(per effetto Joule) dal campo elettromagnetico, per muovere le cariche, è data
da56

Π = f~ · ~v =
=ρ·E ~ · ~v
~ =
= ~j · E
 y

~ − ∂ D  · E,
= rot H ~
∂t

55
Moltiplicando ambo i membri della (9.81) per η jp , infatti, abbiamo che nella som-
matoria sull’indice j, tale indice viene contratto e otteniamo il tensore T in forma
completamente controvariante: T lp . Più esplicitamente
!p !
~
dK jp dK~ ∂Tjl ∂η jp Tjl ∂T pl
=η = η jp l = l
= ,
dV0 dV0 ∂x ∂x ∂xl
j

formula che vale perché la metrica minkowskiana η è una metrica costante.


56
Nel caso di una carica puntiforme abbiamo che Π = f~ · ~v = q E
~ · ~v . Ma qui stiamo
considerando il campo elettromagnetico prodotto in generale da una distribuzione di carica
ρ, quindi sostituiamo ρ a q.
242 LEZIONE 9. EQUAZIONI DI MAXWELL

dove al terzo passaggio abbiamo applicato la (9.66) e al quarto passaggio


abbiamo applicato il primo blocco - quello non omogeneo (9.4) - delle equa-
zioni di Maxwell. Questa formula ci dice che la potenza dissipata in un certo
punto dipende dal campo elettromagnetico nel punto. Questo è il punto di
partenza del bilancio energetico per il campo elettromagnetico. Il passo suc-
cessivo è utilizzare il secondo blocco - quello omogeneo (9.6) - delle equazioni
di Maxwell:
 y

Π = rot H ~ − ∂D  · E~ =
∂t
 y
  y

= rot H ~ − ∂D  · E~ + rot E ~ + ∂B  · H
~ =
∂t ∂t
 y y

~ · ∂D + H~ · ∂B  .
 
= rot H ~ ·E~ − rot E
~ ·H
~ − E
∂t ∂t

Abbiamo scritto la potenza dissipata come somma di due termini: la il


primo termine contiene solo le derivate spaziali dei campi, il secondo ter-
mine contiene solo le derivate temporali. Dalle equazioni costitutive (9.40)
sappiamo che, nel caso del vuoto,
y
~
D = ε0 E
y .
~
B = µ0 H
Sostituendo tali equazioni nella parte temporale dell’espressione per Π
troviamo che
y y y
~
~ · ∂ B = ε0 E
~ · ∂D + H ~ · ∂ E + µ0 H · ∂ H =
y
E
∂t ∂t  ∂t ∂t 
∂ 1 ~ ~ 1 y y
= ε 0 E · E + µ0 H · H =
∂t 2 2
 
1∂ ~ y ~ y
= E·D+H ·B =
2 ∂t
∂e
= ,
∂t

dove abbiamo definito


 
1 y
~ ·D+H
~ ·B
y
e := E (9.85)
2
9.7. IL TENSORE ENERGIA-MOMENTO 243

la densità di energia del campo elettromagnetico nel riferimento inerziale


considerato.
Per quanto riguarda la parte spaziale vale l’identità
y y
~ − (rot E)
(rot H) · E ~ · H = div(H
~ ∧ E)
~ (9.86)
che si dimostra nel modo seguente:
y y
~ =E
(rot H) · E ~ · (rot H) =
y
=E ~ ·∇~ ∧H =

Ex Ey Ez
∂ ∂ ∂

= ∂x ∂y ∂z =
Hx Hy Hz
     
∂Hz ∂Hy ∂Hx ∂Hz ∂Hy ∂Hx
= Ex − + Ey − + Ez −
∂y ∂z ∂z ∂x ∂x ∂y
~ · H,
e analogamente per (rot E) ~ da cui
   
~ ·E~ − (rot E)
~ ·H~ = Ex ∂H z ∂H y ∂H x ∂H z
(rot H) − + Ey − +
∂y ∂z ∂z ∂x
   
∂Hy ∂Hx ∂Ez ∂Ey
+ Ez − − Hx − +
∂x ∂y ∂y ∂z
   
∂Ex ∂Ez ∂Ey ∂Ex
− Hy − − Hz − =
∂z ∂x ∂x ∂y
   
∂Hy ∂Hz ∂Ey ∂Ez
= Ez − Ey − Hz − Hy +
∂x ∂x ∂x ∂x
   
∂Hz ∂Hx ∂Ez ∂Ex
Ex − Ez − Hx − Hz +
∂y ∂y ∂y ∂y
   
∂Hx ∂Hx ∂Ez ∂Ex
Ey − Ez − Hx − Hz =
∂z ∂y ∂z ∂y
= div(H~ ∧ E).
~

Quindi il risultato della manipolazione è di aver scritto la potenza dissi-


pata dall’azione del campo elettromagnetico sulle cariche nella forma

Π = div(H ~ − ∂e
~ ∧ E) (9.87)
∂t
che possiamo anche riscrivere come
∂e y
+ divP = −Π, (9.88)
∂t
244 LEZIONE 9. EQUAZIONI DI MAXWELL

~ e e = 1 (E
y y y y
avendo posto P = E ~ ∧H ~ ·D+H ~ · B). Il vettore P è detto vettore
2
di Poynting.
Interpretiamo l’equazione (9.88) come bilancio energetico del campo elet-
tromagnetico. Consideriamo un volume fisso nello spazio, in un certo riferi-
mento, e integriamo l’equazione (9.88) su tale volume. Abbiamo che
Z Z Z
d y
e dV + divP dV = − Π dV
dt V V V

e per il Teorema della Divergenza possiamo riscrivere che


Z Z y Z
d
e dV + P · ~n dS = − Π dV. (9.89)
dt V ∂V V

Il primo termine della (9.89) rappresenta l’energia del campo elettroma-


gnetico contenuto nel volume V ; questa energia varia, poiché in parte è dis-
sipata per azione sulle cariche e in parte fluisce fuori dal volume attraverso
le pareti.

Z
e dV −→ energia contenuta nel volume V
V
Z
P~ · ~n dS −→ flusso uscente di energia
∂V
Z
−Π dV −→ energia fornita dalle cariche al campo
V

Questa interpretazione dà il significato al vettore di Poynting di densità


di corrente di energia.

9.7.3 Bilancio di quantità di moto


Dallo studio della forza di Lorentz57

f~ = ρ(E
~ + ~v ∧ B)
~

si apprende che si può attribuire al campo elettromagnetico una quantità di


moto allo stesso modo in cui dallo studio della potenza Π = ρE~ · ~v abbiamo
57
Si veda la nota 56 a pag. 241.
9.7. IL TENSORE ENERGIA-MOMENTO 245

imparato ad attribuire al campo un’energia. Possiamo infatti scrivere che

f~ = ρ(E
~ + ~v ∧ B)
~ =
~ + ~j ∧ B
= ρE ~ =
 y

~ − ∂D  ∧ B =
y y
~ + rot H
= (divD)E
∂t

dove al secondo passaggio abbiamo applicato la (9.66) e al terzo passaggio ab-


biamo applicato il primo blocco - quello non omogeneo (9.4) - delle equazioni
di Maxwell.
A questo punto gradiremmo scrivere questa espressione come somma di
una divergenza e di una derivata temporale, che sono i tipici termini che
compaiono in un’equazione di bilancio - come ad esempio la (9.88). Come
prima, ci arriviamo sfruttando il secondo blocco - quello omogeneo, (9.6) -
delle equazioni di Maxwell:
 y

~ − ∂D  ∧ B =
y y
f~ = (divD)E~ + rot H
∂t
  y
    y
 
~ − ∂ D  ∧ B  + (divB)H ~ + ∂ B  ∧ D =
y y y y
= (divD)E ~ + rot H ~ + rot E
∂t ∂t
   
~
y y
~ ~
y
~ ~ ∂ y y
= (rot E) ∧ D + (divD)E + (rot H) ∧ B + (divB)H − (D ∧ B),
∂t
poiché l’ultimo termine verifica
 y y
 y y
∂ y y ∂ D y y ∂ B ∂ D y ∂ B y
− (D ∧ B) = −  ∧B+D∧ =− ∧B− ∧D
∂t ∂t ∂t ∂t ∂t

per l’antisimmetria del prodotto vettoriale.


Si tratta ora di verificare che i primi due termini nelle parentesi sono
divergenze di un tensore doppio; infatti valgono le seguenti identità:
 
~
y y
~
y
~ 1 y ~
(rot E) ∧ D + (divD) ∧ E = div D ⊗ E − (D · E) · id , (9.90)
2
 
y y
~ ∧ B + (divB) ∧ H
y
~ = div B ⊗ H 1 y
~ − (B · H)~ · id ,
(rot H) (9.91)
2
246 LEZIONE 9. EQUAZIONI DI MAXWELL

dove con id = δ ij si intende il tensore doppio identico.


La verifica è fatta componente per componente.
 
y y y
~
(rot E) ∧ D + (divD)E ~ ~ y Dz − (rot E)
= (rot E) ~ z Dy + (divD)Ex =
  x 
∂Ex ∂Ez ∂Ey ∂Ex y
= − Dz − − Dy + (divD)Ex =
∂z ∂x ∂x ∂y
∂Ey ∂Ez ∂ ∂ ∂Ey ∂Dz ~ x=
= −Dy − Dz + (Ex Dy ) + (Ex Dz ) − Ex − Ex + (divD)E
∂x ∂x ∂y ∂z ∂y ∂z
 
∂Ey ∂Ez ∂ ∂ ∂Ex
= − Dy + Dz + (Ex Dy ) + (Ex Dz ) + Ex =
∂x ∂x ∂y ∂z ∂x
 
∂ ∂ ∂ ∂Ex ∂Ey ∂Ez
= (Ex Dx ) + (Ex Dy ) + (Ex Dz ) − Dx + Dy + Dz =
∂x ∂y ∂z ∂x ∂x ∂x
 
∂ ∂ ∂ ∂Ex ∂Ey ∂Ez
= (Ex Dx ) + (Ex Dy ) + (Ex Dz ) − Dx + Dy + Dz
∂x ∂y ∂z ∂x ∂x ∂x
y
e dato che il prodotto tensoriale di D e ~ dà
E
 
y
Dx Ex Dx Ey Dx Ez
~
D ⊗ E = Dy Ex
 Dy Ey Dy Ez 
Ez Ex Dz Ey Ez Ez
i primi tre termini si possono scrivere come divergenza della componente x
y
~
del tensore D ⊗ E:
 
~
y y
~ ∂ ∂ ∂
(rot E) ∧ D + (divD)E = (Ex Dx ) + (Ex Dy ) + (Ex Dz )+
x ∂x ∂y ∂z
 
∂Ex ∂Ey ∂Ez
− Dx + Dy + Dz =
∂x ∂x ∂x
 
y
~ x− ∂ ∂E x ∂E y ∂E z
= div(D ⊗ E) Dx + Dy + Dz =
∂x ∂x ∂x ∂x
 
y
~ x− ∂ 1 y
~ ,
= div(D ⊗ E) D·E
∂x 2

dove l’ultimo passaggio vale poiché nel vuoto



∂ 1y ~
 
∂ 1 ~ ~
 ~ ·E
ε0 ∂ E ~
D·E = (ε0 E · E) = =
∂x 2 ∂x 2 2 ∂x
ε0 ~ ~ ~
= ~ ∂ E = ε0 E
· 2E ~ · ∂E = D~ · ∂ E = Dx ∂Ex + Dy ∂Ey + Dz ∂Ez ,
2 ∂x ∂x ∂x ∂x ∂x ∂x
9.7. IL TENSORE ENERGIA-MOMENTO 247
 
∂ 1y ~
e infine notando che il termine D · E si interpreta a sua volta come
∂x 2
prima componente della divergenza di un vettore doppio
  
∂ 1 y
~
 ∂x 2 D · E 
 y 
1
D·E ~ 0 0
2
    
1 y ~ y   ∂ 1y
~

div (D · E) · id = div  0
 1
D · ~
E 0  =  D · E ,
2 2
y
  ∂y 2 
~
1
  
0 0 D·E ∂ 1 y
~

2 D·E
∂z 2

possiamo scrivere in definitiva che


   
~
y y
~
y
~ ∂ 1y ~
(rot E) ∧ D + (divD)E = div(D ⊗ E)x − D·E
x ∂x 2
 
y 1 y
~ − (D · E)
~ · id .
= div D ⊗ E
2 x

In maniera del tutto analoga si opera per le componenti y e z, sicché la


(9.90) è dimostrata. Per la (9.91) il ragionamento è ovviamente identico,
y y
previa sostituzione di D con B e di E~ con H.
~
Possiamo dunque scrivere che
 
y y 1 y y
~ · id − ∂ (D
f~ = div D ⊗ E ~ +B⊗H ~ − (D · E ~ + B · H) ~ ∧ B),
~ (9.92)
2 ∂t

oppure, in forma leggermente differente, ricordandoci la definizione dell’e-


y y
~ ·D+H
nergia del campo elettromagnetico e = 12 (E ~ · B), possiamo scrivere
che  
∂ ~ ~ y
~ +B⊗H
y
~ − e · id − f~.
(D ∧ B) = div D ⊗ E (9.93)
∂t
Il tensore nella parentesi
y y
~ +B⊗H
Q=D⊗E ~ − e · id

è detto tensore di Maxwell degli sforzi.


L’equazione (9.93) è un’equazione di bilancio; come fatto precedentemente
con l’equazione di bilancio energetico, integriamola e otteniamo che
Z Z   Z
d ~ ∧ B)
~ dV =
y y
~ +B⊗H ~ − e · id dV − f~ dV. (9.94)
(D div D ⊗ E
dt V V V
248 LEZIONE 9. EQUAZIONI DI MAXWELL

Le grandezze in gioco si interpretano quindi nel modo seguente: il primo


integrale non può che essere la quantità di moto, poiché la sua derivata tem-
porale è una forza; il secondo integrale (quello con la divergenza) rende conto
delle azioni di contatto che si esercitano sul contorno del volume occupato
dal campo elettromagnetico, esso misura quindi lo sforzo del campo elettro-
magnetico; l’ultimo integrale della forza rappresenta le azioni che le cariche
esercitano sul volume occupato dal campo elettromagnetico. Riassumendo:58
Z
~ ∧ B)
(D ~ dV −→ quantità di moto del campo
V
Z  
y y
~ ~
div D ⊗ E + B ⊗ H − e · id dV −→ sforzo del campo sul contorno di V
V
Z
f~ dV −→ azione delle cariche sul volume V
V

Quindi le equazioni (9.93) e (9.94) vengono interpretate come equazioni


di bilancio delle quantità di moto del campo elettromagnetico.

9.7.4 Ricapitolazione
In conclusione il campo elettromagnetico deve essere pensato come un sistema
fisico (analogo a un corpo materiale59 ) che possiede una certa quantità di
moto ~g e una certa energia e, le cui espressioni sono fornite da
y y
~g = D ∧ B,
1 y ~ y ~ (9.95)
e = (D · E + B · H).
2
Tali grandezze variano nel tempo, poiché:

• in parte fluiscono attraverso le pareti di contatto, con densità di cor-


rente data rispettivamente da:
y y
~ +B⊗H
tensore degli sforzi di Maxwell (per ~g ): D ⊗ E ~ − e · id;
y
vettore di Poynting (per e): P := E~ ∧ H; ~
58
Esemplifichiamo: se pensiamo ad un pallone, l’ultimo integrale è una forza che agisce
su tutte le particelle (come ad esempio la forza di gravità), il secondo integrale è solo locale
e rende conto dele azioni di contatto su bordo del pallone, come ad esempio l’azione delle
mani che schiacciano il pallone.
59
Questa analogia aveva portato all’introduzione dell’etere.
9.7. IL TENSORE ENERGIA-MOMENTO 249

• in parte sono prodotte attraverso la forza f~ e la potenza Π.


La forma delle equazioni di bilancio relative a ~g e a e quindi non deve più
stupire:
∂ 
~ ∧H~

e = −Π +div E
∂t   (9.96)
∂y y y y
D ∧ B +div −D ⊗ E ~ −B⊗H ~ + e · id = −f~
∂t
Tali equazioni di bilancio si possono ritrascrivere in forma assoluta come
y y !  
e D∧B Π
div y y =− ~ .
~ ∧ H)
(E ~ T −(D ⊗ E ~ + B ⊗ H)~ + e · id f

dove T indica la trasposizione (il vettore diventa un vettore colonna) o anche,


cambiando i segni,
y y !  
−e −D ∧ B Π
div y y = ~ . (9.97)
−(E ~ ∧ H)
~ T D⊗E ~ +B⊗H ~ − e · id f

La matrice al primo membro un tensore doppio di dimensioni60 4 × 4,


scritto sotto forma di matrice a blocchi. Osserviamo al secondo membro che
cosa appare: sappiamo che in questa sezione abbiamo designato con f~ la
densità di forza di Lorentz: l’avevamo infatti definita come
~
~ + ~v ∧ B) = dq (E~ + ~v ∧ B) = dfq
y y
f~ = ρ(E
dV dV
ove f~q designa la usuale forza di Lorentz
f~q = q(E
~ + ~v ∧ B).
~
Ma allora consideriamo il vettore al secondo membro della (9.97), e sup-
poniamo di dividere la potenza Π per il fattore c: ciò che otteniamo è il
vettore61
df~q
!
Π ~ · ~v
f df~q · ~
v d ~q · ~v
f
f~ + · L~ = f~ + ~ =
·L + dV ·L~ = f~q + ~ =
·L
c c dV c dV c
!!
1 d ~q · ~v
f 1 dK ~ ~
dK
= γ(v) f~q + ~
·L = = ,
γ(v) dV c γ(v) dV dV0
60
Il blocco in alto a sinistra è uno scalare, e, il blocco in basso a destra è un tensore di
dimensioni 3 × 3, gli altri blocchi sono vettori di dimensione 3.
Si consideri sempre il tempo come prima componente: il vettore Π
61

f~
sarà quindi un
vettore avente la prima coordinata come coordinata temporale e le ultime tre coordinate
come coordinate spaziali.
250 LEZIONE 9. EQUAZIONI DI MAXWELL

dove abbiamo usato all’ultimo passaggio la relazione (9.69) di contrazione


dei volumi. È chiaro allora che se scriviamo
 e y y   
− −D ∧ B Π
c
 =  c .
   
div 
 1 T (9.98)
y y 
− ~ ∧H
E ~ D⊗E ~ +B⊗H ~ − e · id f~
c

abbiamo sostanza riscritto esattamente l’equazione (9.84) che avevamo rica-


vato con il formalismo assoluto, e che avevamo scritto nella forma
~
dK
divT = .
dV0
Dunque la (9.98) rende esplicita la forma del tensore energia-momento T
del corpo, e il suo significato meccanico, che è espresso da
 e y y 
− −D ∧ B
 c 
T ij =   T  (9.99)
 1~ ~ y
~
y
~

− E∧H D ⊗ E + B ⊗ H − e · id
c

e che è riassunto nello schema in figura 9.7.

Figura 9.7: Forma del tensore T jk energia-momento. La prima colonna


(quella temporale) è riservata all’energia, le ultime tre colonne (quelle spaziali)
sono riservate al momento, cioè alla quantità di moto.
Lezione 10

Approdo alla Relatività


Generale

10.1 Relatività Generale e teoria della gravi-


tazione
10.1.1 Due problemi, una soluzione
Torniamo per un attimo ad assumere un punto di vista cronologico. Una
volta messa a punto la geometria dello spazio di Minkowski (cioè della Rela-
tività Ristretta), si aprivano di fronte a Einstein due problemi a prima vista
scorrelati.

(i) In primo luogo, tutta la teoria relativistica svolta sino ad ora ha uti-
lizzato il concetto di osservatore inerziale ed ha avuto come scopo la
scrittura delle equazioni della fisica in una forma indipendente dalla
scelta dell’osservatore inerziale, al fine di mostrare la compatibilità di
tali equazioni con il Principio di Relatività. Il problema di Einstein
nel 1906 è dunque quello di estendere la teoria precedente, cosı̀ da
conglobare in essa anche osservatori non inerziali, con il proposito di
scrivere le equazioni della fisica in una forma che sia invariante nel pas-
saggio da un osservatore a un altro. Lo scopo è quindi il superamento
del concetto di osservatore inerziale e della cosiddetta “formulazione
covariante”1 delle equazioni della fisica.
1
Cioè formulazione indipendente dal sistema di riferimento inerziale scelto. Nella sua
forma estesa, la formulazione indipendente dall’osservatore (qualsiasi) scelto verrà detta
“formulazione covariante generale”.

251
252 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

È dunque in questo senso che questa parte della teoria è stata denomi-
nata da Einstein Relatività Generale (dal momento che considera la
classe generale degli osservatori, pensati sempre come sistemi di coordi-
nate sullo spaziotempo), per contrasto con la parte della teoria basata
sull’uso dei soli osservatori inerziali (detta Relatività Ristretta).2

(ii) D’altro canto, il proposito della Relatività Ristretta di scrivere le equa-


zioni della fisica in forma invariante rispetto al gruppo di Lorentz (cioè
rispetto al cambio di osservatore inerziale) doveva ancora essere com-
pletato. Dopo aver realizzato questo scopo per la meccanica della parti-
cella, per la meccanica dei fluidi3 e per l’elettromagnetismo4 , rimaneva
da trattare la gravitazione. È ovvio che la gravitazione newtoniana, ba-
sata sul concetto di simultaneità assoluta e di azione a distanza istan-
tanea5 , non è compatibile con i principi della Relatività Ristretta; si
tratta quindi di riaffrontare il problema.
La prima idea è che bisogna procedere con le equazioni di Newton del
campo gravitazionale cosı̀ come abbiamo fatto per le equazioni newto-
niane della dinamica, cioè modificandole (senza stravolgerle) per ren-
derle compatibili con la geometria dello spaziotempo di Minkowski, di
cui lo spaziotempo newtoniano discusso nella Lezione 1 non è altro
che un’approssimazione locale. Si può qualificare questo secondo pro-
2
Va sfatato un deleterio luogo comune: si legge e si sente dire spesso che la Relatività
Ristretta si applica solo ai sistemi di riferimento inerziali, cioè al caso di moti non accele-
rati. Non c’è nulla di più falso: la Relatività Ristretta va bene per qualsiasi tipo di moto,
nell’ipotesi che lo spaziotempo sia piatto, ossia nell’ipotesi di assenza di gravità. Addirit-
tura, la Relatività Ristretta nasce dalle simmetrie dell’elettromagnetismo, e dunque non
ha alcun problema a contemplare (ad esempio) elettroni accelerati.
Come riconciliare questo con l’idea che la gravità è sostanzialmente
un’accelerazione? Ebbene, è questa idea, e non la Relatività Ristretta,
che ha un dominio limitato di applicabilità.
(Sean Carrol)
3
Studio che non abbiamo condotto in questa sede.
4
Ricordiamo che, se per rendere compatibili le equazioni della meccanica con il Principio
di Relatività abbiamo dovuto modificare le equazioni di Newton, le equazioni dell’elettro-
magnetismo erano già compatibili con tale principio, e quindi invarianti per trasformazioni
di Lorentz.
5
Difatti, l’asserto newtoniano secondo cui due masse a distanza r esercitano una forza
diretta lungo la congiungente in verso centripeto e proporzionale a r−2 , presuppone che
spostando una delle due masse l’informazione arrivi all’altra massa istantaneamente, e
dunque che la forza vari istantaneamente (concetto di azione a distanza istantanea). Inol-
tre per avere la distanza tra le due particelle dobbiamo compiere le misurazioni in uno
stesso istante, il che implica che deve esserci simultaneità assoluta.
10.1. RELATIVITÀ GENERALE E GRAVITAZIONE 253

blema come il problema di conglobare la teoria della gravitazione nello


spaziotempo di Minkowski.6

L’analisi di questo problema (costata ad Einstein parecchi anni) ha


mostrato che in questa forma il problema non ha soluzione. Non è cioè
possibile, a causa delle peculiarità della forza gravitazionale, inglobare
la gravitazione nello schema relativistico senza modificare la struttura
dello spaziotempo di Minkowski.

Il punto centrale della teoria einsteiniana della gravitazione è quindi


che bisogna abbandonare la struttura semieuclidea dello spaziotempo,
assegnata a priori7 , e pensare alla geometria dello spaziotempo come
ad una variabile dinamica. Pensare alla geometria dello spaziotempo
come a un variabile dinamica significa, nella nostra visione intrinseca,
pensare alla metrica dello spaziotempo come a un tensore dinamico,
non più fissato a priori, ma definito dalla distribuzione di massa ed
energia nell’universo. La teoria gravitazionale è la teoria che per-
mette di determinare la geometria dello spaziotempo in funzione delle
informazioni sulla distribuzione di massa ed energia, riassunte in un
ente che, come mostrato dalla teoria elettromagnetica, deve essere il
tensore energia-momento.

Il fulcro è dunque che la teoria della gravitazione si identifica con la


geometria dello spaziotempo, il quale acquista un carattere dinamico.

Dal punto di vista della prospettiva storica attuale, i due problemi, che
per Einstein avevano uguale importanza, svolgono un ruolo completamente
diverso. I problemi della Relatività Generale e del principio di covarianza
generale8 - punto (i) - hanno poi assunto un carattere via via più seconda-
rio. Nella prospettiva moderna, la teoria della Relatività Generale è definita
come la teoria della gravitazione einsteiniana, identificata con lo studio della
geometria dello spaziotempo - punto (ii).

6
Ribadiamo che di principio non vorremmo alterare lo spaziotempo di Minkowski, vor-
remmo anzi modificare la teoria della gravitazione di modo da riuscire a conglobarla in
tale spaziotempo.
7
Di fatti tale struttura era conseguenza degli assiomi, assegnati a priori, di cui abbiamo
discusso alla sezione 3.5.
8
Cioè il principio secondo cui le leggi fisiche devono essere le stesse per ogni sistema
di riferimento. Si noti che da tale principio consegue quasi immediatamente che lo stru-
mento matematico per la descrizione della Relatività Generale non può che essere il calcolo
tensoriale.
254 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

10.1.2 Il collegamento: le forze apparenti


Rimane il fatto che, storicamente, la scoperta della peculiare natura della
gravitazione è passata attraverso il problema della Relatività Generale, nel
senso di Einstein, cioè nel senso del punto (i). In forma qualitativa, la ragione
può essere spiegata nel modo seguente.
Passando da un osservatore inerziale ad un osservatore non inerziale
(quindi, nello schema minkowskiano, da coordinate cartesiane ortogonali as-
sociate a una tetrade a coordinate curvilinee9 ) bisogna introdurre le cosid-
dette forze apparenti. In altre parole, il compito della Relatività Generale
è la formulazione generale delle forze apparenti.
È a questo livello che c’è il punto di contatto con la teoria della gravita-
zione. In un certo senso, la forza gravitazionale ha gli stessi caratteri di una
forza apparente.

Caratteri delle forze apparenti

Mettiamoci infatti nell’ottica dello schema newtoniano (l’unico che al ri-


guardo per ora conosciamo); il primo carattere delle forze apparenti è di
essere strettamente proporzionali alla massa inerziale della particella su cui
si esercitano.10
Il secondo carattere delle forze apparenti è (appunto!) di essere apparenti:
il che, per definizione, significa che esse possono essere rigorosamente e glo-
balmente annullate semplicemente cambiando osservatore, cioè passando dal-
l’osservatore di cui si sta studiando il moto a un cert’altro osservatore. Questa
caratteristica è detta proprietà di annullamento globale delle forze ap-
parenti: basta cambiare osservatore, e rispetto a questo nuovo osservatore
immediatamente tutte le forze apparenti scompaiono.

9
È bene puntualizzare: lo spaziotempo di Minkowski è piatto, poiché in coordinate
cartesiane ortogonali la metrica η è costante, dunque in particolare sono nulli tutti i
simboli di Christoffel ed è identicamente nullo di conseguenza il tensore di Riemann. Ma
in generale possiamo anche scegliere un riferimento non cartesiano ortogonale, relativo
a un osservatore non inerziale, per cui la scrittura di η può cambiare, ferma restando
la piattezza dello spazio - il fatto che il tensore di Riemann sia (appunto) un tensore ci
informa infatti che, essendo nullo in un sistema di riferimento, deve essere nullo anche in
ogni altro sistema di riferimento.
10
Ad esempio la forza di Coriolis è data da

F~Coriolis = −2m~
ω ∧ ~vr .
10.1. RELATIVITÀ GENERALE E GRAVITAZIONE 255

Caratteri della forza gravitazionale

La prima proprietà delle forze apparenti (proporzionalità alla massa iner-


ziale mi ) è rigorosamente condivisa dalla forza di gravitazione: è noto infatti
che tutte le particelle, in un campo gravitazionale uniforme e stazionario, ca-
dono con la stessa accelerazione ~g , detta accelerazione di gravità. Quindi,
per la legge di Newton,
F~grav = mi · ~g , (10.1)

dove mi è la massa inerziale. In questo modo si ottiene che

mi · ~a = F~grav = mi · ~g , (10.2)

da cui
~a = ~g , (10.3)

e quindi tutte le particelle cadono con uguale accelerazione.


Per sottolineare questo fatto si usa introdurre una “carica gravitazionale”
mg , detta massa gravitazionale, e scrivere che

F~grav = mg · ~g , (10.4)

in analogia con la formula della forza elettrica F~elettr = q · E.


~ Possiamo quindi
riscrivere la (10.2) come
mi · ~a = mg · ~g (10.5)

e la proprietà scoperta da Galileo dell’universalità dell’accelerazione di gra-


vità si esprime quindi dicendo che

mi = mg . (10.6)

La (10.6) è detta principio di equivalenza debole: lo assumeremo


come un postulato11 ; esso ci garantisce che (per qualche strana ragione
che può apparire quasi “magica”) massa gravitazionale e massa inerziale
coincidono sempre.
Anche la seconda proprietà delle forze apparenti (la proprietà di an-
nullamento12 ) è condivisa dalle forze gravitazionali, ma con un’importante
differenza: essa vale ora solo localmente.
11
Il più famoso esperimento che lo avvalora è l’esperimento di Eotvos, di bilanciamento
tra forze gravitazionali e forze apparenti.
12
È proprio questa proprietà che giustifica l’utilizzo del termine “apparenti”.
256 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

10.1.3 Osservatori in caduta libera

Per comprendere questo fatto, consideriamo anzitutto il caso speciale di


un campo gravitazionale uniforme (costante) nello spazio e stazionario nel
tempo; quindi ~g è un vettore costante nello spaziotempo rispetto ad un op-
portuno osservatore inerziale. Proprio per il principio di equivalenza debole,
possiamo annullare il campo gravitazionale in ogni punto dello spazio sempli-
cemente passando ad un osservatore in caduta libera, cioè un osservatore
non inerziale, che si muove rispetto all’osservatore inerziale precedente con
un’accelerazione ~a = ~g . Rispetto a tale osservatore, secondo le leggi della
dinamica di Newton, una certa particella di prova si muove sotto l’azione
combinata della gravitazione (dovuta al fatto che essa è in un campo gravi-
tazionale) e della forza apparente di gravitazione (dovuta al fatto che stiamo
considerando un osservatore non inerziale). Dunque l’equazione di moto è

mi~arel = F~grav + F~app = mg~g + mi (−~aapp ) = mg~g − mi~aapp = 0,

dove ~arel è l’accelerazione totale della particella relativa all’osservatore in ca-


duta libera, F~grav è la forza gravitazionale agente sulla particella e F~app è la
forza apparente (detta anche forza di trascinamento) che agisce sulla parti-
cella in virtù del fatto che siamo in un riferimento non inerziale. Abbiamo
usato nell’ultimo passaggio il principio di equivalenza debole (mg = mi ) e
il fatto che, per l’osservatore in caduta libera, l’accelerazione apparente di
trascinamento eguaglia in modulo esattamente l’accelerazione gravitazionale,
ed è di verso opposto a questa. Perciò nel campo gravitazionale costante e
stazionario la particella si muove, rispetto all’osservatore in caduta libera,
come se fosse libera, come se non fosse soggetta ad alcuna forza.
Poiché ogni campo gravitazionale può essere localmente considerato co-
stante13 , ne segue che la proprietà di annullamento, globale per ogni campo
uniforme e stazionario, vale localmente per ogni campo gravitazionale.14

13
Qui “localmente” deve essere inteso in senso spaziotemporale, cioè per “piccole” regioni
di spazio (cosı̀ piccole da poter considerare ~g uniforme in tale regione) e per “brevi”
intervalli di tempo (cosı̀ brevi che la particella di prova non esca, in questo intervallo di
tempo, dalla regione in cui ~g può essere considerato uniforme).
14
È questa la situazione di “moto in assenza di peso” che si verifica, ad esempio, in ogni
navicella spaziale orbitante attorno alla terra: in assenza di spinta dei motori, essa si trova
infatti in caduta libera rispetto alla terra (“cade” infatti sulla terra con un’accelerazione
centripeta ~g ), e dunque la gravità terrestre è localmente annullata.
10.2. INCOMPATIBILITÀ DELLA GRAVITAZIONE 257

10.2 Incompatibilità della gravitazione con la


Relatività Ristretta
Vediamo ora come queste peculiarità della gravitazione che la rendono simile
alle forze apparenti15 portino alla conclusione che la gravitazione è incompa-
tibile con la struttura dello spaziotempo di Minkowski - o, in altri termini,
che lo spazio di Minkowski è la fisica in assenza di gravitazione.

10.2.1 Significato geometrico delle forze apparenti


Per spiegare questo punto vediamo innanzitutto come si possono descrivere
le forze apparenti nello spaziotempo M di Minkowski, considerando il caso
elementare del moto di una particella libera. In un riferimento inerziale
(coordinate cartesiane ortogonali su M ) le sue equazioni di moto si scrivono
in forma intrinseca come
dV j
=0 (10.7)

ovvero come
d2 xj
= 0, (10.8)
dτ 2
con j = 0, 1, 2, 3, essendo V~ la 4-velocità e xj (τ ) le coordinate nel riferimento
inerziale scelto. Per far comparire le forze apparenti dobbiamo scrivere le
equazioni di moto in un riferimento non inerziale (e quindi in coordinate
curvilinee su M ). Per farlo, ci rifacciamo al significato geometrico delle
equazioni precedenti: le soluzioni rappresentano infatti le geodetiche dello
spaziotempo di Minkowski. Vederlo non è difficile: facendo uso del concetto
di derivata direzionale (o covariante), possiamo sostituire la derivata rispetto
al tempo proprio τ con la derivata direzionale ∇V~ , che per definizione è la
derivata direzionale lungo la linea il cui vettore tangente è V~ , cioè il cui
parametro affine è l’arco τ . Possiamo dunque scrivere le equazioni di moto
(10.7) e (10.8) nella forma geodetica

∇V~ V~ = 0, (10.9)

che è esattamente la definizione di geodetica come curva autoparallela16 .


15
Abbiamo cosı̀ collegato il problema iniziale della Relatività Generale, vista come teoria
delle forze apparenti, alla teoria gravitazionale, vista come teoria delle forze gravitazionali.
16
Curva, cioè, la cui derivata covariante del campo dei vettori tangenti calcolata lungo
la curva stessa è nulla.
258 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

La geometria ci insegna che in coordinate generali (o curvilinee) l’equa-


zione (10.9) si scrive nella forma
d2 xj h
j dx dx
k
+ Γ hk = 0. (10.10)
dτ 2 dτ dτ
Le equazioni (10.10), al variare di j = 1, 2, 3, 4, devono essere pensate
come equazioni di moto in un riferimento non inerziale. Confrontandole
con le equazioni di Newton (10.8) in un riferimento inerziale, arriviamo alla
conclusione che il termine
dxh dxk
Γjhk
dτ dτ
deve essere interpretato come un’accelerazione apparente, e che quindi le forze
apparenti siano descritte da tale termine. Quindi, in relatività, notiamo che le
forze apparenti dipendono quadraticamente dalla velocità relativa, attraverso
i simboli di Christoffel Γjhk . In breve, possiamo dire che i simboli di Christoffel
rappresentano le forze apparenti. Il carattere non tensoriale di tali simboli
ben si collima con il carattere apparente (appunto) delle forze apparenti.
Poiché i simboli di Christoffel sono per ipotesi 17 relativi alla metrica
dello spaziotempo di Minkowski (che sappiamo essere piatto, cioè R = 0),
deve esistere18 un sistema di coordinate dove simultaneamente e globalmente
tutti i simboli di Christoffel si annullano, manifestando cosı̀ la proprietà di
annullamento globale delle forze apparenti.
Questa proprietà di annullamento globale è quindi una manifestazione
della piattezza dello spaziotempo di Minkowski, la quale a sua volta im-
plica l’esistenza di osservatori inerziali globali. La discussione ora fatta
mette quindi in luce la correlazione tra questi tre concetti, correlazione
schematizzata in figura 10.1.
Dove sta il nodo cruciale, l’anello che non tiene? L’anello che fa saltare
la catena è il fatto che la teoria della gravitazione obbliga la proprietà di
annullamento a essere solo locale! Intuitivamente comprendiamo già sin d’ora
che questo forzera gli osservatori inerziali a essere solo localmente tali e lo
spaziotempo M a essere solo localmente piatto, dunque in generale curvo.

10.2.2 Curvatura dello spaziotempo


L’analisi fino ad ora condotta ci ha portato a confrontare la gravitazione con
le forze apparenti, e a trovare tra esse le seguenti analogie:
17
Infatti stiamo ipotizzando di potere lavorare ancora nello spaziotempo piatto di
Minkowski.
18
Dalla geometria differenziale sappiamo infatti che il tensore di Riemann si annulla
identicamente se e solo se esiste un sistema di coordinate in cui tutti i simboli di Christoffel
sono nulli.
10.2. INCOMPATIBILITÀ DELLA GRAVITAZIONE 259

Figura 10.1: La piattezza di M coimplica la proprietà di annullamento glo-


bale. Infatti se M è piatto, R = 0 e dunque esiste un riferimento in cui i Γjhk
sono tutti nulli, ergo: vale la proprietà di annullamento globale. Viceversa, se
vale la proprietà di annullamento globale, tutti i Γjhk sono nulli in un qualche
riferimento, da cui R = 0. D’altro canto la piattezza di M implica l’esistenza
di osservatori globalmente inerziali; ma d’altro canto l’esistenza di osservatori
globalmente inerziali forza la piattezza di M . Possiamo quindi chiudere il cir-
colo, ottenendo che la proprietà di annullamento globale coimplica l’esistenza
di osservatori inerziali globalmente definiti.

• la rigorosa proporzionalità delle forze alle masse inerziali;


• la proprietà di annullamento: anche la gravità può essere (localmente)
annullata, come conseguenza della possibilità di compensare azioni gra-
vitazionali con forze apparenti. Si passa dalla fisica in un campo gra-
vitazionale uniforme alla fisica in assenza di peso per passaggio ad un
osservatore in caduta libera.
L’analogia con il caso delle forze apparenti suggerisce che gli osserva-
tori in caduta libera possano giocare il ruolo, in presenza di gravità, che gli
osservatori inerziali avevano nello spaziotempo di Minkowski, in assenza di
gravità.
La discrepanza tra forze gravitazionali e forze apparenti rispetto a un
osservatore accelerato nello spaziotempo di Minkowski è - abbiamo visto -
la località della proprietà di annullamento delle prime. Si possono annullare
azioni gravitazionali (a un certo ordine di approssimazione) nell’intorno di
ogni punto (scelto ad arbitrio) dello spaziotempo, ma non simultaneamente
in tutti i punti. Se per analogia pensiamo che ancora le forze gravitazionali
siano rappresentate dai simboli di Christoffel, dobbiamo supporre che tali
simboli si annullino solo localmente, e non identicamente sullo spaziotempo.19
19
Ribadiamo che il non annullamento globale dei simboli Γijk è una misura della curva-
tura dello spazio. Se infatti R = 0, di sicuro esiste un sistema di riferimento per cui i Γijk
260 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

La geometria ci insegna che ciò si realizza su una varietà (riemanniana


e di tipo lorentziano20 ). Infatti dalla geometria sappiamo sussistere due
importanti proprietà:

(i) Esistenza di coordinate locali geodetiche.


Se M è una qualsiasi varietà riemanniana dotata di metrica g, e P0 ∈ M
è un punto fissato ad arbitrio su M , allora esistono coordinate locali uc
centrate in P0 t.c.21

gab (P0 ) = ηab = diag(−1, 1, 1, 1)

e
∂gab
(P0 ) = 0.
∂uc
Sostanzialmente stiamo dicendo che comunque preso un punto di una
varietà riemanniana, esistono delle coordinate per cui la metrica, nel-
l’intorno del punto, ha la forma diagonale del tensore metrico minkow-
skiano η e inoltre tutte le derivate della metrica si annullano nel punto
fissato.22 Annullandosi le derivate della metrica in un certo intorno
di P0 , notiamo che in tale intorno devono necessariamente annullarsi
anche tutti i simboli di Christoffel Γijk . Questi sistemi locali di coor-
dinate che annullano nel punto i simboli di Christoffel rappresentano,
anzi definiscono, gli osservatori in caduta libera23 e le coordinate ad
essi associati vengono dette geometricamente coordinate locali geo-
detiche (mentre in fisica si preferisce la dicitura coordinate localmente
inerziali).

(ii) Effetto della curvatura.


La geometria ci insegna anche che l’ostruzione all’estensione globale
delle coordinate locali trovate al punto precedente è misurata dal ten-
sore di Riemann. È ovvio (dalla definizione di R) che se Γijk = 0

sono tutti identicamente nulli.


20
La varietà deve essere riemanniana (cioè dotata di metrica) per una nostra ipotesi
fisica: stiamo supponendo che lo spazio fisico sia metrico. Il fatto che la metrica debba
essere di tipo lorentziano è un retaggio della Relatività Ristretta: quando il campo è
debole, infatti, lo spazio di Minkowski è un’eccellente approssimazione dello spazio fisico.
21
L’utilizzo dei pedici a, b in luogo dei soliti j, k sta ad indicare che quelle uguaglianze
sono valide in quello speciale sistema di coordinate di cui si sta mostrando l’esistenza.
22
Anzi, potremmo anche estendere la proprietà agli intorni tubolari di una geodetica del
genere tempo, per tempi piccoli; ma questo fatto non interessa affatto la nostra trattazione.
23
Infatti un osservatore in caduta libera può essere definito come quell’osservatore per
cui la metrica ha localmente forma diagonale e derivate nulle.
10.2. INCOMPATIBILITÀ DELLA GRAVITAZIONE 261

identicamente in ogni punto e per ogni i, j, k, allora R = 0 dovunque,


e quindi la varietà è piatta per definizione. È meno ovvio, ma vero,
che vale il viceversa: se R = 0, allora esiste un sistema di coordinate
per cui i Γiik sono tutti identicamente nulli. R è cioè l’unica ostruzione
all’annullamento dei Γijk dappertutto. Calcolando R, mediante la sua
definizione, nelle coordinate scelte in precedenza, in P0 , abbiamo che

l
∂Γlmj ∂Γlmk
Rmjk (P0 ) = (P0 ) − (P0 ) + Γsmj (P0 )Γlsk (P0 ) − Γsmk (P0 )Γlsj (P0 ) =
∂uk ∂u j

∂Γlmj ∂Γlmk
= (P0 ) − (P0 ),
∂uk ∂uj

poiché i Γijk sono tutti identicamente nulli nelle coordinate scelte. Ma


le loro derivate, cioè le derivate seconde della metrica, in generale non
l
si annullano, e dunque Rmjk se ne guarda bene dall’essere nullo!

In breve: la presenza della gravità richiede la curvatura dello spaziotempo,


e quindi è incompatibile con l’esistenza di osservatori inerziali globali.
Con che cosa sostituirli? Dopotutto la fisica di Minkowski nel piccolo
deve continuare a valere! L’idea è quella di passare dal punto di vista globale
al punto di vista locale attribuendo il ruolo di osservatori localmente inerziali
agli osservatori in caduta libera, la cui esistenza ci è garantita dalla prima
delle due proprietà geometriche elencate.
Da un punto di vista prettamente geometrico la situazione è chiara24 : la
proprietà (i) appena menzionata significa che lo spazio tangente al punto P0
(TP0 M ) è uno spazio di Minkowski, poiché la metrica in questo spazio è la
metrica di Minkowski. Il passaggio dalla Relatività Ristretta alla relatività
generale (vista ormai come teoria spaziotemporale del campo gravitazionale)
consiste nell’estendere lo sguardo dallo spazio tangente alla varietà (fig. 10.2).

La curvatura dello spaziotempo, causata dalla presenza di materia, può


essere intuitivamente afferrata nella figura 10.3. Posizionando un oggetto pe-
sante (come una sfera di marmo) su un trampolino elastico, il trampolino ri-
sulterà incurvato; più l’oggetto è pesante, più il trampolino risulta incurvato.
Questo è sostanzialmente quanto accade quando una grande massa (quale
quella terrestre) viene posizionata nello spaziotempo, forzando la geometria
locale dello spazio (l’analogo del trampolino) a incurvarsi.

24
Ma era leggermente meno chiara all’epoca di Einstein.
262 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

Figura 10.2: Lo spaziotempo fisico M è uno spaziotempo curvo, il cui spazio


tangente TP M in ogni punto P è uno spazio semieuclideo di Minkowski.

Figura 10.3: Visualizzazione bidimensionale della curvatura dello spazio-


tempo: la presenza della materia modifica la geometria dello spaziotempo,
forzandolo ad incurvarsi (come una sfera di marmo al centro di un trampolino
elastico). Questa curvatura viene interpretata come gravità, sicché la geome-
tria svolge nella Relatività Generale il compito che la gravità svolgeva nella
meccanica classica.
10.2. INCOMPATIBILITÀ DELLA GRAVITAZIONE 263

10.2.3 Origine degli osservatori inerziali


L’aver collegato il concetto di osservatore (localmente) inerziale alla geome-
tria dello spaziotempo, e quindi in senso fisico alla geometria dell’universo,
ha anche un aspetto soddisfacente da un punto di vista fisico. Un problema
generale che ha assillato i fisici25 , da Newton in avanti, era di spiegare da
che cosa fossero determinati gli osservatori inerziali, perché cioè un certo os-
servatore fosse inerziale, mentre un altro non lo fosse. Newton rispondeva a
questa domanda con l’assioma dello spazio assoluto: gli osservatori inerziali
sono dunque quelli in quiete rispetto allo spazio. Questa giustificazione non
può più funzionare per Einstein.
La verifica sperimentale che nel nostro sistema solare gli osservatori iner-
ziali fossero in qualche modo legati alla materia distante (al “cielo delle stelle
fisse”) aveva portato Mach - come già accennato nella sezione 3.2 - a svilup-
pare l’idea che gli osservatori inerziali dovessero essere definiti dalla distri-
buzione di materia nell’universo.26 Gli osservatori inerziali sarebbero quindi
corpi in una particolare relazione con la materia distante (principio o punto
di vista di Mach).
Einstein riprende il punto di vista di Mach e lo realizza compiutamente:
comprendendo che la materia fissa la geometria dello spaziotempo e sapendo
che la geometria fissa gli osservatori localmente inerziali, egli realizza con-
cretamente il legame tra materia distante27 e osservatori inerziali. Quindi,
l’idea degli osservatori in caduta libera realizza il principio di Mach.

10.2.4 Il principio di equivalenza forte


Una volta arrivati a questo concetto è naturale assimilare gli osservatori in
caduta libera agli osservatori inerziali dello spaziotempo di Minkowski, ac-
cettando che nei riferimenti degli osservatori in caduta libera i fenomeni fisici
avvengano localmente tutti con le stesse modalità (a parità di condizioni
ambientali) e che le leggi della fisica assumano in tali riferimenti la forma
minkowskiana. Questa affermazione prende il nome di principio di equi-
valenza forte: esso postula la completa equivalenza (locale) degli osservatori
in caduta libera con gli osservatori inerziali di minkowskiana memoria.28
25
In effetti, questo è un punto critico assai problematico per la fisica in generale.
26
In sostanza, Mach ritiene che se ci fosse un solo corpo nello spazio vuoto non avrebbe
nemmeno senso la nozione di osservatore inerziale.
27
Perché “distante”? Perché per fissare la curvatura dello spaziotempo in un punto non
è sufficiente la materia nel punto: servono le derivate prime dei simboli di Christoffel, cioè
le derivate seconde della metrica, e dunque entra in gioco la materia distante.
28
In altre parole, postula che localmente gravità e accelerazione siano indistinguibili.
Naturalmente questo vale solo localmente: se lasciamo cadere due palline in un razzo in ac-
264 LEZIONE 10. APPRODO ALLA RELATIVITÀ GENERALE

Nello stesso ordine di idee è naturale assimilare le particelle in caduta


libera (cioè non soggette a forze di natura diversa dalla forza gravitazionale)
alle particelle libere tout-court di Newton, e quindi postulare che le linee di
universo di tali particelle siano geodetiche del genere tempo nello spaziotempo
(principio della geodetica). Tornando all’analogia con il trampolino di
figura 10.3, un oggetto di prova (ad esempio: una pallina di ping-pong)
posizionato sul trampolino incurvato, accelererà verso la sfera centrale in
un modo governato dalla curvatura stessa del trampolino. Il principio della
geodetica ci dice come la curvatura dello spaziotempo (cioè del trampolino)
governa il moto della materia: i corpi in caduta libera (come la pallina da
ping-pong) seguono geodetiche nello spaziotempo. Ad esempio, inviando la
pallina con la giusta velocità e direzione, essa inizierà a orbitare intorno alla
palla di marmo centrale (come la luna orbita intorno alla terra).
Concettualmente, abbiamo sostituito all’idea di forza gravitazionale la
geometria: la traiettoria della pallina da ping-pong non è più dovuta alla
gravità, piuttosto diciamo che è dovuta alla curvatura dello spaziotempo e
al principio che vuole la traiettoria della pallina essere una geodetica in tale
spaziotempo. In generale stiamo considerando fenomeni che classicamente
erano legati all’azione della gravità (come la caduta dei gravi o il moto di
una navicella orbitante) come fenomeni di caduta libera, che localmente sono
a tutti gli effetti inerziali.29
La presenza di un campo gravitazionale non uniforme, che quindi non può
essere annullato globalmente e che implica la curvatura dello spaziotempo, si
manifesta nel fenomeno di deviazione geodetica che studieremo tra poco.

celerazione, tali palline seguiranno sempre traiettorie parallele, mentre se lasciamo cadere
le stesse palline da posizioni molto diverse della superficie terrestre, entrambe si indiriz-
zeranno verso il centro della terra (con evidente rottura della simmetria tra accelerazioni
apparenti e gravità).
29
Cosı̀, ad esempio, quando percepiamo, stando sulla superficie terrestre, una “forza di
gravità”, essa è sostanzialmente un risultato del fatto che, non essendo noi osservatori
in caduta libera, siamo continuamente sottoposti a un’accelerazione fisica causata dalla
resistenza meccanica della superficie terrestre.
Lezione 11

Equazioni di Einstein

11.1 Il problema delle equazioni di campo


Il principio della geodetica dice come la geometria dello spaziotempo controlli
il moto della materia. Resta però da determinare come la materia (intesa
nella duplice veste einsteiniana di massa ed energia) governi la geometria
dello spaziotempo1 , secondo lo schema in figura 11.1.

Figura 11.1: La materia (intesa come distribuzione di massa ed energia)


produce il campo gravitazionale, e quindi è la responsabile (mediante le equa-
zioni di campo) della curvatura dello spaziotempo, e più in generale della sua
geometria. La curvatura dello spaziotempo, a sua volta, mediante il principio
della geodetica, ci dice come avviene il moto della materia, come si muovono
nel campo le particelle e la luce.

11.1.1 Le accelerazioni di marea


Abbiamo ripetuto più volte che la curvatura dello spaziotempo è dovuta alla
disomogeneità del campo gravitazionale, disomogeneità che si manifesta nelle
cosiddette accelerazioni di marea. Analizziamo questo fenomeno anzitutto
dal punto di vista tridimensionale classico di Newton.
1
Dirà John Arcibald Wheeler: “lo spazio influenza la massa, dicendole come muoversi,
e la massa influenza lo spazio, dicendogli come incurvarsi”. (“Spacetime grips mass, telling
it how to move, and mass grips spacetime, telling it how to curve.”)

265
266 LEZIONE 11. EQUAZIONI DI EINSTEIN

Le accelerazioni di marea sulla superficie terrestre

Iniziamo a studiare, ad esempio, il campo gravitazionale prodotto dal sole


sulla superficie terrestre.2 Mettiamoci innanzitutto nel punto di vista di un
osservatore inerziale che assumiamo situato nel centro del sole. La situa-
zione è quella riportata in figura 11.2a: il centro della terra “cadrà” sul sole
con un’accelerazione ~g , mentre i punti sulla superficie terrestre in generale
subiranno accelerazioni diverse, a seconda della loro distanza dal centro del
sole, poiché vale la legge di gravitazione universale e dunque l’accelerazione
in un punto sulla superficie sarà proporzionale al quadrato della distanza tra
il punto e il centro del sole.
Passiamo poi all’osservatore in caduta libera posizionato nel centro della
terra: in questo modo stiamo annullando la gravità nel centro della terra
(localmente), ma non sulla superficie terrestre (non globalmente). Per avere
il campo gravitazionale in un qualsiasi punto della superficie terrestre, non
dobbiamo far altro che sommare l’accelerazione di trascinamento ~a = −~g a
ogni vettore disegnato precedentemente. Si ottiene il diagramma di figura
11.2b, che rappresenta la distribuzione delle accelerazioni di marea. Notiamo
dunque che, tra due qualsiasi dei punti della superficie terrestre, viene a
prodursi un’accelerazione relativa non nulla.
Più in generale, notiamo che l’effetto delle accelerazioni di marea è di pro-
durre un’accelerazione relativa tra le particelle di un fascio di particelle in
caduta libera nel campo gravitazionale. Spieghiamo meglio: qualsiasi punto
della superficie terrestre, infatti può essere considerato in caduta libera; l’in-
sieme dei punti della superficie terrestre è quindi sostanzialmente un fascio
di particelle in caduta libera in un campo gravitazionale. A causa della
disomogeneità di questo campo, le particelle del fascio sono sottoposte ad
accelerazioni diverse, e non esiste un sistema che possa annullare tutte que-
ste accelerazioni contemporaneamente (l’annullamento sarà solo locale, come
avviene scegliendo come sistema di riferimento il centro della terra): l’effetto
è la produzione di accelerazioni relative tra le particelle del fascio, per cui tali
particelle tenderanno a separarsi con legge non lineare. Più chiaramente, non
c’è nulla di strano che le particelle si separino: se non ci fosse gravità, esse
si muoverebbero di moto rettilineo e uniforme, e quindi nulla impedisce che
si separino, ma a velocità costante, quindi con legge lineare. La presenza del
campo disomogeneo, invece, fa separare le particelle del fascio con una certa
accelerazione relativa: ribaltando il ragionamento, possiamo anche dire che

2
Le accelerazioni di marea terrestri, poi, sono però essenzialmente prodotte dal-
l’attrazione lunare, e non dal sole. Tuttavia questo esempio è utile per chiarire la
situazione.
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 267

Figura 11.2: Campo delle accelerazioni di marea sulla superficie terrestre in-
dotte dal sole. Nel diagramma (a) la situazione è descritta dal punto di vista
di un osservatore inerziale situato nel centro del sole: il centro della terra è in
caduta libera sul sole con un’accelerazione ~g ; ogni punto della superficie ter-
restre, a causa delle disomogeneità del campo, subisce invece un’accelerazione
diversa, proporzionale al quadrato della sua distanza dal centro del sole. Nel
diagramma (b) è dipinta la stessa situazione dal punto di vista di un osserva-
tore in caduta libera nel centro della terra: ivi la gravità è annullata, ma non
è annullata la gravità sulla superficie terrestre, poiché in ogni punto la somma
dell’accelerazione del diagramma a e dell’accelerazione ~g con cui il centro del
sole cade ora sulla terra è non nulla. Naturalmente ambedue i diagrammi
mostrano effetti volutamente esagerati, a scopo esemplificativo.
268 LEZIONE 11. EQUAZIONI DI EINSTEIN

la presenza di questa accelerazione relativa tra le particelle è sintomo della


presenza di un campo gravitazionale non uniforme.

Calcolo classico dell’accelerazione di marea


Studiamo ora questa accelerazione relativa che si viene a creare. Conside-
riamo una regione di spazio descritta da un’energia potenziale Φ, secondo la
versione della legge di gravitazione universale data dalla cosiddetta equazione
di Poisson:
4Φ = 4πGρ. (11.1)
Questa è la legge classica, che mostra come la materia (rappresentata dalla
densità di massa ρ) governa il campo gravitazionale (rappresentato dalla sua
energia potenziale Φ).
In ogni punto dello spazio è quindi definita un’accelerazione di gravità ~g
data da
~g = − grad Φ. (11.2)
Le particelle in caduta libera sono quelle che si muovono con accelerazione
pari in modulo, direzione e verso, all’accelerazione del campo, e dunque si
devono muovere secondo l’equazione di Newton

~a = ~g ,

che in coordinate cartesiane3 possiamo scrivere come

d2 xa ∂Φ
2
= − a. (11.3)
dt ∂x
Consideriamo ora un fascio di particelle in caduta libera, fascio descritto
dalla famiglia di funzioni
xa (t, s),
ove s è il parametro che individua la particella all’interno del fascio e t è il
parametro tempo.4
Il vettore separazione tra due particelle infinitamente prossime è dato

∂xa
wa = , (11.4)
∂s
3
Ricordiamo che in coordinate cartesiane scrivere gli indici dei vettori in posto
covariante o covariante è equivalente.
4
Si immagini, ad esempio, una collanina di perle che cada in un campo gravitazionale
non uniforme: che cosa accade tra le perle?
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 269

la velocità relativa tra le particelle (cioè la variazione nel tempo del vettore
separazione) è dunque data da

dwa ∂ 2 xa
= (11.5)
dt ∂t∂s
e l’accelerazione relativa è
d2 wa ∂ 3 xa
= , (11.6)
dt2 ∂t2 ∂s
dove abbiamo usato i simboli di derivata ordinaria, intendendo la velocità
relativa e l’accelerazione relativa come funzioni del tempo t.
Il nostro obiettivo è ora trovare l’equazione differenziale per quest’ultimo
vettore (l’accelerazione relativa), e lo facciamo derivando la legge di moto
(11.3) e utilizzando la commutatività delle derivate parziali:

d2 wa ∂ ∂ 2 xa ∂ 2 Φ ∂xb ∂2Φ b
   
∂ ∂Φ
= = (x(t, s)) = = w
dt2 ∂s ∂t2 ∂s ∂xa ∂xa ∂xb ∂s ∂xa ∂xb

Dunque la matrice hessiana

∂2Φ
Hab = , (11.7)
∂xa ∂xb
che in generale non è nulla, misura la disomogeneità del campo gravitazionale:
2 a
l’accelerazione relativa ddtw2 è a sua volta non nulla, ed è funzione lineare del
vettore separazione wa . Possiamo infatti scrivere, in notazione tensoriale, che

d2 wa
= −Hba wb , (11.8)
dt2
con a = 1, 2, 3 (siamo infatti nel caso dello spazio tridimensionale newto-
niano).
Dalla (11.8) è chiaro come l’accelerazione di marea (legata alla diso-
mogeneità del campo gravitazionale) sia una funzione lineare del vettore
separazione. Inoltre la traccia dell’hessiana H è laplaciando di Φ
3
X ∂2Φ
trH = Haa = a ∂xa
= 4Φ,
a=1
∂x

e quindi l’equazione di campo newtoniana (11.1) si può anche scrivere nella


forma equivalente di
Haa = 4πGρ. (11.9)
270 LEZIONE 11. EQUAZIONI DI EINSTEIN

Calcolo relativistico dell’accelerazione di marea


Ripetiamo lo stesso calcolo della sezione precedente in un contesto differente,
cioè nel contesto di uno spaziotempo quadridimensionale che sia una varietà
riemanniana (dotata di metrica g).5 Sia

xj (τ, σ)

una famiglia ad un parametro (σ) di geodetiche del genere tempo parame-


trizzate dal tempo proprio τ - sono cioè le curve descritte da una famiglia
particelle in caduta libera.
La 4-velocità lungo la singola geodetica è data dall’espressione

∂ ∂xj ∂
V~ = V j j = , (11.10)
∂x ∂τ ∂xj

dove i vettori ∂xj
sono i vettori della base naturale6 . Il vettore separazione è

∂ j ∂xj ∂
w
~ =w = . (11.11)
∂xj ∂σ ∂xj
Vogliamo studiare l’accelerazione relativa in funzione del vettore sepa-
razione w:
~ l’equazione che esprimerà la dipendenza tra tali due quantità
prenderà il nome di equazione della deviazione geodetica. Per studiare l’ac-
celerazione relativa dobbiamo innanzitutto definirla.
Se w
~ è il vettore separazione dipendente dal parametro temporale t e dal
parametro σ che identifica la curva del fascio, chiameremo velocità relativa
tra due particelle del fascio la quantità
 2 j h k

∂w~ ∂ x j ∂x ∂x ∂
= ∇V~ w
~= + Γhk , (11.12)
∂τ ∂τ ∂σ ∂σ ∂τ ∂xj

cioè la derivata covariante7 lungo la 4-velocità V~ del vettore separazione -


come riportato, essa coincide esattamente con la derivata di w ~ rispetto al
~
tempo proprio, essendo V il vettore velocità della curva parametrizzata con
5
Per convenzione utilizzeremo la segnatura lorentziana − + + +, mettendo la
coordinata temporale nella entrata 0-esima di ogni vettore (ad esempio x0 ).
6
La notazione è piuttosto comune: si pensa ai campi vettoriali come a derivazione di

funzioni, dunque la base naturale è data dai funzionali ∂x j . Si può altrimenti pensare alla
∂P
base naturale come ai vettori ∂xj .
7
Il passaggio dalla Relatività Ristretta alla Relatività Generale va di pari passo con il
passaggio dalla derivata direzionale euclidea (costruita con le derivate parziali ordinarie)
alla derivazione covariante che, come sarà meglio ricordato dopo, se calcolata di un campo
tangente alla superficie considerata, restituisce ancora un campo tangente.
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 271

il tempo proprio. Analogamente definiamo come accelerazione relativa la


quantità
∂2w
~
= ∇V~ ∇V~ w,
~ (11.13)
∂τ 2
nella cui espressione esplicita compariranno anche derivate e prodotti dei
Γjhk .8
Per calcolare in modo intrinseco (cioè non in componenti) il vettore
accelerazione relativa di marea
∇V~ ∇V~ w
~
ricordiamo le seguenti proprietà della derivazione covariante e delle geodeti-
che.
(i)
~ = ∇w~ V~ ,
∇V~ w
cioè la derivata covariante commuta rispetto allo scambio degli argo-
menti. Questo è chiaro dal momento che nella definizione di derivata
k ∂ k ∂
covariante (posto w ~ = wk ∂x∂ k = ∂x
∂σ ∂xk
e V~ = V k ∂x∂ k = ∂x
∂τ ∂xk
)
 j   2 j h k

∂w j h k ∂ ∂ x j ∂x ∂x ∂
∇V~ w~= + Γhk w V j
= + Γhk
∂τ ∂x ∂σ∂τ ∂σ ∂τ ∂xj
le derivate parziali miste commutano e i simboli di Christoffel sono
simmetrici rispetto allo scambio degli indici covarianti.
In virtù di questa proprietà si usa dire che la connessione è a tor-
sione nulla (in un certo senso infatti la torsione misura il difetto di
commutatività nello scambio di argomenti).
Questa proprietà non è vera per ogni campo vettoriale, ma solo per
i campi vettoriali della base canonica, altrimenti bisogna inserire un
termine correttivo.
(ii)
~ = R~vw~ (X)
~ = Rp v j w k X q ∂
(∇~v ∇w~ − ∇w~ ∇~v )X qjk ,
∂xp
che traduce la dipendenza del trasporto per parallelismo dalla curva
scelta. Infatti, al contrario delle derivate parziali, le derivate covarianti
non commutano: il difetto di commutazione è misurato dal tensore di
Riemann, visto come una famiglia di applicazioni lineari associati ai
diversi piani coordinati.
8
E ciò ci lascia già subodorare che possa fare il suo ingresso, da qualche parte, il tensore
di Riemann, che è proprio costruito con derivate e prodotti dei simboli di Christoffel.
272 LEZIONE 11. EQUAZIONI DI EINSTEIN

Figura 11.3: Figura esemplificativa: il trasporto per parallelismo lungo il


primo circuito elementare, caratterizzato dal valore R12 dell’applicazione li-
neare di Riemann, restituisce un vettore X ~ 0 ruotato rispetto all’originale. In
generale la differenza ∆X ~ dipende dall’area del circuito e dall’applicazione
~ associata ai vettori del circuito determinato dalla coppia di vettori
R~vw~ (X)
(~v , w).
~ In generale R~vw~ , per qualsiasi scelta di ~v e w,
~ sarà combinazione lineare
dei circuiti elementari associati ai piani coordinati. Se, a scopo esemplificativo,
si considerano triangoli elementari al posto di parallelogrammi elementari e se
si assumono i vettori delle tre facce segnalate in figura come vettori fondamen-
tali, allora ogni altra applicazione R~vw~ si potrà scrivere come combinazione
lineare di R12 , R13 e R23 . I coefficienti della combinazione saranno sostan-
zialmente i coseni direttori dell’area del parallelogramma (~v , w) ~ proiettato sui
piani coordinati.
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 273

Figura 11.4: Trasporto per parallelismo lungo un triangolo geodetico di S 2 :


alla fine del cammino, il vettore iniziale risulta ruotato rispetto al vettore
iniziale. Il trasporto per parallelismo quindi su superfici curve dipende dal
cammino scelto.

Chiariamo meglio la situazione. Si supponga, a scopo esemplificativo,


di prendere un tetraedro9 come quello in figura 11.3. Se trasportiamo
per parallelismo il vettore X~ lungo il circuito indicato, quando il vet-
tore tornerà alla punta (chiamiamo X~ 0 questo nuovo vettore), non avrà
cambiato modulo ma avrà in generale cambiato direzione, sarà cioè
ruotato di un certo angolo per effetto della curvatura (v. fig. 11.4). La
quantità
∆X~ =X ~0 −X ~

in generale sarà lineare in X (se un ~v = ~u + w,


~ anche i relativi vet-
tori dopo il trasporto soddisferanno alla stessa identità) e dipenderà
~
dall’area della regione lungo cui abbiamo trasportato X.
In generale sarà quindi che

~ = A · R~vw~ (X),
∆X ~ (11.14)

ove A è l’area della regione e R~vw~ è la matrice che esprime la linearità


~ la quale sappiamo dalla geometria differenziale coincidere con
in X,
il tensore di Riemann. Il tensore di Riemann misura dunque anche
la dipendenza del trasporto per parallelismo dal cammino scelto. In
particolare, ad ogni circuito identificato dai vettori ~v e w~ (cioè a ogni
9
In realtà questo discorso dovrebbe essere fatto sui parallelogrammi, ma l’esempio del
tetraedro è più efficace.
274 LEZIONE 11. EQUAZIONI DI EINSTEIN

parallelogramma da essi formato) sarà associata l’applicazione lineare


R~vw~ che fornisce il vettore differenza ∆X ~ dopo il trasporto in funzione
del vettore di partenza. Se consideriamo come “parallelogrammi base”
quelli costruiti sui vari piani coordinati, avremo che l’applicazione R~vw~
per ~v , w
~ generici (quindi anche sghembi, rispetto alle rette coordinate)
sarà una combinazione lineare delle applicazioni sui piani coordinati.
Ad esempio, tornando alla semplificazione del tetraedro in figura 11.3,
se prendiamo R13 , R23 e R12 come piani coordinati, l’applicazione su
qualsiasi altro circuito sarà data da una loro combinazione lineare, della
forma
R~vw~ = R12 v 1 w2 + R13 v 1 w3 + R23 v 2 w3 ,
in cui i pesi sono essenzialmente i coseni direttori dell’elemento di area
determinato da ~v e w ~ rispetto ai piani coordinati.
Riassumendo: l’applicazione lineare associata al circuito (~v , w)
~ è una
combinazione lineari delle applicazioni associate ai piani coordinati, i
cui coefficienti sono le aree delle proiezioni dell’elemento di area del
circuito sui piani coordinati (sostanzialmente i coseni direttori).
Tornando alla formula

~ = R~vw~ (X)
~ = Rp v j w k X q ∂
(∇~v ∇w~ − ∇w~ ∇~v )X qjk ,
∂xp
ancora una volta bisogna specificare che essa non vale per qualsiasi
campo vettoriale, ma solo per i campi vettoriali della base naturale.
Notiamo anche il diverso ruolo svolto dai quattro indici nel tensore di
p
Riemann: in Rqjk , la coppia (p, q) è formata dagli indici di matrice
ed individua l’applicazione lineare, mentre la coppia (j, k) è formata
dagli indici di dipendenza dalle facce coordinate, quindi è associata al
parallelogrammino.
(iii) L’equazione
∇~v~v = 0
è la definizione di curva geodetica come curva autoparallela, cioè curva
lungo la quale si vede (mettendosi sulla superficie considerata) che il
versore tangente non cambia direzione.

Proviamo ora a combinare queste tre proprietà.10 L’idea è che dobbiamo


sfruttare l’equazione delle geodetiche: stiamo infatti calcolando variazioni
10
Per apprezzare veramente questo formalismo intrinseco bisognerebbe riavvicinarsi ad
esso dopo aver sprecato una gran quantità di fatica provando a linearizzare direttamente
l’equazione (11.13), dopo averla espressa in componenti.
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 275

lungo delle geodetiche, e questa informazione da qualche parte alla fine dovrà
comparire.
Partendo dalla definizione dell’accelerazione di marea come ∇V~ ∇V~ w ~ si
passa per la proprietà (i) all’espressione ∇V~ ∇w~ V~ , alla quale possiamo poi
11

aggiungere il termine −∇w~ ∇V~ V~ , essendo esso nullo per la proprietà (iii) delle
geodetiche. Dunque

~ = ∇V~ ∇w~ V~ = (∇V~ ∇w~ − ∇w~ ∇V~ )V~ .


∇V~ ∇V~ w

La proprietà (ii) infine ci ricollega all’applicazione RV~ w~ :

~ = (∇V~ ∇w~ − ∇w~ ∇V~ )V~ = RV~ w~ (V~ ),


∇V~ ∇V~ w (11.15)

ovvero per componenti


 l
~ l = RV~ w~ (V~ ) = Rmjp
(∇V~ ∇V~ w) l
V j wp V m = −Rmpj
l
v j v m wp , (11.16)

ove abbiamo sfruttato l’antisimmetria del tensore di Riemann per scambio


l l
degli ultimi due indici covarianti: Rmjp = −Rmpj .
Possiamo riscrivere anche come

~ l = −Rmpj
(∇V~ ∇V~ w) l
V j V m wp = −Kpl (V~ )wp (11.17)

per notare ancora meglio come l’espressione dell’accelerazione relativa sia


lineare nel vettore separazione w.~
L’equazione (11.15) prende il nome di equazione della deviazione geo-
detica. Essa afferma che, anche nel caso delle geodetiche, l’accelerazione
relativa (o accelerazione di marea) è una funzione lineare del vettore se-
parazione. L’applicazione lineare che lega accelerazione di marea a vettore
separazione è data da
Kpl (V~ ) = Rmpj
l
V mV j
e corrisponde all’hessiana Hba definita dalla (11.7) che avevamo trovato nel
calcolo classico.

11.1.2 La derivata covariante


Dal caso euclideo alle superfici
Per rinfrescare la memoria, richiamiamo brevemente il concetto di derivata
covariante, di cui abbiamo fatto uso nei calcoli precedenti.
11
Notiamo ancora una volta che l’accelerazione di marea è legata al trasporto lungo il
~ , w)
parallelogramma definito da (V ~ e quindi in generale non è nulla.
276 LEZIONE 11. EQUAZIONI DI EINSTEIN

Figura 11.5: Derivata covariante sulla circonferenza: la derivata euclidea di


un campo tangente non è in generale un campo tangente.

Nel caso del piano euclideo, abbiamo a disposizione una nozione di deri-
vazione direzionale ben definita e nota dall’analisi. L’idea è di trasportare
questa derivazione al caso di superfici qualunque.
Si consideri un campo vettoriale X(P ~ ) superficiale, ovvero tangente al
supporto di una certa superficie in ogni suo punto. Si consideri inoltre una
~ può essere pensato come
curva γ passante per P con velocità ~v . Il campo X
immerso nello spazio euclideo, e quindi derivato nella maniera euclidea cui
siamo abituati (derivata direzionale ordinaria). Il problema è che la derivata
di un campo tangente alla superficie non è in generale un campo tangente
alla superficie.12
12
Come esempio banale si consideri (fig. 11.5) la circonferenza unitaria, di equazione
parametrica
P (θ) = cos θ~i + sin θ~j.
Consideriamo il campo tangente alla curva

dP
~eθ = = − sin θ~i + cos θ~j

e la sua derivata direzionale lungo il vettore ~v (il vettore velocità della curva)

d ∂θ ∂θ
∇~v ~eθ = (− sin θ~i + cos θ~j) = − (cos θ~i + sin θ~j) = − ~er .
dt ∂t ∂t
Ciò che otteniamo è un vettore che non è per nulla tangente alla curva (la nostra varietà
riemanniana), anzi: è addirittura normale ad essa. Dunque in generale non è vero che la
derivata direzionale di un campo superficiale è un vettore tangente alla superficie.
11.1. IL PROBLEMA DELLE EQUAZIONI DI CAMPO 277

Si conviene allora di chiamare derivata covariante (o derivata dire-


zionale superficiale) la miglior approssimazione della derivata precedente,
cioè la proiezione sul piano tangente alla superficie della derivata direzionale
euclidea. In simboli: Y
~ :=
∇~v X ~
∇~vE X (11.18)
TP S
Y
dove indica appunto la proiezione sul piano tangente e ∇~vE indica la
TP S
derivata direzionale euclidea, che in generale potrà essere scomposta in due
componenti: la componente tangente alla superficie e la componente normale
ad essa; con la derivata covariante stiamo prendendo solo la componente
tangente, dimenticandoci dell’altra.
La derivata covariante ∇~v associa dunque a un campo tangente X ~ un altro
~
campo ∇~v X tangente alla superficie per costruzione. Si può dimostrare facil-
mente che il risultato di questa derivazione non dipende dall’immersione, ma
che è intrinseca e che dipende unicamente dalla conoscenza della metrica.13
Essa risulta definita come
∂X j
 
~ j h k ∂
∇~v X := + Γhk X v (11.19)
∂t ∂xj

dove le xi sono le coordinate e X k , v k sono le componenti dei vettori sulla


base naturale dei ∂x∂ k .
Incidentalmente, dalla definizione (11.19) segue che
∂ ∂
∇ ∂
p
= Γlpq l , (11.20)
∂xq ∂x ∂x
il che dà un ulteriore significato ai simboli di Christoffel.

Assiomatizzazione di Koszul
La derivata covariante può essere definita anche in maniera assiomatica, come
operazione di composizione sui campi vettoriali (che a due campi ne associa
un terzo)
~ Y~ ) → Z
(X, ~ = ∇ ~ Y~
X

e che gode delle seguenti proprietà (dette assiomi di Koszul):


13
Come già scritto nella nota 23 a pagina 175, per l’approfondimento (e per le dimostra-
zioni) sull’argomento si rimanda alle “Nozioni di Geometria Differenziale” scaricabili
dal seguente indirizzo:

http://www.webalice.it/dghisi/scritti/geometria.pdf
278 LEZIONE 11. EQUAZIONI DI EINSTEIN

~ e in ~v :
(i) additività in X

~1 + X
∇~v (X ~ 2 ) = ∇~v X
~ 1 + ∇~v X
~ 2,

~ = ∇~v1 X
∇~v1 +~v2 X ~ + ∇~v2 X.
~

Si noti come quest’ultima espressione (principio di sovrapposizione) dia


la derivata lungo lungo la diagonale del parallelogramma avente per lati
~v1 e ~v2 ;

(ii) f-linearità in ~v :
~ = f · ∇~v X
∇f ·~v X ~

con f una qualsiasi funzione scalare differenziabile;


~
(iii) leibnitzianità in X:

~ = f · ∇~v X
∇~v (f · X) ~ + (∇~v f ) · X.
~

La derivazione covariante definita assiomaticamente in questo modo viene


detta derivazione covariante alla Koszul (o connessione lineare).
Si dimostra che questa definizione coincide esattamente con la derivata
covariante definita nella sezione precedente, a patto che i coefficienti nella
(11.1.2) siano proprio i simboli di Christoffel. Più esplicitamente, la deriva-
zione covariante alla Koszul è definita, in un qualsiasi sistema di coordinate,
dai coefficienti di connessione, ossia dai coefficienti dello sviluppo di ∇~bk~bj ,
una volta fissata una base {~bi } per lo spazio tangente. In altre parole: se
invece che considerare la base naturale dei ∂x∂ j consideriamo una qualsiasi
base nello spazio tangente, possiamo scomporre i vettori rispetto a tale base
e considerare i relativi coefficienti di connessione.
Oppure, simmetricamente, conviene non cambiare base nello spazio tan-
gente (restare con la base naturale) ma alterare i coefficienti della (), che in
generale non saranno più i simboli di Christoffel; in questo senso fissato un
sistema di coordinate, dare una derivazione covariante significa dare le n3
funzioni Lljk che descrivono il comportamento dei vettori della base naturale
associata alle coordinate, le funzioni quindi che soddisfano
∂ ∂
∇ ∂
j
= Lljk l . (11.21)
∂xk ∂x ∂x
Il cambiamento di punto di vista è chiaro: la connessione (la derivazione
covariante) è data a partire dai coefficienti Lljk , ed è completamente definita
da essi.
11.2. EQUAZIONI NEL VUOTO 279

Nel caso in cui


Lljk = Γljk , (11.22)
cioè nel caso “semplice” che abbiamo analizzato nella sezione precedente, il
procedimento di derivazione viene anche detto derivazione covariante alla
Levi-Civita.
Definendo infatti la torsione T di due campi X,~ Y~ come
~ Y~ ) = ∇ ~ X
T (X, ~ − ∇ ~ Y~ − [X,
~ Y~ ] (11.23)
Y X
~ Y~ ] è il commutatore14 : [X,
dove [X, ~ Y~ ] = X~ Y~ − Y~ X,
~ si dimostra che la
connessione di Levi-Civita è l’unica connessione che, oltre ai tre assiomi di
Koszul, verifica anche le seguenti proprietà:
(iv) è a torsione nulla:
~ Y~ ) = ∇ ~ X
T (X, ~ − ∇ ~ Y~ − [X,
~ Y~ ] = 0,
Y X

cioè
~ − ∇ ~ Y~ = [X,
∇Y~ X ~ Y~ ];
X

(v) è metrica, cioè è compatibile con la metrica (conserva angoli e prodotti


scalari):
~ Y~ · Z)
X( ~ = (∇ ~ Y~ ) · Z
~ + Y~ · (∇ ~ Z).
~
X X

L’asserto di unicità è anche noto con il nome di Teorema Fondamentale


della Geometria Riemanniana; per questo talvolta la connessione di Levi-
Civita viene anche detta connessione di Riemann o, dalla proprietà (v),
“connessione metrica”.
Dato che i coefficienti di connessione coincidono con i simboli di Chri-
stoffel, la derivata covariante alla Levi-Civita è dunque proprio la parte tan-
gente della derivata euclidea ed è dunque la derivata che abbiamo trovato e
utilizzato nei paragrafi precedenti, e sarà anche la derivata che in generale
utilizzeremo.

11.2 Equazioni nel vuoto


11.2.1 Equazioni di campo e tensore di Ricci
Mettiamoci ora in una regione ove non c’è materia. Secondo Newton vale la
(11.1), e dunque che
4Φ = 4ϕGρ = 0, (11.24)
14
Talvolta anche detto parentesi di Lie. Si noti che X ~Y~ eY ~X~ non sono in generale
~ ~
campi vettoriali tangenti; tuttavia si può dimostrare che [X, Y ] è un campo vettoriale
tangente.
280 LEZIONE 11. EQUAZIONI DI EINSTEIN

poiché ρ = 0 per l’assenza di materia, o anche, ricordando la (11.9), come

trH = Haa = 0. (11.25)

Per analogia con la formula newtoniana, Einstein propone di considerare


come equazioni del campo gravitazionale nel vuoto le equazioni

Kll (V~ ) = Rmlj


l
V m V j = 0, (11.26)

o anche
Kll (V~ ) = Rmj V m V j = 0, (11.27)
l
chiamando Rmj = Rmlj la contrazione del tensore di Riemann sulla com-
ponente controvariante e sulla terza componente covariante, contrazione che
solitamente viene chiamata tensore di Ricci e indicata con Ric(g), ove
l’argomento esplicita la (naturale) dipendenza di tale tensore dalla metrica.15
La (11.27) si annulla identicamente qualunque sia il fascio di particelle
considerato: è necessario dunque che Rmj (g) = 0 per ogni m, j, cioè deve
annullarsi identicamente il tensore di Ricci. Pertanto l’analogo einsteiniano
dell’equazione di campo di Newton 4Φ = 0 è

Ric(g) = 0, (11.28)

o, per componenti,
Rjk = 0 ∀j, k. (11.29)
Queste sono a tutti gli effetti le equazioni che descrivono il campo gra-
vitazionale in assenza di materia, e sono note con il nome di equazioni di
Ricci oppure come equazioni di Einstein nel vuoto, poichè coincideranno
con le più generali equazioni di Einstein nell’ipotesi in cui non vi sia materia.

11.2.2 Parallelo con la teoria newtoniana


Perfezioniamo l’analogia tra Newton ed Einstein nello schema riportato in
figura 11.6.
Il confronto mostra che la teoria newtoniana è una teoria scalare (con
un solo potenziale), e quindi le equazioni di campo si riducono a una sola
equazione scalare differenziale del second’ordine.
La teoria einsteiniana è invece una teoria a 10 potenziali: tutte le quantità
sono infatti costruite unicamente a partire dalla metrica, che è una matrice
simmetrica di ordine 4, e dunque ha esattamente 10 elementi indipendenti.
15
Naturalmente essendo una contrazione del tensore di Riemann dipende unicamente
dalla metrica. Si usa solitamente riportare tale dipendenza sempre in modo esplicito.
11.2. EQUAZIONI NEL VUOTO 281

Figura 11.6: Schema riepilogativo del parallelo tra la teoria newtoniana e la


teoria Einsteiniana. La teoria newtoniana è una teoria a un solo potenziale Φ,
da cui discendono per derivazione l’accelerazione di gravità ~g e il tensore che dà
le accelerazioni di marea (l’hessiana Hba ); la traccia di tale tensore deve essere,
per le equazioni di Newton, il laplaciano del potenziale. La teoria einsteiniana
è una teoria a dieci potenziali (le componenti indipendenti del tensore metrico
gjk ), che per derivazione danno luogo ai simboli di Christoffel Γljk e al tensore
di curvatura di Riemann Rmjk l , tensore che rende conto anch’esso delle acce-
lerazioni di marea, come mostra l’equazione (11.17), e che per contrazione dà
luogo al tensore di Ricci, il quale deve quindi essere visto come l’analogo del
laplaciano di Φ.
282 LEZIONE 11. EQUAZIONI DI EINSTEIN

L’identificazione della gravitazione con la geometria dello spaziotempo im-


plica che le 10 componenti del tensore metrico svolgano il ruolo di 10 poten-
ziali.16 Le equazioni di campo devono perciò essere un sistema di 10 equazioni
differenziali del second’ordine nella metrica. Di fatto la scrittura
Ric(g) = 0
racchiude 10 equazioni differenziali del second’ordine: anche il tensore di
Ricci infatti è un tensore di ordine 4 simmetrico, con quindi 10 componenti
indipendenti.
Una seconda differenza essenziale tra l’equazione di Newton e le equa-
zioni di Einstein (oltre al numero) è che queste ultime sono non lineari nella
metrica: la prima non linearità subentra sin dal calcolo dei simboli di Chri-
stoffel e dall’inversione del tensore metrico, che poi viene moltiplicato per le
sue derivate e cosı̀ via. Questa forte non linearità non era affatto presente
nell’equazione newtoniana.
Una terza differenza (importante dal punto di vista fisico) è che, laddove
l’equazione di campo newtoniana è un’equazione di tipo ellittico 17 , per cui
una piccola perturbazione si propaga istantaneamente con velocità infinita18 ,
le equazioni di Einstein sono di tipo iperbolico, quindi ammettono un pro-
blema di Cauchy ai valori iniziali che permette, di principio, di determinare
la geometria dello spaziotempo nota che sia la geometria su una superfi-
cie spaziale tridimensionale portante i dati iniziali.19 Inoltre le equazioni di
Einstein, essendo di tipo iperbolico, sono compatibili con un fenomeno di
propagazione ondosa a velocità finita.20 In altri termini, se per Newton l’u-
niverso è un sistema statico e immutabile, per Einstein è invece un sistema
in fieri soggetto a un’evoluzione.
16
Il che è una generalizzazione assolutamente non banale! Si pensi al cambiamento
drastico del punto di vista e della descrizione del campo gravitazionale.
17
Ricordiamo che una equazione differenziale alle derivate parziali del second’ordine
viene detta di tipo ellittico se la matrice Z dei coefficienti delle derivate parziali seconde è
definita positiva. I prototipi di equazioni ellittiche sono l’equazione di Laplace (4Φ = 0)
e la sua generalizzazione, l’equazione di Poisson (4Φ = 4πGρ). Se il determinante di
Z, invece, è negativo, l’equazione viene detta di tipo iperbolico. Il prototipo di equazione
2
di tipo iperbolico è l’equazione delle onde 4f − v12 ∂∂t2f , in cui la matrice Z è la matrice
identica a meno di un elemento, quello di valore − v12 , e dunque det Z < 0. Infine se
il determinante di Z è nullo, l’equazione viene detta di tipo parabolico. Il prototipo di
equazione parabolica è l’equazione del calore ∂T ∂t − k4T = 0, in cui il coefficiente del
∂2T
termine ∂t2 è nullo (tale termine non compare), e dunque la matrice Z è singolare.
18
Se a un dato istante spostiamo un poco una delle due masse, immediatamente cambia
tutto il campo.
19
Dati iniziali che dovranno essere la metrica, ma inevitabilmente anche le sue derivate,
visto che le equazioni di Einstein sono alle derivate seconde.
20
Si pensi, per analogia, all’equazione delle onde di D’Alembert, che è di tipo iperbolico.
11.3. EQUAZIONI IN PRESENZA DI MATERIA 283

11.3 Equazioni in presenza di materia


11.3.1 Intervento di massa ed energia
Veniamo ora alle equazioni in presenza di materia21 . Si tratta ora di divinare
la forma del termine noto, che deve essere legato alla distribuzione di massa
ed energia. Nel caso newtoniano, c’è una proporzionalità tra il laplaciano del
potenziale e la densità di massa:

4Φ = 4πGρ.

Ora abbiamo sostituito il laplaciano con un tensore doppio simmetrico


Ric(g), quindi anche ρ deve essere sostituito da un tensore doppio simmetrico.
La meccanica dei corpi celesti e dei fluidi22 e l’elettromagnetismo mostrano
che il bilancio energetico deve essere associato al bilancio della quantità di
moto e descritto da un complesso di quattro equazioni (tre per la quantità
di moto, una per l’energia) aventi la forma trovata con la (9.84)
~
dK
divT = ,
dV0
dove T è un tensore doppio simmetrico che abbiamo chiamato tensore energia-
~
dK
momento del sistema e dV 0
è la densità per unità di volume proprio della
4-forza che l’ambiente esterno esercita sul sistema considerato (v. sezione 9.7
per il caso dell’elettromagnetismo).
Per un sistema isolato (come è l’universo) deve dunque essere

divT = 0, (11.30)

equazione che in relatività generale si traduce nel vincolo

∇j T jk = 0, (11.31)

dove il simbolo ∇jk


l è il simbolo di derivazione covariante tensoriale
23
definito
come segue.
21
Ribadiamo che materia è sempre inteso nel senso relativistico di massa ed energia.
22
Meccanica che non abbiamo visto in questa sede né nella sua formulazione classica né
nella sua versione relativistica.
23
Si noti che, quando avevamo scritto esplicitamente divT , avevamo utilizzato le derivate
parziali ordinarie, cioè avevamo scritto che

divT = T,jjk

ove la virgola prima della j covariante è una notazione tensoriale diffusa che sta ad indicare
la cosiddetta “comma derivative” (letteralmente: “derivata con la virgola”). Il passaggio
284 LEZIONE 11. EQUAZIONI DI EINSTEIN

11.3.2 Derivata covariante di un tensore


Di un tensore doppio, infatti, possiamo anche definire la derivata covariante,
introducendo assiomi aggiuntivi (come ad esempio l’assioma che impone
alla derivata di commutare con l’operazione di contrazione degli indici) e
il risultato sarà ancora un tensore doppio

∇~v T,

le cui componenti sono date da


 lm 
lm j ∂T l sm m ls
(∇~v T ) = v + Γsj T + Γsj T , (11.32)
∂xj

dove la prima parte è la derivata direzionale usuale e i termini con i simboli


di Christoffel sono quelli legati alla curvatura dello spaziotempo.
Questo nuovo tensore è ancora una funzione lineare del vettore ~v : pos-
siamo indicare i coefficienti di questa combinazione, cioè i termini tra paren-
tesi della (11.32), con ∇k T lm , o più in generale, gli operatori che restituiscono
i termini in parentesi con ∇lm k . Si noti che i ∇k T
lm
non dipendono affatto
dal vettore ~v lungo cui si sta derivando, dipendono unicamente dalle derivate
parziali delle componenti del tensore. Ognuna dei ∇k T lm è la componente
(l, m) della derivata del tensore T rispetto a xk (definita come sopra).
Per tale ente si suole utilizzare, nei libri di relatività, anche la notazione
con il punto e virgola
T;klm ,
cioè
lm ∂T lm
∇k T ≡ T;klm = k
+ Γlsk T sm + Γm
sk T
ls
(11.33)
∂x
L’insieme dei ∇k T lm ≡ T;klm è un ente a tre indici (un tensore triplo) detto
differenziale covariante del tensore doppio T e indicato usualmente con la
notazione ∇T . Possiamo vederlo come un applicazione che prende in ingresso
dalla Relatività Ristretta alla Relatività Generale, abbiamo detto, va di pari passo con
la (naturale) sostituzione delle derivate covarianti alle derivate ordinarie, e quindi con la
sostituzione alla comma derivative della “semicolon derivative” (letteralmente: “derivata
con il punto e virgola”), e dunque d’ora in poi assumeremo che la divergenza sia calcolata
con le derivate covarianti, cioè che

divT = T;jjk .

Se dalla Relatività Speciale sapevamo che T,jjk = 0, ora stiamo generalizzando


ragionevolmente, assumendo che T;jjk = 0.
11.3. EQUAZIONI IN PRESENZA DI MATERIA 285

due elementi del duale e un vettore, e restituisce la derivata covariante del


tensore T lungo ~v ; in simboli:24

∇T (·, ·, ~v ) = ∇~v T (·, ·). (11.34)

11.3.3 Modifica delle equazioni nel vuoto


La prima idea potrebbe essere quella di sostituire alle equazioni di moto nel
vuoto
Rjk = 0
le equazioni nella materia
Rjk = kT jk . (11.35)
In questa estensione c’è però un difetto: infatti mentre il secondo membro
della (11.35) è a divergenza nulla (per quanto detto prima sull’universo come
sistema isolato), il primo membro verifica

∇j Rjk 6= 0.

Per vederlo partiamo dall’identità di Bianchi sulle componenti del tensore


di Riemann
Rijhk;r + Rijrh;k + Rijkr;h = 0. (11.36)
Innalzando la i con la metrica abbiamo
i i i
Rjhk;r + Rjrh;k + Rjkr;h = 0,

o anche, per l’antisimmetria del tensore di Riemann,


i i i
Rjhk;r − Rjhr;k + Rjkr;h = 0,

contraendo gli indici i e h (ricordando che la derivazione covariante tensoriale


commuta con l’operazione di contrazione degli indici) si ha
i
Rjk;r − Rjh;k + Rjkr;i = 0,

quindi innalzando l’indice j


j j ij
Rk;r − Rh;k + Rkr;i = 0,

o anche per l’antisimmetria del tensore di Riemann


j j ji
Rk;r − Rh;k − Rkr;i = 0,
24
Per una trattazione più accurata del calcolo tensoriale relativistico si confrontino i
capitoli 5 e 6 di [11].
286 LEZIONE 11. EQUAZIONI DI EINSTEIN

e contraendo ancora j e k, denotanco con Rkk = R la traccia del tensore di


Ricci in forma mista, detta curvatura scalare, si ha
j i
R;r − Rh;j − Rr;i = 0,

cioè
i
R;r − 2Rr;i = 0. (11.37)
Le identità (11.37) sono dette identità di Bianchi contratte, e mo-
strano che la divergenza del tensore di Ricci
1
∇i Rri = Rr;i
i
= R;r (11.38)
2
è una quantità in generale diversa da zero.
La situazione è simile a quella incontrata da Maxwell nell’elettroma-
gnetismo, passando da un regime stazionario al regime variabile del campo
magnetico. L’equazione di Ampère
~ = ~j
rot H

che descrive il campo magnetico quando ~j è stazionario (cioè ha divergenza


nulla), non è più valido nel caso variabile, in cui div~j 6= 0, essendo
∂ρ
div~j + =0
∂t
per l’equazione di continuità (conservazione della carica).25 Invece la diver-
genza del primo membro è identicamente nulla:
~ = 0.
div rot H

Per risolvere il problema, Maxwell ha introdotto la coorente di sposta-


mento, modificando l’equazione di Ampère in
y
~ − ∂ D = ~j.
rot H
∂t
In questo modo l’equazione diventa compatibile con la legge di conservazione
della carica.
Perché abbiamo sottolineato questo fatto? Perché l’idea è, per analogia, di
modificare le equazioni di Einstein nel vuoto in modo da renderle compatibili
25
Non è la divergenza di ~j a essere nulla, è la divergenza della corrente vista come
4-vettore spaziotemporale ad esserlo, o come abbiamo visto nel nostro formalismo, è il
differenziale della 3-forma J delle sorgenti ad annullarsi.
11.3. EQUAZIONI IN PRESENZA DI MATERIA 287

con la legge di conservazione dell’energia e della quantità di moto tradotta


da
divT = 0,
cioè, in componenti,
∇j T jk = 0.
Dato che, per quanto detto prima, T deve apparire nella formula, ci si
deve chiedere, quindi, quale sia un tensore doppio simmetrico, costruito con
la metrica e le sue derivate, che sia anche a divergenza nulla.

11.3.4 Il tensore di Einstein


Un esempio semplice potrebbe la metrica stessa: gli elementi g jk del tensore
metrico verificano infatti
∇l g jk = 0, (11.39)
relazione che esprime la metricità della connessione ed implica l’annullarsi
della divergenza del tensore metrico. Questo tensore chiaramente non fa al
caso nostro, poiché in esso non compaiono le derivate della metrica. Inoltre
la metrica non si annulla affatto su una varietà piatta, fatto che per noi
è indispensabile, poiché vogliamo che, in assenza di materia, le equazioni
ritornino ad essere omogenee del tipo

Rjk = 0.

Riunendo tutte le idee, vorremmo cercare un tensore:

(i) che si annulli quando la connessione è piatta26 ;

(ii) che sia costruito solo a partire dal tensore metrico e dalle sue derivate
(dovrà comparire da qualche parte il tensore di curvatura di Riemann);

(iii) che sia lineare nel tensore di curvatura di Riemann;

(iv) che sia a divergenza nulla (deve essere eguagliato infatti a un multiplo
tensore energia-momento T ).

La condizione (i) nasce da esigenze di compatibilità con la Relatività Ri-


stretta, la condizione (iv) è un vincolo prettamente matematico, la condizione
26
Incidentalmente, questo implica che, tra le soluzioni dell’equazione nel vuoto, ci sia
anche lo spaziotempo di Minkowski.
288 LEZIONE 11. EQUAZIONI DI EINSTEIN

(ii) è quella che ci garantisce l’intrinsecità del tensore27 , la condizione (iii)


nasce invece da un’esigenza di semplicità.
Le identità di Bianchi contratte (11.37) ci suggeriscono però un secondo
esempio. Infatti, notiamo che esse possono essere riscritte nella forma
 
i 1 i 1 i
Rr;i − R;r = Rr − δr R = 0, (11.40)
2 2 ;i

da cui, innalzando l’indice r con la metrica,


 
ik 1 ik
R − g R = 0. (11.41)
2 ;i

L’equazione (11.41) ci dice esattamente che il tensore


1
Gik = Rik − Rg ik (11.42)
2
ha divergenza nulla. Tale tensore28 è noto con il nome di tensore di Ein-
stein.
È chiaro quindi che tale tensore soddisfa a tutte le proprietà richieste
(i), (ii), (iii) e (iv); si può dimostrare che è l’unico tensore che soddisfa
contemporaneamente a tali proprietà.
Con questo tensore, le equazioni di Einstein nella materia dovranno essere
scritte nella forma
Gjk = kT jk ,
cioè
1
Rjk − Rg jk = kT jk . (11.43)
2
Le equazioni di campo einsteiniane devono ridursi alle leggi di gravità
newtoniane nel limite classico di un campo debole e velocità basse. Mediante
questa analogia si calcola che la costante k vale 8πG
c4
, da cui le equazioni di
Einstein per il campo gravitazionale diventano
1 8πG
Rjk − Rg jk = 4 T jk . (11.44)
2 c
27
Lo spaziotempo non è un’entità immersa in un qualche spazio euclideo: per questo
tutta la teoria deve essere intrinseca, e per questo il Teorema Egregium di Gauss (che
stabilisce che la curvatura gaussiana K è una grandezza intrinseca, poiché si calcola solo
mediante la metrica, ovvero la prima forma) è cosı̀ importante per la fisica della Relatività
Generale.
28
Ricordiamo che R = Rii è la traccia del tensore di Ricci, cioè la cosiddetta curvatura
scalare.
11.3. EQUAZIONI IN PRESENZA DI MATERIA 289

11.3.5 Compatibilità con il caso del vuoto


Si potrebbe obiettare che avendo sostituito le equazioni di Einstein all’an-
nullarsi del tensore di Ricci, bisogni anche modificare le equazioni nel vuoto,
rovinando cosı̀ l’analogia mostrata nello schema in figura 11.6. Non è que-
sto il caso, poiché le nuove equazioni nel caso del vuoto (in cui T jk = 0
identicamente) sono
1
Rjk − Rg jk = 0, (11.45)
2
equazioni del tutto equivalenti alle equazioni di Ricci

Ric(g) = 0.

Se è infatti vero che Ric(g) = 0, cioè che Rjk = 0, allora R = Rjj = 0, e


le equazioni (11.45) sono verificate, poiché si riducono a Rjk = 0 (fatto che
stiamo supponendo vero per ipotesi).
Supponiamo invece che le equazioni (11.45) siano verificate. Mettendo le
(11.45) in forma mista, abbassando un indice con la metrica e notando che29
gkj = δkj , troviamo
1
Rkj − Rgkj = 0
2
1
Rkj − Rδkj = 0
2
e prendendo la traccia da ambo i membri si ha che
1
Rjj − Rδjj = 0
2
1
R− R·4=0
2
R − 2R = 0
e dunque in definitiva
R = 0,
e inserendo tale informazione ancora nelle (11.45) riotteniamo le equazioni
di Ricci Rjk = 0, cioè
Ric(g) = 0.
In altre parole, abbiamo verificato la compatibilità delle equazioni di
Einstein con la richiesta (i) di pag. 287.
29
Infatti per portare il tensore metrico in forma mista sostanzialmente lo moltiplichiamo
per il suo inverso, ottenendo l’identità.
290 LEZIONE 11. EQUAZIONI DI EINSTEIN

11.3.6 L’intervento della costante cosmologica


Le prime semplici soluzioni cosmologiche (trovate da Friedmann) delle equa-
zioni di Einstein (11.44) avevano un andamento dinamico, rappresentavano
cioè un universo in via d’espansione; contrastando ciò con la credenza dell’e-
poca (di retaggio newtoniano) di un universo statico e immutabile, Einstein
modificò le equazioni aggiungendo un altro termine a divergenza nulla χg jk ,
dove χ è una costante, detta costante cosmologica, da calibrare opportu-
namente per avere soluzioni cosmologiche statiche. Le equazioni di Einstein
diventano, con questa correzione,
1 8πG
Rjk − Rg jk − χg jk = 4 T jk , (11.46)
2 c
che sono più generali delle (11.44), poiché queste ultime vengono riottenute
per χ = 0.
Tuttavia questa nuova forma (11.46) non rispetta l’esigenza precedente-
mente espressa dalla proprietà (i) di pag. 287: in sostanza, per R = 0 non
riotteniamo le equazioni trovate in assenza di materia. O, in altri termini,
nell’equazione (11.46), il tensore al primo membro non si annulla quando la
connessione è piatta (poiché banalmente non si annulla il tensore metrico).
Tredici anni dopo la scrittura di tale equazione da parte di Einstein, la
scoperta fatta da Hubble del red-shift dello spettro luminoso delle galassie
veniva interpretata come una prova dell’espansione dell’universo, e quindi
come una sorta di conferma sperimentale dell’equazione (11.44) piuttosto che
della sua correzione con il termine cosmologico, che quindi fu abbandonato30 .
Attualmente, dalle osservazioni, si deduce che la costante cosmologica, se non
è nulla, è comunque molto piccola, e dunque vengono usualmente prese come
equazioni di campo le (11.44).31

30
Einstein descriverà infatti la costante cosmologica come il più grande errore della sua
vita.
31
Le (11.46) sono state in tempi recenti riutilizzate per tener conto del contributo alla
gravità dato dall’energia quantistica del vuoto; in questo caso tuttavia il termine χg jk
viene però interpretato come un contributo al tensore energia-momento T piuttosto che
un termine cosmologico alla maniera einsteiniana.
Lezione 12

Soluzione di Schwarzschild

La soluzione di Schwarzschild (datata 1916) è la prima soluzione esatta1 delle


equazioni di Einstein nel caso del vuoto, che, come sappiamo, possono essere
scritte in forma equivalente come

Rjk = 0, Rkj = 0, Rjk = 0

abbassando o innalzando gli indici con il tensore metrico.

12.1 Soluzione delle equazioni


Si ammette innanzitutto che tali equazioni rappresentino il campo gravita-
zionale esterno ad un pianeta sferico, non ruotante e di carica nulla.2
Si ammette, cioè, che un satellite (o una cometa) si muova attorno al
pianeta in modo tale che la sua linea di universo sia una geodetica del ge-
nere tempo della metrica soluzione, mentre analogamente un raggio luminoso
percorrerà una geodetica del genere luce3 .
L’incognita delle equazioni di Einstein nel vuoto è naturalmente la me-
trica 4 , cioè 10 funzioni in 4 variabili: in questa situazione, chiaramente, il
problema è proibitivo. L’idea è dunque quella di cercare la soluzione in una
1
In merito, Karl Schwarzschild dirà, dopo aver trovato la soluzione, che “è sempre
piacevole valersi di soluzioni esatte in forma semplice”. (“Es ist immer angenehm, über
strenge Lösungen einfacher Form zu verfügen.”)
2
In particolare le soluzioni descriveranno solo il campo all’esterno del pianeta, dal
momento che le equazioni da risolvere sono le equazioni di Einstein nel vuoto.
3
Quest’ultima condizione, in particolare, forzerà un incurvamento dei segnali luminosi,
al pari dell’incurvamento delle orbite dei pianeti.
4
Sostanzialmente tali equazioni legano la materia alla geometria dello spazio: risolverle
significa capire in che modo la materia influenzi tale geometria, la quale è completamente
fissata a partire dal tensore metrico.

291
292 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Figura 12.1: Coordinate sferiche nello spazio euclideo.

classe particolare, che si congettura rappresenti bene le proprietà di simmetria


del sistema fisico. Per individuare tale classe, conviene passare a coordinate
sferiche.

12.1.1 Metrica di Minkowski in coordinate sferiche


Partiamo dalla situazione di assenza di gravità (o di gravità trascurabile),
situazione che si realizza a grande distanza dal pianeta. Qui, dunque, la
metrica deve essere quella di Minkowski:
ds2 = −c2 dt2 + dx2 + dy 2 + dz 2 . (12.1)
Poiché le piattaforme spaziali sono spazi semieuclidei, ha senso introdurre
ivi delle coordinate sferiche, ponendo

 x = r sin θ cos ϕ
y = r sin θ sin ϕ (12.2)
z = r cos θ

con le quali la metrica minkowskiana assume la forma di5


ds2 = −c2 dt2 + dr2 + r2 (dθ2 + sin2 θdϕ2 ). (12.3)
5
Naturalmente questa nuova forma della metrica è sempre una metrica piatta, poiché
è sempre la metrica di Minkowski, solamente abbiamo cambiato coordinate. È immediato
12.1. SOLUZIONE DELLE EQUAZIONI 293

12.1.2 Introduzione del pianeta


La presenza del pianeta perturba la metrica di Minkowski (il campo gravita-
zionale non sarà più nullo, la metrica non sarà più piatta). Tuttavia, per le
ipotesi di sfericità e di staticità6 , possiamo ragionevolmente ammettere che
la metrica deformata preservi la simmetria sferica della metrica di Minkowski
nelle coordinate θ e ϕ.
Congetturiamo quindi che la soluzione (cioè la metrica) sia all’interno
della classe delle più semplici perturbazioni di questo tipo7 , cioè sia del tipo
ds2 = −A(r)dt2 + B(r)dr2 + r2 (dθ2 + sin2 θdϕ2 ), (12.4)
che rappresenta una ragionevole perturbazione sferica della metrica Minko-
skiana in coordinate sferiche (12.3).8
Si presti bene attenzione a un fatto fondamentale: poiché la geometria
dello spaziotempo fisico M non è più la geometria dello spaziotempo di Min-
kowski, non bisogna necessariamente pensare che i simboli (t, r, θ, ϕ) delle
coordinate abbiano ancora il significato di coordinate sferiche, associate cioè
a un ben preciso processo di misura della geometria euclidea. Esse sono a
tutti gli effetti coordinate sullo spaziotempo M , ma, benché continuiamo
a usare gli stessi simboli, non possiamo più dire che r sia il raggio, θ e ϕ
gli angoli e neppure che t sia il tempo. Vedremo meglio questa particolare
situazione alla sezione 12.3.2.
Possiamo inoltre formulare l’ipotesi aggiuntiva
lim A(r) = c2


 r→+∞
(12.5)
 lim B(r) = 1

r→+∞

corrispondente all’intuizione fisica che, a grande distanza dal pianeta, la gra-


vità sia trascurabile, cosicché lo spaziotempo deve diventare minkowskiano
e dunque la metrica deve tendere a µij per r → +∞ (metriche di questo
tipo saranno dette “asintoticamente piatte”). Possiamo perciò ben dire che
le coordinate (t, r, θ, ϕ) hanno il significato di coordinate sferiche non sul-
l’intero spaziotempo M , ma solo per un osservatore a grande distanza dal
pianeta (o per un osservatore all’infinito).
vedere che la nuova metrica ha questa forma, poiché la parte temporale non viene toccata
dalla trasformazione (12.2) e per la parte spaziale si ha un normale passaggio a coordinate
sferiche.
6
Infatti abbiamo supposto che il pianeta non ruoti.
7
In un certo senso seguiamo un criterio fisico di semplicità: si tenga presente che tutte
queste affermazioni sono congetture fisiche, e non necessità matematiche.
8
Infatti la perturbazione dipende solo dal raggio, e non dalle componenti angolari o
temporale. Le componenti angolari, inoltre, proprio non vengono perturbate.
294 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Limitandoci alle metriche della forma (12.4), abbiamo ridotto le incognite


da 10 funzioni in 4 variabili a 2 funzioni in 2 variabili, con una notevole
semplificazione del problema che, in questa veste, può essere risolto.

12.1.3 I simboli di Christoffel con la lagrangiana


Il primo passo è calcolare, a partire da (12.4) i simboli di Christoffel. Il modo
più rapido per farlo è notare che essi sono i coefficienti che compaiono nelle
equazioni delle geodetiche
ẍj + Γjhk ẋj ẋk = 0, (12.6)
dove il punto indica la derivata rispetto al tempo proprio τ .

Equazioni di Lagrange e geodetiche


Naturalmente possiamo interpretare le equazioni delle geodetiche come tra-
iettorie di particelle che si muovono in assenza di forze.
Definendo formalmente la lagrangiana L come
1 1
L(u, u̇) = v 2 = gjk ẋj ẋk (12.7)
2 2
possiamo scrivere le equazioni di Lagrange per la coordinata xk :
d ∂L ∂L
k
− k = 0. (12.8)
dt ∂ ẋ ∂x
Si ha che
∂L ∂L 1 ∂glj l j
k
= gjk ẋj , k
= ẋ ẋ
∂ ẋ ∂x 2 ∂xk
e inoltre
d ∂L dgjk j ∂gjk l j 1 ∂gjk l j 1 ∂glk j l
k
= gjk ẍj + ẋ = gjk ẍj + l
ẋ ẋ = gjk ẍj + ẋ ẋ + ẋ ẋ ,
dt ∂ ẋ dt ∂x 2 ∂xl 2 ∂xj
dove l’ultima uguaglianza vale per la scissione della sommatoria e lo scambio
di indici tra l e j.
Le equazioni di Lagrange dunque diventano:
 
j 1 ∂gjk ∂glk ∂glj
gjk ẍ + + + k ẋl ẋj = 0.
2 ∂xl ∂xj ∂x
Moltiplicando ambo i membri per g hk , possiamo ricondurre tali equazioni
in forma normale9 :
1  ∂gjk ∂glk ∂glj  l j
g hk gjk ẍj + g hk + + k ẋ ẋ = 0
2 ∂xl ∂xj ∂x
9
Ovvero facendo in modo che il coefficiente della derivata di grado massimo sia 1.
12.1. SOLUZIONE DELLE EQUAZIONI 295

cioè, dato che g hk gkj = δjh è il prodotto righe per colonne del tensore metrico
con il suo inverso, ovvero l’identità, abbiamo che
 
h j 1 hk ∂gjk ∂glk ∂glj
δj ẍ + g + + k ẋl ẋj = 0
2 ∂xl ∂xj ∂x

cioè, per la definizione dei simboli di Christoffel,

ẍh + Γhjl ẋl ẋj = 0 (12.9)

Queste sono dunque le equazioni di Lagrange in forma normale; basta un


rapido confronto con le equazioni (12.6) per notare che esse sono le equazioni
delle geodetiche.10
Tali equazioni ci forniscono un modo veloce per ricavare i simboli di Chri-
stoffel. Basta infatti calcolare L = 12 v 2 nelle coordinate assegnate, scrivere le
equazioni di Lagrange del sistema e risolverle rispetto alle derivate seconde
(ossia, metterle in forma normale): i coefficienti dei termini quadratici nella
velocità risultano essere proprio i simboli di Christoffel, prestando attenzione
ai termini misti, il cui simbolo di Christoffel è logicamente la metà del coeffi-
ciente, dato che i simboli di Christoffel sono simmetrici rispetto allo scambio
dei due indici covarianti.

Risoluzione delle equazioni


Utilizzando il formalismo di Lagrange, la lagrangiana nelle coordinate (12.4)
ha la forma
1 ds2
 
1 2 1 ds 1 2 2 2 2 2 2

L= V = = = −A(r) ṫ + B(r)ṙ + r (θ̇ + sin θ ϕ̇ ) .
2 2 dτ 2 dτ 2 2
(12.10)
Scriviamo per ogni coordinata le equazioni di Lagrange:

d ∂L dL
− =0
dτ ∂ ṫ dt
d ∂L dL
− =0
dτ ∂ ṙ dr
(12.11)
d ∂L dL
− =0
dτ ∂ θ̇ dθ
d ∂L dL
− =0
dτ ∂ ϕ̇ dϕ
10
Non dovremmo stupircene, pensando al significato fisico della lagrangiana e delle
equazioni di Lagrange.
296 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

1
ovvero (i fattori 2
si semplificano ovunque)

d
(−2A(r)ṫ) − 0 = 0

d
(2B(r)ṙ) + A0 (r)ṫ2 − B 0 (r)ṙ2 − 2r(θ̇2 + sin2 θϕ̇2 ) = 0
dτ (12.12)
d
(2r2 θ̇) − 2r2 sin θ cos θϕ̇2 = 0

d
(2r2 sin2 θϕ̇) = 0

con A0 (r) e B 0 (r) derivate rispetto alla coordinata r, da cui, sottointendendo
per pulizia di scrittura la dipendenza A = A(r) e B = B(r),

−2A0 ṙṫ − 2Aẗ = 0

2B 0 ṙ2 + 2Br̈ + A0 ṫ2 − B 0 ṙ2 − 2rθ̇2 − 2r sin2 θϕ̇2 = 0


(12.13)
4rṙθ̇ + 2r2 θ̈ − 2r2 sin θ cos θϕ̇2 = 0

4rṙ sin2 θϕ̇ + 4r2 sin θ cos θθ̇ϕ̇ + 2r2 sin2 θϕ̈ = 0

equazioni che possiamo mettere nella forma normale

A0
ẗ + ṙṫ
A
B0 2 A0 2 r 2 r sin2 θ 2
r̈ + ṙ + ṫ − θ̇ − ϕ̇ = 0
2B 2B B B (12.14)
2
θ̈ + ṙθ̇ − sin θ cos θϕ̇2 = 0
r
2
ϕ̈ + ṙϕ̇ + 2 cot θθ̇ϕ̇
r

Pensando alla solita naturale associazione t = x0 , r = x1 , θ = x2 , ϕ = x3 ,


per confronto con l’equazione delle geodetiche (12.6) si ricavano i simboli di
Christoffel per la metrica (12.4). Le equazioni lagrangiane delle geodetiche,
infatti, coordinata per coordinata, si scrivono come11 :

ẗ + Γttt ṫ2 + 2Γttr ṫṙ + 2Γttθ ṫθ̇ + 2Γttϕ ṫϕ̇ + Γtrr ṙ2 +
+ 2Γtrθ ṙθ̇ + 2Γtrϕ ṙϕ̇ + Γtθθ θ̇2 + 2Γtθϕ θ̇ϕ̇ + Γtϕϕ ϕ̇2 = 0,
11
Si ricordi che i fattori 2 sono retaggio della simmetria dei simboli di Christoffel rispetto
agli indici covarianti.
12.1. SOLUZIONE DELLE EQUAZIONI 297

r̈ + Γrtt ṫ2 + 2Γrtr ṫṙ + 2Γrtθ ṫθ̇ + 2Γrtϕ ṫϕ̇ + Γrrr ṙ2 +
+ 2Γrrθ ṙθ̇ + 2Γrrϕ ṙϕ̇ + Γrθθ θ̇2 + 2Γrθϕ θ̇ϕ̇ + Γrϕϕ ϕ̇2 = 0,

θ̈ + Γθtt ṫ2 + 2Γθtr ṫṙ + 2Γθtθ ṫθ̇ + 2Γθtϕ ṫϕ̇ + Γθrr ṙ2 +
+ 2Γθrθ ṙθ̇ + 2Γθrϕ ṙϕ̇ + Γθθθ θ̇2 + 2Γθθϕ θ̇ϕ̇ + Γθϕϕ ϕ̇2 = 0,

ϕ̈ + Γϕtt ṫ2 + 2Γϕtr ṫṙ + 2Γϕtθ ṫθ̇ + 2Γϕtϕ ṫϕ̇ + Γϕrr ṙ2 +
+ 2Γϕrθ ṙθ̇ + 2Γϕrϕ ṙϕ̇ + Γϕθθ θ̇2 + 2Γϕθϕ θ̇ϕ̇ + Γϕϕϕ ϕ̇2 = 0,

e confrontando con la (12.14) otteniamo immediatamente che gli unici simboli


di Christoffel non nulli sono:
A0

t
Γ =
 rt 2A ,

0
 Γr = B ,

r A0 r r r r sin2 θ
 rr Γ tt = , Γ θθ = − , Γ ϕϕ = − ,
 2B 2B B B
 Γθ = 1 ,

 rθ Γθϕϕ = − sin θ cos θ,
 r
 1
Γϕrϕ = , Γϕθϕ = cot θ.
r
(12.15)

12.1.4 Tensore di Riemann e tensore di Ricci


Ottenuti i simboli di Christoffel, non ci resta che calcolare con pazienza,
tabella dei Γijk alla mano, le componenti del tensore di Riemann, che sono
per definizione

l
∂Γlmj ∂Γlmk
Rmjk = − + Γsmj Γlsk − Γsmk Γlsj (12.16)
∂xk ∂xj
che e poi serviranno per calcolare il tensore di Ricci
l t r θ ϕ
Rmk = Rmlk = Rmtk + Rmrk + Rmθk + Rmϕk . (12.17)

Calcolo delle componenti


Visto che il nostro obiettivo è il tensore di Ricci, conviene scrivere una per
una le sue componenti Rmk esplicitando la contrazione, e quindi calcolare le
298 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

l
componenti Rmjk necessarie. Il tensore di Ricci, essendo simmetrico nei due
indici, ha solo dieci componenti indipendenti:

Rtt , Rtr , Rtθ , Rtϕ , Rrr , Rrθ , Rrϕ , Rθθ , Rθϕ , Rϕϕ .

Iniziamo con la prima componente:


t r θ ϕ
Rtt = Rttt + Rtrt + Rtθt + Rtϕt .
t
Il termine Rttt è sicuramente nullo per antisimmetria: il tensore di Riemann
in forma una volta controvariante e tre volte covariante è infatti chiaramente
antisimmetrico rispetto allo scambio degli ultimi due indici covarianti - lo si
nota direttamente dalla (12.16). Quanto agli altri termini:

r ∂Γttr ∂Γttt 2A00 B − 2A0 B 0 A02 A0 B 0


Rtrt = − + Γstr Γrst − Γstt Γrsr = 0 − + − ,
∂t ∂r 4B 2 4AB 4B 2
poiché nelle due sommatorie su s gli unici termini che sono non nulli sono
Γttr Γrtt per la prima e Γrtt Γrrr per la seconda.

θ ∂Γθtθ ∂Γθtt s θ s θ A0
Rtθt = − + Γtθ Γst − Γtt Γsθ = 0 − 0 + 0 − ,
∂t ∂θ 2Br
poiché nella prima sommatoria su s non si salva alcun termine, mentre nella
seconda si salva solo Γrtt Γθrθ .

ϕ ∂Γϕtϕ ∂Γϕtt A0
Rtϕt = − + Γstϕ Γϕst − Γstt Γϕsϕ = 0 − 0 + 0 − ,
∂t ∂ϕ 2Br
poiché ancora una volta nella prima sommatoria su s non si salva alcun
termine, mentre nella seconda si salva solo Γrtt Γϕrϕ . Dunque

t r θ ϕ A00 A0 B 0 A02 A0
Rtt = Rttt + Rtrt + Rtθt + Rtϕt =− + + − ,
2B 4B 4AB B
e abbiamo trovato la prima delle dieci componenti indipendenti del tensore
di Ricci.
Procediamo analogamente per le altre:
t r θ ϕ
Rtr = Rttr + Rtrr + Rtθr + Rtϕr .
r
Il termine Rtrr è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γttt ∂Γttr
Rttr = − + Γstt Γtsr − Γstr Γtst = 0 − 0 + 0 − 0 = 0,
∂r ∂t
12.1. SOLUZIONE DELLE EQUAZIONI 299

dove la seconda derivata è nulla non perché Γttr sia nullo, ma perché non
dipende da t (A e B dipendono solo da r, e cosı̀ le loro derivate). E anche

θ ∂Γθtθ ∂Γθtr
Rtθr = − + Γstθ Γθsr − Γstr Γθsθ = 0 − 0 + 0 − 0 = 0,
∂r ∂θ

ϕ ∂Γϕtϕ ∂Γϕtr
Rtϕr = − + Γstϕ Γϕsr − Γstr Γϕsϕ = 0 − 0 + 0 − 0 = 0,
∂r ∂ϕ
da cui
t r θ ϕ
Rtr = Rttr + Rtrr + Rtθr + Rtϕr = 0.
Andiamo avanti con la terza componente:
t r θ ϕ
Rtθ = Rttθ + Rtrθ + Rtθθ + Rtϕθ .
θ
Il termine Rtθθ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γttt ∂Γttθ
Rttθ = − + Γstt Γtsθ − Γstθ Γtst = 0 − 0 + 0 − 0 = 0,
∂θ ∂t

r ∂Γrtr ∂Γrtθ
Rtrθ = − + Γstr Γrsθ − Γstθ Γrsr = 0 − 0 + 0 − 0 = 0,
∂θ ∂r
ϕ ∂Γϕtϕ ∂Γϕtθ
Rtϕθ = − + Γstϕ Γϕsθ − Γstθ Γϕsϕ = 0 − 0 + 0 − 0 = 0,
∂θ ∂ϕ
da cui
t r θ ϕ
Rtθ = Rttθ + Rtrθ + Rtθθ + Rtϕθ = 0.
La quarta componente:
t r θ ϕ
Rtϕ = Rttϕ + Rtrϕ + Rtθϕ + Rtϕϕ .
ϕ
Il termine Rtϕϕ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γttt ∂Γttϕ
Rttϕ = − + Γstt Γtsϕ − Γstϕ Γtst = 0 − 0 + 0 − 0 = 0,
∂ϕ ∂t

r ∂Γrtr ∂Γrtϕ
Rtrϕ = − + Γstr Γrsϕ − Γstϕ Γrsr = 0 − 0 + 0 − 0 = 0,
∂ϕ ∂r

θ ∂Γθtθ ∂Γθtϕ
Rtθϕ = − + Γstθ Γθsϕ − Γstϕ Γθsθ = 0 − 0 + 0 − 0 = 0,
∂ϕ ∂θ
da cui
t r θ ϕ
Rtϕ = Rttϕ + Rtrϕ + Rtθϕ + Rtϕϕ = 0.
300 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

La quinta componente:
t r θ ϕ
Rrr = Rrtr + Rrrr + Rrθr + Rrϕr .
r
Il termine Rrrr è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γtrt ∂Γtrr 2A00 A − 2A02 A02 A0 B 0


Rrtr = − + Γsrt Γtsr − Γsrr Γtst = − 0 + − ,
∂r ∂t 4A2 4A2 4AB

θ ∂Γθrθ ∂Γθrr 1 1 B0
Rrθr = − + Γsrθ Γθsr − Γsrr Γθsθ = − 2 + 0 + 2 − ,
∂r ∂θ r r 2rB
ϕ
∂Γϕrϕ ∂Γϕrr 1 1 B0
Rrϕr = − + Γsrϕ Γϕsr − Γsrr Γϕsϕ = − 2 + 0 + 2 − ,
∂r ∂ϕ r r 2rB
da cui

t r θ ϕ A00 A0 B 0 A02 B0
Rrr = Rrtr + Rrrr + Rrθr + Rrϕr = − − − .
2A 4AB 4A2 rB
La sesta componente:
t r θ ϕ
Rrθ = Rrtθ + Rrrθ + Rrθθ + Rrϕθ .
θ
Il termine Rrθθ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γtrt ∂Γtrθ
Rrtθ = − + Γsrt Γtsθ − Γsrθ Γtst = 0 − 0 + 0 − 0 = 0,
∂θ ∂t
r ∂Γrrr ∂Γrrθ
Rrrθ = − + Γsrr Γrsθ − Γsrθ Γrsr = 0 − 0 + 0 − 0 = 0,
∂θ ∂r
ϕ ∂Γϕrϕ ∂Γϕrθ cot θ cot θ
Rrϕθ = − + Γsrϕ Γϕsθ − Γsrθ Γϕsϕ = 0 − 0 + − = 0,
∂θ ∂ϕ r r
da cui
t r θ ϕ
Rrθ = Rrtθ + Rrrθ + Rrθθ + Rrϕθ = 0.
La settima componente:
t r θ ϕ
Rrϕ = Rrtϕ + Rrrϕ + Rrθϕ + Rrϕϕ .
ϕ
Il termine Rrϕϕ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γtrt ∂Γtrϕ
Rrtϕ = − + Γsrt Γtsϕ − Γsrϕ Γtst = 0 − 0 + 0 − 0 = 0,
∂ϕ ∂t

r ∂Γrrr ∂Γrrϕ
Rrrϕ = − + Γsrr Γrsϕ − Γsrϕ Γrsr = 0 − 0 + 0 − 0 = 0,
∂ϕ ∂r
12.1. SOLUZIONE DELLE EQUAZIONI 301

θ ∂Γθrθ ∂Γθrϕ
Rrθϕ = − + Γsrθ Γθsϕ − Γsrϕ Γθsθ = 0 − 0 + 0 − 0,
∂ϕ ∂θ
da cui
t r θ ϕ
Rrϕ = Rrtϕ + Rrrϕ + Rrθϕ + Rrϕϕ = 0.
L’ottava componente:
t r θ ϕ
Rθθ = Rθtθ + Rθrθ + Rθθθ + Rθϕθ .
θ
Il termine Rθθθ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γtθt ∂Γtθθ A0 r
Rθtθ = − + Γsθt Γtsθ − Γsθθ Γtst = 0 − 0 + 0 +
∂θ ∂t 2AB
r ∂Γrθr ∂Γrθθ B − B0r 1 B0r B0r
Rθrθ = − + Γsθr Γrsθ − Γsθθ Γrsr = 0 + − + = −
∂θ ∂r B2 B 2B 2 2B 2
poiché
∂Γrθθ d  r d r B − rB 0 1 B0r
= − =− =− = − + ,
∂r dr B dr B B2 B B2
e infine
∂Γϕθϕ ∂Γϕθθ
 
ϕ 1 1 1
Rθϕθ = − + Γsθϕ Γϕsθ − Γsθθ Γϕsϕ = − 2 − 0 + 2 −1 +
∂θ ∂ϕ sin θ sin θ B
in quanto
dΓϕθϕ d cot θ d cos θ − cos2 θ − sin2 θ 1
= = = 2 =− 2
dθ dθ dθ sin θ sin θ sin θ
e
cos2 θ cos2 θ + sin2 θ − sin2 θ 1
Γsθϕ Γϕsθ = Γϕθϕ Γϕ ϕθ = cot2 θ = 2 = 2 = − 1,
sin θ sin θ sin2 θ
e dunque

t r θ ϕ A0 r B0r 1
Rθθ = Rθtθ + Rθrθ + Rθθθ + Rθϕθ = − 2
+ − 1.
2AB 2B B
La nona componente:
t r θ ϕ
Rθϕ = Rθtϕ + Rθrϕ + Rθθϕ + Rθϕϕ .
ϕ
Il termine Rθϕϕ è nullo per antisimmetria. Quanto agli altri termini:

t ∂Γtθt ∂Γtθϕ
Rθtϕ = − + Γsθt Γtsϕ − Γsθϕ Γtst = 0 − 0 + 0 − 0,
∂ϕ ∂t
302 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

r ∂Γrθr ∂Γrθϕ
Rθrϕ = − + Γsθr Γrsϕ − Γsθϕ Γrsr = 0 − 0 + 0 − 0,
∂ϕ ∂r

θ ∂Γθθθ ∂Γθθϕ
Rθθϕ = − + Γsθθ Γθsϕ − Γsθϕ Γθsθ = 0 − 0 + 0 − 0,
∂ϕ ∂θ
da cui
t r θ ϕ
Rθϕ = Rθtϕ + Rθrϕ + Rθθϕ + Rθϕϕ = 0.

L’ultima componente:
t r θ ϕ
Rϕϕ = Rϕtϕ + Rϕrϕ + Rϕθϕ + Rϕϕϕ .

ϕ
Il termine Rϕϕϕ è nullo per antisimmetria. Quanto agli altri termini:

t
∂Γtϕt ∂Γtϕϕ s t s t A0 r sin2 θ
Rϕtϕ = − + Γϕt Γsϕ − Γϕϕ Γst = 0 − 0 + 0 + ,
∂ϕ ∂t 2AB

r
∂Γrϕr ∂Γrϕϕ sin2 θ sin2 θ B 0 r sin2 θ
Rϕrϕ = − + Γsϕr Γrsϕ − Γsϕϕ Γrsr = 0 + − + ,
∂ϕ ∂r B B 2B 2

θ
∂Γθϕθ ∂Γθϕϕ s θ s θ 2 2 2 sin2 θ
Rϕθϕ = − +Γϕθ Γsϕ −Γϕϕ Γsθ = 0−(sin θ −cos θ)−cos θ + ,
∂ϕ ∂θ B
da cui

t r θ ϕ A0 r sin2 θ B 0 r sin2 θ sin2 θ


Rϕϕ = Rϕtϕ + Rϕrϕ + Rϕθϕ + Rϕϕϕ = + + − sin2 θ.
2AB 2B 2 B

Notiamo che il tensore di Ricci Rmk è puramente diagonale, cioè gli unici
elementi non nulli sono quelli del tipo Rii .

12.1.5 Tensore di Ricci in forma mista


Infine si può passare alla forma mista del tensore di Ricci innalzando un
indice con la metrica12
Rkm = g ms Rsk , (12.18)
forma che permetterà di notare meglio alcune relazioni tra le componenti del
tensore.
12
Indifferentemente si poteva innalzare prima un indice di Riemann, passando al tensore
di Riemann due volte covariante e due volte controvariante.
12.1. SOLUZIONE DELLE EQUAZIONI 303

Visto che il tensore di Ricci Rmk è già in forma diagonale, e visto che la
metrica è in forma diagonale, è immediato che anche Rkm sarà non nullo solo
per m = k. In particolare, dato che il tensore metrico è
 
−A 0 0 0
 0 B 0 0 
gjk = 
 0 0 r2
,
0 
0 0 0 r2 sin2 θ
la sua inversa è (tensore metrico in forma controvariante)
 1 
−A 0 0 0
1
 0 0 0 
g jk = 
 0
B
1

0 r2 0 
1
0 0 0 r2 sin 2θ

e gli unici valori non nulli di Rkm sono:


1 A00 A0 B 0 A02 A0
Rtt = g ts Rst = g tt Rtt = − Rtt = − − + ,
A 2AB 4AB 2 4A2 B rAB
1 A00 A0 B 0 A02 B0
Rrr = g rs Rsr = g rr Rrr = Rrr = − − − ,
B 2AB 4AB 2 4A2 B rB 2
1 A0 B0 B−1
Rθθ = g θs Rsθ = g θθ Rθθ = − 2 Rθθ = − 2
− 2 ,
r 2rAB 2rB r B
0 0
1 A B B−1
Rϕϕ = g ϕs Rsϕ = g ϕϕ Rϕϕ = − 2 2 Rϕϕ = − − .
r sin θ 2rAB 2rB 2 r2 B
Riassumendo le componenti non nulle di Rkm :
A00 A0 B 0 A02 A0

t
R = −
 t 2AB 4AB 2 4A2 B rAB − +

00 0 0 02 0
 Rr = A − A B − A − B

 r (12.19)
 2AB 4AB 2 4A2 B rB 2
 A0 B0 B−1
Rθθ = Rϕϕ = − 2
− 2
2rAB 2rB r B
m
Notiamo nuovamente che il tensore Rk continua ad essere solo diagonale;
ciò che si è aggiunto è che due delle sue componenti sono uguali. Ciò significa
che per la metrica (12.4) le 10 equazioni di Einstein si riducono a 3 equazioni.
Inoltre, per effetto del vincolo sul tensore di Ricci dato dalle identità
di Bianchi contratte (11.37), queste tre equazioni non sono nemmeno indi-
pendenti, e dunque si riducono a due. Ricapitolando, avevamo 2 funzioni
incognite e abbiamo 2 equazioni che le definiscono: possiamo risolvere il
problema.13
13
Altrimenti avremmo dovuto estendere la classe di funzioni in cui cercare la soluzione.
304 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

12.1.6 Risoluzione delle equazioni di Ricci


Le equazioni di Ricci (equazioni di Einstein nel vuoto) sono dunque

A00 A0 B 0 A02 A0

− − + =0


2AB 4AB 2 4A2 B rAB




A00 A0 B 0 A02 B0

− − − =0 (12.20)
 2AB 4AB 2 4A2 B rB 2

0 0

 A − B − B−1 =0



2rAB 2rB 2 r2 B
cioè un sistema di equazioni differenziali ordinarie: benché il sistema sembri
temibile, combinando opportunamente le equazioni riusciamo a separare le
incognite.
Per le equazioni di Ricci deve sussistere che

Rtt − Rrr − Rθθ − Rϕϕ = 0, (12.21)

cioè che
B0 B−1
2 2
+2 2 = 0, (12.22)
rB r B
equazione differenziale ordinaria che si risolve per separazione di variabili.
Semplificando la scrittura si trova

rB 0 = B(1 − B),

da cui
dB dr
= .
B(1 − B) r
Dato che
1 1 1−B
= +
B(1 − B) B ,
si ha
−1
Z Z Z
1 1
dB − dB = dr
B 1−B r
e dunque
ln B − ln(1 − B) = ln r + C,
con C costante arbitraria, oppure

B
ln = ln r + C,
1−B
12.1. SOLUZIONE DELLE EQUAZIONI 305

e passando agli esponenziali


B r
=− , (12.23)
1−B a
dove abbiamo riscritto la costante arbitraria nella forma
1
− = eC
a
la cui particolarmente importanza sarà chiara in seguito.
Dalla (12.23) si ricava facilmente

aB = −r(1 − B) = −r + rB,

cioè
B(r − a) = r
e dunque
r 1
B(r) = = . (12.24)
r−a 1 − ar
Dopodiché notiamo che, sempre per le equazioni di Ricci,

Rtt − Rrr = 0, (12.25)

cioè che
A B
+ = 0, (12.26)
rAB rB 2
il che implica che
A0 B + AB 0 = (AB)0 = 0,
cioè che AB sia una quantità costante. Per l’ipotesi aggiuntiva (12.5) tale
costante deve essere c2 , e dunque da

AB = c2

ricaviamo subito che


2
 a
A(r) = c 1 − . (12.27)
r
Et voila: abbiamo trovato le espressioni delle funzioni incognite, e dunque
abbiamo determinato la metrica di Schwarzschild
2 2
 a 2 1 2 2 2 2 2
ds = −c 1 − dt + a dr + r (dθ + sin θdϕ ) (12.28)
r 1− r
e il campo gravitazionale.
Ci resta da determinare il valore della costante a (detta raggio di Sch-
warzschild), cosa che faremo successivamente.
306 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

12.2 Dal campo al moto


Una volta determinato il campo gravitazionale, studiamo come si muovono
in tale campo le particelle e la luce. Per il principio della geodetica, si tratta
di risolvere in sostanza le equazioni delle geodetiche del genere tempo e del
genere luce.
Limitiamo innanzitutto i possibili movimenti; per la simmetria sferica del
problema e del campo, ci possono essere solamente due tipi di moti14 :
(i) il moto radiale, cioè il moto lungo un raggio spiccato dal pianeta,
corrispondente a θ̇ = 0 e ϕ̇ = 0;
(ii) il moto equatoriale, cioè il moto in un piano ben determinato (sup-
poniamo il piano θ = π2 ), corrispondente quindi a θ = π2 e θ̇ =
0.

12.2.1 Moto delle particelle


Cominciamo dalle geodetiche del genere tempo, dove il moto è parametriz-
zato dal tempo proprio τ . La simmetria del problema (sferica e di traslazione
temporale15 ) comporta che due equazioni di Lagrange delle geodetiche pos-
sano essere sostituite con due integrali primi. Abbiamo inoltre un ulteriore
vincolo sul modulo della velocità.
Per esteso, la lagrangiana è
2 ∂s2  a 2 2 1 2 2 2 2 2
L=V = 2 =− 1− c ṫ + a ṙ + r (θ̇ + sin θ ϕ̇ ) (12.29)
∂τ r 1− r
che deve essere costante, poiché in un moto geodetico la velocità è costante.
Inoltre dato che la Lagrangiana non dipende né da t né da ϕ, abbiamo i due
integrali primi sopra accennati. Dal fatto che in
d ∂L ∂L
− = 0,
dτ ∂ ṫ ∂t
∂L
si annulla ricaviamo che
∂t
 a
1− ṫ = cost,
r
14
Nel caso delle geodetiche del genere tempo, il punto sopra la coordinata indica sempre
la derivazione rispetto al tempo proprio. Nel caso delle geodetiche del genere luce, non
ha senso parlare di tempo proprio: in questo caso vedremo meglio successivamente cosa
dobbiamo intendere allora con le scritture θ̇ e ϕ̇.
15
Simmetria sferica significa che la metrica ha la forma (12.4) rispetto alle coordinate ϕ
e θ. Simmetria di traslazione temporale significa che la coordinata temporale non compare
nelle funzioni della metrica, cioè che la metrica è indipendente dal tempo.
12.2. DAL CAMPO AL MOTO 307

e analogamente dal fatto che in


d ∂L ∂L
− = 0,
dτ ∂ ϕ̇ ∂ϕ
∂L
si annulla ricaviamo
∂ϕ
r2 sin2 θϕ̇ = cost.
Infine possiamo scrivere l’equazione di Lagrange rispetto alla coordinata θ:
∂ 2
(r θ̇) − r2 ϕ̇ sin θ cos θ = 0.
∂τ
Riuniamo quanto trovato nel seguente sistema di quattro equazioni:
 
a 2 2 1 2 2 2 2 2 2
− 1 − c ṫ + a ṙ + r (θ̇ + sin θ ϕ̇ ) = −c


r 1 −


r

a

 
 1− ṫ = γ


r (12.30)
2 2


 r sin θ ϕ̇ = J



 ∂ 2
(r θ̇) − r2 ϕ̇ sin θ cos θ = 0



∂τ
ove γ e J sono due opportune costanti.
Notiamo il fatto che la prima equazione traduce la conservazione del mo-
dulo della quadrivelocità, dovuto al fatto che un moto geodetico avviene sem-
pre a velocità costante - il valore −c2 di questa costante dipende dalla scelta
del parametro. La seconda equazione traduce il fatto che la metrica è simme-
trica per traslazioni temporali; tra poco sarà chiaro che dovremo interpretare
la costante γ come una energia. La terza equazione, infine, si interpreta come
conservazione del momento angolare, ed è dovuta al fatto che la metrica è
simmetrica per rotazioni. L’ultima equazione non è legata a un integrale
primo, ma è semplicemente l’equazione di Lagrange per la coordinata θ.

12.2.2 Geodetiche radiali del genere tempo


Concentriamoci ora sulle geodetiche radiali del genere tempo, imponendo i
vincoli, quindi, θ̇ = 0 e ϕ̇ = 0. Inserendo tali informazioni nel sistema (12.30)
rimaniamo con due equazioni del prim’ordine:
a 2 2 1 2
 
 − 1− 2
c ṫ + a ṙ = −c

r 1− r (12.31)
 1 − a ṫ = γ


r
308 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Procediamo per eliminazione di ṫ, ricavandolo dalla seconda


γ
ṫ = a
1− r

e inserendolo nella prima:


c2 γ 2 1 2
− a + ṙ = −c2
1− r 1 − ar

Mettiamo l’equazione in forma normale come


 a
ṙ2 + c2 1 − = c2 γ 2 ,
r
formula che rappresenta l’integrale dell’energia durante il moto radiale, e che
dunque permette di interpretare γ come energia. Derivando, otteniamo
c2 a
2r̈ + = 0,
r2
ovvero
d2 r c2 a
r̈ = = − .
dτ 2 2r2
che è la corrispondente equazione di moto radiale nello spazio.
Per confronto con il caso newtoniano (che deve essere vero nel limite
classico), in cui si aveva che

d2 r GM
= − ,
dt2 r2
si arriva ad identificare16 il raggio di Schwarzschild: da
ac2 GM
− 2 =− 2
2r r
ricaviamo immediatamente che

ac2 = 2GM, (12.32)

cioè che
2GM
a= . (12.33)
c2
Abbiamo quindi legato il raggio di Schwarzschild alla massa del pianeta
mediante il confronto con il caso classico.
16
Il confronto infatti è sensato nel limite classico, quando il campo è debole (cioè a
grandi distanze) e quando il pianeta ha basse velocità.
12.2. DAL CAMPO AL MOTO 309

12.2.3 Geodetiche equatoriali del genere tempo


Ripetiamo ora l’analisi precedente, stavolta studiando il moto confinato di
un satellite intorno al pianeta, pensato come responsabile della metrica di
Schwarzschild. Lo scopo è confrontare con la prima legge di Keplero i risultati
che otterremo.
Le ipotesi sono quindi che θ = π2 , cioè sin θ = 1, cos θ = 0 e θ̇ = 0. Sosti-
tuendo queste informazioni nel sistema (12.30) rimaniamo con tre equazioni
(la quarta è identicamente verificata):
 
a 2 2 1 2 2 2 2
− 1 − c ṫ + a ṙ + r ϕ̇ = −c


r 1 −


r
 
a (12.34)
1− ṫ = γ


 r
 r2 ϕ̇ = J

Si procede come prima, per eliminazione del tempo ṫ e dell’angolo ϕ̇.


Dalla seconda equazione si ha che
γ
ṫ = ,
1 − ar

dalla terza
J
ϕ̇ = .
r2
Sostituendo tali informazioni nella prima, si ha che

c2 γ 2 ṙ2 J2 2
− a + a + 2 = −c ,
1− r 1− r r

e mettendola in forma normale otteniamo subito che


a 2 J2
  
2
ṙ + 1 − c + 2 = c2 γ 2 . (12.35)
r r
Si effettua poi il cambiamento di variabile
1
u=
r
∂ϕ
e il cambiamento di variabile indipendente17 da τ a ϕ, essendo = ϕ̇ > 0
∂τ
17
Il pianeta funziona come una sorta di orologio: l’angolo che spazza è in una relazione
ben determinata e invertibile con il tempo, e quindi possiamo considerare tale angolo ϕ
come tempo, al posto di τ .
310 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

sempre.18 In questo modo si passa dal moto all’orbita, con

du d 1 1 du dϕ J
u̇ = = = − 2 ṙ = = u0 ϕ̇ = u0 2 ,
dτ dτ r r dϕ dτ r

da cui si ricava
ṙ = −Ju0 ,
essendo (si badi bene!) u0 = dϕ du
la derivata rispetto al nuovo orologio ϕ.
Sostituendo quest’ultima eguaglianza nella (12.35), l’equazione differen-
ziale dell’orbita (valevole anche per i moti non legati, cioè per i moti aperti19 )
diventa
J 2 u02 + (1 − au)(c2 + J 2 u2 ) = c2 γ 2 ,
cioè, messa in forma normale,

c2 c2 γ 2
 
02 2
u + (1 − au) u + 2 = ,
J J2

da cui la formula
c2 (γ 2 − 1) ac2
u02 + u2 = + 2 u + au3 . (12.36)
J2 J
La formula (12.36) è particolarmente interessante, nel senso che l’equa-
zione di moto in questa forma risulta particolarmente significativa: la scrit-
tura
c2 (γ 2 − 1) ac2
u02 + u2 = + 2u (12.37)
J2 J
è esattamente l’equazione di moto di un pianeta nel caso newtoniano. Il ter-
mine aggiuntivo che appare al secondo membro della (12.36) è invece un ter-
mine nuovo, che rende conto della perturbazione relativistica. Finché l’equa-
zione era di secondo grado nell’incognita u (caso newtoniano), essa era perfet-
tamente integrabile con le sostituzioni trigonometriche usuali. Aggiungendo
il termine cubico, questa facile integrabilità viene meno, e bisogna servirsi
18
Infatti ϕ̇ = rJ2 , e se tale quantità non fosse maggiore di zero sempre, avrebbe comunque
segno costante, dunque la relazione tra ϕ e t sarebbe comunque invertibile. In particolare,
potremmo scegliere la coordinata ϕ in altro modo, di modo che la derivata sia maggiore
di zero, ma non è questo il punto: il punto è che essendo la relazione tra ϕ e t invertibile,
possiamo usare ϕ come “orologio”. L’unico caso critico è quello per cui J = 0, ma allora
anche ϕ̇ = 0, e dato che si aveva anche θ̇ = 0, saremmo nel caso già trattato del moto
radiale.
19
Infatti, fino a questo punto, tutti i ragionamenti sono validi per qualsiasi moto
equatoriale, limitato o non limitato (satelliti o comete).
12.2. DAL CAMPO AL MOTO 311

delle funzioni ellittiche (la generalizzazione delle funzioni trigonometriche),


ambito in cui non ci addentreremo.
Per risolvere la (12.36) utilizzeremo invece un metodo iterativo (detto
metodo di Picard), che ci fornirà una soluzione approssimata, ma comun-
que soddisfacente già alla prima iterazione. Iniziamo a derivare la (12.36),
passando al second’ordine20 , e sostituendo il raggio di Schwarzschild a con il
suo valore, trovato con la (12.33). Si arriva a
GM GM
u00 + u = 2
+ 3 2 u2 , (12.38)
J c
che è la vera e propria equazione di moto (in cui si vede ancora meglio che il
termine 3 GMc2
è la perturbazione relativistica alla formula newtoniana).
Seguendo il metodo di Picard (che agisce come un comune metodo ite-
rativo), prendiamo come approssimazione zero la funzione u0 (ϕ) soluzione
dell’equazione di Newton
GM
u000 + u0 = 2 . (12.39)
J
È immediato vedere che tale soluzione ha la forma
GM
u0 = 2 (1 + ε cos ϕ), (12.40)
J
ove ε è un’opportuna costante iniziale. La prima approssimazione sarà data
dall’equazione
GM 3GM
u001 + u1 = 2 + 2 u20 , (12.41)
J c
che, essendo u20 funzione nota, è perfettamente risolvibile. E cosı̀ via si può
iterare il procedimento:
GM 3GM
u00i + ui = 2
+ 2 u2i−1 . (12.42)
J c
Fermiamoci per semplicità alla prima iterazione (12.41): si tratta di un’e-
quazione differenziale lineare con un termine forzante (dato dalla presenza
della funzione u20 ).
Esplicitamente, sostituendo l’espressione per u20 , l’equazione (12.41) di-
venta
GM 3G3 M 3
u001 + u1 = 2 + 2 4 (1 + ε cos ϕ)2 , (12.43)
J cJ
la cui soluzione è data da
G3 M 3
  
1 2 1
u1 = u0 + 3 2 4 1 + εϕ sin ϕ + ε 1 − cos(2ϕ) (12.44)
cJ 2 3
20
Abbiamo già semplificato il fattore 2 a tutti i termini.
312 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Si può ammettere di trascurare i termini limitati nella parentesi, cioè


22 1 2 1
21

il termine costante 1 e il termine limitato 2 ε 1 − 3 cos(2ϕ) . Rimane
dunque solo il termine εϕ sin ϕ, che è detto termine secolare per il fatto che
aumenta allo scorrere dell’orologio ϕ. Si assume quindi, in prima approssi-
mazione, che
G3 M 3 G2 M 2
 
GM
u1 = u0 + 3 2 4 εϕ sin ϕ = 2 1 + ε cos ϕ + 3ε 2 2 ϕ sin ϕ . (12.45)
cJ J cJ
Per interpretare la formula (12.45) si ricorre al teorema di composizione
delle funzioni trigonometriche: notando che
 2 2 
3G M
cos ϕ ≈ 1,
c2 J 2
e che
3G2 M 2 3G2 M 2
 
sin ϕ ≈ ϕ,
c2 J 2 c2 J 2
2 2
poiché la quantità 3Gc2 JM2 ϕ è molto piccola. Possiamo dunque riscrivere la
(12.45) come23

G2 M 2 G2 M 2
      
GM
u1 = 2 1 + ε cos ϕ cos 3ε 2 2 ϕ + sin 3ε 2 2 ϕ sin ϕ ,
J cJ cJ
(12.46)
cioè
G2 M 2 G2 M 2
      
GM GM
u1 = 2 1 + ε cos ϕ − 3ε 2 2 ϕ = 2 1 + ε cos 1 − 3ε 2 2 ϕ ,
J cJ J cJ
(12.47)
forma in cui si legge il termine perturbatore come una variazione della pul-
sazione. Il termine
G2 M 2
1−3 2 2 ,
cJ
che fornisce il fattore di dilatazione della pulsazione, è molto prossimo a uno,
ma è in generale diverso da 1: ciò significa che la velocità angolare relativistica
del pianeta non è la velocità angolare prevista dalla teoria classica.
21
Soprattutto perché ciò che ci interesserà sarà poi trovare i massimi di u1 .
22
A maggior ragione perché ε è verosimilmente piccolo.
23
Stiamo portando “dentro la parentesi” la perturbazione, la stiamo interpretando come
un cambiamento di pulsazione; ricordiamoci infatti della formula

cos(α − β) = cos α cos β + sin α sin β.


12.3. PROBLEMA DELLE SINGOLARITÀ 313

Studiamo adesso i massimi24 di u1 . I massimi saranno i valori per cui


l’argomento del coseno25 è un multiplo di 2π: il primo massimo è per
ϕ0 = 0,
soluzione banale prevista anche classicamente, il massimo successivo è
G2 M 2
 

ϕ1 = 2 2 ≈ 2π 1+3 2 2 .
1 − 3 Gc2MJ 2
cJ
Come si nota, il pianeta non ritorna a un massimo dopo un angolo di 2π
(cioè dopo un “giro d’orologio”, una rivoluzione), ma dopo un angolo di
G2 M 2
 
2π 1 + 3 2 2 ,
cJ
cioè leggermente dopo. Questo effetto, di rivoluzione in rivoluzione, di giro
in giro, si va ad amplificare: ad ogni giro il semiasse minore26 “precede” di
una quantità pari a
G2 M 2
∆ϕ = 3 2 2 , (12.48)
cJ
fenomeno di cui si è avuta conferma nell’osservazione sperimentale del pia-
neta Mercurio. Anzi: la precessione del perielio di Mercurio è stata la prima
conferma sperimentale della Relatività Generale. Gli astronomi non riusci-
vano a spiegarsi perché tale precessione fosse cosı̀ marcata (in disaccordo
con le teorie newtoniane); quando Einstein usò la soluzione di Schwarzschild
per calcolare - come abbiamo fatto noi - la precessione, egli scoprı̀ che essa
coincideva esattamente (all’interno del margine d’errore sperimentale) con la
precessione osservata. Questo fu il primo grande trionfo per la Relatività
Generale.

12.3 Problema delle singolarità


La metrica di Schwarzschild (12.28), che ha la forma
 a 2 1
ds2 = −c2 1 − dt + dr2 + r2 (dθ2 + sin2 θdϕ2 ),
r 1 − ar
24
Cioè i punti in cui il pianeta è più vicino al sole, o il satellite è più vicino al pianeta
(infatti u è l’inverso del raggio r).
25
Si riconduce infatti alla ricerca dei massimi della funzione cos(hϕ), i cui massimi sono
tutti i valori per cui l’argomento hϕ = 2kπ per qualche k. Il primo massimo si ha per
hϕ1 = 0, da cui ϕ1 = 0; il secondo massimo si ha per hϕ1 = 2π, cioè per ϕ1 = 2π h , e cosı̀
via.
26
Infatti u1 è massimo dove r è minimo.
314 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

presenta due singolarità: in r = 0 e in r = a, punti in cui qualche denomi-


natore si annulla.
Il caso di r = 0 è una singolarità ineliminabile, corrispondente al diver-
gere della curvatura (basta scrivere gli elementi del tensore di Riemann per
accorgersene).
Viceversa, mostreremo che r = a è una singolarità apparente 27 , elimi-
nabile con un opportuno cambiamento di coordinate.28 Ciò significa, in so-
stanza, che le coordinate usate sono una carta locale solo per una parte dello
spaziotempo fisico (per r > a e 0 < r < a) e che lo spaziotempo può essere
esteso eliminando la singolarità e cambiando le coordinate. Questo processo
di estensione è stato portato ai massimi termini da Kruskal (1961) con la sua
estensione massimale.29
Per indagare la natura della singolarità r = a studiamo il prolungamento
massimale delle geodetiche del genere luce di tipo radiale (fasci di fotoni che
cadono radialmente sul pianeta). Essendoci liberati dalle coordinate angolari,
possiamo lavorare, per semplicità, in un universo bidimensionale (t, r).

12.3.1 Geodetiche radiali del genere luce


Si procede esattamente come fatto in precedenza, considerando le equazioni
del sistema (12.30), con l’unica differenza che, trattandosi di geodetiche del
genere luce, il vettore 4-velocità è un vettore del genere luce, cioè di norma
nulla, da cui dobbiamo porre a zero il termine noto della prima equazione
del sistema. Dato che il moto è radiale vale che θ̇ = 0 e ϕ̇ = 0, le equazioni
del sistema collassano a
 a 2 2 1 2
− 1− c ṫ + ṙ = 0
r 1 − ar (12.49)
 a 
1− ṫ = γ
r
27
Naturalmente la metrica di Schwarzschild è la soluzione esterna al pianeta generante
il campo, per cui essa vale per r > rpianeta . Per i moti classici, dunque, il problema non si
pone, visto che a è in generale molto più piccolo del raggio di un pianeta. Ma in seguito
alla scoperta delle stelle massive (o massicce) e ad altre recenti scoperte della cosmologia
e dell’astrofisica, ha senso considerare anche il caso di a > rpianeta .
28
Ad esempio, anche in coordinate polari, nel piano, c’è una singolarità per r = 0,
ma questo non significa che il piano in tale punto sia in sé singolare, visto che con un
opportuno cambiamento di coordinate (ad esempio passando alle coordinate cartesiane)
tale singolarità può essere eliminata.
29
Si pensi, come analogia, al processo di prolungamento delle soluzioni con cui abbiamo
a che fare risolvendo un’equazione differenziale.
12.3. PROBLEMA DELLE SINGOLARITÀ 315

dove questa volta non possiamo più utilizzare la nozione di tempo proprio, e
dobbiamo definire
dt
ṫ = ,

con λ un qualunque parametro affine lungo l’orbitra (parametro che sarà
determinato dalla seconda delle (12.49).
Per passare dal moto parametrizzato con λ alla linea di universo (indipen-
tente dalla parametrizzazione) riscriviamo la prima equazione della (12.49)
nella forma differenziale
 a 2 2 1
− 1− c dt + dr2 = 0,
r 1 − ar

da cui
dt2 1
2
= 2 ,
dr 1 − ar c2
cioè
dt 1
=±  , (12.50)
dr 1 − ar c
dove il doppio segno distingue le geodetiche che “entrano” nel pianeta da
quelle “uscenti” dal pianeta.
Le equazioni (12.50) si integrano ancora una volta per separazione di
variabili.
Ad esempio, supponiamo che r > a, cioè r > 2GM c2
. Prendiamo nella
(12.50) il segno positivo e scriviamo

1 r
dt = 2GM
 dr = dr =
c 1 − c2 r c(r − 2GM
c2
)
! !
2GM 2GM 2GM
1 r− c2 c2 1 c2
= 2GM
dr + dr = dr + dr ,
c r− c2
r − 2GM
c2
c r − 2GM
c2

equazione che possiamo facilmente integrare, ottenendo


  
1 2GM 2GM
t= r + 2 ln r − 2 + cost,
c c c

o equivalentemente

rc2
  
1 2GM
t= r + 2 ln −1 + cost0 , (12.51)
c c 2GM
316 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

dove abbiamo
 2 cambiato
 la costante, poiché le funzioni 2GMc2
ln(r − 2GM
c2
)
e 2GM
c2
rc
ln 2GM − 1 , avendo uguale derivata, differiscono proprio per una
qualche costante. Questa è l’equazione per le geodetiche uscenti.
Analogamente prendendo il segno negativo nella (12.50) abbiamo

1 r
dt = − 2GM
 dr = − dr =
c 1 − c2 r c(r − 2GM
c 2 )
! !
2GM 2GM 2GM
1 r − c2 c 2 1 c2
= − 2GM
dr − 2GM
dr = −dr − dr ,
c r − c2 r − c2 c r − 2GM
c2

che possiamo integrare, ottenendo


  
1 2GM 2GM
t= −r − 2 ln r − 2 + cost,
c c c

o equivalentemente

rc2
  
1 2GM
t= −r − 2 ln −2 + cost0 , (12.52)
c c GM

per le stesse ragioni addotte precedentemente. Questa è l’equazione per le


geodetiche entranti.
Per r > a, le equazioni sono quindi

rc2
  
1 2GM
t− r + 2 ln −1 =u (12.53)
c c 2GM

per le geodetiche entranti e


  2 
1 2GM rc
t+ r + 2 ln −2 =v (12.54)
c c GM

per le geodetiche entranti, con u e v costanti del moto.


Per 0 < r < a il discorso è analogo; l’interesse delle equazioni delle
geodetiche del genere luce è dato anche dal fatto che esse si integrano com-
pletamente, fino in fondo.

12.3.2 Analisi della struttura causale


Analizziamo ora la geometria di queste geodetiche del genere luce studiando
la disposizione dei coni luce. Per fare questo, non ci servono le equazioni
(12.54) e (12.54) che descrivono il moto radiale della luce, ma ci basta andare
12.3. PROBLEMA DELLE SINGOLARITÀ 317

a riprendere l’equazione (12.50) che dà la pendenza del raggio luminoso in


uno spaziotempo bidimensionale.
Consideriamo la figura 12.2, e mettiamoci nella parte di spaziotempo con
r > a. La pendenza dei coni è ivi definita da30
dt 1 1
=± a =± 2GM
.
dr 1− r 1− rc2

Dall’analisi di questa derivata, tradotta nel grafico di figura 12.2, notiamo


innanzitutto tre fatti:
• per r → +∞ la derivata tende a 1, e ritroviamo quindi esattamente i
coni luce dello spaziotempo di Minkowski (ciò è corretto, e corrisponde
alla nostra supposizione che, a grande distanza dal pianeta generante
il campo, la geometria debba essere minkowskiana);

• al decrescere di r, per r → a+ , i coni si stringono, poiché la derivata


aumenta illimitata;

• le geodetiche luce entranti devono per definizione essere sempre tangenti


alla “falda con pendenza negativa” del cono luce: questa fenomenologia
le forza quindi a tendere asintoticamente alla retta r = a per r → a+ .
A maggior ragione si schiaccia verso la retta r = a una particella, la
cui linea di universo deve essere strettamente contenuta all’interno del
cono luce.
Specialmente quest’ultima affermazione sembra confermare il carattere
singolare della retta r = a. Tuttavia, prima di discutere questo problema più
nel dettaglio, procediamo allo stesso modo per studiare i coni luce dell’altra
regione (0 < r < a), e quindi vedere l’andamento delle geodetiche in tale
regione.
Bisogna innanzitutto prestare molta attenzione a un fatto essenziale:
transitando dalla zona r > a alla zona 0 < r < a, accade che il segno
dei primi due coefficienti della metrica cambia:
 a 2 2 1
ds2 = − 1 − c dt + dr2 + r2 dΩ2 .
r 1 − ar
30
Per convenzione i grafici sono tracciati supponendo c = 1, sicché i coni luce min-
kowskiani risultino proprio giacere sulle bisettrici degli assi. Si noti che nella Relatività
Generale è convenzione assai comune addirittura omettere completamente dalle equazioni
(cioè porre c = 1) tutti i fattori c: sebbene possa confondere leggermente, ciò permette
però che tutte le equazioni siano scritte in maniera più concisa, e nessuna informazione
in effetti viene persa, dal momento che i fattori mancanti possono sempre essere reinseriti
senza ambiguità mediante un’analisi dimensionale.
318 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Figura 12.2: Disposizione dei coni luce nello spaziotempo di Schwarzschild


(grafico tracciato con la convenzione c = 1). Per r grande la metrica è minko-
wskiana, e dunque il cono luce tende al cono luce minkowskiano, le cui falde
sono, se c = 1, le bisettrici dei quadranti. Per r → a+ i coni si stringono,
e forzano le geodetiche luce entranti (che devono essere tangenti alla falda a
pendendenza negativa dei coni) ad avvicinarsi asintoticamente alla retta r = a.
12.3. PROBLEMA DELLE SINGOLARITÀ 319

Il coefficiente di dt2 , prima negativo, diventa positivo, poiché ora ar < 1;


analogamente il coefficiente di dr2 , prima positivo, diventa negativo.
Questo ha un’immediata ripercussione sul significato delle coordinate che
stiamo utilizzando. Abbiamo già accennato precedentemente che in uno spa-
zio non semieuclideo, non possiamo pensare di mantenere incondizionata-
mente il significato di (t, r) rispettivamente come tempo e raggio. In par-
ticolare: che cosa ci assicurava (anche nello spazio minkowskiano) che la
coordinata t fosse effettivamente il tempo? Solo una cosa: il segno della me-
trica! È il segno della metrica che in generale ci dice se una coordinata è
del genere tempo o del genere spazio: visto che nell’analisi minkowskiana,
ηtt = −1 < 0, allora la coordinata t poteva a buon diritto essere interpre-
tata come tempo. Analogamente, le altre coordinate, avendo il corrispettivo
elemento sulla diagonale della metrica positivo, venivano interpretate come
spazio. Ma allora anche qui, non possiamo affatto dire a priori che t è coor-
dinata temporale e r coordinata spaziale: ce lo dice la metrica! Se nella
regione 0 < a < r il coefficiente negativo è quello di dr2 e quello positivo è di
dt2 , significa che in tale regione le coordinate si scambiano i ruoli : r diventa
coordinata temporale, t coordinata spaziale. Ciò significa che i coni luce, in
questa regione avranno come asse un asse parallelo al nuovo asse temporale
r (v. fig. 12.3). In particolare, una curva con r < a costante non è più una
possibile linea di universo di una particella, di un osservatore o di un raggio
luminoso, nemmeno se una qualche forza si esercita per mantenere l’oggetto
su quella retta (nemmeno, cioè, se l’osservatore “accende i motori”).

12.3.3 Significato della singolarità r = a


Per comprendere la natura della singolarità r = a dobbiamo innanzitutto
comprendere il significato della coordinata t: operativamente, che cosa è?
Consideriamo un osservatore che abbia una linea di universo parallela
all’asse t e di equazione
r = r0  a.
Si tratta di un osservatore in quiete relativa rispetto al pianeta (e non
in caduta libera: per non “cadere” sul pianeta e per mantenersi in quiete
relativa, infatti, tale osservatore deve “accendere i motori”!) che osserva i
fotoni e i pianetini cadere verso il pianeta centrale, generante il campo.
Poiché r0  a, lo spaziotempo vicino all’osservatore è praticamente lo
spaziotempo di Minkowski, e quindi lungo la linea di universo dell’osservatore
(ove ṙ = 0, θ̇ = 0 e ϕ̇ = 0), la metrica è31
ds2 = −c2 dt2 . (12.55)
31
Infatti, per quanto detto, ivi si ha che dr = 0, dθ = 0, dϕ = 0.
320 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Figura 12.3: Per 0 < r < a le coordinate r e t si scambiano i ruoli, poiché


cambiano i segni degli elementi della metrica. Di conseguenza, i coni luce
saranno disposti con l’asse lungo la direzione del nuovo asse temporale, r.
12.3. PROBLEMA DELLE SINGOLARITÀ 321

Figura 12.4: O è un osservatore in quiete relativa con il pianeta P (la cui


linea di universo è l’asse dei tempi); ciò significa che O deve “tenere i motori
accesi” per non cadere su P , e dunque non è un osservatore in caduta libera. A
è un astronauta in caduta libera su P che manda, a periodi di tempo regolari
∆τ del suo tempo proprio, segnali radar verso l’esterno. L’osservatore O vede
i periodi di ricezione divergere all’infinito prima che l’astronauta A raggiunga
la retta r = a. Ma questo non significa che l’astronauta non raggiungerà mai
la retta!

Questa formula ci dice che t è il tempo proprio misurato dall’orologio di


un tale osservatore.32
Ora: come può l’osservatore O rendersi conto della caduta, supponiamo,
di un astronauta A sul pianeta principale? L’unico metodo che abbiamo
a disposizione, ormai lo sappiamo bene, è il metodo radar: l’osservatore
si rende conto della caduta dell’astronauta perché riceve, a certi intervalli,
dei segnali luminosi emessi dall’astronauta; tali segnali luminosi dovranno
viaggiare tangenti alla “falda a pendenza positiva” dei coni luce (fig. 12.4).
Il problema è che la somma dei tempi di ricezione dei segnali ricevuti
32
Infatti per la per la (6.10) il tempo proprio è il tempo che verifica

ds2 = −c2 dτ 2 ,

essendo la parte spaziale nulla poiché gli eventi accadono nello stesso luogo nel giudizio
dell’osservatore.
322 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

diverge all’infinito prima che l’astronauta A abbia raggiunto la retta r = a:


O non vede quindi A raggiungere tale retta, perché i segnali che riceve diver-
gono all’infinito più velocemente del tendere di A alla retta. In altre parole,
la geometria dello spaziotempo, che distorce i segnali luminosi, impedisce
all’osservatore O di vedere A cadere su r = a.
Ma questo non significa affatto che A non ci arrivi a tale retta! Infatti, se
si calcola la lunghezza della geodetica per r → a, cioè se si calcola il tempo
misurato dall’orologio di A, si trova un tempo finito!33
Infatti, per l’osservatore O vale che

2 2
 a 2 1 2
ds = −c 1 − dt + a dr ,
r 1− r

mentre per l’astronauta in caduta libera


 a 2
ds2 = −c2 1 − dτ ,
r
e dunque deve valere
 a 2  a 2 1
−c2 1 − dτ = −c2 1 − dt + dr2 , (12.56)
r r 1 − ar

D’altro canto se l’osservatore è distante dal pianeta la sua metrica, come


abbiamo, visto deve essere data dalla (12.55), e dato che sappiamo che il
tempo proprio (che è il tempo di eventi che accadono nello stesso luogo) è
legato alla metrica dalla relazione
 a 2
ds2 = −c2 1 − dτ .
r
Si ha per confronto la relazione che lega il dt dell’osservatore O al tempo
proprio dτ :  a 2
dτ 2 = 1 − dt ,
r
cioè r
a
dτ = 1− dt ≤ dt, (12.57)
r
equazione che rende conto di una dilatazione gravitazionale dei tempi:
il tempo scorre più lentamente laddove il campo è più intenso. Ciò signi-
fica che l’osservatore distante dal pianeta vede il tempo proprio scorrere più
lentamente, a causa del campo gravitazionale.
33
Come suggestione, si pensi all’analogia con l’integrazioni di funzioni che vanno
all’infinito, ma il cui integrale è finito.
12.3. PROBLEMA DELLE SINGOLARITÀ 323

Inserendo l’informazione della (12.57) nella (12.56) ci liberiamo di dt e


abbiamo una relazione pulita tra dτ e dr:
 a 2 1
−c2 1 − dτ = −c2 dτ 2 + dr2 ,
r 1 − ar

da cui  ac  r
dτ 2 c − c + = dr2 ,
r r−a
cioè
r r
dτ 2 = dr2 ,
ac r − a
e dunque
r
dτ = p dr. (12.58)
ac(r − a)
Il tempo (proprio) che l’astronauta A impiega a cadere sulla retta r = a
dal momento in cui si trova in r = r0 è dato da
Z r0 Z r0
r 1 r
τr=a − τr=r0 = p dr = √ √ dr, (12.59)
a ac(r − a) ac a r−a

e con una sostituzione s = r − a (ds = dr) l’integrale acquista la forma


Z r0 Z r0 −a Z r0 −a


1 s+a 1 1
τr=a − τr=r0 = √ √ ds = √ sds + a √ ds ,
ac a s ac 0 0 s
(12.60)
ed entrambi gli integrali nella prentesi convergono: il primo banalmente,
il secondo perché è un’integrale improprio di una funzione del tipo sλ che
dall’analisi sappiamo convergere in s = 0 se e solo se λ > −1. Dato che nel
nostro caso λ = − 12 , l’astronauta A arriva alla retta r = a in un tempo finito.
Il fatto che il tempo impiegato da A per arrivare a r = a appaia infinito
all’osservatore O, dunque, è un problema delle coordinate di O, e non di A:
il divergere all’infinito è solo un effetto della scelta di coordinate!

12.3.4 Risoluzione della singolarità


Se effettivamente A attraversa r = a, proseguendo il moto di caduta verso
il centro, la sua geodetica esterna deve saldarsi con una geodetica interna
(della zona quindi 0 < r < a). Con quale geodetica verrà saldata?
L’idea è di usare l’uguaglianza delle costanti del moto u e v, precedente-
mente introdotte; ciò significa che dovremo usare come coordinate, ad esem-
pio (r, v), essendo v la costante del moto per le geodetiche entranti. Le
coordinate (r, v) sono dette coordinate di Eddington-Finkelstein.
324 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

Il cambio di coordinate tra (t, r) e (r, v) ci è fornito immediatamente dalla


(12.53):

 r=r   2 
1 2GM rc (12.61)
 v =t+ r + 2 ln −2
c c GM
e dunque, in queste coordinate, la metrica nella parte esterna assume la forma
non più diagonale
 
2 2GM
ds = 1− dv 2 + 2dvdr + r2 dΩ2 , (12.62)
rc2

essendo dΩ2 = dθ2 + sin2 θdϕ2 l’elemento standard di angolo solido (cioè la
metrica standard sulla 2-sfera).
Ciò che notiamo immediatamente nella (12.62) è che, anche se
 
2GM
gvv =− 1− =0
rc2

per r = a = 2GMc2
, la metrica ivi non è singolare, poiché il suo determinante
si mantiene ben diverso da zero. Insomma, con il passaggio alle coordinate
di Eddington-Finkelstein è scomparsa la singolarità in r = a.
Rifacciamo ora l’analisi della struttura causale nel grafico (r, v) di figura
12.5.
Nel caso dei segnali luminosi radiali si ha che dϕ = 0 e dθ = 0, da cui dΩ =
0, e dunque l’equazione delle geodetiche luce radiali si ricava immediatamente
dalla (12.62):
 
2 2GM
ds = 1 − 2
dv 2 + 2dvdr = 0, (12.63)
rc
la quale si può scindere nelle due equazioni

dv dv 2
= 0, = . (12.64)
dr dr 1 − 2GM
rc2

La prima afferma che tutte le rette orizzontali sono geodetiche (e ciò era
già ben visibile nel grafico di figura 12.5), la seconda stabilisce la presenza
di altre geodetiche, oltre alle rette orizzontali, e definisce (per r > a) l’altra
falda dei coni luce nel grafico (r, v) di figura 12.5.
Questa trasformazione di coordinate mostra chiaramente che le geodetiche
orizzontali transitano tranquillamente attraverso la retta r = a.
12.3. PROBLEMA DELLE SINGOLARITÀ 325

Figura 12.5: Nel grafico (r, v), le geodetiche del genere luce non hanno più
alcun problema a superare la retta r = a, che dunque non è più una singolarità.
Tuttavia, qualsiasi segnale luminoso diretto verso il pianeta sorpassi la retta
r = a, non ha più possibilità di essere recepito da un osservatore situato nella
zona r > a: infatti il fatto che i coni si stringano, e il fatto che i coni su
r = a siano ad angolo retto, forzano i segnali luminosi che sorpassano r = a a
restare indirizzati verso il pianeta, senza più alcuna possibilità di uscire. Se un
corpo di raggio R ha un raggio di Schwarzschild a > R, qualsiasi informazione
situata nella zona tra R ed a non potrà mai più essere recepita dagli osservatori
esterni. Corpi di questo tipo sono quelli che vengono chiamati buchi neri.
326 LEZIONE 12. SOLUZIONE DI SCHWARZSCHILD

12.3.5 L’orizzonte degli eventi


Ma che cosa è allora r = a? È una superficie che viene solitamente denomi-
nata orizzonte degli eventi, per una sua importante proprietà. Infatti una
volta che un raggio luminoso proveniente dalla zona r > a oltrepassa tale
superficie, non ha più la possibilità di tornare indietro, poiché i coni luce si
stringono, sicché la geodetica, una volta entrata, non può più uscire, essendo
tali coni ora troppo stretti. Un orizzonte degli eventi è dunque una superficie
che isola una regione da cui le geodetiche non possono uscire. I segnali che
finiscono in tale zona sono, per un osservatore esterno, a tutti gli effetti persi,
poiché non hanno più la possibilità di uscire.
Nella maggior parte dei casi, corpi di raggio R hanno un raggio di Sch-
warzschild ben minore del proprio raggio34 . In tale situazione, il valore r = a
si troverebbe all’interno del corpo, dove quindi la soluzione di Schwarzschild
non ha validità.
Nel caso in cui, invece, un corpo di raggio R abbia raggio di schwarzschild
a > R, allora si verrebbe a creare la situazione precedentemente descritta,
cioè si verrebbero ad individuare due zone: quella per r > a e quella per
R < r < a. In particolare, da quest’ultima zona nessun segnale può ritornare
alla zona r > a, poiché, come mostrato dalla figura 12.5, i coni luce sono
troppo stretti: tale segnale, per un osservatore esterno, è a tutti gli effetti
perso per sempre. Corpi aventi raggio di Schwarzschild maggiore del proprio
raggio sono detti buchi neri.

12.3.6 Estensione massimale di Kruskal


Lo spaziotempo di Eddington-Finkelstein (cioè il semipiano r > 0 con la me-
trica data dalla (12.62) può essere considerato una vera e propria estensione
dello spaziotempo di Schwarzschild: abbiamo in sostanza “incollato” le due
regioni che prima erano separate dalla singolarità. L’estensione è stata fatta
utilizzando le geodetiche entranti, e saldandole naturalmente alle geodetiche
della zona 0 < r < a mediante la costante del moto v.
Si può ripetere il processo anche con le geodetiche uscenti, andando a sce-
gliere le coordinate delle costanti del moto (u, v), con u costante del moto per
le geodetiche uscenti data dalla (12.54) e v costante delmoto per le geodetiche
entranti data dalla (12.53).
Di più: possiamo fare anche i cambi di coordinate mostrati nel dia-
gramma di figura 12.6, mettendoci nell’ipotesi r > a, restrizione che poi
verrà automaticamente eliminata.
34
Ad esempio il raggio di Schwarzschild della terra è di soli 8, 92mm, quello del sole di
2, 96km, comunque valori ben minori dei rispettivi raggi (6378km e 6, 96 · 105 km).
12.3. PROBLEMA DELLE SINGOLARITÀ 327

Figura 12.6: Cambi di coordinate, dalle usuali coordinate (t, r) alle


coordinate di Kruskal (T, R).

Le coordinate (T, R) sono dette coordinate di Kruskal. Dal diagramma


segue in particolare che, la trasformazione diretta tra (t, r) e (T, R) la tra-
sformazione diretta è data da

2
  
rc rc2
 T 2 − R2 = 1 − e 2GM


 2 2GM
 (12.65)
T tc
= tanh



R 4GM

La metrica nelle coordinate di Kruskal diventa

G3 M 3 − rc2
ds2 = 32 6
e 2GM (−dT 2 + dR2 ) + R2 dΩ2 , (12.66)
rc

sempre supponendo che dΩ2 conglobi la parte sferica della metrica.


Notiamo che l’unica singolarità di questa metrica è la singolarità inelimi-
nabile r = 0, tutto il resto è completamente scomparso. In particolare, non
c’è più traccia del fatto che r = a sia un punto di singolarità, e abbiamo
ottenuto una quadruplice est