Sei sulla pagina 1di 77

Appunti di Relatività ristretta

Francesco Ravanini
Corso di Laurea in Astrosica e Cosmologia
Università di Bologna

28 dicembre 2007
2
Introduzione

Nel 1905 Einstein pubblicò 3 articoli:

1. elettrodinamica dei corpi in movimento, cioè le basi della relatività ristretta


2. uno studio sul moto browniano, grazie al quale si dava un forte argomento a favore
della natura particellare della materia
3. eetto fotoelettrico, cioè l'interpretazione di uno dei fenomeni più importanti che
condussero alla formulazione della meccanica quantistica
Qui ci occuperemo della prima di queste 3 linee di ricerca iniziate dal genio di Ulm, i cui
frutti nella Fisica del XX secolo sono noti a tutti. In realtà la relatività nasce da una
problematica già individuata in lavori precedenti di altri autori, in particolare di Lorentz
(1904) e di Poincaré (1901). Al termine del 1905 Einstein uscì con un altro lavoro in cui
2
compare per la prima volta la celebre relazione E = mc e negli anni successivi Minkowski
perfezionò la teoria dello spazio-tempo.
Nel 1911 Einstein cominciò a lavorare alla relatività generale portata a termine nel
1916. Da allora non è più sorta alcuna nuova teoria della relatività.
Il concetto di relatività dei movimenti risale in eetti a Galileo. Trovandosi su un
treno che si muove di moto rettilineo uniforme senza scossoni, se non si guarda fuori dal
nestrino non ci si può accorgere dello stato di moto o di quiete. Non si può quindi parlare
di moto assoluto, ma solo di moto relativo tra due sistemi di riferimento inerziali.
Tutto ciò concorda con la legge di gravitazione di Newton che non determina uno
stato di moto assoluto. Cioè la legge di gravitazione ha la stessa forma in due sistemi in
moto relativo uniforme. In altre parole, facendo misure sulla gravitazione non è possibile
distinguere se un sistema sia in moto oppure no.
La scoperta dell' elettromagentismo, culminata attorno al 1850 nei lavori di Max-
well e nelle sue 4 celebri equazioni, pose per la prima volta problemi a questa visione
galileiana della relatività dei movimenti. La teoria di Maxwell predice l'esistenza di vibra-
zioni del campo elettromagnetico e predice pure la velocità di propagazione di tali onde
elettromagnetiche. Tale velocità vale

c = 299.792.458 m/sec ≈ 3 · 108 m/sec


e coincide con la velocità della luce nel vuoto, da cui Maxwell dedusse che la luce doveva
essere un fenomeno elettromagnetico.

3
4

Già l'astronomo danese Rømer aveva misurato la velocità della luce in base ai ritardi
delle eclissi dei satelliti di Giove. Misure più precise arrivarono con il ranarsi delle
tecnologie nel XIX secolo.
Dire che la luce viaggia alla velocità della luce non è una banalità. Ci si chiede in
quale sistema di riferimento ciò avvenga. Alla ne dell'800 il ragionamento tipico era il
seguente: esiste un etere luminifero che vibra producendo le onde elettromagnetiche, così
come l'aria vibrando produce le onde sonore. La luce ha velocità c se riferita a un sistema
di riferimento a riposo rispetto all'etere.
Se però ci muoviamo rispetto all'etere con velocità ~v , la luce non dovrebbe più propa-
garsi con velocità ~c, ma con velocità ~c + ~v , cioè la velocità della luce non è più la stessa in
tutte le direzioni. Ciò implica che le leggi di Maxwell sono valide solo per un sistema di
riferimento a riposo rispetto all'etere, che viene detto sistema di riferimento assoluto.
L'elettromagnetismo ci permetterebbe pertanto di vericare lo stato di quiete o di moto
assoluto di un sistema.
Alla ne del XIX secolo Michelson riuscì a misurare la velocità della luce con una
precisione tale da dover decidere se il suo sistema (la Terra) era in quiete o in moto rispetto
all'etere.
Nel giro di 6 mesi la Terra, che gira attorno al Sole a 30 Km/sec, cambia la sua velocità
di 60 Km/sec e quindi se a un certo istante la Terra fosse in quiete rispetto all'etere, dopo
6 mesi essa si muoverebbe rispetto all'etere di 60 Km/sec. Quindi esiste almeno un giorno
dell'anno in cui la Terra è in moto rispetto all'etere.
La discrepanza tra ~c e ~c + ~v è valutabile con uno strumento costruito da Michelson e
Morley detto interferometro. Ciò che l'interferometro misura è la dierenza di velocità
della luce secondo la direzione. Ciò che si osservò fu l'assoluta costanza di c in ogni direzione
e ad ogni epoca dell'anno. Non si poteva cioè misurare alcun vento di etere.
Per dare risposta all'interrogativo aperto dall'esperimento di Michelson e Morley, Lo-
rentz sviluppò una teoria basata sul fatto che se si considera un solido, esso è formato da
atomi, costituiti da cariche elettriche positive e negative. La forza di attrazione tra cariche
positive e negative, cioè la forza di Coulomb, rimane elettrostatica nchè le cariche sono
ferme rispetto all'etere. Quando queste si muovono compaiono fenomeni magnetici che
si espletano macroscopicamente come un accorciamento della lunghezza del solido nella
direzione del moto. Tale accorciamento era tale, secondo Lorentz, da compensare le di-
screpanze non osservate da Michelson e Morley e non era possibile rendersene conto perchè
anche i metri con cui si misurava tale lunghezza si accorciavano.
Einstein assunse invece la non isolabilità del moto assoluto come postulato e di-
mostrò che la non riuscita dell'esperimento di Michelson e Morley era dovuta a proprietà
intrinseche dello spazio.
Riassumendo, nella teoria galileiana c'è un principio di relatività del moto che viene
violato dalle leggi di propagazione della luce. Infatti, usando il teorema di addizione delle
velocità, la velocità della luce non dovrebbe essere uguale per tutti i sistemi di riferimento
e manterrebbe la sua costanza in tutte le direzioni solo per osservatori in quiete rispetto
all'etere. Se si accetta quindi il teorema di addizione delle velocità, la velocità della luce
deve essere diversa a seconda degli osservatori.
5

Se invece si vuole salvare il principio di relatività, occorre abbandonare il teorema di


addizione delle velocità nella forma galileiana. Ciò porta a una nuova legge di composizione
delle velocità per la quale la velocità della luce è c per tutti gli osservatori. Non è possibile
inseguire la luce o andarle incontro perché comunque sia la velocità della luce è sempre
c. Einstein salvò così il principio di relatività a costo di sacricare il teorema di addizione
delle velocità.
Sebbene nel 1906 una misura di velocità di elettroni sembrò porre dubbi sulla nuova
teoria di Einstein, tutte le misure successive diedero ragione a quest'ultimo e oggi gli eetti
della teoria della relatività einsteiniana sono testati giornalmente nei grandi acceleratori di
particelle.
Si noti che il cambiare il teorema della composizione delle velocità cambia tutta la
meccanica, nonché i concetti stessi di spazio e tempo. Si ha infatti che eventi simultanei
per un osservatore non lo sono più per un altro. Si consideri ad esempio un aereo che vola
da Bologna a Roma e che giunto a metà del suo percorso riceve un segnale radio dalle
due città. Per il personale di terra l'invio dei due segnali costituisce due eventi simultanei.
Per il pilota Roma si sta avvicinando e Bologna si sta allontanando dal segnale, perciò il
segnale arriva prima da Roma che da Bologna, perché si propaga sempre a velocità c. Due
eventi simultanei per il personale di terra non lo sono per il pilota. La simultaneità non
è un concetto assoluto.
Per evento si intende un qualcosa che capita in un certo punto dello spazio a un certo
istante. L'arrivo del segnale è un evento, un libro su un tavolo non è un evento, bensì una
successione di eventi succedentesi con continuità.
L'insieme di tutti gli eventi costituisce lo spazio-tempo cioè uno spazio a 4 dimensioni
di coordinate (t, x, y, z). Un punto dello spazio ordinario è una curva nello spazio-tempo
che sarà chiamata linea di mondo del punto materiale.
Anche le unità di misura cambiano da un sistema di riferimento ad un altro in moto
rispetto al primo. Le sbarre si contraggono nella direzione del moto, gli orologi battono
il secondo più lentamente. Conseguentemente anche le leggi della dinamica subiscono
delle modiche, che hanno come conseguenza una nuova visione della meccanica. I campi
elettromagnetici possono essere inseriti in tale quadro in maniera molto elegante.
6
Capitolo 1
Meccanica newtoniana e relatività
galileiana

1.1 Equazioni del moto

Il mondo newtoniano è da intendersi costituito da punti materiali, ciascuno individuato da


i
x ∈ R3 e da un parametro m
3 coordinate x , i = 1, 2, 3 che possiamo riunire in un vettore ~
detto massa.
Si denisce velocità la derivata
d~x
~v =
dt
e accelerazione la derivata seconda
d2~x
~a =
dt2
La legge newtoniana del moto
F~ = m~a
è da interpretarsi come sistema di equazioni dierenziali per le traiettorie ~xn (t) dei punti
materiali n = 1, ..., N soggetti al campo vettoriale di forze F~ (~x, ~v , t)

d2~xn
 
~ d~x1 d~xN
mn 2 = F ~x1 , ..., ~xN , , ..., ,t
dt dt dt

Abbiamo così un sistema di equazioni dierenziali ordinarie del secondo ordine che dà il
moto dei punti materiali.

1.2 Sistemi di riferimento e osservatori

Le coordinate ~x ≡ (x1 , x2 , x3 ) di un punto materiale sono date rispetto a un sistema di


riferimento (per es. assi cartesiani). Cosa succede alle leggi del moto se si cambia sistema
di riferimento?

7
8 CAPITOLO 1. MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA

Qual è il sistema di riferimento (o i sistemi di riferimento) rispetto al quale le leggi del


moto sono valide?
Deniamo il concetto di osservatore: si dice osservatore O un sistema di riferimento
con un pressato origine di assi coordinati (normalmente cartesiani, ma potremmo anche
pensare ad altre coordinate: polari, ecc...) dotato di regoli per la misura di distanze (quindi
1 2 3
in grado di assegnare coordinate x , x , x ai punti materiali) e di un orologio (quindi in
grado di misurare il tempo t).
Deniamo anche il concetto di evento: si tratta di una entità denita da 4 coordinate:
le 3 usuali coordinate spaziali identicanti un punto materiale e una coordinata temporale
che ne ssa l'istante. Un evento è cioè un punto ~ x dello spazio R3 considerato a un certo
tempo t.
Osservatori diversi O, O0 , ... attribuiscono ad un evento delle coordinate (t, ~x), (t0 , ~x0 )
ecc... diverse l'uno dall'altro. Vogliamo correlare queste descrizioni dierenti per ottenere
un'unica teoria invariante, cioè valida per tutti gli osservatori.

1.3 Trasformazioni di Galileo

Un primo cambiamento possibile è il seguente

t0 = t + τ
~x0 = ~x + ξ~

Questo cambiamento di coordiante è detto traslazione. Il vettore ξ implementa una


traslazione spaziale, mentre il parametro τ descrive una dierenza nell'inizio del computo
dei tempi per i due osservatori, lasciando per altro l'asse dei tempi del tutto identico sotto
ogni altro aspetto per i due osservatori. Le traslazioni perciò dipendono da quattro costanti
(3 nel vettore ξ~, una in τ) non dipendenti dal punto.
Un altra trasformazione è la seguente

t0 = t
~x0 = O~x

in cui O è una matrice 3×3 ortogonale, cioè OOT = 1. Tali trasformazioni, come
ben noto, lasciano invariata la lunghezza di un vettore e sono chiamate rotazioni. Ogni
matrice ortogonale a 3 dimensioni ha 3 parametri indipendenti, che possono essere pensati
per esempio come i 3 angoli di Eulero, e che descrivono completamente la rotazione.
Il tipo di cambiamento di coordiante caratterizzante da un punto di vista sico è però

t0 = t
~x0 = ~x + ~v t

cioè la trasformazione tra due osservatori in moto relativo uniforme con velocità ~v .
Si noti che abbiamo inserito in queste trasformazioni ben 10 parametri:
1.4. TEOREMA DI ADDIZIONE DELLE VELOCITÀ 9

1. 1 relativo alla traslazione dell'origine dei tempi

2. 3 relativi alle traslazioni spaziali

3. 3 relativi alle rotazioni

4. 3 della velocità ~v di moto relativo dei sistemi di riferimento

La più generica trasformazione di Galileo si ha operando contemporaneamente tutte e tre


queste trasformazioni. L'insieme di tutte le trasformazioni di Galileo forma gruppo e si
chiama gruppo di Galileo. La meccanica newtoniana è invariante sotto il gruppo di
Galileo.

1.4 Teorema di addizione delle velocità

Supponiamo di fare due successive trasformazioni di Galileo A : O → O0 e B : O0 → O00

~x0 = ~x + ~vA t
~x00 = ~x0 + ~vB t

eliminando la ~x0 otteniamo

~x00 = ~x + (~vA + ~vB )t


che deve essere identica alla trasformazione diretta C : O → O00

~x00 = ~x + ~vC t

e quindi abbiamo il teorema di addizione delle velocità

~vC = ~vA + ~vB

che è in un certo senso la legge di composizione del Gruppo di Galileo. Nelle trasformazioni
di Galileo le velocità si sommano, come è accettabile anche dall'esperienza intuitiva.
Sappiamo che la luce ha velocità c nei sistemi di riferimento in cui valgono le equazioni di
Maxwell. Se vale il teorema di addizione delle velocità galileiano, allora le leggi di Maxwell
non sono più invarianti per trasformazioni di Galileo. Se viceversa le equazioni di Maxwell
sono valide in tutti i sistemi di riferimento inerziali, non vale più il teorema di addizione
delle velocità, cioè le trasformazioni tra sistemi inerziali non possono più essere quelle di
Galileo. Einstein scelse questa seconda ipotesi, cioè impose che c è un invariante e che le
equazioni di Maxwell devono valere in tutti i sistemi di riferimento inerziali, restaurando
il prinicipio di relatività ma rinunciando alle trasformazioni galileiane.
10 CAPITOLO 1. MECCANICA NEWTONIANA E RELATIVITÀ GALILEIANA

1.5 Invarianza delle leggi della natura

Nella Fisica di Newton e Galileo, un qualunque corpo in moto con velocità ~ u rispetto
0 0
all'osservatore O avrà velocità ~
u = ~u + ~v rispetto all'osservatore O in moto rettilineo
uniforme con velocità ~v rispetto al primo. Ciò si ottiene dalla denizione di velocità come
derivata della coordinata. Poichè ~v è costante, la derivata seconda, cioè l'accelerazione, è
invariante
~a0 = ~a
e, assumendo che la massa m di un corpo sia una proprietà invariante per sistemi di
riferimento, si ha che il primo membro delle leggi del moto è invariante di Galileo.
Se il secondo membro sia invariante o meno dipende dalla forma delle forze.

Gravitazione newtoniana tra due corpi 1 e 2

Gm1 m2 ~
F~12 = − k12
|~r12 |2

ove ~k12 =~
r12
r12 = ~x1 − ~x2 dipende solo dalla distanza dei due corpi che è un
e ~
|~
r12 |
invariante per traslazioni e rotazioni, e anche per boosts a velocità costante. Perciò
la gravità newtoniana è invariante di Galileo.

Forze elettrostatiche la legge di Coulomb è pure invariante sotto trasformazioni di Ga-


lileo se si ipotizza che la carica elettrica è una proprietà dei corpi invariante di
Galileo.

In generale ogni forza dipendente solo dalle distanze è invariante per trasformazioni di
Galileo e quindi rende invarianti le equazioni newtoniane del moto. Tuttavia in natura sono
note forze che dipendono non solo dalle posizioni ma anche dalle velocità, come capita nelle
leggi di Maxwell per l'elettromagnetismo. Come abbiamo visto, è proprio sull'invarianza
delle leggi di Maxwell che la relatività galileiana entra in crisi.
Capitolo 2
Cinematica relativistica

2.1 Principi fondamentali

La meccanica relativistica si basa su due principi fondamentali:

Principio di inerzia Esiste almeno un sistema di riferimento inerziale in cui un corpo


in quiete o in moto rettilineo uniforme perdura nel suo stato di quiete o di moto
rettilineo uniforme se non è soggetto a forze esterne

Si noti che se esiste un sistema di riferimento inerziale, ne esistono automaticamente inniti:


tutti quelli in moto rettilineo uniforme rispetto al primo.

Principio di Relatività ristretta Le leggi della sica sono le stesse (cioè hanno la stessa
forma) in tutti i sistemi di riferimento inerziali.

Dalle leggi di Maxwell si deduce che la velocità di propagazione delle onde elettromagnetiche
è c. Poichè le leggi di Maxwell sono leggi universali della natura, ne si conclude che la
velocità della luce c deve essere la stessa in tutti i sistemi di riferimento inerziali. Non
esiste un etere o un sistema di riferimento assoluto.

2.2 Unità di misura naturali

Poiché la velocità della luce deve essere uguale in tutti i sistemi di riferimento, viene
naturale in relatività porla uguale a 1 e misurare tutte le altre velocità come frazioni della
velocità della luce. Ciò corrisponde a introdurre nuove unità di misura, più convenienti
per il tipo di problemi che andiamo a trattare, in cui i tempi e le lunghezze hanno la stessa
unità di misura. Per esempio possiamo adottare il metro come unità di misura sia dello
spazio che del tempo. Un metro di tempo corrisponde al tempo che impiega la luce a
1
percorrere un metro, cioè a secondi, ovvero circa 1/3 di nanosecondo. Conseguentemente,
c
tutte le velocità sono misurate da numeri puri. Quando diremo che un corpo ha velocità
2/3, intenderemo che si muove a una velocità pari a 2/3 della velocità della luce.

11
12 CAPITOLO 2. CINEMATICA RELATIVISTICA

−1
Le accelerazioni saranno misurate in m , le masse continuano ad essere misurate in Kg,
ma gli impulsi e le energie saranno pure misurati in Kg e le forze in Kg/m. Le formule si
esprimono senza la ridondanza di fattori c, il che le rende più immediatamente signicanti
dal punto di vista sico, ma per calcolare le grandezze nel tradizionale sistema metrico
internazionale m, Kg, sec occorrerà tener conto dei fattori di conversione tra le unità di
misura dei due sistemi.
Alternativamente, si può scegliere il secondo come unità fondamentale. Allora le distan-
ze saranno misurate in secondi-luce, cioè l'unità di misura delle lunghezze sarà la distanza
percorsa dalla luce in un secondo, ovvero 300.000 Km circa. Una versione di questo siste-
ma di misura più adatta alle distanze astronomiche è quella degli anni per i tempi e gli
anni-luce per le distanze.

2.3 Trasformazioni di Lorentz

0
Consideriamo due sistemi di riferimento inerziali O e O , rispettivamente con coordinate
x = (t, x, y, z) e x0 = (t0 , x0 , y 0 , z 0 ).1 La critica alla simultaneità implica che t 6= t0 , cioè che
anche i tempi partecipano alle leggi di trasformazione tra sistemi di riferimento inerziali.
0
Cerchiamo delle trasformazioni x (x) che lascino invariante la velocità della luce.
Le traslazioni e le rotazioni saranno uguali a quelle delle trasformazioni di Galileo,
poichè mantengono invariante la lunghezza dei vettori (e perciò c in particolare).
Una ovvia richiesta è che un corpo in moto rettilineo uniforme in O deve vedersi con
moto rettilineo uniforme anche in O0 , altrimenti sarebbe violato il principio di inerzia,
ovvero
d~x d~x0
~v = = cost. in O ⇔ ~v 0 = = cost. in O0
dt dt0
Per esempio sull'asse x:
∂x0 dx 0 dy ∂x0 dz ∂x0
dx0 dx0 dt ∂x dt
+ ∂x
∂y dt
+ ∂z dt
+ ∂t
vx0 = 0 = = ∂t0 dx 0 dy ∂t0 dz ∂t0
dt dt dt0 ∂x dt
+ ∂t
∂y dt
+ ∂z dt
+ ∂t

dx
Ora, le derivate
dt
= vx ecc... sono costanti per ipotesi. Perciò l'unico modo di garantire
0 ∂x0
che vx sia costante è di richiedere che le derivate parziali ecc... siano anch'esse costanti.
∂x
0
Ma ciò implica che le funzioni x (x) siano funzioni lineari, cioè

x0 = Ax

dove A è una matrice 4×4 a elementi reali. Determiniamo gli elementi Aij ponendoci
in una situazione sica che a prima vista può apparire semplicata, ma che in realtà non

1 Nel seguito indicheremo sempre i vettori tridimensionali in R3 con la notazione ~x = (x1 , x2 , x3 ), le


i
cui componenti saranno indicate con indici latini x con i = 1, 2, 3. Riserveremo invece la notazione x a
vettori 4-dimensionali nello spazio-tempo. Dovendo enumerare le componenti di tali 4-vettori converremo
di indicarle con indici greci xµ che corrono su 0,1,2,3 in cui 1,2,3 sono le coordinate spaziali e 0 quella
temporale del 4-vettore. Useremo perciò le notazioni: x = (x0 , x1 , x2 , x3 ) = (x0 , ~x)
2.3. TRASFORMAZIONI DI LORENTZ 13

perde di generalità. Usando traslazioni e rotazioni, possiamo infatti sempre metterci nella
situazione in cui il moto rettilineo uniforme relativo tra i due sistemi inerziali sia diretto
0
lungo l'asse x e stabilire l'origine dei tempi in modo tale che al tempo t = t = 0 le origini
0
e tutti gli assi dei due sistemi cartesiani coincidano. In istanti successivi, il sistema O ,
visto da O scorre lungo l'asse x a velocità costante v, mantenendo inalterata la direzione
degli assi y, z .
Se tutto l'asse x deve coincidere, al tempo t = t0 = 0 con l'asse x0 , ciò signica che ogni
0
punto con coordinata y = 0 e z = 0 al tempo t = t = 0 deve avere forzatamente anche
0 0
nell'altro sistema y = 0 e z = 0. Ciò implica

A21 = A31 = 0
Lo stesso ragionamento applicato agli assi y e z comporta anche

A12 = A32 = A13 = A23 = 0


Perciò le trasformazioni si riducono a

t0 = A00 t + A01 x + A02 y + A03 z


x0 = A10 t + A11 x
y0 = A20 t + A22 y
z0 = A30 t + A33 z
L'origine O di O appare ad O0 muoversi di moto rettilineo uniforme lungo l'asse x0 , cioè
ha le equazioni del moto

x0 = A10 t y 0 = A20 t = 0 z 0 = A30 t = 0


e quindi
A20 = A30 = 0
Invertendo le trasformazioni si ha
 
A11 0 A02 0 A03 0 A01 0
t = t − y − z − x
∆ A22 A33 ∆
 
A00 0 A01 0 A02 0 A03 0
x = x − t − y − z
∆ ∆ A22 A33
y = (A22 )−1 y 0
z = (A33 )−1 z 0
in cui ∆ = A00 A11 − A10 A01 . Questa sono le trasformazioni inverse da O0 a O. Tuttavia
queste devono ovviamente essere identiche in forma a quelle dirette scritte sopra con il
0 0
solo cambio v → −v . Perciò, nota l'assenza di y e z nelle trasformazioni di x e t dirette,
0 0
dovremo richiedere simmetricamente una assenza di y e z dalle trasformazioni di x e t
inverse. Ciò conduce a
A02 = A03 = 0
14 CAPITOLO 2. CINEMATICA RELATIVISTICA

Pertanto le trasformazioni si semplicano nelle seguenti

t0 = A00 t + A01 x
x0 = A10 t + A11 x
y0 = A22 y
z0 = A33 z

Finora abbiamo solo messo in opera considerazioni geometriche. Ma ora imponiamo che
un fotone di luce che viaggia a velocità c = 1 in O , sia visto viaggiare alla stessa velocità
c anche in O0 . Il fotone viaggerà in linea retta e perciò le sue equazioni del moto saranno

x = n1 t y = n2 t z = n3 t

in cui ni sono le componenti di un versore indicante la direzione del moto: n21 + n22 + n23 =
2
c = 1. Al tempo t + dt il fotone avrà incrementato la sua posizione di

dx = n1 dt dy = n2 dt dz = n3 dt

Ne consegue che la quantità

dt2 − dx2 − dy 2 − dz 2 = 0 . (2.1)

Ragionando allo stesso modo nel sistema O0 si avrà

dt02 − dx02 − dy 02 − dz 02 = 0 (2.2)

La versione innitesima delle trasformazioni ci permette di sostituire nella (2.2) i dieren-


0 0
ziali dx , dy , ... con gli analoghi dx, dy, ... ottenendo

(A00 dt + A01 dx)2 − (A10 dt + A11 dx)2 − A222 dy 2 − A233 dz 2 = 0

Questa espressione deve essere proporzionale alla (2.1) poichè entrambe devono annullarsi.
In particoalre i coecienti dei termini in dt dx che sono assenti dalla (2.1) devono annullarsi,
2
mentre gli altri devono essere uguagliati a meno di una quantità per ora arbitraria Q

A00 A01 − A10 A11 = 0 (2.3)

A211 − A201 = A222 = A233 = A210 − A200 = Q2 (2.4)

La quantità arbitraria è indicata con Q2 in quanto, essendo tutti i coecienti Aij reali, è
sicuramente positiva. La scelta della soluzione

A22 = A33 = Q

piuttosto che −Q, garantisce che nella trasformazione non ci sia un'inversione degli assi y
e z (vedremo più avanti come sono trattate queste trasformazioni particolari). L'origine
2.3. TRASFORMAZIONI DI LORENTZ 15

degli assi O di O ha x = 0, perciò a un generico tempo t la trasformazione per questo


particolare punto è

x0 = A10 t (2.5)

Questo punto O è visto da O0 0


procedere lungo l'asse x con velocità −v , quindi O gli
0
0 0 0
attribuisce l'equazione del moto x = −vt . Sostituendo t con t nella (2.5), ottenendo
0 A10 0
x = A00 t si legano i parametri Aij alla velocità relativa dei due sistemi, che deve essere
l'unico parametro sico delle trasformazioni

A10 = −vA00

e dalla (2.3) segue

−vA11 = A01
Usando la (2.4) si ottiene

A211 1 − v 2 = A200 1 − v 2 = Q2
 

da cui
Q
A11 = A00 = √
1 − v2
Come già commentato per A22 e A33 anche qui scegliamo la soluzione positiva per Q.
Questa scelta è qui ancora più giusticata dal fatto che se fosse A00 < 0 crescendo t
diminuirebbe t0 , cioè i due sistemi di riferimento avrebbero assi dei tempi rivolti in direzione
opposta, con nefaste conseguenze sulla causalità, ecc...
Le trasformazioni di Lorentz diventano perciò con questa scelta

t − vx √
t0 = Q √ L = −m 1 − v 2
1 − v2
x − vt
x0 = Q √ (2.6)
1 − v2
y 0 = Qy
z 0 = Qz

A questo punto possiamo scrivere le traformazioni inverse, ricavandole dalla (2.6)

t0 + vx0
t = Q−1 √
1 − v2
x + vt0
0
x = Q−1 √ (2.7)
1 − v2
y = Q−1 y 0
z = Q−1 z 0
16 CAPITOLO 2. CINEMATICA RELATIVISTICA

oppure come trasformazioni con v → −v

t0 + vx0
t = Q√
1 − v2
x0 + vt0
x = Q√ (2.8)
1 − v2
y = Qy 0
z = Qz 0

Dal confronto della (2.7) e della (2.8) risulta evidente che la costante Q > 0 deve soddisfare
Q = Q−1 , da cui Q = 1. Perciò in conclusione le trasformazioni di Lorentz sono

t − vx
t0 = √
1 − v2
x − vt
x0 = √ (2.9)
1 − v2
0
y = y
z0 = z

Spesso si introduce la notazione

1
γ=√
1 − v2
che semplica la forma delle trasformazioni di Lorentz

t0 = γ(t − vx)
x0 = γ(x − vt) (2.10)

y0 = y
z0 = z

La funzione γ(v), spesso detta fattore γ relativistico di una trasformazione di Lorentz è

tale che

γ(v = 0) = 1
γ(v → 1) → ∞

e per velocità piccole (non relativistiche) ha lo sviluppo di Taylor

1
γ(v) ≈ 1 + v 2 + ...
2
2.4. TRASFORMAZIONI DELLE VELOCITÀ 17

2.4 Trasformazioni delle velocità

Supponiamo di avere un oggetto che viaggia con velocità ~ u = (ux , uy , uz ) nel sistema di
0
riferimento O . A quale velocità sarà visto viaggiare in O in moto rispetto a O a velocità
v lungo l'asse x? Ovviamente, come abbiamo visto, non può valere un teorema di pure
addizioni delle velocità, come avveniva con le trasformazioni di Galileo, in quanto sarebbe
in contraddizione con l'invarianza della velocità della luce. Per dedurre la trasformazione
delle velocità scriviamo le trasformazioni di Lorentz in forma innitesima

dt0 = γ(dt − v dx)


dx0 = γ(dx − v dt)
dy 0 = dy
dz 0 = dz
da cui

dx0 γ(dx − v dt) ux − v


u0x = 0
= =
dt γ(dt − v dx) 1 − ux v
0
dy dy uy
u0y = 0
= =
dt γ(dt − v dx) γ(1 − ux v)
0
dz dz uz
u0z = 0
= =
dt γ(dt − v dx) γ(1 − ux v)
Questa è la formula relativistica di addizione delle velocità. Si noti come la modica
rispetto alla pura addizione di Galileo si produca a causa del fatto che anche i tempi dt
sono diversi nei due sistemi di riferimento. Ciò comporta leggi di trasformazione non banali
anche per le uy , uz sebbene le coordinate y, z non subiscano variazioni. Inoltre, limitandoci
all'asse x, se O vede un raggio di luce muoversi a velocità c = 1, O0 misurerà una velocità
1+v
c0 = =1
1+v
18 CAPITOLO 2. CINEMATICA RELATIVISTICA

cioè queste formule confermano l'invarianza della velocità della luce. Se un corpo si muove
1 0 1
a velocità ux = rispetto a O , e O si muove rispetto ad O a velocità v = , esso non sarà
2 2
0
visto da O muoversi a velocità 1, come erroneamente si potrebbe concludere applicando
trasformazioni di Galileo, bensì a velocità

1
+ 12 4
u0x = 2
1 1 =
1+ 2 · 2 5

cioè a una velocità comunque inferiore a quella della luce.

Per velocità relative tra i sitemi di riferimento piccole rispetto a quella della luce (v  1)
le formule si riducono a quelle galileiane, come si può vedere facilmente espandendo le
formule di trasformazione delle velocità per v → 0. Ciò spiega perché nell'esperienza
comune l'addizione galileiana di velocità è assolutamente accettabile.

Per esempio se due automobili si incrociano sull'autostrada a velocità ciascuna di 30


m/sec (circa 100 Km/h), ognuno dei due autisti dovrebbe giudicare, galileianamente, che
l'altra auto gli viene incontro a 60 m/sec. Se invece applichiamo le formule relativistiche,
−7
tenendo conto che in unità c = 1 la velocità di 30 m/sec è pari a circa 10 , avremo

2 · 10−7
u0x = −14
= 2 · 10−7 (1 − 4 · 10−14 )
1 + 4 · 10

ovvero la correzione è di 14 ordini di grandezza inferiore alla velocità stessa, assolutamente


trascurabile.

Se invece si incontrassero due astronavi vaiggianti ciascuna a velocità 0.99, cioè vicinis-
sime alla velocità della luce, avremmo

0.99 + 0.99 1.98


u0x = 2
= = 0.9995 < 1
1 + 0.99 1.981

comunque inferiore alla velocità della luce.

2.5 Diagrammi spazio-temporali

Un modo utile per visualizzare la geometria dello spazio-tempo come emerge dalle trasfor-
mazioni di Lorentz è quello di ricorrere ai cosiddetti diagrammi spazio-temporali. Iniziamo
con il semplicare il nostro problema pensando allo spazio come a una retta unidimensio-
nale. Allora lo spazio-tempo sarà rappresentato da un piano bidimensionale con coordinate
(x, t).
2.5. DIAGRAMMI SPAZIO-TEMPORALI 19

Le bisettrici x = ±t di questo graco rappresentano le linee lungo cui si propagano


raggi di luce passanti per il qui e ora cioè l'origine degli assi x = t = 0. Una particella
lanciata dall'origine in moto rettilineo uniforme x = vt sarà rappresentata da una retta di
inclinazione tan ϕ = 1/v , come la linea verde in gura. Questa rappresentazione della sua
traiettoria nello spazio-tempo viene detta linea di mondo. Una particella in moto non
uniforme potrà percorrere linee di mondo curve più complicate, come per esempio la linea
blu, la cui tangente punto per punto avrà inclinazione pari a 1/v in quell'istante. Tuttavia
se la particella si mantiene sempre a velocità minore di quella della luce v < 1, la sua

inclinazione dovrà essere sempre maggiore di 45 su questo graco. Linee con inclinazioni

minori di 45 corrispondono a ipotetici corpi viaggianti a velocità maggiori di c (tachioni).
Vedremo tra breve che tali oggetti non possono esistere, pena la violazione dell'ordinamento
causale degli eventi.
Nel sistema di riferimento qui disegnato, che chiameremo O, x e t sono visibil-
gli assi
mente ortogonali. Le linee di eventi giudicati simultanei dall'osservatore O sono ovviamente
rette parallele all'asse x, cioè aventi equazione t = cost. Analogamente corpi fermi rispetto
ad O saranno rappresentati da linee di mondo parallele all'asse t, cioè da rette di equazione
x = cost.
Ci possiamo ora chiedere come possano essere rappresentati su questo diagramma gli
O0 in moto rispetto ad O a velocità v . Le
assi di un nuovo sistema di riferimento inerziale
trasformazioni di Lorentz ci dicono che

x0 = γ(x − vt) t0 = γ(t − vx)

Perciò l'asse delle x0 , ovvero la retta di equazione t0 = 0, sarà dato sul nostro piano (x, t)
0 0
dalla retta t = vx e l'asse dei tempi t , ovvero la retta di equazione x = 0, sarà dato
1 0
dalla retta t = x. L'osservatore O giudica eventi simultanei quelli che giacciono su rette
v
t0 = cost., cioè t = vx + cost.
γ
. Prendiamo per esempio il luogo geometrico degli eventi che O

giudica simultanei e vericantesi dopo 1 metro (ricordiamo che stiamo misurando il tempo
0
in metri!) dal qui ed ora. Questi saranno sulla retta t = 1. Ma per O gli eventi simultanei
0 1
dopo 1 metro saranno t = 1, cioè t = vx + . Non solo la retta degli eventi simultanei
γ
20 CAPITOLO 2. CINEMATICA RELATIVISTICA

per O0 è inclinata rispetto a quella di O, ma anche l'unità di misura del tempo ne risulta
modicata di una quantità 1/γ , come vedremo meglio più avanti.

La cosa più sorprendente è che apparentemente il sistema di riferimento O0 non sembra



più ortogonale. L'angolo tra gli assi non è uguale a 90 !. Tuttavia questa non ortogonalità
è solo apparente. Infatti ciò che determina l'ortogonalità non è l'angolo tra gli assi, ma
l'annullarsi del prodotto scalare tra i vettori della base. Ora, il teorema che aerma che

~x · ~y = |~x||~y | cos ϑxy


ove ϑxy è l'angolo compreso tra i due vettori, è vero solo in geometria euclidea. Cominciamo
a capire che la geometria dello spazio-tempo non è di tipo strettamente euclideo.
In geometria euclidea la distanza ta due punti, per esempio tra l'origine e un punto P
2 2 2
di coordinate (x, y) è data da s = x + y , come ben nota conseguenza del Teorema di
Pitagora. La cosa importante è che, mentre un cambiamento di base nello spazio euclideo
può far variare le coordinate del punto P, la sua distanza dall'origine rimane invariata.
Passando infatti da una base ortogonale a un'altra, la trasformazione che opero è, nel caso
2
euclideo, una rotazione. Ora, qualunque rotazione lascia invariata la quantità s . Si dice
infatti in geometria che le rotazioni sono isometrie, ovvero trasformazioni di coordinate
che lasciano invariata la distanza tra punti. Le traslazioni e le rotazioni nello spazio euclideo
sono isometrie.
Vediamo se anche nel nostro spazio-tempo vale una simile relazione, cioè se la distanza
2 2 2
spazio-temporale tra due eventi si può scrivere come σ = x + t . Se così fosse, dovrei
trovare che questa quantità è invariante per le trasformazioni che richiedo essere isometrie
del mio spazio-tempo. Ciò che deve restare invariante per cambiamenti di coordinate nello
spazio-tempo è la velocità della luce, che abbiamo visto condurre alle trasformazioni di
Lorentz. Perciò le nostre isometrie sono le trasformazioni di Lorentz. Se applico tali
2
trasformazioni alla quantità σ sopra denita, mi accorgo subito che essa non è invariante:
02
σ 6= σ . Invece lo è la quantità τ 2 = t2 − x2 . Infatti
2

τ 02 = t02 − x02 = γ 2 [(t − vx)2 − (x − vt)2 ] = γ 2 (1 − v 2 )(t2 − x2 ) = τ 2


2.6. PRODOTTO SCALARE IN MN 21

Dunque la geometria è drasticamente diversa nello spazio-tempo rispetto allo spazio


3
normale. Mentre il nostro spazio può essere assimilato allo spazio euclideo R , lo spazio-
4 4
tempo non è banalmente un R , o più precisamente, è isomorfo a R come spazio vettoriale,
4
ma non come spazio metrico. Chiameremo questo spazio M , la lettera M essendo scelta
in onore del matematico Minkowski che, negli anni immediatamente seguenti al 1905,
formalizzò questo tipo di spazi proprio pensando all'applicazione in relatività stimolata
da Einstein. Dunque nello spazio-tempo di Minkowski non vale il teorema di Pitagora
tradizionale, ma piuttosto un teorema di Pitagora alla rovescia con il segno meno e dove
l'ipotenusa è sempre minore di uno dei due cateti!

2.6 Prodotto scalare in MN


È chiaro che in una simile situazione geometrica anche il prodotto scalare va rivisto. Infatti
la distanza di un punto dall'origine può essere pensata come la norma del vettore che
2
identica quel punto. Tornando al nostro esempio bidimensionale, in R tale norma è data
2 2 2
da |~
x| = x + y = ~x · ~x e risulta, per quanto detto, essere un invariante per trasformazioni
2
isometriche. Invece in M , ove un punto, o meglio un evento, è identicato dal vettore
x = (t, x) la norma invariante sarà |x|2 = x · x = t2 − x2 . Vediamo subito che il prodotto
2
scalare è denito in modo diverso. In R esso era denito come

~a · ~b = a1 b1 + a2 b2
ma ciò porterebbe alla denizione di distanza s2 che non va bene in Minkowski. Qui
dobbiamo assumere un prodotto scalare denito come

a · b = a0 b0 − a1 b1
ove abbiamo indicato con l'indice 0 la coordinata temporale e con 1 quella spaziale dei
nostri vettori. In questo modo la norma di un vettore e il prodotto scalare stesso risulta
essere invariante di Lorentz.
Tornando al caso 4-dimensionale sico, il prodotto scalare in M4 sarà dato da

a · b = a0 b 0 − a1 b 1 − a2 b 2 − a3 b 3
Pensando al prodotto scalare come moltiplicazione riga per colonna di vettori, mentre nel
3
caso euclideo R si ha immediatamente
 
b1 X3
(a1 , a2 , a3 )  b2  = ai bi
b3 i=1

nel caso minkowskiano occorre inserire una opportuna matrice


  
1 0 0 0 b0
3
 0 −1 0 0   b1  X
(a0 , a1 , a2 , a3 )  
 0 0 −1 0   b2
=
 aµ ηµν bν
µ,ν=0
0 0 0 −1 b3
22 CAPITOLO 2. CINEMATICA RELATIVISTICA

Useremo in generale indici latini quando ci riferiremo a spazi euclidei e indici greci per
spazi di tipo Minkowski. Gli spazi minkowskiani talvolta vengono anche detti spazi pseudo-
euclidei.
La matrice η di elementi ηµν viene detta metrica dello spazio M4 . La metrica di RN
sarebbe invece banalmente la matrice identità a N dimesioni 1N . Talvolta la notazione
dei 4-vettori ora introdotta viene abbreviata indicando solo due simboli nel vettore riga o
colonna: la componente temporale a0 e il 3-vettore delle componenti spaziali ~a. In questo
modo la formula per il prodotto scalare diventa

1 ~0
  
b0
(a0 , ~a) ~0 −13 ~b = a0 b0 − ~a · ~b

In M2 la metrica è semplicemente
 
1 0
η=
0 −1
Verichiamo che con tale metrica anche il sistema O0 risulta ortogonale, nonostante le
apparenze. In O i vettori della base sono
   
1 0
e0 = , e1 =
0 1
ed evidentemente il loro prodotto scalare da proprio gli elementi di η:
eµ · eν = ηµν
come facile vericare. Perciò i vettori della base sono ortogonali. Trasformiamo questi vet-
0
tori secondo Lorentz in una nuova base per O che si muove a velocità v . La trasformazione
di Lorentz si può scrivere in forma matriciale come

t0
    
1 −v t

x0 −v 1 x
perciò    
1−v 0
e00 =γ , e01 =γ
0 1−v
ed è quindi immediato vericare che anche i loro prodotti scalari vericano

e0µ · e0ν = ηµν


Dunque, anche se a prima vista gracamente diremmo che i due assi di O0 non sono
ortogonali, in realtà essi vericano le condizioni di ortogonalità come quelli di O. È il
concetto di ortogonalità che si modica nello spazio di Minkowski poiché la metrica, che
appunto determina i prodotti scalari, non è più 1 ma η.
Si noti come i vettori della base ortonormale, che in uno spazio euclideo prenderemmo
normalizzati a 1, qui sono in realtà normalizzati a ±1. Infatti |e0 |2 = 1, ma |e1 |2 = −1.
Equivalentemente, det η = −1 < 0. La metrica non è denita positiva e ciò ha come
conseguenza che possono esistere vettori a norma nulla che non sono nulli, mentre in uno
spazio euclideo questo era garantito.
2.7. CONO-LUCE, PASSATO, PRESENTE, FUTURO 23

2.7 Cono-luce, passato, presente, futuro

I vettori in MN , cioè in qualunque spazio con metrica non denita positiva, si possono
dividere come segue

1. vettori di tipo tempo, aventi |x|2 > 0


2. vettori di tipo spazio, aventi |x|2 < 0
3. vettori di tipo luce, aventi |x|2 = 0.

Questi ultimi deniscono un ipercono nello spazio M4 di equazione t2 − ~x2 = 0, detto


cono-luce. I vettori di tipo tempo si trovano all'interno di questo cono e quelli di tipo
spazio all'esterno. L'origine del cono coincide con il qui e ora O. Il cono è ovviamente
composto da due falde: una di coordinate t>0 detta cono del futuro, l'altra con t<0
detta cono del passato. In gura ne diamo una rappresentazione in M 3
.

L'asse dei tempi in gura è orientato verticalmente dal basso verso l'alto. Il vertice dei
due coni è l'evento qui e ora O. La supercie del cono superiore è il luogo geometrico
delle traiettorie di raggi di luce emessi in O. L'interno del cono superiore rappresenta gli
eventi che potrò raggiungere in futuro partendo da O e viaggiando a v < 1. (vedremo tra
breve che è impossibile viaggiare o comunicare a v > 1).
Analogamente la supercie del cono inferiore è il luogo geometrico di eventi passati che
possono aver emanato un raggio di luce che mi raggiunge qui e ora in O. Lo spazio, stelle,
galassie, ecc... che vedo (cioè sto osseervando) ora tramite segnali luminosi (o radio, IR,
4
UV, X...) è dato proprio da questa supercie conica (che in M sarebbe di dimensione 3,
3
quindi uno spazio R ). L'interno del cono inferiore è l'insieme degli eventi di partenza di
un mezzo di trasporto o un segnale viaggiante a v<1 che raggiunge O qui e ora.
24 CAPITOLO 2. CINEMATICA RELATIVISTICA

Risulta perciò evidente che l'evento O può essere inuenzato causalmente solo dagli
eventi appartenenti al cono inferiore, mentre O stesso può inuenzare causalmente solo
eventi appartenenti al cono superiore. Ciò giustica la nomenclatura di passato data al
cono inferiore e quella di futuro data al cono superiore.
La regione esterna ai due coni non presenta alcuna possibile connessione causale con O
e ad essa viene dato, forse con un certo abuso di termini, il nome di presente
. Il piano (in
4 3
M sarebbe un iperpiano R ) perpendicolare all'asse dei tempi e passante per O costituisce
l'insieme di tutti gli eventi simultanei a O nel sistema di riferimento in cui O è a riposo e
prende il nome di adesso. I concetti di presente e adesso, che abitualmente consideriamo
come equivalenti, sono distinti in relatività e tornano a coincidere solo nel limite in cui la
velocità della luce diventa innita. In tale limite i coni si allargherebbero no a coincidere
3
con il piano dell'adesso. Si noti, equivalentemente, che abbiamo identicato due spazi R in
quanto detto sopra, non coincidenti. Uno è lo spazio degli adesso, coiè denito dagli eventi
simultanei. L'altro è lo spazio visibile che comprende eventi che vedo adesso, ma capitati
nel passato. Se vedo oggi esplodere una supernova nella Grande Nube di Magellano, sto
ossevando ora un evento capitato circa 160.000 anni fa. Ciò che si trova al posto di quella
supernova ora, nel senso di simultaneamente a me adesso, mi è sconosciuto. Fa parte
degli eventi del presente, di cui non posso avere informazione. Se decido ora di mandare
una sonda per esplorare quella supernova, a velocità vicinissima a quella della luce, essa
raggiungerà la supernova tra 160.000 anni, quando la sua linea di mondo incontrerà il mio
cono del futuro.

2.8 Rapidità

Continuiamo a restringerci per semplicità allo spazio-tempo bidimensinale M2 . Un altro


modo di scrivere le trasformazioni di Lorentz fa uso delle funzioni iperboliche

eθ + e−θ eθ − e−θ
cosh θ = , sinh θ =
2 2
per le quali vale l'identità
cosh2 θ − sinh2 θ = 1
analoga a quella per funzioni trogonometriche ordinarie, ma con il segno meno, proprio ciò
che distingue l'invariante di Lorentz da un comune invariante per rotazioni. Ricordiamo
che
cosh θ = cos iθ , sinh θ = i sin iθ
e che, per denizione
sinh θ
tanh θ =
cosh θ
θ −θ
Poiché e > 0 e e > 0, allora cosh θ > 0, per tutti i θ. Invece sinh θ può essere sia positivo
che negativo (è una funzione dispari di θ , mentre cosh θ è pari). Tuttavia è sempre

| sinh θ| < | cosh θ|


2.8. RAPIDITÀ 25

fe quindi | tanh θ| < 1, per tutti i θ.

Valgono le espansioni in serie attorno a θ=0


1
sinh θ ≈ θ + θ3 + O(θ5 )
6
1
cosh θ ≈ 1 + θ2 + O(θ4 )
2
1
tanh θ ≈ θ − θ3 + O(θ5 )
3
Poniamo v = tanh θ nelle trasformazioni di Lorentz. Il parametro θ così denito prende
il nome di rapidità. Avremo

s
√ sinh2 θ 1
1 − v2 = 1− 2 = =⇒ γ = cosh θ , γv = sinh θ
cosh θ cosh θ

e quindi

t0 = t cosh θ − x sinh θ
x0 = x cosh θ − t sinh θ

ovvero
t0
    
cosh θ − sinh θ t
=
x0 − sinh θ cosh θ x
26 CAPITOLO 2. CINEMATICA RELATIVISTICA

Così scritte, le trasformate di Lorentz hanno una fortissima analogia con una rotazione di
angolo θ degli assi in un piano euclideo, dove però qui θ → iθ. Possiamo allora pensare
alle trasformazioni di Lorentz come a una sorta di speciali rotazioni (iperboliche) nello
spazio-tempo.

La legge di composizione delle velocità, in termini delle rapidità prende una forma
particolarmente interessante. Essa infatti può essere scritta come

tanh θA − tanh θAB


tanh θB =
1 − tanh θA tanh θAB

per la trasformazione da un sistema OA e uno OB viaggiante a velocità relativa vAB rispetto


a OA . Questa risulta essere proprio la formula di addizione delle tangenti iperpoliche, da
cui si deduce

θB = θA − θAB

ovvero, mentre in relatività le velocità non rispettano più una legge di somma, le rapidità
seguono un principio di addizione. Per piccole velocità

v = tanh θ ≈ θ + ...

e quindi il teorema di addizione delle rapidità equivale in questo limite al teorema di


addizione delle velocità galileiano.

2.9 Invarianza dell'ipervolume

Ritorniamo ora al diagramma dello spazio M2 di coordinate (t, x).


Un corpo che si muova alla velocità della luce viaggia lungo la prima o la seconda
bisettrice. Posso pensare di riscrivere le trasformazioni di Lorentz usando le coordinate

t ± x = ξ±

dette coordinate di cono-luce. Avrò

ξ 0± = e±θ ξ ±

2 2 2 2 + −
L'invariante di Lorentz τ = t − x è ora dato semplicemente dal prodotto τ = ξ ξ . Le
±
linee ξ = cost. sono le parallele alle bisettrici e segnano la propagazione di raggi di luce.
2.10. IPERBOLI INVARIANTI, STABILITÀ DEL CONO-LUCE 27

Se costruisco un quadrato e poi lo trasformo secondo Lorentz può succedere per esempio
+ −
che la sua ξ sia dimezzata, ma allora la sua ξ sarà contemporaneamente raddoppiata,
4
sicchè l'area rimane costante. Applicando questo ragionamento a tutto lo spazio M e
non solo al diagramma semplicato bidimensionale, possiamo aermare che l'ipervolume
Ω di una gura geometrica 4-dimensionale è un invariante di Lorentz. In particolare il
volumetto innitesimo d4 x = dt dx1 dx2 dx3 è un invariante.

2.10 Iperboli invarianti, stabilità del cono-luce

Le rotazioni del piano euclideo mantengono invariate le circonferenze e ciò perché l'equa-
zione della circonferenza si scrive

x2 + y 2 = cost.

Ciò che funge da analogo della circonferenza nello spazio-tempo di Minkowski sono le
iperboli

t2 − x2 = cost.

Esse sono iperboli equilatere aventi come asintoti le bisettrici η = cost. e ξ = cost. La
trasformazione di Lorentz non fa altro che far scorrere i punti del piano su queste iperboli
(come ad esempio per i vertici del quadrato di cui sopra) che vengono perciò dette iperboli
invarianti.
28 CAPITOLO 2. CINEMATICA RELATIVISTICA

Se allora un punto è vincolato a scorrere su queste iperboli, esso si potrà trovare o su


±
una iperbole del I-III quadrante rispetto a ξ , oppure su una del II-IV, oppure sugli assi
ξ ± . Poichè le bisettrici sono mandate in se stesse dalle trasformazioni di Lorentz, non è
possibile per un punto fuori di esse attraversarle. Esse dividono nettamente lo spazio-tempo
in 3 regioni che vengono trasformate in se stesse.
Si vede così che una trasformazione di Lorentz manda eventi del cono del futuro sem-
pre in eventi dello stesso cono del futuro. Analogamente capita con passato e presente. Si
dice che le tre regioni passato, presente e futuro sono sottoinsiemi stabili, cioè mappati
in se stessi dalle trasformazioni di Lorentz. Le trasformazioni di Lorentz hanno quindi la
piacevole caratterisitica di non cambiare la posizione di un evento: se esso, per esempio,
appartiene al futuro di O, apparterrà anche al futuro di qualunque sistema di riferimento
centrato in O e in moto relativo inerziale rispetto a quello in cui O è a riposo. Le trasforma-
zioni di Lorentz, perciò, tendono a conservare la succesione causale degli eventi e questa è
una proprietà cruciale per una struttura geometrica che voglia pretendere di rappresentare
il mondo sico.

2.11 Ordinamento causale e velocità maggiori di c.


in relatività ristretta non può esistere alcun agente sico
Dimostriamo ora che
che si propaghi a velocità maggiore di quella della luce. Le trasformazioni di
Lorentz sono valide per v < 1, poiché per v =1 il denominatore si annulla e per v >1
diventa immaginario. Si potrebbe però obbiettare che ciò non dimostra aatto che non
possano esistere velocità superiori a quella della luce. Infatti per v≥1 le trasformazioni
potrebbero essere diverse. Tuttavia ora mostreremo che ciò porta ad un assurdo, usando
solo trasformazioni di Lorentz per v < 1.
Supponiamo di avere due eventi che siano distanti ∆x nello spazio e ∆t nel tempo; siano
cioè (t1 , x1 ) le coordinate dell'evento 1 e (t2 , x2 )le coordinate dell'evento 2. ∆x = x1 − x2
e ∆t = t1 − t2 > 0, cioè l'osservatore O vede l'evento 2 avvenire prima dell'evento 1. Dalle
2.12. CONTRAZIONE DELLE LUNGHEZZE 29

trasformazioni di Lorentz abbiamo subito che per un altro osservatore O0 in moto rispetto
ad O a velocità v questi intervalli saranno

∆x0 = γ(∆x − v∆t)


∆t0 = γ(∆t − v∆x)
0
E' possibile che O veda l'evento 1 avvenire prima di 2? Perchè ciò accada deve essere
∆t0 < 0, ovvero ∆t < v∆x da cui
∆t
<v<1
∆x
Quindi tutti i sistemi che traslano rispetto al sistema O con velocità v sodisfacente a queste
diseguaglianze vedono prima 1 e poi 2. Tali v esistono se ∆t < ∆x, cioè se l'intervallo
temporale tra i due eventi per l'osservatore O è minore del tempo che impiega la luce per
andare da 2 a 1.
Supponiamo che l'evento 1 sia provocato dall'evento 2, cioè che esista una relazione di
causa-eetto tra i due eventi nella sequenza 2 → 1. E' chiaro che se trovo un osservatore
per il quale la sequenza di eventi è invertita ho violato la causalità. Se esiste tale causalità,
allora essa sarà dovuta a un agente sico propagantesi da 2 a 1. Questo agente sico si
propaga a una velocità
∆x
u=
∆t
Se u < 1 non ci sono velocità v tali da invertire la sequenza degli eventi 2 → 1, perché
∆t/∆x = 1/u > 1. Se invece supponiamo per assurdo che tale agente sico si propaghi
con una velocità u > 1, potremo sempre trovare una velocità v < 1 alla quale si mouve un
0
osservatore O per il quale la sequenza di eventi appare invertita (1 → 2) e ciò è chiaramente
impossibile in quanto violerebbe la causalità.
Se ne conclude che nessun segnale, sia esso composto da corpi dotati di massa o meno,
può propagarsi a velocità maggiore di quella della luce senza violare la causalità. La velocità
della luce rappresenta quindi un limite massimo di propagazione di qualunque informazione
nello spazio-tempo.

2.12 Contrazione delle lunghezze

Immaginiamo di avere una sbarra OA di lunghezza L ferma in O e avente un'estremità


nell'origine O e l'altra in un punto A lungo l'asse x, cioè tale che

∀t, x o = 0 xA = L

Per le trasformazioni di Lorentz, lo stesso punto avrà in un sistema inerziale O0 in moto


rispetto a O a velocità v lungo l'asse x le seguenti coordinate

x0o = −γvto t0o = γto


30 CAPITOLO 2. CINEMATICA RELATIVISTICA

e quindi x0o = −vt0o , come è logico che sia, poiché O0 vede questo punto sso nell'origine di
O allontanarsi a velocità −v . Analogamente per il punto A

x0A = γ(L − vtA ) t0A = γ(tA − vL)

La misura di lunghezza della sbarra viene eettuata da entrambi gli osservatori misurando
simultaneamente le coordinate dei punti estremi O e A e calcolandone la dierenza, cioè

per O: L = xA − xo a tempi uguali to = tA

per O0 : L0 = x0A − x0o a tempi uguali t0o = t0A


La condizione t0o = t0A si traduce in

v v
γto = γ(tA − L) ⇒ tA − to = L
c2 c2
D'altronde la dierenza x0A − x0o si trasforma come

v2
 
x0A − x0o = γ[L − v(tA − to )] = γL 1 − 2
c
da cui discende che O0 giudica che la lunghezza di una sbarra misurata da O essere di
lunghezza L sia di lunghezza
L
L0 =
γ
Poiché γ > 1, è sempre L0 < L e si ha il fenomeno noto come contrazione relativistica delle

lunghezze.

Una sbarra a 30 m/sec (velocità tipica di un auto sull'autostrada) sarebbe contratta


di una quantità dell'ordine di10−14 volte la sua lunghezza a riposo. Ma a velocità vicine
a quelle della luce la contrazione può arrivare a essere quasi totale. Si noti che questo
modo di misurare la posizione degli estremi simultaneamente non tiene conto dei ritardi
di segnale dovuti alla velocità nita della luce, e non è ad essi dovuto, ma alla particolare
natura della geometria pseudoeuclidea dell spazio-tempo.

2.13 Dilatazione dei tempi

Associata alla contrazione delle lunghezze si ha sempre anche una dilatazione dei tempi.
Supponiamo di avere un orologio fermo nell'origine degli assi di O che possiamo schematiz-
zare come una serie di eventi equidistanti (il battito dei secondi, per esempio) lungo l'asse
t. Sia la distanza tra i primi due di questi eventi T . Cioè il primo evento O si trova in
to = xo = 0 e il secondo A (l'altro estremo dell'intervallo temporale OA di lunghezza T )
in tA = T e xA = 0.
O0 vede i due eventi a tempi

t0o = 0 t0A = γtA


2.14. PARADOSSO DEI GEMELLI 31

e quindi giudica che l'intervallo temporale trascorso sia

T 0 = t0A − t0o = γtA

dunque con una dilatazione dei tempi

T 0 = γT

2.14 Paradosso dei gemelli

Supponiamo che si voglia fare un viaggio dalla Terra ad α-Centauri (distanza misurata
4
dalla Terra L = 4 anni-luce) a v = c = 240.000 Km/sec. La luce impiega 4 anni per
5
arrivare ad α-Centauri. I terrestri (sistema O ) vedono l'astronave impiegare 5 anni per
raggingere la stella.
Per questo problema conviene adottare come unità di misura aventi c=1 l'anno peer
i tempi e l'anno-luce per le misure spaziali.
Sull'astronave c'è un orologio che scandisce il tempo. Visto dagli astronauti, questo
orologio è del tutto regolare, mentre da Terra lo si vede andare più lentamente e gli stessi
astronauti invecchiano più lentamente dei loro gemelli terrestri. Per quanto visto, un
intervallo di tempo dell'astronave sarà visto da Terra dilatato di un fattore

1 5
γ=√ =
1 − v2 3

Quindi mentre sulla Terra sono passati 5 anni, sull'astronave ne sono passati 3 e quindi
gli astronauti dicono di impiegare 3 anni per fare il viaggio. Ma gli astronauti viaggiano
4
sempre alla velocità v = e dicono che il viaggio è più corto perché è più breve il percorso.
5
0 3
Infatti per la contrazione delle lunghezze per loro sarà L = L, cioè per gli astronauti
5
12
la distanza Terra α-Centauri è di = 2, 4 anni-luce. Dunque l'evento A di arrivo su
5
α-Centauri avrà coordinate

x=4 t=5 nel sistema O della Terra

x0 = 0 t0 = 3 nel sistema O0 dell'astronave

Tuttavia questo calcolo fa sorgere un apparente paradosso. La perfetta relatività dei


movimenti fa sì che gli astronauti possano assumere di essere fermi e che invece sia la Terra
4
a muoversi a v = e percio` essi vedono gli eventi terrestri svolgersi più lentamente di
5
5
un fattore di dilatazione . Allora dati due gemelli, uno dei quali rimane sulla Terra e
3
l'altro invece fa parte dell'equipaggio, il gemello terrestre vedrebbe il gemello astronauta
invecchiare meno rapidamente di lui, mentre il gemello astronauta vedrebbe quello terrestre
invecchiare meno di lui. Chi invecchia meno in realtà?
32 CAPITOLO 2. CINEMATICA RELATIVISTICA

Il paradosso si risolve rendendosi conto che due sistemi di riferimento inerziali viaggiano
necessariamente con moto rettilineo uniforme uno rispetto all'altro e che perciò nchè si
rimane in questa situazione non vi sarà modo per i due gemelli di reincontrarsi e paragonare
eettivamente le loro età. Per fare ciò, l'astronave deve invertire il suo moto e tornare verso
la Terra. Ma questo equivale a dire che deve necessariamente rallentare e passare quindi
per stati di moto accelerato per i quali non valgono più le trasformazioni di Lorentz.

Tralasciando il problema della decelerazione e poi nuova accelerazione in senso opposto


dell'astronave, immaginiamo che il gemello astronauta, una volta arrivato ad α-Centauri,
0 00
salti dal sistema di riferimento inerziale O di andata verso la stella a quello O di ritorno.
0
Eventi simultanei per il sistema di andata sono individuati da rette parallele all asse x del
00
sistema di andata, e queste rette sono ben diverse da quelle parallele all'asse x del sitema
di ritorno.

Il gemello astronauta, nell'evento A in cui arriva su α-Centuari ed è ancora solidale al


sistema di riferimento O0 , descrive gli eventi che lui giudica simultanei al suo arrivo, come
0
il luogo geometrico dato dalla retta parallela all'asse x e passante per l'evento A cioè nel
2.14. PARADOSSO DEI GEMELLI 33

sistema di coordinate di O0 dalla retta

t0 = 3

Questa viene trasformata nel sistema O della Terra nella retta di equazione
 
5 4
3= x+ t
3 5
ovvero
4 9
t= x+
5 5
9
che intercetta l'asse x=0 su cui rimane la Terra a un tempo t=
5
= 1, 8 anni. Questo è
il tempo che il gemello astronauta giudica sia passato sulla Terra durante il suo viaggio di
andata.
Ora l'astronauta inverte bruscamente la rotta, cioè salta istantaneamente su un altro
00
sistema di riferimento O in cui la retta degli eventi simultanei con A è data dalla equazione

4 41
t=− x+
5 5
che è la retta di inclinazione data dall'inverso della velocità (negativa) di ritorno che passa
0 00
per l'evento A. L'astronauta, durante il salto da O a O vede trascorrere istantaneamente
9
tutti gli eventi terrestri dal tempo
5
= 1, 8 anni al tempo 41 5
= 8, 2 anni. Cioè un intervallo
di 6,4 passa istantaneamente sulla Terra per giudizio dell'astronauta.
Ovviamente questo salto istantaneo non è sicamente possibile. La decelerazione e
successiva accelerazione deve durare un certo tempo e i tempi terrestri vengono visti scor-
rere più velocemente ma non istantanemaente per eetti di trasformazioni tra sistemi di
riferimento accelerati che tratteremo in relatività generale. Per ora basti sapere che al
suo ritorno sulla Terra il gemello astronauta sarà invecchiato in totale di 6 anni, mentre il
suo gemello terrestre sara` invecchiato di 10 anni. Questa asimmetria è dovuta proprio al
fatto che l'astronauta ha dovuto cambiare sistema di riferimento inerziale mentre il gemello
terrestre no.
Si noti che anche in questa analisi del paradosso dei gemelli non si tiene conto della
velocità di propagazione del segnale. Gli eetti di dilatazione dei tempi e contrazione delle
lunghezze sono dati esclusivamente da considerazioni sul concetto di simultaneità come
giudicato dai diversi sistemi di riferimento inerziali in gioco.
Se invece volessimo tener conto della propagazione dei segnali alla velocità c, la descri-
zione dei fenomeni sarebbe diversa. L'astronauta vedrebbe gli eventi terrestri dei primi 1,8
anni raggiungerlo molto lentamente, mentre i successivi lo raggingerebbero rapidamente
durante il viaggio di ritorno, cosicchè al momento del rientro sulla Terra l'astronauta è
aggiornato su tutti gli eventi accaduti sul pianeta nel decennio trascorso. Tuttavia egli è
conscio che ciò che vede a un certo istante sulla Terra è in realtà avvenuto tempo prima
ed è a lui arrivato tramite un segnale luminoso che ci ha messo un certo tempo, così come
quando vediamo esplodere una supernova non diciamo ora è esplosa la supernova ma,
34 CAPITOLO 2. CINEMATICA RELATIVISTICA

se questa si trova per esempio a 1000 anni-luce da noi, diciamo 1000 anni fa è esplosa
una supernova nella costellazione tal dei tali, ecc.... Attribuiamo cioè all'evento esplosione
della supernova una proprietà di simultaneità con gli eventi terrestri di 1000 anni fa, non
con quelli di oggi. È questa simultaneità che viene distorta dalle trasformazioni di Lorentz.
L'eetto non è dovuto solo al trasmettersi a velocità nita dei segnali.

2.15 Tempo proprio

Si denisce tempo proprio τ di un sistema di riferimento il tempo misurato dagli orologi


posti a riposo nel sistema di riferimento dato.
Si ponga attenzione nel distinguere il tempo proprio dal tempo coordinata. Il tempo
coordinata vuol dire semplicemente la dierenza tra la coordinata tempo di due eventi.

L'evento partenza e l'evento arrivo su α-Cen dell'astronave, nell'esempio del paragrafo


precedente, sono distanziati di 5 anni per l'osservatore terrestre O.
Tempo proprio è quello sperimentato dall'astronave per chi è sopra l'astronave. Essa,

nel sistema dell'astronave O0 è ferma. Ora, abbiamo visto che

dt02 − d~x02 = dt2 − d~x2

è un invariante per trasformazioni di Lorentz. Nel sistema dell'astronave d~x0 = 0 e dt0 è


il tempo segnato dagli orologi dell'astronave, cioè è contemporaneamente tempo proprio e
tempo coordinata dell'astronave.

dτ 2 = dt2 − d~x2
d~
x
Ma
dt
= ~v e quindi, indicando con v = |~v |

dτ = dt 1 − v 2

cioè si riottiene il tempo dilatato, cioè il tempo proprio dell'astronave è il tempo che la
Terra ha visto passare sui suoi orologi moltiplicato per per il fattore di rallentamento

1 − v 2 = γ −1 .
D'ora in poi useremo il tempo proprio come invariante spazio-temporale fondamentale

dτ 2 = dt2 − dx21 − dx22 − dx23


Capitolo 3
Calcolo tensoriale piatto

Vediamo ora di formalizzare in una veste matematica corretta le idee esposte nel capitolo
precedente. Allo scopo iniziamo con alcuni richiami sugli spazi vettoriali e gli spazi metrici,
per poi introdurre il calcolo tensoriale piatto.
Le leggi della Fisica devono essere uguali in qualsiasi sistema di riferimento inerziale,
cioè invarianti per trasformazioni di Lorentz. Per poter asserire ciò bisogna porre le leggi
siche in una forma in cui l'invarianza appaia chiaramente e ciò viene fatto tramite il
calcolo tensoriale.

3.1 Spazi vettoriali lineari reali

Uno spazio vettoriale lineare V su un corpo commutativo K è un insieme di elementi ~v


1
detti vettori nel quale siano denite

• una operazione di somma +:V×V→V che goda delle proprietà

 commutativa
~v + ~u = ~u + ~v ∀~v , ~u ∈ V
 associativa
(~v + ~u) + w
~ = ~v + (~u + w)
~ ∀~v , ~u, w
~ ∈V
 esistenza del vettore nullo

∃~0 ∈ V : ~v + ~0 = ~v ∀~v ∈ V
1 In questa sezione useremo la convenzione di indicare vettori in uno spazio vettoriale generico di di-
mensione N con il simbolo ~x. Useremo invece la notazione con lettere grassette x quando penseremo a
un vettore come a una matrice colonna. La corrispondente matrice riga sarà indicata dall'operazione di
trasposizione come xT . Le matrici quadrate saranno indicate con lettere grassette, usualmente, ma non
sempre, maiuscole A, B, ecc...
I risultati di questo capitolo si potranno applicare sia allo spazio-tempo 4-dimensionale di Minkowski,
i cui vettori sono indicati con x che allo spazio ordinario R3 i cui vettori sono indicati con ~x negli altri
capitoli.

35
36 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

 esistenza dell'opposto

∀~v ∈ V ∃(−~v ) : ~v + (−~v ) ≡ ~v − ~v = ~0

• un prodotto per scalari K×V→V che goda delle proprietà

 distributiva I
λ(~v + ~u) = λ~v + λ~u ∀λ ∈ K, ∀~v , ~u ∈ V
 distributiva II

(λ + µ)~v = λ~v + µ~v ∀λ, µ ∈ K, ∀~v ∈ V

 associativa
(λµ)~v = λ(µ~v ) ∀λ, µ ∈ K, ∀~v ∈ V
 invarianza per l'unità di K

1~v = ~v 1 ∈ K, ∀~v ∈ V

Nel seguito ci occuperemo principalmente dei casi in cui K=R nel quale V è detto spazio
vettoriale reale.
Ricordiamo qui, senza ripeterne le dimostrazioni, alcune proprietà utili degli spazi
vettoriali:

• l'unicità del vettore nullo e dell'opposto di un elemento dato

• le leggi di annullamento del prodotto per scalari

0~v = ~0 ∀~v ∈ V

λ~0 = ~0 ∀λ ∈ R

• la validità delle usuali regole algebriche di calcolo

• l'esistenza una base {~eµ ; µ = 1, ..., N } di vettori linearmente indipendenti di V tale


che ogni a ∈ V si possa esprimere come2
vettore ~

~a = aµ~eµ aµ ∈ R

Il numero intero N si dice dimensione di V e si scrive dim V = N . Le aµ sono dette


componenti del vettore ~a nella base {~eµ }.
2 Qui e nel seguito aderiamo alla convenzione di Einstein sugli indici: indici ripetuti una volta in alto e
P
una in basso si sottintendono sommati, cioè, per esempio, la notazione precedente sottintende una µ a
secondo membro. Quindi o un indice si contrae, cioè si somma con un altro indice con lo stesso nome ma
che si trova in posizione (alto o basso) opposta, oppure è libero e allora deve comparire libero e nella stessa
posizione anche nell'altro membro dell'equazione. Si noti che gli indici ripetuti sono muti e che quindi
possono essere ribattezzati a piacere.
3.1. SPAZI VETTORIALI LINEARI REALI 37

Deniamo un operatore come un ente astratto A che, applicato a un generico ~a ∈ V


produce come risultato un altro vettore d~ ∈ V, cioè A : V → V.

A~a = d~

Consideriamo operatori lineari, cioè tali che

A(λ~a + µ~b) = λA~a + µA~b

Il vettore d~ sarà esprimibile come d~ = dµ~eµ , ma anche come

d~ = A~a = A(aµ~eµ ) = aµ A~eµ = aµ Aν µ~eν

cioè

dµ = aν Aµν
in cui Aµν indica la µ-sima componente del vettore A~eν . I numeri Aµν possono essere
organizzati in una matrice
 
A1 1 . . . A1 N
. .. .
A= . .
 
. . . 
AN1 ... N
AN
Si noti che la posizione degli indici non è indierente. Il primo indice, che sia in alto o
in basso, rappresenta comunque le righe, mentre il secondo rappresenta le colonne. Ecco
µ µ µ
perchè le notazioni A ν e Aν non sono equivalenti e la notazione Aν in realtà avrebbe senso
solo per matrici simmetriche. Si può così dire che la matrice A costituisce una rappresen-
tazione matriciale dell'operatore lineare A. Come conseguenza dell'algebra operatoriale si
può immediatamente costruire l'algebra delle matrici

1. Somma: la matrice S=A+B ha componenti S µν = Aµν + B µν

2. Prodotto: la matrice P = AB ha componenti P µν = Aµρ B ρν

Un vettore ~a = aµ~eµ sarà rappresentato dalla matrice colonna

 
a1
.
a= .
 
. 
N
a

e ciò concorda con la denizione del prodotto righe per colonne

dµ = Aµν aν cioè d = Aa
38 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

3.2 Prodotto scalare, metrica

Nello spazio V deniamo un prodotto scalare, inteso come forma bilineare non degenere
con valori in R, cioè · : V × V → R avente le proprietà

~a · ~b = ~b · ~a

(λ~a + µ~b) · ~c = λ~a · ~c + µ~b · ~c


Il prodotto scalare permette di denire, per ogni vettore, una norma

|~v | = ~v · ~v

Uno spazio vettoriale dotato di prodotto scalare viene perciò detto spazio normato.
Esprimendo i vettori tramite le componenti nella base

~a · ~b = aµ bν ~eµ · ~eν = gµν aµ bν

ove si è denita la metrica


gµν = ~eµ · ~eν
La commutatività del prodotto scalare implica la simmetria della metrica gµν = gνµ .
Introduciamo anche la metrica inversa, denita dalla relazione
g µν gνρ = δρµ

dove δρµ = 1 se µ = ρ e δρµ = 0 se µ 6= ρ è il cosiddetto simbolo di Krönecker, che descrive le


componenti della matrice identità 1. Pensando a gµν come alle componenti di una matrice
g, allora la relazione denitoria di g µν si rilegge come g−1 g = 1, e ciò giustica il nome
µν
di metrica inversa per g . Il fatto che il prodotto scalare sia non degenere assicura che
det g 6= 0 e che quindi esiste l'inverso g−1 . Si noti invece che non richiederemo in generale
che il prodotto scalare sia denito positivo, il che implicherebbe che tutti gli autovalori di
g siano positivi. Qui invece possiamo permettere sia autovalori positivi che negativi, come
appunto capita nel caso della metrica dello spazio-tempo minkowskiano.
Il prodotto scalare in termini matriciali si può rappresentare come

~a · ~b = aT gb

Uno spazio normato dotato di metrica invertibile e simmetrica si dice spazio metrico.
Nella presente trattazione assumiamo che gli elementi della matrice metrica siano co-
stanti indipendenti dalle coordinate. Vedremo che in Relatività generale occorrerà genera-
lizzare questo punto a metriche dipendenti dalle coordinate, che introdurranno i cosiddetti
spazi curvi. Nella trattazione della relaitività ristretta, tuttavia, si fa uso solo di metriche
costanti e gli spazi metrici dotati di metriche costanti si dicono spazi piatti.
Possiamo poi denire i vettori della base duale di V
~eµ = g µν ~eν
3.2. PRODOTTO SCALARE, METRICA 39

che sono pure linearmente indipendenti. Pertanto un vettore si può decomporre anche nella
base duale

~a = aµ~eµ
Confrontando questa decomposizione con quella nella base originaria si legano i due diversi
tipi di componenti

aµ g µν = aν
e analogamente

aµ gµν = aν
Inoltre il prodotto scalare di due vettori si esprime come

~a · ~b = gµν aµ bν = aν bν

Da tutto ciò si comprende l'importante ruolo della metrica gµν e della sua inversa g µν
nell'alzare e abbassare gli indici. In qualunque situazione, da una quantità con un indice
in alto si potrà ottenere la sua analoga con indice in basso moltiplicando per la metrica
gµν . Viceversa un indice sarà abbassato dalla metrica inversa g µν .
Due vettori si dicono ortogonali se il loro prodotto scalare è nullo. Una base in cui tutti
i vettori siano ortogonali l'uno all'altro si dice base ortogonale. Ovviamente la metrica g
di una base ortogonale è una matrice diagonale. Poichè ogni matrice con determinante non
nullo si può diagonalizzare, e avrà come elementi diagonali i suoi autovalori, ne concludiamo
che possiamo sempre trovare una base ortogonale per uno spazio piatto.
La norma può essere riscritta in componenti, mostrando la sue relazione con la metrica

|~v |2 = gµν v µ v ν

In particolare per i vettori della base

|~eµ |2 = gµµ (qui non vale la convenzione di Einstein)

e perciò possiamo sempre ridenire nuovi vettori della base aventi norma quadrata 1:
−1/2
~eˆµ = gµµ ~eµ . In questa nuova base ortonormale
la metrica risulta necessariamente
diagonale e avente lungo la diagonale elementi gµµ = ±1. Gli spazi vettoriali reali normati
piatti si possono perciò classicare dandone le dimensioni e la quantità di +1 e −1 che
compaiono nella metrica di una loro base ortonormale. Poiché il numero totale degli
elementi diagonali di g è la dimensione, in realtà basterà indicare quanti autovalori +1
(o coordinate temporali ) e quanti −1
(o coordinate spaziali ) compaiono nella metrica.
N
Come spazi vettoriali, tutti questi spazi sono isomor a R . Tuttavia solo se tutti
gli autovalori hanno lo stesso segno, che in questo caso conviene prendere positivo, cioè
se in una base ortonormale g = 1N (dove 1N
indica la matrice identità a N dimensioni)
essi sono isomor a uno spazio euclideo. In questo caso potremo usare la notazione R
N
p,q
per identicarli. In tutti gli altri casi useremo la notazione R dove p è il numero di
40 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

coordinate spaziali e q quello di coordinate temporali3 . Gli spazi di Minkowski saranno


classicati come M
N
= RN −1,1 cioè spazi con N − 1 coordinate spaziali e 1 coordinata
temporale. Gli spazi R
p,q
con entrambi p, q 6= 0 e dim R
p,q
= p + q sono detti spazi
pseudoeuclidei. In questa notazione lo spazio-tempo sico della Relatività ristretta, che
4 3,1
nora abbaimo chiamato M , è R .
v | dipende essenzialmente dagli autovalori della metrica. In RN questi sono
Il segno di |~
2

tutti positivi, e perciò anche il determinante della metrica è positivo. La norma quadrata
sarà sempre positiva e potrà annullarsi solo per il vettore nullo. Nel caso, invece, degli
spazi pseudoeuclidei è possibile trovare un luogo geometrico di tutti i vettori che hanno
norma nulla. A questo luogo viene dato il nome di cono-luce. I vettori saranno classicati
a seconda che abbiano norma positiva, nulla o negativa in vettori di tipo tempo, di tipo
luce o di tipo spazio, come già visto.

3.3 Cambiamenti di base

Un altro importante aspetto della questione è vedere cosa succede alle aµ quando si fa un
cambiamento di base. Supponiamo di trasformare i vettori della base {~ eµ } in un nuovo
0
insieme di vettori {~
eµ } attraverso l'applicazione di una trasformazione lineare L

~e0µ = L~eµ = Λν µ~eν

Dunque la trasformazione L si può rappresentare come una matrice N × N Λ. Si può


dimostrare facilmente che i vettori {~ e0µ } sono ancora linearmente indipendenti se e solo se
det Λ 6= 0. In questo caso {~e0µ } è una nuova base di V ed esiste certamente la trasformazione
−1
inversa Λ che manda le {~e0µ } nelle {~eµ }.
Sia dato un vettore ~a e abbia componenti aµ nella vecchia base {~eµ } e a0µ nella nuova
base {~e0µ }. Sarà
~a = aµ~eµ = aµ (Λ−1 )ν µ~e0ν = a0ν ~e0ν
cioè
a0ν = (Λ−1 )ν µ aµ
Si vede come le componenti con indice in alto di ~a si trasformano con Λ−1 . Perciò sono
dette componenti controvarianti del vettore ~a.
3 Il scegliere +1 per le coordiante temporali e −1 per quelle spaziali è puramente una convenzione. Si
potrebbe benissimo scegliere, come in eetti vienefatto in molti libri di relatività, anche di attribuire il nome
di spaziali alle coordinate con metrica +1, (convenzione East-Coast) il che tra l'altro sarebbe compatibile
con la scelta nel caso euclideo. Tuttavia per altri motivi realtivi a una scrittura più elegante della teoria die
campi, molti scelgono la convenzione, cui aderiremo anche noi, di attribuire +1 alle coordinate temporali
e −1 a quelle spaziali (convenzione West-Coast). I nomi delle convenzioni derivano dal fatto che mentre
la scuola di Einstein (Princeton, ecc...) che si trova sulla costa atlantica degli USA (East-Coast) adottava
la metrica con coordinate spaziali +1, nei grandi Istituti di ricerca californiani, seguendo soprattutto
Feynman, si preferì la metrica con +1 per le coordinate temporali. Leggendo un libro di Relatività si
invita sempre a fare molta attenzione a come si sono adottate le convenzioni, poiché diverse formule
possono cambiare segno a causa di questa scelta.
3.4. ISOMETRIE 41

Ricordando che aµ = aν gµν = aν ~eµ · ~eν , avremo

a0µ = a0ν ~e0µ · ~e0ν = (Λ−1 )ν ρ aρ Λσµ Λτ ν ~eσ · ~eτ

Però (Λ−1 )ν ρ Λτ ν = δρτ e quindi

a0µ = Λσµ gσρ aρ = Λσµ aσ

Queste componenti si trasformano perciò con Λ e vengono quindi dette componenti cova-
rianti di ~a.

3.4 Isometrie

Tutte le possibili trasformazioni lineari invertibili e suriettive sui vettori di uno spazio me-
trico possono essere viste come cambiamenti di base. Tra esse, hanno particolare interesse
quelle che lasciano invariato il prodotto scalare. isometrie.
A queste si da il nome di
v , esso si trasformerà in un v' a causa
Dunque, se opero una trasformazione su un vettore ~
di una isometria L
~v 0 = L~v (3.1)

Pensando ai vettori come matrici colonna, il prodotto scalare si realizza riga per colonna
cioè occorre, tramite la metrica, denire il corrispondente vettore riga. Si noti, per quanto
detto sopra, che il vettora riga ṽ di componenti covarianti vµ è dato da

ṽ = vT g

Il prodotto scalare sarà allora


~u · ~v = ũv = uT gv
Il cambiamento di base (3.1) in termini matriciali si scrive

v0 = Λv u0T = uT ΛT

Se la trasformazione L deve lasciare invariato il prodotto scalare, si deve vericare che

u0T gv0 = uT ΛT gΛv = uT gv

da cui la condizione fondamentale che denisce l'insieme di matrici che possono rappresen-
tare una isometria
ΛT gΛ = g (3.2)

Nel caso di spazi euclidei in cui g = 1 questa si riduce alla condizione di ortogonalità
di matrici. Le isometrie degli spazi euclidei sono le rotazioni N -dimensionali che sono
realizzate appunto da matrici ortogonali

ΛT = Λ−1
42 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

Queste matrici costituiscono un gruppo sotto l'operazione di prodotto di matrici, che si


chiama gruppo ortogonale O(N ). Poichè per qualunque matrice con det A 6= 0

det AT = det A e det(A−1 ) = (det A)−1

per le matrici ortogonali si ha

(det Λ)2 = 1 ⇒ det Λ = ±1

E' chiaro che due matrici ortogonali con determinante +1 hanno prodotto ancora con
determinante +1. Le matrici con determinante +1 formano perciò un sottogruppo di O(N )
detto sottogruppo delle rotazioni proprie SO(N ). Le matrici con determinante −1 invece
non formano gruppo. Tuttavia esse possono essere tutte ottenute moltiplicando le matrici
di SO(N ) per un singolo elemento con determinante −1, per esempio la matrice −1 se N
è dispari, o la matrice diag(1, −1, ..., −1) se N è pari. Esse quindi costituiscono un laterale
del sottogruppo SO(N ) e, detto Z2 il gruppo ciclico {1, −1} si ha O(N ) = SO(N ) × Z2 .
p,q
Passiamo ora ad esaminare il caso degli spazi pseudoeuclidei R . La relazione deni-
toria del gruppo di matrici è ora la (3.2) con g = diag(1, ..p volte..., 1, −1, ...q volte..., −1).
Questo denisce un gruppo che è la generalizzazione del gruppo delle rotazioni O(N ) a spazi
con metrica più generale. Indicheremo questi gruppi con O(p, q). Il gruppo delle trasforma-
zioni di Lorentz è pertanto il gruppo O(3, 1). A questo gruppo vanno aggiunte le traslazioni
p+q
spaziali e temporali, che formano un gruppo abeliano isomorfo a R (inteso come gruppo
p,q
rispetto al prodotto), per avere tutte le isometrie psssibili di R . Il gruppo di tutte le
p+q
isometrie, sia Lorentz che traslazioni, si dice gruppo di Poincaré P(p, q) = O(p, q) × R .
Il determinante, con ragionamento del tutto analogo a quanto fatto per le matrici orto-
gonali, è sempre±1. Anche qui possiamo quindi identicare un sottogruppo di trasforma-
zioni proprie SO(p, q). Tuttavia la struttura può presentare un ulteriore complessità, che
analizzeremo in dettaglio nel coaso di nostro intertesse, cioè il gruppo O(3, 1).

3.5 Gruppo di Lorentz

0
Il gruppo di Poincaré P(3, 1) è il gruppo delle trasformazioni di coordinate x = Λx + a in
R3,1 che lasciano invariato il prodotto scalare e perciò permettono di denire l'invariante
2 2 2
metrico dτ = |dx| = dt − |d~ x|2 . Le trasformazioni di Poincaré sono costituite dalle
4
traslazioni a ∈ R e dalle trasformazioni di Lorentz Λ ∈ O(3, 1). Queste ultime si possono
dividere in proprie, cioè con determinate +1, e improprie con determinate −1. Le prime
formano il sottogruppo SO(3, 1), come già visto. Le seconde invece sono un laterale che
può essere realizzato moltiplicando ogni elemento di SO(3, 1) per la matrice g = η =
diag(1, −1, −1, −1). Quest'ultima lascia invariata la coordinata temporale e manda le
coordinate spaziali da ~x in −~x. Si tratta quindi di una trasformazione di parità. Ogni
trasformazione impropria è il prodotto di una trasformazione propria e una di parità.
+ 0
Inoltre si può denire l'insieme O (3, 1) delle matrici Λ aventi l'elemento Λ 0 > 0.
Queste trasformazioni hanno la proprietà di lasciare invariato l'ordine temporale degli
3.5. GRUPPO DI LORENTZ 43

eventi, perciò sono dette ortocrone. Quelle invece con Λ00 < 0 invertono la direzione
dell'asse dei tempi e vengono dette anticrone. Il loro insieme viene spesso indicato con
O− (3, 1). Chiameremo inoltre SO± (3, 1) = O± (3, 1) ∩ SO(3, 1). Dimostriamo che O+ (3, 1)
è un sottogruppo di O(3, 1). Sapendo che il prodotto è associativo, che l'elemento 1
+
appartiene a O (3, 1), ci basta mostrare che il prodotto di due matrici ortocrone è ancora
una matrice ortocrona e che l'inversa di una trasformazione ortocrona è ortocrona. Per
fare ciò cominciamo col notare che, dalla relazione (3.2) discende

Λ−1 = η −1 ΛT η
Ne segue
(Λ−1 )00 = Λ00 (3.3)

Perciò se Λ è ortocrona con Λ00 > 0, pure Λ−1 lo è. Inoltre

(Λ−1 )k0 = Λ0k , (Λ−1 )kl = Λlk k, l = 1, 2, 3 (3.4)

Inoltre, sempre dalla relazione denitoria (3.2), calcolandone esplicitamente il primo ter-
mine, si ha
X
(Λ00 )2 − (Λi0 )2 = 1
i
−1
Riscrivendo quest'ultima per Λ e tenendo conto delle (3.3,3.4) abbamo anche
X
(Λ00 )2 − (Λ0i )2 = 1
i

Da queste ultime due equazioni discende che (Λ00 )2 ≥ 1 e cioè Λ00 ≤ −1 oppureΛ00 ≥ 1.
Chiaramente le metrici ortocrone si hanno nel secondo caso. Supponiamo che Λ, Σ ∈
O+ (3, 1). Vogliamo mostrare che P = ΛΣ ∈ O+ (3, 1). Calcoliamo pertanto il primo
elemento di matrice di P
X
P 00 = Λ00 Σ00 + ~ ·Σ
Λ0i Σi0 = Λ00 Σ00 + Λ ~
i

dove con ~ Σ
Λ, ~ indichiamo i vettori di componenti Λ0i e Σi0 rispettivamente. Il loro prodotto
scalare gode della seguente proprietà

~ ·Σ
Λ ~ = |Λ||
~ Σ|~ cos θ

dove θ è l'angolo tra ~


Λ e ~
Σ e ovviamente | cos θ| ≤ 1. Perciò

~ · Σ|
|Λ ~ ≤ |Λ||
~ Σ|~

Ora ~ 2 > |Λ|


(Λ00 )2 = 1 + |Λ| ~ 2 e ~ 2 > |Σ|
(Σ00 )2 = 1 + |Σ| ~ 2, per cui ~ Σ|
Λ00 Σ00 > |Λ|| ~ e

~ ·Σ
P 00 = Λ00 Σ00 + Λ ~ ≥ Λ00 Σ00 − |Λ||
~ Σ|~ >0

da cui risulta che P ∈ O+ (3, 1). Dunque le matrici ortocrone formano un sottogruppo di
O(3, 1).
La situazione dei sottogruppi del gruppo di Lorentz si può riassumere nella segnete
tabella
44 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

det Λ = +1 det Λ = −1
0
Λ0≥1 proprie ortocrone improprie ortocrone
Λ00 ≤ −1 proprie anticrone improprie anticrone

La prima casella in alto a destra, cioà le proprie ortocrone forma il sottogruppo SO+ (3, 1)
delle trasformazioni di Lorentz ottenibili dall'identità con deformazioni continue dei para-
metri. Normalmente si richiede che una legge sica sia invariante rispetto a queste trasfor-
mazioni. Le trasformazioni della seconda casella, le improprie ortocorone, si ottengono dalle
proprie ortocrone moltiplicandole per una inversione di parità P = diag(1, −1, −1, −1) (che
coincide con la metrica η ). Tutte le leggi siche per le quali si desidera anche invarianza
di parità devono essere invarianti almeno per tutte le ortocrone, siano esse proprie o im-
+
proprie, cioè per il sottogruppo O (3, 1) costituito da entrambe le caselle della prima riga
della tabella.
La prima casella della seconda riga, le trasformazioni proprie anticrone si ottengono dal-
le proprie ortocrone moltiplicandole per una inversione temporale T = diag(−1, −1, 1, 1).
Tutte le leggi siche che siano indierenti alla freccia del tempo devono essere invarianti
per tutte le matrici proprie, siano esse ortocrone o anticrone, cioè per le matrici di tutto
il sottogruppo SO(3, 1) costituito dalle due caselle della prima colonna della tabella. Le
matrici della seconda colonna della seconda riga, cioè le improprie anticrone si ottengono
dalle proprie ortocrone moltiplicandole per PT = diag(−1, 1, −1, −1). Esse vanno consi-
derate se si vuole invarianza rispetto a tutto il gruppo di Lorentz, cioè anche per parità e
inversione temporale.

3.6 Tensori

Considerando ora un operatore rappresentato da una matrice A, i suoi elementi Aµν si


trasformano come segue

(A0 )µν = (Λ−1 )µρ Λσν Aρ σ


Quindi, consistentemente, l'indice in alto si trasforma in maniera controvariante e quello in
basso in maniera covariante. Più in generale, un oggetto che si trasforma come il prodotto
di p componenti controvarianti e q covarianti di un vettore si dice tensore di rango (p, q).
In altre parole, un tensore è un insieme di numeri

Aµ1 ···µp ν···νq

che, per una trasformazione di base, si trasforma come

(A0 )µ1 ···µp ν1 ···νq = (Λ−1 )µ1 ρ1 · · · (Λ−1 )µp ρ1 Λσ1 ν1 · · · Λσq νq Aρ1 ···ρp σ1 ···σq

In un tensore, qualunque indice può essere innalzato o abbassato usando la metrica o la


metrica inversa.
3.7. INVARIANTI 45

3.7 Invarianti

Si dicono invarianti le quantità che non variano per un cambiamento di base. Il prodotto
scalare di due vettori è un invariante

a0µ b0µ = aσ Λσµ (Λ−1 )µρ bρ = aσ δρσ bρ = aσ bσ


Gli invarianti sono molto importanti in relatività. Ad esempio, le trasformazioni di Lorentz
devono lasciare invariata la quantità

dτ 2 = dt2 − |d~x|2 = gµν dxµ dxν = dxµ dxµ


2
Poichè non abbiamo richiesto la positività della metrica, si può avere dτ < 0 e non è vero
2 µ
che dτ = 0 implichi che dx = 0. Infatti tutti i vettori del cono-luce sono caratterizzati
2
proprio da dτ = 0.
µ
Un altro invariante importante è la traccia TrA = A µ di una matrice

(A0 )µµ = (Λ−1 )µρ Λσµ Aρ σ = Aρ ρ


Anche il determinante di una matrice è un invariante. Basta ricordare che il determi-
nante di un prodotto è uguale al prodotto dei determinanti e che il determinante di una
matrice inversa è uguale all'inverso del determinante della matrice originaria:

det A0 = det(Λ−1 AΛ) = (det Λ)−1 det A det Λ = det A

3.8 Campi tensoriali

Ci interessa ora studiare la trasformazione di un tensore dipendente dal punto, ovvero di


quello che si denisce come un campo tensoriale.
(T 0 )µν ρ (x0 ) = (Λ−1 )µα (Λ−1 )ν β Λγ ρ T αβγ (x)
in cui
xµ = Λµν x0ν
Supponinamo di avere una grandezza W (P ), ove P è un punto di V di coordinate
~x. Se trasformandola secondo una isometria di V succede che W 0 (P ) = W (P ), ovvero
W 0 (~x0 ) = W (~x), si dice che W è una funzione scalare. Se W 0 = W anche come forma
funzionale, ovvero W (~ x0 ) = W (~x), si parla di invariante scalare.
3
Un esempio di invariante scalare in R è il potenziale coulombiano

a a
V (r) = = √
r ∆xi ∆xi
Trasformandolo con l'isometria di R3 , cioè le rotazioni O(3), si ha infatti

a a
V 0 (r0 ) = q =q = V (r0 )
(R−1 )ji ∆x0j Rki ∆x0k ∆x0j ∆x0j
46 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

Quindi V (r)
non solo ha lo stesso valore, ma mantiene anche la stessa forma nel nuovo
x0 che aveva nel vecchio ~x.
sistema di coordinate ~
Introduciamo ora il concetto di derivata di un tensore. Cominicamo col denire le
derivate di una funzione scalare

∂W 0 ∂W ∂xν ∂W

= ν 0µ
= Λν µ ν
∂x ∂x ∂x ∂x
La derivata di uno scalare rispetto alle componenti controvarianti di un 4-vettore si compor-
ta quindi come un 4-vettore covariante. Analogamente la derivata rispetto alle componenti
covarianti si comporta in modo controvariante

∂W 0 ∂W ∂xν ∂W
0
= 0
= (Λ−1 )µν
∂xµ ∂xν ∂xµ ∂xν

In maniera poco ortodossa, si può dire che indici in alto nel denominatore di una derivata
si comportano come indici in basso e viceversa indici in basso si comportano come indici in
alto. Ciò giustica l'introduzione del simbolo ∂µ per indicare la derivata tensoriale rispetto
µ
alla coordinata x
∂ ∂ ~
∂µ ≡ µ
= ( , ∇)
∂x ∂t
∂µ si comporta quindi come un 4-vettore covariante

∂µ0 = Λν µ ∂µ

Si noti che l'analogo controvariante è dato da


 
µ ∂t
∂ = ~
−∇

Derivando un tensore di rango r si ottiene un tensore di rango r + 1. Per esempio

∂µ0 T 0αβ (~x0 ) = Λν µ (Λ−1 )αγ (Λ−1 )βδ ∂ν T γδ

Ad esempio in R3 il potenziale elettrostatico, come abbiamo visto, è un invariante scalare.


Derivandolo rispetto alle componenti xi del vettore posizione ~x si ottiene un 3-vettore (il
campo elettrico) Ei = −∂i V il che può essere scritto in notazione vettoriale ~ = ∇V
E ~ come
ben noto.
La derivata di un vettore da un tensore di rango 2

∂µ V ν = Tµ ν

Facendone la contrazione si ottiene la divergenza del vettore V~ . A 3 dimensioni questa è


la usuale divergenza
~ · V~
∂i V i = ∇
3.8. CAMPI TENSORIALI 47

che è infatti uno scalare. Nel caso 4-dimensionale di Minkowski si parla di 4-divergenza

∂µ V µ

di un 4-vettore. Questa è uno scalare di Lorentz.


Inne, il rotore è una operazione dierenziale che, applicata a un vettore, genera un
altro vettore. In generale, per scrivere questa operazione in componenti conviene introdurre
il simbolo totalmente antisimmetrico di Levi-Civita. In uno spazio vettoriale V a
N dimensioni questa è denita come un tensore di rango N

 +1 per α1 ...αN = tutte le permutazioni pari di 1, ..., N
α1 ...αN = −1 per α1 ...αN = tutte le permutazioni dispari di 1, ..., N
0 per almeno 2 indici uguali

3
Illustreremo questo a 3 dimensioni in R e a 4 dimensioni nello spazio-tempo di Minkowski
4 3
M . In R talvolta il simbolo di Levi-Civita viene anche chiamato simbolo di Ricci. Le
componeti del rotore di un vettore saranno espresse da

~ × V~ )i = ijk ∂j Vk
(∇

Infatti, per esempio

~ × V~ )1 = 123 ∂2 V3 + 132 ∂3 V2 = ∂2 V3 − ∂3 V2
(∇

come deve essere secondo la denizione tradizionale. Il lettore potrà agevolmente vericare
le altre componenti.
Il simbolo di Levi-Civita a 4 dimensioni ha 4 indici: αβγδ = −αβγδ . La contrazione di
un tensore antisimmetrico di rango r≤4 con il simbolo di Levi-Civita produce un altro
tensore di rango 4−r totalmente antisimmetrico nei suoi indici che viene detto duale del
precedente

αβγδ Vδ = Ṽ αβγ αβγδ Fγδ = F̃ αβ αβγδ Rβγδ = R̃α


La contrazione, invece, con un tensore simmetrico produce 0, perché moltiplicare un oggetto
simmetrico per uno antisimmetrico produce sempre zero. Poiché ogni tensore di rango 2
può essere pensato come la somma di una parte simmetrica e di una antisimmetrica negli
indici, risulta che solo la parte antisimmetrica può avere un duale. Si noti che la proprietà
che il duale di un tensore di rango 2 è pure di rango 2 è valida solo in 4 dimensioni.
Il simbolo di Levi-Civita si trasforma come

0α1 ...αN = det Λ · α1 ...αN

ed è quindi una densità tensoriale di rango N. Si dice densità scalare ogni oggetto che si
trasformi come

q 0 (x0 ) = det Λ · q(x)


48 CAPITOLO 3. CALCOLO TENSORIALE PIATTO

e densità tensoriale ogni oggetto che, oltre alla trasformazione tipica dei tensori abbia anche
un termine di tipo determinante nella trasformazione. Per esempio una densità tensoriale
di rango 2 si trasforma come

T 0µν (x0 ) = det Λ · (Λ−1 )µρ (Λ−1 )ν σ T ρσ

Nel caso del simbolo di Levi-Civita, tutti i termini Λβiαi nella contrazione si elidono dando
delle δ di Kroenecker e lasciando quindi sopravvivere solo il termine col determinate. Per le
trasformazioni proprie det Λ = 1 perciò non c'è distinzione da un tensore usuale, e il simbolo
di Levi-Civita è lo stesso in tutti i sistemi di riferimento. Ma se considero trasformazioni
improprie, allora det Λ = −1 e i tensori sono quindi caratterizzati dalle loro trasformazioni
di parità. I vettori che si trasformano con un segno meno sotto trasformazioni di parità
vengono detti pseudovettori. Si possono avere anche pseudoscalari (le densità scalari) e
pseudotensori.
Una proprietà importante di ijk = ijk a 3 dimensioni è la seguente

ijk ilm = δ jl δ km − δ jm δ kl

molto utile per dimostare certe identità tra gradienti, divergenze e rotori di 3-vettori.
Vedremo alcuni esempi di ciò nella trattazione del campo elettromagnetico.
Capitolo 4
Dinamica relativistica

4.1 Particella libera relativistica

Per sviluppare una dinamica relativistica procederemo qui da un punto di vista formale,
e cioè da un prinicipio di minima azione. Come in meccanica newtoniana una particella
libera percorre un cammino lungo il quale la traiettoria sia minima (linea retta in uno spazio
euclideo) e questo può essere formalizzato chiedendo che la lunghezza della traiettoria Γ
Z
ds
Γ

sia minimo, cioè che Z


δ ds = 0
Γ
così anche in relatività richiederemo che la lunghezza della linea di mondo γ di una particella
nello spazio-tempo sia la minima possibile se la particella è libera. Perciò richiederemo il
principio di minima azione
δS = 0
con Z
S=α dτ
γ

ove α è una costante per ora arbitraria, che sseremo in seguito. L'azione S può essere
scritta come l'integrale, tra l'istante iniziale tA e quello nale tB del moto, di una funzione
delle coordinate e delle velocità nota come Lagrangiana L(~x, ~v )
Z tB
S= dt L(~x, ~v )
tA

Poichè il tempo proprio dτ è legato al tempo coordinata da dτ = 1 − v 2 dt, possiamo
assumere come lagrangiana di una singola particella libera la quantità

L = α 1 − v2

49
50 CAPITOLO 4. DINAMICA RELATIVISTICA

Determiniamo ora la costante α richiedendo che per v→0 sia riprodotta la lagrangiana
non relativistica di una particella libera, che notoriamente è pari alla sua energia cientica
L = 12 mv 2 + cost. (a meno di una costante additiva arbitraria). Perciò espandiamo questa
esperessione per v piccoli
1
L = α − αv 2 + ...
2
da cui è immediato identicare α = −m. Perciò la lagrangiana relativistica della particella
libera di massa m è

L = −m 1 − v 2
La massa m si intende misurata nel sistema di riferimento a riposo. Da questa lagrangiana
è immediato ricavare, col metodo di Euler-Lagrange, le equazioni del moto

d ∂L ∂L
− =0 (4.1)
dt ∂~v ∂~x
cioè il moto rettilineo uniforme
~v = cost.
Per ricavare una espressione per l'impulso p~ di questa particella, ricordiamo che in
formalismo lagrangiano esso è visto come variabile canonicamente coniugata alla coordinata
~x
∂L m~v
p~ = =√ = mγ~v
∂~v 1 − v2
Si noti come questa espressione dierisca da quella newtoniana p~ = m~v . Il fattore γ fa
crescere vertiginosamente l'impulso di una particella di massa m quando questa viaggi a
velocità relativistiche. Per accelerare una particella alla velocità della luce occorrerebbe
fornirle un impulso innito, cosa chiaramente impossibile e per questo motivo nessun corpo
materiale dotato di massa potrà mai raggiungere la velocità della luce.
L'energia totale del sistema è data dall'hamiltoniana

2
√ mv 2 + m − mv 2
E = H = p~ · ~v − L = mγv + m 1 − v2 = √ = mγ
1 − v2
Si noti che quando la particella è a riposo, cioè γ = 1, l'energia del sistema non è nulla,
bensì
E0 = m
cioè ogni corpo materiale è dotato di una energia a riposo pari alla sua massa. Questa è forse
la relazione più famosa di tutta la relatività, ma quello che interessa qui è capirne il profondo
signicato: ogni massa è una forma di energia e l'energia può essere sempre pensata come
massa (questo sarà particolarmente importante per determinare i campi gravitazionali).
La massa pu essere trasformata in energia e viceversa, come avviene notoriamente nelle
reazioni nucleari. Per esempio nella fusione dell'idrogeno in elio, la massa totale dei corpi
iniziali è più grande del 7 per mille di quella del nucleo di elio nale. La dierenza si è
trasformata in energia termica e cinetica i cui eetti devastanti sono noti a tutti.
4.2. 4-VELOCITÀ 51

L'energia di una particella libera può perciò essere pensata come somma di energia
cinetica e energia a riposo

E = mγ = m + (γ − 1)m
perciò una espressione per l'emergia cinetica di una particella materiale in relatività è
T = (γ − 1)m. È immediato vericare che, espandendo per piccole v si riottiene la formula
1 2
usuale dell'energia cientica non-relativistica T = mv .
2

4.2 4-velocità

Una volta compreso come scrivere l'energia e il momento relativistici, ci chiediamo come
essi si trasformino sotto Lorentz. Allo scopo dobbiamo prima introdurre il concetto di
4-velocità. Essa è denita come
dxµ
uµ =

µ
Essendo la derivata eettuata rispetto al tempo proprio, che è un invariante, u eredita
µ
le proprietà tensoriali di dx e quindi è un 4-vettore. Le componenti della 4-velocità si
2 2
possono ottenere osservando che dτ = dt − |d~ x|2 = dt2 (1 − v 2 ) da cui dt = γdτ e perciò

dxµ
 
µ 1
u =γ =γ
dt ~v

La 4-velocità ha sempre norma 1

 
µ 2 1
uµ u = γ (1, −~v ) = γ 2 (1 − v 2 ) = 1
~v

E' utile denire in maniera simile anche la 4-accelerazione

duµ
aµ =

che risulta sempre ortogonale alla 4-velocità. Infatti derivando la uµ uµ = 1 rispetto a τ si
ottiene

aµ uµ = 0

4.3 4-impulso e equazione di mass-shell

Una volta introdotta la 4-velocità la trattazione covariante dell'impulso e dell'energia


può essere agevolmente trattata dimostrando che la quantità p = (E, p~) di componenti
controvarianti  
µ E
p =
p~
52 CAPITOLO 4. DINAMICA RELATIVISTICA

detta 4-impulso è un 4-vettore. Infatti essa può essere scritta come pµ = muµ con uµ
4-velocità, come è immediato vericare
   
µ mγ 1
p = = mγ = mγuµ
mγ~v ~v
Il 4-vettore p perciò ha componenti che si trasformano come un tensore controvariante di
rango 1
p0µ = (Λ−1 )µν pν
da cui si possono ricavare le trasformazioni di energia e impulso. In particolare, sistemi
di riferimento diversi attribuiranno energia diversa a un corpo; le componenti energia e
impulso si mescolano in una trasformazione di Lorentz, proprio come si mescolano spazio
e tempo.
La quantità |p|2 = pµ pµ è pertanto un invariante di Lorentz. Essa può essere espressa
da un lato tramite la sua espressione generale

|p|2 = E 2 − p2

(in cui si è usata la notazione p = |~p|) e dall'altro può essere calcolata in un sistema di
riferimento particolare, poiché il suo valore non cambia passando da un sistema a un altro.
Calcolandola quindi nel sistema di riferimento a riposo, in cui
 
µ m
p = ~0

si ottiene l'equazione di mass-shell o equazione di dispersione per una particella libera


relativistica
E 2 = p2 + m2
p2
che è l'analogo della formula newtoniana che lega impulso ed energia
2m
. Si noti cheE=
se si vuole calcolare l'energia da questa formula occorre estarre una radice quadrata
p
E = ± p2 + m2

Le soluzioni con il segno meno vengono escluse dal fatto che si assume che una particella
a riposo abbia energia pari alla sua massa positiva m, non −m. Tuttavia queste energie
negative diventano importanti quando si cerca di introdurre una equazione quantisitica
relativistica analoga all'equazione di Schrödinger, la cosiddeta equazione di Dirac, che
prevede appunto accanto alle soluzioni di energia positiva anche quelle di energia negativa,
portando di fatto al concetto di antiparticella. Non ci occupiamo qui per ora di questo
problema, segnalando però che anche le soluzioni di energia negativa della relazione di
mass-shell possono assumere signicato in certi capitoli della Fisica Teorica.
Si noti inoltre che la relazione di mass-shell ci da anche la relazione energia-impulso nel
caso di particelle prive di massa (per esempio il fotone)

E=p
4.4. PARTICELLA IN UN POTENZIALE ESTERNO 53

Pensando a tali particelle prive di massa come caso limite di quelle massive per m → 0, ci
rendiamo conto che la relazione
m
E=√
1 − v2
si annullerebbe a meno che il denominatore pure si annulli, ovvero che v = 1, cioè che la
particella viaggi alla velocità della luce. Viceversa, una particella che viaggia alla velocità
della luce avrebbe energia divergente, a meno che il numeratore si annulli, cioè la particella
sia di massa nulla. Le particelle esistenti in natura perciò si possono dividere in due grandi
classi:

• quelle con massa m>0 che viaggiano sempre a velocità inferiore a quella della luce

• quelle di massa nulla, che sono forzate a viaggiare costantemente alla velocità della
luce senza mai fermarsi o rallentare.

Non possono invece esistere particelle che viaggino a velocità superiori a quelle della luce
(tachioni). Esse potrebbero essere infatti veicolo di segnali superluminali che violerebbero
la causalità. Per essere più precisi esse potrebbero esistere ma non avere alcuna interazione
col mondo da noi conosciuto e perciò si possono totalmente ignorare in una teoria scientica
perché non misurabili.

4.4 Particella in un potenziale esterno

Supponiamo ora che la nostra particella sia immersa in un campo esterno statico descrivibile
da un potenziale V (~x). La lagrangiana sarà ora


L = −m 1 − v 2 − V (~x)

e le equazioni di Euler-Lagrange (4.1) che minimizzano l'azione in questo caso sono

d~p ∂V ~
=− = −∇V
dt ∂~x
Introdotto il concetto di forza
F~ = −∇V
~

la legge fondamentale del moto può essere scritta come

d~p
F~ =
dt
che ha una forma analoga a quella newtoniana, ma in realtà è molto diversa. Infatti ora il
momento non ha più la forma newtoniana p~ = m~v da cui sarebbe subito possibile inferire
54 CAPITOLO 4. DINAMICA RELATIVISTICA

la seconda legge di Newton F~ = m~a. Essendo ora la forma dell'impulso p~ = mγ~v la sua
derivata sarà più complicata

d dγ
F~ = m (γ~v ) = mγ~a + m ~v
dt dt
dγ d~v
= mγ~a + m · ~v = mγ~a − mγ 3 (~v · ~a)~v
d~v dt
Questa legge mostra che la forza è parallela alla accelerazione solo nel caso in cui que-
st'ultima sia perpendicolare alla velocità o parallela ad essa. In tutti gli altri casi, ci sono
componenti della forza non dirette come l'accelerazione. Inoltre la validità di questa forma
della legge del moto è limitata ai casi in cui la massa rimane costante. Ora abbiamo visto
che processi nucleari possono trasmutare massa in energia e perciò può esserci anche un
termine dm/dt che complica ulteriormente le cose. In conclusione, sebbene la F~ = d~p/dt
sia una corretta legge dinamica in relatività, essa ha un contenuto in generale molto più
ricco che in meccanica newtoniana, prevedendo sia forze non parallele all'accelerazione, sia
la possibilità che, con la transmutazione di massa in energia siano previsti nuovi metodi di
inuire sulle traiettorie dei corpi materiali.

4.5 4-forza

Un metodo più succinto di esprimere la legge della dinamica è quello di introdurre il


concetto di 4-forza
dpµ
Fµ =

Essendo dτ un invariante, la natura tensoriale di pµ implica che la 4-forza è un 4-vettore.
Le sue componenti sono
dE
dt dpµ
 
µ dt
F = =γ
dτ dt F~
Come abbiamo visto, in relatività può capitare che la massa di un corpo si trasmuti in
parte in energia, cambiando quindi le caratteristiche del moto, come avviene per esempio
nelle reazioni nucleari. Se però ci restringiamo a moti in cui la massa a riposo del corpo
rimane costante, dalla denizione di 4-forza segue

duµ
Fµ = m = maµ

cioè una specie di analogo 4-dimesionale della legge di Newton. Ricordando che la 4-
µ
accelerazione è ortogonale alla 4-velocità, ne segue Fµ u = 0, da cui, esplicitando le
componenti  
dE 1
γ ( , −F~ )
2
=0
dt ~v
ovvero
dE
= F~ · ~v
dt
4.6. AZIONE A CONTATTO E A DISTANZA. CAMPI. 55

e perciò possiamo riscrivere la 4-forza come

F~ · ~v
 
µ
F =γ
F~

Osservando inne che p~ = E~v si ha

d~p dE
F~ = = E~a + ~v
dt dt
e perciò la generalizzazione relativistica della legge di Newton

F~ = mγ~a + (F~ · ~v )~v

che torna a coincidere con quella classica per v  1. Questa equazione ci dice che la
forza, in generale, non è più parallela all'accelerazione, cosa che invece succedeva sempre in
meccanica newtoniana. Il parallelismo tra F~ e ~a sussiste solo se ~v = 0, ciè in caso di moto
incipiente, oppure se F~ · ~v = 0, cioè per forze perpendicolari alla velocità (come nel moto
circolare uniforme) o, inne, per il caso in cui il moto sia rettilineo (non necessariamente
uniforme), cioè con ~a parallela a ~v .

4.6 Azione a contatto e a distanza. Campi.

Se si vuole ora considerare la dinamica di un sistema chiuso (cioè non sottoposto a forze
esterne, ma solo alle forze esercitate da uno sull'altro corpo appartenente al sistema), si
incontra un punto fondamentale di dierenza con la meccanica newtoniana.
Un sistema di particelle infatti può prevedere due tipi fondamentali di interazioni:

• l' interazione a contatto in cui i corpi si comportano come liberi nchè non giungono
a contatto l'uno dell'altro e allora avviene un urto durante il quale può esserci scambio
di impulso e energia. Questa è la situazione tipica delle classiche palle da biliardo

• l' interazione a distanza in cui i corpi si sentono l'un l'altro attraverso un poten-
ziale, come avviene per esempio nella gravità newtoniana.

Nessun segnale può propagarsi a velocità superiore a quella della luce. La visione newto-
niana della forza di gravitazione universale presuppone una forza che dipenda solo dalle
posizioni dei corpi che la generano e la subiscono. Poiché tali corpi si muovono, il dire che
la forza dipende solo dalla posizione e non dalla velocità ha una conseguenza crucuale: si
deve richiedere che la forza si propaghi a velocità innita. Se un corpo si muove la sua
inuenza gravitazionale secondo Newton deve riaggiornarsi immediatamente in qualunque
punto dello spazio. Ciò rende la graviatazione di Newton incompatibile con la relatività ri-
stretta. Sarà da questo punto che prenderà le mosse l'altra grande rivoluzione Einsteiniana,
la relatività generale.
56 CAPITOLO 4. DINAMICA RELATIVISTICA

Qui ci basti commentare per ora che una interazione tra corpi distanti in relatività non
può che avvenire a velocità minore o uguale a quella della luce. Il concetto di campo, che
in meccanica newtoniana era nulla più che un espediente matematico, diventa ora invece
centrale. Invece del concetto di azione a distanza tra due corpi, la visione relativistica pre-
ferisce parlare di corpo materiale che produce un campo (gravitazionale, elettromagnetico,
ecc...) che si propaga nello spazio come un'onda a velocità minore o uguale a quella della
luce e quando raggiunge l'altro corpo materiale è da questo percepito e ne inuenza il moto.
Ciò che viene salvato della visione newtoniana è solo il prinicipio di azione e reazione. La
forza prodotta dal campo sul corpo di arrivo è uguale e contraria a quella sul corpo di
partenza. Tuttavia queste due forze non vengono in essere nello stesso istante, ma sono
separate dal tempo di propagazione del segnale di campo da un corpo all'altro.

Tuttavia il principio di azione e reazione garantisce, come in meccanica newtoniana,


che l'impulso totale di un sistema chiuso si conserva. Nel caso di forze a contatto questo è
chiaramente intuitivo. Se la forza F~AB agente dalla particella A sulla particella B durante
un urto è uguale e contraria alla F~BA agente dalla particella B sulla particella A, allora

d
F~AB + F~BA = (~pA + p~B ) = 0
dt

Perciò l'impulso totale P~ = p~in ~in


A +p ~out
B = p ~out
A +psi conserva nel processo di urto. Dall'e-
B
quazione di mass-shell discende che anche l'energia totaleE = EAin + EBin = EAout + EBout .
µ
Perciò possiamo aermare che in ogni processo di urto il 4-impulso totale P del sistema
si conserva.

Nel caso di interazione a distanza ovviamente per avere ancora la conservazione del
4-impulso totale dobbiamo ammettere che parte di esso è data dal 4-impulso del campo
che deve essere sommato a quello delle particelle. Dunque in relatività l'unico tipo di
lagrangiama che possiamo immaginare di scrivere per particelle interagenti a distanza è per
forza accoppiata alla lagrangiana di un campo φ(~x, t) (la cui natura tensoriale dipenderà
dal tipo di interazione) che media le forze tra queste particelle

X q 
L= −mA 1− vA2 − V (~xA , ~vA , φ(~xA , t), ∂µ φ(~xA , t)) + Lcampo (φ, ∂µ φ)
A

Vedremo in dettaglio un esempio di ciò trattando il campo elettromagnetico.

In ultima analisi anche le interazioni a contatto sono in realtà delle interazioni a distanza
(su distanze molto piccole). Due palle da biliardo che urtano sono composte da atomi che,
avvicinandosi gli uni agli altri, si repellono per via di forze elettromagnetiche. Gli urti tra
particelle elementari sono in realtà regolati dalle forze nucleari (deboli e forti), anch'esse
descritte da un campo. Da ciò si vede come il concetto di campo prenda sempre più
importanza man mano che si procede nell'analisi delle forze della natura e la relatività si
dimostra perfettamente compatibile con questo tipo di visione.
4.7. CRITICA AL CONCETTO DI CORPO RIGIDO 57

4.7 Critica al concetto di corpo rigido

In meccanica classica è molto in uso il concetto di corpo rigido. Un corpo perfettamente


rigido ha un moto del tutto solidale col suo centro di massa. Se imprimo una forza su
un lato del corpo, tutti i punti del corpo devono risentire immediatamente di questa forza
e spostarsi di conseguenza. In relatività, tuttavia, ciò è impossibile perché implicherebbe
la trasmissione di una informazione a velocità innita. Detto in altro modo, la velocità
del suono all'interno di un corpo rigido dovrebbe essere innita e perciò maggiore della
velocità della luce. Il corpo perfettamente rigido è un concetto non valido in meccanica
relativistica.

La visione relativistica si sposa bene invece con una visione atomistica in cui un corpo
materiale è costituito da moltissimi corpuscoli tenuti insieme da campi di interazione.
Il problema si ripresenta però a livello dei corpuscoli: se questi hanno una qualunque
estensione, non potendo essere rigidi, devono essere composti di qualcosa di ancora più
piccolo. Dunque gli oggetti elementari in relatività devono essere puntiformi. In realtà
questa visione viene modicata se si introducono considerazioni quantisitiche. Tuttavia
qui non ci occuperemo di questo interessantissimo aspetto, che esula dalla trattazione
strettamente classica della relatività ristretta e assumeremo come puntiformi gli oggetti
elementari.

4.8 Densità e correnti

Spesso, avendo a che fare con corpi macroscopici, conviene considerare la distribuzione
di materia come approssimativamente continua e perciò introdurre i concetti di densità e
3
corrente di materia. Preso un cubetto innitesimo di lato dx e volume dV = d x di mate-
riale, misuratane la massa-energia dE si denisce densità di materia-energia relativisitica
la quantità

dE
µ(~x, t) =
dV

Questa può variare nel tempo perché ci può essere un usso di materia che esce o entra
dalle pareti immaginarie del cubetto. Dunque una informazione completa non consta
solo della densità ma anche dei movimenti di materia, cioè del movimento che la materia
del cubetto compie in ogni istante, ovvero della corrente di materia

~π (~x, t) = µ(~x, t)~v (~x, t)

Alternativamente possiamo pensare a un sistema di N particelle puntiformi A = 1, ..., N


che costituiscono il nostro corpo materiale. In questo caso la denizione di densità e
corrente può agevolmente essere data in termini di distribuzioni delta di Dirac centrate nei
58 CAPITOLO 4. DINAMICA RELATIVISTICA

punti in cui si trovano le particelle (si ricordi che p~A = EA~vA )

X
µ(~x, t) = EA δ (3) (~x − ~xA ) (4.2)
A
X
~π (~x, t) = p~A δ (3) (~x − ~xA ) (4.3)
A

in cui δ (3) (~x) = δ(x1 )δ(x2 )δ(x3 ) è la distribuzione delta di Dirac tridimensionale e ~xA =
~xA (t) è la traiettoria della particella A.
Naturalmente µ(x) non è un invariante di Lorentz. Per rendersene conto facilmente,
pensiamo a un gas di densità uniforme in una scatola cubica di lato L. Se M è la massa
totale del gas, la sua densità nel sistema di riferimento in cui il cubo è a riposo, sarà

M
µ=
L3

Tuttavia se osservo il cubo da un sistema di riferimento inerziale che si muova rispetto a


quello a riposo con velocità v lungo uno dei lati del cubo, questo lato subirà una contrazione
0
di Lorentz e misurerà L = L/γ . Pertanto questo nuovo osservatore non vede più un cubo
ma un parallelepipedo schiacciato di un fattore γ nella direzione del moto e avente volume
L3 /γ . Perciò egli attribuirà al gas una densità

γM
µ0 = = γµ
L3

Ci aspettiamo quindi che la densità si trasformi con un fattore γ e che non sia uno scalare
invariante di Lorentz, ma si trasformi come una struttura più complicata.

Allo stesso modo si possono introdurre altre densità. Per particelle dotate di una
qualche proprietà che chiameremo genericamente carica qA potrò introdurre una densità
di carica e una densità di corrente

X
(~x, t) = qA δ (3) (~x − ~xA )
A
X
~ x, t) =
J(~ qA~vA δ (3) (~x − ~xA )
A

e lo stesso per qualunque altro tipo di carica una particella possa possedere. Nel seguito di
questa sezione pensiamo a qA come a una qualsiasi caratteristica Lorentz-invariante di una
particella: la sua massa mA , la sua carica elettrica eA oppure un'altro tipo di carica (per
esempio di colore per i quarks, ecc...). L'invarianza di queste cariche elementari implica
che possiamo scrivere le densità e le correnti in maniera covariante collezionandole in un
4.8. DENSITÀ E CORRENTI 59

4-oggetto

dxµA (3)
   
µ ε X 1 X
J = = qA δ (3) (~x − ~xA ) =
δ (~x − ~xA ) qA
J~ ~vA dt
A A
dxµA (3) X dxµ dτ
Z X Z
= dt qA δ(t − tA ) δ (~x − ~xA ) = dt qA A δ (4) (x − xA )
A
dt A
dτ dt
Z X
= dτ qA uµA δ (4) (x − xA (τ ))
A

µ µ
In questa ultima forma è chiaro che J è un 4-vettore. Infatti dτ e qA sono invarianti, uA
(4)
sono 4-vettori e la δ , dovendo soddifare in qualunque sistema di riferimento la relazione
denitoria Z
d4 xδ (4) (x) = 1

deve pure essere un invariante. Per essere più precisi essa si trasforma inversamente a
d4 x. Quest'ultimo si trasforma come det Λ−1 , perciò la delta di Dirac 4-dimensionale si
µ
trasforma come det Λ, cioè come una densità scalare. Perciò J si trasforma come uno
pseudo-4-vettore.
Calcoliamo ora, tornando alla notazione con la delta 3-dimensionale, la divergenza della
densità di corrente

~ · J~ =
X d~xA ∂ (3) X d~xA ∂
∇ qA δ (~x − ~xA ) = − qA δ (3) (~x − ~xA )
A
dt ∂~x A
dt ∂~
x A
X ∂ (3) ∂ε
= − qA δ (~x − ~xA ) = −
A
∂t ∂t

Se le qA sono proprietà delle particelle indipenedenti dal tempo allora vale l' equazione di
continuità
∂ε ~ ~
+∇·J =0
∂t
ovvero ancora più elegantemente in formalismo 4-dimensionale

∂µ J µ = 0

Questa equazione ha un profondo signicato sico, in quanto è alla base delle leggi di
conservazione. Infatti in un sistema chiuso, la carica totale Q sarà la somma di tutte le
cariche qA delle singole particelle, ovvero l'integrale della densità ad essa associata su un
volume V sucientemente grande da includere tutto il sistema
Z XZ X
3
Q(t) = d xε(x) = d3 x qA δ (3) (~x − ~xA ) = qA
V A A
60 CAPITOLO 4. DINAMICA RELATIVISTICA

Questa quantità globale potrebbe in linea di principio dipendere dal tempo t. Tuttavia
l'equazione di continuità ci permette di calcolarne la derivata temporale
Z Z
dQ 3 ∂ε ~ · J~
= dx =− d3 x∇
dt V ∂t V

Ora per il teorema di Stokes l'integrale su un volume della divergenza di un campo vettoriale
è pari all'integrale sulla frontiera ∂V di tale volume del campo vettoriale stesso
Z Z
3 ~ ~
d x∇ · J = d~σ · J~
V ∂V

dove con d~σ si indica il vettore innitesimo normale a ∂V in un punto ~σ ∈ ∂V . Se questa


supercie è presa molto lontana (matematicamente, innitamente lontana) dal sistema,
tutte le densità e correnti saranno nulle su tale supercie. Perciò l'integrale di Stokes si
annulla e
dQ
=0 ⇒ Q = costante
dt
Perciò a ogni equazione di continuità è associata una legge di conservazione della quantità
Z
Q= d3 xJ 0 (x)
R3

Notando che d3 x si trasforma con un γ −1 e ε con un γ, si vede che Q è uno scalare se Jµ


era un 4-vettore.

4.9 Tensore energia-impulso

Ritorniamo alla denizione di densità di massa-energia e alla corrispondente corrente, date


nelle eq.(4.2,4.3). La corrente corrisponde anche alla densità di impulso, perciò allo stesso
modo della densità di materia possiamo pensare alla densità di impulso come un 3-vettore
di componenti
X
π i (x) = piA δ (3) (~x − ~xA )
A
i
dove pA sono le componenti del 3-vettore impulso della particella A. La densità di corrente
corrispondente a ogni componente della densità di impulso è data da un oggetto con 2 indici
σ ij . Il primo denota a quale componente della densità di impulso ci stiamo riferendo, il
secondo è l'indice della componente della velocità nella denizione di corrente
X
σ ij (x) = piA vAj δ (3) (~x − ~xA )
A

Tutte queste nozioni possono essere riassunte in un unico oggetto 4-dimensionale con due
indici
µ X pµ pν
µ dxA (3)
X
µν A A (3)
T (x) = pA δ (~x − ~xA ) = δ (~x − ~xA )
A
dt A
EA
4.9. TENSORE ENERGIA-IMPULSO 61

da cui si evince che T µν = T νµ è un oggetto simmetrico. Inoltre esso può essere riscritto
come
XZ
T µν
= dτ pµA uνA δ (4) (x − xA (τ ))
A

in analogia con quanto fatto nel caso di una corrente generica nella sezione precedente.
Con ciò si vede che si tratta di un tensore di rango 2, cui viene dato il nome di tensore
energia-impulso. Le sue componenti in forma matriciale sono

 
µ π1 π2 π3  
 π 1 σ 11 σ 12 σ 13  µ ~
π
T µν  π 2 σ 21 σ 22 σ 23  = ~π σ
= 

π 3 σ 31 σ 32 σ 33

dove la matrice 3×3 σ è detta tensore degli sforzi (nome mutuato dalla teoria dell'elasticità
dei solidi) e il suo elemento i, j -simo rappresenta il usso della componente i della densità
di impulso lungo la direzione j .
Questa denizione è stata data per particelle non interagenti o interganeti a contatto.
Nel caso di particelle interagenti a distanza si dovrà considerare anche la densità di ener-
gia e di impulso distribuita nel campo di interazione, come vedremo nel caso del campo
elettromagnetico.
Il tensore energia impulso è una quantità fondamentale in tutta la relatività, ristretta
o generale. Esso infatti codica nella maniera più completa la conservazione di 4 cariche
che sono alla base di tutta la meccanica.

X dxiA ∂ (3)
∂i T µi = pµA δ (~x − ~xA )
A
dt ∂xi
X dxiA ∂ (3)
= − pµA δ (~x − ~xA )
A
dt ∂xiA
X ∂ (3)
= − pµA δ (~x − ~xA )
A
∂t
∂ X µ (3) X dpµ
A (3)
= − pA δ (~x − ~xA ) + δ (~x − ~xA )
∂t A A
dt
µ0 µ
∂T X dpA (3)
= − + δ (~x − ~xA )
∂t A
dt

ovvero
X dpµ X
∂ν T µν
= A (3)
δ (~x − ~xA ) = FAµ γ −1 (vA )δ (3) (~x − ~xA ) = g µ
A
dt A

A dierenza del caso generico della sezione precedente, qui il 4-impulso delle singole par-
ticelle non è necessariamente una quantità ssa nel tempo. Lo è ovviamente nchè una
62 CAPITOLO 4. DINAMICA RELATIVISTICA

particella è libera. Nel momento in cui comincia a interagire essa subisce una forza, che
µ
crea appunto il termine g di cui sopra e a cui si da talvolta il nome di densità di forza. Se
µν
le particelle non interagiscono, ovviamente ∂ν T = 0. Lo stesso si verica se le particelle
interagiscono solo a contatto. Infatti supponiamo che tutte le particelle si stiano muoven-
do liberamente tranne due B e C che si urtano. Per tutte le particelle libere l'impulso e
l'energia si conservano, dunque dpµA /dt = 0. Allora gli unici termini non nulli nella densità
di forza sono
dpµB (3) dpµ
gµ = δ (~x − ~xB ) + C δ (3) (~x − ~xC )
dt dt
L'interazione avviene a contatto, cioè quando ~xB = ~xC e durante l'urto il 4-impulso si
conserva
d µ
(pB + pµC ) = 0 ⇒ gµ = 0
dt
In caso di azione a distanza la gµ non può essere annullata. Tuttavia, come vedremo
esplicitamente nel caso del campo elettromagnetico, è possibile aggiungere un termine di
µν
campo al tensore energia-impulso in modo tale che la somma del T della materia più
quello del campo sia ancora conservato.
La legge di conservazione corrispondente all'equazione di continuità del tensore energia-
impulso ci dice che la quantità
Z
ν
P = d3 xT 0ν
R3

si conserva. Chiaramente questa quantità corrisponde al 4-impulso totale del sistema, cioè
alla somma dei 4-impulsi di tutte le particelle in esso contenute. Come abbiamo detto ciò
è strettamente vero solo per particelle con interazioni a contatto (per esempio in un gas
perfetto relativistico). Per interazioni a distanza, come l'elettromagnetismo, la gravità o le
altre forze fondamentali della natura, per mantenere l'equazione di continuità (e quindi la
conservazione dell'energia-impulso) occorre aggiungere un termine di campo che ci mostra
come una certa quantità dell'energia e dell'impulso totali del sistema chiuso sono distribuite
nel campo di interazione. Il campo in relatività non è più solo un articio matematico, ma
diventa una vera e propria entità sica dotata di energia e impulso come le particelle.

4.10 Momento angolare

Si denisca la quantità

M γαβ = xα T γβ − xβ T αγ = −M γβα
che è chiaramente un 4-tensore di rango 3, essendo somma di prodotti di tensori di rango
1 e 2 rispettivamente. Si noti l'antisimmetria negli indici α, β . Questa quantità obbedisce
a una legge di continuità rispetto all'indice γ se il sistema è isolato. Infatti

∂γ M γαβ = δγα T γβ + xα ∂γ T γβ − δγβ T αγ + xβ ∂γ T αγ


4.11. CENTRO DI MASSA-ENERGIA 63

La legge di continuità del tensore energia-impulso garantisce l'annullarsi del secondo e


quarto termine, perciò
∂γ M γαβ = T αβ − T βα = 0
per simmetria del tensore energia-impulso. Corrispondentemente a questa equazione di
continutà esiste una collezione di cariche conservate etichettate da due indici
Z
αβ
J = d3 xM 0αβ = −J βα

Si tratta quindi di di un tensore antisimmetrico di rango 2, perciò dotato di 6 componenti


indipendenti, normalmente esprimibili in termini di 2 vettori tridimensionali. Vediamo di
capire a cosa corrispondono sicamente queste componenti
Z Z
0i
J = d x(x T − x T ) = tP − d3 xxi T 00 = K i
3 0 0i i 00 i

Z Z
J ij = d x(x T − x T ) = d3 x(xi π j − xj π i ) = ijk Lk
3 i j0 j i0

Queste espressioni diventano ancora più chiare se torniamo alle espressioni per un sistema
di particelle. Per le componenti di L avremo
Z XZ X
~ =
L 3
d x~x × ~π = d3 x ~xA × p~A δ (3) (~x − ~xA ) = ~xA × p~A
A A
e perciò stiamo parlando delle componenti del momento angolare totale del sistema, che
perciò è una quantità conservata anche in relatività.

4.11 Centro di massa-energia

Più involuta è l'interpretazione delle componenti di ~


K
Z X
~ = tP~ −
K d3 xρ~x = tP~ − EA~xA
A
Dividendo ambo i membri per l'energia totale, che è pure una quantità conservata, si vede
che il punto (centro di massa-energia)
P
~ A EA ~
xA
X= P
A EA
soddisfa l'equazione del moto
~ = V~ t + K
X ~
ove sia V~ = P~ /E e K
~ sono costanti. Perciò tale punto si muove di moto rettilineo uniforme.
Perciò il centro di massa-energia (CME) ha un moto non inuenzato dalle forze interne
del sistema e ci si può porre in un sistema di riferimento inerziale in cui esso risulti fermo.
Questo è il concetto che sostituisce il centro di massa della sica newtoniana.
Nel sistema CME il vettore ~
X è ovviamente nullo, per denizione, come pure la sua
velocità V~ . Perciò in questo sistema K~ = 0 e J αβ ha solo 3 componenti date dal momento
angolare intrinseco del sistema.
64 CAPITOLO 4. DINAMICA RELATIVISTICA

4.12 Spin

Il 4-tensore J αβ
ha una trasformazione alquanto peculiare per traslazioni. Se cambio
0µ µ µ µ
coordinate come x = x + a con a = costante, esso subirà una variazione

J 0αβ = J αβ + aα pβ − aβ pα

Ciò non deve sorprendere più di tanto, poiché sappiamo che il momento angolare subisce
una analoga variazione quando lo si denisca da origini degli assi diversi. Per isolare la
parte intrinseca del momento angolare risulta conveninete denire un 4-vettore detto spin
come segue
1
Sα = αβγδ J βγ U δ
2
U δ = P δ/
P
dove n mn è la 4-velocità del CME. Nel sistema CME le sue componenti sono

 
δ 1
U = ~0

(poiché γ(0) = 1). Perciò in tale sistema le componenti di Sα si possono facilemnte calcolare

Sα = (0, J 23 , J 31 , J 12 )

cioè  
α 0
S = ~
L
Le componenti dello spin sono proprio date dal momento angolare intrinseco, cioè calcolato
nel sistema CME. Che Sα abbia sempre 3 componenti indipendenti, in qualunque sistema
di riferimento si può vedere dalla relazione

U α Sα = 0

facilmente deducibile dalla denizione di Sα in quanto si moltiplica un termine simmetrico


α δ αβγδ
in α, δ (U U ) per uno antisimmetrico  . Questa relazione lega tra loro le 4 componenti
di Sα in qualunque sistema di riferimento, lasciandone solo 3 linearmente indipendenti.
Capitolo 5
Il campo elettromagnetico

5.1 Equazioni di Maxwell

I fenomeni elettromagnetici, nella sintesi operata da Maxwell (1850) sono descritti da un


campo elettrico ~
E e un campo magnetico ~
B generati da distribuzioni di carica elettrica
descritte da una densità di carica ρ e una densità di corrente ~j = ρ~v , essendo ~v un campo
di velocità che descrive i moti delle cariche elettriche nello spazio tridimensionale.
Le equazioni di Maxwell, che regolano tutti i fenomeni elettromagnetici, si scrivono

~ ·E
∇ ~ =ρ I Eq. di Gauss per l'elettricità
~
∇·B~ =0 II Eq. di Gauss per il magetismo
~ ×E
∇ ~ = − ∂ B~ III Legge di Faraday dell'induzione
∂t
~ ~ ~
∇×B = ∂E
+ ~j
∂t
IV Legge di Ampère

La II e la III legano tra loro i campi ~


E e ~
B e si dicono equazioni omogenee, le altre
due legano i campi ~ B
E, ~ alle loro cause, cioè alla distribuzione di cariche descritta dalla
densità ρ e dalla densità di corrente ~j .
Non esistono, per quanto sappiamo, in natura cariche e correnti magnetiche (monopoli
magnetici) anche se da un punto di vista teorico restaurerebbero la simmetria ~ ↔ −B
E ~
che le equazioni godono quando scritte in assenza di cariche elettriche (cioè per ρ = ~
j = 0).

5.2 Equazione di continuità

La densità di carica ρ e la corrente ~j sono legate dall'equazione di continuità

∂ρ ~ ~
+∇·j =0
∂t
Quest'ultima è deducibile dalle equazioni di Maxwell stesse. Si prenda la IV equazione e
se ne faccia la divergenza (cioè vi si applichi l'operatore ~
∇· ad ambo i membri)

~ ·∇
∇ ~ = ∂∇
~ ×B ~ ·E
~ +∇
~ · ~j
∂t
65
66 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

e inne si ricordi che per qualunque vettore V~ vale l'identità ~ ·∇


∇ ~ × V~ = 0. Riesprimendo
∇ ~
~ ·E tramite la equazione III, si ottiene l'equazione di continuità.
Il signicato sico dell'equazione di continuità è quello di conservazione della carica
elettrica totale del sistema, come può essere dimostrato seguendo le linee della sezione 4.8.
Quest'ultima è denita come la somma su tutti i punti dello spazio della densità di carica
distribuita in ciascun punto Z
Q≡ ρ(~x, t)d3 x
R3
Nel caso di un sistema di particelle cariche la densità e la densità di corrente saranno
denite come
X
ρ(~x, t) = eA δ (3) (~x − ~xA )
A
X
~j(~x, t) = eA~vA δ (3) (~x − ~xA )
A

in cui eA sono le cariche elettriche delle singole particelle del sistema.


P Ovviamente ne
discende che Q= A eA .

5.3 Campi potenziali

Dalla II equazione di Maxwell vediamo che ~


B è un campo vettoriale a divergenza nul-
la. Tutti i vettori a divergenza nulla si possono scrivere come rotore di un altro vettore
opportuno. Perciò introduciamo il potenziale vettore ~
A tale che

~ =∇
B ~ ×A
~ (5.1)

Sostituendo nella III


~
~ ×E
∇ ~ = −∇~ × ∂A
∂t
cioè !
∂ ~
A
~ × E
∇ ~+ =0
∂t
Ora, ogni vettore avente rotore nullo può essere scritto come il gradiente di un opportuno
potenziale scalare. Esisterà dunque una funzione φ tale che

~
~ + ∂ A = −∇φ
E ~
∂t
φ è detto potenziale scalare. Quindi

~
E ~ − ∂A
~ = −∇φ (5.2)
∂t
5.4. INVARIANZA DI GAUGE E GAUGE DI LORENTZ 67

5.4 Invarianza di gauge e gauge di Lorentz

I potenziali ~
A e φ non sono in realtà deniti univocamente dalle relazioni (5.1,5.2). Quelli
che contano da un punto di vista sico sono i campi ~ B
E, ~ e qualunque variazione dei po-
~ φ che li lasci invariati è del tutto ininuente per la sica dell'elettromagnetismo.
tenziali A,
Mostriamo ora che una ridenizione dei potenziali come segue

~ → A
A ~0 = A
~ + ∇Λ
~
0 ∂Λ (5.3)
φ → φ = φ − ∂t

con ~ B
Λ funzione arbitraria genera gli stessi campi E, ~. Infatti, tenendo conto della identità
vettoriale
~ × ∇f
∇ ~ =0 , ∀f
si ha
~0 = ∇
B ~ ×A~0 = ∇~ ×A
~+∇~ × ∇Λ
~ =∇ ~ ×A~=B ~
~0 ~
E ~ 0 − ∂ A = −∇φ
~ 0 = −∇φ ~ + ∇∂Λ
~ −
∂A
−∇~ ∂Λ = E
~
∂t ∂t ∂t
Le ridenizioni (5.3) dei potenziali, che lasciano invariata la sica, sono dette trasformazioni
di gauge. Le equazioni di Maxwell sono invarianti per trasformazioni di gauge.

Possiamo quindi scegliere opportunamente le Λ per semplicare certe formule relative


~
ai potenziali A, φ sapendo che queste non inceranno i risultati sici che riguardano i campi
~ B
E, ~.
Una scelta conveniente è il cosiddetto gauge di Lorentz in cui

∇ ~ + ∂φ = 0
~ ·A (5.4)
∂t
Qualunque funzione Λ(x) che soddis la condizione

Λ = 0
realizza la condizione (5.4) del gauge di Lorentz. Infatti operando sul primo membro della
(5.4) una trasformazione di gauge si ottiene

0 2
~ 0 + ∂φ = ∇
~ ·A
∇ ~ + ∂φ + ∇2 Λ − ∂ Λ = ∇
~ ·A ~ + ∂φ − Λ
~ ·A
∂t ∂t ∂t 2 ∂t
e perciò essa è realizzata da qualunque trasformazione di gauge che soddis Λ = 0.

5.5 Equazioni soddisfatte da ~


A e φ; 4-potenziale Aµ
Sostituendo le (5.1,5.2) nella IV equazione di Maxwell, si ha
!
~
~ ×∇
∇ ~= ∂
~ ×A ~ − ∂A
−∇φ + ~j
∂t ∂t
68 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

e grazie alla nota identità tra vettori

~ ×∇
∇ ~ × V~ = ∇(
~ ∇~ · V~ ) − ∇2 V~

si perviene alla
∂2A~ 
∂φ

~ 2 ~ ~ ~
−∇ A + 2 = −∇ ∇ · A + + ~j
∂t ∂t
equazione che deve essere soddisfatta dai potenziali scalare e vettore anchè i campi ~ B
E, ~
da loro generati soddisno le equazioni di Maxwell.
Nel gauge di Lorentz questa equazione si semplica notevolmente

~ = ~j
A

Analogamente, sostituendo le (5.1,5.2) nella I equazione di Maxwell otteniamo

!
~
~ ·
−∇ ~ + ∂A
∇φ = −∇2 φ −
∂ ~ ~
∇·A=ρ
∂t ∂t

Nel gauge di Lorentz, in cui ~ A


∇· ~ = − ∂φ anche questa equazione si semplica notevolmente
∂t

φ = ρ

Risulta quindi conveniente riunire i tre potenziali ~


A e il potenziale φ in un oggetto
4-dimensionale  
µ φ
A = ~
A
per il quale, nel gauge di Lorentz, le equazioni di campo si scrivono semplicemente

Aµ = j µ

Poichè  ≡ ∂µ ∂ µ si Lorentz-trasforma come uno scalare e j µ come un 4-vettore contro-


µ
variante, anche A risulta essere un 4-vettore controvariante. Il corrispondente 4-vettore
ν
covariante sarà ovviamente denito da Aµ = gµν A = (φ, −A)~ . A questo oggetto Aµ o Aµ si
da il nome di 4-potenziale elettromagnetico.

5.6 Tensore elettromagnetico

Per scrivere le equazioni di Maxwell in forma covariante dobbiamo innanzitutto trovare


un oggetto tensoriale che codichi opportunamente le informazioni contenute nei campi
~ B
E, ~. Questi due vettori corrispondono in totale a 6 componenti. Perciò l'oggetto che
cerchiamo non può essere un 4-vettore, che ha solo 4 componenti. Un generico tensore di
rango 2 avrebbe 16 componenti, ma se consideriamo un tensore antisimmetrico, esso ha le
componenti diagonali nulle e quelle sotto la diagonale opposte a quelle sopra la diagonale, e
5.6. TENSORE ELETTROMAGNETICO 69

perciò non indipendenti. Tale tensore antisimmetrico ha perciò esattamente 6 componenti


indipendenti, e viene quindi spontaneo pensare a un tale oggetto come il naturale candidato
a descrivere il campo elettromagnetico.
Deniamo il tensore elettromagnetico

Fµν = ∂µ Aν − ∂ν Aµ
Si verica subito che tale oggetto è antisimmetrico nello scambio degli indici µ e ν. Le sue
componenti possono essere determinate con un calcolo diretto, per esempio:

∂Ai
F0i = ∂0 Ai − ∂i A0 = − − ∂i φ = E i
∂t
F12 = ∂1 A2 − ∂2 A1 = ∂2 A1 − ∂1 A2 = −B 3
Riassumendo
F0i = E i Fij = −ijk B k
ovvero in forma matriciale
 
0 E1 E2 E3
 −E 1 0 −B 3 B 2 
Fµν = 2 3

 −E B 0 −B 1 
−E 3 −B 2 B 1 0
Analogamente si può denire un tensore controvariante
 
0 −E 1 −E 2 −E 3
 E1 0 −B 3 B 2 
F µν = g µρ g νσ Fρσ = 2 3

 E B 0 −B 1 
E 3 −B 2 B 1 0
La prima considerazione è che Fµν , anche se inizialmente denito attarverso il 4-
potenziale Aµ , dipende solo dai campi elettrico e magnetico, perciò come questi è un
oggetto sico gauge invariante.
Consideriamo ora le due equazioni di Maxwell disomogenee (I e IV) nella forma

~ ·E
∇ ~ =ρ
~ − ∂ E~ = ~j
~ ×B
∇ ∂t

A secondo membro compare in modo evidente la 4-corrente j µ , perciò ci aspetteremmo che


questa sia eguagliata da un 4-vettore. Abbiamo però a disposizione un tensore antisim-
metrico Fµν di rango 2. Osserviamo che le componenti di questo tensore sono date dalle

componenti di ~
E o ~.
B Ora, nelle equazioni compaiono le derivate di tali vettori, perciò
dovrebbe esserci anche una ∂µ nel primo membro dell'equazione. Viene spontaneo pensa-
µν
re che la contrazione ∂µ F , che ha appunto un solo indice libero, possa essere il miglior
candidato. Infatti le equazioni disomogenee si scrivono

∂µ F µν = j ν (5.5)
70 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

Possiamo vericare questo fatto componente per componente

~ ·E
∂µ F µ0 = ∂i E i = ∇ ~ = j0 = ρ

∂E i ~ × B)
~ 1
∂µ F µi = ∂0 F 0i + ∂k F ki = ∂0 E i + ∂k = − + (∇
∂t
e analogamente per le altre componenti.
Si noti che derivando il primo membro rispetto a ∂µ si ottiene 0, poichè si sta contraendo
µν
un oggetto totalmente simmetrico (∂µ ∂ν ) con uno totalmente antisimmetrico (F ). Perciò
il secondo membro di tale uguaglianza dovrà pure essere 0. Abbiamo così ridedotto in un
modo molto semplice, che illustra la potenza del caclolo covariante, l'equazione di continuità
∂µ j µ = 0.
Esaminiamo ora le equazioni omogenee

~ ·B
∇ ~ =0
~ + ∂ B~ = 0
~ ×E
∇ ∂t

Di nuovo queste sono 4 equazioni in tutto, ma la dierenza ora è che non possono più essere
uguagliate a un 4-vettore: a secondo membro infatti c'è semplicemente 0. Dovendo usare
Fµν e non potendo contrarlo in modo tale da ottenere comunque 4 equazioni, si può solo
pensare a una combinazione di antisimmetrizzazione degli indici che possa eventualmente
dare 4 equazioni indipendenti. Avendo a disposizione 2 indici ciò non è possibile: poichè
ogni indice prende 4 valori le possibilità sarebbero le possibili liste di 4 oggetti presi a due
a due, cioe`
4!
=6
2!2!
In eetti stiamo contando le compomenti di Fµν che sono appunto 6. Tuttavia notiamo
che anche in queste equazioni come nelle precedenti entrano le derivate, perciò dovremo
mettere una ∂µ da qualche parte. Vediamo allora cosa si riesce a fare con oggetti con 3
indici, tipo ∂µ Fνρ . Se antisimmetrizziamo completamente questo oggetto otteniamo tutti i
modi di disporre 4 oggetti presi a 3 a 3 cioè

4!
=4
3!1!
abbiamo il giusto numero di equazioni. Per le equazioni omogenee di Maxwell si propone
quindi la forma
∂µ Fνρ + ∂ρ Fµν + ∂ν Fρµ = 0
Una verica componente per componente conferma che la scelta è giusta e che questa
equazione veramente è equivalente alle equazioni di Maxwell omogenee.
Usando il simbolo di Levi-Civita è utile a questo punto introdurre il tensore elettroma-
gnetico duale
F̃µν = µνρσ F ρσ
5.7. FORZA DI LORENTZ 71

in modo da scrivere le equazioni omogenne di Maxwell nella semplice forma

∂µ F̃ µν = 0 (5.6)

Le equazioni di Maxwell possono quindi essere scritte in maniera covariante tramite le (5.5)
e le (5.6).
Per studiare le trasformazioni di Lorentz dei potenziali scalare e vettore basta osservare
che essi formano un 4-vettore e perciò si trasformano come

A0µ = Λµν Aν

Nel caso di due sistemi di riferimento in moto relativo a velocità v lungo l'asse x1 si avrà

φ0 = γ(φ − vA1 )
A01 = γ(A1 − vφ)
A02 = A2
A03 = A3

Analogamente per i campi elettrico e magnetico basta scrivere le trasformazioni del tensore
elettromagnetico
(F 0 )µν = Λρ µ Λσν Fρσ
ed esplicitare le componenti. Un semplice prodotto di matrici fornisce, :

E10 = E1
E20 = γ(E2 − vB3 )
E30 = γ(E3 − vB2 )
B10 = B1
B20 = γ(B2 + vE3 )
B30 = γ(B3 + vE2 )

Si noti come un campo puramente elettrico in un sistema di riferimento inerziale può


mostrare sia componenti elettriche che magnetiche in un altro. I concetti di campo elettrico
e di campo magnetico sono del tutto relativi.

5.7 Forza di Lorentz

Le equazioni di Maxwell dicono come, data una distribuzione di cariche (descrtta da ρ) e


dato il loro movimento (descritto da ~
j ) siano determinati il campo elettrico e il campo ma-
gnetico. Tuttavia non dicono nulla su come i campi ~ B
E, ~ inuenzino il moto delle particelle
cariche. Questo è descritto dalla cosiddetta forza di Lorentz, cioè da una espressione per
la forza generata da un campo elettromagnetico che inserita nelle equazioni del moto (di
Newton o relativistiche) determina le traiettorie dei punti materiali carichi elettricamente.
72 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

La forza di Lorentz è, nel caso più generale


 
~ + 1B
F~ = e E ~ × ~v
c

In formalismo 4-dimensionale essa si può tradurre in una espressione che lega la derivata
del 4-impulso rispetto al tempo proprio con il tensore elettromagnetico e la 4-velocità

dpµ 1
= F µν uν
dτ c

5.8 Formalismo lagrangiano

Come già commentato nel capitolo sulla meccanica relativisitca l'interazione a distanza
in relatività si deve pensare sempre come mediata da un campo avente una sua densità
di energia-impulso e quindi assimilabile a un ente sico che partecipa alla dinamica del
sistema assieme alle particelle che ne sono sorgenti. Una trattazione completa di un sistema
comprendente le sue forze deve perciò passare attraverso la formulazione di un principio
di minima azione, o equivalentemente di un formalismo lagrangiano, che comprenda sia
le particelle materiali che i campi che ne trasmettono le interazioni. In questa sezione
esporremo la formulazione lagrangiana di un sistema di particelle accoppiato al campo
elettromagnetico.
Scriviamo l'azione di particelle nel campo elettromagnetico come composta di tre parti

S = Smat + Sint + Scampo

in cui Smat è l'azione delle N particelle libere vista a suo tempo

N
X Z t1 q
Smat = − mA 1 − vA2 dt
A=1 t0

Scampo è il termine di puro campo in assenza di materia e dovrebbe riprodurre le equazioni


di Maxwell in assenza di cariche elettriche e correnti. Esso deve essere sia invariante di
Lorentz che invariante di gauge. Inoltre, poichè le equazioni di Maxwell in forma covariante
involvono derivate prime di Fµν , ci aspettiamo che la corrispondente densità di Lagrangiana,
da cui esse sono ottenute attraverso le equazioni di Eulero-Lagrange con una operazione di
derivazione, sia un Lorentz-invariante quadratico nelle Fµν e senza derivate. Ci sono due
1
invarianti di Lorentz e di gauge indipendenti con questi requisiti

Fµν F µν e Fµν F̃ µν

Abbiamo però visto che di questi due invarianti il primo è anche invariante di parità,
mentre il secondo non lo è. Poichè i fenomeni elettromagnetici, per quanto ne sappiamo

1 Ovviamente F̃µν F̃ µν = Fµν F µν , come è facile vericare


5.8. FORMALISMO LAGRANGIANO 73

sperimentalmente, non presentano violazioni della simmetria di parità, ne a livello classico


e nemmeno a quello quantistico, escluderemo la possibilità che il secondo termine possa
comparire nella densità di lagrangiana L. Pertanto assumiamo che l'azione sia data da
Z Z
4
Scampo = d xL = λ d4 xFµν F µν

ove d4 x = dx0 dx1 dx2 dx3 . La costante λ davanti all'integrale sarà determinata dalla ri-
chiesta che eettivamente le equazioni del moto forniscano le equazioni di Maxwell, con le
giuste costanti. Ricordando la denizione di Fµν in termini del 4-potenziale Aµ possiamo
usare le equazioni di Eulero-Lagrange

∂L ∂L
∂ρ − =0
∂∂ρ Aµ ∂Aµ
per ricavare le equazioni del moto. Queste risultano avere la forma

∂ρ F ρµ = 0
complementate dall'identità di Bianchi

∂ρ F̃ ρµ = 0
Sappiamo che l'identità di Bianchi da origine alle equazioni omogenee di Maxwell, mentre
l'altra equazione da origine a quelle disomogenee che sono accoppiate alla materia. Il
fatto che qui esse a secondo membro siano nulle rispecchia l'assunto iniziale che stiamo
µ
trattando un campo in assenza di materia. Il termine proporzionale a j che abbiamo
visto a secondo membro dare le equazioni di Maxwell disomogenee complete verrà dunque
dal termine di interazione materia-campo Sint . Questo dovrà essere un Lorentz-invariante
µ
contenente appunto j accoppiata in qualche modo al campo Aµ . La maniera più semplice
di accoppiare questi due campi in grado di fornire, attraverso Eulero-Lagrange, le equazioni
di Maxwell disomogenee è quella di assumere
Z
Sint = ω d4 x j µ Aµ

Anche qui la costante ω davanti all'integrale sarà determinata richiedendo che vengano
riprodotte le corrette costanti nelle equazioni di Maxwell. Applicando Eulero-Lagrange a
tutto il sistema Sint + Scampo , a dierenza di prima, ove comparivano solo derivate della L
rispetto a ∂ρ Aµ , ora compare anche una derivata della densità di lagrangiana rispetto ad
Aµ , portando alle equazioni
∂ρ F ρµ = j µ
a patto che si scelga λ = −ω/4. La scelta di porre ω = 1 porta, come vedremo tra breve, al
corretto accoppiamento materia-campo, cioè alla giusta espressione per la forza di Lorentz.
L'azione totale del sistema materia-campo elettromagnetico sarà perciò

N Z Z Z
1
X q
4 µ
S=− mA 2
dt 1 − vA + d xj Aµ − d4 xFµν F µν
A=1
4
74 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

Ricordando le espressioni della densità di carica e di corrente per un sistema di particelle


ognuna avente carica eA
N
X
ρ(~x, t) = eA δ (3) (~x − ~xA (t))
A=1
XN
~j(~x, t) = eA~vA (t)δ (3) (~x − ~xA (t))
A=1

perveniamo alla lagrangiana di un sistema di particelle materiali immerso in un campo


elettromagnetico

X q X X
L=− mA 1 − vA2 + eA φ(xA ) − ~ A ) + Lcampo
eA~vA · A(x
A A A

Prima di calcolare le equazioni del moto, ricaviamo il momento coniugato P~A delle coordi-
nate ~xA
∂L
P~A ≡ ~ A)
= p~A + eA A(x
∂~vA
ove p~A = mA γ(vA )~vA è il consueto impulso della particella materiale. Per applicare Eulero-
Lagrange per le variabili ~x, ~v
d ∂L ∂L
=
dt ∂~vA ∂~xA
calcoliamo innanzitutto il termine ∂L/∂~xA

∂L ~ = eA ∇(
~ A~ · ~vA ) − eA ∇φ
~
= ∇L
∂~xA ~vA =cost.

Dimostriamo che vale l'identità

~ A
∇( ~ · ~v ) = (~v · ∇)
~ A~ + ~v × (∇
~ × A)
~ (5.7)

Ciò può essere fatto in compnenti, tenendo conto della relazione

δjl δkm = δjm δkl + ijk ilm (5.8)

La componente j-sima del primo membro della (5.7) si può scrivere

~ · ~v ) = ∂j Ak v k = δjl δkm ∂l Am v k
∂j (A

che equivale a moltiplicare il primo membro della (5.8) per ∂l Am v k . La (5.8) ci fornisce
allora
~ × A)
δjl δkm ∂l Am v k = (δjm δkl + ijk ilm )∂l Am v k = v k ∂k Aj + jki v k (∇ ~ i
5.9. TENSORE ENERGIA-IMPULSO DEL CAMPO ELETTROMAGNETICO 75

e cioè la (5.7). Pertanto

∂L ~ A ) + eA~vA × B(x
~ A(x ~ A ) − eA ∇φ(x
~
= eA (~vA · ∇) A)
∂~xA
Da ciò, usando le equazioni di Eulero-Lagrange per le coordinate ~xA e le velocità ~vA
delle particelle si ottiene l'espressione per la forza di Lorentz vista prima

dpµ
= F µν uν

Questa che abbiamo esposto è la lagrangiana generale dell'elettrodinamica classica di un
sistema di particelle e sta alla base della generalizzazione quantistica nota come QED
(quantoelettrodinamica), uno dei massimi successi della Teoria Quantistica dei Campi.
Si noti che il calcolo del momento coniugato alle coordinate ~xA delle particelle, nel caso
di accoppiamento con il campo elettromagnetico dato dalla Sint proposta sopra, porta a

∂L
P~A = ~ A)
= p~A + eA A(x
∂~xA
con p~A impulso della particella libera, cioè la cosiddetta regola minimale di accoppiamento
tra materia carica e un campo elettromagnetico esterno.
Inne calcoliamo l'hamiltoniana che ci darà l'energia totale del sistema. Cominciamo
da Smat + Sint (indichiamo per brevità ~ A = A(x
A ~ A) e φA = φ(xA )

X
H = ~vA · P~A − L
A
X q 
= mA γA vA2 ~ A · ~vA + mA
+ eA A 1− vA2 ~ A · ~vA + eA φA
− eA A
A
X
= (mA γA + eA φA )
A

Si noti che il contributo all'energia dovuto alla presenza di campo elettromagnetico proviene
tutto dal solo potenziale scalare.

5.9 Tensore energia-impulso del campo elettromagneti-

co

Nel caso del campo elettromagnetico, descritto dalla densità di lagrangiana

1
L = − Fµν F µν
4
calcoliamo il tensore energia impulso

∂L
T µν = ∂µ Aσ − δνµ L
∂∂µ Aσ
76 CAPITOLO 5. IL CAMPO ELETTROMAGNETICO

Essendo
∂L 1 ∂Fαβ 1 ∂(∂α Aβ − ∂β Aα )
= − F αβ = − F αβ
∂∂µ Aσ 2 ∂∂µ Aσ 2 ∂∂µ Aσ
∂∂α Aβ
= −F αβ = −F αβ δαµ δβσ = −F µσ
∂∂µ Aσ
si ha
1
T µν = −F µσ ∂ν Aσ + δνµ Fρτ F ρτ
4
Alzando l'indice ν
1
T µν = −F µσ ∂ ν Aσ + g µν Fρτ F ρτ
4
Questo tensore non è simmetrico. Costruiamoci allora un tensore

T 0µν = T µν + ∂σ ψ µνσ
che sia simmetrico. Allo scopo prendiamo

ψ µνσ = Aµ F νσ
cosicchè
∂σ ψ µνσ = (∂σ Aµ )F νσ + Aµ ∂σ F νσ
In assenza di cariche il secondo termine scompare e quindi

∂σ ψ µνσ = F νσ ∂σ Aµ
Perciò il nuovo tensore energia impulso sarà ora simmetrico e varrà
 
µν µσ 1
Tcampo =− F F σν − g µν Fρτ F ρτ
4
Si vede subito che la traccia
T µµ = 0
è nulla (il campo elettromagnetico classico è conformemente invariante) ed esplicitando le
componenti

E2 + B2
T 00 = H =
2
T 0i = S i
1 2
T 11 = (E + E32 − E12 + B22 + B32 − B12 )
2 2
1 2
T 22 = (E + E12 − E22 + B32 + B22 − B12 )
2 3
1 2
T 33 = (E + E22 − E32 + B12 + B22 − B32 )
2 1
T ij = −E i E j + B i B j i 6= j
ij
Le componenti T = σ ij si dicono tensore degli sforzi di Maxwell, mentre le componenti
0i
T che devono fornire la densità di impulso del sistema, sono date dalle componenti del
vettore di Poynting ~=E
S ~ ×B
~, del quale si può così comprendere il signicato sico.
5.10. TENSORE ENERGIA-IMPULSO DI MATERIA ACCOPPIATA AL CAMPO ELETTROMAGNET

5.10 Tensore energia-impulso di materia accoppiata al

campo elettromagnetico

Ricordando le denizioni di densità e corrente di materia


X
µ(x) = mn γ(vn )δ (3) (~x − ~xn (t)) = Tmat
00

n
X
~π (x) = p~n δ (3) (~x − ~xn (t)) = Tmat
i0

ovvero, usando il 4-vettore pµ


µ0
X
Tmat (x) = pµn δ (3) (~x − ~xn (t))
n

µ0
possiamo vedere le componenti Tmat del tensore energia-impulso di un sistema di particelle
libere come le densità di 4-impulso. Queste, assieme alle densità di correnti di 4-impulso
formano come visto a suo tempo 4 equazioni di continuità

µν
∂ν Tmat =0

Se le particelle non sono più libere, ma intergaenti elettromagneticamente, questa equa-


zione di continuità non vale più e deve essere sostiutita da una più generale che comprende
anche il contributo del tensore energia-impulso del campo elettromagnetico. Denendo
infatti
µν
T µν = Tmat µν
+ Tcampo
si ha l'equazione di continuità
∂µ T µν = 0
valida per tutto il sistema chiuso costituito da materia più campo elettromagnetico.

Potrebbero piacerti anche