Sei sulla pagina 1di 25

Guido Corbò

Note di relatività

Generalità

Il principio di relatività di Einstein consiste nell'aermare che le leggi della

sica sono le stesse in qualsiasi sistema di riferimento inerziale. Ciò implica

l'impossibilità di privilegiare un particolare sistema di riferimento inerziale

rispetto ad un altro. Le leggi della meccanica classica, contenute nell'equazione

f = ma

sono eettivamente invarianti nel passaggio da un sistema inerziale ad un altro,

se si assumono le trasformazioni di Galileo.

Invece, le equazioni di Maxwell non sono invarianti sotto trasformazioni di

Galileo. Infatti, da tali trasformazioni si ricava la legge classica di composizione

delle velocità. Per esempio

vx0 = vx − V (1)

se V è la velocità con la quale trasla, lungo l'asse x, il riferimento O0 . D'altra

parte, nel vuoto, la soluzione generale delle equazioni di Maxwell per una

propagazione lungo l'asse x è

Φ = f (x − ct) + g(x + ct) (2)

cioè una propagazione con velocità isotropa; ovvero con la stessa velocità tanto

nel verso delle x crescenti quanto in quello delle x decrescenti. Secondo le


0
trasformazioni di Galileo, in un nuovo riferimento O avremmo due velocità

diverse per la propagazione in un senso e nell'altro; ma ciò signicherebbe che

l'equazione d'onda dovrebbe avere una struttura diversa nel nuovo riferimento,

in contraddizione con il principio di relatività. Non rimane che ammettere che

la velocità della luce sia un invariante rispetto alle trasformazioni da un sistema

inerziale ad un altro.

1
La richiesta che la velocità della luce sia un'invariante impone la condizione

che si abbia, per il fronte di un'onda luminosa:

x2 + y 2 + z 2 = c2 t2 (3)

x02 + y 02 + z 02 = c2 t02 (4)

Per semplicità, deniamo

x0 = ct x00 = ct0 (5)

e quindi le relazioni precedenti diventano

2
x2 + y 2 + z 2 = x0 (6)

02 02 02 00 2
x +y +z = x

La relazione più semplice possibile, tra vecchie e nuove coordinate, è una

relazione lineare; dunque possiamo ipotizzare che sia, per un moto traslatorio

lungo l'asse x:

y0 = y (7)

z0 = z
x0 = αx + βx0
x00 = γx + δx0

Sostituendo nella seconda delle (6) si ottiene:

(αx + βx0 )2 + y 02 + z 02 = (γx + δx0 )2 (8)

ovvero

(αx + βx0 )2 + y 2 + z 2 = (γx + δx0 )2 (9)

Sviluppando:

2 2
α2 x2 + β 2 x0 + 2αβxx0 + y 2 + z 2 = (γ 2 x2 + δ 2 x0 + 2γδxx0 ) (10)

2
D'altra parte, deve essere x2 +y 2 +z 2 = x0 ; e dunque si deve avere identicamente

α2 − γ 2 = 1 (11)

δ2 − β 2 = 1
αβ − γδ = 0

2
Possiamo allora utilizzare la seguente parametrizzazione:

α = cosh ξ γ = sinh ξ (12)

δ = cosh ϕ β = sinh ϕ

La terza delle (11) mostra che ξ = ϕ; dunque abbiamo:

x0 = x cosh ϕ + x0 sinh ϕ (13)

x00 = x sinh ϕ + x0 cosh ϕ

Possiamo ricavare il signicato sico della quantità ϕ. Infatti, se l'origine O0 del

sistema di assi (cioè x0 = 0) si muove di moto rettilineo uniforme con velocità V


(per esempio positiva) deve essere, per ogni t

0 = V t cosh ϕ + ct sinh ϕ (14)

ovvero
sinh ϕ V
tanh ϕ = =− (15)
cosh ϕ c
Da questa si ricava (osserviamo che cosh ϕ è sempre positivo e sinh ϕ deve

risultare negativo):

1 −V /c
cosh ϕ = q sinh ϕ = q (16)
1 − V 2 /c2 1 − V 2 /c2

In denitiva, possiamo scrivere così le relazioni tra i due sistemi di coordinate,

che vengono chiamate trasformazioni di Lorentz:


x−Vt
x0 = q (17)
1 − V 2 /c2
y0 = y
z0 = z
0 t − (V /c2 )x
t = q
1 − V 2 /c2

È molto utile introdurre una nuova notazione per le coordinate spaziali.

Precisamente, ponendo un indice in alto:

x ≡ x1 y ≡ x2 z ≡ x3 (18)

3
scriviamo così le trasformazioni di Lorentz:

x1 − βx0
x01 = √ (19)
1 − β2
x02 = x 2

x03 = x3
x0 − βx1
x00 = √
1 − β2
dove abbiamo posto
V
β= (20)
c
È utile anche porre questa denizione:

1
γ=√ (21)
1 − β2
e scrivere le trasformazioni di Lorentz in questo modo:

x01 = (x1 − βx0 )γ (22)

x02 = x2
x03 = x3
x00 = (x0 − βx1 )γ

Contrazione di Lorentz

Le trasformazioni di Lorentz implicano l'esistenza di fenomeni che non sono

previsti dalla meccanica galileiana. Uno di tali fenomeni è conosciuto come

contrazione di Lorentz o contrazione delle lunghezze. Vediamo di cosa si tratta.

In meccanica galileiana, la lunghezza di un segmento, per esempio la lunghezza

di una sbarra rigida, è una quantità assoluta; nel senso che qualsiasi osservatore,

che intenda misurarla, trova sempre lo stesso valore l0 .

E' ovvio che cosa si intenda per misura di una sbarra che è a riposo rispetto

ad un osservatore: questi sovrappone alla sbarra una riga graduata che consente

la valutazione della misura. Per un osservatore rispetto al quale la sbarra è in

4
movimento, l'operazione da eseguire è, in linea di principio, la seguente: egli

deve marcare nello stesso istante la posizione dei due estremi della sbarra che

gli scorre davanti; e successivamente misurare la distanza tra tali posizioni. Ci

aspettiamo che il risultato sia ancora l0 . Le cose vanno eettivamente così in

meccanica galileiana ma vanno diversamente dal punto di vista relativistico.

Supponiamo infatti che la sbarra sia posta lungo l'asse delle ascisse e trasli

lungo tale asse con velocità V rispetto ad un osservatore O. La relazione tra le


coordinate di O e quelle di O0 , che segue la sbarra, è data dalle trasformazioni
di Lorentz; in particolare
x−Vt
x0 = q (23)
1 − V 2 /c2
Per le posizioni degli estremi A e B della sbarra devono valere evidentemente

x A − V tA x B − V tB
x0A = q x0B = q (24)
1 − V 2 /c2 1 − V 2 /c2

dove tA e tB sono gli istanti nei quali viene rilevata da O la posizione dei due

estremi, rispettivamente. Sottraendo membro a membro si ha

xB − xA − V (tB − tA )
x0B − x0A = q (25)
1 − V 2 /c2

Il primo membro è la lunghezza l0 della sbarra a riposo in O0 ; d'altra parte,

xB − xA , che gura al secondo membro, può essere interpretata come lunghezza

l della sbarra misurata in O se in tale riferimento la misura è eseguita, come

abbiamo già notato, nello stesso istante per i due estremi; cioè tB = tA . Da ciò

risulta
l q
l0 = q ovvero l = l0 1 − V 2 /c2 (26)
1 − V 2 /c2

O, la sbarra risulta contratta della quantità


q
In altre parole, vista da 1 − V 2 /c2 .

Dilatazione dei tempi

In meccanica galileiana, ci aspettiamo che la durata di un certo fenomeno

sia una quantità assoluta, indipendente dal sistema di riferimento. Ma, anche in

5
questo caso, la relatività porta ad un nuovo risultato. Precisamente, immaginiamo

che il fenomeno in questione sia l'accensione di una lampadina ad un certo istante

tA e il successivo spegnimento ad un istante tB , con la lampadina ferma nel

sistema di riferimento O. Per quanto tempo rimane accesa la lampadina, per


0
un osservatore O che trasla con velocità V? Lo vediamo, come sempre, dalle

trasformazioni di Lorentz. In particolare, da

t − (V /c2 ) x
t0 = q (27)
1 − V 2 /c2
Per l'istante di accensione e quello dello spegnimento valgono evidentemente

tA − (V /c2 ) xA tB − (V /c2 ) xB
t0A = q t0B = q (28)
1 − V 2 /c2 1 − V 2 /c2
Sottraendo membro a membro:

tB − tA − (V /c2 ) (xB − xA )
t0B − t0A = q (29)
1 − V 2 /c2
Al primo membro compare la durata T0 del fenomeno misurata da O0 ; al secondo

membro compare la durata T = tB − tA per il sistema nel quale, d'altra parte, la

lampadina è ferma in una certa posizione: xB = xA . Dunque

T
T 0=q (30)
1 − V 2 /c2
ovvero, per l'osservatore in movimento, l'intervallo di tempo risulta dilatato della

quantità
1
q (31)
1 − V 2 /c2
L'intervallo di tempo (innitesimo) misurato tra due eventi che avvengono

nello stesso punto dello spazio (tridimensionale) viene chiamato intervallo di


tempo proprio tra tali eventi e viene indicato con il simbolo dτ . In un generico

sistema di riferimento risulta quindi:

dt = γdτ (32)

Due gemelli non sono coetanei!

6
Supponiamo che un ipotetico astronauta compia un lungo viaggio spaziale

e poi torni sulla Terra, dove lo ha aspettato suo fratello gemello. Al momento

della partenza, i due hanno evidentemente la stessa età. Che età avranno quando

si incontrano di nuovo sulla Terra? Per l'astronauta è passato un tempo


Z τ2
Ta = dτ = τ2 − τ1 (33)
τ1

Per il gemello sulla Terra è passato il tempo

Z t2 Z τ2 Z τ2
TT = dt = γ dτ > dτ = Ta (34)
t1 τ1 τ1

poiché γ > 1. Ciò signica che Ta < TT ovvero che l'astronauta è invecchiato

meno del fratello.

Composizione delle velocità

Dalle trasformazioni di Lorentz si ricava facilmente la legge di composizione

relativistica delle velocità. Per semplicità riferiamoci alla sola componente x. Per

incrementi innitesimi delle coordinate spazio-temporali, si ha:

dx − V dt
dx0 = q (35)
1 − V 2 /c2
dt − (V /c2 ) dx
dt0 = q (36)
1 − V 2 /c2

Dividendo membro a membro per dt0 :


dx0 dx − V dt
vx0 = 0
= (37)
dt dt − (V /c2 ) dx
E dividendo per dt numeratore e denominatore:

dx0 vx − V
vx0 = 0 = (38)
dt 1 − (V /c2 ) vx
Si vede che, nel limite di traslazioni a piccola velocità rispetto a quella della

luce, la legge di composizione relativistica diventa quella galileiana.

7
Come semplice esercizio, possiamo vericare che la relazione precedente

mostra l'invarianza della velocità della luce. Ponendo infatti vx = c si ha:

c−V
c0 = =c (39)
1 − (V /c2 )c
E' inoltre semplice vedere che la composizione di due velocità inferiori a quella

della luce fornisce una velocità anch'essa inferiore a quella della luce. Basta per

questo dimostrare che si ha comunque

vx − V
vx0 = <c (40)
1 − (V /c2 ) vx
per qualsiasi valore di vx e V (purché entrambe minori di c). La disuguaglianza

precedente si può scrivere infatti

V
vx − V < c − vx (41)
c
ovvero

vx (1 + V /c) < c (1 + V /c) (42)

che è sicuramente vera dal momento che vx < c .

Quadrivettori

Possiamo pensare alle x, y, z e ct come alle componenti xµ raggio vettore


del

in uno spazio a quattro dimensioni che viene chiamato spazio di Minkowski.


Chiameremo dunque quadrivettore un vettore appartenente a tale spazio. In

generale, un quadrivettore è una grandezza che, sotto una trasformazione di

Lorentz ovvero una trasformazione da un sistema inerziale ad un altro, si

trasforma come x, y, z e ct. Una qualsiasi grandezza sica vettoriale sarà dunque

quadrivettoriale. Le quattro componenti vengono chiamate


di fatto una grandezza

componenti controvarianti e sono scritte con un indice in alto. Ricordiamo che

x0 = ct x1 = x x2 = y x3 = z (43)

e scriveremo, in generale

aµ = (a1 , a2 , a3 , a0 ) (44)

8
Chiameremocomponenti spaziali le prime tre componenti del quadrivettore;
e componente temporale la quarta componente. Potremo indicare anche così:

aµ = (a , a0 ) (45)

dove il carattere grassetto indica, come al solito, un vettore nello spazio

tridimensionale.

È molto semplice vericare che per due quadrivettori aµ e bµ la quantità

a0 b 0 − a1 b 1 − a2 b 2 − a3 b 3 (46)

risultainvariante sotto trasformazioni di coordinate, cioè sotto trasformazioni di


Lorentz; dunque essa può denire il prodotto scalare tra i due quadrivettori:

a · b ≡ a0 b0 − a1 b1 − a2 b2 − a3 b3 (47)

Possiamo anche scrivere così, sottintendendo la somma su indici ripetuti:

a · b = gµν aµ bν (48)

dove

gµν = 0 se µ 6= ν g00 = 1; g11 = −1; g22 = −1; g33 = −1 (49)

gµν viene chiamato tensore metrico o semplicemente metrica dello spazio

quadridimensionale. Con l'ausilio di gµν possiamo denire le componenti

covarianti di un quadrivettore, che sono scritte con un indice in basso

aµ = gµν aν (50)

e possiamo dunque scrivere il prodotto scalare anche così:

a · b = aµ b µ = aµ b µ (51)

In particolare possiamo calcolare il prodotto scalare

a · a = (a0 )2 − (a1 )2 − (a2 )2 − (a3 )2 (52)

che è naturale denire norma del quadrivettore a. Poiché le quantità aµ sono

arbitrarie, vediamo che la norma di un quadrivettore può essere positiva, negativa

9
o nulla. Corrispondentemente, diciamo che il quadrivettore è di tipo tempo
timelike), spazio (spacelike) o luce (lightlike).
(

Inversione temporale e causalità

Consideriamo un evento P1 : per esempio il lampo di un ash fotograco

che avviene ad un certo istante t1 nel punto dello spazio di coordinate (x1 , y1 , z1 );
ed un altro evento P2 che immaginiamo sia un altro lampo all'istante t2 in un

altro punto di coordinate (x2 , y2 , z2 ). Ai due eventi corrispondono dunque i raggi

vettori

xµ1 = (x1 , y1 , z1 , ct1 ) xµ2 = (x2 , y2 , z2 , ct2 ) (53)

Si denisce distanza tra i due eventi il vettore

sµ = xµ2 − xµ1 = (x2 − x1 , y2 − y1 , z2 − z1 , c(t2 − t1 )) (54)

Osserviamo ora che se la distanza tra i due eventi P1 e P2 è di tipo spacelike, la

successione temporale di essi può essere invertita, a patto di osservare tali eventi

da un opportuno sistema di riferimento. Supponiamo per semplicità che i due

lampi avvengano sull'asse x (dunque con coordinate y e z uguali a zero) e che sia

c2 (t2 − t1 )2 − (x2 − x1 )2 < 0 (55)

ed inoltre che, in un dato sistema di riferimento, sia

t2 > t1 (56)

x 2 > x1 (57)

Possiamo scrivere dunque che per tali eventi:

c (t2 − t1 ) < x2 − x1 (58)

ovvero
c (t2 − t1 )
<1 (59)
x2 − x1
10
Osserviamo ora i due eventi precedenti da un altro sistema di riferimento. Con

una trasformazione di Lorentz abbiamo

t1 − (V /c2 ) x1
t01 = q (60)
1 − V 2 /c2
t2 − (V /c2 ) x2
t02 = q (61)
1 − V 2 /c2

cioè
t2 − t1 − (V /c2 )(x2 − x1 )
t02 − t01 = q (62)
1 − V 2 /c2
Vericare se è possibile che nel nuovo sistema di riferimento t02 − t01 sia negativo,
equivale a vericare se è possibile che si possa ottenere

V
t2 − t1 − (x2 − x1 ) < 0 (63)
c2
ovvero
(t2 − t1 ) c
V > c (64)
x2 − x1
D'altra parte, ricordando la (59), ciò signica che V deve essere maggiore di una

certa velocità comunque minore di c: cosa che è sempre possibile avere.

Da ciò segue che l'evento P1 causa dell'evento P2 solo se la


può essere la

distanza tra tali eventi è di tipo timelike o lightlike; diversamente esisterebbero

sistemi di riferimento rispetto ai quali osserveremmo un eetto che precede

temporalmente la sua causa: in contraddizione con il principio di causalità.

Trasformazioni di Lorentz generiche

Scriviamo così una generica trasformazione di Lorentz:

x0µ = Λµν xν (65)

della quale la (22) è il caso particolare che riguarda un moto traslatorio di O0


lungo l'asse x (con assi paralleli). Per un generico quadrivettore, del quale xµ è

11
il prototipo, vale altrettanto la seguente legge di trasformazione, che è dunque la

legge di trasformazione per le componenti controvarianti:


a0µ = Λµν aν (66)

Tale relazione può essere invertita, scrivendo dunque

aµ = Θµν a0ν (67)

dove Θµν è la matrice inversa di Λµν :

Θνµ Λµσ = δσν (68)

Ricordiamo che il prodotto scalare a·b è un invariante. Scriviamo allora,

cambiando opportunamente nome agli indici muti:

a · b = a0µ b0µ = a0ρ b0ρ = Λρσ aσ b0ρ = aσ bσ (69)

Poiché tale uguaglianza deve essere valida per qualsiasi valore di aσ segue

bσ = Λρσ b0ρ (70)

che è simile alla (66) a parte lo scambio delle quantità relative ad O e O0 .


Invertendo tale relazione scriviamo

0
b µ = Θνµ bν (71)

Le equazioni di Maxwell non omogenee

Ci accorgiamo che nello spazio quadridimensionale di Minkowski è molto

semplice scrivere le equazioni di Maxwell in forma compatta. A questo scopo,


µν
inventiamoci la seguente matrice antisimmetrica F (ponendo dunque gli indici

in alto). È proprio il caso di dire inventiamoci perché, per il momento, questa

tabella non ha alcun particolare signicato; è soltanto un utile metodo di scrittura:




0 −Bz By Ex /c
Bz 0 −Bx Ey /c
F µν = (72)

−By Bx 0 Ez /c


−Ex /c −Ey /c −Ez /c 0

12
E inventiamoci anche questa matrice colonna:


jx

µ
jy
j = (73)

jz



Ebbene, le equazioni di Maxwell non omogenee sono contenute in questa relazione:

∂µ F µν = µ0 j ν (74)

dove abbiamo denito



∂µ ≡ (75)
∂xµ
Infatti, poniamo per esempio ν = 1. Otteniamo:

∂1 F 11 + ∂2 F 21 + ∂3 F 31 + ∂0 F 01 = µ0 j 1 (76)

ovvero
∂Bz ∂By 1 ∂Ex
− − 2 = µ0 j 1 (77)
∂y ∂z c ∂t
cioè:

(rotB )x = µ0 jx + µ0 ε0
∂Ex
(78)
∂t
Ponendo ν = 2, 3 si ottengono equazioni simili per le altre componenti. Ponendo

ν=0 otteniamo invece:

∂1 F 10 + ∂2 F 20 + ∂3 F 30 + ∂0 F 00 = µ0 j 0 (79)

ovvero
1 ∂Ex 1 ∂Ey 1 ∂Ez
+ + = µ0 cρ (80)
c ∂x c ∂y c ∂z
cioè

div E = µ0 c2 ρ = ρ/ε0 (81)

E' inoltre molto semplice scrivere l'equazione di continuità. Infatti si ha

ovviamente:

∂µ ∂ν F µν = 0 (82)

poiché sulla antisimmetrica F µν agisce l'operazione ∂µ ∂ν che


quantità è

evidentemente simmetrica negli indici µ e ν . D'altra parte, per la (74), si ha

∂µ ∂ν F µν = µ0 ∂µ j µ (83)

13
dalle (82) e (83) si ha dunque:

∂µ j µ = 0 (84)

che è proprio l'equazione di continuità. Scrivendo esplicitamente, infatti:

∂1 j 1 + ∂2 j 2 + ∂3 j 3 + ∂0 j 0 = 0 (85)

ovvero

div j + 1c ∂t∂ j 4 = div j + ∂ρ


∂t
=0 (86)

Campi tensoriali nello spazio di Minkowski

In un dato sistema di riferimento, un campo scalare è denito da

una funzione ordinaria delle coordinate spaziali e del tempo (di solito, nelle

applicazioni, tale funzione è continua e derivabile un numero arbitrario di volte).

Un classico esempio è fornito dalla temperatura in una certa zona della Terra: la

temperatura è infatti funzione della latitudine, longitudine e quota del punto che

ci interessa; e cambia al trascorrere del tempo. Scriviamo dunque

T = T (x, y, z, ct) ≡ T (x) (87)

intendendo brevemente con x l'insieme delle quattro coordinate spazio-temporali.


Se cambiamo sistema di riferimento, lo stesso campo delle temperature sarà

descritto da una nuova funzione T 0 (x0 ) per la quale deve dunque valere:

T 0 (x0 ) = T (x) (88)

con

x0ν = Λνµ xµ (89)

Altrettanto, si può parlare di campo vettoriale v µ (x) se in due diversi sistemi di

riferimento si ha comunque:

ν
v µ (x)eµ = v 0 (x0 )e0ν (90)

14
dove con eµ e e0ν sono indicati i versori degli assi coordinati nei rispettivi sistemi

di riferimento. D'altra parte, per i versori, vale la legge di trasformazione

eµ = Λνµ e0ν (91)

Da ciò segue:

v µ (x) Λνµ e0ν = v 0ν (x0 )e0ν (92)

ovvero:

v 0ν (x0ρ = Λρσ xσ ) = Λνµ v µ (x) (93)

Per le componenti covarianti di un campo vettoriale vale evidentemente

vν0 (x0 ) = Θρν vρ (x) (94)

In generale, abbiamo campi tensoriali per i quali si verica, ad esempio:

0µν
T (x0ρ = Λρσ xσ ) = Λµα Λνβ T αβ
(x) (95)

Vogliamo ora mostrare che il gradiente di un campo scalare è un campo vettoriale


con indice covariante o, come si dice brevemente, è un vettore covariante. Dato

un campo ϕ(x) dobbiamo calcolare le derivate rispetto alle coordinate che, come

sappiamo, sono le componenti controvarianti del raggio vettore. In altri termini,

dobbiamo calcolare

ϕ(x) (96)
∂xµ
In un altro sistema di riferimento scriviamo, altrettanto:

∂ 0 0
ϕ (x ) (97)
∂x0µ
D'altra parte, possiamo scrivere facilmente questa serie di uguaglianze:

∂ 0 0 ∂ ∂xν ∂ ∂

ϕ (x ) = 0µ
ϕ(x) = 0µ ν
ϕ(x) = Θνµ ν ϕ(x) (98)
∂x ∂x ∂x ∂x ∂x
La prima uguaglianza segue dal fatto che ϕ è un campo scalare; la seconda dalla

regola di derivazione delle funzioni composte; e la terza dalla proprietà (89). La

(98) rappresenta dunque proprio quanto volevamo dimostrare. Si può scrivere

anche così:

ϕ(x) = ∂µ ϕ(x) (99)
∂xµ
15
facendo apparire in modo più esplicito la natura covariante dell'indice µ.
Possiamo allora ricavare dalla (84) una conseguenza molto importante.

Poiché l'operatore ∂µ produce un indice covariante e ∂µ j µ è una quantità scalare

(in rispetto del principio di relatività deve essere nulla in qualsiasi sistema di

riferimento, ovvero la conservazione della carica elettrica deve comunque valere),

segue che jµ vettore controvariante . Stabilito questo, dalla


è necessariamente un

è necessariamente un tensore controvariante che è chiamato


µν
(74) segue che F

tensore elettromagnetico. Con queste conclusioni, le semplici tabelle (72) e (73)


acquistano un valore del tutto rilevante: esse mostrano il contenuto di un campo

tensoriale e vettoriale rispettivamente. Si dice allora che le equazioni di Maxwell,

scritte nella (74) sono espresse in forma covariante nel senso che sono relazioni tra
enti vettoriali o tensoriali nello spazio di Minkowski. In generale, per rispettare

il principio di relatività, tutte le equazioni della sica dovranno dunque risultare

covarianti.

Meccanica relativistica

Passando allo studio della dinamica del punto materiale, ci accorgiamo

subito che l'equazione newtoniana, così come è scritta,

F = dtd p (100)

è sicuramente non covariante, poiché è una relazione tra vettori dello spazio

ordinario tridimensionale e non tra tensori quadridimensionali. Dobbiamo quindi

rimpiazzare la (100) con un'equazione covariante che, d'altra parte, riproduca la

(100) stessa nel limite di velocità piccole rispetto a quella della luce. Cominciamo

con il denire le quantità cinematiche rilevanti.

Supponiamo di individuare un punto materiale in movimento in un certo

riferimento inerziale R che, ad un dato istante t, ha coordinate spaziali x, y e z.


Ciò equivale a conoscere il raggio vettore

xµ = (x, y, z, ct) (101)

16
Supponiamo che in tale istante il punto abbia una velocità (tridimensionale) v.
Dopo un intervallo di tempo innitesimo dt, il punto si è spostato di una quantità
innitesima e l'incremento del raggio vettore risulta

dxµ = (dx, dy, dz, cdt) = (vx dt, vy dt, vz dt, cdt) (102)

La sua norma è

(dxµ )2 = (c2 − vx2 − vy2 − vz2 ) dt2 = (c2 − v 2 ) dt2 (103)

dove con v2 denotiamo il quadrato del modulo tridimensionale della velocità.

Osserviamo ora il punto materiale da un altro sistema di riferimento R0 che si

muove di moto traslatorio rispetto a R proprio con velocità v . La norma rimane la

stessa; d'altra parte, rispetto ad R0 il punto materiale è fermo. Per conseguenza,

vale la seguente uguaglianza:

(dx0µ )2 = c2 dt02 = (c2 − v 2 ) dt2 = (dxµ )2 (104)

dalla quale si vede che l'intervallo di tempo dt0 , misurato nel sistema di riferimento
che in quell'istante segue il punto materiale nel suo movimento, è un invariante

relativistico (poiché lo sono (dxµ )2 e c2 ). Tale intervallo di tempo viene di solito

indicato con il simbolo dτ e, come abbiamo già avuto occasione di dire, viene

chiamato intervallo di tempo proprio. Si ha dunque:


q
dt0 = dt 1 − v 2 /c2 ≡ dτ (105)

Riconsideriamo l'elemento spazio-temporale (che è un quadrivettore innitesimo)

dxµ = (dx , cdt) (106)

Dividendo per dτ (che è una quantità scalare) otteniamo dunque un altro

quadrivettore:

v
 
 = (γ v , γc)
µ dxµ  c
u ≡ = q , q (107)
dτ 1 − v 2 /c2 1 − v 2 /c2
che è naturale denire come quadrivelocità, giacché la sua parte spaziale coincide
proprio con l'ordinario vettore velocità, nel limite non relativistico. Notiamo che

la quadrivelocità ha norma costante (positiva) uguale a c2 :


v2
!
µ 2 2 2 2 2 2 2
(u ) = γ c − γ v = γ c 1− 2 = c2 (108)
c

17
Moltiplicando per la massa m del punto materiale deniamo altrettanto il

quadrimpulso :
mv
 
 = (γmv , γmc)
µ µ mc
p ≡ m u = q , q (109)
1 − v 2 /c2 1 − v 2 /c2
che evidentemente ha norma costante uguale a m2 c2 .
Per quanto riguarda la dinamica, ci riferiamo alla forza di Lorentz che,

d'altra parte, è una forza fondamentale della Natura; per la quale non sono

necessari modelli fenomenologici, come invece accade per le forze elastiche o le

forze di attrito ecc.

In termini di vettori tridimensionali sappiamo che:

f = q (E + v × B ) (110)

Per la componente x, per esempio:

fx = q (Ex + vy Bz − vz By ) (111)

In termini del tensore elettromagnetico:

fx = q (cF 10 + vy F 21 − vz F 13 ) (112)

D'altra parte, per denizione di uµ :


u2 u3
!
10
fx = q cF + F 21 − F 13 (113)
γ γ
Ora studiamo con cura il seguente passaggio, nel quale abbassiamo gli indici della

quadrivelocità. Ricordiamoci che, per la struttura di gµν , si ha u0 = u0 , ui = −ui


(questa è una regola generale da tenere sempre presente: la quarta componente
di un quadrivettore rimane immutata abbassando (o innalzando ) il suo indice ; le
componenti spaziali cambiano segno ).
Ricordiamoci anche dell'antisimmetria del tensore elettromagnetico. Con

queste indicazioni è facile rendersi conto che si ha:


!
1 u0 10 u2 12 u3 13 u1 11 q
f = fx = q F + F + F + F = uν F 1ν (114)
γ γ γ γ γ
(l'ultimo addendo è identicamente nullo e lo abbiamo aggiunto nell'espressione

(113); in questo modo però ci siamo avvantaggiati ottenendo una scrittura nella

quale compaiono tutti gli indici sommati).

18
Espressioni analoghe si ottengono per le altre componenti spaziali di f e in

denitiva possiamo vericare che:

γf i = qF iν uν (115)

A questo punto è naturale introdurre un'analoga espressione f 0, denita da

γf 0 = qF 0ν uν (116)

e scrivere

γf µ = qF µν uν (117)

Al secondo membro abbiamo un quadrivettore e allora lo è altrettanto il primo

membro che denisce così la quadriforza F µ :

F µ ≡ γf µ = qF µν uν (118)

A parte il fattore γ, la parte spaziale coincide con l'espressione tridimensionale

della forza di Lorentz f ; e la parte temporale risulta


F0 = γ
q
c
E ·v (119)

In denitiva, scrivendo esplicitamente la parte spaziale e quella temporale,

abbiamo il quadrivettore

F = γf , γ E · v = γf , γ f · v
q 1
   
µ
(120)
c c
L'ultimo passaggio è giusticato dal fatto che la parte magnetica della forza di

Lorentz non contribuisce (si ha un prodotto misto nullo).

Dobbiamo ora uguagliare la quadriforza ad un'espressione che contenga la

variazione di impulso, come è suggerito dall'equazione newtoniana. Per rispettare

la covarianza, non possiamo avere altro che:

dpµ
Fµ = (121)

La parte spaziale risulta:

F = ddτp = dτd q mv
=q
1 d
q
mv
(122)
1 − v 2 /c2 1 − v 2 /c2 dt 1 − v 2 /c2

19
ovvero
mv
f =
d
q
dt 1 − v 2 /c2
(123)

che, per piccole velocità, si riduce all'equazione di Newton f = m dv /dt .

Una conseguenza molto importante viene dalla quarta componente della

(121) per la quale risulta:

f · v dt = d (mc2γ) = d q mc2
(124)
1 − v 2 /c2

Al primo membro compare il lavoro compiuto dalla forza di Lorentz nel tempo

dt; dunque al secondo membro deve comparire la variazione di energia cinetica

dE . Questo ci suggerisce la seguente espressione per E:

mc2
E=q (125)
1 − v 2 /c2

In particolare, per piccole velocità, sviluppando in serie rispetto a v2, si ha:

1 v2
!
2 1
E ≈ mc 1+ 2 = mc2 + mv 2 (126)
2c 2

che, a parte il valore costante mc2 , coincide con l'espressione classica. D'altra

parte, se l'espressione corretta per l'energia cinetica è la (125), non possiamo

omettere il termine mc2 che risulta dunque presente anche per velocità nulle.

Questo termine è chiamato energia di riposo che compete ad un punto materiale

di massa m. Il solo fatto che un corpo abbia massa m implica pertanto


2
che esso possieda comunque un'energia pari a mc : massa ed energia sono

dunque strettamente correlate. Discuteremo più avanti l'eettiva validità della

(125). Un'altra relazione importante lega l'energia all'impulso di una particella.

Ricordiamo infatti che  

pµ = p , q
mc

1 − v 2 /c2
Moltiplicando per c:
 

cpµ = cp , q  = (cp , E)


mc2
2
1 − v /c2

20
da questa si ricava

c2 p2 = E 2 − c2 |p |2 (127)

nella quale p è la parte spaziale del quadrimpulso:


p = q mv 2 2 (128)
1 − v /c
Ricordiamo inoltre che

1
p2 = pµ pµ = 2 2
(mc2 − mv 2 ) = m2 c2 (129)
1 − v /c
e dunque, dalla (127):

E 2 = c2 |p |2 + m2 c4 (130)

A questo punto, è molto importante studiare il caso limite nel quale si considerano

particelle di massa nulla.

In meccanica classica, ad una particella di massa nulla competono impulso

ed energia nulli. In pratica ciò signica che, in meccanica classica, non esistono
particelle di massa nulla. O, per meglio dire, la eventuale presenza di particelle
a massa nulla non è osservabile: non possiamo accorgerci se esse intervengono in

un qualsiasi processo, dal momento che esse non apportano alcuna variazione di

impulso o di energia (e anche di momento angolare).

La situazione è completamente diversa in relatività: la presenza di particelle

di massa nulla è assolutamente ammissibile ed osservabile. Ce ne accorgiamo dalla

(129): nel limite di m che tende a zero osserviamo che il quadrimpulso è di tipo

luce:

p2 = pµ pµ = 0 (131)

ma ciò non signica che la parte spaziale e quella temporale di pµ siano

separatamente nulle. Per di più, dalla (130), possiamo anche osservare che una

particella di massa nulla possiede un'energia cinetica:

E = c |p | (132)

D'altra parte, è semplice ricavare la relazione che lega E al modulo spaziale

dell'impulso |p | e alla velocità v di una particella di massa m. Dalla (128) si ha


infatti, prendendo i moduli e moltiplicando per c2 :
c2 |p |
E= (133)
v
21
Confrontando con la (132) si vede che per una particella di massa nulla si

ha necessariamente v = c; ovvero una particella di massa nulla si muove

necessariamente alla velocità della luce.

Questi risultati non sono in contraddizione con le espressioni (125) e (128)

che sembrerebbero fornire impulso ed energia comunque nulli, quando m tende

a zero. Infatti, tali limiti sono eettivamente zero se v è diversa da c: in questo

caso la particella è inosservabile, come in meccanica classica; ma se si ammette

che il passaggio al limite m→0 sia accompagnato da v che tende a c, i limiti in

questione possono benissimo essere diversi da zero.

Notiamo che la relazione (132) è quella che lega energia e impulso di un'onda

piana monocromatica. Ciò ci permette di interpretare la propagazione del campo

elettromagnetico come propagazione di particelle di massa nulla: i fotoni.


Rimane la questione della validità della (125), dalla quale derivano le

circostanze che abbiamo appena esposto. In particolare, vogliamo valutare

l'energia di risposo per la quale deve valere

E = mc2 (134)

Si deve proprio ad Einstein un argomento a riprova di ciò.

Immaginiamo un vagone di massa M e di lunghezza L all'estremo sinistro

del quale sia posto il ash di una macchina fotograca. All'altro estremo sia posto

uno schermo S che assorbe la luce che gli viene inviata orizzontalmente, lungo

l'asse x verso destra. Se px è l'impulso del campo elettromagnetico associato alla

luce del ash, non c'è dubbio che, dopo il lampo, il vagone subirà un rinculo

acquistando una quantità di moto − px (a meno che, ma questo è assolutamente

irragionevole, non si voglia rinunciare al principio di conservazione dell'impulso).

Quando poi la luce sarà arrivata ed assorbita da S, il vagone tornerà ad avere

quantità di moto nulla. Di quanto si è spostato il vagone, viaggiando con impulso

− px , prima che la luce venga assorbita? E' evidente che la velocità del vagone è

vx = − px /M (135)

e il trasferimento della luce è avvenuto in un tempo t che è praticamente:

t = L/c (136)

22
dunque il vagone si è spostato della quantità

Lpx EL
∆xvagone = vx t = − =− (137)
Mc M c2
e di altrettanto si è spostato il suo centro di massa. D'altra parte, durante tutto

l'esperimento che si è svolto all'interno del vagone, il centro di massa del sistema

complessivo deve essere rimasto dov'era inizialmente. Come possiamo riconciliare

la (137) con quest'ultima circostanza? Evidentemente, il trasferimento della

quantità di energia raggiante E = pc da un estremo all'altro, per un tratto L, è

stato equivalente ad un trasferimento di massa m, per lo stesso tratto L in modo

tale da avere:
EL
mL = −M ∆xvagone = (138)
c2
ovvero:

E = mc2 (139)

Estensione al caso di forze arbitrarie

Possiamo estendere le considerazioni fatte, a proposito della forza di Lorentz,

al caso di forze di qualsiasi natura. Osserviamo intanto che, comunque si denisca

la quadriforza, questa è necessariamente ortogonale al quadrimpulso. Ciò è

conseguenza del fatto che il quadrimpulso ha norma costante:

d µ 2 dpµ
0= (p ) = 2pµ = 2pµ F µ (140)
dτ dτ
Consideriamo ora un punto materiale P di massa m che, ad un certo istante, nel

riferimento O, ha velocità (tridimensionale) v. Consideriamo un altro sistema

di riferimento O0 che trasla rispetto ad O proprio con velocità v. Rispetto a

quest'ultimo riferimento, P è fermo in quell'istante; dunque la sua quadrivelocità

è il vettore

v 0µ = (0, γc) (141)

D'altra parte, la quadriforza è comunque ortogonale alla quadrivelocità e si dovrà

avere in O0 , quali che siano le componenti spaziali f:


F 0µ = (f , 0) (142)

23
anché

F ·v =0
La quantità f deve coincidere con la forza newtoniana, poiché nel sistema O0 il

punto materiale si muove a velocità molto piccola rispetto a quella della luce (è

addirittura fermo!)

Per semplicità, immaginiamo che P si muova lungo l'asse x e sia sottoposto


ad una forza anch'essa diretta lungo l'asse x. Avremo dunque

F 0µ = (fx , 0, 0, 0) (143)

Le trasformazioni di Lorentz ci dicono ora quali componenti ha la quadriforza nel

sistema originale O. Precisamente, si vede che

Fx = γfx (144)

F0 = γβfx

e allora scriviamo l'equazione (121)

d
(γfx , γβfx ) = (mγvx , mγc) (145)

ovvero, ricordando che

dt = γdτ
d
(γfx , γβfx ) = γ (mγvx , mγc) (146)
dt
Semplicando il fattore γ:
d
(fx , βfx ) = (mγvx , mγc) (147)
dt
La componente spaziale di questa equazione è:

d mvx
fx = q (148)
dt 1 − vx2 /c2

che, per piccole velocità, si riduce alla formula galileiana. Dall'equazione per la

parte temporale
d
βfx = mγc
dt
ricaviamo
mc2
fx vx dt = d(mc2 γ) = d q (149)
1 − v 2 /c2

24
Al primo membro compare il lavoro fatto dalla forza nel tempo dt; dunque al

secondo membro deve comparire la variazione di energia cinetica dE . Anche ora

vediamo dunque che la relatività ci suggerisce l'espressione

mc2
E=q (150)
1 − v 2 /c2

25