Sei sulla pagina 1di 26

Guido Corbò

Note di relatività

Generalità

Il principio di relatività di Einstein consiste nell'aermare che le leggi della


sica sono le stesse in qualsiasi sistema di riferimento inerziale. Ciò implica
l'impossibilità di privilegiare un particolare sistema di riferimento inerziale
rispetto ad un altro. Le leggi della meccanica classica, contenute nell'equazione

f = ma

sono eettivamente invarianti nel passaggio da un sistema inerziale ad un altro,


se si assumono le trasformazioni di Galileo.
Invece, le equazioni di Maxwell non sono invarianti sotto trasformazioni di
Galileo. Infatti, da tali trasformazioni si ricava la legge classica di composizione
delle velocità. Per esempio
vx0 = vx − V (1)

se V è (l'unica) componente della velocità con la quale trasla, lungo l'asse x, il


riferimento O0 (gura 1).

y y'
V

O O'
x x'
z z'

Figura 1: Il sistema O0 trasla rispetto ad O con una certa velocità V .

1
D'altra parte, nel vuoto, la soluzione generale delle equazioni di Maxwell
per una propagazione lungo l'asse x è

Φ = f (x − ct) + g(x + ct) (2)

cioè una propagazione con velocità isotropa; ovvero con la stessa velocità tanto
nel verso delle x crescenti quanto in quello delle x decrescenti. Secondo le
0
trasformazioni di Galileo, in un nuovo riferimento O avremmo due velocità
diverse per la propagazione in un senso e nell'altro; ma ciò signicherebbe che
l'equazione d'onda dovrebbe avere una struttura diversa nel nuovo riferimento,
in contraddizione con il principio di relatività. Non rimane che ammettere che
la velocità della luce sia un invariante rispetto alle trasformazioni da un sistema
inerziale ad un altro.
La richiesta che la velocità della luce sia un'invariante impone la condizione
che si abbia, per il fronte di un'onda luminosa:

x2 + y 2 + z 2 = c 2 t 2 (3)

x02 + y 02 + z 02 = c2 t02 (4)

Per semplicità, possiamo denire

x0 = ct x00 = ct0 (5)

x0 ha dunque le stesse dimensioni siche delle altre variabili x, y e z (quelle di


una lunghezza) e possiamo quindi scrivere le (3) e (4) come
2
x2 + y 2 + z 2 = x0 (6)
2
x02 + y 02 + z 02 = x00

La relazione più semplice possibile, tra vecchie e nuove coordinate, è una


relazione lineare; dunque possiamo ipotizzare che, per un moto traslatorio lungo
l'asse x, le coordinate y e z restino immutate e che si abbia dunque:

y0 = y (7)
z0 = z
x0 = αx + βx0
x00 = γx + δx0

2
Sostituendo nella seconda delle (6) si ottiene:

(αx + βx0 )2 + y 02 + z 02 = (γx + δx0 )2 (8)

Sviluppando:

2 2
α2 x2 + β 2 x0 + 2αβxx0 + y 2 + z 2 = (γ 2 x2 + δ 2 x0 + 2γδxx0 ) (9)

2
D'altra parte, deve essere x2 +y 2 +z 2 = x0 ; e dunque si deve avere identicamente

α2 − γ 2 = 1 (10)
δ2 − β 2 = 1
αβ − γδ = 0

Possiamo allora utilizzare la seguente parametrizzazione:

α = cosh ξ γ = sinh ξ (11)


δ = cosh ϕ β = sinh ϕ

La terza delle (10) mostra che ξ = ϕ; dunque abbiamo:

x0 = x cosh ϕ + x0 sinh ϕ (12)


x00 = x sinh ϕ + x0 cosh ϕ

Possiamo ricavare il signicato sico della quantità ϕ. Infatti, se l'origine O0 del


sistema di assi (cioè x0 = 0) trasla di moto rettilineo uniforme con una velocità
che ha soltanto componente lungo l'asse x pari a V deve essere, per ogni t

0 = V t cosh ϕ + ct sinh ϕ (13)

ovvero
sinh ϕ V
tanh ϕ = =− (14)
cosh ϕ c
Da questa si ricava (osserviamo che cosh ϕ è sempre positivo):

1 −V /c
cosh ϕ = q sinh ϕ = q (15)
1 − V 2 /c2 1 − V 2 /c2

3
In denitiva, possiamo scrivere così le relazioni tra i due sistemi di coordinate,
che vengono chiamate trasformazioni di Lorentz:

x−Vt
x0 = q (16)
1 − V 2 /c2
y0 = y
z0 = z
t − (V /c2 )x
t0 = q
1 − V 2 /c2

È molto utile introdurre una nuova notazione per le coordinate spaziali.


Precisamente, ponendo un indice in alto:

x ≡ x1 y ≡ x2 z ≡ x3 (17)

scriviamo così le trasformazioni di Lorentz:


x1 − βx0
x01 = √ (18)
1 − β2
x02 = x 2

x03 = x3
x0 − βx1
x00 = √
1 − β2

dove abbiamo posto


V
β= (19)
c
È utile anche porre questa denizione:

1
γ=√ (20)
1 − β2

e scrivere le trasformazioni di Lorentz in questo modo:

x01 = (x1 − βx0 )γ (21)


x02 = x2
x03 = x3
x00 = (x0 − βx1 )γ

4
Contrazione di Lorentz

Le trasformazioni di Lorentz implicano l'esistenza di fenomeni che non sono


previsti dalla meccanica galileiana. Uno di tali fenomeni è conosciuto come
contrazione di Lorentz o contrazione delle lunghezze. Vediamo di cosa si tratta.
In meccanica galileiana, la lunghezza di un segmento, per esempio la lunghezza
di una sbarra rigida, è una quantità assoluta; nel senso che qualsiasi osservatore,
che intenda misurarla, trova sempre lo stesso valore l0 .
È ovvio che cosa si intenda per misura di una sbarra che è a riposo rispetto
ad un osservatore: questi sovrappone alla sbarra una riga graduata che consente
la valutazione della misura (gura 2).

y y'
V

l0
O O'
x x'A x'B x'
z z'

Figura 2: Una sbarra è ferma nel riferimento O0 .

Per un osservatore solidale ad O, rispetto al quale la sbarra è dunque in


movimento, l'operazione da eseguire è, in linea di principio, la seguente: egli
deve marcare nello stesso istante la posizione dei due estremi della sbarra
che gli scorre davanti; e successivamente misurare la distanza tra tali posizioni.
Ci aspettiamo che il risultato sia ancora l0 . Le cose vanno eettivamente così
in meccanica galileiana ma vanno diversamente dal punto di vista relativistico.
Supponiamo infatti che, come è illustrato nella gura precedente, la sbarra sia
posta lungo l'asse delle ascisse e trasli lungo tale asse con velocità V rispetto ad
un osservatore solidale ad O. La relazione tra le coordinate di O e quelle di O0 ,

5
che segue la sbarra, è data dalle trasformazioni di Lorentz; in particolare
x−Vt
x0 = q (22)
1 − V 2 /c2
Per le posizioni degli estremi A e B della sbarra devono valere evidentemente
xA − V t A xB − V t B
x0A = q x0B = q (23)
1 − V 2 /c2 1 − V 2 /c2
dove tA e tB sono gli istanti nei quali viene rilevata da O la posizione dei due
estremi, rispettivamente. Sottraendo membro a membro si ha
xB − xA − V (tB − tA )
x0B − x0A = q (24)
1 − V 2 /c2
Il primo membro è la lunghezza l0 della sbarra a riposo in O0 ; d'altra parte,
xB − xA , che gura al secondo membro, può essere interpretata come lunghezza
l della sbarra misurata in O se in tale riferimento la misura è eseguita, come
abbiamo già notato, nello stesso istante per i due estremi; cioè tB = tA . Da ciò
risulta q
l
l0 = q ovvero l = l0 1 − V 2 /c2 (25)
1 − V 2 /c2
q
In altre parole, vista da O, la sbarra risulta contratta della quantità 1 − V 2 /c2 .
Arriviamo allo stesso risultato anche se deniamo la lunghezza l della sbarra
in movimento in altro modo. Precisamente, possiamo pensare di misurare il
tempo che trascorre tra il passaggio dei due estremi della sbarra per uno stesso
punto del riferimento O; e poi moltiplicare tale intervallo di tempo per la velocità
V con la quale scorre la sbarra. Riferendoci ancora alla (24), poniamo xB = xA
e otteniamo
−V (tB − tA )
l0 = x0B − x0A = q (26)
1 − V 2 /c2
dalla quale otteniamo
l0 q
tB − tA = − 1 − V 2 /c2 (27)
V
(notiamo che se per esempio V > 0, come nelle gure precedenti, tB − tA risulta
negativo: giustamente, l'estremo A passa davanti all'osservatore dopo l'estremo
B ). Dalla (27) otteniamo dunque
q
| V (tB − tA ) | = l0 1 − V 2 /c2 (28)

6
che coincide con la (25).

Dilatazione dei tempi

In meccanica galileiana, ci aspettiamo che la durata di un certo fenomeno


sia una quantità assoluta, indipendente dal sistema di riferimento. Ma, anche in
questo caso, la relatività porta ad un nuovo risultato. Precisamente, immaginiamo
che il fenomeno in questione sia l'accensione di una lampadina ad un certo istante
tA e il successivo spegnimento ad un istante tB , con la lampadina ferma nel
sistema di riferimento O. Per quanto tempo rimane accesa la lampadina, per
un osservatore O0 che trasla con velocità V ? Lo vediamo, come sempre, dalle
trasformazioni di Lorentz. In particolare, da
t − (V /c2 ) x
t0 = q (29)
1 − V 2 /c2

Per l'istante di accensione e quello dello spegnimento valgono evidentemente


tA − (V /c2 ) xA tB − (V /c2 ) xB
t0A = q t0B = q (30)
1 − V 2 /c2 1 − V 2 /c2

Sottraendo membro a membro:


tB − tA − (V /c2 ) (xB − xA )
t0B − t0A = q (31)
1 − V 2 /c2

Al primo membro compare la durata T 0 del fenomeno misurata da O0 ; al secondo


membro compare la durata T = tB − tA per il sistema nel quale, d'altra parte, la
lampadina è ferma in una certa posizione: xB = xA . Dunque
T
T 0=q (32)
1 − V 2 /c2

ovvero, per l'osservatore in movimento rispetto alla lampadina, l'intervallo di


tempo risulta dilatato della quantità
1
q (33)
1 − V 2 /c2

7
L'intervallo di tempo (innitesimo) misurato tra due eventi che avvengono
nello stesso punto dello spazio (tridimensionale) viene chiamato intervallo di
tempo proprio tra tali eventi e viene indicato con il simbolo dτ . In un generico
sistema di riferimento risulta quindi:

dt = γdτ (34)

Due gemelli non sono coetanei!

Supponiamo che un ipotetico astronauta compia un lungo viaggio spaziale


e poi torni sulla Terra, dove lo ha aspettato suo fratello gemello. Al momento
della partenza, i due hanno evidentemente la stessa età. Che età avranno quando
si incontrano di nuovo sulla Terra? Per l'astronauta è passato un tempo
Z τ2
Ta = dτ = τ2 − τ1 (35)
τ1

Per il gemello sulla Terra è passato il tempo


Z t2 Z τ2 Z τ2
TT = dt = γ dτ > dτ = Ta (36)
t1 τ1 τ1

poiché γ > 1. Ciò signica che Ta < TT ovvero che l'astronauta è invecchiato
meno del fratello.

Composizione delle velocità

Dalle trasformazioni di Lorentz si ricava facilmente la legge di composizione


relativistica delle velocità. Per semplicità riferiamoci alla sola componente x. Per
incrementi innitesimi delle coordinate spazio-temporali, si ha:
dx − V dt
dx0 = q (37)
1 − V 2 /c2
dt − (V /c2 ) dx
dt0 = q (38)
1 − V 2 /c2

8
Dividendo membro a membro per dt0 :
dx0 dx − V dt
vx0 = 0
= (39)
dt dt − (V /c2 ) dx
E dividendo per dt numeratore e denominatore:
dx0 vx − V
vx0 = 0 = (40)
dt 1 − (V /c2 ) vx
Si vede che, nel limite di traslazioni a piccola velocità rispetto a quella della
luce, la legge di composizione relativistica diventa quella galileiana.
Come semplice esercizio, possiamo vericare che la relazione precedente
conferma l'invarianza della velocità della luce. Ponendo infatti vx = c si ha:
c−V
c0 = =c (41)
1 − (V /c2 )c
È inoltre semplice vedere che la composizione di due velocità inferiori a quella
della luce fornisce una velocità anch'essa inferiore a quella della luce. Basta per
questo dimostrare che si ha comunque
vx − V
vx0 = <c (42)
1 − (V /c2 ) vx
per qualsiasi valore di vx e V (purché entrambe minori di c). La disuguaglianza
precedente si può scrivere infatti
V
vx − V < c − vx (43)
c
ovvero
vx (1 + V /c) < c (1 + V /c) (44)

che è sicuramente vera dal momento che vx < c.

Quadrivettori

Possiamo pensare alle x, y, z e ct come alle componenti xµ del raggio vettore


in uno spazio a quattro dimensioni che viene chiamato spazio di Minkowski.

9
Chiameremo dunque quadrivettore un vettore appartenente a tale spazio. In
generale, un quadrivettore è una grandezza che, sotto una trasformazione di
Lorentz ovvero una trasformazione da un sistema inerziale ad un altro, si
trasforma come x, y, z e ct. Una qualsiasi grandezza sica vettoriale sarà dunque
di fatto una grandezza quadrivettoriale. Le quattro componenti vengono chiamate
componenti controvarianti e sono scritte con un indice in alto. Ricordiamo che

x0 = ct x1 = x x2 = y x3 = z (45)

e scriveremo così un generico quadrivettore:

aµ = (a1 , a2 , a3 , a0 ) (46)

Chiameremo componenti spaziali le prime tre componenti del quadrivettore;


e componente temporale la quarta componente. Potremo indicare anche così:

aµ = (a , a0 ) (47)

dove il carattere grassetto indica, come al solito, un vettore nello spazio


tridimensionale.
È molto semplice vericare che per due quadrivettori aµ e bµ la quantità

a0 b0 − a1 b1 − a2 b2 − a3 b3 (48)

risulta invariante sotto trasformazioni di coordinate, cioè sotto trasformazioni di


Lorentz; dunque essa può denire il prodotto scalare tra i due quadrivettori:

a · b ≡ a0 b0 − a1 b1 − a2 b2 − a3 b3 (49)

Possiamo anche scrivere così, sottintendendo la somma su indici ripetuti:

a · b = gµν aµ bν (50)

dove

gµν = 0 se µ 6= ν g00 = 1; g11 = −1; g22 = −1; g33 = −1 (51)

gµν viene chiamato tensore metrico o semplicemente metrica dello spazio


quadridimensionale. Con l'ausilio di gµν possiamo denire le componenti
covarianti di un quadrivettore, che sono scritte con un indice in basso:

aµ = gµν aν (52)

10
e possiamo dunque scrivere il prodotto scalare anche così:

a · b = aµ bµ = aµ bµ (53)

In particolare possiamo calcolare il prodotto scalare

a · a = (a0 )2 − (a1 )2 − (a2 )2 − (a3 )2 (54)

che è naturale denire norma del quadrivettore a. Poiché le quantità aµ sono


arbitrarie, vediamo che la norma di un quadrivettore può essere positiva, negativa
o nulla. Corrispondentemente, diciamo che il quadrivettore è di tipo tempo
(timelike), spazio (spacelike) o luce (lightlike).

Inversione temporale e causalità

Consideriamo un evento P1 : per esempio il lampo di un ash fotograco


che avviene ad un certo istante t1 nel punto dello spazio di coordinate (x1 , y1 , z1 );
ed un altro evento P2 che immaginiamo sia un altro lampo all'istante t2 in un
altro punto di coordinate (x2 , y2 , z2 ). Ai due eventi corrispondono dunque i raggi
vettori
xµ1 = (x1 , y1 , z1 , ct1 ) xµ2 = (x2 , y2 , z2 , ct2 ) (55)
Si denisce distanza tra i due eventi il vettore

sµ = xµ2 − xµ1 = (x2 − x1 , y2 − y1 , z2 − z1 , c(t2 − t1 )) (56)

Osserviamo ora che se la distanza tra i due eventi P1 e P2 è di tipo spacelike,


la successione temporale di essi può risultare invertita, a patto di osservare tali
eventi da un opportuno sistema di riferimento. Supponiamo per semplicità che
i due lampi avvengano sull'asse x (dunque con coordinate y e z uguali a zero) e
che sia
c2 (t2 − t1 )2 − (x2 − x1 )2 < 0 (57)
ed inoltre che, in un dato sistema di riferimento, sia

t2 > t1 (58)
x2 > x 1 (59)

11
Possiamo scrivere dunque che per tali eventi:

c (t2 − t1 ) < x2 − x1 (60)

ovvero
c (t2 − t1 )
<1 (61)
x2 − x1
Osserviamo ora i due eventi precedenti da un altro sistema di riferimento. Con
una trasformazione di Lorentz abbiamo
t1 − (V /c2 ) x1
t01 = q (62)
1 − V 2 /c2
t2 − (V /c2 ) x2
t02 = q (63)
1 − V 2 /c2
cioè
t2 − t1 − (V /c2 )(x2 − x1 )
t02 − t01 = q (64)
1 − V 2 /c2
Vericare se è possibile che nel nuovo sistema di riferimento t02 − t01 sia negativo,
equivale a vericare se è possibile che si possa ottenere
V
t2 − t1 − (x2 − x1 ) < 0 (65)
c2
ovvero
(t2 − t1 ) c
V > c (66)
x2 − x1
D'altra parte, ricordando la (61), ciò signica che V deve essere maggiore di una
certa velocità comunque minore di c: cosa che è sempre possibile avere.
Da ciò segue che l'evento P1 può essere la causa dell'evento P2 solo se la
distanza tra tali eventi è di tipo timelike o lightlike; diversamente esisterebbero
sistemi di riferimento rispetto ai quali osserveremmo un eetto che precede
temporalmente la sua causa: in contraddizione con il principio di causalità.

Trasformazioni di Lorentz generiche

Scriviamo così una generica trasformazione di Lorentz:

x0µ = Λµν xν (67)

12
della quale la (21) è il caso particolare che riguarda un moto traslatorio di O0
lungo l'asse x (con assi paralleli). Per un generico quadrivettore, del quale xµ è
il prototipo, vale altrettanto la seguente legge di trasformazione, che è dunque la
legge di trasformazione per le componenti controvarianti:

a0µ = Λµν aν (68)

Tale relazione può essere invertita, scrivendo dunque

aµ = Θµν a0ν (69)

dove Θµν è la matrice inversa di Λµν :

Θνµ Λµσ = δσν (70)

Ricordiamo che il prodotto scalare a · b è un invariante. Scriviamo allora,


cambiando opportunamente nome agli indici muti:

a · b = a0µ b0µ = a0ρ b0ρ = Λρσ aσ b0ρ = aσ bσ (71)

Poiché tale uguaglianza deve essere valida per qualsiasi valore di aσ segue

bσ = Λρσ b0ρ (72)

che è simile alla (68) a parte lo scambio delle quantità relative ad O e O0 .


Invertendo tale relazione scriviamo

0
b µ = Θνµ bν (73)

Le equazioni di Maxwell non omogenee

Ci accorgiamo che nello spazio quadridimensionale di Minkowski è molto


semplice scrivere le equazioni di Maxwell in forma compatta. A questo scopo,
inventiamoci la seguente matrice antisimmetrica F µν (ponendo dunque gli indici
in alto). È proprio il caso di dire inventiamoci perché, per il momento, questa

13
tabella non ha alcun particolare signicato; è soltanto un utile metodo di scrittura
e gli indici µ e ν sono semplicemente indici di riga e di colonna:
¯ ¯
¯ 0 −Bz By Ex /c ¯¯
¯
¯ Bz 0 −Bx Ey /c ¯¯
F µν = ¯¯ ¯ (74)
¯ −By B x 0 Ez /c ¯¯
¯
¯ −Ex /c −Ey /c −Ez /c 0 ¯
E inventiamoci anche questa matrice colonna:
¯ ¯
¯ jx ¯
¯ ¯
¯ jy ¯
j µ = ¯¯ ¯
¯ (75)
¯
¯
jz ¯
¯
¯ cρ ¯

Nelle espressioni precedenti, l'indice zero deve essere pensato come indice
 quattro, riferendosi cioè alla quarta riga o alla quarta colonna, a seconda dei
casi.
Ebbene, le equazioni di Maxwell non omogenee sono contenute in questa
relazione:
∂µ F µν = µ0 j ν (76)

dove abbiamo denito



∂µ ≡ (77)
∂xµ
Infatti, poniamo per esempio ν = 1. Otteniamo:

∂1 F 11 + ∂2 F 21 + ∂3 F 31 + ∂0 F 01 = µ0 j 1 (78)

ovvero
∂Bz ∂By 1 ∂Ex
− − 2 = µ0 j 1 (79)
∂y ∂z c ∂t
cioè:
∂Ex
(rotB )x = µ0 jx + µ0 ε0 (80)
∂t
Ponendo ν = 2, 3 si ottengono equazioni simili per le altre componenti. Ponendo
ν = 0 otteniamo invece:

∂1 F 10 + ∂2 F 20 + ∂3 F 30 + ∂0 F 00 = µ0 j 0 (81)

ovvero
1 ∂Ex 1 ∂Ey 1 ∂Ez
+ + = µ0 cρ (82)
c ∂x c ∂y c ∂z

14
cioè
div E = µ0 c2 ρ = ρ/ε0 (83)
È inoltre molto semplice scrivere l'equazione di continuità. Infatti si ha
ovviamente:
∂µ ∂ν F µν = 0 (84)
poiché sulla quantità antisimmetrica F µν agisce l'operazione ∂µ ∂ν che è
evidentemente simmetrica negli indici µ e ν . D'altra parte, per la (76), si ha

∂µ ∂ν F µν = µ0 ∂µ j µ (85)

dalle (84) e (85) si ha dunque:


∂µ j µ = 0 (86)
che è proprio l'equazione di continuità. Scrivendo esplicitamente, infatti:

∂1 j 1 + ∂2 j 2 + ∂3 j 3 + ∂0 j 0 = 0 (87)

ovvero
1∂ 4 ∂ρ
div j + j = div j + =0 (88)
c ∂t ∂t

Campi tensoriali nello spazio di Minkowski

In un dato sistema di riferimento, un campo scalare è denito da


una funzione ordinaria delle coordinate spaziali e del tempo (di solito, nelle
applicazioni, tale funzione è continua e derivabile un numero arbitrario di volte).
Un classico esempio è fornito dalla temperatura in una certa zona della Terra: la
temperatura è infatti funzione della latitudine, longitudine e quota del punto che
ci interessa; e cambia al trascorrere del tempo. Scriviamo dunque

T = T (x, y, z, ct) ≡ T (x) (89)

intendendo brevemente con x l'insieme delle quattro coordinate spazio-temporali.


Se cambiamo sistema di riferimento, lo stesso campo delle temperature sarà
descritto da una nuova funzione T 0 (x0 ) per la quale deve dunque valere:

T 0 (x0 ) = T (x) (90)

15
con
x0ν = Λνµ xµ (91)

Altrettanto, si può parlare di campo vettoriale v µ (x) se in due diversi sistemi di


riferimento si ha comunque:
ν
v µ (x)eµ = v 0 (x0 )e0ν (92)

dove con eµ e e0ν sono indicati i versori degli assi coordinati nei rispettivi sistemi
di riferimento. D'altra parte, per i versori, vale la legge di trasformazione

eµ = Λνµ e0ν (93)

Da ciò segue:
v µ (x) Λνµ e0ν = v 0ν (x0 )e0ν (94)

ovvero:
v 0ν (x0ρ = Λρσ xσ ) = Λνµ v µ (x) (95)

Per le componenti covarianti di un campo vettoriale vale evidentemente

vν0 (x0 ) = Θρν vρ (x) (96)

In generale, abbiamo campi tensoriali per i quali si verica, ad esempio:


0µν
T (x0ρ = Λρσ xσ ) = Λµα Λνβ T αβ
(x) (97)

Vogliamo ora mostrare che il gradiente di un campo scalare è un campo vettoriale


con indice covariante o, come si dice brevemente, è un vettore covariante. Dato
un campo ϕ(x) dobbiamo calcolare le derivate rispetto alle coordinate che, come
sappiamo, sono le componenti controvarianti del raggio vettore. In altri termini,
dobbiamo calcolare

ϕ(x) (98)
∂xµ
In un altro sistema di riferimento scriviamo, altrettanto:
∂ 0 0
ϕ (x ) (99)
∂x0µ
D'altra parte, possiamo scrivere facilmente questa serie di uguaglianze:
∂ 0 0 ∂ ∂xν ∂ ∂

ϕ (x ) = 0µ
ϕ(x) = 0µ ν
ϕ(x) = Θνµ ν ϕ(x) (100)
∂x ∂x ∂x ∂x ∂x
16
La prima uguaglianza segue dal fatto che ϕ è un campo scalare; la seconda dalla
regola di derivazione delle funzioni composte; e la terza dalla proprietà (91). La
(100) rappresenta dunque proprio quanto volevamo dimostrare. Si può scrivere
anche così:

ϕ(x) = ∂µ ϕ(x) (101)
∂xµ
facendo apparire in modo più esplicito la natura covariante dell'indice µ.
Possiamo allora ricavare dalla (86) una conseguenza molto importante.
Poiché l'operatore ∂µ produce un indice covariante e ∂µ j µ è una quantità scalare
(in rispetto del principio di relatività deve essere nulla in qualsiasi sistema di
riferimento, ovvero la conservazione della carica elettrica deve comunque valere),
segue che j µ è necessariamente un vettore controvariante . Stabilito questo, dalla
(76) segue che F µν è necessariamente un tensore controvariante che è chiamato
tensore elettromagnetico. Con queste conclusioni, le semplici tabelle (74) e (75)
acquistano un valore del tutto rilevante: esse mostrano il contenuto di un campo
tensoriale e vettoriale rispettivamente. In altri termini, gli indici µ e ν di riga e di
colonna sono eettivamente indici di Lorentz, caratteristici di vettori (o tensori)
nello spazio di Minkowski.
Si dice allora che le equazioni di Maxwell, scritte nella (76) sono espresse
in forma covariante nel senso che sono appunto relazioni tra enti vettoriali o
tensoriali nello spazio di Minkowski. In generale, per rispettare il principio di
relatività, tutte le equazioni della sica dovranno dunque risultare covarianti.

Meccanica relativistica

Passando allo studio della dinamica del punto materiale, ci accorgiamo


subito che l'equazione newtoniana, così come è scritta,
d
F= p (102)
dt
è sicuramente non covariante, poiché è una relazione tra vettori dello spazio
ordinario tridimensionale e non tra vettori o tensori quadridimensionali.
Dobbiamo quindi rimpiazzare la (102) con un'equazione covariante che, d'altra

17
parte, riproduca la (102) stessa nel limite di velocità piccole rispetto a quella della
luce.
Cominciamo con il denire le quantità cinematiche rilevanti.
Supponiamo di individuare un punto materiale in movimento in un certo
riferimento inerziale R che, ad un dato istante t, ha coordinate spaziali x, y e z .
Ciò equivale a conoscere il raggio vettore

xµ = (x, y, z, ct) (103)

Supponiamo che in tale istante il punto abbia una velocità (tridimensionale) v .


Dopo un intervallo di tempo innitesimo dt, il punto si è spostato di una quantità
innitesima e l'incremento del raggio vettore risulta

dxµ = (dx, dy, dz, cdt) = (vx dt, vy dt, vz dt, cdt) (104)

La sua norma è

(dxµ )2 = (c2 − vx2 − vy2 − vz2 ) dt2 = (c2 − v 2 ) dt2 (105)

dove con v 2 denotiamo il quadrato del modulo tridimensionale della velocità.


Osserviamo ora il punto materiale da un altro sistema di riferimento R0 che si
muove di moto traslatorio rispetto a R proprio con velocità v . La norma rimane la
stessa; d'altra parte, rispetto ad R0 il punto materiale è fermo. Per conseguenza,
vale la seguente uguaglianza:

(dx0µ )2 = c2 dt02 = (c2 − v 2 ) dt2 = (dxµ )2 (106)

dalla quale si vede che l'intervallo di tempo dt0 , misurato nel sistema di riferimento
che in quell'istante segue il punto materiale nel suo movimento, è un invariante
relativistico (poiché lo sono (dxµ )2 e c2 ). Tale intervallo di tempo viene di solito
indicato con il simbolo dτ e, come abbiamo già avuto occasione di dire, viene
chiamato intervallo di tempo proprio. Si ha dunque:
q
0
dt = dt 1 − v 2 /c2 ≡ dτ (107)

Riconsideriamo l'elemento spazio-temporale (che è un quadrivettore innitesimo)

dxµ = (dx , cdt) (108)

18
Dividendo per dτ (che è una quantità scalare) otteniamo dunque un altro
quadrivettore:
 
dxµ
v c  = (γ v , γc)
uµ ≡ = q , q (109)
dτ 1 − v 2 /c2 1 − v 2 /c2

che è naturale denire come quadrivelocità, giacché la sua parte spaziale coincide
proprio con l'ordinario vettore velocità, nel limite non relativistico. Notiamo che
la quadrivelocità ha norma costante (positiva) uguale a c2 :
à !
µ 2 2 2 2 2 2 2 v2
(u ) = γ c − γ v = γ c 1− 2 = c2 (110)
c

Moltiplicando per la massa m del punto materiale deniamo altrettanto il


quadrimpulso :
 
mv mc  = (γmv , γmc)
pµ ≡ m uµ =  q , q (111)
2
1 − v /c 2 1 − v 2 /c2

che evidentemente ha norma costante uguale a m2 c2 .


Per quanto riguarda la dinamica, ci riferiamo alla forza di Lorentz che,
d'altra parte, è una forza fondamentale della Natura; per la quale non sono
necessari modelli fenomenologici, come invece accade per le forze elastiche o le
forze di attrito ecc.
In termini di vettori tridimensionali sappiamo che:

f = q (E + v × B ) (112)

Per la componente x, per esempio:

fx = q (Ex + vy Bz − vz By ) (113)

In termini del tensore elettromagnetico:

fx = q (cF 10 + vy F 21 − vz F 13 ) (114)

D'altra parte, per denizione di uµ :


à !
10 u2 u3
fx = q cF + F 21 − F 13 (115)
γ γ

19
Ora studiamo con cura il seguente passaggio, nel quale abbassiamo gli indici della
quadrivelocità. Ricordiamoci che, per la struttura di gµν , si ha u0 = u0 , ui = −ui
(questa è una regola generale da tenere sempre presente: la quarta componente
di un quadrivettore rimane immutata abbassando (o innalzando ) il suo indice ; le
componenti spaziali cambiano segno ).
Ricordiamoci anche dell'antisimmetria del tensore elettromagnetico. Con
queste indicazioni è facile rendersi conto che si ha:
à !
1 u0 10 u2 12 u3 13 u1 11 q
f = fx = q F + F + F + F = uν F 1ν (116)
γ γ γ γ γ
(l'ultimo addendo è identicamente nullo e lo abbiamo aggiunto nell'espressione
(115); in questo modo però ci siamo avvantaggiati ottenendo una scrittura nella
quale compaiono tutti gli indici sommati).
Espressioni analoghe si ottengono per le altre componenti spaziali di f e in
denitiva possiamo vericare che:

γf i = qF iν uν (117)

dove con l'indice i abbiamo denotato la componente che può essere x, y o z . A


questo punto è naturale introdurre un'analoga espressione f 0 , denita da

γf 0 = qF 0ν uν (118)

e scrivere
γf µ = qF µν uν (119)
Al secondo membro abbiamo un quadrivettore e allora lo è altrettanto il primo
membro che denisce così la quadriforza F µ :

F µ ≡ γf µ = qF µν uν (120)

A parte il fattore γ , la parte spaziale coincide con l'espressione tridimensionale


della forza di Lorentz f ; e la parte temporale risulta
q
F0 = γ E · v (121)
c
In denitiva, scrivendo esplicitamente la parte spaziale e quella temporale,
abbiamo il quadrivettore
µ ¶ µ ¶
q 1
F = γf , γ E · v
µ
= γf , γ f · v (122)
c c
20
L'ultimo passaggio è giusticato dal fatto che la parte magnetica della forza di
Lorentz non contribuisce (si ha un prodotto misto nullo).
Dobbiamo ora uguagliare la quadriforza ad un'espressione che contenga la
variazione di impulso, come è suggerito dall'equazione newtoniana. Per rispettare
la covarianza, non possiamo avere altro che:
dpµ
Fµ = (123)

La parte spaziale risulta:
dp d mv 1 d mv
F= = q =q q (124)
dτ dτ 1 − v 2 /c2 1 − v 2 /c2 dt 1 − v 2 /c2
ovvero
d mv
f = q (125)
dt 1 − v 2 /c2

che, per piccole velocità, si riduce all'equazione di Newton f = m dv /dt .


Una conseguenza molto importante viene dalla quarta componente della
(123) per la quale risulta:

mc2
f · v dt = d (mc2 γ) = d q (126)
1 − v 2 /c2

Al primo membro compare il lavoro compiuto dalla forza di Lorentz nel tempo
dt; dunque al secondo membro deve comparire la variazione di energia cinetica
dE . Questo ci suggerisce la seguente espressione per E :
mc2
E=q (127)
1 − v 2 /c2

In particolare, per piccole velocità, sviluppando in serie rispetto a v 2 , si ha:


à !
2 1 v2 1
E ≈ mc 1+ 2 = mc2 + mv 2 (128)
2c 2

che, a parte il valore costante mc2 , coincide con l'espressione classica. D'altra
parte, se l'espressione corretta per l'energia cinetica è la (127), non possiamo
omettere il termine mc2 che risulta dunque presente anche per velocità nulle.
Questo termine è chiamato energia di riposo che compete ad un punto materiale
di massa m. Il solo fatto che un corpo abbia massa m implica pertanto

21
che esso possieda comunque un'energia pari a mc2 : massa ed energia sono
dunque strettamente correlate. Discuteremo più avanti l'eettiva validità della
(127). Un'altra relazione importante lega l'energia all'impulso di una particella.
Ricordiamo infatti che  
mc
pµ = p , q 
1 − v 2 /c2
Moltiplicando per c:
 
mc2
cpµ = cp , q  = (cp , E)
1− v 2 /c2
da questa si ricava
c2 p2 = E 2 − c2 |p |2 (129)
nella quale p è la parte spaziale del quadrimpulso:
mv
p= q (130)
1 − v 2 /c2
Ricordiamo inoltre che
1
p2 = pµ pµ = 2 2
(mc2 − mv 2 ) = m2 c2 (131)
1 − v /c
e dunque, dalla (129):
E 2 = c2 |p |2 + m2 c4 (132)
A questo punto, è molto importante studiare il caso limite nel quale si considerano
particelle di massa nulla.
In meccanica classica, ad una particella di massa nulla competono impulso
ed energia nulli. In pratica ciò signica che, in meccanica classica, non esistono
particelle di massa nulla. O, per meglio dire, la eventuale presenza di particelle
a massa nulla non è osservabile: non possiamo accorgerci se esse intervengono in
un qualsiasi processo, dal momento che esse non apportano alcuna variazione di
impulso o di energia (e anche di momento angolare).
La situazione è completamente diversa in relatività: la presenza di particelle
di massa nulla è assolutamente ammissibile ed osservabile. Ce ne accorgiamo dalla
(131): nel limite di m che tende a zero osserviamo che il quadrimpulso è di tipo
luce:
p2 = pµ pµ = 0 (133)

22
ma ciò non signica che la parte spaziale e quella temporale di pµ siano
separatamente nulle. Per di più, dalla (132), possiamo anche osservare che una
particella di massa nulla possiede un'energia cinetica:

E = c |p | (134)

D'altra parte, è semplice ricavare la relazione che lega E al modulo spaziale


dell'impulso |p | e alla velocità v di una particella di massa m. Dalla (130) si ha
infatti, prendendo i moduli e moltiplicando per c2 :

c2 |p |
E= (135)
v
Confrontando con la (134) si vede che per una particella di massa nulla si
ha necessariamente v = c; ovvero una particella di massa nulla si muove
necessariamente alla velocità della luce.
Questi risultati non sono in contraddizione con le espressioni (127) e (130)
che sembrerebbero fornire impulso ed energia comunque nulli, quando m tende
a zero. Infatti, tali limiti sono eettivamente zero se v è diversa da c: in questo
caso la particella è inosservabile, come in meccanica classica; ma se si ammette
che il passaggio al limite m → 0 sia accompagnato da v che tende a c, i limiti in
questione possono benissimo essere diversi da zero.
Notiamo che la relazione (134) è quella che lega energia e impulso di un'onda
piana monocromatica. Ciò ci permette di interpretare la propagazione del campo
elettromagnetico come propagazione di particelle di massa nulla: i fotoni.
Rimane la questione della validità della (127), dalla quale derivano le
circostanze che abbiamo appena esposto. In particolare, vogliamo valutare
l'energia di risposo per la quale deve valere

E = mc2 (136)

Si deve proprio ad Einstein un argomento a riprova di ciò.


Immaginiamo un vagone di massa M e di lunghezza L all'estremo sinistro
del quale sia posto il ash di una macchina fotograca. All'altro estremo sia posto
uno schermo S che assorbe la luce che gli viene inviata orizzontalmente, lungo
l'asse x verso destra. Se px è l'impulso del campo elettromagnetico associato alla
luce del ash, non c'è dubbio che, dopo il lampo, il vagone subirà un rinculo

23
acquistando una quantità di moto − px (a meno che, ma questo è assolutamente
irragionevole, non si voglia rinunciare al principio di conservazione dell'impulso).
Quando poi la luce sarà arrivata ed assorbita da S , il vagone tornerà ad avere
quantità di moto nulla. Di quanto si è spostato il vagone, viaggiando con impulso
− px , prima che la luce venga assorbita? È evidente che la velocità del vagone è

vx = − px /M (137)

e il trasferimento della luce è avvenuto in un tempo t che è praticamente:

t = L/c (138)

dunque il vagone si è spostato della quantità


Lpx EL
∆xvagone = vx t = − =− (139)
Mc M c2
e di altrettanto si è spostato il suo centro di massa. D'altra parte, durante tutto
l'esperimento che si è svolto all'interno del vagone, il centro di massa del sistema
complessivo deve essere rimasto dov'era inizialmente. Come possiamo riconciliare
la (139) con quest'ultima circostanza? Evidentemente, il trasferimento della
quantità di energia raggiante E = pc da un estremo all'altro, per un tratto L, è
stato equivalente ad un trasferimento di massa m, per lo stesso tratto L in modo
tale da avere:
EL
mL = −M ∆xvagone = (140)
c2
ovvero:
E = mc2 (141)

Estensione al caso di forze arbitrarie

Possiamo estendere le considerazioni fatte, a proposito della forza di Lorentz,


al caso di forze di qualsiasi natura. Osserviamo intanto che, comunque si denisca
la quadriforza, questa è necessariamente ortogonale al quadrimpulso. Ciò è
conseguenza del fatto che il quadrimpulso ha norma costante:
d µ 2 dpµ
0= (p ) = 2pµ = 2pµ F µ (142)
dτ dτ
24
Consideriamo ora un punto materiale P di massa m che, ad un certo istante, nel
riferimento O, ha velocità (tridimensionale) v . Consideriamo un altro sistema
di riferimento O0 che trasla rispetto ad O proprio con velocità v . Rispetto a
quest'ultimo riferimento, P è fermo in quell'istante; dunque la sua quadrivelocità
è il vettore
v 0µ = (0, γc) (143)

D'altra parte, la quadriforza è comunque ortogonale alla quadrivelocità e si dovrà


avere in O0 , quali che siano le componenti spaziali f :

F 0µ = (f , 0) (144)

anché
F ·v =0

La quantità f deve coincidere con la forza newtoniana, poiché nel sistema O0 il


punto materiale si muove a velocità molto piccola rispetto a quella della luce (è
addirittura fermo!)
Per semplicità, immaginiamo che P si muova lungo l'asse x e sia sottoposto
ad una forza anch'essa diretta lungo l'asse x. Avremo dunque

F 0µ = (fx , 0, 0, 0) (145)

Le trasformazioni di Lorentz ci dicono ora quali componenti ha la quadriforza nel


sistema originale O. Precisamente, si vede che

Fx = γfx (146)
F0 = γβfx

e allora scriviamo l'equazione (123)

d
(γfx , γβfx ) = (mγvx , mγc) (147)

ovvero, ricordando che
dt = γdτ
d
(γfx , γβfx ) = γ (mγvx , mγc) (148)
dt
25
Semplicando il fattore γ :
d
(fx , βfx ) = (mγvx , mγc) (149)
dt
La componente spaziale di questa equazione è:
d mvx
fx = q (150)
dt 1 − vx2 /c2

che, per piccole velocità, si riduce alla formula galileiana. Dall'equazione per la
parte temporale
d
βfx = mγc
dt
ricaviamo
mc2
fx vx dt = d(mc2 γ) = d q (151)
1 − v 2 /c2
Al primo membro compare il lavoro fatto dalla forza nel tempo dt; dunque al
secondo membro deve comparire la variazione di energia cinetica dE . Anche ora
vediamo dunque che la relatività ci suggerisce l'espressione

mc2
E=q (152)
1 − v 2 /c2

26

Potrebbero piacerti anche