Sei sulla pagina 1di 108

Appunti di Relativit`

a Speciale
Roberto Casalbuoni
Dipartimento di Fisica dellUniversit`a di Firenze
a.a. 2004-2005

Indice
1 Le deviazioni dalla meccanica newtoniana
1.1 Esiste un limite superiore alla velocit`a? . .
1.2 Fotoni . . . . . . . . . . . . . . . . . . . .
1.3 Linerzia dellenergia . . . . . . . . . . . .
1.4 Energia, impulso e massa . . . . . . . . . .
1.5 Commenti . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

2 Laffermazione del principio di relativit`


a
2.1 Il principio di relativit`a in meccanica e le trasformazioni di
Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Linvarianza della fase di unonda piana . . . . . . . . . . . .
2.3 Effetto Doppler . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Velocit`a di fase, velocit`a di gruppo e aberrazione della luce .
2.4.1 La velocit`a di fase e la velocit`a di gruppo . . . . . . .
2.4.2 Legge di trasformazione della velocit`a di gruppo . . .
2.4.3 Laberrazione della luce . . . . . . . . . . . . . . . .
2.5 Lesperimento di Michelson . . . . . . . . . . . . . . . . . .
3 La critica della simultaneit`
a e la cinematica relativistica
3.1 Critica della simultaneit`a . . . . . . . . . . . . . . . . . . . .
3.1.1 Dimostrazione della consistenza della definizione di sincronizzazione . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Relativit`a della simultaneit`a . . . . . . . . . . . . . .
3.1.3 Le trasformazioni di Lorentz . . . . . . . . . . . . . .

.
.
.
.
.

3
3
9
11
14
18
19

.
.
.
.
.
.
.
.

19
23
25
27
27
29
30
33

36
. 36
. 38
. 40
. 40

4 Le propriet`
a delle trasformazioni di Lorentz
48
4.1 Forma generale delle trasformazioni di Lorentz . . . . . . . . . 48
4.2 Contrazione delle lunghezze e dilatazione dei tempi . . . . . . 49
1

4.3
4.4

4.2.1 Orologio a luce . . . . . . . . . . . . . . . .


4.2.2 Inversione temporale . . . . . . . . . . . . .
La legge di composizione delle velocit`a . . . . . . .
Effetto Doppler relativistico e aberrazione della luce

5 Elementi di calcolo tensoriale


5.1 Spazi vettoriali . . . . . . .
5.2 Tensori . . . . . . . . . . . .
5.3 Spazi metrici . . . . . . . .
5.4 Lo spazio di Minkowski . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

6 Meccanica relativistica
6.1 Quadriforza e dinamica relativistica. . . . . . . . . . . .
6.2 Impulso ed energia . . . . . . . . . . . . . . . . . . . . .
6.3 Sistema del centro di massa ed equivalenza massa-energia
6.4 Difetto di massa . . . . . . . . . . . . . . . . . . . . . . .
6.5 Applicazioni di meccanica e cinematica relativistiche . .
7 Elettrodinamica nel vuoto.
7.1 La corrente e la densit`a elettromagnetiche . . .
7.2 La forma covariante delle equazioni di Maxwell.
7.3 Le propriet`a di trasformazione dei campi. . . . .
7.4 Potenziali di gauge . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

51
54
56
57

.
.
.
.

60
60
62
67
69

.
.
.
.
.

75
75
79
83
85
88

.
.
.
.

94
94
96
98
100

A Appendice sulle unit`


a di misura.
102
A.1 Equazioni di Maxwell . . . . . . . . . . . . . . . . . . . . . . . 102
A.2 Unit`a di energia . . . . . . . . . . . . . . . . . . . . . . . . . . 105

Capitolo 1
Le deviazioni dalla meccanica
newtoniana
1.1

Esiste un limite superiore alla velocit`


a?

In accordo alle legge di Newton non c`e un limite superiore per le velocit`a.
Infatti possiamo pensare di esercitare una forza costante ad un corpo e la sua
velocit`a aumenter`a linearmente con il tempo. Per esempio, se applichiamo al
corpo una accelerazione pari a quella di gravit`a, g = 9.8m/s2 , la sua velocita
al tempo t sar`a
v(t) = gt = 9.8 t m/s
(1.1)
Dato che in un anno ci sono
1 anno = 365 24 3600 s 3.15 107 s 107 s

(1.2)

vediamo che dopo un anno la velocit`a raggiunta sar`a pari a


v 3 108 m/s

(1.3)

` per`o possibile ottenere velocit`a molto


che `e circa la velocit`a della luce. E
grandi in tempi brevi se si dispone di una forza pi`
u intensa di quella gravitazionale e se loggetto che vogliamo accelerare ha massa piccola (perche
questo non `e vero nel caso della forza gravitazionale?), dato che per una forza
costante
F
t
(1.4)
v(t) =
m
3

dove F `e la forza agente e m `e la massa delloggetto che stiamo accelerando.


A titolo di esempio consideriamo un elettrone che vada dal catodo allanodo
di un tubo a vuoto con una differenza di potenziale pari a V = 100 V .
Lenergia cinetica che acquista un elettrone sar`a
1 2
mv = eV 1.6 1019 100 J = 1.6 1017 J
2

(1.5)

Vediamo che
r
v =

s
2eV

2 1.6 1017 J
9.1 1031 Kg

36 1012 m/s = 6 106 m/s = 6000 Km/s

(1.6)

Se la distanza tra catodo e anodo fosse 2 mm, da


1
1
s = at2 = vt
2
2
segue
t=

2s
v

(1.7)

(1.8)

e quindi

v
v2
36 1012 m2 /s2
=
=
= 9 1015 m/s2
(1.9)
t
2s
4 103 m
Si pu`o vedere subito che laccelerazione in questo caso `e enormemente pi`
u
grande che nel caso gravitazionale. Infatti
a=

a
9 1015

1015
g
9.8

(1.10)

Sperimentalmente si vede che anche in una situazione di questo tipo, cio`e a


queste velocit`a, la dinamica di Newton fornisce una ottima descrizione. Le
cose vanno per`o diversamente se la differenza di potenziale applicata `e molto
pi`
u grande, dellordine dei milioni di Volts. A questo proposito vale la pena
di ricordare che una unit`a di misura conveniente nel campo microscopico `e
lelettronvolt (eV ), definito come lenergia acquisita da una carica elettrica
pari a quella dellelettrone attraverso la differenza di potenziale di un Volt.
Quindi
1 eV = 1.602176 1019 C 1 V = 1.602176 1019 J
4

(1.11)

Una accelerazione tale da dar luogo ad elettroni con energie dellordine di


106 eV = 1 M eV si pu`o ottenere con un generatore Van de Graaf. Se il Van
de Graaf si accoppia ad un misuratore di tempo di volo, come illustrato nella
figura 1.1, si ottiene un dispositivo che ci permette di esplorare cosa succeda
agli elettroni a velocit`a altissime, dellordine della velocit`a della luce. Gli
elettroni accelerati nel Van de Graaf sino a 1.5 M eV vengono inviati nel
LINAC, dove vengono ulteriormente accelerati nel primo tratto tramite un
sistema di radiofrequenze. Viene misurato il tempo di volo tra i punti A e
B tramite i corrispondenti elettrodi che danno un segnale nelloscilloscopio
(vedi fig. 1.2). Dato che i cavi che portano alloscilloscopio sono di uguale
lunghezza, la differenza temporale misurata tra gli impulsi in A e B rappresenta effettivamente il tempo impiegato dagli elettroni per andare da A a
B. Stiamo facendo qui una approssimazione, che `e quella di non tener conto
della variazione di velocit`a nel primo tratto del LINAC a causa della ulteriore accelerazione. Daltra parte si vede che laccelerazione successiva provoca
solo una piccola variazione della velocit`a. La velocit`a si ottiene dunque dalle
dimensioni del LINAC, ` = 8.4 m divise per il tempo di volo
`
(1.12)
t
Nel caso di accelerazione sino a 0.5 M eV , che corrisponde ad impulsi come
in fig. 1.2, si ha t 3.3 108 s e quindi
v=

8.4
2.5 108 m/s
(1.13)
8
3.3 10 s
. Daltra parte la velocit`a, in accorda alla fisica di Newton, si pu`o anche
ottenere uguagliando lenergia cinetica K allenergia acquisita nel Van de
Graaf
1
K = mv 2 = eV
(1.14)
2
` subito chiaro che i risultati sono in
Si pu`o dunque costruire la tabella 1.1. E
contraddizione con quanto ci aspettiamo. Infatti nel passare da 0.5 M eV a
15 M eV di accelerazione ci saremmo aspettati che il quadrato della velocit`a
cambiasse di un fattore 30, mentre cambia solo di 1.3. In effetti, data la non
grande accuratezza di una misura di questo tipo, la differenza di velocit`a tra
0.5 e 4.5 M eV `e difficilmente rivelabile. Il risultato `e illustrato in figura 1.3.
Ovviamente occorre essere sicuri che gli elettroni ricevono effettivamente
lenergia pari a eV , ma questo viene verificato sperimentalmente effettuando una misura di tipo calorimetrico dellenergia degli elettroni che arrivano
v

Figura 1.1: Diagramma di un apparato per la misura del tempo di volo di un


elettrone

Figura 1.2: La traccia delloscilloscopio mostra gli impulsi dovuti agli elettroni
da 0.5 M eV allinizio e alla fine del tratto di volo di 8.4 m. Da notare che una
divisione della scala corrisponde a circa 108 s.

Energia fornita
eV
0.5
1.0
1.5
4.5
15

Tempo di volo
t 108 s
3.23
3.08
2.92
2.84
2.80

Velocit`a dellelettrone
v 108 m/s
2.60
2.73
2.88
2.96
3.00

v 2 1016 m2 /s2
6.8
7.5
8.3
8.8
9.0

Tabella 1.1: Le quantit`a misurate nellesperimento al LINAC.


in B. In figura 1.3 abbiamo riportato anche la linea che corrisponde alla
predizione newtoniana, cio`e
v2 =

2eV
3.5 1017 V (M eV )
m

(1.15)

Vediamo che anche allenergia pi`


u bassa, 0.5 M eV , la formula newtoniana
2
17
predice v 1.75 10 che `e pi`
u di un fattore 2 maggiore del valore sperimentale dato in Tabella 1.1. Mentre la formula newtoniana funziona bene
sino ad energie dellordine del KeV , vediamo che fallisce completamente ad
energie pi`
u elevate. Inoltre, mentre non c`e un limite superiore alla velocit`a
nella dinamica di Newton, landamento trovato mostra che la curva satura
verso una velocit`a di 3 108 m/s cio`e alla velocit`a della luce. Questo `e
ancora pi`
u evidente se si considera la misura fatta a 15 M eV , non riportata nel grafico. Il risultato sperimentale `e quindi consistente con la seguente
affermazione: Esiste una velocit`
a limite per gli oggetti materiali e
questa `
e la velocit`
a della luce.
7

Predizione newtoniana
m 2 / s2

v 2 x 10

16

10

Predizione einsteiniana

4
2
1

Energia fornita (MeV)

Figura 1.3: Il grafico mostra il quadrato della velocit`a misurata dal tempo di
volo, in funzione dellenergia fornita dal van de Graaf e dal LINAC. La linea
tratteggiata `e la predizione che segue dalle equazioni di Newton. I punti sono i
dati sperimentali, e la linea continua `e la predizione che segue dalla relativit`a di
Einstein (vedi dopo).

Per quanto sorprendente possa essere questo risultato lo `e ancora di pi`


u
se lo esaminiamo da un altro punto di vista. Supponiamo di avere un LINAC
molto lungo nel quale si accelerano continuamente gli elettroni. Supponiamo
inoltre di essere in un riferimento che si muove solidalmente con gli elettroni
accelerati da una differenza di potenziale di 0.5 MV. Possiamo allora facilmente immaginare che gli elettroni continueranno ad accelerare fino a raggiungere ancora la velocit`a equivalente a 0.5 M eV nel riferimento in moto,
cio`e 2.6 108 m/s (vedi Tabella 1.1). Ma questo significa che questi elettroni
avranno una velocit`a, rispetto al riferimento fisso data 2 2.6 108 m/s che
`e pi`
u grande della velocit`a della luce, in contraddizione con il risultato sperimentale. Dunque questo risultato mette in dubbio la formula newtoniana
di addizione delle velocit`a. ma quale `e lorigine profonda di questa formula?
Come vedremo `e nella natura stessa della nostra concezione di spazio e di
tempo. Lanalisi profonda di Einstein fa infatti riferimento a queste concezioni e mostra come il problema delle misure di spazio e di tempo debba
8

essere reimpostato.
Una domanda che nasce spontanea dallesperimento che abbiamo studiato
`e che fine faccia lenergia che forniamo agli elettroni se esiste una velocit`a
limite. Dato che questa velocit`a coincide sperimentalmente con la velocit`a
della luce, sembra ragionevole andare ad esaminare pi`
u in dettaglio alcune
propriet`a della luce stessa.

1.2

Fotoni
y

x
E
v
z

H
Figura 1.4: La figura mostra la propagazione di unonda elettromagnetica che
incide su una particella di carica e.

Come vedremo meglio in seguito nella parte di Quanti di questo corso


Einstein ipotizz`o che lenergia luminosa U che compete alla banda di frequenze compresa tra e + d, fosse composta da un numero di fotoni pari
a
U
(1.16)
n=
h
dove h `e la costante di Planck
h = 6.626 1034 J s
9

(1.17)

` da notare che la costante di Planck ha le dimensione di unazione cio`e di


E
una energia per un tempo. Laffermazione precedente `e equivalente a dire
che ogni fotone ha una energia pari a
E = h

(1.18)

Una conferma a queste idee venne anche dalleffetto Compton (1923), cio`e
nello studio della diffusione di un fotone su elettroni. Tutto succede come se
la radiazione fosse composta da particelle (fotoni) con energia pari a quella
della formula (1.18) ed impulso pari a
p=

E
h
=
c
c

(1.19)

Questa relazione tra energia ed impulso trasportato da unonda elettromagnetica `e facilmente dimostrabile nel contesto della teoria di Maxwell. Supponiamo infatti di avere unonda e.m. che si propaga nella direzione dellasse
delle x con campi elettrico e magnetico diretti rispettivamente lungo lasse y
e lasse z, come mostrato in figura 1.4. Quindi
~ = (0, E, 0),
E

~ = (0, 0, H),
H

E=H

(1.20)

Il lavoro fatto nel tempo dt dal campo elettrico su una particella di carica e
che si muove con velocit`a ~v `e dato da
~ ~v dt = eEvy dt
dL = eE

(1.21)

Daltra parte la forza che agisce lungo lasse x (direzione di propagazione) `e


data da

1
~ + ~v H
~ = e vy H
Fx = e E
(1.22)
c
c
Pertanto limpulso trasmesso dallonda alla particella `e dato da
e
dL
dp = vy Hdt =
c
c

(1.23)

Dunque limpulso trasferito alla particella `e uguale allenergia trasferita divisa


per la velocit`a della luce.
Se quanto detto sopra `e corretto vediamo che la velocit`a dei fotoni `e
sempre uguale alla velocit`a della luce indipendentemente dalla loro energia.
Questo `e stato verificato sperimentalmente a partire da fotoni di energia
10

107 eV sino ad energie dellordine di 108 eV , cio`e su 15 ordini di grandezza


in energia. Quindi i fotoni appaiono molto simili agli elettroni di alta energia
la cui velocit`a, come abbiamo visto, `e indipendente dallenergia e pari alla
` interessante osservare che nel caso newtoniana, la
velocit`a della luce. E
relazione tra energia ed impulso `e data da
1
K = vp
2

(1.24)

che differisce per un fattore 2 da quella dei fotoni. In realt`a anche per gli
elettroni di alta energia si osserva sperimentalmente (tramite collisioni atomiche) che il loro impulso `e dato da K/c, in accordo con quanto vale per i
fotoni.
Nella prossima Sezione cercheremo di dare una risposta al quesito su dove
vada a finire lenergia degli elettroni o dei fotoni se non si ha un aumento
della velocit`a.

1.3

Linerzia dellenergia
L
a)

E
x

b)

Figura 1.5: La scatola passa dalla posizione a) alla posizione b) per effetto
dellemissione luminosa dal lato sinistro.

Consideriamo il seguente esperimento pensato (gedanken experiment) inventato da Einstein nel 1906. Immaginiamo che una quantit`a di energia
luminosa sia emessa dal lato sinistro della scatola nella posizione a) in figura
1.5. Per la conservazione dellimpulso la scatola deve acquistare un impulso

11

opposto a quello della radiazione e si muover`a verso sinistra. Quando la radiazione viene assorbita sul lato destro la scatola si fermer`a in una posizione
diversa da quella iniziale. Riesce per`o difficile immaginare che il centro di
massa del sistema si sia spostato, dato che si ha un sistema isolato. La sola
soluzione possibile sembra essere quella in cui il fotone trasporta una massa
dal lato sinistro al lato destro. Per calcolare questa massa, osserviamo che
limpulso acquistato dalla scatola sar`a pari a E/c e quindi si muover`a con
velocit`a
E
v=
(1.25)
Mc
In buona approssimazione la radiazione arriva sullaltro lato della scatola
dopo un tempo pari a
L
t =
(1.26)
c
e quindi lo spostamento della scatola in questo tempo sar`a
x = vt =

E
L
EL
=
Mc
c
M c2

(1.27)

Se associamo alla radiazione una massa equivalente m, che passa dal lato
sinistro al lato destro, la condizione che il centro di massa sia rimasto nella
posizione iniziale richiede
mL + M x = 0
da cui
m=

M
E
x = 2
L
c

(1.28)

(1.29)

Quindi
E = mc2

(1.30)

Sebbene qui m venga associata alla radiazione, in realt`a le implicazioni


sono molto pi`
u grandi. Infatti occorre riconoscere che quando la radiazione
viene emessa dal lato sinistro, questo subisce una perdita di massa pari a
m, che viene trasportata via sotto forma di radiazione e che viene ritrasformata in massa allaltra estremit`a. Quindi limplicazione `e che allenergia sia
associata una massa e viceversa. In definitiva ad ogni variazione E dellenergia di un corpo corrisponde una variazione della massa inerziale tale che
E = mc2 .

12

m1

m2
L

a)
E
b)

m'1

m'2

v1

v2

Figura 1.6: Versione migliorata dellesperimento di Einstein.


Nella discussione precedente abbiamo trattato la scatola come un corpo
rigido. Lidea di corpo rigido non ha per`o significato se si accetta lidea di una
velocit`a limite. Infatti un corpo pu`o essere rigido solo se le informazioni tra le
sue parti vengono trasmesse a velocit`a infinita. In figura 1.6 `e rappresentata
una versione dellesperimento di Einstein che non fa uso di una scatola, ma
di due masse m1 e m2 . La massa m1 emette radiazione e quindi si muove
verso sinistra con velocit`a v1 e contemporaneamente varia la sua massa da
m1 a m01 . Quando la radiazione arriva sulla massa a destra, viene assorbita
conferendole una velocit`a v2 . Anche in questo caso la massa cambia da m2 a
m02 . Richiedendo che la massa totale del sistema non cambi e che il baricentro
rimanga nella posizione originaria si ritrova la relazione di Einstein. Infatti
si ha
E
v1 = 0
(1.31)
m1 c
e la posizione di al tempo t sar`a (usando un sistema di coordinate tale che
x1 (0) = 0 e x2 (0) = L)
E
(1.32)
x( t) = 0 t
m1 c
Analogamente si ha
v2 =

E
m02 c

13

(1.33)

E
x2 (t) = L + 0
m2 c

L
t
c

(1.34)

dove si `e tenuto conto che la massa m2 inizia a muoversi al tempo L/c quando
la radiazione la raggiunge (anche in questo caso si assume che le velocit`a delle
due acquisite dalle due masse siano piccole rispetto a c). La posizione del
centro di massa prima dellemissione era (M = m1 + m2 = m01 + m02 )
M x = m1 0 + m2 L
mentre dopo lassorbimento

E
E
L
EL
0
0
0
M x = m1 0 t + m2 L + 0
t
= m02 L 2
m1 c
m2 c
c
c

(1.35)

(1.36)

Richiedendo x = x0 segue
m2 L = m02 L

EL
c2

da cui
m = m02 m2 =

(1.37)

E
c2

(1.38)

E
c2

(1.39)

e dato che M non cambia si ha anche


m1 = m2 =

1.4

Energia, impulso e massa

Usando i risultati precedenti si vede facilmente che lenergia di un corpo


aumenta tanto pi`
u rapidamente quanto pi`
u il corpo ha velocit`a vicina a
quella della luce. Ricordiamo che abbiamo visto che per i fotoni E = cp
ed inoltre associata allenergia E ce una massa m = E/c2 . Sostituendo la
prima relazione nella seconda segue
m=

p
c

(1.40)

Questa relazione `e identica a quelle per particelle ordinarie


m=
14

p
v

(1.41)

Quindi la (1.40) pu`o essere vista come un caso particolare della (1.41).
Combinando questa relazione con m = E/c2 ed eliminando m si ottiene
E=

c2 p
v

(1.42)

In meccanica si `e usualmente interessati nella variazioni di energia prodotte


da forze. Questa variazione si calcola con
dE = F dx =

dp
dx = v dp
dt

(1.43)

Usando questa relazione con la (1.42) si trova


E dE = E v dp = c2 p dp

(1.44)

E 2 = c2 p2 + E02

(1.45)

che integrata da
da questa possiamo trovare E in funzione della velocit`a riesprimendo p in
funzione di v tramite la (1.42). Si trova
2
vE
2
E=c
+ E02
(1.46)
c2
da cui
E(v) = p

E0
1 v 2 /c2

per velocit`a piccole rispetto a quelle della luce, v c, si trova



1 E0
E(v) E0 +
v2
2 c2

(1.47)

(1.48)

Se identifichiamo E0 /c2 con la massa inerziale del corpo si ottiene


1
E(v) m0 c2 + m0 v 2 ,
2

E0 = m0 c2

(1.49)

Vediamo che il secondo termine non `e altro che lenergia cinetica newtoniana,
mentre il primo termine `e lenergia associata alla massa inerziale. In meccanica newtoniana il prime termine viene ignorato perch`e `e una costante,
mentre adesso abbiamo visto che ci pu`o essere un trasferimento tra la parte
15

di massa e la parte di energia cinetica. Infatti possiamo definire, nel caso


in esame, lenergia cinetica come la differenza tra lenergia della particella in
moto e lenergia della particella ferma. Il risultato `e

!
1
K = m0 c2 p
1
(1.50)
1 v 2 /c2
Se da questa si ricava v in funzione di K

m20 c4
2
2
v =c 1
(K + m0 c2 )2

(1.51)

si trova la curva continua di figura 1.3 indicata come predizione einsteniana.


Quindi abbiamo riprodotto correttamente i risultati sperimentali. Usando
ancora p = vE/c2 si trova
m0 v

p(v) = p

1 v 2 /c2

Questa, assieme
E(v) = p

m0 c2
1 v 2 /c2

(1.52)

(1.53)

definisce completamente la cinematica relativistica. In alcuni testi il fattore


contenente la radice viene attribuito alla massa. In questo caso le formule
precedenti diventano
p = m(v)v,

E = m(v)c2

(1.54)

In questo contesto m0 assume il significato di massa del corpo a riposo, dato


che
m0
m(v) = p
(1.55)
1 v 2 /c2
Ovviamente questa `e solo una questione di linguaggio. Noi non introdurremo
una massa dipendente dalla velocit`a, ma il linguaggio precedente pu`o essere
utile per un confronto con il caso newtoniano. Infatti vediamo che facendo
tendere la velocit`a a quella della luce lenergia e limpulso di una particella
diventano sempre pi`
u grandi. Se si reinterpreta questo in termini newtoniani
`e come se fornendo energia agli elettroni nel LINAC convertissimo la gran
parte di questa energia in massa della particella invece che in aumento di
16

velocit`a. Daltra parte, nel linguaggio einsteiniano, poich`e massa ed energia


possono trasformarsi luna nellaltra e non esistono pi`
u due quantit`a conservate, la massa e l energia, ma solo lenergia totale, risulta pi`
u conveniente
non introdurre il concetto di massa dipendente dalla velocit`a, ma parlare
solo dellenergia totale. In questo contesto anche lenergia cinetica perde di
valore teorico, sebbene sia ancora importante ai fini sperimentali.
Possiamo vedere sotto queste nuove assunzioni cosa succede ad un corpo
soggetto ad una forza costante. Nel caso classico abbiamo visto che la sua
velocit`a cresce senza limite. Nel caso relativistico invece ci aspettiamo che
la velocit`a tenda a c. Per dimostrare questo risultato assumeremo che valga
ancora la seconda legge di Newton, ma con il valore relativistico dellimpulso.
Cio`e
F t = p
(1.56)
e nel caso in cui la forza sia costante e la si applichi per un tempo t ad una
particella inizialmente ferma
F t = p(v) = p
Da cui

da cui

m0 v
1 v 2 /c2

v 2 m 0 v 2
1 2 =
c
Ft

m c 2
v2
0
1= 2 1+
c
Ft

e finalmente

v(t) = p

1 + (m0 c/F t)2

(1.57)

(1.58)

(1.59)
(1.60)

Per tempi sufficientemente piccoli tali che F t m0 c segue


v(t)

c
F
=
t
(m0 c/F t)
m0

che `e il risultato newtoniano. Per tempi t tali che F t m0 c invece

1 m 0 c 2
v c 1
c
2 Ft

17

(1.61)

(1.62)

1.5

Commenti

Come abbiamo visto, i risultati dellesperimento sul LINAC ci hanno portato


a cambiare alcuni risultati della meccanica di Newton, nel caso di velocit`a
vicine a quella della luce. In particolare abbiamo visto lequivalenza massaenergia e quindi la possibilit`a di trasformazione delluna nellaltra. La pi`
u
importante differenza `e per`o nel fatto che lesperimento ci porta a concludere
che debba esistere una velocit`a limite, quella della luce, mentre nella meccanica newtoniana tale limite non esiste. Abbiamo anche fatto vedere nella
sezione precedente, come, pur facendo uso delle equazioni di Newton con
una modifica nellespressione dellimpulso, si ritrovi effettivamente il fatto
sperimentale che allorche si sottoponga una particella ad una forza costante, questa aumenta la sua energia, ma la velocit`a tende a c. Ovviamente
vorremmo ottenere questo risultato nellambito di una teoria unitaria e non
facendo uso di informazioni sperimentali unite in modo ad hoc alla meccanica
di Newton. Sembra quindi necessario un riesame completo delle basi stesse
della meccanica. Infatti, abbiamo gi`a accennato al fatto che lesistenza di
una velocit`a limite richiede che la legge di composizione delle velocit`a di un
corpo rispetto ad un riferimento, S 0 , in moto rispetto ad un riferimento S, e
la velocit`a del riferimento S 0 rispetto ad S non possa essere semplicemente
la somma delle due velocit`a, come richiederebbe lintuizione che noi abbiamo
dello spazio e del tempo. La necessit`a di questa analisi origin`o gi`a alla met`a
dellottocento in relazione ai successi della teoria di Maxwell dellelettromagnetismo. Per dirla in breve, la velocit`a della luce appare nelle equazioni
di Maxwell come un coefficiente legato alla permeabilit`a magnetica ed alla
costante dielettrica del vuoto. Pertanto se effettuiamo una trasformazione
da un riferimento S ad un altro in moto rettilineo uniforme S 0 rispetto ad S,
la velocit`a della luce in S ed in S 0 non pu`o essere la stessa. Ne risulterebbe
quindi che le equazioni di Maxwell non sono invarianti e quindi sarebbero
valide in un solo sistema di riferimento. Questo fu il punto di vista adottato
inizialmente. Una delle ragioni fu anche dovuta al fatto che le equazioni di
Maxwell hanno soluzioni di tipo ondulatorio e quindi, da un punto di vista
meccanicistico, questo richiedeva lesistenza di un mezzo che in qualche modo
vibrasse, come succede per le onde elastiche. Un tale mezzo fu denominato
con la parola etere e nacque il problema di identificare questo mezzo ed in
particolare la velocit`a con la quale noi ci muoviamo rispetto a tale mezzo.

18

Capitolo 2
Laffermazione del principio di
relativit`
a
2.1

Il principio di relativit`
a in meccanica e le
trasformazioni di Galileo

vt
S

S'
x

x'
P
v
x

x'

Figura 2.1: Il punto P come descritto dai due riferimenti S e S 0 in moto uno
rispetto allaltro con velocit`a costante v.

Ricordiamo che il principio di relativit`a di Galileo richiede che le leggi


della meccanica siano le stesse quando le si descrivano da due sistemi di
riferimento S e S 0 in moto rettilineo uniforme uno rispetto allaltro. Se
19

consideriamo i due sistemi in moto come descritti in figura 2.1 si ha


x0 = x vt,

y 0 = y,

z0 = z

(2.1)

dove abbiamo assunto che allistante t = 0 i due riferimenti coincidano. A


questa relazione si aggiunge lulteriore condizione che i tempi misurati nei
due riferimenti coincidano
t0 = t
(2.2)
Le equazioni (2.1) e 2.2) costituiscono le trasformazioni di Galileo. La
relazione tra la velocit`a di P nel sistema S, ~u e S 0 , ~u0 si trova immediatamente
per differenziazione
~u 0 = ~u ~v
(2.3)
Come si vede la legge di composizione delle velocit`a `e conseguenza immediata
delle trasformazioni di Galileo. Verifichiamo adesso che le leggi della dinamica
sono invarianti rispetto a trasformazioni di Galileo se facciamo lulteriore
assunzione che la massa e le forze siano assolute, cio`e
m0 = m,

F~ 0 = F~

(2.4)

Infatti si ha subito dalla (2.1)


d2 x
d2 x 0
02 =
dt
dt2

(2.5)

ed analoghe per le altre coordinate. Pertanto


m0

d2~x 0
~0
02 = F
dt

(2.6)

La propriet`a della massa di essere invariante di Galileo `e legata alla legge


di conservazione della massa, che `e sperimentalmente corretta per velocit`a
piccole rispetto a quella della luce. Per quanto riguarda la forza, notiamo che
tipicamente le forze derivano da interazioni a due corpi (vedi il principio di
azione e reazione). Ma la distanza relativa tra due corpi non cambia rispetto
ad una trasformazione di Galileo e questo giustifica lassunzione che anche la
forza sia una grandezza assoluta.
Occorre qui fare una precisazione, cio`e che le leggi di Newton stesse sono
valide solo in una categoria di sistemi di riferimento, i cosi detti riferimenti
inerziali, cio`e quei riferimenti in cui un corpo libero, non soggetto a forze delle quali sia possibile rintracciare la causa, si muove di moto rettilineo
20

uniforme. Linvarianza galileiana ci dice che di tali riferimenti ne esistano


infiniti, tutti quelli collegati da una trasformazione di Galileo. Non `e facile
definire. o determinare sperimentalmente, un riferimento inerziale. Sicuramente la terra non `e un tale riferimento. In genere si assume che un tale
riferimento possa essere costituito da uno con lorigine nel sole e gli assi
orientati secondo le stelle fisse.
Una volta chiarita la struttura delle trasformazioni di Galileo `e evidente la
loro incompatibilit`a con le equazioni di Maxwell, che prevedono che nel vuoto le onde e.m. si muovano sempre con velocit`a pari a c indipendentemente
dal moto della sorgente delle onde stesse. Pi`
u formalmente si pu`o verificare
esplicitamente che le equazioni di Maxwell non sono invarianti rispetto a trasformazioni di Galileo. Se daltro canto richiediamo alle equazioni di Maxwell
di soddisfare il principio di relativit`a, `e evidente che sotto le corrispondenti
trasformazioni la velocit`a della luce non pu`o cambiare. Quindi queste trasformazioni non possono coincidere con le trasformazioni di Galileo. Infatti
Poincare determin`o queste trasformazioni (dette adesso trasformazioni di Lorentz) che sono tali da ridursi a quelle di Galileo per v c. Ritorneremo in
seguito sulla forma di queste equazioni. Vediamo dunque che si aprono due
possibilit`a
La fisica `e invariante sotto trasformazioni di Galileo. In questo caso la
meccanica di Newton `e corretta, ma esiste un riferimento privilegiato
in cui valgono le equazioni di Maxwell.
La fisica `e invariante sotto trasformazioni che lasciano invariate le equazioni di Maxwell. In questo caso la velocit`a della luce `e invariante ed
occorre modificare la meccanica di Newton
Ovviamente esiste una terza possibilit`a, cio`e che nessuna delle due precedenti
sia corretta. Per quanto riguarda il primo caso lovvio punto a cui mirare `e
quello di determinare se la velocit`a della luce sia la stessa in tutti i riferimenti
inerziali, oppure se cambi da un riferimento ad un altro. Prima di passare a
questa discussione ci sar`a per`o utile ricavare dalla (2.3) le leggi di trasformazione dei moduli e degli angoli delle velocit`a. facendo uso della (2.3) con le
definizioni in figura 2.2 si ha
u cos v = u0 cos 0
u sin = u0 sin 0

21

(2.7)

Da queste ricaviamo: dividendo la seconda per la prima


tan 0 =

sin
cos v/u

(2.8)

e, quadrando e sommando:
u0 = (u2 + v 2 2uv cos )1/2
o anche

u =u 1+

v 2
u

v
u

1/2
cos

(2.9)

z'

X'
V

O'

u'
'

x x'

y'

Figura 2.2: La figura illustra due riferimenti inerziali in moto relativo e la


composizione delle velocit`a.

22

2.2

Linvarianza della fase di unonda piana

Assumiamo per il momento latteggiamento che le equazioni di Maxwell siano vere in un riferimento privilegiato, quello dell etere. Quindi in ogni
riferimento diverso da questo le equazioni di Maxwell devono avere delle correzioni, che ci aspettiamo essere piccole, almeno di ordine v/c, dove v `e la
velocit`a del riferimento in relazione a quello delletere. Ci aspettiamo dunque di poter mettere in evidenza queste correzioni con esperimenti di tipo
ottico. Ai fini di questa discussione introduciamo una propriet`a particolare
delle onde piane, cio`e l invarianza della fase.

S'

z'

n
Q
P'

P
V

x x'

O'
L

Figura 2.3: La figura illustra il principio dellinvarianza della fase di unonda


piana.

23

Nel riferimento S londa piana `e descritta dalla funzione


~n ~x
(~x, t) = A cos t
c

(2.10)

dove
2
~n ~
= k; |~k| =
; ~n2 = 1
(2.11)
c

e dove ~k `e il vettore di propagazione e c `e la velocit`a della luce, c 3


1010 cm/s1 . Si definisce fase dellonda piana la quantit`a

~n ~x
F (~x, t) = t
(2.12)
c
= 2;

La fase ha un significato fisico molto interessante. Supponiamo, vedi figura


2.3, di aver marcato londa che a t = 0 passa dallorigine O del riferimento
S. Supponiamo di aver posizionato un osservatore nel punto P solidale con
S. Si ha allora che il numero di onde che P conta a partire dallistante in
cui londa marcata passa per P sino al tempo t `e dato esattamente dalla
fase F calcolata in P . Infatti londa marcata impiega un tempo pari a L/c
per arrivare in P che quindi conter`a per un tempo pari a t L/c. Dato che
arrivano onde al secondo, il numero di onde contate sar`a pari a

L
t
= F (~x, t)
(2.13)
c
dato che
L = ~n ~x

(2.14)

Consideriamo adesso un riferimento S che si muova rispetto ad S con velocit`a


v come in figura 2.3 ed un punto P 0 , solidale con S 0 che coincida con P al
` evidente che il numero di onde che P 0 conta a partire
tempo t0 = t. E
dallonda marcata sino a quando coincide con P sar`a identico a quello contato
da P . Daltra parte anche nel riferimento S 0 vale il ragionamento fatto in S
e quindi il numero di onde contato da S 0 sar`a pari a F (~x0 , t) con
!

0x
0
~
~
n
~n ~x
0
0
0
F (~x , t) = t
= F (~x, t) = t
(2.15)
c0
c
1

Attualmente la velocit`a della luce viene usata per definire lunit`a di lunghezza. Il metro
`e definito come la distanza percorsa da un raggio luminoso in un intervallo di tempo pari
a 1/299792458 secondi. Dunque per definizione si ha c = 2.99792458 1010 cm/s.

24

Usando le trasformazioni di Galileo (eq. (2.1))


~x 0 = ~x ~v t
segue

n~ 0 x~ 0
t
c0

~n (x~ 0 + ~v t 0 )
t
c

Uguagliando i coefficienti di ~x 0 e di t 0 si ottiene

~n ~v
0
= 1
c

(2.16)
!
(2.17)

(2.18)

~n 0
~n
=
(2.19)
0
c
c
Questultima ci dice che ~n e ~n 0 sono vettori paralleli, ma essendo versori
dovranno essere uguali. Quindi
0

0
=
0
c
c

~n = ~n 0 ,

(2.20)

La seconda relazione in congiunzione con la (2.18) ci permette di determinare


c 0:

0
~n ~v
0
c =c =c 1
= c ~n ~v
(2.21)

2.3

Effetto Doppler

la (2.18) `e lespressione matematica delleffetto Doppler, che `e leffetto che


si verifica quando losservatore e la sorgente sono in moto relativo. Per`o
questa equazione non pu`o essere usata direttamente perche se assumiamo le
trasformazioni di Galileo dobbiamo anche assumere lesistenza delletere e sia
losservatore che la sorgente potrebbero essere in moto rispetto al riferimento
delletere. Consideriamo allora tre sistemi di riferimento S0 , il riferimento in
cui la sorgente `e a riposo, S, il riferimento delletere e S 0 , il riferimento
dellosservatore. Detto questo, possiamo applicare la (2.18) al moto della
sorgente rispetto alletere. Quindi

~n ~v0
(2.22)
0 = 1
c
25

dove ~v0 `e la velocit`a della sorgente rispetto alletere. Possiamo usare questa
equazione per eliminare la frequenza che `e la frequenza dellonda considerata nel riferimento delletere. Usando ancora la (2.18) tra S 0 e S ed eliminando
si ha
~n ~v
1
c
(2.23)
0 = 0
~n ~v0
1
c
con ~v la velocit`a dellosservatore rispetto alletere. Dato che `e possibile
misurare la velocit`a relativa tra la sorgente e losservatore
~vr = ~v ~v0

(2.24)

e le due frequenze 0 e 0 dalla equazione precedente possiamo determinare


la velocit`a assoluta della sorgente ~v . Daltra parte se sia ~v che ~v0 sono piccoli
rispetto alla velocit`a della luce (come `e praticamente il caso), sviluppando al
primo ordine in ~v /c e ~v0 /c segue

2 !
(~
n

~
v
)
~
n

~
v
(~
n

~
v
)
0
0
0 0 1
1+
+
c
c
c

~n ~vr (~n ~v0 )(~n ~vr )


0 1

(2.25)
c
c2
Quindi la velocit`a assoluta ~v = ~v0 + ~vr `e contenuta solo nei termini del
secondo ordine. Leffetto Doppler viene osservato negli spettri stellari dove
le linee sono spostate verso il rosso o verso il violetto a seconda che la terra
si allontani o si avvicini all stella. Dato che la velocit`a della terra sulla sua
orbita `e dellordine di 3 106 cm/s e le velocit`a stellari sono dello stesso
ordine di grandezza, si ha tipicamente v/c 104 . Dunque gli effetti del
secondo ordine sono circa 108 , praticamente inosservabili. Questo effetto
si pu`o misurare anche in sorgenti terrestri. Stark [1] nel 1906 misurava le
frequenze emesse da atomi idrogenoidi in movimento con velocit`a dellordine
di 108 cm/s. Adesso si hanno valori tipici v/c 1/300 che danno per`o
effetti del secondo ordine ancora inosservabili. Nel 1938 Ives [2] sfruttando i
notevoli miglioramenti tecnici fu in grado di osservare gli effetti del secondo
ordine dimostrando che questi non erano in accordo con il risultato da noi
trovato, ma che invece dipendevano dalla sola velocit`a relativa in accordo con
la teoria della relativit`a di Einstein (vedi dopo).
26

2.4

Velocit`
a di fase, velocit`
a di gruppo e aberrazione della luce

Ricordiamo dalla (2.21)


c 0 = c (~n ~v )

(2.26)

Questa equazione permetterebbe in linea di principio la determinazione


dela velocit`a assoluta della terra v, misurando c0 e data c. Queste misure
furono fatte (Fizeau 1848; Foucault 1865), ma non fu rilevata alcuna influenza
del moto della terra sulla velocit`a della luce. In altre parole la velocit`a della
luce risult`o invariata, in accordo con il principio di relativit`a speciale, per cui
il valore di c, che compare nelle equazioni di Maxwell, non pu`o variare da un
sistema di riferimento inerziale ad un altro.
Tuttavia va osservato che la (2.26) `e ricavata dalle formule di trasformazione delle caratteristiche di unonda, mentre gli esperimenti sulla velocit`a della luce devono essere interpretati in termini di pacchetti donda, e
quindi in termini di velocit`a di gruppo. Poiche queste due grandezze hanno
importanza di carattere generale, apriamo una parentesi per discuterle.

2.4.1

La velocit`
a di fase e la velocit`
a di gruppo

Sia f (~x, t) un segnale e.m.. Per esempio si pu`o considerare una componente
del campo elettrico o magnetico. Possiamo rappresentarlo come trasformata
di Fourier
Z
~
~
f (~x, t) = A(~k)ei[(k)tk~x] d3~k
(2.27)
In questa relazione `e una funzione assegnata di ~k, determinata dallequazione donda. Questa relazione tra la frequenza angolare e il vettore
di propagazione ~k si chiama relazione di dispersione. Il rapporto /|~k| `e la
velocit`a di fase vf ed `e la velocit`a di propagazione di quellonda che ha come
vettore di propagazione ~k e come lunghezza donda = 2/k. Nel caso della
propagazione della luce nel vuoto si ha = c|~k|. Quindi, la velocit`a di fase
`e costante ed `e uguale a c.

27

Se f rappresenta un pacchetto lampiezza di Fourier A `e una funzione


con un massimo ben definito per un determinato valore di ~k = ~k0 . Poniamo
0 = (~k0 ).
Lesponente si pu`o approssimare nel modo seguente
(~k)t ~k ~x =

~
~
~
~
= 0 + (k0 ) (k k0 ) t ~k ~x =

~ ~k0 ) t ~x (
~ ~k0 )t ~k
= 0 ~k0 (

(2.28)

e poniamo
f (~x, t) = ei(0 k0 (k0 ))t M (~x, t),
Z
~
~ ~
M (~x, t) =
A(~k)e+i[(~x(k0 )t)k] d3 k
~ ~

(2.29)
(2.30)

dove M `e il fattore modulante, mentre lesponenziale a fattore rappresenta


londa portante. Comparando la (2.27) con la (2.30) vediamo che
~ ~k0 )t, 0))
M (~x, t) = f (~x (

(2.31)

Pertanto M (~x, t) soddisfa lequazione delle onde con velocit`a pari a


~ ~k0 ))
~vg = (

(2.32)

Dato che lenergia trasportata dallonda `e proporzionale al modulo quadro


dellampiezza vediamo che il fattore di fase in fronte non `e rilevante a questi
fini e quindi lenergia si propaga con velocit`a pari a ~vg , la velocit`
a di grup`
po. E interessante notare che la (2.31) pu`o essere interpretata nel seguente
modo: consideriamo il valore del fattore modulante in un dato punto ~x0 a
t = 0, M (~x0 , 0) e consideriamo al tempo t il punto che si muove con velocit`a
~vg a partire da ~x0 , cio`e
~x(t) = ~x0 + ~vg t
(2.33)
segue allora immediatamente dalla (2.31) che
M (~x(t), t) = M (~x0 , 0)
28

(2.34)

Dunque lungo i punti che si muovono a velocit`a ~vg il fattore modulante


`e costante e quindi il profilo dellonda `e trasportato senza alterazioni con
velocit`a ~vg .
La velocit`a di fase e la velocit`a di gruppo in generale non coicidono.
Nel caso di una relazione di dispersione non dispersiva, cio`e quando `e
proporzionale a |~k|, le due velocit`a coincidono, altrimenti si dice che si ha
dispersione.

2.4.2

Legge di trasformazione della velocit`


a di gruppo

Se osserviamo un segnale e.m. in un sistema di riferimento inerziale S 0 ,


in moto rettilineo e uniforme rispetto al sistema S, nel quale osserviamo
lo stesso segnale f (~x, t), sappiamo che le sue caratteristiche si trasformano
secondo equazioni (2.18), (2.20) e (2.21). Queste valgono nel caso di unonda
e.m. e permettono di determinare la regola di trasformazione della velocit`a
di gruppo.
Si pu`o per`o dimostrare che la regola cos` determinata vale in generale,
anche per altri tipi di onde.
Poiche nel caso e.m. il modulo del vettore di propagazione `e dato da

|~k| =
c
e ~n `e la sua direzione, lequazione (2.18) si pu`o scrivere
0 = ~k ~v

(2.35)

(2.36)

Questa `e la legge di trasformazione di dal sistema S al sistema S 0 .


Tenuto conto dellespressione per la velocit`a di gruppo (2.32), si ha che la
velocit`a di gruppo in S 0 cio`e ~v 0g `e data da
~v 0g = ~vg ~v

(2.37)

cio`e la velocit`a di gruppo segue la stessa legge di trasformazione della velocit`a


di una particella materiale.
Se si confronta la legge di trasformazione (2.37) con la legge di trasformazione per le velocit`a di fase (2.26), si vede che sono diverse, salvo il caso
molto particolare in cui ~v e ~n sono paralleli (si pu`o per`o mostrare che differiscono solo per termini del secondo ordine in v/c (vedi referenza [3] e sezione
seguente).
29

2.4.3

Laberrazione della luce

Tornando alla determinazione della velocit`a assoluta della terra, gli esperimenti fatti a questo scopo non dettero alcun risultato, pur tenendo conto che
` per`o
la velocit`a da considerare `e la velocit`a di gruppo e non quella di fase. E
da tener presente che ci`o `e vero per gli effetti del primo ordine in v/c. Negli
esperimenti citati (Fizeau), nei quali si misurava la velocit`a di un raggio di
luce su di un cammino chiuso, la precisione della misura permetteva di tener
conto dei soli termini del primo ordine.
Questi esperimenti furono condotti anche in presenza di un mezzo rifrattivo, con gli stessi risultati.
In conclusione, solo con esperimenti in grado di misurare termini di ordine
superiore si poteva sperare di ottenere un risultato significativo, perche allora,
come mostra lequazione (2.25), si possono misurare termini che dipendono
dalla velocit`a assoluta.
Prima di passare alla descrizione del pi`
u famoso di questi esperimenti, cio`e
quello di Michelson, discutiamo laltro effetto che si pu`o ricavare dalla legge
di trasformazione di un pacchetto di radiazione e.m. (2.37), cio`e la variazione
della direzione di un raggio luminoso dovuta al moto della sorgente; questo
effetto si chiama aberrazione della luce.
Se e 0 sono gli angoli tra la direzione di ~v con ~vg e ~v 0g rispettivamente,
dalla (2.37) si ricava, tenendo conto della Fig. (2.4),

Vg

'

Vg'

Figura 2.4: Laberrazione stellare


30

vg0 cos 0 = vg cos + v


vg0 sin 0 = vg sin

(2.38)

dalle quali, dividendo membro a membro


tan 0 =

sin
cos + v/vg

(2.39)

che `e lespressione per laberrazione della luce proveniente da un stella, dove


0 `e langolo sotto il quale si osserva la stella dal riferimento terrestre e `e
langolo sotto il quale apparirebbe la stella in un riferimento assoluto. ~v `e la
velocit`a del riferimento terrestre rispetto allo spazio assoluto.
Questa formula `e corretta al primo ordine in v/c, se con v si intende la
velocit`a della terra rispetto al riferimento astronomico delle stelle fisse.
Osservare che la (2.39) si pu`o ricavare dallanaloga (2.8) con la sostituzione
+ ; 0 0 +

(2.40)

che `e dovuta al fatto che gli angoli che si misurano sono appunto quelli
indicati in Fig. (2.4), mentre gli angoli che i vettori ~vg e ~v 0g formano con la
direzione di ~v , coerentemente con la Fig. (2.2), sarebbero quelli aumentati
di nel senso positivo (antiorario).
Dalle (2.38) si pu`o ricavare anche il modulo di ~v 0g ,. Portando v a primo
membro e poi quadrando e sommando si ottiene
2

vg0 + v 2 2vvg0 cos (0 ) = vg2

(2.41)

che, risolta in vg0 (e scegliendo il ramo opportuno) fornisce


q
0
vg = vg2 v 2 + (v cos (0 ))2 + v cos (0 )

(2.42)

che si pu`o anche riscrivere


q
vg0 = vg2 v 2 + (~v ~e 0 )2 (~v ~e 0 )

(2.43)

dove ~e 0 `e il versore di ~v 0g . Notiamo che sviluppando questa formula al primo


ordine in v/c si ha
(2.44)
vg0 = vg (~v ~e 0 ) + O((v/c)2 )
31

Quindi vediamo che a meno di termini del secondo ordine la velocit`a di fase
e quella di gruppo si trasformano nello stesso modo.
Possiamo anche verificare che per esperimenti effettuati su percorsi chiusi
di un raggio luminoso non ci sono effetti del primo ordine dovuti al moto
rispetto alletere. In un arrangiamento sperimentale come in figura 2.5, se
indichiamo con ~ei i versori dei lati del poligono e con `i i lati si ha:

e2
e1

e3

O
eN

e4

Figura 2.5: Percorso chiuso di un raggio luminoso come usato negli esperimenti
di Fizeau e di Foucault.

~ei `i = 0

(2.45)

Il tempo necessario al raggio luminoso a percorrere il cammino chiuso sar`a


dato da
X
X `i
`i
p
=
t=
(2.46)
0
2
2
ui
c v + (~v ~ei )2 ~v ~ei
i
i
dove ~v `e la velocit`a del riferimento terrestre rispetto alletere. Espandendo
al primo ordine in v/c si ha
t

X
i

X `i X (~v ~ei )`i X `i


`i

+
=
2
c ~v ~ei
c
c
c
i
i
i

(2.47)

Quindi non sono visibili effetti al primo ordine. Questo completa gli argomenti precedenti.

32

2.5

Lesperimento di Michelson

Abbiamo visto che tutti gli esperimenti citati mostrano accordo con il principio di relativit`a esteso ai fenomeni e.m. (indipendenza del moto del sistema
rispetto al sistema assoluto). Tuttavia non avevano laccuratezza necessaria
per testare i termini del secondo ordine in v/c.
Fu Michelson (A.A.Michelson, 1881, e poi A.A.Michelson e E.W.Morley,
1887) che misur`o la velocit`a della luce con un interferometro con una precisione che permetteva di determinare i termini del secondo ordine in v/c.

S2

d
2

L
1
d

S1

V
T
Figura 2.6: Schema dellinterferometro di Michelson

33

In modo estremamente schematico linterferometro era come indicato in


figura 2.6.
Mediante lo specchio semitrasparente P un raggio di luce proveniente dalla sorgente L viene diviso in due parti, un raggio 1 e un raggio 2, mutuamente
perpendicolari.
Il raggio 1 viene riflesso dallo specchio S1 verso P , dove una sua parte
viene riflessa ulteriormente nel telescopio T .
Il raggio 2 viene riflesso dallo specchio S2 verso P e una sua parte attraversa P ed entra nel telescopio T , dove interferisce col raggio 1.
Anche se lapparato fosse a riposo rispetto alletere dovremmo osservare
delle frange dinterferenza in T , a causa delle inevitabili differenza nei due
bracci P S1 e P S2 .
Supponiamo ora che lapparato sia disposto con il braccio P S1 parallelo
alla direzione del moto della terra rispetto alletere e siano i due bracci uguali
a d (in realt`a vi sar`a una piccola differenza responsabile dellinterferenza di
cui abbiamo gi`a parlato, il cui effetto sar`a per`o eliminato come vedremo pi`
u
sotto).
Per mezzo dellequazione (2.43) con vg = c si pu`o calcolare la differenza di
fase F dei raggi 1 e 2, dovuta al moto dellapparato sperimentale nelletere.
Applicando la (2.43) al caso del percorso P S1 , si ha che ~e0 `e parallelo a
~v , dove ~v `e la velocit`a della terra rispetto alletere.
Quindi, per il percorso da P a S1 si ha
v 0g = c v

(2.48)

mentre per il percorso inverso si ha


v 0g = c + v

(2.49)

Quindi il tempo t1 che il raggio 1 impiega per andare da P a S1 e ritorno


`e
t1 =

d
d
2d
+
=
cv c+v
c(1 v 2 /c2 )

(2.50)

Per il percorso P S2 ed anche per il ritorno S2 P si ha


v 0g =

c2 v 2

e il tempo t2 impiegato `e
34

(2.51)

t2 = 2d

1
c2 v 2

(2.52)

Per F si ha
"

2d
2d
F = (t1 t2 ) =
p
2
2
c(1 v /c ) c 1 v 2 /c2

p
2d 1 1 v 2 /c2
=
c
1 v 2 /c2
(2.53)

Se si calcola F al secondo ordine, si ha


v2
(2.54)
c3
Se ora si ruota tutto lapparato di 900 i due percorsi si scambiano e la
differenza di fase diventa F . Viceversa, la differenza di fase dovuta alla
piccola differenza dei due bracci resta identica. Quindi, facendo la differenza,
si ottiene 2F e leffetto della differenza dei bracci si elide.
Il risultato dellesperimento di Michelson fu che questa differenza di fase
era zero, nonostante che il valore aspettato, dato dalla (2.54), fosse due ordini
di grandezza superiore alla precisione dellapparato.
Quindi si ha un risultato che indica che il principio di relativit`a, nella sua
forma estesa, `e valido almeno fino al secondo ordine in v/c.
F = d

35

Capitolo 3
La critica della simultaneit`
ae
la cinematica relativistica
3.1

Critica della simultaneit`


a

Linsieme degli esperimenti sulla velocit`a della luce avevano determinato se


non la certezza almeno la convinzione della validit`a del principio di relativit`a
esteso a tutti i fenomeni (meccanici ed elettromagnetici). In particolare, se si
assumono valide le equazioni di Maxwell, si ha come conseguenza la costanza
del valore numerico c della velocit`a della luce, che compare nella forma delle
equazioni. Ma questa costanza `e in conflitto con il consueto concetto di
velocit`a e della sua legge di composizione. Ne viene di conseguenza che
dobbiamo rivedere questo concetto.
La misura della velocit`a in un dato sistema di riferimento inerziale S
richiede la misura di una distanza, per esempio tra un punto A e un punto B
e la misura di una differenza di tempi. Mentre la misura della distanza non
pone particolari problemi, ma solo lipotesi di disporre di regoli calibrati a
riposo nel sistema S, la misura della differenza tra il tempo t2 di arrivo in B
di una particella partita da A, della quale si vuol misurare la velocit`a, e il
tempo t1 di partenza da A, presenta qualche difficolt`a.
Il problema `e quello della sincronizzare di due orologi situati in punti
diversi, in A e in B. Il metodo di inviare un segnale da A a B, in modo che
se un orologio in A segna il tempo t si possa allora regolare un orologio in
B al tempo di arrivo del segnale cio`e al tempo t + l/v, dove v `e la velocit`a
36

del segnale di sincronizzazione e l `e la distanza AB, richiede a sua volta la


misura di una velocit`a (quella del segnale di sincronizzazione).
Si potrebbe vedere che altri metodi di sincronizzazione portano a conclusioni analoghe, per cui siamo in un circolo vizioso.
Il punto `e che il concetto di simultaneit`a deve essere definito, altrimenti,
come si `e visto, non ha significato. La stessa conclusione si ha naturalmente
per il concetto di velocit`a.
Il punto di partenza per definire cosa si intende per simultaneit`a `e un
insieme di fatti sperimentali sulla propagazione luminosa, tra i quali in particolare indicheremo lesperimento di Fizeau, nel quale si misurava la velocit`a
della luce su di un percorso chiuso, come particolarmente utile al nostro ragionamento. Il risultato dellesperimento fu che la velocit`a della luce risultava
c, cio`e lo stesso valore della costante che compare nelle equazioni di Maxwell.
Se eleviamo questo fatto sperimentale a postulato, postulato della costanza della velocit`a della luce, allora potremo usare questo per definire cosa si
intende per simultaneit`a.
Possiamo ora usare la luce come segnale per sincronizzare tutta una collezione di orologi, disposti nel riferimento inerziale S in tutti i punti nei quali
si intende effettuare delle misure. Se t0 `e un istante iniziale segnato dallorologio posto in un punto O di riferimento, origine del nostro sistema, inviando
da O un segnale luminoso verso un punto arbitrario P , a distanza l da O,
distanza misurata a riposo in S, regoleremo lorologio in P al tempo t0 + l/c.
In ogni punto dove abbiamo disposto un orologio potremo sincronizzarlo
con questo procedimento. Per ci`o che riguarda la definizione di simultaneit`a
avremo che due eventi, cio`e due avvenimenti che si verificano in due determinati punti dello spazio e a due dati tempi, si diranno simultanei se gli orologi
situati nei due punti corripondenti segnano lo stesso tempo.
Compare qui per la prima volta la parola evento, che esprime un concetto
centrale in tutta la teoria della relativit`a. Il suo significato `e facile da spiegare:
si tratta di un fatto (un fatto fisico) che si manifesta in un determinato punto
dello spazio e ad un determinato istante. Come tale precede leventuale
descrizione che di esso ne possiamo dare. Se abbiamo scelto un sistema di
riferimento e un sistema di orologi sincronizzati allora potremo assegnare
allevento una quaterna di numeri (t, x, y, z).
Tutto ci`o suona molto naturale. Il punto `e che, perche si possa affermare
che questa `e una sincronizzazione consistente, occorre dimostrare che `e indipendente dalla scelta del tempo iniziale t0 e che `e anche indipendente dalla

37

scelta del punto O di riferimento. Il procedimento di sincronizzazione dovr`a


poi essere ripetuto in ogni sistema di riferimento inerziale.
Sono in particolare questi ultimi due punti che richiedono il ricorso allesperimento citato di Fizeau, e quindi `e qui che si rivela il carattere particolare
della luce come mezzo per trasmettere i segnali di sincronizzazione.

3.1.1

Dimostrazione della consistenza della definizione


di sincronizzazione

a)-Il primo punto da dimostrare `e lindipendenza della sincronizzazione dal


tempo iniziale t0 . Questo punto `e sicuramente soddisfatto poich`e se si hanno
due orologi sincronizzati nel punto O, se uno dei due viene spostato in un
altro punto P , sotto alcune ipotesi del tutto naturali, riacquister`a lo stesso
ritmo.
Va notato che non si sta affermando che il ritmo del secondo orologio resta
invariato durante il trasporto, anzi si lascia aperta la possibilit`a che possa
essere alterato in funzione della velocit`a, ma una volta posto nuovamente a
riposo in P , non vi `e nessun motivo di ritenere che non abbia nuovamente lo
stesso ritmo, se nel trasporto non `e stato danneggiato.
E chiaro allora che, se si varia il tempo iniziale dellorologio in O da t0 a
t0 + , avremo che anche lorologio in P misurer`a un tempo aumentato di .
Quindi il primo punto `e verificato.
Per ci`o che riguarda il secondo punto facciamo unosservazione preliminare.
b)-Se un segnale luminoso `e inviato dal punto O al punto P e viene
rimandato da P verso O, idealmente senza alcun ritardo, se il tempo iniziale
di sincronizzazione, segnato dallorologio in O `e t0 , allora, facendo appello
allesperienza di Fizeau gi`a citata, possiamo dire che il tempo impiegato per
tornare in O dal raggio luminoso `e
t0 + 2(l/c)

(3.1)

Se allora si calcola la differenza del tempo di arrivo in O e del tempo in


cui il segnale era arrivato in P , si ha
[t0 + 2(l/c)] [t0 + (l/c)] = l/c

38

(3.2)

cio`e il tempo necessario per il percorso OP `e uguale a quello per il percorso


inverso P O.
c)-A questo punto passiamo a dimostrare il secondo punto e cio`e che la
sincronizzazione `e indipendente dalla scelta del punto di riferimento O. Per
vedere questo consideriamo un secondo punto O0 , oltre ad O e P e dimostriamo che il tempo che impiega un raggio luminoso emesso da O0 per raggiungere
P `e dato da l0 /c, dove l0 `e la distanza tra O0 e P .
Se dimostriamo questo `e chiaro che potremo usare il nuovo punto O0 come
nuova origine, essendo poi P del tutto arbitrario.
Richiamando ancora una volta lesperienza di Fizeau, avremo che il tempo
di arrivo in O di un segnale luminoso emesso da O verso O0 , riemesso da O0
verso P e poi riemesso da P verso O sar`a dato da
tOO0 P O = t0 + (l0 + l0 + l)/c

(3.3)

dove l0 `e la distanza tra O e O0 e l0 `e la distanza tra O0 e P .


Se tOO0 P `e il tempo in cui questo segnale transita dal punto P , allora si
ha
tOO0 P O = tOO0 P + (l/c)

(3.4)

per quanto detto in (b). Poiche il tempo in cui il segnale transita per O0 `e
dato da tOO0 = t0 + (l0 /c), eliminando tOO0 P O dalle due equazioni (3.3), (3.4)
si ha
tOO0 P t0 =

l0 + l 0
c

(3.5)

e ricavando t0 in termini di tOO0

l0
l0 + l 0
tOO0 P tOO0
=
c
c
e quindi
tOO0 P tOO0 = tO0 P =
che `e quello che si voleva dimostrare.

39

l0
c

(3.6)

(3.7)

3.1.2

Relativit`
a della simultaneit`
a

Passiamo ora a considerare un secondo sistema inerziale S 0 . Anche in S 0


potremo costruire un sistema di orologi sincronizzati disposti in vari punti
dello spazio come nel caso di S. Il valore della velocit`a della luce sar`a ancora
c, come sappiamo dai vari esperimenti. Questo sistema di sincronizazione
sar`a consistente nel modo precedentemente discusso e per le stesse ragioni.
In particolare le distanze saranno misurate mediante regoli a riposo in S 0 .
Cos` come per S anche in S 0 due eventi saranno considerati simultanei se gli
orologi situati nelle corrispondenti posizioni segnano lo stesso tempo.
Ora, ci`o che avviene `e che due eventi simultanei in S non saranno pi
u
0
necessariamente simultanei in S .
Per convincersi di ci`o consideriamo due eventi che si manifestano in due
punti A e B, a distanza fissa in S; per esempio gli estremi di una sbarra
dai quali vengono emessi due raggi luminosi verso il suo centro. Questi due
eventi si diranno simultanei, relativamente a S, se i due raggi di luce emessi
da A e B si incontrano nel punto di mezzo.
Questo criterio di simultaneit`a vale anche per S 0 . Ora, supponiamo che
S 0 si muova rispetto a S con velocit`a v parallela alla congiungente dei due
punti, ovvero alla sbarra. In S 0 la velocit`a della luce `e ancora c. Quindi,
il punto in S 0 , che allistante iniziale coincideva col punto di mezzo e che si
muove solidalmente con S 0 con velocit`a v verso il punto B `e il punto di mezzo
per S 0 , ma, poich`e va incontro alla sorgente sar`a raggiunto dal raggio emesso
da B prima del raggio luminoso emesso da A. Si vede perci`o che due eventi
simultanei in S non lo sono pi
u in S 0 .
Si conclude che il concetto di simultaneit`a `e relativo (al sistema di riferimento).

3.1.3

Le trasformazioni di Lorentz

Riassumendo la discussione precedente, la relativit`a di Einstein (o relativit`a


ristretta) si basa sui seguenti due postulati:
1. Le leggi della fisica sono le stesse in tutti i sistemi inerziali
2. La velocit`
a della luce `
e la stessa in tutti i sistemi inerziali
Consideriamo adesso due riferimenti inerziali S e S 0 che si muovano di
moto rettilineo uniforme uno rispetto allaltro, come in figura 3.1. Vogliamo
40

costruire le trasformazioni (dette di Lorentz) che connettono i due riferimenti


e che soddisfano ai due postulati precedenti. In base al postulato di relativit`a (postulato 1) se P `e un punto di S che si muove di moto rettilineo
uniforme anche S 0 lo vedr`a muoversi di moto rettilineo uniforme. Dunque il
cambiamento di coordinate tra S e S 0 dovr`a essere lineare
x0
y0
z0
t0

=
=
=
=

a11 x + a12 y + a13 z + a14 t + c1


a21 x + a22 y + a23 z + a24 t + c2
a31 x + a32 y + a33 z + a34 t + c3
a41 x + a42 y + a43 z + a44 t + c4

(3.8)

Se i due riferimenti sono tali che le origini coincidono a t = t0 = 0 avremo


c1 = c2 = c3 = c4 = 0

(3.9)

Inoltre i piani y = 0 e y 0 = 0 cosi come i piani z = 0 e z 0 = 0 coincidono per


tutta la durata del moto e quindi dovremo avere
a21 = a23 = a24 = 0

(3.10)

a31 = a32 = a34 = 0

(3.11)

e
Infine, per le scelte fatte, i piani x = 0 e x0 = 0 coincidono a t = t0 = 0.
Pertanto
a12 = a13 = a42 = a43 = 0
(3.12)
In definitiva si ha
x0
y0
z0
t0

=
=
=
=

a11 x + a14 t
a22 y
a33 z
a41 x + a44 t

(3.13)

Ovviamente a22 (ed anche a33 ) possono dipendere solo dalla velocit`a. Dunque
se ricaviamo le coordinate di P in S dalle coordinate in S 0 dovremo avere
y = a(v)y 0

41

(3.14)

S'

S
y

y'

V
O'

x
x'

z'
Figura 3.1: I sistemi di riferimento S e S 0 .

dato che S si muove con velocit`a v rispetto a S 0 . Ma dalle (3.13) segue


y=

1 0
y
a(v)

(3.15)

e quindi
a(v)a(v) = 1

(3.16)

Se ora invertiamo gli assi x, x0 , z e z 0 vediamo che S 0 si muove con velocit`a


v rispetto a S ma dato che y e y 0 rimangono invariate avremo
y 0 = a(v)y
42

(3.17)

e quindi
a2 (v) = 1

(3.18)

. Dunque avremo a22 = 1 (e per lo stesso motivo a33 = 1). Si ottiene cosi
x0
y0
z0
t0

=
=
=
=

a11 x + a14 t
y
z
a41 x + a44 t

(3.19)

Per determinare i coefficienti rimanenti consideriamo unonda luminosa emessa a t = t0 = 0 dallorigine comune di S e S 0 . In virt`
u della costanza della
velocit`a della luce in ogni sistema inerziale, le equazioni dei fronti donda nei
due riferimenti saranno
x2 + y 2 + z 2 = c 2 t 2 ,

x0 + y 0 + z 0 = c2 t0

(3.20)

Sottraendo membro a membro queste due equazioni si ha


2

c2 t2 x2 = c2 t0 x0

(3.21)

Sostituendo la (3.19) si trovano le condizioni


a211 c2 a241 = 1
c2 a244 a214 = c2
a11 a14 c2 a41 a44 = 0

(3.22)

La prima si risolve immediatamente in forma parametrica ponendo


a11 = cosh ,

ca41 = sinh

(3.23)

Sostituendo nella terza delle (3.22) si ha


a14 cosh ca44 sinh = 0

(3.24)

a14 = ca44 tanh

(3.25)

da cui
Sostituendo questa relazione nella seconda delle (3.22) si ha infine
a44 = cosh ,

a14 = c sinh
43

(3.26)

Pertanto le trasformazioni di Lorentz risultano


x0 = x cosh + ct sinh
x
t0 = t cosh + sinh
c

(3.27)

Determiniamo adesso il parametro . Consideriamo i punti del piano x = 0.


Questi sono visti da S 0 allontanarsi con velocit`a v e soddisfano la relazione
x0 = vt0

(3.28)

Segue dunque, per x = 0,


t0 = t cosh ,

x0 = ct sinh

(3.29)

da cui
x0 = (c tanh )t
e quindi
tanh =
Segue
sinh = p

v/c
1

v 2 /c2

v
c

cosh = p

(3.30)
(3.31)
1
1 v 2 /c2

(3.32)

Dunque le (3.27) diventano


x vt

x0 = p

1 v 2 /c2

y0 = y
z0 = z

t vx/c2
t0 = p
1 v 2 /c2

(3.33)

Le trasformazioni di Lorentz assumono un significato geometrico pi`


u trasparente se introduciamo coordinate con le stesse dimensioni. Possiamo cio`e
trasformare la coordinata temporale in una coordinata con le dimensioni di
una lunghezza moltiplicandola per la velocit`a della luce. Introducendo allora
la notazione
x0 = ct, x1 = x, x2 = y, x3 = z
(3.34)
44

si ha
0

x0 = x0 cosh + x1 sinh
1
x0 = x0 sinh + x1 cosh

(3.35)

Risulta cosi evidente che questa trasformazione lascia invariata la forma quadratica (x0 )2 (x1 )2 , infatti per le propriet`a delle funzioni iperboliche si ha
subito
0
1
(x0 )2 (x0 )2 = (x0 )2 (x1 )2
(3.36)
` anche interessante notare che se si introduce formalmente una coordinata
E
x4 tale che
x4 = ix0
(3.37)
allora le trasformazioni di Lorentz assumono la forma
1

x0 = x1 cosh ix4 sinh


4
x0 = ix1 sinh + x4 cosh

(3.38)

= i

(3.39)

Ponendo
e osservando che
cosh = cos ,

sinh = i sin

(3.40)

si ha
1

x0 = x1 cos + x4 sin
4
x0 = x1 sin + x4 cos

(3.41)

Inoltre nelle nuove variabili la forma quadratica che `e lasciata invariante


risulta
(x1 )2 + (x2 )2 + (x3 )2 + (x4 )2
(3.42)
che `e una forma quadratica definita positiva. Questa `e lasciata invariata da
trasformazioni ortogonale che altro non sono che combinazioni di rotazioni
attorno ai vari assi coordinati, Nel particolare caso in esame si ha a che fare
con una rotazione di un angolo del piano x1 x4 . Una forma quadratica
reale `e sempre diagonalizzabile ed i segni dei suoi autovalori costituiscono la
segnatura della forma quadratica. Una forma quadratica positiva ha segnatura positiva e nel caso in esame sar`a (+, +, +, +). Daltra parte questo `e
45

formale perche in realt`a non si ha a che fare con coordinate reali, visto che
x4 `e immaginaria pura. Infatti nelle coordinate reali (x0 , x1 , x2 , x3 ) la forma
quadratica ha segnatura (, +, +, +). Poiche una forma quadratica definisce
anche una forma metrica, cio`e una forma per la distanza tra due punti in
uno spazio assegnato, le forme quadratiche definite positive corrispondono a
metriche a segnatura positiva, o metriche euclidee. Le metriche a segnatura
non definita positiva sono dette anche metriche pseudo-euclidee, dato che si
possono riportare a metriche euclidee ridefinendo come immaginarie pure le
coordinate corrispondenti alla parte negativa della segnatura. Dunque lequazione che definisce la propagazione del fronte donda di un raggio luminoso da
luogo ad una metrica pseudoeuclidea. Le trasformazioni che lasciano invariate le metriche pseudoeuclidee sono dette pseudo-ortogonali perche si riducono
ovviamente a trasformazioni ortogonali passando a coordinate immaginarie.
In sostanza si passa da trasformazioni ortogonali a pseudo-ortogonali considerando parte degli angoli delle rotazioni come immaginari puri. Luso della
coordinata tempo di tipo x4 , cio`e immaginaria pura, `e usato nei testi pi`
u
0
vecchi ma oggi `e quasi sempre sostituita dalla versione reale, cio`e x .
Concludiamo questo paragrafo con alcune osservazioni. Primo che le trasformazioni di Lorentz inverse si possono ottenere semplicemente osservando
che la situazione relativa di S e di S 0 si pu`o ottenere mandando v in v.
Infatti se S vede S 0 muoversi con velocit`a v, S 0 vede S muoversi con velocit`a v. Quindi le formule inverse si ottengono immediatamente con questo
scambio
x0 + vt0
x = p
1 v 2 /c2
y = y0
z = z0
t0 + vx0 /c2
t = p
1 v 2 /c2

(3.43)

Secondo che nel limite c si ha dalle (3.33)


x0
y0
z0
t0

=
=
=
=

x vt
y
z
t
46

(3.44)

si riottengono cio`e le trasformazioni di Galileo.


Osserviamo anche che un modo standard di scrivere le trasformazioni di
Lorentz `e quello che fa uso delle notazioni
v
= ,
c

=p

1
1 2

(3.45)

Si ottiene cio`e
x0
y0
z0
t0

=
=
=
=

(x vt)
y
z
(t x/c)

(3.46)

Dal procedimento seguito risulta chiaro che, se si ammette lesistenza di


un tipo di segnale con velocit`a costante in ogni riferimento, questo pu`o essere
usato al posto della luce, dando luogo ad una trasformazione della forma della
(3.33), ma con questa velocit`a al posto di c.
Tuttavia, poiche solo un trasformazione pu`o essere valida, cio`e o la (3.33)
o questultima, ne segue che questo segnale dovr`a propagarsi alla velocit`a c e
ci`o sar`a vero per ogni tipo di segnale con queste caratteristiche (per esempio
le onde gravitazionali).
Notare che in quanto precede abbiamo fatto uso del principio di costanza
della velocit`a della luce, che in effetti deve essere formulato indipendentemente dal principio di relativit`a, cosi come fece Einstein ed abbiamo fatto
noi allinizio di questo paragrafo. Potrebbe sembrare che il principio di relativit`a, che afferma linvarianza delle equazioni di Maxwell, implichi la costanza
della velocit`a della luce. Ma per poter parlare di invarianza delle equazioni
di Maxwell occorre prima aver definito i nostri sistemi di riferimento, con le
loro sincronizzazioni.
Osserviamo che per v c la trasformazione `e singolare, nel senso che il
fattore diventa infinito. Ci`o significa che un sistema di riferimento non si
potr`a muovere rispetto ad un altro sistema con velocit`a uguale o superiore a
quella della luce.
Ora, un sistema di riferimento si pu`o pensare costituito da corpi materiali,
per cui ne segue che una particella materiale non pu`o muoversi con velocit`a
uguale o maggiore di quella della luce, rispetto ad un qualsiasi sistema di
riferimento.
47

Capitolo 4
Le propriet`
a delle
trasformazioni di Lorentz
4.1

Forma generale delle trasformazioni di Lorentz

Abbiamo ottenuto con la (3.46) un caso particolare di trasformazione di


Lorentz, corrispondente alla figura (3.1). Si pu`o per`o ottenere un caso piu
generale e cio`e il caso in cui gli assi di S 0 sono paralleli a quelli di S, ma ~v `e
orientata in modo generico.
Basta per questo decomporre il vettore di posizione ~x0 del punto generico P nel sistema S 0 in una parte parallela ed in una perpendicolare a ~v .
Si comprende come la parte perpendicolare rimanga invariata, cos` come le
coordinate y e z restavano invariate nella (3.46), mentre la parte parallela si
trasformer`a in modo analogo alla x delle (3.46). In questo modo si ottiene la
trasformazione

(~
v

~
x
)
(~
v

~
x
)

~v +
~v ~v t ,
~x = ~x
2
v2
v

(4.1)
(~v ~x)

.
t = t
c2
Infatti i primi due termini della prima equazione dicono che la parte di ~x
perpendicolare a ~v `e inalterata, mentre la parte in parentesi mostra che la
48

parte parallela a ~v si trasforma come la x nella (3.46). Se poi gli assi di S 0


sono ruotati rispetto a S, allora occorre preventivamente ruotare gli assi di
S in modo da portarli ad essere paralleli a quelli di S 0 . Ma questo caso non
lo discuteremo.
Ovviamente la trasformazione pi`
u generale lascia invariata lespressione
(cosi come la (3.46))
x2 + y 2 + z 2 c2 t2 = (x1 )2 + (x2 )2 + (x3 )2 (x0 )2 (x, x)

(4.2)

Come si verifica subito vale la propriet`a


(y + z, y + z) = (y, y) + (z, z) + 2(y, z)

(4.3)

(y, z) = y 1 z 1 + y 2 z 2 + y 3 z 3 y 0 z 0 )

(4.4)

dove
Dunque dato che abbiamo visto che una trasformazione di Lorentz lascia
invariata lespressione (x, x), lascer`a invariate si (y + z, y + z) che (y, y) e
(z, z). Dalla formula (4.3) vediamo che anche lespressione (4.4) `e invariante.
Quest `e molto importanteperche si pu`o dimostrare che le trasformazioni di
Lorentz nella loro forma estesa, che comprende anche il caso delle inversioni
spaziali e dellinversione temporale, sono le pi
u generali trasformazioni che
lasciano invariata questa forma quadratica.

4.2

Contrazione delle lunghezze e dilatazione


dei tempi

Possiamo ora ricavare alcune conseguenze della legge di trasformazione di


Lorentz (3.46), che riguardano il confronto di misure effettuate nei due sistemi
di riferimento S ed S 0 .
Considereremo le due situazioni: a) un regolo a riposo in S 0 disposto parallelamente allasse delle x0 e b) un orologio, opportunamente sincronizzato
come gi`a spiegato, posto a riposo in S 0 su di punto dellasse delle x0 con
ascissa x01 .
a) Contrazione delle lunghezze - Come illustrato in figura (4.1), gli
estremi del regolo in S 0 abbiano le coordinate x01 e x02 rispettivamente. La
lunghezza del regolo misurata in S 0 `e perci`o data da
49

l0

S'
x'2

x'1
S

x'

Figura 4.1: Illustrazione dei due riferimenti coinvolti nella discussione sulla
contrazione delle lunghezze.

l0 = x02 x01 .

(4.5)

Questa la chiameremo la lunghezza a riposo o semplicemente la lunghezza


del regolo.
Ponendoci in S, `e naturale definire come lunghezza del regolo l = x2 x1 ,
dove le misure dei due estremi x1 , x2 sono effettuate allo stesso istante t1 =
t2 = t. Usando allora le (3.46) si ha
x01 = (x1 vt),

x02 = (x2 vt).

(4.6)

da cui, sottraendo membro a membro, si trova la lunghezza del regolo, l, in


S:
1
l = x2 x1 = (x02 x01 ),
(4.7)

cio`e
p
l = l0 1 v 2 /c2 ,
(4.8)
che `e indipendente da t. Questa `e la famosa espressione della contrazione
delle lunghezze.
E chiaro dalla derivazione che se il regolo fosse stato perpendicolare alla
velocit`a ~v , la sua lunghezza sarebbe rimasta invariata. Quindi, se si considera
un corpo esteso di volume V , misurato in S e di volume V 0 se misurato in
S 0 , avremo la seguente relazione
r
v2
V = V0 1 2,
(4.9)
c
50

dove la contrazione del corpo avviene nella direzione del moto.


b) Dilatazione dei tempi - Supponiamo adesso che due eventi si verifichino in S 0 nello stesso punto x0 e agli istanti t01 e t02 . Usando le trasformazioni
di Lorentz inverse (vedi equazioni (3.43)) si ottiene
(
t1 = (t01 + vx0 /c2 ),
(4.10)
t2 = (t02 + vx0 /c2 ),
e quindi
t2 t1 =

(t02

t01 )

t02 t01

=p

1 v 2 /c2

(4.11)

La (4.11) `e lespressione della dilatazione dei tempi. Il termine a fattore


`e adesso invertito rispetto al caso delle lunghezze (4.8).
Possiamo introdurre il concetto di tempo proprio considerando una
particella nel suo sistema di riposo S 0 . L intervallo di tempo infinitesimo
in questo sistema d `e connesso con lintervallo di tempo dt misurato da un
osservatore S rispetto al quale la particella si muove con velocit`a ~u, tramite
la (4.11)
p
d = 1 u2 /c2 dt
(4.12)
Si assume che questa relazione sia valida per un moto arbitrario, con ~u data
dalla velocit`a istantanea dellorologio. Quindi si assume che laccelerazione dellorologio relativa ad un sistema inerziale non abbia influenza sul suo
ritmo. Il tempo cosi definito si chiama tempo proprio.
Notare che, per il modo nel quale `e stato definito, il tempo proprio `e un
invariante. Infatti si tratta di una misura eseguita in un determinato sistema
di riferimento, quello di riposo della particella. Non ha perci`o senso parlare
di propriet`a di trasformazione! Sar`a la sua relazione con il tempo misurato
da un orologio fisso in un sistema inerziale a cambiare se si cambia sistema
inerziale.

4.2.1

Orologio a luce

Un orologio si basa sullidea di osservare un fenomeno periodico e contare


il numero delle volte che, in un certo tempo, il fenomeno si ripete. Questo
numero si pu`o prendere a misura del tempo in un sistema di unit`a di misura
in cui lunit`a `e il periodo del fenomeno. Per esempio, negli orologi a pendolo
si sfrutta lisocronismo delle piccole oscillazioni del pendolo che assicurano un
51

periodo costante (trascurando gli attriti), ecc. Un orologio concettualmente


semplice, sebbene di difficile realizzazione pratica, `e il cosi detto orologio a
luce. Nel tubo indicato in Figura 4.2, un raggio luminoso parte dal basso,
viene riflesso dallo specchio in alto e ritorna allorigine dove viene riflesso
ancora. In questo modo, misurando con un contatore le volte in cui il raggio
ritorna in basso, abbiamo a disposizione un orologio. Il periodo di questo
orologio, o il tempo t che la luce impiega a percorrere andata e ritorno `e,
per un osservatore S 0 solidale con lorologio, dato da
t0 =

2`0
c

(4.13)

dove `0 `e la lunghezza dellorologio misurata in S 0 . Se il riferimento S 0 (solidale con lorologio) si muove di velocit`a v (vedi Figura 4.2) rispetto ad un
riferimento fisso S, losservatore in S vedr`a il raggio luminoso fare il percorso
ABC, rappresentato nella Figura. Se t `e il tempo impiegato dalla luce a
fare questo percorso, come visto in S, avremo
vt
(4.14)
2
Se assumiamo, come ragionevole e come visto quando abbiamo studiato
le trasformazioni di Lorentz, che le coordinate perpendicolari al moto non
cambino, la lunghezza `0 dellorologio vista in S 0 coincider`a con la lunghezza
vista in S. Quindi
q
p
AB + BC = 2 (BN )2 + ((AN )2 = 2 `20 + v 2 t2 /4
(4.15)
AN = N C =

Ma, dato che la velocit`a della luce `e la stessa in S e in S 0 si ha anche


AB + BC = ct

(4.16)

Uguagliando le ultime due relazioni segue

da cui

c2 t2 = 4`20 + v 2 t2

(4.17)

2`0
t = p
c 1 v 2 /c2

(4.18)

Confrontando con la (4.13) si ottiene


t0

t = p

1 v 2 /c2

52

(4.19)

S'

v
A

C
N
S
Figura 4.2: Lorologio luce descritto nel testo.

Riotteniamo dunque la legge di dilatazione dei tempi ma vista in un contesto


pi`
u fisico rispetto a quello un p`o formale considerato in precedenza.
In maniera analoga possiamo descrivere la contrazione delle lunghezze.
Consideriamo ancora lorologio di luce in posizione orizzontale rispetto alla
velocit`a del riferimento S 0 (solidale con lorologio) ed il riferimento S. Al
tempo t = t1 , in S, quando il raggio luminoso raggiunge lestremit`a B
avremo la relazione
` + vt1 = ct1
(4.20)
con ` la lunghezza dellorologio vista in S. Dopo un tempo t2 il raggio
luminoso ritorna in A e abbiamo
` vt2 = ct2

(4.21)

Dunque il tempo impiegato dal raggio luminoso a percorrere lintero tragitto


`e dato da
t = t1 + t2 =

`
2`
`
1
+
=
cv c+v
c 1 v 2 /c2

53

(4.22)

t=0
v t 1
t = t 1
v t 2
t = t 2

Figura 4.3: In questo caso lorologio luce serve per illustrare la contrazione delle
lunghezze.

Ma poiche si ha
t =
segue
`=

4.2.2

1
2`0
p
c
1 v 2 /c2
p

1 v 2 /c2 `0

(4.23)
(4.24)

Inversione temporale

Vogliamo ora studiare le condizioni sotto le quali un evento A che nel riferimento S precede temporalmente levento B possa essere osservato, da un
osservatore S 0 in moto rispetto a S, come posteriore a B. Le coordinata di A
saranno (xA , tA ) e quelle di B, (xB , tB ). Per ipotesi tA < tB . Nel riferimento
S 0 dovremmo avere

0
0
tA tB = (tA xA ) (tB xB ) = (tA tB ) (xA xB ) > 0
c
c
c
(4.25)

54

Questa relazione richiede


(tB tA ) <

(xB xA )
c

(4.26)

Nel caso limite = 1 cio`e quando S 0 si muove a velocit`a c rispetto ad S si


ha
(xB xA )
(tB tA ) <
(4.27)
c
Questa relazione mostra che `e possibile vedere linversione temporale degli
eventi solo se la distanza temporale tra gli eventi `e pi`
u piccola del tempo
che impiega la luce a percorrere la distanza tra gli eventi stessi. Possiamo

ct

cono luce in avanti


cono luce

A=0

cono luce indietro


Figura 4.4: Il cone di luce relativo allevento A.
illustrare queste considerazioni nella figura 4.4 dove abbiamo posto levento
A nel punto xA = 0 ed al tempo tA = 0. Le bisettrici danno lequazione di
un raggio di luce (x2 c2 t2 = 0). Se B si trova nel cono luce in avanti si ha
ctB > xB :

cono luce in avanti

(4.28)

e non `e possibile trovare un riferimento in cui B preceda A. Se invece B `e


fuori del cono di luce, allora
ctB < xB
(4.29)
55

ed `e possibile trovare un riferimento in cui gli eventi si invertono. Se assumiamo la validit`a del principio di causalit`a, cio`e che la causa deve precedere
leffetto, segue che nessun agente fisico (o segnale) che trasporti informazioni
pu`o propagarsi a velocit`a superiori a quelle della luce, perche in questo caso
la connessione tra i due eventi soddisfa
tB tA <

(xB xA )
c

(4.30)

e quindi si potrebbe invertire lordine temporale di causa ed effetto.

4.3

La legge di composizione delle velocit`


a

Unaltra propriet`a importante delle trasformazioni di Lorentz `e la legge di


composizione delle velocit`a. Questa, nel caso particolare delle trasformazioni
(3.43), si pu`o ottenere differenziando le (3.43) stesse
0
dx = (dx vdt),

dy 0 = dy,
(4.31)
0

dz
=
dz,

0
dt = (dt vdx/c2 ),
dalle quali, ponendo ~u = d~x/dt e ~u0 = d~x0 /dt0 , si ha subito
u0x
u0y
u0z

ux v
vux
1 2
c
uy
=
vux
(1 2 )
c
uz
=
vux
(1 2 )
c
=

(4.32)

che si riducono a quelle Galileiane nel limite c .


Notare che questa legge di composizione delle velocit`a non contraddice il
fatto che la velocit`a della luce sia la velocit`a limite. Infatti si verifica che se
si pone, per esempio, ux = c e uy = uz = 0 si ha u0x = c.
56

In modo analogo possiamo anche ricavare lanaloga formula per la trasformazione (4.1):

(~v ~u)
~u + ~v ( 1) 2
v
0

~u =
,
(4.33)
(~v ~u)
1
c2
che si riduce, per ~u parallelo a ~v , a ~u0 = ~u ~v nel limite c .

4.4

Effetto Doppler relativistico e aberrazione della luce

Per ottenere le formule relativistiche delleffetto Doppler `e necessario studiare


prima la legge di trasformazione delle caratteristiche di unonda, cio`e determinare la versione relativistica delle formule (2.18) e (2.20). Consideriamo
ancora unonda monocromatica nel sistema inerziale S
(~x, t) = A cos [(t

~n ~x
)],
c

(4.34)

Esattamente lo stesso ragionamento usato in sezione (2.2) dimostra linvarianza della fase di questonda, dove per`o questa volta la trasformazione `e
una trasformazione di Lorentz, cio`e
~n0 ~x0
~n ~x
) = (t
),
(4.35)
c
c
dove le grandezze con lapice sono misurate nel sistema S 0 , che al solito si
muove rispetto a S di moto rettilineo uniforme con velocit`a ~v .
Se si considera la trasformazione di Lorentz (3.43) e si identificano i
coefficienti di x0 e t0 , si ha
0 (t0

0 = (1
per ci`o che riguarda i coefficienti di t0 e

57

nx v
),
c

(4.36)


v
0
(nx ) = n0x
c
c
c
0

ny = n0y
c
c

0 0
nz = nz
c
c

(4.37)

per ci`o che riguarda i coefficienti di x0 , y 0 e z 0 rispettivamente.


Tenuto conto che ~v `e parallela allasse delle x, la prima di queste equazioni
si pu`o riscrivere
~n ~v
).
(4.38)
c
Se poi si sceglie lasse delle y nel piano formato dallasse delle x e ~n e
ponendo
0 = (1

~n = cos ~i + sin ~j,

(4.39)

si ha che le altre equazioni si riducono a


v
(cos ) = 0 cos 0 ,
c
sin = 0 sin 0

(4.40)
(4.41)

Dividendo membro a membro queste due equazioni, si ha


tan 0 =

sin
(cos v/c)

(4.42)

Lequazione (4.38) si riduce alla corrispondente equazione non relativistica (2.18) nel limite c . Essa rende conto delleffetto Doppler relativistico. Infatti, se in S 0 c`e un osservatore e in S una sorgente, per esempio
di luce con frequenza = /2, la sorgente si allontana dallosservatore con
velocit`a costante v. Allora losservatore osserva una radiazione con frequenza
0 = 0 /2, data da
0 = (1

58

~n ~v
)
c

(4.43)

Per quanto riguarda laberrazione della luce abbiamo gi`a osservato che ci`o
che conta non `e la velocit`a di fase, cio`e la velocit`a w che compare nella (4.34),
ma la velocit`a di gruppo. Abbiamo anche visto che la velocit`a di gruppo si
trasforma come la velocit`a di una particella nel caso non relativistico. Si pu`o
dimostrare che ci`o vale anche nel caso relativistico, per cui dobbiamo usare
le equazioni (4.32) piuttosto che lequazione (4.42).
Dalle (4.32), prendendo ~u e quindi ~u 0 nel piano (x, y), e chiamando con
e 0 gli angoli che ~u e ~u 0 formano con lasse delle x, si ha
u 0 cos 0
u 0 sin 0

u cos v
1 vu cos /c2
u sin
=
(1 vu cos /c2 )
=

(4.44)

e, dividendo membro a membro


tan 0 =

sin
(cos v/u)

(4.45)

Questa formula rende conto dellaberrazione della luce se, come nel caso della
(2.39), si opera la sostituzione (2.40)
+ ; 0 0 + ,

(4.46)

dove adesso e 0 sono gli angoli come in figura (2.4). Si ottiene allora
tan 0 =

sin
.
(cos + v/u)

(4.47)

Si vede che questa formula differisce da quella non relativistica per il fattore
, cio`e per termini del secondo ordine in v/c.

59

Capitolo 5
Elementi di calcolo tensoriale
5.1

Spazi vettoriali

Consideriamo uno spazio vettoriale V ad n dimensioni e sia ea una base in


tale spazio (a = 1, 2 , n). Un generico vettore v sara allora esprimibile
come1
v = v a ea
(5.1)
Chiameremo i vettori di V vettori controvarianti. Dato V e possibile costruire uno spazio vettoriale associato, detto il duale di V e che sara indicato con
V . Lo spazio V e lo spazio della applicazioni lineari da V R dove R e
lo spazio dei reali. Se indichiamo con f lapplicazione, avremo
f (v) hf , vi R

(5.2)

dove la notazione introdotta anticipa il fatto che le applicazioni lineari di


V R sono elementi dello spazio vettoriale V . Poiche f e lineare avremo
f (v + w) = f (v) + f (w)

(5.3)

hf , v + wi = hf , vi + hf , wi

(5.4)

od anche
Vediamo ora come sia possibili assegnare a V la struttura di spazio vettoriale. Definiamo a questo scopo la somma di due applicazioni

hf + g, vi = hf , vi + hg, vi
(5.5)
(f + g)(v) = f (v) + g(v),
1

Qui e nel seguito adotteremo la convenzione di Einstein, cio`e quando si scriva una
coppia di indici uguali, uno in alto ed uno in basso, una somma su questo indice `e sottintesa.

60

ed il prodotto di unapplicazione per un numero reale

hf , vi = hf , vi
(f )(v) = f (v),

(5.6)

Dove in parentesi abbiamo anche usato laltra definizione di f (v). Questa


quantita viene anche chiamata la valutazione dellapplicazione f in quanto
calcola lapplicazione al punto v. Notiamo che le definizioni date hanno senso
poiche il risultato dellapplicazione f e un numero reale ed i reali possono
essere addizionati e moltiplicati tra loro. A questo proposito si puo notare
che se lo spazio vettoriale invece di essere definito su R fosse definito su un
generico campo numerico F , le applicazioni f dovrebbero essere considerate
come applicazioni da V F . Dalle definizioni date di somma di applicazioni
e di prodotto di unapplicazione per un numero e immediato verificare che
V soddisfa gli assiomi di spazio vettoriale.
Data una base in V si puo costruire una base in V nel seguente modo:
consideriamo le applicazioni a tali che
h a , eb i = ba

(5.7)

Notiamo anche che il piu generale mapping lineare potra essere rappresentato nella forma
f (v) = fa v a
(5.8)
dove v a sono le componenti di v nella base data. Pertanto lapplicazione f
potra essere sempre decomposta nella forma
f = fa a

(5.9)

hfa a , vi = fa h a , v b eb i = fa v b ba = fa v a

(5.10)

dato che
Questo mostra che in effetti le a formano una base per V e quindi anche
V e uno spazio vettoriale n-dimensionale.
Se consideriamo il caso V = Rn , potremo scrivere il generico elemento
come il vettore riga
(5.11)
v = (v 1 , v 2 , , v n )
Una base e data allora da
e1 = (1, 0, , 0), , en = (0, 0, , 1)
61

(5.12)

Possiamo allora rappresentare la generica applicazione come



f1
f2


1 2
n .
a
f (v) = v fa = (v , v , , v )
.
.
fn

(5.13)

Pertanto i vettori duali possono essere pensati come vettori colonna. Il generico elemento del duale potra allora essere scritto come f = fa a , con la
base duale data da


1
0
0
0


.
.
1
n

= , , =
(5.14)
.
.


.
.
0
1
I vettori dello spazio duale V saranno chiamati vettori covarianti.

5.2

Tensori

Usando una procedura analoga a quella seguita per la costruzione del duale
e possibile costruire altri spazi vettoriali che ci permetteranno di definire i
tensori di rango (r, s). A tal fine costruiamo il seguente spazio ottenuto come
prodotto cartesiano di r copie di V e di s copie di V :
sr = (V )r (V )s

(5.15)

Consideriamo poi le applicazioni multilineari da sr R (cioe lineari in


tutti gli argomenti). Lo spazio di queste applicazioni lineari sara indicato con
T (r, s) e sara detto lo spazio dei tensori di rango (r, s). Per esempio T (0, 1) =
V poiche questo e lo spazio delle applicazioni da V R. Analogamente
si ha T (1, 0) = V , poiche le applicazioni da V R danno il duale del
duale che come noto coincide con lo spazio vettoriale di partenza. Il generico
elemento di T (r, s) sara allora indicato con
T ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s ),
62

i V ,

Yi V

(5.16)

Lo spazio T (r, s) puo essere dotato della struttura di spazio vettoriale cosi
come abbiamo fatto per lo spazio duale. Definiremo cioe la somma di due
elementi T (r, s)
(T + T 0 )( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )
= T ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )
+ T 0 ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )

(5.17)

ed il prodotto di un elemento di T (r, s) per un numero reale


(T )( 1 , 2 , , r ; Y 1 , Y 2 , , Y s ) = T ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )
(5.18)
Introduciamo ora un insieme speciale di elementi di T (r, s)
b1
b2
bs
s
tba11ba22b
ar ea1 ea2 ear

(5.19)

definiti come quelle applicazioni che mappano


( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )

(5.20)

h 1 , ea1 i h r , ear ih b1 , Y 1 i h bs , Y s i

(5.21)

in
Cioe
1 2
r
s
tba11ba22b
ar ( , , , ; Y 1 , Y 2 , , Y s )

= h 1 , ea1 i h r , ear ih b1 , Y 1 i h bs , Y s i

(5.22)

Possiamo vedere facilmente che gli nr+s elementi di T (r, s) costituiscono una
base. Infatti la generica applicazione multilineare sara
ar 1 2
T ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s ) = Tba11ba22b
a1 a2 arr Y1b1 Y2b2 Ysbs
s
(5.23)
i
dove abbiamo introdotto le componenti degli e degli Y i :

i = ai a ,

Y i = Yia ea

(5.24)

Si vede allora che lapplicazione T puo essere decomposta come


ar b1 b2 bs
ta1 a2 ar
T = Tba11ba22b
s

63

(5.25)

Infatti
T ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )
ar b1 b2 bs
= Tba11ba22b
ta1 a2 ar ( 1 , 2 , , r ; Y 1 , Y 2 , , Y s )
s
ar 1 2
= Tba11ba22b
a1 a2 arr Y1b1 Y2b2 Ysbs
s

(5.26)

ar
Le quantita Tba11ba22b
sono le componenti del tensore T . E ovvio dalle
s
definizioni date che:
a a a

ar
ar
(T + T 0 )ab11ba22b
= Tba11ba22b
+ T 0 b11b22bsr
s
s

(5.27)

e
ar
ar
(T )ab11ba22b
= Tba11ba22b
s
s

(5.28)

Consideriamo ora lo spazio T costituito dallinsieme di tutti gli spazi


` allora possibile definire in questo spazio una operazione che prende
T (r, s). E
il nome di prodotto tensoriale. Questa e una operazione che mappa la coppia
T (r, s)T (r0 , s0 ) in T (r + r0 , s + s0 ) e se T T (r, s) e T 0 T (r0 , s0 ), e definita
dalla relazione
0

(T T 0 )( 1 , , r+r , Y 1 , , Y s+s0 )
= T ( 1 , , r , Y 1 , , Y s )
0

T 0 (( r+1 , , r+r , Y s+1 , , Y s+s0 )

(5.29)

o, in componenti
a1 a

ar+1 a

ar
r+r
r+r
(T T 0 )b1 bs+s
= Tba11b
Tbs+1 bs+s
0
0
s
0

(5.30)

Questa definizione giustifica la scrittura usata nella formula (5.19) per indicare gli elementi della base di T (r, s) che possono dunque essere ottenuti come
prodotto tensoriale delle basi di V e di V . Pertanto le regole del calcolo
per i prodotti tensoriali sono molto semplici poiche e sufficiente decomporre
ogni tensore nella propria base e poi moltiplicare tensorialmente tra loro le
basi stesse. Per esempio
v w = v a ea wb eb = v a wb ea eb

(5.31)

da cui, come deve essere


(v w)ab = v a wb
64

(5.32)

Poiche un vettore ha una definizione intrinseca non dipende dalla scelta


della base. Naturalmente in una base diversa da quella fissata originariamente le componenti del vettore saranno diverse. La variazione delle componenti
puo essere facilmente calcolata a partire dalla trasformazione della base.
Supponiamo allora che la base sia trasformata nel modo seguente:
ea ea0 = aa0 ea

(5.33)

con aa0 una matrice nonsingolare. Per calcolare la trasformazione delle


componenti usiamo il fatto che v non dipende dalla base e quindi
0

v = v a ea = v a ea0 = v a aa0 ea
e pertanto

v a = aa0 v a

(5.34)
(5.35)

Congiuntamente alla base ea , la base duale a subira una trasformazione,


visto che la base duale e definita in riferimento alla base usata per V (vedi
equazione (5.7)). Avremo dunque
0
a0 a
a a =
a

(5.36)

a unaltra matrice nonsingolare. Ma usando la (5.7) nella nuova base


con
a
si ha
0
a0 b0 h a , eb i =
a0 a0
h a , eb0 i =
(5.37)
a b
a b
0

Segue dunque

a0 a0 = b00

a b
a

(5.38)

Dunque la matrice che trasforma la base e quella che trasforma la base duale
sono luna linversa dellaltra. Facendo attenzione alla posizione degli indici
scriveremo
0
0
aa (1 )aa
(5.39)
Possiamo allora invertire la relazione (5.34)
0

v a = aa v a

(5.40)

Questa formula puo anche essere ottenuta osservando che in generale le


componenti di un tensore possono essere ottenute valutando il tensore sulla
base duale, cioe
ar
= T ( a1 , a2 , , ar , eb1 , eb2 , , ebs )
Tba11ba22b
s

65

(5.41)

come segue subito dalla (5.25). Per esempio


v a = h a , vi

(5.42)

Usando questultima relazione si ha


0

v a = h a , vi = aa h a , vi = aa v a

(5.43)

Segue allora
0

ar
Tba110 ba220 b
0
s

= T ( a1 , a2 , , ar , eb1 0 , eb2 0 , , ebs 0 )


0

ar
= aa11 aa22 aarr bb11 0 bb22 0 bbss 0 Tba11ba22b
s

(5.44)

Dato un tensore in T (r, s) con r > 1, s > 1 e possibile definire un tensore


appartenente a T (r 1, s 1) tramite la cosi detta operazione di contrazione
C11 . Dunque per definizione C11 e una applicazione T (r, s) T (r 1, s 1)
cosi definita: dato un tensore T di T (r, s)
ar
T = Tba11ba22b
ea1 ea2 ear b1 b2 bs
s

(5.45)

C11 (T ) T (r 1, s 1) e dato da
b2
bs
2 ar
C11 (T ) = T aa
ab2 bs ea2 ear

(5.46)

Affinche la contrazione sia ben definita e necessario verificare che la definizione data sia indipendente dalla base. Infatti si ha
0

C11 (T )

ar
b2
= Taa0 ba220 b
bs
0 ea2 0 ear 0
s
0

ar
= aa ba0 Tbbaa22b
ea2 0 ear 0 b2 bs
s

= C11 (T )

(5.47)

Altre operazioni che si possono definire su un tensore sono le operazioni


di simmetrizzazione ed antisimmetrizzazione. Per esempio, dato un tensore
di tipo (2, 0), T ( 1 , 2 ), la sua parte simmetrica e data da

1
(ST )( 1 , 2 ) =
T ( 1 , 2 ) + T ( 2 , 1 )
2

(5.48)

e la sua parte antisimmetrica da


(AT )( 1 , 2 ) =

1
T ( 1 , 2 ) T ( 2 , 1 )
2
66

(5.49)

Si verifica immediatamente che ST ed AT sono tensori (cioe che le definizioni date non dipendono dalla base). Le componenti di questi tensori son
rispettivamente
(ST )ab =

5.3

1 ab
T + T ba ,
2

(AT )ab =

1 ab
T T ba
2

(5.50)

Spazi metrici

Un altro tensore che ci sara utile nel seguito e il tensore metrico. Questi e
un tensore simmetrico di rango (0,2), cioe una applicazione g di V xV R.
Le componenti di g si ottengono valutandolo su una base
g(ei , ej ) = gij

(5.51)

e quindi potremo scrivere


g = gij i j ,

gij = gji

(5.52)

Se det |gij | 6= 0 si dice che la metrica e non degenere. Lassegnazione di un


tensore metrico permette di definire un mapping da V V , che indicheremo
ancora con g, definito come
hg(v), wi = g(v, w)

(5.53)

Le componenti di g(v) possono essere calcolate immediatamente notanto che


si puo scrivere
g(v, w) = gij v i wj = g(v)j wj
(5.54)
dove nellultimo passaggio abbiamo usato la definizione di g(v). Per confronto
vediamo che
g(v)i = gij v j
(5.55)
Queste quantita sono anche dette le componenti covarianti del vettore v
(mentre le v i sono le componenti controvarianti) e saranno indicate con
lindice in basso:
vi gij v j
(5.56)
Osserviamo che il numero g(v, w) puo anche essere calcolato usando il mapping tra V e V e la contrazione. Infatti
g(v, w) = hg(v), wi = gij v i wj = vj wj = C11 (g(v) w)
67

(5.57)

Si ha anche immediatamente che


g(ei ) = gij j

(5.58)

Notiamo che se g e non degenere allora il mapping tra V e V definito dalla


metrica e invertibile, e si puo introdurre il mapping inverso. La sua azione
sulla base duale sara
g 1 ( i ) = g ij ej
(5.59)
dove g ij e la matrice inversa di gij
g ij gjk = ki

(5.60)

Tramite la matrice inversa possiamo definire le componenti controvarianti di


un vettore covariante come
g 1 ()i = g ij j

(5.61)

Chiaramente il mapping g, quando e non degenere, stabilisce un isomorfismo


tra V e V . Notiamo infine che g 1 puo essere considerato come un tensore
di rango (2,0), definendolo ( 1 , 2 V )
g 1 ( 1 , 2 ) = h 1 , g 1 ( 2 )i

(5.62)

Se introduciamo lelemento di linea come un vettore covariante


dx = dx

(5.63)

Possiamo introdurre la distanza infinitesima tra due punti usando linverso


del tensore metrico:
ds2 = g 1 (dx, dx) = g 1 (dx , dx ) = g dx dx
nel caso in cui
ds2 =

dx dx

(5.64)
(5.65)

(cioe g = ) si dice che si ha una metrica euclidea.


Un altro tensore importante e il cosi detto tensore di Ricci, che puo
essere definito a partire dallelemento di volume in uno spazio n-dimensionale
dV = 1 n dx1 dxn
68

(5.66)

Il tensore 1 n e definito essere zero quando una o piu coppie di indici


sono uguali, e completamente antisimmetrico (cambia di segno scambiando
tra loro due indici contigui) ed e uguale a +1 quando gli indici sono in una
permutazione pari rispetto alla permutazione fondamentale (1, 2, , n). Si
vede allora facilmente che data una matrice |A |, il tensore di Ricci soddisfa
la relazione
1 n A11 Ann = 1 n det |A|
(5.67)
Pertanto cambiando la base
0

1 n dx1 dxn det ||1 n dx01 dx0n

(5.68)

In generale dunque il simbolo 1 n non e un tensore ma quello che si chiama


una densita tensoriale. Se pero il cambiamento di base ha determinante
unita allora 1 n e un tensore vero e per di piu isotropo poiche le sue
componenti non cambiano. Un altro esempio di tensore isotropo e la delta di
Kronecker che puo essere pensato come quel tensore di rango (1,1) definito
dalla valutazione.

5.4

Lo spazio di Minkowski

Nel caso della relativita ristretta ricordiamo che abbiamo ottenuto le trasformazioni di Lorentz usando linvarianza dellonda sferica al variare del sistema
di riferimento. Poiche lequazione che descrive tale onda e
x2 + y 2 + z 2 c 2 t 2 = 0

(5.69)

e dato che sotto una trasformazione di Lorentz il vettore infinitesimo


(cdt, dx, dy, dz)

(5.70)

si trasforma come le coordinate di un evento (ct, x, y, z) vediamo che le


trasformazioni di Lorentz lasciano invariante la distanza infinitesima
dx2 + dy 2 + dz 2 c2 dt2

(5.71)

Interpreteremo questa distanza (che pero non e definita positiva) come una
distanza nello spazio-tempo a quattro dimensioni. Se facciamo uso di coordinate reali x (x0 = ct, x, y, z) possiamo allora introdurre una metrica nello
spazio-tempo come
ds2 = g dx dx = c2 dt2 dx2 dy 2 dz 2
69

(5.72)

Pertanto
g

+1 0
0
0
0 1 0
0

=
0
0 1 0
0
0
0 1

(5.73)

Chiaramente avremo (notiamo che la matrice |g | non cambia con il riferimento)


0
0
0
0
(5.74)
ds2 = g dx dx = g0 0 dx dx = g0 0 dx dx
da cui

g = g0 0

(5.75)

Se scriviamo . al fine di individuare le righe e le colonne della matrice


della trasformazione2 , e possibile scrivere la relazione precedente nella forma
matriciale
T g = g
(5.76)
Segue da det |g| = 1 che det || = 1.
Dunque lo spazio-tempo della relativit`a ristretto `e uno spazio pseudoeuclideo a quattro dimensioni, detto anche spazio di Minkowski. I vettori
x = (ct, x, y, z),

= 0, 1, 2, 3

(5.77)

sono detti quadrivettori. Studiamone alcune propriet`a fondamentali. Il


quadrato di un quadrivettore v `e definito dalla relazione
v 2 = g v v

(5.78)

` conveniente introdurre la notazione


E
v = g v (v 0 , v 1 , v 2 , v 3 )

(5.79)

Questa operazione viene chiamata di abbassamento degli indici. Si pu`o


introdurre loperazione inversa se definiamo linverso della metrica come
g g =

(5.80)

g = g

(5.81)

Chiaramente
2

Ricordiamo che x0 = x . x .

70

Quindi si ha
v = g v

(5.82)

Con queste notazioni il quadrato di un quadrivettore pu`o essere scritto anche


nella forma
v 2 = v v = g v v
(5.83)
Vediamo che in componenti
v 2 = v02 |~v |2

(5.84)

dove abbiamo introdotto il modulo del vettore spaziale ~v = (v 1 , v 2 , v 3 ).


Studiamo adesso le propriet`a geometrica di una trasformazione di Lorentz
nello spazio di Minkowski. Consideriamo solo trasformazioni della coordinata
x e del tempo, cio`e trasformazioni nel piano (x0 , x1 ). La trasformazione di
Lorentz ad un riferimento che si muove con velocit`a v lungo lasse delle x `e
data da
x0

x1

x0 x1
= p
1 2
x0 + x1
= p
1 2

(5.85)

Le equazioni degli assi coordinati (x00 , x01 ) nel nuovo riferimento sono rispettivamente
0
0
x0 : x1 = 0 x1 = x0
(5.86)
e

x1 :

x0 = 0 x0 = x1

(5.87)

Abbiamo rappresentato i nuovi assi in Fig. 5.1 introducendo un angolo


tale che
tan =
(5.88)
da questo tipo di rappresentazione appare particolarmente evidente che due
eventi simultanei in un riferimento non lo sono pi`
u in un altro in moto rispetto
al primo. Vediamo anche che quando la velocit`a tra i due sistemi tende
a quella della luce il piano si restringe sino a degenerare in una retta a
450 . Questa retta fa parte del cosi detto cono di luce (vedi dopo). Unaltra
propriet`a evidente `e che se si considera un punto fuori del cono di luce (come il
punto C in Figura 5.1) con una trasformazione di Lorentz `e possibile invertirlo
71

x0

x '0

x 1'

tA = t B

t A'
C

t 'B

x1
Figura 5.1: Il piano di Minkowski. In particolare si `e mostrato come due eventi
simultanei nel riferimento S non lo siano pi`
u nel riferimento S 0 .

temporalmente rispetto allorigine (nel caso specifico far diventare negativa


0
la sua coordinata temporale x0 ).
Chiaramente il quadrato di un quadrivettore `e invariante sotto trasformazioni di Lorentz, ma non `e una forma definita positiva. Possiamo dunque
distinguere tre casi:
1. v 2 > 0. Questi vettori vengo detti di tipo-tempo (o time-like). Si vede
subito che in questo caso anche il segno di v 0 `e un invariante di Lorentz.
Consideriamo infatti una rotazione spaziale che allinei la parte spaziale
di ~v lungo lasse x. Segue v = (v 0 , |~v |, 0, 0), con (v 0 )2 > |~v |2 . Pertanto
se v 0 `e positivo si trova nel cono luce in avanti, mentre se `e negativo nel
cono luce indietro (vedi figura 5.2). In ogni caso abbiamo visto nella
Sezione (4.2) una trasformazione di Lorentz non pu`o invertire lordine
temporale di due eventi che siano uno dentro il cono di luce dellaltro.
Mostriamo anche che in questo caso `e sempre possibile trovare un riferimento in cui il quadrivettore ha solo la componente 0 (o componente
temporale). Questo riferimento `e chiamato anche il riferimento di riposo del quadrivettore (o rest-frame). Infatti, se dopo la rotazione che
72

x0

tipo-tempo
tipo-luce
tipo-spazio
x1

Figura 5.2: Esempi di quadrivettori nello spazio di Minkowski.


allinea la parte spaziale lungo lasse x effettuiamo una trasformazione
di Lorentz come in eq. (3.35) segue
0

v 0 = v 0 cosh + |~v | sinh ,

v 0 = v 0 sinh + |~v | cosh

Scegliendo quindi
tanh =
si ha

v0 =

v2,

|~v |
v0
1

v0 = 0

(5.89)

(5.90)
(5.91)

Questa `e una trasformazione ammissibile ricordando che in generale


tanh = dove `e il rapporto della velocit`a con cui un S 0 si muove
rispetto a S con la velocit`a della luce. Quindi si deve avere | tanh | < 1,
condizione soddisfatta nel nostro caso. Per inciso, questo mostra anche
in modo semplice linvarianza del quadrato di un quadrivettore, dato
che dalla (5.91) segue v 0 2 = v 2 .
2. v 2 < 0. Questi vettori vengo detti di tipo-spazio (o space-like). In
questo caso il vettore sta fuori del cono di luce e quindi `e possibile
73

trovare una trasformazione di Lorentz che fa cambiare di segno a v 0


(vedi ancora la discussione in Sezione (4.2)). Dunque per un vettore
di tipo spazio la il segno della quarta componente non `e invariante di
Lorentz. In questo caso si pu`o trovare un riferimento in cui la parte
temporale `e nulla. Procedendo come prima con una rotazione spaziale
che riduca v alla forma v 0 = (v 0 , |~v |, 0, 0) e facendo la trasformazione
di Lorentz lungo lasse x caratterizzata da
tanh =
si trova

v 0 = 0,

v0
|~v |

(5.92)

v 2

(5.93)

v0 =

3. v 2 = 0. Questi vettori vengo detti di tipo-luce (o light-like). Anche


in questo caso il segno di v 0 `e invariante di Lorentz. Si vede facilmente
che si pu`o sempre trovare un riferimento in cui
v = (|~v |, |~v |, 0, 0)

(5.94)

Infatti `e sufficiente effettuare una rotazione spaziale per allineare la


parte spaziale di v lungo lasse x ed usare v 2 = 0 da cui
v 0 = |~v |

74

(5.95)

Capitolo 6
Meccanica relativistica
6.1

Quadriforza e dinamica relativistica.

Abbiamo visto che lelemento di linea nello spazio di Minkowszki


ds2 = g dx dx

(6.1)

`e invariante di Lorentz. Osserviamo che risulta invariante anche se si traslano


le coordinate spaziali od il tempo
~x ~x + ~a,

tt+b

(6.2)

Linsieme delle trasformazioni di Lorentz e delle traslazioni spazio-temporali


prende il il nome di trasformazioni di Poincare. Se scriviamo esplicitamente
il ds2 vediamo che
p
ds = c2 dt2 |d~x|2
(6.3)
Ricordando che il tempo proprio `e definito dalla relazione
p
p
d = 1 |~v |2 /c2 dt = dt2 |d~x|2 /c2
si ha

(6.4)

ds
(6.5)
c
che tra laltro mostra esplicitamente linvarianza del tempo proprio.
Come abbiamo detto, le trasformazioni di Lorentz lasciano invariate le
equazioni di Maxwell, per cui queste ultime soddisfano al principio di relativit`a. La contropartita `e che le equazioni della dinamica di Newton non
d =

75

soddisfano pi`
u il principio di relativit`a, se non nel limite di velocit`a piccole
rispetto alla velocit`a della luce. Occorre allora modificare le equazioni di
Newton in modo che lo soddisfino.
Supponiamo che una particella materiale si muova in un campo di forze
a velocit`a relativistica, per cui non sia possibile applicare ad essa la seconda legge della dinamica. Supponiamo per`o di saper calcolare la forza in un
riferimento in cui la particella sia momentaneamente ferma. Possiamo allora effettuare una trasformazione di Lorentz in modo da portarci in tale
riferimento e determinare cos` il moto della particella. Lidea `e cio`e quella di utilizzare le trasformazioni di Lorentz per porci in una situazione in
cui possiamo applicare la dinamica di Newton. Ora noi sappiamo come si
trasformano le velocit`a e da ci`o possiamo determinare la legge di trasformazione dellaccelerazione. Vediamo subito per`o che questa legge sar`a alquanto
complicata (basta dare uno sguardo alle (4.32) per rendersene conto).
Allo scopo di semplificare la trattazione, possiamo sfruttare il fatto che
il tempo proprio d `e un invariante e che si riduce a dt se la particella `e a
riposo.
Allora, invece di studiare il comportamento sotto trasformazioni di Lorentz dellaccelerazione possiamo studiare la grandezza
d2 x
,
d 2
che, data appunto linvarianza di d , si trasforma come x :

(6.6)

2
d2 x0
d x
=

,
(6.7)

d 2
d 2
essendo costante in . Lidea `e allora quella di definire un quadrivettore,
la quadriforza, tramite la relazione

f = m

d2 x
d 2

(6.8)

dove f sar`a chiamata la forza relativistica, che, per quanto detto sopra, si
trasforma secondo la legge
f 0 = f
(6.9)
La (6.8) ci fornir`a la generalizzazione relativistica della seconda legge di Newton e, ovviamente, dovremo riottenere le equazioni di Newton nel limite
v c. Ora la f si pu`o calcolare osservando che, se la particella `e momentaneamente ferma, lintervallo di tempo proprio d coincide con dt. Ne segue
76

che, poich`e x0 = ct, la sua derivata seconda rispetto a t `e nulla e quindi,


dalla (6.8) con = 0, si ha
f 0 = 0,

(6.10)

inoltre
fi = m

d2 xi
,
dt2

(6.11)

per cui f~ = F~ , cio`e f~ `e la forza di Newton nel riferimento in cui la particella


`e momentaneamente ferma. Se ora la particella ha velocit`a ~v invece che
zero, baster`a effettuare una trasformazione di Lorentz tale che, nel nuovo
riferimento, la particella abbia velocit`a ~v . Evidentemente questo riferimento
dovr`a avere velocit`a ~v rispetto a quello in cui la particella `e a riposo. Se
indichiamo con (~v ) questa trasformazione, avremo che la f sar`a data da
f = (~v )F ,

(6.12)

con F = (0, F~ ). Possiamo leggere la (~v ) dalle (4.1) (scrivendole per x0 =


ct), ponendo le componenti di f al posto di quelle di ~x0 e ct0 e quelle di F
al posto di quelle di ~x e ct. Inoltre andr`a posto ~v ~v . In questo modo si
ottiene
"
#
~) F0
~)
(~
v

F
(~
v

F
+ ~v
+
f~ = F~ ~v
v2
v2
c
"
#
(~v F~ )
f0 = F0 +
(6.13)
c
dove per`o F 0 = 0. In definitiva, tenendo conto che dalla prima di queste
equazioni segue
~v f~ = (~v F~ )
Quindi
(~v F~ )
f~ = F~ + ~v ( 1)
v2
(~v F~ )
(~v f~)
f0 =
=
c
c
77

(6.14)

Inserendo queste espressioni nella (6.8) si ha la generalizzazone della seconda legge della dinamica di Newton, espressa come un sistema di equazioni
differenziali in . Se si risolvono e si determinano le x in termini di , si pu`o
poi eliminare a favore di t e ottenere le consuete equazioni orarie per ~x.
In realt`a queste sono quattro equazioni, mentre le equazioni di Newton sono
solo tre. Ma si vede che queste equazioni non sono indipendenti. Infatti,
definendo la quadrivelocit`a
dx
= (c, ~v )
d

(6.15)

dx dx
ds2
= 2 = c2
d d
d

(6.16)

V =
si ha
V2 =
e quindi

Inoltre si ha

2
d 2
dV
d x
0=
V =V
=V
d
d
d 2

(6.17)

V f = cf 0 ~v f~ = 0

(6.18)

dove si `e fatto uso della (6.14). Quindi la componente delle equazioni del
moto (6.8) lungo la direzione di V (ottenuta moltiplicando le equazioni del
moto (6.8) per V ) `e soddisfatta identicamente per qualunque forma delle
x ( ) e le equazioni che determinano il moto del sistema sono solo tre.
Pertanto la proiezione delle equazioni del moto lungo la direzione della quadrivelocit`a `e nulla e quindi si hanno solo tre equazioni indipendenti.
Abbiamo visto che, nella forma (6.8), la seconda legge della dinamica si
trasforma da un riferimento inerziale ad un altro con la legge
f = m

d2 x
,
d 2

(6.19)

dove `e la trasformazione di Lorentz che trasforma le coordinate di un


riferimento in quelle di un altro.
La legge (6.8) garantisce quindi che la stessa forma della seconda legge
della dinamica valga anche nel nuovo riferimento. Lutilit`a del formalismo
vettoriale (quadri-vettoriale) risiede principalmente in questo fatto.
Si usa definire una forza f~N con
f~ = f~N ,
78

(6.20)

In termini di f~N si ha

f = ( (~v f~N ), f~N )


(6.21)
c
e, tenuto conto della (6.4), la parte spaziale dellequazione di moto si scrive
d~p
= f~N
dt

(6.22)

dove abbiamo definito

dx
(6.23)
d
Nel limite c , usando la (6.14) e la (6.20) si ritrova la usuale seconda
legge di Newton
d~p
= F~
(6.24)
dt
con F~ la forza misurata nel riferimento istantaneamente solidale con la particella.
p = m

6.2

Impulso ed energia

In termini del quadri-impulso definito nella (6.23) la seconda legge (vedi


equazione (6.8)) si scrive
dp
= f ,
(6.25)
d
Se calcoliamo il lavoro fatto dalla forza f~N nel tempo dt avremo
c
dp0
L = f~N ~v dt = f 0 dt = cf 0 d = c
d = cdp0

(6.26)

Dalla (6.23) vediamo che


p0 = mc

p~ = m~v ,

(6.27)

e quindi, integrando la (6.26)


L = c(p0 (t2 ) p0 (t1 )) = mc2 ((v2 ) (v1 ))

79

(6.28)

nella meccanica di Newton il lavoro fatto da una forza `e uguale alla variazione
di energia cinetica. Definiremo quindi lanalogo dellenergia cinetica come
lespressione
K = mc2 + K0
(6.29)
dove K0 `e una costante che sceglieremo in modo tale che K si annulli a
velocit`a zero, come nel caso classico. Quindi K0 = mc2 dato che (0) = 1
pertanto lenergia cinetica relativistica `e definita da

!
1
K = mc2 p
1
(6.30)
1 v 2 /c2
Notiamo che per piccole velocit`a si ha

p~ = m~v + O
cp

v2
c2

m
= mc + ~v 2 + O
2
2

v4
c2

(6.31)

1
K m~v 2
(6.32)
2
Vediamo dunque che la meccanica di Einstein riproduce perfettamente i risultati della Sezione (1.4) che, come avevamo visto, sono in perfetto accordo
con gli esperimenti di accelerazione fatti con il LINAC. Tra laltro lespressione di cp0 nel limite di basse velocit`a suggerisce di introdurre lenergia totale
come
mc2
E = cp0 = mc2 = p
(6.33)
1 v 2 /c2

da cui vediamo che lenergia cinetica non `e altra che lenergia totale alla quale
si sottrae lenergia di riposo della particella.
K = E mc2

(6.34)

Se si elimina la velocit`a dalle equazioni (6.27)


~v 2 =
si trova
E=c

p~ 2 c2
p~ 2 + m2 c2

p~ 2 + m2 c2 ,
80

(6.35)

(6.36)

che `e la forma relativistica dellenergia in funzione dellimpulso. Questa pu`o


anche essere ottenuta dalla (6.23) e dalla (6.16), cio`e
p2 = p p g = m2 c2 ,

(6.37)

che equivale alla (6.36) se si prende il ramo positivo della radice.


Il caso di un raggio di luce si pu`o inquadrare nello schema sviluppato, con
delle modifiche importanti. Infatti, per un raggio di luce, si ha che lelemento
di linea (6.1) `e zero
~v 2
ds2 = c2 (1 2 )dt2 = 0,
(6.38)
c
e quindi anche il tempo proprio (6.4) `e nullo. Lespressione dellimpulso
(6.23) avr`a allora senso solo se si fa tendere la massa a zero, cio`e, dalla (6.37)
(p0 )2 (~p)2 = 0.

(6.39)

` per`o con la meccanica quantistica che si da un significato preciso alla


E
nozione di particella con massa zero nel caso della luce.
Consideriamo adesso n particelle che subiscono un processo tale che sia
conservato limpulso totale P~ dato dalla somma degli impulsi delle particelle:
P~ = P~ (f ) P~ (i) =

n
X

(f )

p~k

k=1

n
X

(i)

p~k = 0,

(6.40)

k=1

(i)
p~k

(f )

dove k numera le particelle,


sono gli impulsi iniziali e p~k sono gli impulsi finali. Notare che il numero di particelle finali potr`a essere in generale
diverso da quello iniziale, se vi sono processi di annichilazione o creazione di
` importante osservare che a livello relativistico la conservazione
particelle. E
dellimpulso spaziale implica la conservazione delle energie.
Infatti, osserviamo che, se limpulso totale `e conservato in un riferimento,
lo deve essere in unaltro riferimento, poiche la conservazione dipende solo
dal fatto che il sistema `e isolato e non dal riferimento in cui ci`o si esprime.
Se ora indichiamo con un apice le stesse quantit`a determinate in un altro
riferimento inerziale, avremo
P 0 = P .

(6.41)

Ma per = 1, 2, 3, tenuto conto della (6.40), si ha


P 0 = 0 P 0 ,
81

(6.42)

e, per = 1, 2, 3 il primo membro `e zero, perche, come abbiamo osservato,


la conservazione dellimpulso si ha anche nel nuovo riferimento.
Quindi
0 = i0 P 0 ,

(6.43)

da cui P 0 = 0, perch`e quanto sopra vale per una trasformazione di Lorentz


arbitraria. Questo dimostra che la conservazione dellimpulso implica quella
dellenergia.
Quanto detto va sotto il nome di conservazione del quadrimpulso:
P (f ) =

n
X

(f )

pi

= P (i) =

i=1

n
X

(i)

pi

(6.44)

i=1

Questa legge di conservazione giustifica il nome di energia dato alla grandezza E in (6.36), poche `e una quantit`a conservata che si riduce allenergia
classica nel limite non relativistico, salvo laggiunta dellenergia di riposo.
Quanto alle propriet`a di trasformazione queste si ricavano immediatamente dalla (6.23). Nel caso della trasformazione di Lorentz (3.46) si ha
(tenuto conto dei fattori c)
0
p x = (px vE/c2 ),

p 0 = p ,
y
y
(6.45)
0

p
=
p
z,

0
E = (E vpx ),
mentre nel caso di un trasformazione con ~v generica, ma senza rotazione degli
assi, si ha come in (4.1)

p~

E0

(~v p~)
(~v p~) E
= p~ ~v 2 + ~v
2
v
v2
c
= [E (~v p~)]

82

(6.46)

6.3

Sistema del centro di massa ed equivalenza massa-energia

Consideriamo ancora un sistema di n particelle libere. Detti (P~ , E) e (P~ 0 , E 0 )


limpulso totale e lenergia totale del sistema in due sistemi di riferimento
inerziali S e S 0 , il quadrato del quadrimpulso totale (vedi equazione (6.37))
nel riferimento S `e dato da
P

n
n
n
X
X
X
E 2 c2 P~ 2

2 2
=
=
g pi pj =
mi c +
g pi pj =
2
c
i,j=1
i=1
i6=j=1

n
X
i=1

m2i c2

n
X

(p0i p0j |~pi ||~pj | cos ij )

(6.47)

i6=j=1

Dato che per una particella di massa mi si ha p2i = m2i c2 > 0 i singoli
quadrimpulsi sono di tipo tempo e quindi
p0i > |~pi |,

(6.48)

da cui
p0i p0j |~pi ||~pj | cos ij > 0

(6.49)

Pertanto il quadrimpulso totale P `e di tipo tempo (P 2 > 0).


Il fatto che sia di tipo tempo ci permette di determinare un sistema di
riferimento particolare tale che P~ sia zero (vedi Sezione (5.4)). Infatti, dalla
legge di trasformazione inversa della (6.46) per P~
"
#
~ 0)
~ 0) E 0
(~
v

P
(~
v

P
P~ = P~ 0 ~v
+ ~v
+ 2
v2
v2
c
h
i
E = E 0 + (~v P~ 0 )
(6.50)
si vede che ci`o `e possibile con una velocit`a relativa di S 0 rispetto a S data da
~v =

c2 P~
;
E

(6.51)

Questo si trova subito ponendo P~ 0 = 0 nelle (6.50) ed usando lespressione


di E 0 in termini di E.
83

Il fatto che linvariante (6.37) sia positivo ci permette anche di affermare


che questa velocit`a `e minore di c. Infatti da E 2 c2 P~ 2 > 0 segue che E >
c|P~ | e dalla (6.51) si ha che v/c < 1. Quindi questo sistema di riferimento
` il sistema del
esiste sempre per un sistema di particelle (con massa). E
centro di massa del sistema.
Indichiamo con S 0 il sistema del centro di massa e con S un sistema di
riferimento generico. Allora, indicando con ~u la velocit`a di S 0 , identificato
con S 0 , rispetto a S e applicando le formule (6.46) con ~v = ~u, si trova
0

~uE
P~ = 2 ,
c

E = E 0

(6.52)

dove P~ e E sono limpulso e lenergia nel sistema S e P~ 0 = 0 e E 0 limpulso


e lenergia nel sistema S 0 del centro di massa. Il fattore `e naturalmente in
termini della velocit`a ~u.
Abbiamo quindi mostrato che il sistema delle n particelle come insieme
si comporta come ununica particella di impulso P~ e di energia E, che si
trasformano come limpulso e lenergia di una singola particella.
Se si confrontano le (6.52) con le analoghe per una particella con massa
m, cio`e le (6.27), e si nota che
P2 =

2
E 02
E 2 c2 P~ 2
2E 0
2 2
=
1

u
/c
= 2
c2
c2
c

(6.53)

si vede che `e naturale definire la massa totale del sistema di particelle M


come
E0
M= 2
(6.54)
c
Notare che M `e maggiore della somma delle masse delle singole particelle,
infatti per E 0 abbiamo
0

E =

n
X
i=1

n
n
q
X
X
2
2 2
02
E =
c mi c + p~i c
mi
i0

i=1

da cui

(6.55)

i=1
n

M=

E0 X
mi

c2
i=1

(6.56)

In questa equazione il segno di uguale si ha solo se tutte le particelle hanno


impulso zero, cio`e nel caso statico. Con la definizione (6.54) le (6.52) si
84

scrivono

(
P~
E

= M~u
= M c2

(6.57)

Possiamo allora definire lenergia cinetica nel sistema del centro di massa K 0
come
n
X
0
E =
mi c2 + K 0
(6.58)
i=1

Dalla (6.58) segue unimportante conclusione e cio`e che lenergia interna


del sistema contribuisce alla massa totale del sistema (salvo il caso particolare
statico).
Abbiamo visto ci`o nel caso di un sistema di particelle libere, in cui lenergia interna `e data solo dallenergia cinetica. Ma questa conclusione si pu`o
ottenere per ogni processo fisico, si pu`o cio`e dimostrare che: ad ogni quantit`a
di energia E corrisponde una massa
E
(6.59)
c2
Non daremo qui la dimostrazione di questo risultato, la dimostrazione
si pu`o trovare in [3], pagg. 78-82, e una discussione nei suoi aspetti sperimentali in [4], pagg. 220-236. In particolare valgono le considerazioni che
abbiamo fatto nella Sezione (1.4), cio`e che in relativit`a vale la conservazione dellenergia totale ma non quella della massa. Massa ed energia sono
intercambiabili.
m =

6.4

Difetto di massa

Una applicazione particolarmente significativa dellequivalenza massa-energia


`e data dal difetto di massa dei nuclei atomici. Infatti risulta che la massa di un nucleo atomico nel suo stato fondamentale `e sempre minore della
somma delle masse dei nucleoni che lo costituiscono, Quindi, per separare i
costituenti, `e necessario fornire energia, ovvero massa, al nucleo.
Il difetto di massa si definisce allora come la differenza tra la somma delle
masse dei costituenti del nucleo e la massa nucleare effettiva, cio`e
m = Zmp + (A Z)mn MZ,A

85

(6.60)

dove mp `e la massa del protone, mn quella del nautrone, MZ,A `e la massa


effettiva del nucleo, Z `e il numero atomico, ci`o il numero di protoni del
nucleo e A `e il numero di massa, cio`e il numero totale di protoni e neutroni.
A approssima il peso del nucleo in unit`a di massa atomiche (u.m.a.), con la
massa del C 12 fissata esattamente a 12 u.m.a..
Ci aspettiamo che questo difetto di massa sia tanto pi`
u grande quanto
pi`
u il nucleo `e stabile. Ad esso corrisponde unenergia secondo la relazione
(6.59) che pu`o essere interpretata come unenergia di legame (negativa). In
altre parole, per decomporre un nucleo nei suoi costituenti occorrer`a fornirgli
unenergia almeno uguale allenergia di legame
E = mc2

(6.61)

dove m `e il difetto di massa.


Lequazione (6.60) fornisce unenergia di legame, che, misurata in MeV
risulta
E(MeV) = 931, 494[Z 1, 0078250 + (A Z) 1, 008665 MZ,A ] (6.62)
In questa formula il numero a fattore `e il fattore di conversione da unit`a di
massa atomiche a MeV1 .
Com`e noto, sia i processi di fusione nucleare, nei quali nuclei leggeri
si fondono in un nucleo pi`
u pesante, che di fissione nucleare, nei quali un
nucleo si rompe in frammenti, sono basati sul difetto di massa. Questo `e
possibile perch`e si pu`o vedere sperimentalmente che nei due casi indicati i
processi vanno nel senso che il difetto di massa del nucleo o dei nuclei iniziali `e
minore di quello del nucleo o dei nuclei finali. Per rendere chiaro largomento
consideriamo per esempio la reazione nucleare
1
1H

+63 Li 32 He +42 He

(6.63)

dove il primo termine della reazione `e un protone, il secondo un isotopo del


Litio, che ha lisotopo pi`
u abbondante con numero atomico 7, e lElio-3 che `e
anchesso un isotopo della forma usuale Elio-4. Le masse di questi elementi
1

Si ricorda che lunit`a di massa atomica e 1/12 della massa di un atomo di carbonio

12.

86

Figura 6.1: Lenergia di legame media


espresse in unit`a di massa atomica (u.m.a.) sono2
massa

del

00

00

00

00

00

00

1
1H
6
3 Li
3
2 He
4
2 He

= 1, 0078250
= 6, 0151223
= 3, 0160293
= 4, 0026032

(6.64)

Se si calcolano i difetti di massa si ha


m11 H
m63 Li
m32 He
m42 He

=
=
=
=

0,
0, 0343474 u.m.a. ' 32 MeV,
0, 0082856 u.m.a. ' 7, 72 MeV,
0, 0303766 u.m.a. ' 28, 3 MeV

da cui si ha il difetto di massa complessivo


mH + mLi m3 He m4 He = 0, 0043148 u.m.a.
2

(6.65)

Queste sono masse atomiche, che comprendono le masse degli elettroni. Per`o nel
calcolo del difetto di massa ci`o non influisce, poich`e il loro contributo si elide tra primo e
secondo termine della reazione. I dati sono ripresi da http://www2.bnl.gov/ton/.

87

che `e negativo e quindi la reazione avviene con produzione di energia. Lo


stesso risultato si ottiene facendo il bilancio delle masse, poiche le masse dei
costituenti si elidono nella differenza tra il contributo del primo membro della
reazione e il secondo. Il risultato sar`a con il segno opposto:
mH + mLi m3 He m4 He = +0, 0043148 u.m.a. ' 4, 02 MeV

(6.66)

Nella figura (6.1) `e riportata lenergia di legame media per nucleone (cio`e
il difetto di massa diviso il numero dei nucleoni) in funzione del numero
atomico3 .

6.5

Applicazioni di meccanica e cinematica


relativistiche

1 - Moto sotto lazione di una forza costante


Riprendiamo in considerazioni le equazioni della meccanica relativistica
dp
= f ,
d

f = (~v f~N /c, f~N )

e
p~ = m~v ,

p0 = mc,

=p

1
1 v 2 /c2

(6.67)
(6.68)

Calcoliamo la derivata temporale dellimpulso. Si ha


d~p
d(~v )
d~v
d
d~v
d(p0 /mc)
= m
= m + m~v
= m + m~v
=
dt
dt
dt
dt
dt
dt
d~v
~v
d~v
~v
= m + f 0 = m + 2 ~v f~N
(6.69)
dt c
dt c
Pertanto

~v
d~v
= f~N 2 ~v f~N
(6.70)
dt
c
Supponiamo di avere una forza costante diretta, per esempio, lungo lasse
delle x. Quindi porremo
f~N = (F, 0, 0)
(6.71)
m

Limmagine `e ripresa da http://cnx.prenhall.com/petrucci/medialib/media portfolio/26.html.

88

Le equazioni del moto risultanti sono

vx2
d~vx
m
= F 1 2
dt
c
d~vy
vx vy
m
= F 2
dt
c
d~vz
vx vz
m
= F 2
dt
c
Se assumiamo allistante iniziale

(6.72)

vx (0) = vy (0) = vz (0) = 0

(6.73)

vediamo che
vy (t) = vz (t) = 0,

(6.74)

Dato che le equazioni del moto richiedono che anche le derivate prime siano

ct

2
mc
F

Figura 6.2: Il moto relativistico di una particella soggetta ad una forza costante.
nulle a t = 0. Dunque, il moto `e unidimensionale e lungo la direzione della
forza. Ponendo vx = v segue
m

dv
F
= 2
dt

89

(6.75)

da cui

dv
F
=
dt
(1 v 2 /c2 )3/2
m

(6.76)

Integrando tra 0 e t segue


Z v/c
dv
dx
=c
=
2
2
3/2
(1 x2 )3/2
0 (1 v /c )
0

v/c
x
v
p
= c
=
(1 x2 )1/2 0
1 v 2 /c2

F
t =
m

(6.77)

Risolvendo in v questa equazione si trova


v=

dx
c
Ft
1
p
=
=p
dt
m 1 + (F t/mc)2
1 + (mc/F t)2

(6.78)

Lultima espressione per v `e identica a quella che avevamo trovato in base a considerazioni euristiche nella Sezione (1.4) (vedi equazione (1.60)).
Effettuando una ulteriore integrazione si ha (si assume x(0) = 0)
Z
F t
tdt
p
x(t) =
(6.79)
m 0
1 + (F t/mc)2
Ponendo
t=

mc
y
F

(6.80)

segue
Z

iF t/mc
mc2 h p
2
p
=
2 1+y
=
2F
0
1 + y2
0

mc2 p
1 + (F t/mc)2 1
=
F

mc2
x(t) =
2F

F t/mc

dy 2

(6.81)

Questa relazione pu`o riscriversi nella forma

mc2
x+
F

2
c2 t2 =

m2 c4
F2

(6.82)

Il moto `e rappresentato nella figura 6.2 ed `e ovviamente detto moto iperbolico. Notiamo che per F t mc, cio`e quando limpulso della forza F t `e piccolo
90

rispetto al tipico impulso relativistico che `e di ordine mc allora si riottiene


la soluzione newtoniana. Infatti sviluppando

!
2
mc2
1 Ft
1F 2
x(t)
1+
1 =
t
(6.83)
F
2 mc
2m
che `e la soluzione classica, dato che F/m `e laccelerazione newtoniana. Invece
nel limite opposto (limite relativistico), F t mc segue
x(t) ct

(6.84)

Quindi la particella si muove con velocit`a pari a quella della luce, come `e
anche evidente dalla equazione (6.78).
2 - Cinematica del laboratorio e del centro di massa

Linvarianza di una teoria rispetto ad un insieme di trasformazioni permette in genere una grande semplificazione dei problemi. La trattazione
formale di questo aspetto `e descritta da una apposita parte della matematica
che si chiama teoria dei gruppi. Sebbene questa sia una teoria abbastanza
sofisticata, in molte applicazioni fisiche si riduce allo studio di quelle quantit`a che non cambiano sotto le trasformazioni considerate. Per esempio se
abbiamo una teoria invariante sotto rotazioni spaziali e sappiamo che una
certa osservabile dipende solo da un vettore, risulta che pu`o dipendere solo
dal modulo. Infatti linvarianza per rotazioni ci permette di dire che losservabile non dovr`a cambiare ruotando il sistema di riferimento e quindi pu`o
dipendere solo dal modulo del vettore. Pi`
u in generale se dipende da un certo
numero di vettori, potr`a essere funzione solo dei prodotti scalari indipendenti. Luso degli invarianti permette delle semplificazioni notevoli, per esempio
pu`o evitare di calcolare direttamente come le quantit`a si trasformano sotto
trasformazioni di Lorentz. Come esempio consideriamo un processo durto
tra due particelle. In generale da questo urto possono generarsi nuove particelle solo se si ha sufficiente energia nel sistema del centro di massa. Quindi
allenergia totale a disposizione va sottratta lenergia del centro di massa.
Nasce pertanto il problema di mettere in relazione lenergia totale nel riferimento del laboratorio con lenergia nel riferimento in cui il centro di massa
`e fermo (sistema del c.d.m.). Questa relazione la si pu`o ottenere effettuando
91

esplicitamente la trasformazione di Lorentz o pi`


u semplicemente usando gli
invarianti. per fare questo si considerano i quadri-impulsi della particella
incidente, p1 , e della particella bersaglio nel sistema del laboratorio, p2 , in
cui, tipicamente, il bersaglio `e fermo. Avremo
p1 = (E/c, q, 0, 0),

p2 = (mc, ~0)

(6.85)

Invece nel sistema del c.d.m. (assumendo le due particelle della stessa massa
m)
p1 = (Ecm /c, p~), p2 = (Ecm /2c, ~p)
(6.86)
Infatti dato che nel c.d.m. gli impulsi sono uguali ed opposti e le particelle
hanno la stessa massa, segue da
p21 = p22 = m2 c2

(6.87)

che le energie delle due particelle nel c.d.m. sono uguali. Inoltre abbiamo
chiamato con Ecm lenergia totale nel c.d.m.. Calcoliamo allora il quadrato
di (p1 + p2 ) . Dato che questo `e un invariante ha lo stesso valore nel c.d.m.
e nel laboratorio. Pertanto

2
E
2
(p1 + p2 ) =
+ mc q 2 nel laboratorio
(6.88)
c
e

2
Ecm
nel c.d.m.
c2
Uguagliando queste espressioni si ha
2

2
E
Ecm
2
+ mc q = 2
c
c

(p1 + p2 )2 =

da cui
Ecm = c

2m(E + mc2 )

(6.89)

(6.90)

(6.91)

Questa relazione permette di capire la differenza tra un acceleratore a bersaglio fisso ed un collisionatore (o collider). Nel primo caso una delle particelle `e
ferma e laltra viene accelerata. Nel secondo caso entrambe vengono portate
allo stesso impulso ma con direzioni opposte e poi fatte collidere. Quindi nel
primo caso la cinematica `e quella stessa del sistema del laboratorio, mentre
nel secondo caso di fatto siamo nel riferimento del cdm. Vediamo dunque
92

che mentre per un collisionatore per avere Ecm a disposizione `e sufficiente


accelerare i due fasci sino ad energie Ecm /2 nel caso di bersaglio fisso occorre
fornire ad un fascio una energia data da
E=

2
Ecm
mc2
2mc2

(6.92)

Pertanto lenergia da fornire va con il quadrato dellenergia sfruttabile.


3 - Cinematica del decadimento in due corpi
Consideriamo una particella di massa m1 che decade in due particelle di massa m3 e m4 rispettivamente, nel sistema in cui `e a riposo. La conservazione
dellimpulso richiede
p1 = (m1 c, ~0),

p2 = (E2 /c, p~),

p3 = (E3 /c, ~p)

(6.93)

Il calcolo di E2 e E3 `e immediata se si osserva che dalla conservazione del


quadri-impulso
p1 = p2 + p3
(6.94)
segue che

p3 = p1 p2 ,

p2 = p1 p3

(6.95)

Prendendo i quadrati di queste espressioni si ha


m23 c2 = (m21 + m22 )c2 2m1 E2

(6.96)

m22 c2 = (m21 + m23 )c2 2m1 E3

(6.97)

e
da cui

m21 + m22 m23 2


c,
2m1
Infine quadrando la (6.94) si ha
E2 =

E3 =

m21 + m23 m22 2


c
2m1

(6.98)

2E2 E3
+ 2|~p|2 (m22 + m23 + 2m2 m3 )c2 = (m2 + m3 )2 c2
c2
(6.99)
da cui si ha la condizione cinematica per il decadimento
m21 c2 = (m22 + m23 )c2 +

m1 m2 + m3
93

(6.100)

Capitolo 7
Elettrodinamica nel vuoto.
7.1

La corrente e la densit`
a elettromagnetiche

Come `e abbastanza ovvio, le equazioni di Maxwell soddisfano il principio


di relativit`a di Einstein, quindi anche la corrente elettrica e la densit`a di
carica dovranno avere propriet`a semplici di trasformazione rispetto alle trasformazioni di Lorentz. Consideriamo per esempio la carica contenuta in un
elemento infinitesimo di volume spaziale d3~x. Tale quantit`a di carica non dipende chiaramente dal riferimento di Lorentz nel quale siamo. Dunque dovr`a
essere un invariante
d3~x = 0 d3~x 0
(7.1)
Notiamo poi che anche lelemento di volume quadri-dimensionale d4 x `e invariante per trasformazioni di Lorentz, dato che dalla 5.76) segue
det|| = 1

(7.2)

dove `e la matrice della trasformazione di Lorentz. Vediamo dunque che


d4 x = d4 x 0

(7.3)

Questo mostra che la densit`a di carica si trasforma come dx0 cio`e come la
quarta componente di un quadrivettore. Consideriamo adesso la relazione
d3~xdx =
94

dx 4
dx
dx0

(7.4)

Poiche d3~x `e invariante il primo membro di questa relazione si trasforma


come un quadrivettore. E siccome d4 x `e invariante, segue che

dx
dx0

(7.5)

deve trasformarsi come un quadrivettore. Definiamo allora la quadricorrente


come
dx
~
j = 0 = (, ~v /c) (, J/c)
(7.6)
dx
Quindi la parte spaziale di j `e la usuale densit`a di corrente divisa per c.
Ricordiamo che vale la condizione di continuit`
a
~ ~
+J =0
t

(7.7)

Introduciamo la notazione

=
=
x

1
,
c t ~x

(7.8)

e consideriamo la quadri-divergenza di j Si ha
j =

1 ~ ~ 1 1 ~ ~
+j =
+ J =0
c t
c t
c

(7.9)

dove abbiamo usato appunto la condizione di continuit`a. Questa propriet`a si


riassume dicendo che il quadrivettore j rappresenta una corrente conservata
o che ha quadri-divergenza nulla.
Osserviamo che j 2 `e un invariante di Lorentz che vale
j 2 = 2 (1 v 2 /c2 ) =
Dunque lespressione
0 =

2
2

p
1
= 1 2

(7.10)

(7.11)

`e un invariante di Lorentz e rappresenta la densit`a di carica nel riferimento


in cui la particella `e ferma. Potremo dunque scrivere la corrente nella forma
dx
0 dx
0
=
= v
0
2
c d
c
1 dx

j = p

95

(7.12)

Per un sistema di N particelle materiali puntiformi la densit`a di corrente


~
J(~x, t) e di carica (~x, t) sono date da
~ x, t) =
J(~

en 3 (~x ~xn (t))

(~x, t) =

d~xn (t)
dt

en 3 (~x ~xn (t))

(7.13)
(7.14)

La carica totale si ottiene integrando la componente temporale di j


Z
Q = d3 xj 0 (x),
(7.15)
che `e costante nel tempo. Infatti si ha
Z
Z
0
d
J i (~x, t)
3 j (x)
Q= d x
= d3 x
,
dt
t
xi

(7.16)

dove `e sottintesa la somma su i. Lultimo integrale, tramite il teorema di


Stokes 1 , `e un integrale di superficie che si pu`o pensare estesa allinfinito,
dove la corrente `e nulla. Quindi `e zero. Dunque laffermazione che la quadridivergenza della corrente `e zero `e equivalente ad affermare la costanza nel
tempo dellintegrale spaziale della componente temporale e viceversa (come
si pu`o vedere subito).

7.2

La forma covariante delle equazioni di Maxwell.

Il risultato principale della sezione precedente `e laver mostrato che j `e un


quadrivettore. Questo `e un ingrediente essenziale per determinare la forma
covariante delle equazioni di Maxwell.
Scriviamo le equazioni di Maxwell, nelle unit`a Heaviside-Lorentz (vedi
Appendice A.1)
1

Il teorema di Stokes si pu`o applicare alla forma = J 1 dx2 dx3 + ciclic., il cui
differenziale `e d = J i /xi d3 x.

96

~ =
a) E
~ =0
b) B
~
~ = 1 B
c) E
c t
~
~ = 1 J~ + 1 E
d) B
c
c t

(7.17)

Notare che lequazione di continuit`a `e conseguenza di queste equazioni.


Infatti si pu`o ricavare prendendo la divergenza dellequazione (d), tenendo
conto del fatto che la divergenza di un rotore `e zero, e infine utilizzando
lequazione (a). Definiamo adesso un tensore di Lorentz del secondo ordine,
antisimmetrico
F = F
(7.18)
tale che1
F 0i = E i ,

F ij = ijk B k

(7.19)

~ eH
~ sono rispettivamente il campo elettrico ed il campo magnetico
dove E
nel vuoto. Queste equazioni possono anche essere scritte in forma matriciale

0
Ex Ey Ez
+Ex
0
Bz +By

F =k F k=
(7.20)
+Ey +Bz
0
Bx
+Ez By +Bx
0
` facile verificare che le equazioni di Maxwell (a) e (d) si possono scrivere in
E
forma compatta
F
= j ,
(7.21)
x
mentre le equazioni (b) e (c) si scrivono

F
= 0,
x

(7.22)

Notiamo che al primo membro si ha un tensore di Lorentz e quindi la posizione in


alto od in basso degli indici `e rilevante. le quantit`a a secondo membro sono invece vettori
spaziali e quindi la posizione degli indici `e irrilevante

97

dove `e il tensore di Ricci totalmente antisimmetrico e che vale 1 o -1


secondo che gli indici siano in un ordine che sia una permutazione pari o
dispari rispetto alla permutazione (0, 1, 2, 3). Il tensore
F

(7.23)

si chiama tensore duale di F . Come abbiamo detto F `e un tensore antisimmetrico di rango due. Ci`o si verifica dallequazione (7.21), dove il secondo
membro sappiamo che `e un quadrivettore e naturalmente x `e anche un quadrivettore. Ci`o garantisce il carattere tensoriale di F , come si pu`o verificare
anche esplicitamente.
Quindi le equazioni di Maxwell sono adesso scritte in forma covariante.

7.3

Le propriet`
a di trasformazione dei campi.

Un tensore di rango 2 si trasforma sotto trasformazione di Lorentz con la


legge
F0

= F

(7.24)

che pu`o essere riscritta in forma matriciale come


F 0 = F T

(7.25)

con la matrice F definita in (7.20). Da questa equazione si possono ricavare


~ e H.
~ Consideriamo il caso di una
le propriet`a di trasformazione dei campi E
trasformazione di Lorentz come in (3.33) per la quale la matrice `e data da2

0 0

0 0

=k . k=
(7.26)
0
0
1 0
0
0
0 1
Effettuando il prodotto matriciale si ottiene

0
Ex
(Ey Bz ) (Ez + By )

Ex
0
(Bz Ey ) (By + Ez )

F0 =
(Ey Bz ) (Bz Ey )

0
Bx
(Ez + By ) (By + Ez )
Bx
0
(7.27)
2

Ricordarsi che x0 = ct.

98

Dunque
Ex0 = Ex ,
Bx0 = Bx ,

Ey0 = (Ey Bz ),
By0 = (By + Ez ),

Ez0 = (Ez + By )
Bz0 = (Bz Ey )

(7.28)

~ e B
~ sono i campi misurati nel sistema S e E
~0 e B
~ 0 sono i campi
dove E
misurati nel sistema S 0 , che si muove rispetto a S con velocit`a ~v = v~i. Possiamo facilmente estendere queste trasformazioni alle componenti parallele e
perpendicolari dei campi rispetto alla velocit`a notando che
~ k = Ex~i, E
~ = Ey~j + Ez~k
E
~ k = Bx~i,
B

~ = By~j + Bz~k
B

(7.29)

e
~ = vEz~j + vEy~k
~v E
~ = vBz~j + vBy~k
~v B

(7.30)

Segue allora
~0 = E
~ k,
E
k
~0 = B
~ k,
B
k

~ 0 = (E
~ + ~v B/c)
~
E

~ 0 = (B
~ ~v E/c)
~
B

(7.31)

~ e B
~ con E
~0 e B
~ 0 e ~v
La trasformazione inversa si ottiene scambiando E
con ~v . Dunque le componenti parallele alla velocit`a non si trasformano,
mentre si trasformano quelle perpendicolari. Notiamo che il secondo termine
~ 0 al primo ordine in v/c, altro non `e che la forza di
nellespressione di E

~ 0 ha una semplice interpretazione.


Lorentz. Anche il secondo termine in B

Consideriamo una carica ferma nel riferimento S. nel riferimento S 0 verr`a


vista in moto con velocit`a ~v . Quindi S 0 vedr`a un campo magnetico la cui
espressione per un intervallo di percorso infinitesimo `e

Ma

~
~ 0 = i d` ~r
B
4cr3

(7.32)

id~` = dV (~v )

(7.33)

E posto q = dV , la carica nellelemento di volume dV , il campo visto in S 0


risulta
~ 0 = q ~v ~r = 1 ~v E
~
B
(7.34)
4c r3
c
~0 .
che, al primo ordine in v/c coincide con il secondo termine in B

99

7.4

Potenziali di gauge

Ricordiamo che il potenziale vettore ed il potenziale scalare sono definiti


tramite le relazioni
~
~ = 1 A ,
~
E
c t

~ =
~ A
~
B

(7.35)

Con le definizioni che abbiamo dato per il tensore elettromagnetico F ,


introducendo
~
A = (, A)
(7.36)
si vede subito per sostituzione che
F = A A

(7.37)

In questo modo le equazioni omogenee di Maxwell (7.22) sono automaticamente soddisfatte dato che

F
= ( A A ) = 0
x

(7.38)

per lantisimmetria dl tensore di Ricci. Le equazioni non omogenee (7.21)


diventano
A ( A ) = j
(7.39)
dove

1 2
~2

(7.40)
c2 t2
`e loperatore di DAlembert in quattro dimensioni spazio-temporali.
Ovviamente il quadri-potenziale A non `e univocamente definito, dato
che se effettuiamo la trasformazione (detta di gauge)
= =

A = A +

(7.41)

dove `e una arbitraria funzione di x si ha


0
= A0 A0 = F
F

(7.42)

Quindi i campi rimangono invariati sotto una trasformazione di gauge. In


termini delle componenti si ha
~A
~ ,
~
A

100

1
c t

(7.43)

Questa libert`a permette di fissare di imporre una condizione su A o come


si dice di fissare il gauge per semplificare le equazioni. Una scelta comune `e
quella del gauge di Lorentz
A = 0
(7.44)
in cui le equazioni di Maxwell per i potenziali, equazioni (7.39) diventano le
equazioni di DAlembert
A = j
(7.45)
che, in particolare mostra che i potenziali, e quindi anche i campi, soddisfano
lequazione delle onde.

101

Appendice A
Appendice sulle unit`
a di
misura.
A.1

Equazioni di Maxwell

Le unit`a di misura relative tra i campi elettrici e magnetici e le densit`a di


carica e di corrente sono a priori arbitrarie (nel senso che dipendono dalle
unit`a scelte). Quindi la forma pi`
u generale delle equazioni di Maxwell che
tenga conto di tale ambiguit`a

~ = 4k1
E

B = 0
~
B
(A.1)
~

E
=
k

B
~ = 4k2 J~ + k4 E
t
Alle equazioni di Maxwell occorre aggiungere lequazione di continuit`a, che
non contiene costanti arbitrarie, dato che fissata lunit`a di carica rimane
fissata anche quella di corrente, quindi
~ ~
+J =0
t

102

(A.2)

Una ulteriore costante arbitraria appare nellespressione della forza che i


campi elettrici e magnetici applicano ad una carica q

~
v
~ + B
~
F~ = q E
(A.3)

Nel termine del campo elettrico non appare una costante perche la si pu`o
assorbire nella definizione della carica. Queste cinque costanti sono correlate,
infatti si possono stabilire tre relazioni tra di loro. Prendendo la divergenza
della quarta equazione di Maxwell (A.1) si ha
~ ~
~ J~ + 4k4 k1
E = 4k2
(A.4)
t
t
dove si `e fatto uso della prima delle equazioni (A.1). La compatibilit`a con
lequazione di continuit`a richiede
~ J~ + k4
0 = 4k2

k4 =

k2
k1

(A.5)

Il calcolo della forza per unit`a di lunghezza che agisce tra due fili indefiniti
posti a distanza d e percorsi da correnti I1 e I2 si riconduce al calcolo della
forza di Lorentz del campo magnetico generato da una delle correnti. Questo
campo pu`o a sua volta essere determinato in termini della corrente dalla
quarta delle (A.1). Quindi si vede subito che la forza `e proporzionale a k2
I1 I2
dF
= 2k2
(A.6)
d`
d
In modo analogo la forza tra due cariche statiche (forza coulombiana) si
determina dalla prima equazione di Maxwell e dalla relazione tra forza e
campo elettrico. Si trova
q1 q2
F = k1 2
(A.7)
r
Vediamo dunque che le dimensioni del rapporto k1 /k2 sono
" 2 #

2
k1
`2 F Q2
`
=
=
=
v
(A.8)
k2
(F `1 ) ` Q2 t2
t
Quindi questo rapporto non dipende dalle unit`a di misura usata per la carica elettrica e pu`o essere misurato sperimentalmente facendo uso solo delle
definizioni di unit`a meccaniche. Il risultato `e che
k1
= c2
(A.9)
k2
103

dove c `e la velocit`a della luce. Prendendo poi il rotore della quarta equazione
di Maxwell con corrente nulla, si ha
2~
~ (
~ B)
~ =
~ E
~ = k3 B

c2 t
c2 t2

(A.10)

dove abbiamo usato la terza equazione di Maxwell. Daltra parte si ha


~ (
~ B)
~ i =
(

3
X

3
X

ijk j (klm l Bm ) =

j,k,l,m=1

(il jm im jl )j l Bm =

j,l,m=1

~ B) 2 Bi = 2 Bi
= i (

(A.11)

dove si `e usato la seconda delle (A.1). Pertanto


~
k3 2 B
~ =0
2 B
c2 t2

(A.12)

Questa `e lequazione delle onde e dato che le onde elettromagnetiche si


propagano con velocit`a pari a c segue
k3 = 1

(A.13)

Riassumendo si sono trovate le seguenti tre relazioni tra le cinque costanti


ki , i = 1, , 4 e
k1
= c2 ,
k2

k3 =

1
,

k4 =

c2

(A.14)

Quindi ne possiamo fissare arbitrariamente due.


Nel sistema SI si fa la scelta
k1 =
e quindi

1
= 107 c2 ,
40

k2 =

0
= 107 ,
4

k3 = 1,

k4 =

1
,
c2

=1
(A.15)

~ =
D

B = 0

~
B
~

E
=

H
~ = J~ + D
t
104

(A.16)

~ eB
~ legati ai campi elettrici e magnetici E
~ eB
~ da
dove abbiamo definito D
~ = 0 E,
~
D

~ = 0 H
~
B

(A.17)

Nel sistema di Heaviside-Lorentz, che `e quello usato nel testo, si ha


1
1
1
1
, k2 =
, k3 = , k4 = , = c
2
4
4c
c
c
e quindi le equazioni di Maxwell si scrivono in questo sistema

~ =
E

B = 0
~
~ = 1 B

c t

1
B
~ = J~ + 1 E
c
c t
k1 =

mentre la forza di Lorentz `e data da

1
~
~
~
F = q E + ~v B
c

(A.18)

(A.19)

(A.20)

Abbiamo riportato le equazioni di Maxwell in questo sistema perch`e `e quello


spesso usato quando si discute di relativit`a. Infatti in questo sistema risulta
pi`
u evidente il fattore c, ed `e anche pi`
u utile per porre queste equazioni in
una forma covariante.

A.2

Unit`
a di energia

Per unit`a di energia abbiamo usato leV, che `e stato definito come lenergia
acquistata da un elettrone nellattraversare la differenza di potenziale di 1
Volt.
Tenuto conto che la carica di un eletrone `e data da
e = 1, 602 1019 Coulomb,
si ha

105

(A.21)

1eV = 1, 602 1019 Coulomb Volt.

(A.22)

Dato che 1Coulomb Volt = 1Joule = 107 erg, si ha


1eV = 1, 602 1012 erg.
Le masse dei nucleoni sono date da
(
mp = 931, 494 1, 007276 = 938, 272 MeV,
mn = 931, 494 1, 008666 = 939, 565 MeV,

(A.23)

(A.24)

dove il fattore 931, 494 `e il fattore di conversione da u.m.a. a MeV.


Notare che adesso la massa del protone `e inferiore alla massa data nella
(6.64), che `e quella dellatomo di idrogeno 11 H.

106

Bibliografia
[1] J. Stark, Ann. d. Phys. 21, 40 (1906); J. Stark and K. Siegel, ibidem
21, 457 (1906); J. Stark, W. Hermann and S. Kinoshita, ibidem 21, 462
(1906).
[2] H.E. Ives and G.R. Stilwell, Journal of the Optical Society of America,
28, 215 (1938).
[3] C. Moller, The Theory of Relativity, Oxford at the Clarendon Press,
1952.
[4] W.G.V.Rosser, An Introduction to the Theory of Relativity, London
Butterworths, terza ed. 1071.

107