Sei sulla pagina 1di 373

Vladimir Aleksandrovic Ugarov

Teoria della relatività


ristretta

Edizioni Mir
1 edizione: 1982
Titolo originale: Spetsialnaja teorija otnosxtelnosti
© Copyright by Nauka, 1977, Mosca

Traduzione dal russo


© Copyright hy Edizioni Mir, Mosca
IN D IC E

Prefazione

I, Meccanica classica e princìpio di relatività


§ 1.1. Sistema di coordinate e sistema di riferimento in meccanica
classica (9). § 1.2. Scelta del sistema di riferimento (il). § 1.3. Tra­
sformazioni di Galileo (13). §1.4. Principio di relatività galileiana.
Seconda legge di Newton (17). § 1.5. Leggi di Newton e sistemi di
riferimento inerziali (22). § 1.6. Tempo assoluto e spazio assoluto
(26). § 1.7. Come la fisica si è andata avvicinando alla teoria della
relatività (27). § 1 .8. Generalizzazione del principio di relatività
galileiana (30). § 1.9. Velocità della luce nel vuoto (32).

IL Postulati di Einstein. Intervallo tra eventi.


Trasformazioni di Lorentz
§ 2.1. Postulati di Einstein (34). § 2.2. Sistema di riferimento rela­
tivistico (36). § 2.3. Conseguenze dirette dei postulati di Einstein
(alcuni esperimenti ideali) (40). § 2.4. Relatività della sincroniz­
zazione di orologi di due sistemi di riferimento inerziali. Derivazione
diretta delle trasformazioni di Lorentz (47). § 2.5. Trasformazioni
di Lorentz come conseguenza dei postulati di Einstein (51). § 2.6. Pro­
pagazione del fronte dell’ onda luminosa. Un intervallo fra gli
eventi (55). § 2.7. Trasformazioni di Lorentz come conseguenza
dell’ invarianza dell’intervallo fra gli eventi (58). § 2.8 Valori com­
plessi nella TRR. Designazioni simmetriche (60). § 2.9. Illustra­
zione geometrica delle trasformazioni di Lorentz (63).

III. Conseguenze delle trasformazioni di Lorentz.


Classificazione degli intervalli e principio di causalità. Metodo
del coefficiente k
§ 3.1. Misure di lunghezza ed intervalli di tempo. Relatività del
concetto di simultaneità (65). § 3.2. Relatività della lunghezza di
righelli in moto (scale). Forma visibile di corpi in moto a velocità
relativistiche (68). § 3.3. Relatività degli intervalli di tempo tra
eventi (76). § 3.4. Classificazione degli intervalli e principio di
causalità (83). § 3.5. Trasformazione delle componenti della velocità
di una particella nel passaggio da un sistema di riferimento inerziale
ad un altro (87). § 3.6. Trasformazione del valore assoluto e della
direzione della velocità di una particella (93). § 3.7. Metodo del
coefficiente k (metodo radar) (97).

IV. Spazio-tempo quadridimensionale 109

§ 4.1. Spazi euclidei tridimensionali e quadridimensionali (109).


§ 4.2. Spazio-tempo quadridimensionale o spazio pseudoeuclideo
quadridimensionale (HO). § 4.3. Vettori e tensori quadridimensionali
(112). § 4.4. Piano pseudoeuclideo (115).

V. Meccanica relativistica di una particella 126

§ 5.1. Quadrivelocità e quadriaccelerazione (127). § 5.2. Quadriforza


ed equazione del moto quadridimensionale (133). § 5.3. Equazione
relativistica tridimensionale del moto di una particella (seconda
legge di Newton in forma relativistica) (138). § 5.4. Espressione
lelativistica dell’energia di una particella (141). § 5.5. Quadrivettore
energia-impulso (145). § 5.6. Massa a riposo di un sistema. Energia
di legame (148). § 5.7. Alcuni problemi di meccanica relativistica
di una particella (152). § 5.8. Leggi di conservazione della meccanica
relativistica (165).

VI. Teoria di Maxwell in forma relativistica 170

§ 6.1. Sistema di equazioni di Maxwell tridimensionale. Quadripoten­


ziale e quadricorrente (171). § 6.2. Trasformazione del quadripoten­
ziale e della quadricorrente (174). § 6.3. Tensore del campo elettro-
magnetico (178). § 6.4. Trasformazione delle componenti dei campi
elettrico e magnetico (182). § 6.5. Invarianti del campo elettromagne­
tico (187). § 6.6. Forza di Lorentz (188). § 6.7. Covarianza del sistema
di equazioni di Maxwell (194). § 6.8. Equazioni di Minkowski per un
mezzo in movimento (trasformazione delle equazioni materiali) (197).
§ 6.9. Trasformazione dei momenti elettrico e magnetico (203).
§ 6.10. Alcuni problemi sulla trasformazione del campo elettromagne­
tico (205). § 6.11. Tensore energia-impulso-tensione del campo elet­
tromagnetico nel vuoto (210). § 6.12. Tensore energia-impulso-ten­
sione del campo elettromagnetico in un mezzo. Tensore di Minkowski
e tensore di Abraham (220). § 6.13. Tensore energia-impulso-tensione
di una carica a simmetria sferica (226). § 6.14. Potenziali del campo
in un mezzo non conduttore in moto (227). § 6.15. Potenziali del
campo in un mezzo conduttore in moto (233).

VII. Fenomeni ottici e teoria della relatività ristretta 242

§ 7.1. Proprietà delle onde luminose piane (242). § 7.2. Quadrivettore


d’ onda. Effetto Doppler. Aberrazione della luce (245). § 7.3. Onda
piana limitata nello spazio. Trasformazione dell’energia e dell’ am­
piezza di un’onda piana (249). § 7.4. Pressione di un’onda elettro-
magnetica (luce) su una superficie (254). § 7.5. Variazione di frequenza
della luce nella riflessione da una superficie in moto (specchio) (255).
§ 7.6. Quanti di luce (fotoni) come particelle relativistiche (259).
§ 7.7. Quanti di luce in un mezzo. Effetto Vavilov-Cerenkov. Effetto
Doppler anomalo (263).

6
V i li . Su alcuni «paradossi» della teoria della relatività ristretta 269

§ 8.1. Più veloce della luce (270). § 8.2. Paradosso del filo e della
leva (275). § 8.3. Tachioni (279). § 8.4. Paradosso dell’ orologio (285).
§ 8.5. « Equivalenza » fra massa ed energia. Massa a riposo nulla (293).

Supplementi 299

I. Chi ha sviluppato la teoria della relatività ristretta e come?


(V. L. Ginzburg) (299). II. Ricerche infruttuose di un mezzo in cui si
propagala luce (309). III. L ’esperimento di Michelson fu « decisivo »
per la creazione della TRR? (326). IV. Perché non si deve introdurre
la dipendenza della massa dalla velocità o la massa relativistica (331).
V. Sistemi di riferimento non inerziali. Teoria della relatività ristret­
ta ed il passaggio alla teoria della gravitazione (teoria della relatività
generale) (335).

Eventi fondamentali della storia della TRR 34l

Appendice I 343

§ 1. Notazioni simmetriche, regole di somma (343). § 2. Trasforma­


zione di coordinate nel caso di una rotazione del sistema di coordi­
nate cartesiane (344). § 3. Tensori (348). § 4. Invarianza della quadri-
divergenza e dell’ operatore di D ’Alembert (351). § 5. Convoluzione
(« ringiovanimento ») degli indici tensoriali (352). § 6. Alcuni dati
sui determinanti. Tensori duali (354). § 7. Tensori sforzi (359).
§ 8. Sistemi di coordinate rettilinei obliqui (361). § 9. Definizione
di funzioni iperboliche e alcune relazioni tra di esse (365).

Bibliografia dell’appendice I 366

Appendice IL Formule basilari delPelettrodinamica nel siste­


ma di Gauss 367

Bibliografia 371

Indice analitico 373

7
PREFAZIONE

Il presente libro è un’edizione rielaborata e aggiornata del libros


uscito nel 1969 con lo stesso titolo. Il libro è un manuale destinato
agli studenti ed agli insegnanti, compresi gli insegnanti di fisica
delle scuole medie. Il piano generale del libro non è cambiato, ma
quest’ edizione in un’ esposizione piu dettagliata esamina i fonda­
menti teorici, un’ attenzione particolare è data alla trattazione qua­
dridimensionale, sono riportati diversi modi di esposizione della
teoria della relatività ristretta; sono stati introdotti i paragrafi
dedicati a questioni metodologiche e a quelle riguardanti lo sviluppo
della teoria della relatività ristretta; è stato ampliato il capitolo
su ll’elettrodinamica.
Nella preparazione di quest’ edizione si è tenuto conto di nu­
merose osservazioni dei lettori, cui l ’ autore esprime una viva gra­
titudine. Ringrazio con piacere B. M. Bolotovskij e S. N. Stoljarov
che hanno scritto i §§6.14 e 6.15 del libro. Voglio esprimere la mia
particolare gratitudine a V. L. Ginzburg. Questo libro cita molte
cose che ho appreso ad un seminario da lui tenuto. Un certo numero
di problemi sono stati discussi direttamente con lui; in particolare
merita di essere menzionato il problema del tensore energia-impulso-
tensione. Infine, V, L. Ginzburg ha scritto l ’ articolo «Chi ha svilup­
p atola teoria della relatività ristretta, e come?» pubblicato in questo
volume (Supplemento I). Secondo me, questo articolo dà molte ri­
sposte precise ai problemi riguardanti la storia dello sviluppo della
TRR. Sono onorato che questo articolo sia stato incluso in questo
libro.
L'autore
L MECCANICA CLASSICA E PRINCIPIO
Dì RELATIVITÀ

§ 1.1. Sistema di coordinate e


sistema eli riferimento in meccanica
classica
Tutti i fenomeni avvengono nello spazio e nel tempo; elemento d i
ciascun fenomeno è qualcosa che avviene in un dato momento di
tempo e in un dato punto dello spazio. Nella teoria della relatività
ristretta 1 si chiama evento qualcosa che ha luogo in un dato punto
e in un dato momento (cioè concentrato in un volume sufficientemen­
te piccolo di spazio e limitato da un breve intervallo di tempo).
Questa definizione mostra che le caratteristiche concrete dell’evento'
possono essere molto differenti. Per questo si usa dire « l ’ evento
consiste in... » Esempi di eventi possono essere remissione di un
segnale di luce da un certo punto dello spazio in un certo istante di
tempo, o la presenza di una particella in moto (punto materiale)'
in un dato punto dello spazio ed ad un determinato momento.
Quando un evento si realizza, si dice che « è avvenuto » (o sta
avvenendo o avverrà). Ogni fenomeno fisico rappresenta una suc­
cessione di eventi. La descrizione di un evento separato serve come
base per la descrizione di tutti i fenomeni e quindi cominceremo con
la descrizione di un evento separato.
Per caratterizzare un punto dello spazio, dove si è verificato
un evento, è necessario che ogni punto dello spazio sia etichettato
prima dell’ analisi di ogni fenomeno specifico. Ma lo spazio è uniforme
eu isotropo e ciò implica che tutti i punti dello spazio e tutte le di­
rezioni sono uguali. Bisogna sottolineare, comunque, che qui ci oc­
cupiamo dello spazio libero, o vuoto. Lo studio dei fenomeni fisici
nel vuoto è d’ importanza primaria per la teoria della relatività
ristretta. Anche se il vuoto è un sistema fisico complesso, per i nostri
scopi è sufficiente che nello spazio, che noi consideriamo come vuoto,,
non ci siano oggetti con massa a riposo finita e che i campi elettrici
e gravitazionali non siano troppo forti.
Ma anche quando tutti i punti dello spazio sono uguali, si può»
ancora evidenziare un determinato punto ponendovi un corpo mate­
riale, cioè un corpo con massa a riposo finita. I punti dello spazio
sono generalmente identificati mediante un sistema di coordinate.
Con Tausilio del corpo materiale distinguiamo un punto che è Tori-

1 Nel seguito il termine « teoria della relatività ristretta » sarà spesso abbre­
viato in TRR.

9
gine delle coordinate. Il più semplice sistema di coordinate è quello
cartesiano. Esso si costruisce tracciando tre rette mutuamente per­
pendicolari, cioè i tre assi coordinati X , Y , Z. In termini fisici, co­
munque, queste non sono soltanto linee rette. In linea teorica, gli
assi coordinati sono solidi rigidi non deformabili 1. A questo pro­
posito gli strumenti e gli altri oggetti di un dato sistema di riferi­
mento sono sempre fissati agli assi e quindi va tenuto presente che
un sistema di coordinate in fisica è sempre un oggetto materiale.
Nel sistema di coordinate cartesiano i punti sono facilmente
individuabili. Da ciascun punto IVI dello spazio si possono costruire
le perpendicolari agli assi X , Y , Z o, in altri termini, proiettare questo
punto sugli assi coordinati. Misurando in una scala opportuna la
•distanza della proiezione di un punto dall’ origine lungo gli assi
X , Y, Z si ottengono i numeri x, iy, _z, che sono chiamati coordinate
cartesiane del punto. La distanza può essere misurata mediante una
trasposizione passo per passo della scala unitaria, dall’ origine della
proiezione di un punto sull’ asse. Infatti, tale procedura, usata per
la misura delle lunghezze nella vita di ogni giorno, può essere usata
per determinare la lunghezza di un intervallo o di un oggetto a riposo
rispetto ad un dato sistema di coordinate. Come vedremo più avanti,
la teoria della relatività ristretta offre un metodo molto conveniente
per misurare le distanze senza dover trasporre passo per passo una
scala rigida (vedi capitolo II). Naturalmente i due metodi sono equi­
valenti.
Quindi, grazie all’ introduzione di coordinate cartesiane, ogni
punto dello spazio acquista tre numeri, che sono le tre coordinate
.x, y, z. Comunque, il principio obiettivo della fisica è lo studio del
moto. Pur se il moto di tipo meccanico è il più semplice, la sua de­
scrizione richiede misure di tempo e quindi il sistema di coordinate
deve essere fornito anche di un orologio. Questo orologio è necessario
per registrare Faccadere di un evento nei vari punti dello spazio.
Di quanti orologi si ha bisogno?
Nella meccanica classica non ci sono esitazioni riguardo la ri­
sposta a questa domanda e si assume tacitamente che è sufficiente un
orologio fermo in un dato sistema di riferimento. È utile eviden­
ziare le implicazioni di questa assunzione. Supponiamo che l ’ oro­
logio sia posto a ll’ origine del sistema di coordinate. Gli eventi pos­
sono aver luogo in ogni punto dello spazio compresi quelli sufficien­
temente lontani dall’ origine. Come si può, allora, registrare un even­
to se l ’ orologio è posto lontano dal punto dove l ’evento stesso è
accaduto? Ovviamente, nell’esatto momento in cui avviene un even­
to, bisogna inviare un certo segnale dal punto, in cui avviene l ’even­
to, all’ orologio posto nell’ origine. Se la velocità del segnale è finita,
esso raggiungerà l ’ orologio qualche tempo dopo l ’ inizio dell’evento,
e l ’ intervallo di tempo dipenderà dalla distanza tra il punto dove

1 La TRR nega Resistenza di solidi assoluti (vedi capitolo V ili), ma per gli
assi coordinati è sufficiente che non siano molto elastici.

10
è accaduto l ’evento e l ’ orologio. Comunque la meccanica classica
si fonda sulla propagazione dei segnali a velocità infinita. È ovvio,
in questo caso, che sia sufficiente un solo orologio fissato rigidamente
in un punto del sistema di coordinate.
È implicito che l ’ inizio di un evento sia registrato come segue:
al momento in cui l ’evento ha luogo in un determinato punto dello
spazio un segnale viene inviato da quel punto all’ orologio, ed il
tempo di arrivo è proprio il tempo d ’ inizio dell’evento (la velocità
del segnale è infinita!). Il concetto di segnale infinitamente veloce
si applica, naturalmente, non solo alla registrazione degli eventi.
Esso è intrinsecamente contenuto nella meccanica classica newtonia­
na: le interazioni tra i corpi sono trasmesse a velocità infinita
(vedi § 1.4).
La fisica moderna, tuttavia, afferma che tutti i segnali (intera­
zioni) sono trasmessi a velocità finita; in altre parole, esiste una ve­
locità finita per la trasmissione delle interazioni. Come si può con­
ciliare, dunque, questa affermazione con il fatto che la meccanica
newtoniana, basata sull’ assunzione di velocità infinita dei segnali,
si adatta eccellentemente a molti problemi (per esempio, predice in
modo esemplare il moto dei pianeti del sistema solare)? La risposta è
molto semplice. La velocità limite con cui viene trasmesso un segna­
le, o un’ interazione, è molto elevata, in accordo con questa idea
è la velocità di un’ onda elettromagnetica nel vuoto, che è uguale a
circa 3* IO8 m/s. Ne consegue che, appena le velocità degli oggetti sono
considerevolmente inferiori a quella della luce nel vuoto e le distan­
ze caratteristiche sono tali che il tempo di propagazione della luce
sia trascurabile, la meccanica newtoniana è valida ed è sufficiente
un orologio per registrare il tempo dell’evento. Nello stesso tempo
è chiaro che, nel caso di velocità elevate (v ^ c) e di sistemi estesi,
il tempo di un evento deve essere registrato in modo diverso e l ’ in­
tera meccanica deve basarsi su altre premesse. Infatti, è proprio
ciò che la teoria della relatività ristretta fa quando prende esplici­
tamente in considerazione la velocità finita della trasmissione dell’ in­
terazione.
Torniamo ora sul sentiero classico. Un sistema di riferimento
è formato da un oggetto di riferimento con un sistema di coordinate,
un sistema di unità di lunghezza ed un orologio fissato rigidamente
a ll’ oggetto di riferimento, in fisica si ricorre sempre ad un sistema
di riferimento, poiché ogni misura compiuta con uno strumento pro­
duce un risultato correlato al sistema di riferimento in cui lo stru­
mento è a riposo.
§ 1.2. Scelta del sistema
di riferimento
Per trattare problemi concreti scegliamo un sistema di riferimento
conveniente ed un conveniente sistema di coordinate. Come si può
sfruttare Y opportunità di questa scelta? Per l ’ orologio, in meccanica
classica ogni sistema di riferimento ha bisogno di un solo orologio
11
Ideale. Ma un oggetto di riferimento, l ’ origine e le direzioni degli
assi coordinati si possono scegliere a piacere. È ben noto come questo
fatto venga utilizzato in geometria. Per esempio, l'equazione dell’el­
lisse ha la forma semplice x,2/a2 4- y2lh2 — 1 soltanto se l ’ origine è
posta al centro delPellisse e gli assi coordinati coincidono con gli
assi principali. Senza dubbio, tutte le caratteristiche tipiche dell’ el­
lisse rimangono inalterate per qualsiasi scelta del sistema di coor­
dinate, .ma tutte le formule diventano incomparabilmente più
complesse. È importante sottolineare che in geometria analitica
le transizioni da un sistema di coordinate ad un altro modificano
soltanto la forma algebrica delle equazioni degii oggetti geometrici*
mentre gli oggetti stessi rimangono naturalmente inalterati.
N ell’ analisi dei fenomeni fisici, la costruzione di un sistema
di riferimento può essere fatta con una certa arbitrarietà. Comunque*
sono implicite le due principali proprietà dello spazio vuoto: omo­
geneità ed isotropia. Omogeneità è l ’ identità di tutti i punti dello
spazio. Questa proprietà è essenziale essendo quella che ci permette
di usare la fisica. Si è dimostrato che le leggi della fisica sono le
stesse in vari punti della Terra e ovunque dentro il sistema solare.
È proprio questo che permette di porre l ’ origine nel punto più con­
veniente. Quando si ruota un sistema di coordinate intorno all’ ori­
gine ci aspettiamo che non ci siano cambiamenti. Questo significa
che tutte le direzioni che si departono da un punto dato hanno lo
medesime proprietà. Questa è l ’esatta isotropia dello spazio. In
meccanica classica (o, più precisamente, in sistemi di riferimento do­
ve valgono le leggi di Newton, vedi § 1.5) si assume che lo spazio
libero sia omogeneo ed isotropo.
À differènza della geometria, in fisica c ’ è un’ altra scelta di si­
stemi di riferimento: quelli in moto relativo agli altri. Questo è
superfluo in geometria, ma in fisica sistemi di riferimento in moto
relativo sono inevitabili. Per esempio, esperimenti di fisica possono
essere condotti a bordo di una nave spaziale e sulla Terra. Questi
sono due sistemi di riferimento, ciascuno dei quali può avere stru­
menti immobili rispetto al riferimento. Non appena consideriamo
sistemi di riferimento che si muovono relativamente l ’uno all’ altro*
sorgono due questioni sostanzialmente diverse, ma fondamentali.
1. In che modo il moto del sistema di riferimento influenza £
fenomeni fisici osservati in esso, cioè le leggi della fisica cambiano
passando da un sistema di riferimento ad un altro?
2. Supponiamo di osservare un fenomeno fisico mediante uno
strumento in quiete in un dato sistema di riferimento e di ottenere*
dalle misure delle grandezze tipiche del fenomeno, determinati va­
lori. Lo stesso fenomeno può essere osservato in un altro sistema di
riferimento in moto rispetto al primo. Le misure condotte nel se­
condo sistema daranno determinati numeri che definiscono le stesse
grandezze fisiche. Come sono correlate queste grandezze?
È importante notare che in entrambi i sistemi si osserva lo stesso
fenomeno. Dobbiamo sapere come correlare queste grandezze. Dopo

12
tutto, un sistema di riferimento è una costruzione artificiale creata
allo scopo di compiere misure. I fenomeni stessi, come le leggi della
natura, non possono dipendere dalla scelta del sistema di riferimen­
to. Il fenomeno naturale è una realtà oggettiva al di fuori dei nostri
sensi e delle nostre misure.
Naturalmente i risultati delle misure possono essere diversi in
differenti sistemi di riferimento, ma in ogni caso dobbiamo saper
convertire 1 risultati delle osservazioni ottenuti in un sistema in
quelli ottenuti, o cbe si possono ottenere, in un altro. In breve,
abbiamo bisogno di un metodo per trasformare i risultati delle mi­
sure. Come si può trovare un tale metodo?
La risposta alla prima domanda ci conduce al principio di re­
latività e, attraverso la legge di Newton, ci permette di distinguere
una classe speciale di sistemi di riferimento rappresentata dai siste­
mi inerziali (§ 1.5). La risposta alla seconda domanda è data dalle
regole di trasformazione delle coordinate di un evento, cioè le tra­
sformazioni di Galileo in meccanica classica (§ 1.3) o le trasformazio­
ni di Lorentz in meccanica relativistica (§§ 2.4, 2.5, 2.7).

§ 1.3. Trasformazioni di Galileo


Il passaggio da un sistema di riferimento ad un altro in moto ri­
spetto al primo, fu realizzato molto prima dell5avvento della teoria
della relatività. In apparenza il primo che usò questa tecnica fu
Huygens, che trattò in questo modo il problema della collisione
delle sfere. Per brevità, si designerà con K il sistema di riferimento
e s’introdurrà l ’indice soprascritto per gli altri sistemi introdotti
(K°, K \ K \ . . .). Abbiamo già detto che un evento può essere con­
siderato come un « elemento » di un determinato fenomeno fisico.
E naturale cominciare con la misurazione delle grandezze caratteri­
stiche di un evento nel passaggio da un sistema di riferimento ad
un altro. Da adesso il « passaggio da un sistema di riferimento ad un
altro » deve essere sempre inteso nei senso di sistemi di riferimento
in moto relativo. Il cambiamento dell’ origine, così come la rotazione
degli assi coordinati, non sarà considerato come un « passaggio ».
In un sistema di riferimento arbitrario K un evento è descritto
dai quattro numeri x, y, z, t, da tre coordinate del punto, in cui ha
luogo l ’evento, e dal momento di tempo in cui è avvenuto. Vogliamo
sapere come saranno i quattro numeri x\ y\ z', tr in un altro sistema
di riferimento K r in moto rispetto a K .
Fin dall’ inizio abbiamo limitato il nostro problema e abbiamo
considerato solo quei sistemi di riferimento cbe si muovono di moto
rettilineo ed uniforme gli uni rispetto agli altri e non ruotano intor­
no all’ origine. In altri termini, nessuno dei sistemi di riferimento si
muove con un’ accelerazione rispetto ad un altro. Più avanti sarà
chiaro che si tratta del gruppo dei cosiddetti sistemi di riferimento
inerziali, ma il loro riconoscimento può avvenire soltanto mediante
le leggi di Newton; perciò rimandiamo la definizione e ì ’ identifica­

13
zione di questi riferimenti al § 1.5. Per il momento consideriamo due
sistemi di riferimento K e K r in moto uniforme e rettilineo (trasla­
zione) l ’uno rispetto all’ altro, in termini di geometria. Assumiamo
che il sistema di riferimento K ' si muova relativamente a A a velo­
cità F. Supponiamo che ad un dato istante t il raggio vettore del
punto M nel riferimento K ' sia uguale a r\ Allora, come si vede dalla
fig. 1.1, r = r — R, dove r è
il raggio vettore dello stesso
punto nel riferimento K , e R è
il raggio vettore dell’ origine del
sistema di coordinate K ' preso
dall’ origine di K. Questa rela­
zione è valida per ogni istante
di tempo e R varia secondo la
nota legge R — Vt + J?0, dove
R 0 è il raggio vettore che deter­
mina l ’ origine 0' al tempo t = 0.
Tenendo presente che all’ istante
t — 0 entrambe le origini coinci­
dono, R = Vi e si ottiene la
legge di trasformazione in forma
vettoriale
Fig. 1.1. I due sistemi di riferimento
K e K ’ con gli assi x, y, z e x , y' , z' r —r v t, (1.1)
diretti arbitrariamente. Il sistema K'
si muove relativamente a K con velo­
cità V. Il raggio vettore del punto M,dove le componenti del vettore V
uguale al vettore r nel sistema i£, sono definite nel sistema K . A
nel sistema È! è uguale a d r '. Secondo
la regola di somma vettoriale r = questo punto possiamo sfruttare
= r' -j- R, dove R è il raggio vettorel ’ isotropia dello spazio e ruotare
dell’ origine O’ . ognuno dei sistemi K e K ' intor­
no alle rispettive origini. E conve­
niente farlo nel modo seguente. Ruotando i sistemi di riferimento,
orientiamo gli assi x e x lungo la direzione della velocità relativa
dei sistemi K e K r. Poi ruotando i sistemi lungo gli assi comuni x , x\
orientiamo gli assi z/, y' e z, z' parallelamente gli uni agli altri, in
tal modo, non perdendo di generalità fisica, siamo giunti alle posi­
zioni reciproche dei sistemi di coordinate mostrati nella fig. 1.2.
In questo caso la velocità V ha le componenti (F, 0, 0). L ’ origine del
sistema K ' si muove lungo l ’ asse comune x, x a velocità F, mentre
all’ istante iniziale entrambe le origini coincidono. Si vede dalla
formula vettoriale (1.1) o direttamente dalla fig. 1.2 che la relazione
tra le coordinate del punto M (dove è accaduto l ’ evento) nei sistemi
K e K ' è determinata dalle equazioni
= 2 — F £ ,y = y, z' z.,
Ora, per stabilire definitivamente quali sono le coordinate dell’ e­
vento nel sistema K \ bisogna conoscere il tempo dell’ evento per
mezzo dell’ orologio nel sistema K r (ora abbiamo due orologi, uno nel

14
sistema K e un altro nel sistema K '). Poiché in entrambi i sistemi
usiamo segnali infinitamente veloci, la velocità relativa finita dei
sistemi è inessenziale per tali segnali: la velocità infinita rimane in­
finita in entrambi i sistemi. Di conseguenza il tempo dell’ evento re­
gistrato dagli orologi dei due sistemi sarà lo stesso, cioè t — tV

Fig. 1.2. I due sistemi di riferimento K e K! con gli assi p arali elissi muovono
relativamente Tuno all’altro a velocità V (V è la velocità di K' rispetto a K).
In fisica classica le coordinate di un « evento » si trasformano nel passaggio dai
riferimento K a K' secondo le formule delle « trasformazioni di Galileo » x —
— x — Vt, y = y, z' = z, t ' ~ t

Questa conclusione è confermata dal nostro « senso comune », visto


che, nella vita di ogni giorno, non rileviamo nessuna influenza del
moto sullo scandire del tempo degli orologi. Ma, tuttavia, bisogna
tenere in mente, che la velocità infinita dei segnali è soltanto un’ as­
sunzione, e, anche se il senso comune non è in grado di avvertire la
differenza nella vita quotidiana, dobbiamo essere preparati al fatto
che in caso di velocità finita dobbiamo porre t ^ tf.
Ma entro il campo di validità della meccanica classica, stabilita
fino ad ora, le formule di trasformazione delle « coordinate » di un
evento determinate nel sistema K (x, y, z, t) e quelle del sistema
K ' (x\ y\ z\ t') si possono scrivere
x* ~ x — Vt ,
y' = y,(1-2)
zr = Z,
V = t.

Naturalmente, queste equazioni valgono soltanto per le posizioni


reciproche dei sistemi di riferimento mostrate nella fig. 1.2. La

15
trasformazione delle « coordinate » di un evento da K a K ' (1.2)
è chiamata trasformazione galileiana. Si vuole richiamare l ’ attenzio­
ne dei lettori sul fatto che il tempo risulta la quarta coordinata di
un evento e quando si parla di coordinate di un evento, si intendono
quattro numeri (x, y, z, t). Questo si fa non solo per brevità di linguag­
gio. Nella teoria della relatività ristretta una simile terminologia
trova una completa giustificazione (vedi capitolo IV).
Abbiamo già sottolineato l ’ equivalenza di due sistemi in moto
rettilineo uniforme relativamente l ’ uno all’ altro. I sistemi K e K \
cui taremo riferimento (1 ora m poi, differiscono soltanto per ia ve­
locità V del sistema K ' rispetto a K , ovvero — V del sistema K rispet­
to a K f. Quindi, per ottenere le formule di trasformazioni inverse,
è sufficiente scambiare di posto le grandezze con indice e senza indice,
cambiando segno a F. Si ha

X = X' + Vt'y
y = y', (4.3)
z = z\
t t\
Naturalmente le stesse equazioni si possono ottenere direttamente
per via analitica.
Si noti una delle conseguenze delle trasformazioni di Galileo.
Supponiamo che due eventi accadano sull’ asse x del sistema K : uno
nel punto x ± all’ istante tly l ’ altro nel punto x 2 all’ istante t2 (t± G)*
È possibile scegliere un riferimento K f in cui entrambi gli eventi
accadano1nello stesso punto dello spazio? Troviamo le coordinate
x di questi eventi nel riferimento K ':x [ = x 1 — Vt1? x'2 — x 2 — Vt2;
calcoliamo la differenza x'2 — x[ = x 2 — xx — V (t2 — tt). Ponendo
x 2 — x 'i = 0, otteniamo l ’equazione che determinala velocità del
riferimento K ' rispetto a K: V = (x2 — x ±)/(t2 — G)* 41 significato
di questo risultato è molto semplice: durante il tempo t2 — ty il
sistema K ' riesce a portare il punto x[ nel punto in cui avviene il
secondo evento al tempo richiesto. Si vede che è sempre possibile
scegliere un sistema K ' che soddisfa alla condizione richiesta. Co­
munque, ciò è possibile solo perché in meccanica classica la velocità
V può assumere qualsiasi valore. Nella teoria della relatività, dove
la velocità di un sistema di riferimento, come di ogni altro corpo
materiale, è limitata, il sistema di riferimento cercato non esiste
sempre.
Prima di procedere nel principio di relatività galileiana accordia­
moci su un termine. Per semplicità di linguaggio si dirà « diversi
osservatori » ovvero « osservatori in diversi sistemi di riferimento ».
Nel passato questa terminologia ha provocato molta discussione,
perché molti hanno immaginato che questo implicasse un approccio
soggettivo alle misure fisiche. Ma la presenza di un « osservatore »
non è affatto indispensabile per le misure: esse si possono fare con
strumenti senza la partecipazione degli uomini. E proprio il caso,

16
per esempio, delle astronavi, anche quando ci sono uomini a bordo.
Un « osservatore nel sistema K ». infatti, va inteso come l ’ insieme
degli strumenti in quiete in questo sistema. Non bisogna stupirsi
del fatto che strumenti posti in diversi sistemi di riferimento diano
differenti risultati di misura riguardo allo stesso fenomeno, in
quanto il moto relativo è un fatto fondamentale fisico. L ’ oggettività
delle leggi della natura si manifesta nel fatto che, conoscendo i
risultati di un’ osservazione in un sistema di riferimento, si possono
trovare i risultati dell’ osservazione dello stesso fenomeno in altri
riferimenti. Si può sperare che dopo questi chiarimenti il termine
« osservatore » che appare in queste pagine non dia luogo ad obie­
zioni.
§ 1.4. Principio di relatività
galileiana. Seconda legge di
Newton
Il principio di relatività galileiana riguarda esclusivamente i feno­
meni meccanici; fu il primo passo verso V acquisizione del principio
di relatività che abbraccia tutta la fisica. Galileo ha messo in luce
che il moto rettilineo ed uniforme non influenza i fenomeni mecca­
nici. È necessario chiarire il significato di ciò. Come sappiamo già
è necessario un sistema di riferimento per la descrizione di ogni
fenomeno fisico, inclusi quelli meccanici. Consideriamo due sistemi
di riferimento in moto rettilineo ed uniforme relativamente l ’uno
all’ altro. Conduciamo un « esperimento meccanico » in uno di questi
riferimenti: ad esempio, studiamo il moto di un pendolo matematico
o la caduta libera di corpi. Il principio di relatività afferma che e-
sperimenti identici condotti nei due sistemi menzionati portano a
risultati identici. Quindi, è impossibile mettere in evidenza il moto
relativo dei riferimenti per mezzo di tali esperimenti. Ovviamente
il moto relativo si evidenzia facilmente in molti modi purché ven­
gano condotti esperimenti di altro tipo.
La prima formulazione del principio di relatività che si trova
nel libro di Galileo Dialogo sui due massimi sistemi del mondo, tole­
maico e copernicano (1632), è di natura puramente qualitativa. Fac­
ciamo un breve estratto da questo libro, che illustra l ’ essenza del
problema.
« Rinchiudetevi con alcuni amici nella cabina principale sot­
tocoperta di una grande nave, portate con voi delle mosche, delle
farfalle, altri piccoli animali volanti. Portate un grande recipiente
d’ acqua con dei pesci. Appendete una bottiglia che si svuota goccia
a goccia dentro un largo catino sotto di essa. Con la nave ancora1
ferma, osservate attentamente come gli animaletti volano con eguale :
velocità in tutti i lati della cabina. I pesci nuotano indifferentemente
in tutte le direzioni. Le gocce cadono dentro il recipiente sottostante. ;
Nello scagliare qualcosa ai vostri amici, non c ’ è bisogno di tirarlo
più forte in una direzione che in un’ altra, a parità di distanza. Saltan­
do a piedi uniti, si fanno passi eguali in ogni direzione. Dopo aver

17
osservato tutto ciò con attenzione (anche se non ci sono dubbi, con
la nave ferma, che tutto ciò accada come descritto), fate muovere
la nave ad una velocità qualsiasi in modo che il moto sia uniforme
e senza fluttuazioni. Scoprirete che non c ’è alcun cambiamento in
tutti gli effetti citati, né potrete dire, da nessuno di essi, se la nave
si stia muovendo o stia ancora ferma ».
Dalla formulazione qualitativa del principio di relatività di
Galileo — l ’ identità dei risultati di identici esperimenti meccanici
condotti da due osservatori in moto uniforme e rettilineo relativa­
mente l ’uno all’ altro — seguono corollari essenziali. Infatti se
sono note le leggi, che governano i fenomeni meccanici, e tutti
gli esperimenti identici di meccanica producono lo stesso risultato
nei diversi sistemi di riferimento, le leggi della meccanica devono
essere le stesse in tali riferimenti. In altre parole, le equazioni della
meccanica devono essere le stesse in tutti i sistemi di riferimento
in moto uniforme e rettilineo gli uni rispetto agli altri.
In questo modo, le equazioni principali della meccanica scritte
mediante le coordinate e con la lettura di un orologio nel proprio
sistema di riferimento devono avere la stessa forma. Nello stesso
tempo è chiaro che molte grandezze variano nella transizione da un
riferimento all’ altro. Infatti, consideriamo il moto di una particel­
la 1 nel sistema K ; in genere esso è definito come la dipendenza dal
tempo del raggio vettore r = r (t). In accordo con la (1.1), il moto
della stessa particella in K ' è definito dal raggio vettore variabile
r ’ (t) — r (t) — Vt. Differenziando entrambi i termini dell’ultima
equazione rispetto a t e tenendo conto che dr'/dt — v' e dr/dt = v si
ottiene ’
v' = v — V. (1.4)
Quindi la velocità della particella nei riferimenti K e K ' è differente.
Le grandezze che variano nella transizione da un sistema di coordi­
nate all’ altro sono chiamate relative. Allora le coordinate x e la ve­
locità di una particella sono grandezze relative. La sua accelerazio­
ne, comunque, è la stessa in entrambi i riferimenti K e K '; questo
diventa subito evidente, differenziando l ’ (1.4),

= (F = costante).

Il fatto che l ’ accelerazione di corpi sia la stessa per tutti gli osserva­
tori in moto rettilineo ed uniforme è immediatamente evidente. Ma
questo risultato rende possibile la comprensione dell’ espressione
« le equazioni hanno la stessa forma in tutti i sistemi di riferimento ».
L ’ equazione fondamentale della meccanica classica è quella che e-
sprime la seconda legge di Newton. Questa equazione pone in relazio­

1 Si intende un piccolo corpo (dotato di massa) ma così piccolo da poterne


trascurare la rotazione. In meccanica si parla di punto di massa, ma poiché
dovremo trattare spesso con punti nello spazio, è preferibile il termine « par­
ticella ».

18
ne la forza F che agisce su un corpo e l ’ accelerazione acquistata dal
corpo sotto l ’ azione di questa forza:

n § = F ‘> (1.5)
il fattore m è chiamato massa del corpo.
Se le leggi della meccanica sono veramente le stesse in tutti i
sistemi in moto uniforme e rettilineo, l ’ equazione (1.5) deve mante­
nere la sua forma in tutti i sistemi di riferimento di questo tipo.
Non è difficile vedere come questo avvenga realmente. Abbiamo
già mostrato che le accelerazioni sono le stesse in tutti i sistemi di
riferimento in esame. Ma cosa succede alle forze nel passaggio da
un riferimento ad un altro? Supponiamo di analizzare due corpi I
e IT; supponiamo che la forza della loro interazione dipenda dalla
distanza fra di essi, dalla velocità relativa e dal tempo. Ma nessuna
di queste grandezze cambia nelle trasformazioni di Galileo. In­
fatti, scriviamo le coordinate e le velocità dei corpi I e II nei rife­
rimenti A e K ' usando le trasformazioni di Galileo

T rasform a­
C o o rd in a te e velo cità
C oo rd in a te in K ' z io n i d e lle
dei corpi I e II in K velo cità

I x ii ÌJiì z iì v i x i = x 1 — V i , z[ = z 1 v
II Z 2’ ^2 X% = h i, y g y 25 ^2 = = Zg

Si vede subito che x 2 — xx = y2 — y1 = y'2 — y[,


Z2 — zi = z'2 — zv Dato che la distanza tra i corpi è uguale a

V ( x 2— aq)2 + (z/2— Uì)2jr (z2 ~ zi)2 nel riferimento A ,


V (K — x'1)2-ir (y2— + — zi)2 ne^ riferimento A ',
ò chiaro che essa rimane costante nella transizione da A a A '. Per
la velocità relativa
*>2 “ < = ^2 — th,
cioè essa rimane costante; in accordo con le trasformazioni di Galileo
il tempo è invariante: t — t'. Di conseguenza, le forze che dipendono
dalle variabili citate non variano affatto nel passaggio da A a A '.
Ma le forze considerate in meccanica dipendono sia dalla distanza
(forze gravitazionali, forze di interazione elettrica, forze elastiche)
sia dalla velocità relativa (forze di attrito). Quindi le forze che agi­
scono nella meccanica rimangono inalterate rispetto alle trasforma­
zioni di Galileo. Considerando che tutte le grandezze che figurano
nell’ (1.5), accelerazioni e forze, non variano rispetto alle trasforma­
zioni galileiane, l ’equazione fondamentale della meccanica classici/
(la seconda legge di Newton) che mette in relazione forze ed acce­
lerazioni, ha la stessa forma nei riferimenti A e A ' e differisce sol-’

19
tanto per la designazione delle variabili. (Si suppone, ovviamente,
che la massa sia una grandezza costante; Vinvarianza della massa
è uno dei postulati basilari della meccanica classica 1.) L ’equazione
che descrive la seconda legge di Newton nel riferimento K, nell’ ipo­
tesi di forze che dipendono dalla distanza e dal tempo, ha la forma
seguente:

e nel riferimento K '

t = f ( 0 2. f ) .
Un’ equazione che no^ cambia nel caso di una trasformazione
delle variabili che appaiono in essa (in altre parole, i termini della
quale risultano invarianti) è chiamata invariante rispetto ad una
data trasformazione. In questo modo, abbiamo mostrato che l ’ equa­
zione che esprime la seconda legge di Newton è invariante rispetto
alle trasformazioni di Galileo.
Ora possiamo formulare più precisamente le condizioni per cui
« esperimenti identici conducono a risultati identici ». L ’equazione
di Newton (1.5) è un’equazione ordinaria del secondo ordine. La
sua soluzione descrive il moto del sistema. Perche le soluzioni del-
l ’equazione (1.5) coincidano nei riferimenti K e K ' (proprio ciò
assicura l ’« identità del moto ») è necessario che coincidano le con­
dizioni iniziali. L ’ invarianza delle equazioni basilari della mecca­
nica assicura che i fenomeni della meccanica si svolgano in modo
uguale ih tutti i sistemi di riferimento in moto rettilineo ed uniforme
gli uni rispetto agli altri, soltanto quando le condizioni iniziali coin­
cidono in questi riferimenti.
Se le condizioni iniziali differiscono, per lo stesso fenomeno,
in diversi sistemi di riferimento, il fenomeno stesso sembrerà diffe­
rente. Ad esempio, mentre una goccia d ’ acqua cade verticalmente
per un osservatore che si trova su una piattaforma, la stessa goccia
si muoverà lungo una parabola per un osservatore su un treno (sup­
poniamo che la goccia di acqua cada con un’ accelerazione). Comun­
que, i dati iniziali in questi riferimenti erano differenti; dal punto
di vista di un osservatore sul treno la goccia d’ acqua alPistante
iniziale aveva una componente orizzontale della velocità; un osser­
vatore che si trovava sulla piattaforma considerava che alPistante
iniziale la goccia d’ acqua non aveva nessuna componente orizzon­
tale della velocità.

1 Si. noti che in meccanica newtoniana si considera anche il caso del moto
di corpi di massa variabile (una propulsione a jet, il moto di una goccia con
condensazione), ma in tutti questi casi un corpo o dona materia all’ ambiente o
l ’ acquista da esso. Quando si parla di variazione di massa nella TRR (vedi
Supplemento IV), si intende che la massa del corpo rimane costante nel rife­
rimento in quiete, cioè non c’è scambio tra il corpo e l ’ ambiente.

20
Abbiamo già detto in precedenza che in meccanica newtoniana
un’ interazione tra corpi si suppone a velocità infinita. Adesso siamo
in grado di spiegare questo in dettaglio. L ’« interazione » tra corpi
è caratterizzata da forze. In meccanica classica le forze sono consi­
derate dipendenti dalle distanze tra corpi; lo stesso si considera va­
lido per i corpi in moto relativo gli uni agli altri. Ma la distanza
tra due corpi in moto deve essere espressa come
x (tt)]2+ [y2 (t— 4(i)]2 + [z2 (t) — z4 (t)]2„
Assumendo che un’ interazione, cioè una forza, si trasmetta a
veloci Là finita, non si può presumere che nnell’
oli'
equazione che defi­
nisce questa forza, figuri ancora r12. Se ci interessa la forza agente
da parte del corpo II sul corpo I, la posizione del corpo II deve essere
registrata non al momento t ma in anticipo di un intervallo di tempo
necessario perché l ’ interazione « si trasmetta » dal corpo l i al cor­
po L Se si trascura questo ritardo, ciò significa di fatto che la velo­
cità di propagazione dell’ interazione viene considerata infinita. Pro­
prio in questo modo sono trattati I problemi in meccanica newtonia­
na.
Lo stesso accade quando s’introduce un’energia potenziale. Scri­
vendo, come al solito, una forza centrale per l ’interazione di due
particelle nella forma
F = - V U ( \ ri - 2 |),
si trascura esplicitamente il ritardo nella trasmissione dell’ intera­
zione.
La trasmissione istantanea delle interazioni (in passato conside­
rate come azione a lungo raggio) ci appare sorprendente ed oscura.
La trasmissione di qualsiasi segnale (cioè un impulso e l ’energia
capaci di compiere qualche azione, per esempio la commutazione
di un dato dispositivo) richiede del tempo. Come ci insegna l ’espe­
rienza è impossibile trasmettere istantaneamente un segnale « da
qui » ad un altro luogo (« là »). Per quanto riguarda la trasmissione
delle interazioni l ’ epoca di Newton non aveva sviluppato altra
idea ad eccezione dell’ azione a lungo raggio. La velocità finita della
trasmissione delle interazioni apparve insieme con il concetto di
campo, introdotto nella teoria dell’ elettromagnetismo da Maxwell.
Nella teoria di Maxwell l ’ interazione delle cariche o delle correnti
si realizza per mezzo di un campo cui si attribuisce un’ esistenza in­
dipendente. Segue dalla teoria che un campo si propaga a velocità
finita e ciò significa che l ’ interazione si propaga con la velocità di
propagazione del campo. La velocità di propagazione di un campo
elettromagnetico nel vuoto gioca un ruolo fondamentale nella teo­
ria della relatività. Essa è designata con la lettera c ed è circa ugua­
le a 3 -IO8 m/s. Poiché la variazione di campo si trasmette da punto
a punto, le teorie dei campi vengono chiamate a corto raggio. Come
si vedrà in seguito, la teoria della relatività in linea di principio ri­
fiuta l ’ azione a lungo raggio.

21
§ 1.5. Leggi di Newton e sistemi
di riferimento inerziali

Le leggi fondamentali della meccanica, le leggi di Newton, ci per­


mettono di individuare, fra tutti i possibili sistemi di riferimento,
la classe particolare di sistemi in cui non solo le leggi della mecca­
nica ma anche tutte le altre leggi fisiche sono particolarmente sem­
plici. Questi sono i cosiddetti sistemi di riferimento inerziali. Un
sistema di riferimento inerziale è un riferimento (o meglio riferimenti,
poiché come emergerà in seguito ce n ’ è un numero infinito) in cui
sono valide tutte e tre le leggi di Newton.
Incominciamo a vedere come sia importante la prima legge di
Newton per discriminare i sistemi inerziali dagli altri. La prima
legge di Newton, la legge d’ inerzia, afferma che un corpo non sog­
getto a forze si muove per inerzia, cioè in moto rettilineo ed unifor­
me. Spesso si può sentire (o anche leggere su qualche testo) che la
prima legge non è un’ affermazione indipendente, ma soltanto una
conseguenza della seconda legge.
Formalmente le cose stanno cosi. La risultante di tutte le forze
che agiscono su un corpo appare nel secondo membro dell’equazione
(1.5). La seconda legge afferma semplicemente che l ’ accelerazione
subita da un corpo è proporzionale a questa risultante e inversamen­
te proporzionale alla sua massa. D all’equazione (1.5) segue che se
la risultante di tutte le forze è uguale a zero, o se non ci sono forze
di alcun genere, il corpo non subisce alcuna accelerazione. Se un
corpo non è accelerato, o si muove con moto rettilineo ed uniforme
o è in quiete. Da ciò si è concluso che la legge d’ inerzia può essere
ottenuta dàlia dinamica.
Allora perché Newton ha ritenuto necessario formulare separa­
tamente la legge d ’ inerzia? È difficile credere che Newton non abbia
compreso che la legge d’ inerzia è conseguenza della legge della dina­
mica. Il problema è piu complicato di come sembra a prima vista.
Newton comprese molto bene che né l ’ equazione (1.5) né la legge
d ’ inerzia possono essere ugualmente valide in tutti i sistemi di ri­
ferimento. Non è casuale che per la definizione di un sistema di
riferimento si ricorra a tutte e tre le leggi di Newton. Ricordiamo
la terza legge: ad ogni forza corrisponde una forza uguale e contra­
ria. Questa legge sottolinea che tutte le forze nella meccanica di
Newton sono associate all’ interazione fra corpi.
Esaminiamo un utile, anche se semplice, esempio. Supponiamo
che un corpo a riposo sia in un sistema di riferimento inerziale K.
In accordo con la seconda legge di Newton non agiranno forze su
questo corpo. Senza toccarlo, consideriamolo dal punto di vista di
un osservatore dal sistema di riferimento che si muove rispetto a
K con accelerazione a. Questo osservatore noterà che il corpo in
questione si muove relativamente a lui con accelerazione —a. Se
la seconda legge di Newton fosse valida nel suo riferimento, egli
potrebbe dire che il corpo è soggetto alla forza —ma. Ma sappiamo

22
dall’ osservatore nel sistema inerziale che non ci sono forze agenti
sul corpo. Quindi la seconda legge di Newton non è valida nel si­
stema di riferimento in moto accelerato rispetto al riferimento iner­
ziale. Molti lettori hanno già compreso, naturalmente, che passando
in un sistema di riferimento in moto accelerato, si manifesta una
« forza d ’ inerzia » che non è propriamente una forza nel senso della
meccanica di Newton (vedi Supplemento V). Poiché le leggi di
Newton non sono valide in tutti i sistemi di riferimento, Newton
ha dovuto precisare che esiste un certo sistema di riferimento in cui
tutte queste leggi sono valide. L prima legge di Newton è equiva-
lente, infatti, a questa afferma­
zione. Questa legge postula che A sse d i rotazione
si può avere un sistema di rife­ d ella Terra
rimento inerziale (cioè un rife­
rimento in cui vale la legge
d ’inerzia). In altre parole, si può
trovare un sistema di riferimento,
in cui un corpo, che non inte­
ragisce con altri corpi, si muove
di moto rettilineo ed uniforme
per inerzia.
La legge d ’ inerzia rappresen­ F ig. 1.3. L’ esperimento di Foucault
ta un caso particolare della leg­ ideato per riconoscere uno dei SRI.
Per semplicità il disegno illustra
ge di conservazione dell’ impulso. l ’ esperimento di Foucault condotto
Da un lato, è una conseguenza al Polo. In realtà l ’ esperimento fu
della seconda e della terza legge condotto a Parigi, ma questo non
ne cambia la sostanza.
di Newton, dall’ altro, una con­
seguenza della seconda legge e
dell’ ipotesi sull’ omogeneità dello spazio (equivalenza di tutti i suoi
punti), cioè la meccanica newtoniana assume l ’ omogeneità dello
spazio in ogni sistema di riferimento inerziale.
Ora supponiamo di conoscere un sistema di riferimento inerziale.
In accordo col principio di relatività di Galileo tutti i sistemi in
moto rettilineo ed uniforme rispetto ad esso saranno anch’essi iner­
ziali. È chiaro quindi che c ’ è un numero infinito di sistemi di rife­
rimento inerziali.
Come si può individuare almeno un sistema di riferimento iner­
ziale? Naturalmente la scoperta di un tale riferimento è una questio­
ne di esperienza. Il famoso esperimento del pendolo, condotto per
la prima volta da Foucault, è adatto allo scopo. Per semplicità de­
scriveremo l ’esperimento come se fosse condotto ad uno dei poli
terrestri (fig. 1.3). Una pesante palla è sospesa ad un filo che è at­
taccato ad un riferimento costruito al Polo. Il punto di sospensione
del pendolo è collocato sull’ asse della Terra; l ’ attacco del filo è
libero e quindi il riferimento non trascina il filo nella rotazione at­
torno all’ asse terrestre. La posizione d ’ equilibrio del pendolo coin­
cide con l ’ asse terrestre. Se uno allontana il pendolo dalla posizione
di equilibrio e quindi lo lascia andare con velocità iniziale nulla,

23
esso comincerà ad oscillare su un certo piano. Le due forze che agi­
scono sul pendolo sono la forza di gravità mg e quella del vincolo T
del filo; entrambe le forze agiscono sul piano P di oscillazione e non
possono variare questo piano. Se la seconda legge di Newton fosse
valida sulla Terra, il piano delle oscillazioni del pendolo dovrebbe
mantenere l ’ orientazione rispetto alla Terra. Ma nelTesperimento
la Terra si tira indietro da sotto il pendolo e quindi « registra »
il fatto che nel sistema di coordinate assocciato alla Terra la seconda
legge non è a rigore valida.
Non bisogna stupirsi troppo di ciò, dato che le leggi di Newton
possono ancora essere usate con grande vantaggio sulla Terra. E
evidente, ad esempio, che Tiritera ingegneria e la meccanica teorica
si basano sulla seconda legge di Newton senza correzioni. Certamente
questo è dovuto al fatto che le correzioni sono piccole: esse sono le­
gate alla rotazione della Terra che non è molto veloce. La Terra può
essere considerata un sistema inerziale anche in un libro di scuola.
Ma fondamentalmente la Terra non è un sistema inerziale. Un
riferimento inerziale comporta un sistema di coordinate rispetto
al quale il piano delle oscillazioni del pendolo rimane costante.
Questo sistema può essere trovato dallo stesso esperimento di Fou­
cault. Il sistema può sembrare abbastanza « esotico ». Il suo centro
è collocato sul Sole e i tre assi coordinati sono diretti sulle stelle
« fisse » (cioè le stelle che si muovono rigidamente insieme alla co­
siddetta sfera celeste). Per il ruolo singolare del Sole il riferimento
inerziale così trovato viene detto eliocentrico. Nella scelta del si­
stema di riferimento è molto importante la scelta delia direzione
degli assi coordinati. La scelta deiTorigine nei centro d’ inerzia del
Sole è conveniente perché il Sole è l ’ oggetto più massivo di tutto il
sistema solare. 11 movimento dei pianeti risulta particolarmente
semplice in questo riferimento. È da notare che gli assi del riferi­
mento eliocentrico non partecipano alla rotazione del Sole. Per
altro, il sistema di riferimento, i cui assi coordinati sono fissati
rigidamente alla Terra (cioè ruotano con essa), è detto geocentrico.
Come messo in luce dall’esperimento di Foucault, questo riferimen­
to non è inerziale.
Quindi le leggi di Newton sono applicabili nel riferimento elio-
centrico. In accordo col principio di relatività di Galileo le leggi
di Newton sono ancora valido in tutti i sistemi di riferimento in
moto rettilineo ed un if orme rispetto a quello eliocentrico. Chiame­
remo tutti questi sistemi sistemi di riferimento inerziali 1. Benché
il numero di tali sistemi sia infinito, essi sono dispersi tra tutti i
possibili tipi di riferimento. Se fosse possibile rinchiudere tutti i
tipi di riferimento dentro un sacco e tirarne fuori uno a caso, otter­
remmo molto probabilmente un riferimento non inerziale.

1 Da questo momento in poi useremo la forma SRI per abbreviare « sistema


di riferimento inerziale ».

24
L ’esperimento di Foucault non è certamente runico che permette
di apprezzare la deviazione del sistema di riferimento geocentrico
da quello inerziale. Indicheremo un altro esperimento di questo tipo.
Quando un oggetto pesante è lasciato cadere da una certa altezza,
non cade verticalmente come dovrebbe a causa della forza di gra­
vità, ma viene deviato leggermente verso est. La deviazione dalla
verticale dei corpi in caduta libera mette in evidenza il carattere
non inerziale del riferimento geocentrico e ci permette dì trovare un
riferimento inerziale.
In meccanica c ’ è ancora una legge di conservazione per i sistemi
chiusi che è la legge di conservazione dei momento delia quantità
di moto. Essa è una conseguenza della seconda e terza legge di New­
ton, proprio come la legge di conservazione della quantità di moto
in un sistema chiuso. Inoltre, essa può essere ottenuta come conse­
guenza della seconda legge con l ’ assunzione dell’ isotropia dello
spazio. Questo implica che la meccanica di Newton jjresuppone
uno spazio isotropo.
La legge di conservazione di energia per sistemi chiusi è di nuovo
una conseguenza della seconda legge di Newton nell’ ipotesi sul ca­
rattere potenziale delle forze che agiscono fra le particelle del si­
stema. D ’ altro canto essa deriva dalle equazioni del moto del si­
stema e dall’ assunta uniformità del tempo. Ne segue che l ’ uniformi-
tà dei tempo è uno dei presupposti della meccanica newtoniana.
Perciò un sistema di riferimento inerziale può essere individuato
come quello rispetto a cui lo spazio è uniforme ed isotropo e il tempo
è uniforme.
Qualche volta un sistema di riferimento inerziale è definito come
un riferimento fissato rigidamente ad un oggetto in moto libero;
benché sia fondamentalmente vera, questa affermazione non serve
per la determinazione sperimentale dei SRL Non abbiamo a disposi­
zione « oggetti in moto libero », poiché non si può annullare la gra­
vità. È più corretto, perciò, definire i SRI come riferimenti in cui
sono valide tutte e tre le leggi di Newton.
I sistemi inerziali si distinguono fra gli altri (non inerziali)
non solo in meccanica. Una carica elettrica non irradia onde elet­
tromagnetiche quando è a riposo in un sistema di riferimento iner­
ziale, mentre irradia in un sistema di riferimento non inerziale.
I sistemi di riferimento inerziali hanno un ruolo importantis­
simo in fisica. È per questi sistemi di riferimento che si sono regi­
strate le familiari leggi fisiche, li passaggio ad un riferimento non
inerziale comporta considerevoli difficoltà. La teoria della relatività
ristretta ci insegna come descrivere tutti i tipi di fenomeni fisici in
ogni sistema di riferimento inerziale 1. Ma cosa significa e cosa si

1 Bisogna sottolineare che la TRR si può formulare in un sistema non iner­


ziale. Infatti, la TRR può essere usata in ogni sistema di riferimento dove non
ci sono forze gravitazionali (in uno spazio piano quadridimensionale). Comun­
que la forma della TRR suggerita da Einstein e sviluppata in questo libro è
applicabile soltanto ai sistemi di riferimento inerziali.

25
può fare in pratica? Abbiamo molto da discutere prima di poter
dare una risposta a queste domande.

§ 1.6. Tempo assoluto e spazio


assoluto
Benché, nella derivazione delle trasformazioni di Galileo, abbiamo
già parlato del significato del tempo e dello spazio in quelle tra­
sformazioni, vogliamo ripetere i punti più pertinenti. Normalmente,
quando si parla di fisica « classica », si implica la meccanica newto­
niana perché il concetto di spazio e di tempo di Newton riflette pre­
cisamente Tapproccio classico a questi concetti. Le idee di Newton
meritano un’ attenzione particolare perché corrispondono all’ espe­
rienza quotidiana, e sono di senso comune e comprensibili, mentre
il passaggio al concetto di spazio e di tempo legato alla teoria della
relatività costringe ad abbandonare queste idee. In più, un più pre­
ciso allontanamento da questi concetti fu compiuto da Einstein
nella teoria della gravitazione spesso indicata come teoria della
relatività generale. Questo è quello che si legge nel Philosophiae
Naturalis Principia Mathematica (1687): « Lo spazio assoluto, nella
sua propria natura, senza relazione con qualcosa d ’esterno, rimane
sempre uguale e inamovibile ».
Cosi, secondo Newton, lo spazio è rappresentabile come una gi­
gantesca scatola vuota che contiene la materia e dove avvengono
i fenomeni fisici. Nello stesso tempo Newton era certo che il prin­
cipio di Galileo fosse valido in meccanica. E questo indica che lo
stato di immobilità è equivalente al moto rettilineo uniforme. Allora
come si deve mettere in evidenza lo spazio « assolutamente immobi­
le »?
Naturalmente è impossibile evidenziare la « mancanza assoluta
di moto » con la sola osservazione dei fenomeni meccanici. La rive­
lazione dello spazio assoluto e del moto assoluto implica lo studio
di campi fuori dalla portata della meccanica. Essi si possono rive­
lare interpretando i fenomeni ottici. Di conseguenza nel saggio sto­
rico dedicato all’ interpretazione di alcuni fatti sperimentali (vedi
Supplemento II) si presumerà che il riferimento privilegiato di
Newton (è lo spazio assoluto immobile) è il riferimento eliocentrico.
Infine, dovrebbe essere chiaro che non c ’ è un riferimento privilegia­
to, ma c ’ è un’ intera classe di riferimenti privilegiati in cui le leggi
fisiche appaiono particolarmente semplici. È la classe dei sistemi
di riferimento inerziali.
Vediamo cosa scrisse Newton del tempo:
« Assoluto, vero e matematico il tempo per sé e per la sua stessa
natura fluisce ugualmente senza relazione con l ’ esterno ed è chiamato
in alternativa durata ».
Ancora una volta incontriamo l ’ affermazione che il tempo è
qualcosa di esterno rispetto alla natura. Quindi, secondo le idee
di Newton, tempo e spazio esistono di per sé indipendentemente

26
dai corpi materiali collocati nello spazio. Sicuramente i concetti
di tempo e di spazio di Newton ci sembrano molto scolastici. Co­
munque, non devono essere sottostimati. Riportiamo a questo pro­
posito un breve brano da un libro [11]:
« Nelle conversazioni con degli autori di questo libro in varie
occasioni negli anni, Einstein dimostrò il suo grande rispetto per
Newton. Egli sottolineò che Newton fu perfino più consapevole dei
critici del X V II secolo delle difficoltà connesse alle idee di spazio e
di tempo assoluti. In ogni caso, per quel tempo il postulare queste
idee era Punico modo pratico di risolvere il problema delle descri­
zioni del moto ».
Naturalmente si pone una questione: come può funzionare con
tanta efficienza la meccanica classica basata su concetti di spazio
e tempo difficilmente spiegabili? Si torna a punto che questi con­
cetti sono quasi corretti e la deviazione è insignificante nella vita
quotidiana. La deviazione dalla meccanica classica diviene chiara­
mente visibile solo quando si studiano microparticelle anche nelle
condizioni dello spazio esterno in cui la fisica moderna ha cominciato
ad addentrarsi. Tali ricerche richiedono, però, condizioni partico­
lari ed un equipaggiamento abbastanza sofisticato.
Per finire questo breve paragrafo è necessario fornire una rapida
presentazione dell’ attuale approccio al problema. Dal moderno punto
di vista non esiste spazio assoluto e, quindi, non c ’ è moto assoluto.
Tutti i sistemi di riferimento inerziali sono equivalenti. La teoria
della relatività ristretta mostra che le letture del tempo di un evento
sono differenti in diversi sistemi di riferimento inerziali. Quindi,
lo scorrere del tempo dipende, dallo stato di moto. La teoria della
gravitazione di Einstein va ancora oltre. Secondo questa teoria le
proprietà dello spazio e del tempo non sono assegnate per sempre,
ma sono determinate dagli oggetti che si trovano nello spazio. Dato
che in accordo con il materialismo dialettico spazio e tempo sono
forme di esistenza della materia, le conclusioni della teoria della
gravitazione di Einstein appaiono più soddisfacenti dei concetti
newtoniani di spazio e di tempo.
§ 1.7. Come la fisica si è andata
avvicinando alla teoria della
relatività
Dal punto di vista della fisica moderna è interessante ricostruire
come gli effetti relativistici siano stati messi in evidenza prima della
creazione della teoria della relatività. Questo paragrafo non pretende
di essere un saggio storico (il Supplemento II è più indirizzato a que­
sto scopo), ma ò inteso soltanto come premessa per la comprensione
dei prossimi due paragrafi, dove sono presentati i primi principi della
teoria.
Senza dubbio, il primo passo nello sviluppo della teoria della
relatività ristretta fu la scoperta di Galileo del principio di relatività
dei fenomeni meccanici.

27
Nasce spontaneo il quesito: perché Galileo limitò il suo principio
alla meccanica? La risposta è immediata: nell’epoca di Galileo non
c ’erano « altre branche della fisica », come le definiamo oggi. In­
fatti, la meccanica rappresentava l ’ intera fisica. Se poi consideriamo
che fino alla fine del X IX secolo si tentò di spiegare tutti i fenomeni
fisici sulla base della meccanica, diviene chiaro come il principio
di relatività di Galileo racchiudesse l ’ « intera fisica » del tempo.
Il, passo successivo sulla strada verso la relatività si ebbe quando
fu stabilita la velocità finita della luce. La conclusione fu raggiunta
da Romer sulla base delle sue osservazioni astronomiche (1676).
Prima di Romer la velocità della luce era considerata infinita.
Il principio di relatività galileiano fu espresso in forma mate­
matica soltanto dopo che furono scritte le equazioni della meccanica
(Newton, Phìlosophiae Naturalis Principici Mathematica, 1687).
Poiché coordinate e tempo sono le variabili principali nelle equazio­
ni della meccanica, la loro trasformazione per il passaggio da un
riferimento ad un altro, in moto rispetto al primo, richiede equazio­
ni appropriate per la trasformazione delle coordinate e del tempo nel
passaggio citato. Segue dal principio di relatività di Galileo che la
trasformazione delle coordinate e del tempo richieste non devono
alterare la forma delle leggi di Newton (§ 1.4). Queste trasformazioni
sono quelle di Galileo.
Nel 1851 fu condotto al Panthéon di Parigi Pesperimento del
pendolo di Foucault che dimostrò definitivamente la rotazione della
Terra ed indicò il sistema di riferimento inerziale (§ 1.5). Infatti,
con questo esperimento si può concludere la descrizione dei fenomeni
meccanici, legati direttamente alla teoria della relatività.
I] principio di relatività galileiano, le leggi di Newton e le tra­
sformazioni di Galileo sono strettamente correlati. La conseguenza
diretta delle trasformazioni di Galileo è la formula classica della
trasformazione della velocità (1.4): v' = v — V. Nel 1851 Fizeau
condusse un esperimento per mostrare che questa formula non è
sempre corretta. L ’ esperimento di Fizeau con l ’ acqua corrente fu
condotto schematicamente come segue. Nel riferimento K V acqua
scorre lungo un tubo a velocità F, e viene misurata la velocità della
luce nell’ acqua. Ora si può ragionare (in termini puramente cine­
matici). Fissiamo nel riferimento K ' l ’ acqua che scorre. In questo
sistema di riferimento la velocità vf della luce è data dalla solita re­
lazione u' — chi, dove n è l ’ indice di rifrazione dell’ acqua. Per
trovare la velocità della luce nel riferimento K, bisogna semplice-
mente applicare l ’ (1.4) e si ottiene quindi v - chi + V. Ma il risul­
tato di Fizeau (confermato anche da moderne misure) fu

Ne segue che Fequazione classica (1.4) non è corretta in questo caso;


e questo è quanto si voleva sottolineare. Per i dettagli dell’esperia
mento e la sua moderna interpretazione si può vedere nel § 3.6.

28
La teoria della relatività deve moltissimo alla teoria di Maxwell
(1856—1873) formulata prima in alcuni articoli e poi pubblicata
nei due volumi Treatise on Electricity and Magnetism (1873). Fu la
prima teoria di campo in cui Vinterazione veniva trasmessa a velo­
cità finita, che è la velocità di propagazione del campo. La teoria
prevedeva un valore definito per questa velocità che è precisamente
uguale a 1/]/"e0p0 nel vuoto, dove s0 e p0 sono le costanti elettriche
e magnetiche. Naturalmente sorse subito il problema se fosse soddi­
sfatto il principio di relatività; in altri termini, se le equazioni di

Si può facilmente verificare che le trasformazioni di Galileo cambia­


no la forma delle equazioni di Maxwell. Da ciò nacque il sospetto
che il principio di relatività non si estendesse alla dinamica. Furono
necessarie diverse decine di anni per rendersi conto degli aspetti
« portentosi » della teoria di Maxwell. Maxwell, senza sapere nulla,
neppure un sospetto, della teoria della relatività, aveva sviluppato
la sua teoria in completo accordo con i requisiti della teoria della
relatività.
Ora, sapendo bene dove si può « notare » l ’ influenza della teoria
della relatività, è facile tornare ai fatti essenziali. La teoria della
relatività si rivela quando le velocità dei corpi si avvicinano a quella
della luce nel vuoto (tali velocità vengono dette relativistiche).
Tuttavia non ci sono corpi macroscopici che posseggono velocità
relativistiche. Soltanto particelle microscopiche possono avere
velocità vicine a quelle della luce. La prima particella scoperta fu
l ’ elettrone (Thomson, 1894-1896). Thomson determinò sperimental­
mente il rapporto tra la carica di un elettrone e la sua massa. Il
suo esperimento fu conno ilo in tubi a scarica, dove le velocità degli
elettroni sono molto lontane da quelle della luce. Ma nel 1896 fu
scoperta la radioattività naturale. Tra le radiazioni emesse dalle
sostanze radioattive si rivelò anche il fascio di elettroni che
furono presto identificati con gli elettroni nei tubi a scarica. Le
velocità di questi elettroni si rivelarono già vicine a quella della
luce. Quando nel 1902 Kaufmann studiò il moto di tali elettroni in
campi elettrici e magnetici, si scoprì che l ’equazione classica del mo­
to (la seconda legge di Newton) descriveva scorrettamente il loro
comportamento. Così fu osservata per la prima volta la deviazione
dalle leggi di Newton. Riassumendo, si può dire che agli inizi del
X X secolo divenne ovvio che la meccanica di Newton e le trasforma­
zioni di Galileo non fossero sempre valide, e che i segnali più veloci
conosciuti, cioè i segnali luminosi, fossero trasmessi a velocità finita.
Benché non ci siano oggetti che si muovono a velocità relativi­
stiche, un oggetto relativistico, la luce, era sempre a nostra dispo­
sizione. Gli esperimenti di ottica giocarono un ruolo fondamentale
nella storia della TRR: l ’ interpretazione degli esperimenti di
ottica è associata con l ’emergere dell’ ipotesi sul « mezzo portatore
di luce ». Il rigetto di tale ipotesi portò molti vantaggi, ma ora è
menzionato come una pagina della fisica (vedi Supplemento II).

29
§ 1.8. Generalizzazione del principio
della relatività galileiana

Il principio di relatività di Galileo riguardava soltanto i fenomeni


meccanici. Abbiamo rilevato che la seconda legge di Newton, espres­
sa in forma differenziale in combinazione con le trasformazioni di
Galileo, soddisfaceva al principio di relatività. Dal punto di vista
formale ciò significava che nelle trasformazioni di Galileo l ’ equazione
(1.5) rimaneva invariata e cambiava soltanto la designazione delle
variabili. Ovviamente nasce il problema: perché il principio di rela­
tività deve estendersi soltanto ai fenomeni meccanici? Perché è im­
possibile credere che tutti i fenomeni fisici accadano in modo identico
in tutti i riferimenti inerziali, purché le condizioni iniziali di questi
fenomeni siano identiche? In altre parole, perché è impossibile as­
sumere che tutti i sistemi di riferimento inerziali siano compieta-
mente equivalenti rispetto a tutti i fenomeni fisici?
Queste questioni non infastidirono troppo i fisici fino alla metà
del X IX secolo, in quanto tutta la fisica era ridotta alla meccanica.
Ma dalla metà del X IX secolo divenne evidente che la fisica non si
riduceva alla meccanica. Allo stesso tempo si era andata sviluppando
la convinzione di una relazione universale tra i fenomeni fisici. La
suddivisione della fisica in « meccanica », « elettricità », « calore »,
ecc,. (giustificata dal fatto che ciascun gruppo di fenomeni possiede
il proprio bagaglio di equazioni fondamentali) fu piuttosto una ri­
chiesta pedagogica che un imperativo intrinseco. Guardando con
maggiore attenzione, anche in un evento « puramente meccanico »
si possono notare manifestazioni di regolarità di altro tipo. La col­
lisione delle palle da biliardo è sempre citata come un esempio clas­
sico di meccanica. Ma al momento della collisione, quando le palle si
sono leggermente appiattite, le forze elastiche definite dalle forze
elettromagnetiche giocano un ruolo importante. Dunque in natura
non esistono fenomeni « puramente meccanici ». Ne segue che il
principio di relatività deve estendersi all’« intera fisica » oppure
è completamente errato.
Quindi l ’estensione del principio di relatività a tutti i fenomeni
fisici fu piuttosto naturale dal punto di vista dei fisici della fine del
X IX secolo. Ma una tale generalizzazione del principio di relatività
galileiana è proprio ciò che viene chiamato il primo postulato di
Einstein, o principio di relatività di Einstein.
Comunque, il sistema fondamentale delle equazioni dell’elettro­
dinamica si trovarono subito in contraddizione col principio di
equivalenza dei sistemi di riferimento inerziali.
Prima di tutto, per quanto riguarda il sistema fondamentale
delle equazioni dell’elettrodinamica, cioè le equazioni di Maxwell,
esse modificano il loro aspetto sotto le trasformazioni di Galileo, cioè
non mantengono la loro forma. Ne segue che i fenomeni elettromagne­
tici sono descritti in modo diverso in differenti SRI; in altri termini,
i fenomeni elettromagnetici non obbediscono al principio di relati-

30
vita. In particolare, questo significa che in un sistema di riferimento,
in cui le equazioni di Maxwell sono scritte in forma convenzionale
(vedi capitolo VI), la velocità di propagazione delle onde elettroma­
gnetiche (della luce) c è uguale a l / ] / e 0(x0, mentre in tutti gli altri
sistemi di riferimento in moto rispetto al primo, la velocità è diffe­
rente. Ma il vuoto occupa un posto speciale rispetto ai sistemi di
riferimento. In più, esso è degno di nota perché non ha un « mezzo »
dotato di massa a riposo. Ad un mezzo materiale si può sempre as­
sociare un riferimento, cioè scegliere un riferimento tale in cui il
mezzo è in quiete come tu tt’uno o in una regione limitata. Ma questo
riferimento particolare è quello scelto. Un altro sistema di riferi­
mento equivalente in moto rettilineo al primo deve avere le stesse
proprietà del mezzo immobile. Ma questo crea una diversa situazio­
ne fisica. Così, la presenza del mezzo individua sempre un riferi­
mento tra tutti gli altri. Ma è impossibile evidenziare tale riferimen­
to nel vuoto perché non ci sono sistemi di riferimento in cui il vuoto
è a riposo. Di conseguenza, tutti i sistemi di riferimento sono equi­
valenti rispetto al vuoto. Ne segue logicamente che (purché tutti gli
osservatori inerziali siano equivalenti) la velocità delle onde elettro-
magnetiche (della luce) deve essere la stessa, 1/]/ £0jui0, *n tutti i
SRI.
La formula classica della trasformazione delle velocità (1.4)
mostra che questo non è proprio il caso. Poniamo uguale a c la ve­
locità della luce nel vuoto in un riferimento inerziale K . In un
altro riferimento inerziale K ' la velocità della luce nel vuoto c'
è uguale a c — V. Quindi la velocità della luce nel vuoto c è uguale
a 1/ ] / e0|
li0 soltanto in un sistema di riferimento privilegiato. Quin­
di il principio di relatività non sembra corretto per i fenomeni elet­
tromagnetici.
Il ragionamento precedente era basato su un assunto fondamenta­
le assolutamente inaccettabile per la fisica del X I X secolo: le onde
elettromagnetiche (la luce), si possono propagare nel vuoto o, in
altri termini, non è necessaria la materia per la loro propagazione.
Questo è un punto difficile da capire quando si inizia a passare dalla
fisica classica a quella relativistica.
Ma cosa si può fare in una tale situazione? Tre possibilità sono
aperte per logica.
1) Si potrebbe assumere che il principio di relatività copra sol­
tanto la meccanica e non abbia nulla a che fare con Felettrodina­
mica in cui esiste un sistema di riferimento « assoluto ». Ma, come
detto in precedenza, una tale possibilità va respinta in considerazio­
ne delle relazioni generali fra i fenomeni fisici.
2) Il principio di relatività dovrebbe essere considerato come
universalmente applicabile e poiché il sistema delle equazioni di
Maxwell non soddisfa questo principio (esso cambia la sua forma
per le trasformazioni di Galileo) esso non può essere accettato. Ma
il sistema di equazioni di Maxwell si è dimostrato una teoria affi­

di
daMle ed esauriente all’interno di un sistema di riferimento inerziale
(quello del laboratorio). D ’ altro canto, la meccanica di Newton e
le trasformazioni di Galileo ad essa associate hanno mostrato di
non essere sempre corrette. À causa di ciò sembrerebbe ragionevole
mantenere il sistema di equazioni di Maxwell.
3) Se il principio di relatività si considera valido per tutti i
fenomeni naturali, e le equazioni di Maxwell si ritengono esatte, il
passaggio- da un sistema di riferimento ad un altro non può essere
descritto dalle trasformazioni di Galileo (che modificano la forma
delle equazioni di Maxwell). D ’ altra parte, una nuova trasformazione
non può lasciare invariata la forma delle equazioni della meccanica.
Di conseguenza, le equazioni della meccanica vanno modificate in
modo che la nuova trasformazione le lasci inalterate.
Quest’ultima possibilità illustra concisamente il programma
portato a termine dalla teoria della relatività ristretta: 1) il prin­
cipio di relatività si estende a tutti i fenomeni naturali, 2) la velocità
della luce nel vuoto è la stessa in tutti i SRI (questo discende dall’ in­
varianza delle equazioni di Maxwell).
Ma come devono essere le trasformazioni delle coordinate e
del tempo per soddisfare i due requisiti precedentemente posti?
Le trasformazioni cercate saranno proprio trasformazioni di Lo-
rentz, che esamineremo da vicino nel prossimo capitolo. In conclu­
sione vogliamo puntualizzare quanto segue.
Non appena il principio eli relatività galileiana fu esteso a tutti
i fenomeni fisici, esso divenne 1’ autentico principio della fisica. È
il caso di sottolineare la differenza fra legge fisica e principio fisico.
Quando si parla di legge fisica, si intende la sua validità per una
classe limitata di fenomeni fisici. Ad esempio, le leggi di Newton
descrivono i fenomeni meccanici. Le equazioni di Maxwell sono per­
tinenti all’elettrodinamica e quindi sono le leggi dell’eie ttrodinami-
ca. Le tre leggi della termodinamica riguardano i fenomeni termici.
I principi fisici invece hanno importanza universale, perciò riguar­
dano tutti i fenomeni fisici.
Il più noto principio fisico è quello della conservazione del­
l ’energia. Il famoso libro di M. Planck dedicato alla conservazione
dell’energia è intitolato II principio della conservazione dell1energia
(1931). Noi crediamo che la legge di conservazione dell’energia valga
per tutti i fenomeni fisici, così come siamo convinti che la legge di
conservazione della quantità di moto è vera per tutti i fenomeni
fisici. Il principio di relatività ha un posto nella fisica, subito dopo
il principio di conservazione dell’energia e della quantità di moto.

§ 1.9. Velocità della luce nel vuoto


La velocità della luce nel vuoto occupa un posto speciale in natura
in quanto, secondo la concezione odierna, essa è la massima velocità
con cui si può trasmettere l ’ interazione tra i corpi. La trasmissione
di un’ interazione (cioè la trasmissione di una certa « azione » pro­

32
dotta da un corpo sull’ altro) è spesso citata come trasmissione di
un segnale (è questo il termine più spesso usato nella teoria della
relatività). Trasmettere un segnale significa trasmettere energia e
quantità di moto (considerate inseparabili nella teoria relativistica,
vedi § 5.5), capaci di « accendere » un certo sistema (ad esempio, un
meccanismo di relè).
Non è deducibile in alcun modo che in natura la velocità di pro­
pagazione dei segnali debba avere un valore limite. Tuttavia, sia
la teoria che gli esperimenti mostrano che tutte le interazioni a noi
note si propagano a velocità finita,
può propagarsi un segnale è quella della luce nel vuoto (ricordiamo
che essa è anche la velocità di propagazione nel vuoto delle onde
elettromagnetiche di qualsiasi frequenza). Come già detto, la teoria
classica assumeva tacitamente che un segnale possa propagarsi a
velocità infinita.
Se si ammette resistenza in natura di una velocità limite di
propagazione dei segnali, il suo valore assoluto deve essere lo stesso
in tutti i sistemi di riferimento inerziali. Infatti, tutti questi rife­
rimenti sono equivalenti in base al principio di relatività, ed è im­
possibile, con esperimenti fisici, mettere in evidenza differenze fra
essi. Se la velocità limite di propagazione delle interazioni fosse
diversa in vari sistemi inerziali, sarebbe possibile distinguerli Tuno
dall’ altro. E ciò è impossibile se il principio di relatività ha validità
universale. Quindi da ciò segue immediatamente che la velocità
della luce nel vuoto deve essere la stessa in tutti i riferimenti iner­
ziali. E cosa succede se la sorgente si muove verso l ’osservatore o se
l ’ osservatore si muove verso la sorgente? Tale moto non modifica
la velocità limite di trasmissione del segnale. Quindi la velocità
delia luce nel vuoto non può dipendere dal moto né della sorgente,
né dell’ osservatore.
Ovviamente la velocità della luce nel vuoto ha proprietà uniche.
Tutte le velocità sono relative, cioè esse cambiano nel passaggio
da un riferimento inerziale ad un altro. Ma il valore assoluto della
velocità c rimane lo stesso. Benché fra i riferimenti inerzial. non
ce ne sia uno privilegiato, c ’è una velocità privilegiata in 1utti.
Entrambe queste circostanze sono strettamente legate al fattto che
le onde elettromagnetiche si possono propagare nel vuoto; in altri
termini, non c ’ è bisogno di un mezzo materiale per la loro propaga­
zione. Ovviamente l ’assumere una velocità privilegiata (invariante)
modifica drasticamente il quadro classico, cioè la relazione (1.4) e,
di conseguenza, le (1.2) e (1.3).
In ogni caso, per quanto un ragionamento logico sia bello e
rigoroso l ’esperimento ha avuto e avrà sempre un ruolo fondamen­
tale in fisica. Un esperimento conferma le due circostanze seguenti:
1) in un dato SRI la velocità della luce nel vuoto è uguale in tutti
i punti ed in tutte le direzioni; 2) in tutti i SRI questa velocità ha
lo stesso valore. Ci riferiamo qui agli esperimenti di Michelson-Morlev
e Kennedy-Thomdike descritti nel Supplemento IL

33
IL POSTULATI DI EINSTEIN.
INTERVALLO TRA EVENTI.
TRASFORMAZIONI DI LORENTZ

§ 2.1. Postulati di Einstein


La parte finale del capitolo precedente era dedicata alla spiegazione
dei due assunti fondamentali della T R R , chiamati anche postulati
di Einstein. Dato il loro significato li ripeteremo anche qui con ul­
teriori commenti.
Postulato I. Tutti i fenomeni fisici identici si manifestano nella
stesso modo nei sistemi di riferimento inerziali a parità di condizioni
iniziali. In altre parole, non ci sono riferimenti privilegiati tra i
SRI, ed è impossibile mettere in evidenza lo stato di moto assoluto.
Questo postulato estende a tutti i fenomeni fisici il principio
di relatività galileiana. Esso pone fine per sempre al concetto di
spazio assoluto: se tutti i sistemi di riferimento sono equivalenti,
tra di essi non c ’ è un sistema di riferimento privilegiato. Era pro­
prio lo spazio assoluto che serviva da riferimento privilegiato. Viene
rifiutato analogamente il concetto di moto « assoluto » (nel vuoto)
inteso come moto rispetto’ al sistema di riferimento assoluto (vedi
§ 1 . 6 ).
Postulato IL La velocità, della luce nel vuoto è uguale in tutte le
direzioni ed in ogni regione di un dato sistema di riferimento, ed uguale
in tutti i sistemi di riferimento inerziali.
Spesso questo postulato è integrato dall’ affermazione che la
velocità della luce nel vuoto non dipende dalla velocità della sorgente.
Questo comunque è una diretta conseguenza del postulato II. In­
fatti, ad ogni sorgente si può associare un sistema di riferimento
inerziale (se la sorgente si muove non uniformemente e lungo una
curva, si può trovare un riferimento inerziale istantaneo comovente).
In tale riferimento la sorgente è in quiete, mentre tutti gli altri
riferimenti inerziali sono in moto rispetto ad essa (e la sorgente si
muove rispetto ad essi). In accordo con il postulato II la velocità
della luce è la stessa in tutti i riferimenti, ma ciò significa che essa
non dipende dalla velocità della sorgente. Per quel che riguarda il
moto dell’ osservatore, è essenziale la velocità relativa della sor­
gente e dell’ osservatore, così il ragionamento precedente risponde
alla domanda.
Bisogna capire bene le implicazioni del postulato IL Per questo
immaginiamo che la velocità della luce sia misurata nel riferimento
K come segue. Al momento L viene inviato un segnale dal punto

34
lungo l ’ asse x, che raggiunge il punto x 2 all’ istante t2. Alierà
c = (x2 — ^i)/(h — h)- Ora i medesimi due eventi, l ’ invio e la
ricezione del segnale, sono visti dal riferimento K '. L ’ invio del se-
gnale, per l ’ osservatore in K ' , avviene al punto x[ all’ istante e
la ricezione al punto x'2 all’ istante Nonostante il fatto che i rife­
rimenti K e K ' siano in molo relativo lungo l ’ asse comune x, x\
noi dobbiamo ottenere che il rapporto (x'2 — #')/(£' — £') sia uguale
a c. Dal punto di vista del « buon senso » non deve essere così (diven­
ta chiaro se si disegna il diagramma dell’esperimento). Comunque,;
è proprio ciò che dice il postulato IL
Abbiamo formulato il postulato II nel modo in cui l ’ha fatto Einstein
stesso nel suo articolo del 1905. Comunque, oggi è opportuno formularlo diver­
samente. E precisamente, procedendo dall’ assunto che in natura c ’è una velo­
cità limite di propagazione del segnale (interazione). Questa è l ’ affermazione
principale. Poi si suppone che questa velocità limite sia la velocità delle onde
elettromagnetiche (della luce) nel vuoto. L ’ultimo assunto non è obbligatorio:
in linea di principio la TRR non perderebbe senso se la velocità limite fosse
diversa, ma la TRR fa uso anche di questo assunto. Dal fatto che la velocità
della luce nel vuoto è la velocità limite della trasmissione delle interazioni,
segue direttamente che essa deve avere lo stesso valore in tutti i SRI (vedi § 1.9),

Dopo aver formulato i principi primi della teoria della rela­


tività, cioè i due postulati di Einstein, si possono formulare gli
obiettivi generali della teoria della relatività ristretta. La sua base
è il principio di relatività, cioè l ’ equivalenza di tutti i riferimenti
inerziali rispetto ai fenomeni fisici. La teoria della relatività deve
dare una descrizione dei fenomeni fisici tale da essere la stessa in
tutti i sistemi di riferimento inerziali. Allora, se abbiamo delle equa­
zioni a nostra disposizione che descrivono questo o quel fenomeno
fisico, queste equazioni devono avere lo stesso aspetto in tutti i
sistemi di riferimento inerziali (nelle variabili di ciascun riferimento).
Ricordiamo che le equazioni della meccanica ed elettrodinamica con­
tengono intrinsecamente le coordinate dell’evento e l ’ istante di
tempo in cui esso è avvenuto. Le coordinate e l ’ istante di tempo di
un evento si trasformano nel passaggio da un riferimento inerziale
all’ altro. Le trasformazioni di Galileo cambiano l ’ aspetto delle
equazioni di Maxwell, ma poiché noi vogliamo mantenere le equazio­
ni di Maxwell come equazioni del campo elettromagnetico valide in
tutti i sistemi di riferimento, dobbiamo cercare trasformazioni di
coordinate e del tempo tali che mantengano l ’ aspetto delle equazioni
di Maxwell. Trasformazioni siffatte saranno appunto le trasformazio­
ni di Lorentz.
Comunque, le trasformazioni di Lorentz sono conseguenza di­
retta dei postulati di Einstein. Il punto è che la teoria di Maxwell
fu sviluppata fin dall’ inizio cerne quella relativistica. La causa
interna di ciò consiste nel fatto che essa conteneva una descrizione
corretta dell’ oggetto relativistico stesso, la luce.
In questo modo, avendo trovato le trasformazioni delle coordinate
e del tempo che soddisfano i postulati di Einstein, dobbiamo essere

35
sicuri che le equazioni fondamentali della fisica siano le stesse in
tutti i sistemi dì riferimento, cioè siano covarianti rispetto a tali
trasformazioni'. Il significato del termine « covariante » sarà spiegato
nel § 4.3. Ora occupiamoci delle « equazioni fondamentali » della
fisica.
Le leggi di Newton sono considerate le leggi fondamentali della
meccanica, quelle di Maxwell le leggi fondamentali doli’ elettrodi­
namica e nella termodinamica si considerano fondamentali le equa­
zioni che esprimono il suo primo e secondo principio.
Grandezze relative in fisica classica erano conosciute, mi esempio
la velocità, le coordinate, le direzioni delle velocità; ma la teoria
della relatività ristretta ha aggiunto loro, contrariamente all 5intui­
zione comune, gli intervalli di tempo relativo fra eventi e lunghezze
di scale relative, cioè le distanze. E questo il « prezzo » da pagare
per estendere il principio di relatività a tutti i fenomeni fisici.
Il carattere dominante della teoria della relatività, a dispetto
del nome, non è affatto la relatività delle varie grandezze, cioè la
loro dipendenza dalla scelta del sistema di riferimento. L'essenza
della teoria della relatività sta proprio nel contrario. Essa mostra
che le leggi di natura in un sistema di riferimento inerziale non
dipendono dalla scelta del riferimento e dalla posizione e dal moto
dell 5osservatore, ma i risultati delle misure condotte in diversi si­
stemi di riferimento possono essere correlate fra loro. Parlando in
termini filosofici, la teoria della relatività mette in risalto il carat­
tere oggettivo delle leggi della natura e non la relatività della co­
noscenza.
Ovviamente, tentare di modificare un nome ormai storicamente
stabilito, che fu proposto non da Einstein ma da Planck nel 1906,
è completamente inutile. Comunque c ’ è un punto al quale si può
prestare attenzione; la controversia sul nome corretto per la teoria,
-« speciale » o « parziale », è inessenziale. In un certo senso il pro­
blema è come restringere la teoria ai sistemi di riferimento inerziali.
Essenzialmente questa restrizione comporta che la teoria è corretta
in assenza di campi gravitazionali o, praticamente, in campi deboli.
Questo è il motivo per cui il nome più .corretto è teoria della relati­
vità « ristretta » che è quello adottato nella letteratura francese.
Sebbene i postulati di Einstein siano i principi primi della teo­
ria relativistica, essi non sono sufficienti al suo sviluppo. La costru­
zione di un sistema di riferimento relativistico è di fondamentale
importanza per la teoria, perciò porremo V attenzione su questo a-
spetto.
§ 2*2» Sistema di riferimento
relativistico
Nella costruzione di un sistema di riferimento relativistico, così
come nella costruzione dell5intera teoria, si assumono validi entram­
bi i postulati di Einstein. Inoltre, si assume la velocità della luce
nel vuoto come velocità limite della trasmissione dei segnali. L ’ ul-

36
tinta affermazione non è contenuta nei postulati di Einstein. Come
vedremo in seguito, però, essa deve essere inevitabilmente incorpora­
ta nella teoria se si vuole tener conto del principio di causalità
(vedi § 3.4).
Nel § 1.1 abbiamo parlato in dettaglio di come si costruisce un
sistema di riferimento in meccanica classica. Abbiamo detto che
era sufficiente avere un orologio in ogni riferimento, in quanto ve­
niva assunta la possibilità di usare segnali infinitamente veloci.
Ma nella TRR è esplicitamente prevista una velocità limite del se­
gnale e, se le velocità in questione diventano vicine a quella limite,
è sconveniente e addirittura impossibile usare un solo orologio. Ma
sono proprio queste velocità cbe interessano la teoria della relativi­
tà.
Quindi, bisogna aggiungere una serie di orologi al sistema di
coordinate (costruito esattamente come descritto nel § 1.1). In prin­
cipio, la T RR comporta cbe gli orologi siano collocati in ogni punto
dello spazio. Questo non è in pratica necessario, ma come questione
di principio deve esserci un orologio in ogni punto dove è registrato
Raccadere di un evento. Tutti gli orologi di un sistema di riferimento
sono in quiete rispetto ad esso. Si assume nella TRR cbe si abbiano
a disposizione tutti gli orologi identici di cui si ha bisogno. Questa
ipotesi è facilmente realizzabile al giorno d’ oggi. Secondo la mecca­
nica quantistica tutte le microparticelle della stessa specie sono
identiche. In particolare le frequenze di oscillazione caratteristiche
degli atomi della stessa specie coincidono esattamente. Ponendo
come orologi gli atomi stessi e come campione di tempo i periodi
delle oscillazioni caratteristiche, abbiamo a disposizione un numero
sufficiente degli orologi richiesti.
Le lunghezze campione possono essere considerate nello stesso
modo. La lunghezza d ’ onda di una radiazione caratteristica di un
dato atomo può essere scelta adeguatamente come lunghezza unita­
ria. Già prima dell’ avvento della meccanica quantistica si pensava
di utilizzare come lunghezza campione la radiazione eli un dato
atomo: proprio così agli inizi del X X secolo è stata immortalata
da Michelson la lunghezza del metro.
Quando consideriamo due SRI in moto Tuno rispetto all’ altro,
la lunghezza campione e gli orologi di ciascun riferimento sono in
quiete soltanto rispetto al « proprio » sistema di riferimento. E
possibile pensare di avere identiche lunghezze campione ed orologi
in differenti SRI, se questi orologi e lunghezze sono soltanto un ri­
ferimento? In certa letteratura si può trovare un ragionamento che
lunghezze campione ed orologi si possono trasferire da un SRI al­
l ’ altro. Non ci sono dubbi che non si debba fare così. Nel trasferi­
mento dei campioni di lunghezze e degli orologi da un SRI all’ altro
si impartisce loro un’ accelerazione. Secondo la teoria, l ’ accelerazio­
ne varia i campioni di lunghezze e il passare del tempo. Vediamo
alcuni esempi immediati: lasciate cadere un orologio od un righello
sul pavimento. L ’ orologio si può fermare e il righello si rompe. Anche

37
un orologio atomico si rompe quando l ’ atomo viene distrutto. Tutto
ciò è l ’effetto dell’ accelerazione.
Ma per ottenere i medesimi campioni di tempo e di lunghezze in
differenti SRI, non c ’ è bisogno di trasferire nulla da un riferimento
all’ altro. È sufficiente prendere una sostanza pura in ciascun siste­
ma di riferimento e la sua radiazione ci permetterà di definire i
campioni cercati.
Bisogna sottolineare quanto sia importante avere in ogni SRI
campioni di lunghezza e di tempo che siano realmente identici a
quelli degli altri sistemi di riferimento. Infatti, il principio di
relatività e l ’equivalenza di tutti i SRI insieme con l ’ identità dei
campioni di tempo e di lunghezze rendono completa l ’ identità di
questi sistemi di riferimento.
In questo modo, ogni SRI ha un adeguato numero di orologi.
L ’istante del verificarsi di un evento in un dato punto è la lettura
di un orologio posto nel punto dove accade l ’evento nell’ istante in
cui accade. Se due eventi accadono in punti differenti dello spazio
e gli orologi in questi punti registrano lo stesso tempo per gli eventi
vuol dire che essi sono simultanei. Ma ovviamente il sincronismo
degli eventi che accadono in punti differenti dello spazio dipende
da come è fatta la lettura iniziale del tempo di questi orologi (sup­
ponendo che lo scandire del tempo sia identico). Quindi la determi­
nazione del sincronismo degli eventi e l ’ aggiustamento del tempo di
lettura iniziale per tutti gli orologi di un dato SRI (la sincronizza­
zione degli orologi) sono la stessa cosa. Bisogna sottolineare che la
sincronizzazione degli orologi (ovvero la determinazione del sincro­
nismo degli eventi) può essere compiuta in modi diversi. Verrà spie­
gato in seguito il vantaggio della sincronizzazione suggerita da Ein­
stein. Ancora va detto che il sincronismo degli eventi è fissato e la
sua determinazione può essere fatta non in un unico modo.
Mostriamo un esempio di come sia importante il modo con cui
determinare il sincronismo degli eventi. Come si trova la velocità
di una particella? Poniamo che la particella si muova lungo l ’ asse x.
Per avere la sua velocità, bisogna conoscere la posizione xx al tempo
h e la posizione x 2 al tempo t2. Supponendo il moto uniforme, la
velocità è uguale a (x2 — xl)/(t2 — £x). Ma l ’ arrivo della particella
in x1 è registrato dall’ orologio posto in x l9 mentre l ’ arrivo in x 2 è
segnato dall’ orologio in x 2. Per la determinazione della velocità,
bisogna assicurarsi che l ’ orologio in x 2 segni, all’istante t±ì lo stesso
tempo dell’ orologio in x1. Solo in questo caso avrebbe senso la stima
di velocità. Ma questo implica proprio che i due orologi siano sin­
cronizzati.
Chiarito che sincronizzazione degli orologi e determinazione
del sincronismo sono la stessa cosa, passiamo alla procedura per
la sincronizzazione di un orologio all’ interno di un SRI. La prima
cosa che viene in mente è di raccogliere tutti gli orologi in un punto,
verificarli e poi riportarli alle loro posizioni iniziali. Ma, seguendo
Einstein, dobbiamo rifiutare questo modo di procedere perché ogni

38
spostamento degli orologi comporta un’ accelerazione degli orologi
stessi, ed ogni accelerazione influenza lo scandire dell’ orologio.
Quindi è meglio prima collocare gli orologi al loro posto e poi ve­
rificarli 1.
Come si possono verificare, ovvero sincronizzare, gli orologi
disseminati in vari punti dello spazio? Poniamo un orologio, che
chiameremo di riferimento, nell’ origine delle coordinate di un dato
SRI (naturalmente questo orologio non differisce minimamente
da tutti gli altri). Si può mandare un segnale da questo orologio
di riferimento ad un altro del SRI. Si assume che la distanza fra
l ’ origine e gli orologi sia nota (nessun orologio viene usato per de­
terminare queste distanze !). Conoscendole velocità di trasmissione
del segnale, si può determinare il tempo che il segnale impiega ad
andare dall’ orologio di riferimento a ciascuno degli orologi del SRI.
Se il segnale parte dall’ orologio di riferimento a t —= 0, un orologio
sincronizzato deve segnare proprio quel tempo di propagazione nel­
l ’ istante in cui il segnale lo raggiunge. Sebbene si possa usare qual­
siasi segnale, è più conveniente scegliere un segnale luminoso nel
vuoto, in quanto esso si propaga alla stessa velocità in tutti i SRI.
L ’utilizzazione di un segnale di luce nel vuoto per la sincronizza­
zione è un ulteriore fattore che assicura la completa equivalenza di
tutti i SRI.
Quindi, un « agente » per a sincronizzazione è un raggio di lu­
ce. Descriviamo ora la procedura della sincronizzazione secondo Ein­
stein (in un dato SRI).
1. Gli orologi vanno posti nei rispettivi punti e messi in fun­
zione. Le coordinate dei punti in cui sono posti gli orologi sono note,
così come le distanze tra ciascun orologio e quello di riferimento
(posto nell’ origine delle coordinate).
2. Ad un istante arbitrario tx un segnale luminoso viene in­
viato dall’ orologio di riferimento all’ orologio da sincronizzare. Il
segnale viaggia nel vuoto lungo il cammino stabilito ed il suo arrivo
è registrato da un osservatore o da un dispositivo.
3a. Il quadrante dell’ orologio deve segnare, al momento del­
l ’ arrivo del segnale, il tempo t = tx -f- rie, essendo r la distanza
dall’ orologio di riferimento. Così si è scelta la lettura « iniziale »
dell’ orologio, l ’ orologio è « verificato » rispetto a quello di riferi­
mento.
Si può usare un metodo equivalente.
3b. Si pone uno specchio in ogni punto dove è sistemato un oro­
logio in modo da riflettere la luce sulla sua sorgente. Se l ’ orologio
di riferimento registra il ritorno del segnale all’ istante t2, Listante
registrato dall’ orologio vicino allo specchio deve essere uguale a
t = t± + (h +
1 Esiste una voluminosa letteratura per « illustrare » che un trasporto
infinitamente lento degli orologi non influenza il loro battere. È certamente
plausibile in termini fisici. Ma visto che la teoria della relatività tratta velocità
e distanze relativistiche, una tale procedura è priva d’ interesse.

39
| L ’ultima tecnica di sincronizzazione ha un punto delicato. Usan­
do la procedura Sa si presume nota la velocità della luce c. Ma ab­
biamo già visto che due orologi sincronizzati servono a determinare
la velocità del moto in una direzione. D ’ altro canto, la velocità della
luce si determina normalmente dal moto di un fascio lungo un per­
corso chiuso. In particolare, in presenza di un solo orologio, la
velocità della luce si può trovare mediante riflessione da uno spec­
chio. In questo caso bisogna usare la procedura 3b e conoscere la
distanza fra l ’ orologio di riferimento e lo specchio. Se questa distan­
za è uguale ad r, allora c = 2r/(t2 — t,). In ogni caso, se la velocità
della luce che si propaga « in avanti» non è uguale a quella che
« torna indietro », non possiamo stabilire nulla. È impossibile ac­
certarlo sperimentalmente perché i nostri orologi sono sincronizzati
per dare il valore c alla velocità della luce. Comunque, la teoria
della relatività parte dall’ assunzione che la velocità della luce nel
vuoto è la stessa in tutte le direzioni; inoltre, la totalità dei dati
sperimentali non contraddice questo punto né le conseguenze della
teoria.
Ora noi abbiamo un sistema di riferimento relativistico, un si­
stema di coordinate (con assi rigidi) ed orologi sincronizzati rigida­
mente connessi al sistema. Questi orologi in un dato SRI saranno
indicati come « insieme » di orologi. La procedura di sincronizzazio­
ne, secondo Einstein, sarà tale da potersi utilizzare nello stesso modo
in ogni SRI.
Secondo la regola di sincronizzazione adottala, il sincronismo
di eventi può essere determinato come segue. Supponiamo che due
eventi sì verifichino in due punti ugualmente distanti da un terzo.
Se all’ istante in cui avvengono i due eventi vengono inviati dei
segnali luminosi dai due punti al terzo, gii eventi sono considerati
simultanei se entrambi i segnali raggiungono il terzo punto allo
stesso istante.
Ovviamente, un moto accelerato dei corpi può essere trattato
nell3ambito del SRL mentre non si può considerare un moto acce­
lerato dei sistemi di riferimento (rispetto a inerziali). Poiché i campio­
ni di lunghezza e gli orologi sono rigidamente fissati al loro SRI,
è ovvio che tali campioni e tali orologi non devono essere accelerati.
D ’ altronde, io studio di un’ accelerazione sni campioni di lunghezze
e sugli orologi ci farebbe entrare nello specifico della loro struttura
e priverebbe la teoria del suo carattere universale*

§ 2*3* Conseguenze dirette


dei postulati di Einstein
(alcuni esperimenti ideali)
Le due dirette conseguenze dei postulati di Einstein, « relatività
delle lunghezze campione » e « relatività degli intervalli di tempo
tra eventi », si possono ottenere direttamente dai postulati stessi.
Molto spesso si ottengono da trasformazioni delle coordinate e del

40
tempo di un evento, compatibili con i postulati di Einstein chiama­
te trasformazioni di Lorentz. Comunque questo metodo (ne facciamo*
uso nel § 3.2) non è un passo obbligatorio. Ora illustreremo alcuni
« esperimenti ideali » dai quali trarremo le necessarie conclusioni.
Gli esperimenti ideali hanno un ruolo importante nelle conclusioni-
delia TR R ; essi rappresentano esperimenti immaginari che non sono
necessariamente condotti in pratica. Infatti essi sono ragionamenti
che permettono, date certe premesse \ di analizzarne le conseguenze.
Si passa alla descrizione di alcuni esperimenti ideali i cui risultati
verranno riottenuti in seguito, quando discuteremo le conseguenze
delle trasformazioni di Lorentza
Incominciamo con un esperimento molto semplice che illustra
qualitativamente la relatività del sincronismo, se il secondo postu­
lato di Einstein è soddisfatto; in seguito riotterremo lo stesso risul­
tato con un altro metodo. L ’esperimento è condotto nel treno di
Einstein; questo termine viene dato ad ogni treno in moto rettili­
neo ed uniforme ma (è desiderabile!) con velocità relativistica. Nell’ e-
sperimenlo ideale si può assumere anche questa ultima richiesta. È
facile trovare il punto di mezzo del treno (questo si fa nel sistema di
riferimento del treno e non presenta difficoltà). L ’osservatore 1
è posto nel mezzo del treno e l ’ osservatore 2 alla stazione. Dalie-
estremità del treno-che sono egualmente distanti dall’ osservatore 1
verso di lui sono inviati segnali luminosi. L ’ esperimento ideale è
fatto in modo che i segnali che viaggiano dalle estremità del treno
arrivino all’ osservatore 1 proprio nel momento in cui questo raggiun­
ge l ’ osservatore 2 (negli esperimenti ideali non importa come questo
si realizzi in pratica). Sono essenziali per noi le conclusioni che i
due osservatori traggono dal simultaneo arrivo dei segnali nel punto-
centrale del treno.
Osservatore 1. I segnali luminosi devono percorrere un’ eguale*
distanza per raggiungermi. Quindi sono inviati simultaneamente.
Osservatore 2 . I segnali luminosi mi raggiungono quando la metà
del treno mi passa vicino, di conseguenza, essi sono inviati qualche
tempo prima. Ma « prima » la testa del treno era più vicina della
coda. Quindi, il segnale dalla coda è stato inviato leggermente in
anticipo per poter giungere a me contemporaneamente al segnalo
proveniente dalla testa.
È evidente da questo semplice ragionamento che dne eventi si­
multanei in un sistema di riferimento (il riferimento del treno nel
nostro esempio) non lo sono affatto in un altro (nel nostro caso il
riferimento « Terra »).
Tutti gli esperimenti ideali successivi saranno di natura quanti­
tativa. In tutti verranno considerati due SRI detti K e K' la cui

1 Non si deve pensare che gli « esperimenti ideali» siano caratteristici solo-
delia teoria della relatività. Una serie di « esperimenti ideali » rivolti alla
meccanica quantistica si trova nella discussione di N. Bohr e A. Einstein, y<t>K
(Successi delle scienze fisiche) 66, 571 (1958).

41
velocità relativa è diretta lungo l ’ asse comune x , x (vedi fig. 1 .2 ).
Si assume che gli assi cartesiani dei due riferimenti coincidano all’ i-
;stante iniziale t = V = 0.
a)
direzione perpendicolare a quella del moto relativo dei due S R I. Pren­
diamo due righelli della stessa lunghezza in ciascun sistema di rife­
rimento K e K ' e poniamoli lungo i corrispondenti assi y e y r. I
righelli BC e B 'C r sono mostrati
nella fig. 2.1. A e A ' sono i punti
medi dei righelli in ciascun riferi­
mento. Supponiamo che i righelli
si muovano in modo che, quando
gli assi y e y' coincidono, coinci­
dono anche i punti A e A '. I rife­
rimenti K e K ' sono geometrica­
mente identici all’ istante t = t' =
= 0. La questione è: quale lun­
ghezza per il righello B 'C 'm isurerà
un osservatore nel riferimento K ,
Fig. 2.1 L’ « esperimento ideale » che
'permette di stabilire che la lunghezza e quale invece per il righello BC ,
dei righelli, orientati perpendicolar­ quando la misura viene compiuta
mente alla direzione di moto relativo dall’ osservatore del riferimento
dei sistemi di coordinate, non varia K'? Gli osservatori devono regi­
al misurarli in un qualsiasi SRI.
strare la posizione dei due estremi
dei righelli simultaneamente nei
.rispettivi sistemi di riferimento. P e rii caso considerato qui è conve­
niente stabilire il sincronismo come segue. Quando i punti C' e B' si
trovano sull’ asse y, da questi punti si mandano due segnali luminosi
al punto A '. Nel riferimento K ' i segmenti A 'C ' e B fA ' sono uguali,
la velocità della luce c è la stessa, così entrambi i segnali raggiunge­
ranno il punto A ' simultaneamente. Quindi, nel riferimento K\
i punti C e B' attraverseranno l ’ asse y' simultaneamente. Esattamen­
te allo stesso modo i punti C e B attraverseranno simultaneamente
l ’ asse y' nel riferimento K ' , come visto nel riferimento K. A ll’ i­
stante t = V = 0 (quando gli assi y e y' coincidono) misuriamo le
lunghezze del righello B 'C r nel riferimento K e del righello BC nel
riferimento K ' . In questo caso tutti e quattro i punti C, C", B , B\
•si trovano sull’ asse comune y, y r e gli osservatori nei due sistemi
possono comparare i loro risultati. Se risulta che CB > C B ' o vice­
versa C'B' > CB, si può mettere in luce la differenza fra il riferi­
mento K e K ', il che è inammissibile in base all’ assunto iniziale
circa l ’equivalenza di tutti i sistemi di riferimento inerziali. Per­
ciò gli osservatori dei riferimenti K e K' possono soltanto affermare
che CB = C 'B '.
Di conseguenza, le lunghezze (e le unità di lunghezza) orientate
perpendicolarmente alla direzione del moto relativo rimangono co-
: stanti in ogni SRI. Ma questo implica che le coordinate dei punti
lungo gli assi perpendicolari al moto rimangono anche esse invariate.

42
Così, proprio come nelle trasformazioni di Galileo si ha
y f = y, z' = Z- ( 2 .1 )
b)
si osservano i ritmi di orologi nei due riferimenti K e K ' in moto
l ’ uno rispetto all’ altro, si possono confrontare le letture di un oro­
logio in un riferimento con quelle di diversi orologi nell’ altro rife­
rimento, in quanto due orologi appartenenti a diversi sistemi di
riferimento si trovano soltanto una volta nello stesso punto dello
spazio. In uno dei riferimenti ci devono essere almeno due orologi

a)

Fig. 2.2. L’ « esperimento ideale » da cui segue che l ’ intervallo di tempo proprio
tra due eventi è sempre minore dell’ intervallo di tempo tra gli stessi eventi
registrati da due orologi in qualsiasi SRI (esperimento « dell’ orologio luce »).
a) Per il calcolo dell’ intervallo di tempo proprio tra la partenza e l ’ arrivo del
segnale luminoso all’ origine O' del sistema di coordinate, b) Per il calcolo del­
l ’ intervallo di tempo tra gli stessi eventi nel riferimento K rispetto al quale la
sorgente di luce e lo specchio sono in moto.

supposti sincronizzati, come descritto nel § 2.2 di questo capitolo.


Per chiarezza confronteremo un orologio del riferimento K ' con due
orologi del riferimento K.
Poniamo un orologio ed una sorgente luminosa all’ origine 0 '
del riferimento K ' (fig. 2.2a). Uno specchio viene posto sull’ asse
z alla distanza z'0 dalla sorgente di luce (e dall’ orologio) in direzione
perpendicolare a quella del moto relativo. Viene trasmesso un se­
gnale luminoso dalla sorgente allo specchio, da cui, per riflessione,
•esso torna indietro al punto O' nell’ intervallo di tempo ÀP = 2z'Jc.
Sia la sorgente di luce che lo specchio sono a riposo nel riferimento
K' e il segnale va « avanti » e « indietro » lungo una linea retta
(l’ asse z ) .
Vediamo ora la propagazione dello stesso segnalo nel riferimento
K rispetto al quale lo specchio e la sorgente insieme con il riferimento
K' si muovono verso destra a velocità V. Benché il segnale venga
inviato dalle due origini coincidenti O ed G\ la riflessione della luce
dallo specchio avverrà in qualche altro punto x1 del riferimento K
e la ricezione del segnale riflesso nel punto x 2 dell’ asse x. In questo
modo il cammino del segnale nel riferimento K traccia i due lati

43
di un triangolo equilatero. Dato che il cammino della luce nel ri­
ferimento K è maggiore di quello nel riferimento iD, ci si aspetta che
Fintervallo di tempo At tra la partenza e F arrivo del segnale, mi­
surato nel sistema K 1 sia maggiore di At'. Infatti, Fosservatore del
riferimento K accerta che i due eventi, cioè remissione della luce
dal punto 0 ' ed il suo ritorno in 0 \ avvengono in due distinti punti
dello spazio 0 e B (fig. 2.2b). LÙntervallo di tempo Ai fra i due even­
ti nel riferimento K sarà misurato in questo caso da due orologi
separati dalla distanza VAt lungo la direzione di moto. La velocità
della luce è c in tutti i sistemi di riferimento; quindi, dopo aver di­
viso la lunghezza dei due lati del triangolo OAB per la velocità
della luce c, otteniamo per Dintervallo Ai F espressione implicita

A* = 2 ) / z l + ^ y j c »

Ricavando At dalFultima equazione otteniamo

At = -^ 2. . J1
y A - ze2i
U T 1/2
dove R = ( 1
ù2 /
Poiché z0 z'0, allora
At'i At'ì
At: ■TAt', (2 . 2)
Vz> V B2
v s
dove si è posto R = Vie. Dato che i due eventi avvengono nello
stesso punto nel riferimento K \ essi sono registrati dallo stesso oro­
logio. Un intervallo di tempo fra eventi registrato dallo stesso orolo­
gio (il che implica che gli eventi avvengono nello stesso punto dello
spazio) viene detto intervallo di tempo proprio tra questi eventi.
Ovviamente, un intervallo il cui inizio e la cui fine sono registrati
in punti diversi del riferimento e, di conseguenza, con diversi oro­
logi non sarà un intervallo proprio. Nell’ esempio già considerato
Fintervallo di tempo proprio è uguale a A t'. Si è visto dall’equazione
(2 .2 ) che un intervallo di tempo proprio fra eventi è il più breve
quando viene misurato nel sistema di riferimento in cui gii eventi
avvengono nello stesso punto dello spazio. Come vedremo nel § 3.4,
si possono indicare le condizioni, per cui esiste un tale sistema di
riferimento, in cui due eventi dati avvengono nello stesso punto.
Quindi abbiamo raggiunto la più importante conclusione: Finterval­
lo di tempo tra due eventi è una grandezza relativa; il suo valore
dipende dalla scelta del sistema di riferimento. Niente del genere
era noto in fisica classica, dove gli intervalli di tempo avevano carat­
tere assoluto.
Questo esempio illustra come perfino la lettura del tempo sia
differente in diversi riferimenti. Quando le origini O ed 0 ' coincidono*

44
allora gli orologi del riferimento K e K ’ posti in quei punti registrano
gli istanti t1 0 e £' = 0 (secondo le nostre condizioni iniziali).
Quando la luce e tornata ad 0\ l ’ orologio del riferimento K ' ha
registrato il tempo t\ = t[ + A f . Ma allo stesso istante nello stesso
punto si trova l ’ orologio del sistema K (non quello che era in 0 ,
ma un altro sincronizzato con esso). In questo caso Porologio regi­
stra t2 = t± At. Gome abbiamo già stabilito At At\ cioè le
letture degli orologi sono diverse. Questo significa che gli istanti
dell’ avvenire degli eventi sono registrati in modo diverso in diffe­
renti sistemi di riferimento. È da notare che questo calcolo della
lettura deir orologio nel riferimento K corrisponde pienamente alla
regola di sincronizzazione di un orologio secondo Einstein, descritta
nel .. § 2 .2 .
c)
direzione della velocità relativa. Un sistema di riferimento, in cui il
corpo è a riposo, è per questo corpo un sistema di riferimento pro­
prio. È consuetudine designare questo riferimento con K°. Supponia­
mo che il righello posto lungo basse x° sia a riposo nel riferimento
scelto. Denotiamo la lunghezza del righello in questo riferimento
(la lunghezza propria del righello) con Z0. Per trovare la lunghezza
del righello in un altro sistema di riferimento, bisogna determinare
simultaneamente (in tale riferimento) le coordinate degli estremi
del righello. La simultaneità di misura non è importante soltanto
nel riferimento K° in cui il righello è a riposo. Dato che nella vita
quotidiana viene misurata la lunghezza propria degli oggetti, la
procedura è semplice e viene effettuata mediante la trasposizione
diretta della lunghezza campione.
Se si tratta di sistemi di riferimento in moto l ’uno rispetto all’ al­
tro, il righello è a riposo in un unico sistema di riferimento, e ri­
spetto a tutti gli altri riferimenti esso si muove. E la diretta tra­
sposizione della misura unitaria diventa impossibile. Facciamo uso
del metodo della misura di lunghezza, adatto anche per misurare
la lunghezza di un righello in moto rispetto al riferimento.
Poniamo l ’ estremità sinistra del righello nell’ origine O0, dove
è posta anche una sorgente di luce I. A ll’estremità destra del ri­
ghello è posto uno specchio S perpendicolare agli assi x e x 0 (fig. 2.3a).
Consideriamo ora due eventi. Primo evento: un segnale luminoso
è inviato dalla sorgente / verso lo specchio lungo l ’ asse x 0 all’ istante
t = t0 = 0. Secondo-evento: il segnale luminoso riflesso dallo spec­
chio S torna indietro verso l ’estremità sinistra nel punto O0. Entram­
bi gli eventi vengono registrati nel punto O0 da un orologio. In
questo modo l ’ intervallo di tempo fra gli eventi è Pintervallo di
tempo proprio At0 che può essere scritto nella forma

(2-3)

Gli stessi due eventi sembrano abbastanza diversi ad un osser­


vatore nel sistema K (fig. 2.36). A ll’ istante dell’emissione del segna­

45
le la sorgente / del riferimento K si trova in 0 e lo specchio S è nel pun­
to Sv A ll’ istante della riflessione lo specchio si è spostato nel punto
S 2 e la sorgente I nel punto I 1. A ll’ istante dell’ arrivo del segnale,
riflesso dallo specchio S, all’estremità sinistra del righello la sorgen­
te si trova nel punto / 2. Gli istanti di tempo corrispondenti al pri­
mo e al secondo evento sono registrati nel riferimento K in punti
diversi e, di conseguenza, con diversi orologi. Questo implica che
l ’ intervallo At tra questi due eventi si può esprimere in termini di
At0 in accordo con la (2.2). Nel propagarsi della luce verso destra,

Fig- 2.3. L’ « esperimento ideale » che mette in risalto la « contrazione » della


lunghezza del righello se questa lunghezza viene misurata in un riferimento'
rispetto al quale il righello è in moto uniforme e rettilineo. Il righello è orien­
tato parallelamente alla velocità del suo moto, a) Per il calcolo della lunghezza
del righello a riposo nel riferimento K° (lunghezza propria del righello), b) Per il
calcolo della lunghezza del righello nel riferimento rispetto al quale il righello
si muove con velocità V.

la velocità con cui essa rincorre lo specchio S è uguale a c — V


(la composizione classica delle velocità in un dato SRI), nel propagar­
si verso sinistra, la luce va incontro allo specchio alla velocità c A V .
Indicando nel riferimento K la lunghezza del righello (per ora in­
cognita) con Z, si ottiene che il tempo in cui la luce va dalla sorgente'
allo specchio ò tx = U (c — F), e il tempo in cui la luce va dallo spec­
chio alla sorgente vale t2 = li (c - f V). Quindi l ’ intervallo tra l ’ in­
vio e la ricezione del segnale luminoso nel riferimento K è

At — ti + l2- c_ y + c + y - c c ‘

Ricordando che At0 = ] / 1 — B2ÀZ e considerando la (2.3),.


dall’ultima equazione si ottiene
l= ? <r=LB2) At =

L ’equazione (2.4) dà la lunghezza di un righello in un sistema


di riferimento inerziale qualsiasi. Nel riferimento in cui il righello
è a riposo (B = 0) la sua lunghezza è Z0, da cui siamo partiti nel
nostro ragionamento. La formula (2.4) è asimmetrica rispetto alle
lunghezze Z e Z0, in quanto essa collega la lunghezza propria del rh

46
girello Z0 (nel riferimento K°) alla lunghezza impropria l in un altro-
riferimento K.
Così abbiamo dedotto direttamente dai postulati di Einstein la.
relatività degli intervalli temporali fra gli eventi e la relatività delle
lunghezze (dei righelli) delle scale. Entrambe queste grandezze in
meccanica classica erano equivalenti in ogni sistema di riferimento.
Questi risultati sono inerenti alla teoria della relatività e richiedono
un1approfondii a discussione. Comunque, rimandiamo la discussione-
dei risultati ottenuti fino ai §§ 3.2, 3.3., poiché questi risultati,
data la loro importanza, saranno ottenuti ancora con metodi diversi,,
che evidenzieranno alcune nuove proprietà, essenziali per E inter­
pretazione delle equazioni (2 .2 ) e (2.4).

§ 2.4. Relatività della


sincronizzazione di orologi di due
sistemi di riferimento inerziali.
Derivazione diretta
delle trasformazioni di Lorentz
Finora abbiamo considerato la sincronizzazione di un insieme dii
orologi appartenenti ad un dato sistema di riferimento. Ma tutti
i sistemi di riferimento sono equivalenti ed ogni evento può essere-
registrato da un osservatore da qualsiasi sistema di riferimento..
Un osservatore registra le coordinate di un evento nel proprio re­
ticolo eli coordinate. L ’ insieme di orologi in ogni riferimento iner­
ziale registra il tempo dell’ avvenire dell’ evento mediante orologi,
posti nel punto in cui l ’ evento accade e nell’ istante dell’ avvenimen­
to. Parlando per immagini, tutto lo spazio è riempito di orologi in
movimento appartenenti a diversi sistemi di riferimento ed un
flash istantaneo di luce, in un dato punto dello spazio, illuminando'
i quadranti di tutti gli orologi in questo punto, permette di determi­
nare il tempo dell’ avvenire dell’ evento (del flash) in tutti i sistemi
di riferimento i cui orologi si trovano in quel punto al momento del
flash. Per vedere cosa avviene è sufficiente considerare due riferi­
menti K e K r.
La questione e cosa mostreranno gli orologi dei due riferimenti.
K e / ( ', quando essi si trovano in un punto. Ovviamente, se vogliamo
confrontare la lettura degli orologi di diversi riferimenti (si dovrà,
ricordare che tutti gli orologi di uno stesso riferimento sono sincro­
nizzati), dobbiamo stabilire una determinata relazione tra le letture
dei corrispondenti insiemi di orologi. Senza tale relazione il con­
fronto è privo di significato.
Ne segue che bisogna sincronizzare soltanto due orologi, uno
del riferimento K e l ’ altro del riferimento K ' , che si trovano insieme
in un dato istante. Una volta sincronizzati questi due orologi, in
virtù della sincronizzazione in ogni sistema, abbiamo sincronizzato
le letture di tutti i restanti orologi in ciascun riferimento. Allora
risulta che gli orologi dei riferimenti K e K' mostrano tempi diversi.'

4?
in tutti gli altri punti dello spazio. Questo è un risultato molto im­
portante: l ’ orologio sincronizzato in un sistema di riferimento è
non sincronizzato in un altro sistema di riferimento inerziale; In
altre parole, se nel riferimento K ' fissiamo simultaneamente le let­
ture di tutti gli orologi del riferimento K , si vedrà che gli orologi
nel riferimento K segnano un tempo diverso. Ora otteniamo le equa­
zioni richieste.
Normalmente una relazione fra le indicazioni degli insiemi di
orologi sincronizzati nei riferimenti K e K* si stabilisce come segue.
Quando le origini dei riferimenti K e K f coincidono, gli orologi di
K e K ' che sono collocati nell’ origine comune segnano t = 0 e t! = 0 .
Come vedremo più avanti, non segue da ciò che gli orologi dei rife­
rimenti K e K r segnano lo stesso tempo in tutti gli altri punti dello
spazio.
Abbiamo bisogno di una formula della trasformazione delle coor­
dinate dei punti delio spazio nella transizione dal riferimento K
■a K '. Quando le origini delle coordinate coincidono, il retìcolo delle
coordinate del riferimento K ! è contratto di 1 /F volte rispetto al
riferimento K (le unità di scala proprie sono le stesse nei riferimenti
K e K '). Di conseguenza, all’ istante iniziale le coordinate x ed x r
sono legate dal rapporto (vedi la (2.4))
1
/ 1 — B2 )■
D all 1istante t il reticolo delle coordinate del riferimento K s si spo­
sterà rigidamente delia distanza Ft, così avremo in queiristante
x = x f/V + Vt, Quindi, se la coordinata del punto nel riferimento
K è uguale a x all’ istante £, la sua coordinata x f nel riferimento K*
sarà uguale a
x 9 (.X, t) =■ r \(x — Vt). (2.5)
Il reticolo delle fcoordinate non varia lungo gli assi y e k (§ 2,3)?
•e ^perciò
y' = y,P; = z-
Ora siamo interessati alla lettura deH’ orologio del riferimento K f
posto nel punto x all’ istante t; designarne questa lettura con tr (x, t).
Questa grandezza si può definire in molti metodi, ma ora lo otter­
remo usando una procedura di sincronizzazione dell’ orologio.
Facciamo ciò nel modo seguente: quando le origini delle coordinate .
0 ed 0 ! coincidono e le letture dei due orologi (uno da K e l ’ altro
da K f) sono uguali a zero, si manda un segnale luminoso lungo l ’ asse
comune x nel verso crescente delle x e x\ Consideriamo poi ristante
t dell’ orologio nel riferimento K . In questo istante il segnale è arri­
vato al punto x2 — et del riferimento K , L ’ arrivo del segnale al pun­
to x 2 n ell’istante t rappresenta l ’evento le cui coordinate in K sa­
ranno (x2ì t). Nel sistema K r lo stesso evento avrà le coordinate
(x 2, i[), in accordo col secondo postulato x'z = et'r Ma l ’ equazione

48
(2,5) è valida per tutti gli eventi, perciò, sostituendo x 2 e x* in en­
trambi i membri e dividendo per c, otteniamo
- T t ( l — B). (2.6)
Ciò significa che un orologio dell’ insieme di orologi del riferimento
K ! segna al punto x 2 il tempo che non coincide affatto con il
tempo t segnato allo stesso punto dall’ orologio del riferimento A.
Abbiamo così due diverse letture di tempo, ciò è già stato discusso
al § 2,3.
Ora possiamo cercare la lettura eli un ulteriore orologio uei ri­
ferimento A ' all’ istante t. A ll’ istante t l ’ origine O' si troverà nel

Kr
ìV | |Istante i
i
t-0 A t r t /r t'2=r(i-$)t
---(J---------------------3^
j Ax=c(1-B)t |

t*-0 X f* V t X f C t X

Fig. 2.4o La non sincronia degli orologi del riferimento K' in termini del riferì-
mento K . Quando le origini 0 ed O' coincidono, i due orologi dei riferimenti K
e /£', che si trovano in quel punto, sono azzerati in modo da segnare t = 0 e
t' — 0. All’istante t (secondo l ’ orologio di K) si possono trovare le letture
dell’orologio del riferimento K f nei punti x1 — Vt e x2 = et.

punto x L = Vt; l ’ orologio di riferimento di A 1 sarà anch’esso spo»


stato nel nuovo punto. Durante lo spostamento esso registrerà l ’ in­
tervallo proprio Atf = £' — 0 = D ’ altra parte l ’intervallo di
tempo tra l ’ istante in cui Or coincide con 0 , e quello in cui Or si
trova nel punto xx è uguale a At = t — 0 = t, se misurato con l ’ oro­
logio del riferimento K. In accordo con la (2.2)
t't^t/T. (2.7)
Così si giunge alla conclusione (fig. 2.4) che all’istante t (con
l ’ orologio di A , cioè simultaneamente nel riferimento A ) l ’ orologio
di A ', collocato in punti diversi del riferimento A , segna tempi di­
versi:
nel punto x2 - et £ '= T (1 — B) f,
nel punto x i Vt = tlY.

E questo a dispetto del fatto che tutti gli orologi dell’ insieme del
riferimento A ' sono stati sincronizzati nel loro riferimento. Ma
il calcolo mostra che tutti questi orologi sono nonsincronizzati nel
riferimento A . Abbiamo trovato che la non sincronia dipende da
quale punto del riferimento A si sceglie per il confronto. Troviamo
la differenza di lettura degli orologi del riferimento A ' nei punti

49
x 2 e x ±:
At' = *; - t r = PB£ (B - 1 ).
Questa differenza di lettura si accumula nella distanza Ax =
= z 2 — Xx = et (1 — B). Avendo supposto che la non sincronia
dipende linearmente dalla distanza lungo l ’ asse x ì si può determinare-
una non sincronia per unità di lunghezza:
At' _ _ -p _B
( 2 . 8>
dx 1 C8
Si vede dalla (2.8) che la non sincronia per unità di lunghezza
non dipende dalla scelta dell’istante £, ma è definita unicamente
dalla distanza fra gli orologi del
t ’(x, 0)% riferimento A ', calcolata nel si­
Corologia in Kr stema A ; otterremo per una coppia
va aranti t=0 arbitraria di punti

a -t'i= —r — (x2—xi).

x Come già detto, insiemi di


remane orologi sincronizzati nei riferi­
indietro menti A e A ' sono correlati l ’ un
l ’ altro imponendo agli orologi di
segnare zero al punto x± = 0
Fig. 2.5. Letture dell’orologio del
riferimento K' a ll’istante t ~ 0 (se­ all’istante in cui i sistemi di
condo l ’orologio di K) nei punti delle coordinate coincidono, cioè agli
coordinate x. orologi posti in quel punto ven­
gono associati i valori t = 0'
e t' = 0. Ponendo x 2 = x, otteniamo dall’ultima uguaglianza
t' (x, t = 0) = ■T — x. (2.9)
C
Si vede dalla (2.9) cosa segnerà l ’ orologio di|A' posto nel punto-
x all’istante t = 0 (secondo l ’ orologio di A ). La sua lettura è mostra­
ta schematicamente nella fig. 2.5. Un orologio del riferimento A r
va avanti rispetto ad un orologio di A se è posto alla sinistra dell’ ori­
gine, mentre va indietro quando è alla destra dell’ origine.
Non è difficile, a questo punto, vedere cosa segnerà un orologio-
di A ' all’ istante t se viene collocato al punto x. Trarremo vantaggio-
dal fatto che la differenza di letture dei due orologi del riferimento
A ' non dipende dall’ istante scelto t. L ’ orologio del riferimento-
A ', che era al punto x — Vt all’ istante t = 0 e, in accordo con la
(2.9), era indietro rispetto all’ orologio di riferimento della grandez­
za — T Ble (x — Fi), sarà al punto x a ll’istante t. Questo orologio
sarà sempre indietro rispetto a quello di riferimento per tutto il pe­
riodo. Ma all’ istante t l ’ orologio campione segnerà t' = t/T (vedi
la (2.4)), mentre l ’ orologio nel punto x segnerà

t ’ (x, t ) = j r - T ^ - ( x - V t ) = T(t-^(2.10)

50
Le equazioni (2.5), (2.6) e (2.10) costituiscono le trasformazioni
di Lorentz. Ovviamente, la derivazione della (2.10) può sembrare
laboriosa e anche superflua. Infatti, applicando il ragionamento che
ci ha condotto all’ equazione (2.5) per il passaggio dal riferimento
K' a K , otteniamo
x (x\ t') = T (x' + Vtr). (2 . 1 1 )
Risolvendo la (2.11) rispetto a f e sostituendo x secondo la
(2.5) otteniamo direttamente la (2.10):

Una volta mostrata la relatività della sincronizzazione degli


orologi, si è chiarito il significato fisico di una diversa lettura degli
orologi in diversi sistemi inerziali. Inoltre, la comprensione del-
L« asincronia dell’ orologio » permette di evitare molte questioni non
chiare. Per concludere, si noti che il punto, in cui coincidono le
letture degli orologi dei riferimenti K e K ' , si muove con continuità
lungo l ’ asse delle x positive alla velocità che può ricavarsi dall’equa­
zione (2 . 10 ) sostituendovi t = t':
x r —i (2. 12)
t ~ TB Cm

§ 2.5. Trasformazioni di Lorentz


come conseguenza dei postulati
di Einstein
Deriviamo le equazioni che definiscono le coordinate (.x ', y r, z\ tr)
di un evento nel riferimento K' partendo dalle coordinate (x, y, z, t)
dello stesso evento .nel riferimento K . Queste equazioni (per le
trasformazioni di coordinate dell’ evento) devono essere conformi ai
postulati di Einstein.
Dal fatto che spazio e tempo devono essere uniformi in tutti i
sistemi di riferimento segue che la relazione fra le coordinate di un
evento in due riferimenti inerziali deve essere lineare. Infatti, sup­
poniamo di cambiare l ’ origine delle coordinate e del tempo, cioè
effettuiamo la trasformazione x = x + x 0, y = y + y 03 z = z +
+ 0 t = 1 + t 0 . Se la relazione tra le coordinate è lineare nel
z j

riferimento K e K r, si ottiene per x\ ad esempio,


x r = axx + a2y + a3z -[- akt = axx - f a2y + a3z + akt +
+ (ai%0 + a2lf0 + a3Z0 + <Mo)>
dove au a2, &3 ed ak sono costanti. D all’ultima equazione si vede che
l ’ origine si è spostata nel riferimento K f, poiché l ’ espressione in
parentesi è la stessa per tutti i punti del riferimento K ' . Comunque*
un tale spostamento è inessenziale in virtù dell’ uniformità di spa­
zio e tempo in tutti i SRL

51
Ora introduciamo nelle equazioni di trasformazione un termine del
secondo ordine:

x' = btx2 -f - . . . = biX2+ 2bxxx0 + .. .

Allora il secondo termine nel terzo membro di questa equazione di­


penderà da x e dà luogo ad una distorsione o deformazione dello
spazio. Questo non può essere tollerato. Di conseguenza la trasfor­
mazione deve essere lineare.
. Faremo uso del sistema di riferimento rappresentato nella fig=
1.2: la velocità relativa dei riferimenti A e A ' è diretta lungo l ’ asse
comune x, x f con gli assi y e z rispettivamente paralleli agli assi
y* e z\ All'istante t = t* = 0 i sistemi di coordinate coincidono. La
velocità di K f rispetto a A è uguale a V. L ’ asse x risulta dall’ interse­
zione dei piani y = 0 e z = 0 ; perciò, se gli assix e x ' coincidono, dalla
condizione y = 0, z — 0 deve aversi anche y r = 0 e z' = 0 . Allora
la trasformazione delle variabili y e z avrà la forma seguente:
y' = A z + B y , z' = Cy + Dz

(qui A , B, C e B sono costanti). Poiché le rotazioni puramente spa­


ziali dei sistemi di coordinate sono inessenziali per la descrizione
di un fenomeno fisico, si può essere certi, mediante rotazione degli
assi y‘ e zf attorno ad x\ che il piano y = 0 si trasforma nel piano
if = 0 ecl il piano z = 0 nel piano z — 0. A. questo punto si può
porre if = By q z — Dz\ d’ altronde, dato che le direzioni y e z
sono equivalenti (lo spazio ò isotropo, e la velocità relativa del si­
stema di riferimento è diretta lungo l ’ asse x, x f) deve essere B = D .
Quindi,
if ■= D y, zf = D z.

Rimane da determinare il coefficiente B. Consideriamo un righello


unitario posto nel riferimento K lungo Passe y (le coordinate dei
suoi estremi sono yx = 0, y2 = t). Nel riferimento K ‘ esse sareb­
bero y[ = 0, y'2 = D, e la sua lunghezza sarebbe V — z/' — y[ = D .
Se prendiamo un righello unitario posto in A ' lungo l ’ asse y f (y[ = 0,
y 2 = i), le coordinate dei suoi estremi in A sarebbero = 0,
z/2 = 1 /D e la lunghezza sarebbe l = y 2 — = 1 /A .
Quindi, misurando un righello unitario del riferimento A ,
un osservatore del riferimento K r troverà la sua lunghezza uguale .a
A , mentre un osservatore del riferimento A che misura il righello
unitario del riferimento A ' trova la sua lunghezza pari a 1/Z). In
virtù dell’ equivalenza dei sistemi inerziali un simile risultato
è inammissibile a meno che D = 1. Quindi
y = y\ z = 2',
proprio come avevamo ottenuto dai postulati di Einstein (vedi
§ 2.3).

52
Ora deriviamo ie equazioni di trasformazione per le variabili
x e t. Poiché la trasformazione è lineare, allora
x = A 1±x + A ^ t -[- A 10, (■&}
e, viceversa,
X — A 21X -}~ A 22^ “f* A 21),
dove tutti i coefficienti A sono costanti. Dalle condizioni iniziali
si ha t = 0 e tf = 0 quando le origini 0 e Or coincidono. Quindi
A 10 = 0 e A 20 = 0- Osservando il punto O' possiamo dire che la sua
OUUlUliiUtU AkjC
7 UgUUIO riPequaz inno \/->\
/
otteniamo
0 - + ^-12^
conseguentemente, A 12/A u = —'F. Indicando 1 A 12 con Y\ possiamo
riscrivere l ’ equazione (*) nella forma (vedi § 2.4)
= r / (x — Vt), (2.13)
e con ragionamenti analoghi,
x = Y (x* + Vt'), (2.14)
Quindi il problema si riduce alla determinazione dei coefficienti
r e PC Data l ’uniformità del tempo e dello spazio e l ’isotropia dello
spazio, entrambi questi coefficienti possono dipendere soltanto dal
valore assoluto della velocità V.
È facile vedere che T = PC Infatti, supponiamo che nel riferi­
mento K una scala collocata lungo Passe x abbia la propria lunghezza
Z0. Collochiamo un suo estremo all’ origine del sistema di riferimen­
to, allora le coordinate dei suoi estremi saranno, rispettivamente,
x v = 0 e x2 = lQ. A ll’ istante t = t' — 0 (ricordiamo che in questo
istante i sistemi K e K ' coincidono geometricamente) in accordo con
la (2.14) x[ = 0 e x'2 — IJY. Di conseguenza, la lunghezza della
scala in termini di K ' è uguale a V = x\ — x[ = IJ PC Prendiamo
la seal a della stessa lunghezza, immobile nel riferimento e col­
locata lungo l ’ asse x. Allora le coordinate degli estremi saranno
x[ = 0 e x'2 = Z0. Ma in termini del riferimento K queste coordina­
te saranno = 0 e x 2 = IJY' all’ istante t = 0 come nella (2.13).
In conseguenza, la sua lunghezza è ugnale a I - i 2 — xi — Z0/T\
cioè la scalasi è contratta di P' volte. I riferimenti K e K ' sono
equivalenti, la loro velocità relativa è la stessa, perciò la contra­
zione deve essere identica e quindi T = P\
Cerchiamo di definire la grandezza P. La differenza tra il riferi­
mento K e K' sta solo nella loro velocità relativa, e Y deve dipen­
dere solo dal valore assoluto della velocità V . Utilizziamo ora il
postulato sull’ invarianza della velocità della luce nel vuoto in
tutti i SPJ. A ll’ istante t = t' = 0 (quando le origini O e 0 ' dei due

1 Verrà mostrato subito che le grandezze F e T' introdotte a questo punto-


sono uguali e coincidono con le grandezze T usate nelle (2.2) e (2.4).

53
riferimenti coincidono) viene mandato un segnale luminoso dall’ ori­
gine comune. Supponiamo che P evento consista nell’ arrivo del
segnale in un certo istante (t nel riferimento K o t' in K ') in un cer­
to punto (x in K e x in K ') posto sull’ asse x. Nel riferimento K
questo punto ha la coordinata x = et, mentre in K' lo stesso punto
ha la coordinata x = et'. Questi istanti e coordinate sono correlati
dalle trasformazioni (2.13) e (2.14) e, sostituendo queste espressioni
per x e x nelle (2.13) e (2.14), otteniamo
et' = T* (e — F), et = Tt' (c + V).
Moltiplicando termine a termine entrambi i membri di queste
due espressioni e cancellando il termine tt', si ottiene
i i
r (2.15)
Y 1 —B2 ’

Ci siamo convinti che la grandezza T coincide con la grandezza T


già apparsa nelle formule (2.2) e (2.4).
Per trovare Vequazione di trasformazione per la variabile t
dobbiamo definire t' dalla (2.14), tenendo conto della (2.13),
f _ x x' __ x r (x — Vt)
1 = T F ~ T “ Tf v

In questo modo otteniamo finalmente le trasformazioni di coordinate


e di tempo dell’evento nella forma
x' = T (z — Vt), y' = y , z' — z, t ' y t — ~z) . (2.16)

Le trasformazioni (2.16) sono proprio trasformazioni di Lorentz.


E facile riscriverle per una direzione arbitraria della velocità relati­
va V dei riferimenti K e K ' . Infatti, noi abbiamo ottenuto che le co­
ordinate cambino nella direzione del moto e rimangano invariate
in una direzione perpendicolare al moto. Risolviamo nelle sue
componenti il raggio vettore r del punto: una parallela alla direzio­
ne del moto r n ( r u ||V) ed un’ altra perpendicolare a questa r x (rL _L V):
r = r± + rn
Allora
, / r,.V \
r ( l - r (r il V t)i t' = T ( t ^ )
ma
"n
II
1

Quindi
r' = r(, + r'± = T (ru— Vt) + r ± = T [ ( r „ + ^ j . ) — Vt] — (\ — T ) r L,
rV lV(rV)ì
r± = r — r i[ = r — V V2 V2 ‘

54
Di conseguenza,
rV
t' = T [ t — C2 )■

Queste sono le trasformazioni di Lorentz in forma vettoriale per


una direzione arbitraria della velocità relativa: l ’ equazione per
r' corrisponde a quella classica ( 1 . 1 ) e si trasforma in essa ponendo

Rimanderemo ancora la discussione sul significato delle tra­


sformazioni di Lorentz (2.16) per derivarle ancora con un diverso
metodo. Tale metodo ci permetterà di renderci conto che la realtà
fisica in cui avvengono tutti i fenomeni della natura è un substrato
a quattro dimensioni, lo «spazio-tempo». La teoria della relatività
ristretta ci apparirà come la teoria dello spazio-tempo quadridi­
mensionale, come la teoria con un ovvio significato geometrico.
Dato lo scopo fisico e la possibilità di successive generalizzazioni,
un tale approccio sarà di estrema importanza alla nostra visione
del mondo e il primo passo verso la teoria della gravità.

§ 2.6. Propagazione del fronte


dell’ onda luminosa.
Un intervallo fra gli eventi

Consideriamo un altro esperimento ideale, condotto in termini di


due SRI, K e K r, collocati nel vuoto (il riferimento IV è in moto
lungo l ’ asse comune x, x ’ a velocità V). A ll’ istante iniziale t = t' =
= 0, quando coincidono le origini d e O', si sincronizza un flash.
In accordo con il secondo postulato di Einstein la luce si propaga alla
stessa velocità c in tutte le direzioni nei riferimenti K e K r. Di
'Conseguenza, il fronte dell’ onda (cioè la superficie di fasi uguali)
rappresenterà sfere in ciascuno dei riferimenti K e I V . Si possono
facilmente scrivere le equazioni di queste sfere:
nel riferimento K | nel riferimento IV
x 2 + y* + z2 = cH2 | ^,2 + y'2 + 2'2 = c2t'2.
Anche se dimentichiamo tutto quello che si è detto sulle letture
di tempo differenti t e t' nei riferimenti K e IV , si può spiegare per­
ché abbiamo scritto t' invece di t per il riferimento K ' . Supponiamo
che nei riferimenti K e K ' il tempo sia lo stesso, t = £'. Allora i
raggi di ambedue le sfere (per un dato istante t) risulteranno uguali.
Allora, lo stesso oggetto fisico, il fronte d’ onda, è descritto ugual­
mente da due sfere di ugual raggio, ma con i centri nei punti 0
e O'. Questo è assurdo. Quindi, non si può assumere t = t '.
Riscriviamo le equazioni nella forma
cH2— (x2+ y2+ z2) = 0 ,
c2t'2— (x '2-\- y '2 V V 2) — 0 .

55.
In questo esperimento ideale abbiamo a che fare con due eventi.
Il primo consiste nell’ invio di un segnale dall’ origine xG = 0 *
y0 = 0 , z0 = 0 all’ istante t0 = 0 , il secondo nell’ arrivo del segnale
in un punto arbitrario della sfera con le coordinate x, y, z all’ istante
t. Se mettiamo insieme l ’espressione

y c 2 (t— — (x— x0)2 — (y


t0)2
che viene chiamata intervallo tra i due eventi e designata con s,
i risultati ottenuti si possono formulare come segue: il quadrato
dell’ intervallo fra due eventi, invio di un segnale in un punto e
suo arrivo in un altro, deve essere uguale a zero in ogni SRI:
s2 - 0, s'2 - 0. (2.17)
Naturalmente, l ’ intervallo fra gli eventi si può trovare non solo
per l ’ invio e per l ’ arrivo di un raggio luminoso. Se le coordinate
dell’evento 1 sono definite dai numeri xXì yx, zx, t%e le coordinate
dell’evento 2 dai numeri x 2, y 2, z^ N, l ’ intervallo s12 tra questi even­
ti è uguale a
s 12 = V c 2 (U — t y — (x2— Xj)2 — (y2— y y — — z3)2.
L ’ intervallo s12 per eventi arbitrari, comunque, nono uguale a zero.
Frequentemente è conveniente considerare gli eventi che ac­
cadono in punti e ad istanti unfuntamente vicini. Assumendo in
questo caso ^2 — tx — dt, x 2 — xx = dx, y 2 — y ì = dy, z2 — zì =
= dz, otteniamo il quadrato dell’ intervallo nella forma
ds3 = c2dt2 — dx2 — dy2 — dz2.
Come illustreremo ora, la proprietà fondamentale dell’ intervallo
tra eventi è la sua invarianza nel passaggio da un riferimento all’ al­
tro.
In accordo con la (2.17) segue da questo esperimento ideale che
se ds2 — 0 in un SRI, ds'2 = 0 in ogni altro. Sia ds che ds' sono gran­
dezze infinitesime dello stesso ordine e quindi devono essere propor­
zionali Runa all’ altra. Quindi si può porre
ds2 = a ds'2,
dove a è un fattore di proporzionalità. Questa relazione deve essere
valida per Vintervallo tra ogni coppia di eventi. Infatti, non ci
sono condizioni imposte sulla relazione tra gii intervalli ds e ds\
e per gii eventi particolari, cioè l ’ invio e la ricezione di segnali
luminosi, la relazione deve essere quella mostrata prima.
Il coefficiente a non può dipendere dalle coordinate x, y, z e
dal tempo t, in quanto ciò significherebbe che punti diversi dello
spazio e differenti istanti di tempo non sono equivalenti. Perché
noi consideriamo Io spazio e il tempo omogenei, a deve essere una
costante che dipende soltanto dal valore assoluto della velocità re­
lativa dei due SRI in considerazione. Infatti, il coefficiente a non

56
può dipendere dalia direzione delia velocità relativa dei due SRI*,
perché altrimenti ciò implicherebbe la non equivalenza delle diver­
se direzioni nello spazio. Data Visotropia dello spazio dobbiamo
presumere che a possa dipendere soltanto dal valore assoluto della
velocità relativa dei riferimenti inerziali in questione.
Consideriamo tre SRI denotandoli rispettivamente con A , K r
e A ", inoltre Vx è la velocità di K ' rispetto a A e V 2 è la velocità
di A" rispetto a A . Possiamo scrivere che
ds* = a (Vi) ds\, (*);
— = —
a (VA riA
\• ùj —a- \ r
Considerando direttamente i riferimenti A ' e A", si può scrivere
dsl =
dove V12 è il valore assoluto della velocità del riferimento A ' rispet­
to a A ". Sostituendo l ’ultima espressione nell’ equazione (*) e com­
parandola con Pequazione (**), troviamo che

T ^ = «C 'iO - < ">


Poiché V12 dipende non solo dal valore assoluto dei vettori
V1 e V2 ma anche dall’ angolo tra essi (quest’ ultimo non entra e-
splicitamente nell’ultima equazione), questa relazione può essere
soddisfatta evidentemente soltanto se il coefficiente a si riduce ad
una costante; dall’ ultima equazione è chiaro che la costante a
può essere soltanto uguale all’unità. Quindi
ds2 = dsi2\
dall’uguaglianza degli intervalli infinitesimi segue l ’ uguaglianza
(gli intervalli s e s' non possono differire per una costante, poiché
da 5 == 0 segue che s' = 0)
s = s\
cioè l ’ invarianza dell5intervallo s rispetto alle trasformazioni di
coordinate e tempo è in accordo coi postulati di Einstein. Abbiamo
già visto e riceveremo conferma in seguito che tali trasformazioni
sono trasformazioni di Lorentz.
Allora l ’espressione c2t2 — x 2 — z/2 — z2 deve restare invariata
nel passaggio dal riferimento A a A b Quando i riferimenti A e A '
sono come nella fig. 1 .2 , allora y = y ', z = z e la somma y 2 + z%
è un invariante. È il caso dell’ espressione
s2 = cH2 — x l (2.18>
che sarà infatti la trasformazione invariante.

57
§ 2.7. Trasformazioni di Lorentz
come conseguenza dell’ invarianza
dell’ intervallo tra gli eventi
Nel paragrafo precedente si è mostrato che le coordinate di due
■eventi devono soddisfare l ’ equazione
cH'1 — x '2 = cH2 — x2 o x 2 — cH'2 = x 2 — cH2 (2.19)
nel passaggio da un riferimento inerziale ad un altro. Qui supponiamo
per semplicità che uno degli eventi abbia coordinate (0 , 0 , 0 , 0 )
e, visto raccordo sui sistemi di riferimento, ciò significa che questo
evento avrà coordinate (0 , 0 , 0 , 0 ) in un altro riferimento.
Facciamo un altro passo per semplificare la notazione. Il lettore
ha già notato quanto sia comune il prodotto et della velocità della
luce per il tempo. Introduciamo una nuova unità di tempo, il me­
tro luce; l ’ intervallo di tempo in cui la luce percorre una distanza di
1 m. Ovviamente 1 m è percorso in He secondi.
La luce percorre % metri nel tempo x - = t s; quindi è chiaro
che
t (luce-m) — et (s). (2 . 20)
Questa unità non appare eccezionale se si pensa che la distanza in
astronomia è misurata in termini di tempo (e la velocità della
luce), cioè in anni luce.
Allora, se il tempo è misurato in metri luce, l ’ espressione
per l ’ intervallo invariante tra eventi diventa piuttosto semplice:
x '2 — x '2 = x2 — x2. ( 2 .2 1 )
Il modo più semplice di trovare trasformazioni che soddisfino
la (2.21) è il seguente. Sappiamo (§ 2.5) che trasformazioni di
coordinate e del tempo devono essere lineari. Scriviamo tali tra­
sformazioni con coefficienti indeterminati costanti nella forma
x = axx + b±t , /o
x' = + b2t .
Sostituendo l ’espressione (2.22) al primo membro della (2.21)
e raggruppando i coefficienti di x 2, x2 e 2 , otteniamo
x t

x 2 — x 2 = x2 (a2 — a2) — x2 (b\ — ò2) + 2x% (a^ — a 2ò2) ==


EEEE ^ - x2. (2.23)
L ’ ultimo membro di quest’equazione è scritto in accordo con la
( 2 .2 1 ); essa deve essere identicamente soddisfatta per ogni x e x.
Ciò richiede che debbano valere le seguenti equazioni:
a\ — a\ = 1 , b\ — b\ = 1 , a1bì — a2b2 = 0. (2.24)
Queste equazioni sono semplici da soddisfare, assumendo i
coefficienti a e b uguali alle funzioni iperboliche (definite e descrit­

58
te nell’ Appendice I, § 9);
a1 = eh dq, a 2 = sh dq, b2 = eh # 2, b1 = s h d 2.
In questo caso le prime due uguaglianze dalla (2.24) sono auto­
maticamente soddisfatte, e dalla terza, riscritta nella forma
= bJb-L, segue th # 1 = th *0*2, e per soddisfare questa equa­
zione è sufficiente porre d x = d 2 = $'• Quindi la trasformazione
( 2 . 22 ) diventa
x' — x eh d + t sh d,
t ' = £ sh d -[-T eh d. (-^.25)
11 parametro d può dipendere solo dalla velocità relativa V.
È chiamato parametro velocità e gioca un ruolo importante nella
T R R (vedi § 3.5). Per definirlo, si deve usare la prima uguaglianza
della (2.25). Assumendo x = 0 per l ’ origine O' , otteniamo

~ = — th d. (2.26)

Comunque, il primo membro dell’ equazione, nelle convenzionali


unità di tempo, si scrive come x!ct = B, poiché x!l all’ origine O'
è proprio uguale alla velocità di K ' rispetto a K . In questo modo
abbiamo trovato la relazione fra il parametro d e la velocità V:
th d = —B. (2.27)
Da qui si trova facilmente (vedi Appendice I, § 9):
ch & — __ 1 = .1 = r
/ 1 — th2 d V i — B2 ’ (2.28)
sh d = th d eh d = — PB.
Finalmente otteniamo le trasformazioni cercate
X9 = xT + t ( — TB) = r (x — B t), (2.29)
t ' = x ( — TB) + tF = T (t - Bx).

Per le trasformazioni inverse abbiamo (il modo più semplice è


di rimpiazzare le grandezze con l ’ indice con quelle senza indice e
B con — B)
x = P (xr + B ' ) , t
(2.30)
x = r ( t' + Bx/).
Queste equazioni perfettamente simmetriche sono identificabi­
li facilmente con le stesse trasformazioni di Lorentz (2.16); è suf­
ficiente fare la sostituzione della (2 .20 ).
Allora, abbiamo ottenuto ancora le trasformazioni di Lorentz,
partendo dall’ invarianza dell’ intervallo e dall’uniformità dello
spazio e del tempo. Non c ’ è nessuna meraviglia in questo, perché
l ’ invarianza dell’ intervallo è una diretta conseguenza dei postu­
lati di Einstein.

59
§ 2.8c Valori complessi nella TRR*.
Designazioni simmetriche
Qualche volta per comodità formale si introduce una coordinata tem­
porale immaginaria % — ict = ir. Questo procedimento è utile-
nell’ ambito della teoria della relatività ristretta, perché ci libera
dalla necessità di introdurre e distinguere coordinate co- e contro-
varianti (vedi Appendice I, § 8 ). L ’introduzione di tali coordinate
è inevitabile nell’ elettrodinamica relativistica, a meno die non
si usi un tempo immaginario. Si deve sottolineare die l ’ introduzione
di un tempo immaginario è solo una questione ui convenienza e se
ne può fare a meno: perciò non c ’ è niente di misterioso nella com­
parsa del numero i. Nella forma finale tutte le formule per le coor­
dinate e il tempo contengono il numero i, e ciò conferma una volta di
più che esso gioca soltanto un ruolo ausiliario.
Quindi introduciamo formalmente una coordinata immaginaria
t = ilet. Allora

s2 — c2t2— x2= — {x2+ t 2) (i2 = — 1 ).


Diamo la deduzione delle trasformazioni di Lorentz usando la va­
riabile immaginaria . Consideriamo il piano delle variabili (xf
t

x); in questo piano l ’espressione x2 + t2 rappresenta una distanza


dall’ origine delle coordinate al punto (x, ) . Questa distanza non
t

varia per rotazione del sistema di coordinate di un angolo cp nel piano


(x, t ).
La rotazione di un angolo cp in un piano convenzionale (euclideo)
è descritta dalle equazioni (vedi Appendice I, § 2)
x f = x cos cp - f y sin cp, ys = —x sin cp - f y cos cp, (2.31)

dove tutte le grandezze sono reali.


Consideriamo una rotazione nel piano (x, x), in cui una coordina­
ta è puramente immaginaria. Assumeremo che le formule (2.31)
mantengano comunque la propria forma; come si vedrà più avanti
il significato geometrico delle equazioni con variabile immaginaria
differisce in modo essenziale da quello delle (2.31). Così scriviamo*
le trasformazioni cercate nella forma

xf — x cos cpA x sin cp, (2.32a)

%' — x cos cp— #sin cpB (2.32b)


Chiariamo il significato del parametro cp. Esso può essere associa­
to soltanto con la velocità V del moto relativo dei riferimenti K
e K\ essendo l ’unico parametro per cui differiscono. Prendiamo un
punto del riferimento K' (x' = costante). Esso si muove rispetto
a K come l ’ interoriferimento, cioè a velocità V; perogni punto
rigidamente fissato al riferimento K f si può scrivere V — dx/dt.

60
Assumendo x come funzione di t , differenziamo la (2.32a) rispetto
•a t . Otterremo dx cos cp + dr sin cp = 0, da cui segue
dx 1 dx
dt — tg<p

a, di conseguenza,
tg (p = iB . (2.33)
La tangente è una grandezza immaginaria; questo ci fa pensare
ancora una volta che tra le variabili c ’ è una grandezza immaginaria.
Usando le formule convenzionali della trigonometria si trovano
dalla (2.33)

v i+ t
(2.34)
COS (p = — r- 1 = - ----- — rr= z
/ i + i g 2«p Y i- -B*
■dove si è introdotta la sostituzione F = (1 — gi à usata
nella (2/15). Sostituendo il valore di cos cp e sin cp nella (2.32),
•otteniamo le trasformazioni cercate per le variabili x, r:

x r = F (x-{- ì Bt), %f = r (% — iBx). (2.35)


Le formule per le trasformazioni di coordinate dell’evento dal
riferimento K a K' differiscono da quelle inverse, da K a KJ solo
per la sostituzione delle grandezze con apice con quelle senza e
viceversa; inoltre, deve essere cambiato il segno della velocità F.
In questo modo si ottiene dalle (2.35)

x = -V (xF— iB r'), t = T (U -f- iBxf). (2.36)


Naturalmente, si sarebbe ottenuto Io stesso risultato se l ’ equazione
(2.35) fosse stata risolta direttamente rispetto ad x e t .
Nelle formule (2.35) e (2.36) è facile passare alle variabili reali
x e Z, sostituendovi % = ict e t ' = ict'. Cosi otteniamo direttamente
le formule di trasformazione (2.16). Le trasformazioni dirette e
inverse delle variabili x e t hanno la forma
#' = T (x — Vt) (a), x = T (x' + Vt') (c),

Un confronto delle trasformazioni di Lorentz date nella forma


delle (2.25) e (2.32) ci sarà utile. Ricordiamo che nella (2.25) tutte
le grandezze sono reali, mentre nella (2.32) figura il tempo immagi­
nario. Facendo uso delle relazioni (vedi Appendice I, § 9)
cos ia = eh a, sin ia = i sii a, tg la = i th a,

61
si vede che è sufficiente sostituire cp = — nella (2.25) per
convertirla nella (2.32). Così, nel piano delle variabili reali
x, t abbiamo, dal punto di vista formale, la rotazione di un sistema
cartesiano di un angolo immaginario. Questa rotazione ricorda assai
poco una rotazione autentica del sistema cartesiano e le formule
(2.25) che la definiscono sono una « parodia » delle formule (2.31).,
che descrivono una rotazione reale. Spiegheremo più avanti il si­
gnificato geometrico della « rotazione » degli assi x e t secondo le
(2.32), in questo paragrafo scriveremo le trasformazioni di Lorentz.
in forma simmetrica per poterle usare d ’ ora in poi.
Introduciamo le notazioni simmetriche delle variabili fonda-
mentali come segue:
x1 = x, x2 = y , x 3 = z, = let = ìt (2.38)
per il tempo immaginario e
x° = et = t , x1 == X, X2 = Z/, X3 = z (2.39)
per il tempo reale.
L ’ insieme delle variabili (2.38) sarà comodo per l ’ espressione
deH’elettrodinamica relativistica. Per quanto riguarda l ’ insieme
delle variabili (2.39) esso si usa nel libro [9] che contiene la descri­
zione della teoria generale della relatività, e la transizione dalla
TRR alla teoria della relatività generale senza l ’ ausilio dell’unità
immaginaria risulta più complessa. Riscriviamo le corrispondenti
trasformazioni di variabili (2.30) (in forma reale):
£0= Tx°' + I W ' + 0 •x*' + 0 -a *'9
x 1= PBa?0' -f- Re1' -f-O-z2' ,
(2.30')
x2—0-xQ' -f-0-a;1' + 1-a;2' + 0-£3',
a* = 0-a*' + 0 -x if + 0 -& ' +
la (2.36) (con il tempo immaginario):
x i = Tx[ + 0-x'2 -f- 0-z'3— iBRr',
z2 = 0 •x[ + 1 •x'2+ 0 ■x'3+ 0 •x[,
(2.36')
£3 = 0 - £ '+ 0 « # ' + l- - 0 •xAÌ
24 — iBP •x[ + 0 •x\ + 0 ■x'3+ r •
Le trasformazioni (2.30') e (2.36') si possono riscrivere in forma
abbreviata
x l = aihZ'k (a), I xi = ai*:** (b). (2.40)

Nelle (2.40a) e (2.40b) la somma è intesa rispetto a k che va da O


a 3 in (a) e da 1 a 4 in (b). L ’indice i è «lib e ro » di prendere tutti
i valori da 0 a 3 in (a) e da 1 a 4 in (b), i coefficienti a ih e a ih hanno

62
la forma di matrici
/ r TB 0 0\ r 0 o -- ì B r \
/ TB r 0 0 1 0 1 0
'■
‘ ih ' (a) 0 i (b), (2.41)
lo 0 1 0 I 0 0 1
0
\0 0 0 1/ iBr o o r /
che sono dette matrici delle trasformazioni di Lorentz. Matrici di
questa forma sono usate sempre nella trasformazione di coordinate
e di tempo nel passaggio da un riferimento inerziale all’ altro. Queste
matrici differiscono soltanto per il valore della velocità relativa V y
cioè per il diverso valore di B = Vie.
Le equazioni della transizione inversa, cioè il passaggio dal
riferimento^ K a K r, si ottengono con la sostituzione di B a —B.
Designamo con la matrice della transizione da K a K' in modo'
che
x ir = aihxh, zi = a'ikx h. (2.42)
Per la matrice con elementi reali la sostituzione indicata porta
ad una matrice a'ik completamente nuova. Ma la matrice a'ik si
trasforma in a ki (con righe e colonne trasposte), quando si sostitui­
sce — B al posto di B, in modo che
x'i = akixh. (2 A3)

§ 2.9. Illustrazione geometrica


delle trasformazioni di Lorentz

Poiché nella scelta della posizione relativa dei sistemi inerziali le


coordinate y e z non variano, è sufficiente considerare la trasforma­
zione del sistema di riferimento nel piano (x, t ).
Tracciamo gli assi x e % del riferimento K mediante due rette
perpendicolari (fig. 2.6). Per tracciare gli assi del riferimento K r
nel diagramma, riprendiamo le formule (2.29), in cui le origini
dei riferimenti K e IV coincidono (per x = 0 e t = 0, anche x —
= 0 e V = 0). Il punto x = 0 (l’ origine del riferimento IV) si
muove con velocità V rispetto al riferimento K\ quindi il suo moto
è illustrato mediante una retta che forma un angolo cp con Passe
t , inoltre l ’ angolo cp è definito dalla relazione cp = arctg B. Ma
la retta xJ = 0 è Passe dei tempi nel riferimento K ' . Di conseguen­
za, la trasformazione di Lorentz per Passe t si riduce ad un’ inclina­
zione dell’ asse V di un angolo cp rispetto a t .
L ’ asso x' è definito dalla condizione %' = 0. Ma dalla (2.29)
si vede che questa condizione è soddisfatta nel riferimento K
dalla retta t = Bx. Naturalmente, Passe %r può essere trovato anche
dalla condizione x = 0, ma allora otteniamo la stessa retta x =
= B t dalla (2.29). Quindi le equazioni per i nuovi assi si scriverai!-

63
no:
, 1
asse t : t — — x;
D
asse#' : T = Bx. (2.44)
L ’ angolo tra gli assi x e x è definito dalla relazione cp — arctg B.
Quindi, le trasformazioni di Lorentz si riducono ad una conversione
da un sistema di riferimento rettangolare x, % a quello obliquo x ' ,
t '; gli assi x e x ruotano attorno all’ origine, nella direzione della
bisettrice del l ’ angolo coordinato, duello stesso angolo cp — arctg B

Fig. 2.6. Un’illustrazione geometrica delle trasformazioni di Lorentz. irsse si


riducono ad una rotazione degli assi x e x di un angolo arctg B attorno
all’ origine nella direzione della bisettrice dell’ angolo coor to verso la posi»
zione finale x\ x'. Le rette x' — costante sono ora parallele all’ asse Ox' e le
rette x' = costante sono parallele all’ asse Ox (siamo passati al sistema di coor­
dinate rettilineo ma obliquo). Il passaggio da K a K' corrisponde alia conver­
genza degli assi %' e x' (a); il passaggio inverso alla divergenza degli assi x

(vedi fig. 2.6, a). Questo è il significato di una rotazione di un an­


golo immaginario! In termini formali la rotazione di un sistema ret­
tangolare appena considerata non somiglia affatto alla rotazione
di un sistema di coordinate cartesiano.
I nostri risultati dimostrano che non si può rimanere nell’ ambito
degii assi ortogonali x e t , quando si vogliono considerare i siste­
mi di riferimento inerziali e dare un’ illustrazione geometrica di
queste trasformazioni. Anche se gli assi del riferimento iniziale sono
ortogonali, un passaggio ad un altro riferimento K ' li rende obliqui*
La fig. 2.6, b illustra il passaggio dal riferimento ortogonale K ' a
K in accordo con la (2.30). Ma l ’ emergere di coordinate oblique rende
necessario distinguere tra coordinate co- e controvarianti (vedi Ap­
pendice I, § 8). Per questo è difficile evitare queste nozioni nella
T R R senza introdurre il numero i (vedi § 2.8).

64
IIL CONSEGUENZE DELLE TRASFORMAZIONI
DI LORENTZ. CLASSIFICAZIONE DEGLI INTERVALLI
E PRINCIPIO DI CAUSALITÀ»
METODO DEL COEFFICIENTE k

Non c'è da aspettarsi nuove conseguenze dalle trasformazioni di


Lorentz che non siano ottenibili direttamente dai postulati di
Einstein: in ultima analisi le stesse trasformazioni di Lorentz sono
una conseguenza dei postulati di Einstein. L ’ inizio di questo capi­
tolo è dedicato, infatti, all’ analisi dei risultati già ottenuti nel
capitolo IL Sicuramente, essi si ottengono più facilmente dalle tra­
sformazioni di Lorentz e noi trarremo vantaggio da ciò. Non trala-
sceremo l ’ opportunità eli mostrare come tutte queste conseguenze,
inclusa la legge di trasformazione delle velocità, siano ottenibili
senza ricorrere alla costruzione di un sistema di coordinate (il meto­
do del coefficiente k). Naturalmente può nascere il problema del per­
ché le trasformazioni di Lorentz siano importanti, se tutti i risultati
finora ottenuti si possono ricavare con altri mezzi. Il punto è che
nonostante E importanza dei risultati ottenuti, essi non sono ancora
sufficienti ai nostri scopi. Per convincersi della validità dei principio
di relatività, bisogna conoscere come si trasformano le equazioni di
base delia fisica nel passaggio da un SRI ad un altro. Sono le tra­
sformazioni di Lorentz che gettano le basi per tale passaggio.

§ 3.1. Misure dì lunghezza e


intervalli di tempo. Relatività
del concetto di simultaneità
Le trasformazioni di Lorentz permettono il calcolo delle coordinate
di un evento (comprese le « coordinate » temporali) nel passaggio da
un SRI ad un altro. Ma un evento è soltanto un elemento del fe­
nomeno fisico, nell’ analisi finale l ’uso principale della TRR è
nel calcolo conseguente delle grandezze fisiche osservate, Comunque,
prima di porre questo problema è necessario trattare dei procedi­
menti di misura delle grandezze fisiche fondamentali. Le misure
più importanti sono quelle di distanze (lunghezze) e di intervalli
di tempo. Siamo abituati a misurare le lunghezze dei corpi o le
distanze fra punti quando i corpi o i punti sono a riposo rispetto a
noi. Se un corpo è a riposo, è sufficiente spostare la scala unitaria
lungo la lunghezza da misurare per il numero di volte necessario.

65
È ciò che si fa comunemente quando si misura, per esempio, un tes­
suto o la lunghezza di una stanza.
È anche piuttosto semplice la misura di un intervallo di tempo
tra due eventi che avvengono nello stesso punto dove si trova 1’ orolo­
gio. Occorre soltanto registrare ristante in cui avviene il primo
evento e quello in cui avviene il secondo. La differenza nelle letture
dell’ orologio ci darà l ’ inlervallo di tempo richiesto. In questo modo,
ad esempio, si stabilisce la durata di una lezione o di un incontro di
calcio.
Ma come si misura la lunghezza di un corpo in moto rispetto a
noi? Supponiamo che un treno ci passi accanto a grande velocità
e di volerne determinare la lunghezza. Non è certo facile per un
uomo. Egli deve annotare simultaneamente la posizione della testa
del treno (locomotiva) e della coda rispetto ad un certo punto fisso
sul terreno. Ma appena ha annotato la posizione della locomotiva e
comincia a voltare la testa, la coda del treno è andata avanti. Di
conseguenza, bisogna avere gran cura nel segnare simultaneamente
le posizioni della testa e della coda del treno.
Una volta segnate sul terreno le posizioni delle estremità del tre­
no, si può facilmente misurare la lunghezza con i metodi convenzio­
nali, cioè la lunghezza del corpo a riposo.
Come si misurano, invece, gli intervalli di tempo tra eventi che
accadono in punti diversi dello spazio? Ricordiamo come si misura
il tempo di uno sprinter nella gara dei cento metri. Gli eventi in
questo caso sono la partenza dell’ atleta ed il] suo arrivo. E c ’ è un
solo orologio! Il colpo dello starter serve come segnale d ’ inizio della
gara e fa partire un contasecondi che si trova all’ arrivo. Il suono si
propaga in aria alla velocità di 300 m/s, e l ’ atleta comincia a correre
prima che il giudice che si trova all’ arrivo faccia partire il conta-
secondi. Questo non è essenziale, tuttavia, data la bassa velocità del
corridore (circa 36 km/h = 10 m/s, che è piccola rispetto alla
velocità del suono). Ma da questo esempio si ha la sensazione che la
misura dell’ intervallo di tempo tra due eventi che hanno luogo in
punti diversi richiede una certa attenzione.
Nel § 2.1 abbiamo discusso come viene trattato il problema
nell’ ambito della teoria della relatività: ciascun riferimento inerzia­
le ha il proprio sistema di coordinate e orologi a riposo sono posti in
tutti i punti in cui sono necessari. Questi orologi sono sincronizzati
all’ interno del sistema di riferimento, in modo che letture uguali
degli orologi corrispondono allo stesso istante di tempo nel riferi­
mento.
Quando passiamo a confrontare eventi di due riferimenti K
e K\ leghiamo la lettura dell’ insieme sincronizzato di orologi del
sistema K all’ analogo insieme di K ' ponendo t = 0 e V = Ó alle
origini coincidenti 0 e 0 ' (vedi § 2.2). Ricordiamo che le trasforma­
zioni di Lorentz sono proprio una conversione delle coordinate di un
evento nel riferimento K , cioè delle coordinate {x, y, z, t), nelle
coordinate dello stesso evento nel riferimento K '. Dalle formule

66
(2.16) o (2.29) o (2.40) otteniamo (x , y ', z , t') espresse mediante
(x, y, z, t). Ovviamente, tutte le conseguenze, sorprendenti dal
punto di vista del « senso comune », dei postulati di Einstein discussi
nel capitolo II si riottengono dalle trasformazioni di Lorentz. Ora
ci occuperemo di ciò.
Dapprima deriviamo due utili equazioni che ci saranno necessarie
in seguito. Consideriamo due eventi arbitrari I (x±, iq, zl7 t±) e II
(x2, z/2, z2, t2). Per la conversione delle coordiante e dei tempi di que­
sti eventi nel riferimento K ' abbiamo, in accordo co n ia (2.37a, b)5

fo' = r ( t 2- l x 2) , ^2 = r (x2~ -vt2),

xx = r (zi - ■Vti).
Prendendo le differenze t' e x„ -x, cioè sottraendo l ’equa­
zione in basso da quella in alto, e definendo Ax = x 2 — xl7 Ax' =
— x'2 — x'v At' — t'2 — t[, At = t2 — tl7 si ottengono le equazioni
richieste (le equazioni per il passaggio inverso sono date accanto):
Ax' = T (Az — FA (3.1) Ax = P (Ax' + V At'), (3.1')
Af = T (At (3.2)

Infatti le formule (3.1) e (3.2) (così come le (3.L) e (3.2')) sono I©


trasformazioni di Lorentz per le differenze delle coordinate spazia­
li e temporali dei due eventi. A tali formule vanno aggiunte le rela­
zioni Ayr = Ay e Az = Az.
Segue immediatamente dalla (3.2), che due eventi, simultanei
nel riferimento K , non lo sono in K '. Infatti, assumendo At = 0
nella (3.2), otteniamo

At' = - T ^ - A x . (3.3)

Si vede che A l1 ^ 0, se Ax =^= 0. Ma se per At = 0 anche Ax — 07


gli eventi o coincidono oppure accadono nel piano x — costante.
Per tali eventi At' = 0.
Dalia formula (3.2) seguono due condizioni, la cui verifica per­
mette di ignorare la relatività degli intervalli temporali tra gli even­
ti. Prima, si deve supporre B < 1; poi T ^ 1 e si possono scrivere le
seguenti espressioni: At' = At — (Vie) (Ax/c). Il secondo termine
dell'espressione si può ignorare se il rapporto Ax/c è suf­
ficientemente piccolo. Questa (seconda) condizione è certamen­
te soddisfatta se l ’evento avviene in una regione di spazio limitata^
lungo Passe x, cioè per Ax piccoli. Non ci sono limitazioni, comun­
que, sulla regione di spazio lungo le direzioni y e z, dato che tutti
gli eventi nel piano x — costante avvengono allo stesso istante in
accordo con l ’ orologio del riferimento K '.
Certamente, la relatività della simultaneità si rivela nella man­
canza di sincronia degli orologi che abbiamo esaminato in dettaglio

67
nel § 2.4. È sufficiente porre V = 0 nella formula (2.37b) per ot­
tenere immediatamente la (2.9) che non era in px^ecedenza facil­
mente ottenibile. Non appena si assume At = 0 nella formula
(3.2), si ottiene la (2.8). Questo dimostra quanto una « trasformazione »
possa essere oscura in apparenza.
Nella vita quotidiana una violazione delia simultaneità in diver­
si riferimenti non è percepibile: la differenza temporale At ò pro­
porzionale a B/c, come si vede dalla (3.2), assumendo At — 0 (la
simultaneità nel riferimento K ). Dalla stessa (3.2) si vede tuttavia
che se Ble Ax ha un valore apprezzabile, anche At' assume un certo
valore se Ax è grande.
È importante sottolineare che la relatività della simultaneità
è imposta dal fatto che la velocità della luce è finita. Se formal­
mente si fa un passaggio al limite per c oo (ciò significa che
B -> 0), la simultaneità diventa assoluta. Questo risultato corri­
sponde al caso di piccole velocità relative dei sistemi di riferimento.
Si vede dalle formule (3.1) e (3.1') che due eventi che avvengono
in punti dello spazio con la stessa coordinata x nel riferimento K
(cioè allo stesso punto nel riferimento K) hanno coordinate x' diverse
nel riferimento K ' . Infatti dalla (3.1) otteniamo Ax' = T (Ax —
— V At) = —TV At. Ma Al è Vintervallo di tempo proprio, e quindi
F At — At', da cui Ax = — V At'. Il significato di quest’ ultimo ri­
sultato è evidente; esso definisce Io spostamento del punto £ rispetto
al riferiménto K f registrato in K ' .

§ 3.2. Relatività della lunghezza


di righelli in moto (scale)«
Forma visibile di corpi in moto
a velocità relativistiche

Consideriamo ora la misura di lunghezza di un righello in moto.


Supponiamo che gli orologi del riferimento K siano sincronizzati e
ohe ci siano dei riferimenti nello spazio. Poniamo un righello orien­
tato lungo Passe x che si muove rispetto a K con velocità V. Si
può fissare il riferimento K ' a tale righello. Come si misura la lun­
ghezza dello stesso righello nel riferimento K? Ovviamente le coor­
dinate delle estremità del righello devono essere determinate si­
multaneamente nel riferimento K . Questa richiesta di simultaneità
comporta lo strano risultato che abbiamo già discusso nel § 2.3: la
lunghezza del righello, misurata nel sistema di riferimento rispetto
al quale è in moto, risulta minore della lunghezza dello stesso
righello nel sistema di riferimento in cui è in quiete. Allora, sup­
poniamo che il righello sia a riposo nel riferimento A ' e le coordina­
te degli estremi siano x[ e x'2. Per definizione, la lunghezza nel rife­
rimento K\ detta lunghezza propria, è uguale a x'2 — x[. Denotia­
mo la lunghezza propria del righello con Z0, cioè /0 = x 2 r — x[.
Poiché il righello è in quiete nel riferimento K ' , non si pone il

68
problema della simultaneità delle misure delle coordinate degli
estremi: la sua lunghezza può essere misurata con ogni mezzo.
Nel riferimento K le coordinate degli estremi del righello si
determinano dalla trasformazione di Lorentz (vedi la (2.37 a))
x't = T (x2— Vi2), x[ = T (xì — Vti).
Costruendo la differenza — x[, si ottiene
— x'i — T l f a — Xi) — V (tz — ti)}. (3.4)
La lunghezza propria del righello costituisce il primo membro della
(3.4). In parentesi graffe nel secondo membro troviamo Ax e Ai
per i due eventi, essendo x 2 la posizione dell’estremo sinistro del
righello all’ istante Z3 e x1 la posizione dell’estremo destro all’ istante
tx (nel riferimento K).
La grandezza Ax sarà la lunghezza del righello nel riferimento
K solo se le posizioni degli estremi sono registrate simultaneamente
in questo riferimento. Altrimenti si può avere qualsiasi valore per
Ax. Riprendiamo l ’esempio citato all’ inizio del § 3.1 riguardo la
misura di lunghezza di un treno in movimento: si è segnata la
posizione della coda del treno e ci si volge lentamente con la testa
verso il suo inizio. Se si segna la posizione della testa della locomotiva
e si misura la distanza fra i segni, essa risulterà maggiore della lun­
ghezza propria del treno. Procediamo ora in senso opposto: prima
segnamo la posizione della testa della locomotiva e poi giriamoci
lentamente verso la coda del treno.. È facile convincersi che, se si
volge il capo con una certa lentezza,, la lunghezza del treno può per­
fino essere nulla. Questo è proprio il senso della formula (3.4).
Quindi, per determinare senza ambiguità la lunghezza del righello
nel riferimento K, bisogna considerare i due eventi simultanei in
K : la coincidenza dell’estremo sinistro del righello con un certo
riferimento spaziale in K (diciamo aq) e dell’ estremo destro con
un altro riferimento in K (diciamo x 2). Questo significa che Ax — ì
solo se Ai = 0. Ma allora dalla (3.4) segue che i0 = PZ, dove ì
è la lunghezza del righello determinata nel riferimento K. Como
è consuetudine l ’ultima equazione si scrive come segue:

1= 1o ] / K
Ovviamente, per le stesse condizioni del problema, si può fa^
uso delle equazioni di trasformazione inversa:
^2 = r « + F«'), Xi = r (x[ + vt[).
Sottraendo l ’ uguaglianza destra da quella sinistra, si ottiene
Ax - rz0+ t v (*; - 1 [) = rz0+ t v a ? .
Ma Ax diventa la lunghezza Z solo se At = 0. Esprimendo At' in
termini di At e Ax dalla (2.37b), Af = T (At — P/c 2Ax), ed assu­
mendo Ai = Q nell’ equazione, otteniamo ancora la (3.5).
Ci sono due metodi per determinare la lunghezza di un righello
in movimento che, naturalmente, conducono allo stesso risultato.
Sia il righello AB a riposo nel riferimento K, in modo che l ’ estremi-
tà sinistra A coincida con l ’ origine 0 (fig. 3.1). A ll’istante t — 0
l ’ origine del riferimento K' coincide con 0 (la lettura dell’ orologio
in O’ è t' = 0 ) . Quindi l ’ osservatore in B registra il momento in
cui (9' attraversa il punto B. Sia questo istante t. La velocità del
riferimento K' è nota. Quindi la lunghezza propria del righello è

0r 0f

0
4* 3 *
Fig. 3.1. Per il calcolo della lunghezza di un righello in moto.

uguale a l0 t. Questa è lunghezza propria in quanto è mi­


surata con la scala e gli orologi del riferimento K in cui il righello
è in quiete. Anche la velocità è determinata nel riferimento K .
D ’ altra parte, l ’ osservatore del riferimento K' che si trova nel punto
O' registrerà il passaggio del punto A (all’ istante t' = 0) e B (all’i­
stante t') usando il proprio orologio. Ma il righello oltrepassa questo
osservatore con velocità V (nella direzione opposta) ed egli troverà
che la lunghezza del righello è uguale a l — V At'. Ma At' =
= (tf — 0 ) è l ’ intervallo proprio tra due eventi (la coinciden­
za di 0' con A e poi con B). Così At = (t — 0) = t è l ’ intervallo
di tempo fra gli stessi eventi nel riferimento K. In accordo con
la (2 . 2) At = T At' e perciò l/lQ = = JL , allora

i = ± i 0= i 0y r ~ B i .

La relatività delle lunghezze è una conseguenza diretta della


relatività della simultaneità. Supponiamo che un righello sia a
riposo nel riferimento K\ essendo le coordinate degli estremi x'2
e x'v La lunghezza propria è l0 — Ax' — x 2 — x[.
Supponiamo che due lampadine fissate agli estremi del righello
s’ illuminino simultaneamente ( A f = 0), e che i due eventi vengano
registrati nel riferimento K. Troviamo la distanza tra i punti dove
sono avvenuti i due eventi nel riferimento K : Ax — V (Ax' +
+ V At') = T Ax' — T /0 (vedila (3.1Q). Questo significa che la di­
stanza tra i punti dove sono avvenuti i due eventi è maggiore del­
la lunghezza propria del righello. Ma questa distanza non è la lun­
ghezza del righello misurata dall’ osservatore in K. Per trovare la
lunghezza del righello nel riferimento A , bisogna trovare siinultane-

70
amente in questo riferimento, lo coordinate degli estremi del righel­
lo. Gli eventi che sono simultanei nel riferimento K' sono ritardati
l ’ uno rispetto all’ altro di A £ = P (Atf -f- V/c2k x ) = TV/cH0 nel
riferimento K (fig. 3.2). Ma in questo tempo l ’ estremo x[ si sposta
nella direzione del moto della distanza F A t — TB2l0. Quindi la
lunghezza misurata del righello sarà minore di Tl0 della grandezza
FAZ, cioè
z = rz0—rB2z0- 10] / T ^ b "2.
Ricordiamo che la (3.5) è stata ottenuta direttamente dai po­
stulati di Einstein (§ 2.3). Ora è il momento di entrare nel signi­
ficato fisico della (3.5). Abbiamo trovato che la lunghezza di un corpo

-------4------- 3 ------- ìL-------

V&t _ l/ h W
X
U_____ Ho._____^
Fig. 3.2. Relatività delle lunghezze di righelli come conseguenza della relatività
del verificarsi simultaneo di due eventi.

fisico (ad esempio, di un righello) è relativa, cioè è diversa in


diversi sistemi di riferimento. Il righello possiede una lunghezza
massima nel riferimento in cui è a riposo, cioè la lunghezza pro­
pria è la maggiore. Se la lunghezza del righello viene determinata
in un riferimento inerziale, rispetto al quale il righello è in moto,
si dimostra che la sua lunghezza è minore della lunghezza propria.
Segue dalla (3.5) che se il righello fosse in grado di muoversi a velo­
cità c, la sua lunghezza sarebbe uguale a zero. Ma questo non può
accadere: ogni corpo avente una massa a riposo finita, compreso
ogni possibile sistema di riferimento reale, non può raggiungere la
velocità c.
Cosa significa la contrazione di un righello? Spesso s’ intende il
problema come se « di fatto » il righello diventi più corto. Per comin­
ciare, è chiaro che non può avvenire nessuna contrazione del righello.
Questo deriva dal principio basilare della TR R , il principio di
equivalenza di tutti i SRI. Lo stato fisico del righello è lo stesso
in tutti i SRI. Quindi non ci sono problemi nell’emergere di sforzi
dovuti alla deformazione. La « contrazione » del righello avviene sola­
mente a causa dei diversi metodi di misura nei due sistemi di rife­
rimento. D ’ altra parte, la relatività osservata della lunghezza del
righello non è un’illusione dell’ osservatore. Tale risultato è ot­
tenibile con qualsiasi metodo ragionevole di misura della lunghezza
di un corpo in movimento. Inoltre, analizzando i fenomeni fisici in

71
un dato sistema di riferimento, si deve adottare la grandezza l
come lunghezza del corpo nella (3.5), e non Z0.
È estremamente inopportuno parlare di « contrazione di Lorentz »
alludendo alla formula (3.5), sebbene lo stesso G. A. Lorentz abbia
per primo suggerito questa formula nel 1892. Comunque, è stata
interpretata (vedi Supplemento II) piuttosto diversamente da quan­
to discusso precedentemente.
Fu Einstein a parlare chiaramente sulla realtà della contrazione
di Lorentz: « Non c ’ è da discutere se la contrazione di Lorentz è
reale o no. La contrazione non è reale, in quanto essa non esiste per
un osservatore che si muove con il corpo; comunque, essa è reale,
in quanto può essere provata in linea di principio con mezzi fisici
per un osservatore che non si muove con il corpo».
Spesso si solleva un’ altra questione: qual è la lunghezza «ef­
fettiva » del righello?^ Il problema sulla lunghezza del righello indi­
pendentemente dal sistema di riferimento è priva di senso. Il
righello ha la sua lunghezza) in ciascun riferimento; questa è la sua
lunghezza «effettiva». Tutti i riferimenti inerziali sono equivalenti
ed equivalenti sono i valori di lunghezza determinati in questi rife­
rimenti. In ogni riferimento il righello si comporta come se avesse
la lunghezza determinata in questo riferimento. Sebbene tutti i
SRI sono equivalenti fra di loro, c ’ è ancora un sistema di coordina­
te «selezionato» abituale, che è proprio quello in cui il righello è
a riposo. Dal punto di vista dei nostri concetti abituali questa è
proprio la lunghezza «effettiva» del righello; siamo pronti ad adot­
tarla come lunghezza vera, ma quest’ultima definisce il comporta­
mento dal righello soltanto in questo « proprio » sistema di riferi­
mento.
Infine, l ’ultimo rilievo. Il righello esiste obiettivamente, cioè al
di fuori della nostra coscienza e di noi stessi. Ma c ’ è una lunghezza
prima che sia fatta la misura? Una lunghezza come un certo numero
è il risultato di misure e di una scelta di unità di misura. Natural­
mente, il righello possiede un’estensione (lunghezza, se si vuole)
come qualità prima della misura, ma il valore numerico della lun­
ghezza si origina solo dopo la misura. Allora, il valore numerico della
lunghezza dei corpi oggettivamente esistenti emerge solo dopo la
misura, e il risultato della misura, come abbiamo stabilito, dipende
dagli strumenti di quale riferimento usiamo.
Consideriamo righelli che hanno la stessa lunghezza propria
Z' e Z" (Z' = l'I) nei due riferimenti K ' e K ". Le misure condotte nel
riferimento K' danno
(3.6)
Le misure nel riferimento K" danno
(3.7)
Le disuguaglianze (3.6) e (3.7) non sono affatto contradditorie,
perché la (3.6) si è ottenuta per le scale e gli orologi del riferimento

72
K\ e la (3.7) per quelli del riferimento K " . La differenza nei valori
di lunghezza del righello è dovuta alla diversa definizione della
simultaneità nei due riferimenti. La difficoltà d ’ interpretazione
delle conclusioni della TRR non sta nell’ esistenza di grandezze re­
lative, ma nella messa in luce dell’equivalenza di tutti i sistemi di
riferimento inerziali. Le disuguaglianze (3.6) e (3.7) indicano proprio
questa equivalenza.
Le conclusioni della TRR circa la relatività della lunghezza
di corpo in moto è in parte inusuale perché nella vita quotidiana
non percepiamo tale effetto. Consideriamo il moto più veloce che
si raggiunge, cioè quello orbitale della Terra. In questo caso V =
= 30 km/s. Il rapporto V/c~ IO-4 e l = Z0] / T — IO"8' » lQ(1 —
— -* 1 0 -8) ^ l q\.: Bisogna sottolineare ancora una volta che la con­
trazione delle lunghezze è una conseguenza diretta della lim i­
tatezza della velocità della luce. Se la velocità della luce fosse
infinita, la lunghezza del righello sarebbe la stessa in tutti i siste­
mi di riferimento, in accordo con la formula (3.5). Si può vederlo
dal fatto che per co la simultaneità dell’ evento diventa asso­
luta.
Sebbene fino ad ora abbiamo sempre discusso la relatività della
lunghezza dei corpi (righelli), bisogna tenere in mente che stiamo
trattando della relatività delle distanze tra due punti fissi in un
riferimento, quando vengono misurati con gli. strumenti di un al­
tro riferimento.
Consideriamo un cubo in quiete nel riferimento K con i lati
Ax, Ay, Az e con volume proprio À fL = AxAyAz. Secondo le tra­
sformazioni di Lorentz in un SRI arbitrario K ' abbiamo Ax' =
= ( 1 /T) Ax, Ay' = Ay, Az' — Az e, di conseguenza,
A T 9 ss Ax'Ay'Az' = ( 1 /T) AxAyAz = ( 1 /T) A T 0-
Quindi, il cambiamento del volume del cubo nel passaggio dal ri­
riferii e determinato da
T '= T'oV 1— B2. (3.8)
Segue dai risultati ottenuti che il volume proprio di un corpo è
Rinvariante della trasformazione di Lorentz:
T 'd T ' = T "d T " = T 0-

È possibile osservare direttamente la contrazione di Lorentzy


diciamo, osservando o fotografando un corpo in .moto rapido? Nel
primo lavoro di Einstein dedicato alla teoria della relatività si
può leggere quanto segue: « Un corpo, che a riposo ha una forma sfe­
rica, in movimento viene visto da un osservatore stazionario come
un ellissoide con i semiassi R (1 — (32)1/ 2, i?, R ». La parola «v isto »
può essere intesa come osservazione visuale o mediante fotografia.
Per circa cinquanta anni dopo l ’ avvento della TRR ognuno era cer­
to che la forma visibile della sfera in moto relativistico fosse un
^ellissoide. Comunque, viene fuori che il problema della forma visibi­
le dei corpi in moto a velocità relativistica richiede molte condi­
zioni da prendere in considerazione, e che una sfera in moto rapido
rimane sfera. Se si assume che un occhio ed una lastra fotografica
sfissano un’ immagine istantanea prodotta dalla luce, questa immagi­
ne viene prodotta simultaneamente sulla retina o sulla lastra foto­
grafica da raggi provenienti da sezioni diverse del corpo in esame.
Ma se i cammini ottici della luce che provengono da vari punti del
•corpo in osservazione sono differenti, una lastra fotografica registre­
rà le posizioni dei punti del corpo ad istanti di tempo diversi, pre­
cedenti, ovviamente, all’ istante della presa fotografica. L ’effetto

d)
Wig, 3.3. Osservazione visuale di un cubo che sorpassa un osservatore: a) la
'rispettiva posizione dell’ osservatore e del cubo $ = 0; b) l ’ aspetto visibile del
cubo in moto; c) la possibile interpretazione dell’ aspetto visibile del cubo fatta
da un osservatore: la rotazione del cubo di un angolo cp = arcsin (3; d) l ’ osserva­
zione del cubo in volo sotto un angolo ih

è condizionato dalla limitatezza della velocità della luce. Usando


un semplice esempio, mostreremo come il contorno visibile di una
sfera in moto coincide con quello di una sfera stazionaria.
Immaginiamo che un cubo luminoso in moto lungo una retta pa­
rallela ad una delle sue facce sorpassi una macchina fotografica
(od un osservatore). La fotografia o l ’ osservazione viene fatta all’i­
stante in cui il centro del cubo attraversa la linea perpendicolare alla
direzione di moto, tracciata dal punto in cui si trova l ’ osservatore
•(fig. 3.3, a). Naturalmente dobbiamo sapere a priori che il corpo
è a forma di cubo nel proprio sistema di riferimento.
Ad un istante definito tutti i fotoni, emessi simultaneamente nel
riferimento della lastra in un punto della linea A D , raggiungeranno
la lastra insieme con quelli emessi dal punto B in anticipo di un
intervallo He (l è la lunghezza dello spigolo del cubo). Ma in quel­
l ’ istante il punto B è nella posizione B'. La determinazione simul­
tanea delle posizioni dei punti A e D nel riferimento della lastra
comporta, in accordo con le regole usuali di misura delle lunghezze,
la contrazione di Lorentz: V = l (1 — (32)1/2. D ’ altra parte B B ' =
= (He) v = p/.
Dalla fig. 3.3, b e c si può vedere che l ’ immagine di un cubo in
moto, che dovrebbe vedere un osservatore (idealizzato), in quiete
coincide con l ’ immagine del cubo fermo ruotato di un certo angolo
q>. Questo angolo è determinato dalla relazione sin cp = |3. Questo
è un caso particolare di un risultato più generale: ogni corpo tridi­
mensionale in movimento si vede ruotato ad un dato istante. Se
rispetto ad un osservatore il cubo è visto sotto un angolo tP rispetto
all’ asse x quando è a riposo, si vedrà ruotato di un angolo diverso.
Se il cubo viene allontanato a sufficienza dall’ osservatore, la luce
proveniente da esso può essere considerata come un fascio di raggi
paralleli. Quando questo fascio è osservato nel riferimento K,
per un osservatore in K esso si propaga sotto l ’ angolo ù rispetto
all’ asse x, inoltre gli angoli ù e ù ' sono correlati dall’ equazione (vedi
la (7.11))

cos ù = (cos {P + P)/(l + p cos '&').

La variazione del fronte dell’ onda piana nel passaggio da un rife­


rimento ad un altro, in moto rispetto al primo, si chiama aberrazione
della luce. L ’ immagine registrata in questo caso sulla lastra corri­
sponde al cubo (osservato nel riferimento K sotto un angolo $) ruo­
tato dell’ angolo ù — <P.
Da ciò appare che una sfera ruota, ma il suo contorno non varia
(vedi [28] per dettagli).
Ancora, si può fotografare un corpo in modo che la lastra registri
una contrazione relativistica? Per evitare complicazioni legate alla
rotazione, si può considerare un oggetto ad una dimensione confron­
tabile con la sua lunghezza propria sulla lastra. Per questo l ’ osserva­
tore nel riferimento K deve sapere a priori che la sbarra si muovo lun­
go una certa direzione e conoscere la sua lunghezza propria (la sbar­
ra è a riposo nel riferimento K'). In questo caso l ’ osservatore si
costruisce un « sosia » della sbarra in movimento nel riferimento K
e scatta una foto della sbarra in moto sullo sfondo della sua lunghez­
za propria.
Lo schema più semplice per fotografare una sbarra che subisce
la contrazione di Lorentz è quello mostrato nella fig. 3.4. La sbar­
ra è parallela all’ asse x e si muove, lungo tale asse. Un osservatore
è posto nella perpendicolare all’ asse x, passante per il punto di mez­
zo del sosia della sbarra inquiete nel riferimento K ' . Appena il punto
medio della sbarra luminosa si trova sulla perpendicolare, un mec­
canismo fa aprire l ’ otturatore della camera, e vengono registrate
simultaneamente sulla lastra le posizioni degli estremi della sbarra.
Il sosia stazionario della sbarra può essere fotografato in qualsiasi
istante, ovviamente. Probabilmente anche questo è un «esperimen­
to ideale».

75
Bisogna dire, comunque, che una «rotazione del cubo» in moto a
velocità relativistica qualitativamente è stata fotografata. Riman­
diamo il lettore interessato ai dottagli al [27].
In generale, un’ immagine « visibile » può differire in modo es­
senziale per diversi osservatori. Un semplice esempio. Un osservato­
re si trovi ad una certa distanza da un piano su cui s’ illuminano si­
multaneamente nei riferimento, dove sono a riposo il piano e l ’ os­
servatore, delle lampadine ovvero si produce il flash luminoso. Allo­
ra, data la limitazione della velocità della luce, l ’ osservatore vedrà

K rk |1
1
o\ lo
—>■-----r*” or\i 1
ii x} x r
i]
i
i!

L i-
Lastra fotografica

Fig. SA. Lo schema che permette di fotografare la contrazione di Lorentz di


una sbarra in movimento. Quando il punto di mezzo della sbarra O' cade sulla
linea PO, uno speciale dispositivo apre (per un istante) l ’ otturatore in P lascian­
do passare i raggi emessi dai punti della sbarra nell’istante di intersezione del
punto O' con la retta PO.

che il piano comincia ad illuminarsi gradualmente con un’ «onda


d ’illnminazione » che va dal centro alla periferia. In particolare se
un filo infinito viene illuminato simultaneamente in modo istanta­
neo, un osservatore lontano vedrà i due punti luminosi allontanar­
ci
Per la stessa ragione una velocità visibile (osservabile) può
anche differire da quella reale: essa può rivelarsi anche più grande
della velocità della luce [33].

§ 3.3* Relatività degli intervalli


di tempo tra eventi
Supponiamo che due eventi accadano in un certo punto del riferi­
mento K f agli istanti t[ e L ’ intervallo temporale che separa questi
eventi può essere registrato dagli orologi posti in questo punto. Per
definizione, un intervallo di tempo tra eventi avvenuti nello stesso
punto di un certo riferimento registrato dallo stesso orologio di que­
sto riferimento viene chiamato intervallo di tempo proprio tra
gli eventi. Denotando con At° l ’ intervallo di tempo proprio, nel
nostro caso si ha At° = àt' = £' —

76
Definiamo ora an intervallo di tempo tra gli eventi considerati
nel riferimento K . In accordo con la (3.2) At = TAt' = TAt0. Que-
sto risultato ci è già familiare (2 . 2 ).
Comunque, se gli eventi nel riferimento K' accadono in un punto
dello spazio, ciò non avviene in ogni altro riferimento K. Infatti,
supponiamo che due eventi avvengano nel riferimento K' ad istanti
diversi ma nello stesso punto, cioè Ax' = 0 ma Atr =^= 0. Dalla
(3.1) Ax = TV, At' =£. 0. Il significato dell’ultimo risultato è
ovvio: tutti i punti del riferimento IV si muovono rispetto a K
alla velocità F, e Ax è proprio lo spostamento di ogni punto nel
riferimento K ! nell’ intervallo considerato. Poiché T A f — TAt0 =
= At, segue che Ax — VAi.
Perciò gli intervalli di tempo fra la medesima coppia di eventi
si dimostrano diversi in differenti SRI. Osserveremo il minimo
intervallo temporale fra gli eventi nel sistema di riferimento in cui
gli eventi accadono nel medesimo punto e, di conseguenza, sono re­
gistrati con lo stesso orologio, cioè l ’ intervallo di tempo proprio
è minimo.
Un intervallo di tempo tra gli eventi in termini del riferimento
K può essere misurato come segue. Il punto del riferimento K ' ,
in cui avvengono i due eventi considerati, si muove a velocità F
rispetto al riferimento K. Se gli eventi accadono nel riferimento K
nei punti x1 e x%, l ’ intervallo di tempo At tra gli eventi è, ovvia­
mente, At — Ax/V. Ma secondo la (3.1) Ax — TV At' (Ax' = 0),
da cui si ha di nuovo

At —TAi0=
/ 1 -B 2
La conferma sperimentale diretta delle conclusioni della TPiR
riguardanti la relatività degli intervalli di tempo è ampiamente
conosciuta. Delle particelle leggere (muoni) furono scoperte, da
un lato, in un laboratorio come risultato della scissione dei nuclei,
dall’ altro, nei raggi cosmici. Il tempo di vita (dimezzamento)
dei muoni misurati in laboratorio risultò uguale a circa 2 -IO" 6 s.
Tale tempo di vita si può considerare come tempo di vita proprio, in
quanto le velocità dei muoni di laboratorio sono non relativistiche
(vedi la (3.9); con la velocità del sistema di coordinate K f si intende
la velocità del riferimento legato al muone). Nell 1intervallo At° =
= 2 »10 “6 s un muone si disintegra in altre particelle.
E noto che i muoni osservati.nei raggi cosmici alla superficie ter­
restre si formano negli strati superiori dell’ atmosfera all’ altezza di
5-6 km. come conseguenza della radiazione cosmica primaria. La ve­
locità con cui questi muoni raggiungono la Terra è confrontabile
con quella della luce. Secondo la (3.9) il tempo di dimezzamento
At di un muone nel riferimento del laboratorio è uguale a At =
~ TAt0. Per il muone F ~ 10 è nel sistema del laboratorio At =
— 2 «IO-5 s. In questo tempo un muone percorre una distanza e At =
= 3» IO10 X 2 -10 ~5 ^ 6 km. Se non esistesse l ’effetto di relatività de­

77
gli intervalli di tempo, il mnone percorrerebbe soltanto 600 m, e
non rileveremmo i muoni al livello del mare. Allora, soltanto la
trasformazione relativistica degli intervalli di tempo può spiegare il
flusso dei mnoni osservabile sulla Terra.
Un esempio eccellente della relatività degli intervalli di tempo
è costituito dalTeffetto Doppler. Esso consiste nel fatto che una
sorgente di luce ed un osservatore (ricevitore) si muovono l ’uno
rispetto all’ altro \ la frequenza della luce determinata dall’ osserva­
tore è diversa da quella che rileverebbe l ’ osservatore se fosse in
quiete rispetto alla sorgente. La frequenza della luce determinata

[K A/r
A U /f' \K.r
I
,1

O^VJ_ o
vr —H! xx1 I x x '
t= o t =T t=0 t=T
Sorgente Osservatore Sorgente Osservatore
a) à)
Fig. 3.5. Per la deduzione delle formule per l ’effetto Doppler longitudinale:
a) un osservatore si allontana dalla sorgente; b) un osservatore si avvicina alla
sorgente.

dall’ osservatore è naturale chiamarla in quiete rispetto alla sor­


gente frequenza propria, indichiamola con co0. Tutte le conclusioni
riguardano il vuoto.
Consideriamo prima il caso in cui la direzione di propagazione
della luce coincide con la direzione della velocità relativa della
sorgente e dell’ osservatore (effetto Doppler longitudinale). Nella
fig. 3.5, a ciò corrisponde alla propagazione della luce lungo Tasso
x, x . Pen considerare l ’ effetto Doppler, si può imitare un’ onda di
luce mandando brevi impulsi dalla sorgente con un intervallo (pe­
riodo) T . Supponiamo che questi impulsi siano inviati dall’ origine
del riferimento A , cioè dal punto 0 . Ogni osservatore in quiete in
questo riferimento troverà che questi impulsi gli arrivano con lo-
stesso intervallo T. Fissiamo ora l ’ osservatore al riferimento A '.
Supponiamo che all’ istante in cui l ’ origine 0 e O' coincidono (t =
— 0 , tr = 0) dal punto 0 sia inviato il primo impulso, che sarà re­
gistrato naturalmente dall’ osservatore nel punto 0 '. L ’ impulso suc­
cessivo lascia il punto 0 dopo l ’ intervallo T (secondo l ’ orologio del
riferimento A). Ma in quelTistante l ’ origine O' è già alla distanza
VT da O. La velocità della luce rispetto ad 0 ', nel riferimento A ,

1 Notiamo che nella trattazione seguente di fisica « classica » useremo


sempre una tipica assunzione relativistica secondo cui non c’ è bisogno di alcun
mezzo materiale per la propagazione della luce. Questo spiega perché ci interessa
soltanto la velocità relativa di una sorgente di luce e di un osservatore.

78
è uguale a c — V, perciò un raggio luminoso impiegherà un tempo-
aggiuntivo VTi(c — V) per raggiungere l ’ origine O' . Quindi, l ’ os­
servatore in 0 riceverà l ’ impulso dopo un intervallo di tempo (regi­
strato dall’ orologio in K)

T' = T + 7 !^ v = ( i + T = k ) T = T h T - <3 ' 10>


Abbiamo ottenuto l ’ intervallo di tempo tra il primo e il secondo
segnale ricevuti dall’ osserva lore in Or e registrati da un orologio
in K. L ’ arrivo del segnale nel riferimento K' avviene in un punto
Of e il passaggio all’ intervallo di tempo proprio può essere fatto­
secondo la (3.9): T'0 = (1/T) T ', in modo che il periodo T'0 per l ’ os­
servatore in 0' sarà uguale a

(3.11).

Passando alle frequenze (co0= 2u/7\ co' = 2 n /r ') otteniamo

<b, “ V/ T T F <0‘* * <M1- B )- (3-12>


L ’ultima operazione si compie facilmente nel modo seguente:
il numeratore e il denominatore sotto il segno di radice vengono mol­
tiplicati per (1 — B), il secondo membro della (3.12) si ottiene
trascurando il termine B 2 nell’espressione (1 — B2) del denominato­
re. Questa equazione è valida per un osservatore che si allontana dal­
la sorgente: la frequenza osservata è minore di quella propria.
Se un osservatore si avvicina alla sorgente (nella fig. 3.5, b-
il punto 0" è alla sinistra di 0) ed i segnali sono inviati dal riferi­
mento K " , ragionamenti analoghi (la sorgente e l ’ osservatore con­
vergono e la velocità relativa è c + V) conducono alle equazioni'

r = ì T F 7'- n - j / j f l T « “ fi” «

w "= ]A L r f-fflo » (1 + B) co0. (3.13)

Le formule (3.12) e (3.13) (senza approssimazioni) sono le esatte


equazioni relativistiche che descrivono l ’ effetto Doppler longitudi­
nale. Esse verranno ottenute in seguito (§ 7.2) sulla base delle
equazioni relativistiche «rigorose». Ma la deduzione qui citata è
perfetta in termini fisici e allo stesso tempo mostra chiaramente che
l ’ effetto Doppler è formato da due parti indipendenti: 1) è connesso
col cambiamento continuo della distanza tra l ’ osservatore e la sor­
gente; 2 ) è anche connesso con la trasformazione degli intervalli di.
tempo fra gli eventi in un passaggio da un riferimento all’ altro. Il
primo aspetto non è di competenza della teoria della relatività in
prima approssimazione. L ’effetto Doppler longitudinale segue qua­
litativamente dalla teoria classica, e la formula corrispondente si.

79-
ottiene dalla (3/10). Non c'è niente da modificare nella (3.10)
in termini della teoria classica, visto che gli intervalli di tempo sono
g li stessi in tutti i sistemi di riferimento. La differenza fra l'equazio­
ne classica e quella relativistica è essenziale a meno di B2. L'ulti­
ma uguaglianza approssimata nella (3.12) dà proprio l ’espressione
classica ottenuta dalla (3.10). Visto che il rapporto B è determina­
to dalla velocità relativa della sorgente e dell 1osservatore, esso è
molto piccolo almeno per sorgenti macroscopiche, e l ’effetto Doppler
è definito principalmente dalla variazione della distanza fra sor­
gente e osservatore.
Comunque, c'è un caso di velocità nulla fra sorgente ed osserva­
tore, anche se i riferimenti, in cui sono in quiete la sorgente e l ’ osser-
vatore, si muovono l'uno rispetto all’ altro. Questo accade quando la
sorgente in moto viene osservata quando la sua velocità è perpendi­
colare alla direzione dell’ osservazione (linea di vista) (fig. 3.6, a).
A ll’ istante dell’ osservazione illustrato nella fig. 3.6, a la distanza
fra sorgente e osservatore non varia. Di conseguenza non c ’ è effetto
Doppler dal punto di vista classico. Ma in termini della teoria della
relatività il periodo d’ invio del segnale nel riferimento K' (denotia­
molo con 71', questo è l'intervallo di tempo proprio, cosicché co0 =
= 2n/T'0) deve essere sincronizzato col tempo dell’ osservatore in ac­
cordo con la formula (3.9), cioè T ----- T'J\/ t — B2, da cui ottenia­
mo per l'effetto Doppler trasversale la formula
(D ^ fP F ^ o . (3.14)
Questa equazione è del secondo ordine rispetto a B. L ’effetto tra­
sversale è 1più difficile da rilevare di quello longitudinale, ciò no­
nostante esso fu osservato nel 1938. La sua scoperta, come si vede
dai ragionamenti precedenti, è una dimostrazione diretta della
relatività degli intervalli fra eventi. Bisogna sottolineare una volta
di più che l ’esistenza dell’effetto Doppler trasversale segue soltanto
dalla TR R . L ’ equazione dell’ effetto Doppler si può ricavare facilmen­
te considerando la radiazione sotto l'angolo rispetto alla direzione
del moto della sorgente (fig. 3.6, b). Se il primo impulso è emesso
nel punto A e il secondo nel punto B , la differenza di cammino dei
raggi paralleli che viaggiano sotto un angolo d rispetto alla direzio­
ne della velocità è uguale a VT cos ù. È chiaro da ciò che Tr =
= T — ----- ------ in termini dell’ osservatore e, di conseguenza, co' =

= . E da notare che co' e co0 in questa equazione sono mi­


surate nello stesso sistema di riferimento. Quindi siamo certi a
maggior ragione che non c ’ è effetto Doppler trasversale (ù = ax/2)
in senso classico: co' = co0.
Siamo certi che quando due eventi accadono nello stesso punto
in un certo sistema di riferimento (hanno un’unica posizione),
Pintervallo di tempo tra di essi è definito come intervallo proprio
(misurato da un orologio) mentre l ’ intervallo di tempo fra gli stessi

80
eventi in ogni altro riferimento può essere calcolato dalla (3.9). Nasce
il problema seguente: è sempre possibile convertire un intervallo
temporale misurato in un riferimento arbitrario in un intervallo
proprio? Si dimostra che ciò non è sempre possibile, e le condizio­
ni, per le quali ciò è possibile, saranno date nel § 3.4.
Introduciamo ora il concetto di te m p o p r o p r io d i u n c o r p o . Sup­
poniamo che il corpo sia. in moto rettilineo ed uniforme rispetto al
riferimento K. Il riferimento K' si può associare al corpo in moto;
esso è fermo in tale riferimento, cosi che gli eventi che accadono

F ig . 3 .6 . Per la deduzione delle formule per Defletto Doppler: a) l ’ effetto tra­


sversale; b) il caso generale.

con esso (o su di esso) vengono registrati con un solo orologio. Que­


sto orologio misura il tempo proprio nel punto in cui è posto il
corpo; si può dire che questo orologio misura il tempo proprio del cor^
po. La formula (3.9) mostra semplicemente in questo caso che Tinter­
vallo del tempo proprio del corpo tra eventi avvenuti con il corpo o
su di esso, è sempre minore deir intervallo tra gli stessi eventi misu­
rato dagli orologi di ogni altro SRI rispetto al quale il corpo si muo­
ve. Non bisogna dimenticare che Yintervallo di tempo proprio viene
registrato da un solo orologio, mentre Yintervallo di tempo nel rife­
rimento rispetto a cui il corpo si muove è registrato da almeno due
orologi. Ciò è molto importante perché, interpretando il risultato
(3 .9 ), si dice che P orologio in moto ha un ritmo più lento di quello
stazionario. Un tale modo di esprimersi può solo portare a una confu­
sione. Infatti, i ritmi degli orologi sono gli stessi in ogni SRL Quello
che cambia è la lettura dell’ intervallo di tempo fra gli eventi. Ma
ciò è naturale in quanto gli orologi sincronizzati in un SRI non
Io sono in un altro.
Il tempo proprio si può introdurre anche per una particella in
moto accelerato. Per fare ciò, consideriamo il moto di una particella
durante un intervallo di tempo infinitesimo. La velocità della par­
ticella a quel dato istante sia V. Consideriamo ora il riferimento

81
inerziale K * che si muove a velocità V. In questo sistema di rife­
rimento vale la relazione d r = ] / 1 — fì2d t. Questa equazione è
anche valida approssimativamente per una particella comovente
istantaneamente del riferimento K ' . Il riferimento K* differisce
da quello istantaneamente comovente K ' in quanto quest’ultimo,
K\ possiede un’ accelerazione, mentre il primo, K *, no sebbene
entrambi si muovono in un dato istante con la stessa velocità. Ma per
quanto più breve è l ’ intervallo d t, tanto più applicabile è la rela­
zione d% = ] / 1 — (32 d t per il riferimento K ' . Integrata questa espres­
sione, otteniamo l ’espressione precisa per t , che è in effetti il
tempo « proprio » risultante di un sistema di coordinate K*.
Partendo da questi ragionamenti riterremo che se 1 intervallo
di tempo fra eventi, accaduti con il corpo, e misurato da un orologio
fisso al riferimento comovente con il corpo risulta uguale a dir, allo­
ra P intervallo -diM m p ó d t fra gli stessi eventi, misurato dall’ orologio
di un altro SRI rispetto al quale il corpo si muove, vale, secondo la
(3-9),
dt == yd X j
dove

: ^ )= 7 != F ’ P= U <3-15>
ora v = v (t) è la velocità del corpo (e non del riferimento); data
la circostanza sono state introdotte le notazioni p e 7 . Quando la
velocità del corpo varia seguendo la dipendenza v = v (£), la relazio­
ne tra l ’ intervallo di tempo finito r e quello registrato dall’ orologio
del riferimento rispetto a cui il corpo è in moto, si ottiene per inte­
grazione

T - T 0= j ] / 1 - ( ù r ) 2 ^ - (3-16>
K
Cos’ è la grandezza che si vede al primo membro della (3.16) ?
La si può chiamare, naturalmente, tempo proprio del corpo. Ma
come si misura? A rigore, la relazione (3.9) è valida per gli orologi
in un sistema di riferimento inerziale, ma sei l ’ orologio è fissato
ad un corpo in moto arbitrario, esso subirà delle accelerazioni. Sen­
za dubbi un’ accelerazione influenza il ritmo dell’ orologio (in grado
diverso a seconda della costruzione dell’ orologio; se non ci credi,
fai cadere il tuo orologio sul pavimento). Di conseguenza, è difficile
parlare di lettura di tempo fatta mediante questi orologi. Una ragio­
nevole interpretazione della formula (3.16) sta nel fatto che t — Tq.
è l ’ intervallo di tempo risultante misurato in molti riferimenti iner­
ziali comoventi con il corpo 0 , il che è lo stesso, il tempo registrato
da un orologio fissato rigidamente al corpo e n o n a ffetto p e r n u lla da
u n a c celera zio n e d el co r p o .
Bisogna sottolineare che le differenze di letture degli orologi
di diversi sistemi di riferimento inerziali che abbiamo ottenuto non

82
hanno relazione con qualsiasi irregolarità del ritmo degli orologi in
uno o nell’ altro riferimento. Come nel caso di variazione di lunghez­
za del righello, noi ci imbattiamo qui in differenti metodi di misura
del tempo. Tutti gli orologi in tutti i sistemi di riferimento cam­
minano in modo idealmente esatto. Le misure di intervalli di tempo
tra due eventi condotte mediante due insiemi di orologi di diversi
riferimenti, sincronizzati all’ interno dei rispettivi riferimenti, por­
tano ai risultati ottenuti: l ’ intervallo di tempo proprio tra due eventi
si dimostra sempre il minore.
Consideriamo un esempio (piuttosto simile a quello discusso in
rapporto alla variazione della scala delle lunghezze) che mostra
come il rallentarsi del tempo sia causato dai differenti metodi di
confronto. Prendiamo due orologi identici: A nel riferimento K
e A ' in K' (possono essere atomi della stessa specie). Osserviamo
l ’ orologio A ' nel riferimento K\ cioè confrontiamo l ’ orologio A
con l ’ insieme di orologi sincronizzati con A'. Allora gli osservatori
di K ' scopriranno che l ’ orologio A va più lentamente rispetto all’ in­
sieme di orologi del riferimento K ' . Al contrario, gli osservatori
del riferimento K che vedono un orologio A ' del riferimento K ’
scopriranno che esso va più lentamente dell’ insieme di orologi di K.
Sono contradditori questi risultati? No. Si vede chiaramente che i
metodi di confronto dell’ orologio nel primo e nel secondo caso sono
differenti. L ’ orologio che viene confrontato con gli altri orologi di
un altro sistema ritarda sempre. Questa stupefacente situazione si
dimostra inevitabile. L ’equivalenza di tutti i SRI è alla base della
teoria della relatività, e quando emerge un valore relativo, emerge
nello stesso modo in tutti i SRI.

§ 3.4. Classificazione degli


intervalli e principio di causalità
Si vede dalle formule (3.1) e (3.2) che quando si considerano due
eventi arbitrari, sia la distanza spaziale tra di essi che l ’ intervallo
temporale tra il loro verificarsi sono dei valori relativi (Ax' ^ A x,
Ai' At). Finora abbiamo trattato eventi di tipo particolare: nel
misurare lunghezze venivano considerate simultaneamente le coordi­
nate degli estremi x 2 ed x1 del righello (£x = t2); nel determinare un
intervallo di tempo, gli istanti £' e t'2 venivano considerati allo
stesso punto x'2 = x[. Ma anche in questi casi le « distanze » spaziali
e temporali tra eventi si sono dimostrate relative. Non c ’ è da mera­
vigliarsi che esse risultino relative nel caso generale. D ’ altronde,
come sappiamo, segue direttamente dai postulati di Einstein che
l ’ intervallo tra eventi è l ’ invariante delle trasformazioni di Lorentz:
« 12 = V c2 ih— t)2
, — (x2— Xi)2—— — Zi)2 =
=- U c 2 (Ai)2- zp - (A;/)2— (Az)2. (3.17)
(K
La simbologia è la stessa usata nella deduzione delle formule (3.1)
e (3.2). È opportuno introdurre anche la simbologia speciale per le

83
distanze spaziali e temporali tra gli eventi:
lt\= (A x)* + (A y )* + {Az)\ Ai = tl2. (3.18)
Dopo aver scritto il quadrato deir intervallo fra due eventi nel
riferimento K come s22 = cH\2 — Z22 e nel riferimento K ' come
s'2 = c2Z'2 — Z'|, otteniamo la condizione per l ’ invarianza del-
V intervallo s'2 = s22 nella forma
= (3.19)
gli eventi in un riferimento arbitrario K , si scopri-
C o n s id e r a n d o
rà probabilmente che essi avvengono in punti diversi dello spazio
© a diversi istanti di tempo.
È possibile mediante la scelta del sistema di riferimento K '
assicurarsi che: a) gli eventi I e II avvengano allo stesso punto
dello spazio; b) gli eventi I e II avvengano nello stesso istante e,
infine, c) gli eventi I e II avvengano in un punto dello spazio e
nello stesso istante? Cominciamo dall1inizio.
a) E possibile scegliere un sistema K \ in cui questi eventi av­
vengano allo stesso punto dello spazio, cioè abbiano la medesima
posizione? Questo significa che in K r deve essere l[2 = 0. Ma allora
dalla (3.19) segue che
= = (3.20)
cioè > 0 e l ’ intervallo s12 deve essere reale. Nel riferimento K*
gli eventi considerati avvengono in un punto dello spazio e T inter­
vallo di tempo tra di essi è uguale, a meno del fattore a, a

V = | l = (3-21)

Per questo gli intervalli reali fra gli eventi vengono detti intervalli
del genere tempo. La condizione per un intervallo del genere tempo
si può scrivere nella forma Z12 <C c£ia.
Consideriamo il moto di una particella dotata di massa a riposo
(la meccanica convenzionale tratta solamente oggetti di questo tipo).
Supponiamo per semplicità che la particella si muova uniformemente
lungo Passe x, coprendo la distanza A x'nel tempo At. Nel riferimen­
to K f questa particella percorrerà la distanza Ax' nel tempo AV
che viene determinato in accordo con le (3.1) e (3.2). Il rapporto
ÀT
— = v è la velocità della particella nel riferimento K . Tenendo con­
to di ciò, riscriviamo le (3.1) e (3.2):

A x' = T x— VAt) —r
(A (4f-y)
A t’ = T { A t - ^ (A
Tl —
x)= ) ( l - ^ ) Af.

Se si assume Ax' = 0 nella (3.22), si può trovare facilmente la


Velocità del riferimento K f in cui i due eventi in questione hanno la

«4
stessa posizione. Dal fecondo membro della formula otteniamo im­
mediatamente la risposta evidente V ~ v. È proprio il riferimento
comovente con la particella. Dalla (3.23) segue un’ altra importante
conseguenza. Sia Ai — t2 — ix > 0. Questo implica che revento II
avviene dopo Tevento I. C’ è un riferimento K' in cui Atf <C 0,
cioè la sequenza temporale degli eventi è invertita rispetto al riferi­
mento K? La (3.23) mostra che il segno di At' coincide cori quello
di At quando ^1 — > 0. Ma questa condizione è sempre soddi­
sfatta visto che la velocità v del corpo è sempre minore di c. (Il siste­
ma di riferimento è anch’esso un corpo materiale.) La stessa condi­
zione è soddisfatta anche per ogni coppia di eventi legata da un
intervallo del genere tempo. Infatti il terzo passaggio della (3.23)
77 \

^
(1 -----T'T a ì J * Secondo
A x, e se ct12 >> Z12, cAt >> Ax a fortiori.
la (3.18),
Questo implica che il
Z12 ^

rapporto Ax/c*At è minore dell’unità; Vie è sempre minore di uno*


1—— ) > 0 e, di conseguenza At' >> 0.
Quindi, per questi due eventi considerati in termini dei riferi­
menti K e i concetti di « dopo » e « prima » hanno carattere
identico, cioè assoluto. In generale, se l ’ intervallo fra gli eventi è
del genere tempo (ricordiamo che V intervallo è una grandezza inva­
riante), la sequenza temporale degli eventi rimane la stessa in tutti
1 SRL Più avanti si vedrà che non sarà così per gli intervalli che
differiscono per il segno dagli intervalli del genere tempo.
Che significato ha Vinvarianza della sequenza temporale in tutti
i sistemi di riferimento inerziali? Abbiamo già accertato che due
eventi separati da un intervallo del genere tempo avranno la stessa
posizione in qualche riferimento. Se uno di essi è avvenuto « prima »
e l ’ altro « dopo », il primo può essere la causa della comparsa del
secondo, cioè questi eventi possono essere legati da una relazione
causa-effetto. Ma allora la loro sequenza temporale non può dipende­
re dalla scelta del sistema di riferimento. Dai nostri risultati segue
appunto il criterio della possibilità della relazione causa-effetto
(l’ intervallo è del genere tempo). Per la sequenza temporale degli
eventi, essa rimane automaticamente la stessa in tutti i sistemi di
riferimento.
L ’ intervallo del genere tempo indica la possibilità di una rela­
zione causa-effetto tra gli eventi non solo perché garantisce una
sequenza temporale identica in tutti i SR L Esso indica la possibilità
fisica perché un evento influenzi l ’ altro. Dalla disuguaglianza
< c2tl2, che determina un intervallo del genere tempo, segue che
nel tempo passato fra il verificarsi degli eventi la luce copre a fortiori
la distanza dal punto in cui è avvenuto 1’evento I a quello dell’even­
to II (il prodotto c (£2 — A) è appunto il cammino percorso dalla luce
nel tempo t2 — t j . Fondamentalmente questo significa che una certa
interazione (segnale) si potrebbe propagare dal punto in cui è avve-

85
unto l ’evento I a quello dell’evento II nell’ intervallo di tempo tra i
due eventi. Senza pretesa di generalità nell’ impostazione del proble­
ma assumeremo che un evento possa influenzare un altro solamente
mediante interazione fisica (di forza). Quindi, se l ’evento I ha avuto
luogo, un « segnale » di ciò può raggiungere il punto in cui accadrà
l ’evento II prima del verificarsi dell’evento II. Questo significa che
l ’evento I può essere la causa dell’evento i l, e l ’evento II può essere
l ’ effetto dell’evento I. In questo caso i due eventi sono legati da una
relazione causa-effetto. Dunque, gli eventi separati da un intervallo
del genere tempo possono avere una relazione causa-effetto in termini
fisici. È ovvio che essi possono non essere in una tale relazione. Si
tratta della possibilità di principio. È essenziale che in questi inter­
valli la sequenza temporale non può essere invertita: l ’effetto non
può influenzare la sua causa.
b)
miniamo ancora le condizioni d ’ invarianza dell’ intervallo (3.19)
e determiniamo se si può trovare un sistema di coordinate K r in
cui gli eventi I e II in esame accadono simultaneamente. Ciò signifi­
ca che in questo sistema t'12 = 0.
Quindi s[2 = —l C 0. Il quadrato dell’ intervallo tra gli eventi
deve essere negativo, e l ’ intervallo risulta immaginario. Nel riferi­
mento K' gli eventi in questione accadono allo stesso istante, e l ’ in­
tervallo tra di essi si riduce (a meno del numero i) ad un intervallo
spaziale Z'2 = is12. Perciò gli intervalli immaginari sono detti inter­
valli del genere spazio. La condizione di un intervallo del genere
spazio può essere scritta nella forma Z12 > ct12.
Si può trovare un sistema di riferimento in cui At' = 0 per due
eventi dati? Assumendo At' = 0, otteniamo dalla (3.2)

v = cSt - <3-24>
Visto che si può sempre scegliere gli eventi in modo che Z12 = Ax,
segue dalla condizione di un intervallo del genere spazio che in
questo caso A x ^ > c -A t . La (3.24) mostra che possiamo ottenere
V < c, cioè in linea di principio un tale riferimento si può scegliere.
Il rapporto Ax/c-At appare nel terzo passaggio dell’uguaglianza
(3.23); come abbiamo rilevato, esso può essere maggiore dell’ unità.
y ^ oc \
( 1 — — J può essere reso negati-
vo con una scelta appropriata di V.
Ne segue che la sequenza temporale di due eventi legati da un
iniervallo del genere spazio può essere invertita in seguito al passag­
gio da un SRI ad un altro. Ciò non si applica agli eventi che possono
essere legati da una relazione causa-effetto. Ma in termini fisici essi
non possono essere in tale relazione. Infatti, la condizione l\2 > cHl2
indica che nell’ intervallo di tempo tra i due eventi nessun « segnale »
si può trasmettere dal punto dove è accaduto l ’evento I a quello in
cui accadrà l ’ evento II. Di conseguenza, eventi separati da un inter­
vallo del genere spazio non possono avere relazione causa-effetto.

86
Allora, la teoria della relatività ristretta è in grado di indicare le
condizioni secondo cui è possibile o meno una relazione causa-effetto.
E un criterio molto importante che non può essere ricavato in forma
generale da altre premesse. Bisogna sottolineare una volta di più,
che tutti i nostri ragionamenti sono basati sulla velocità finita dei
segnali trasmessi.
c)
siano o simultanei, o nello stesso punto, cioè siano soddisfatte le due
condizioni t'12 = 0 e Z'2 = 0, sarebbe necessaria una verifica contem­
poranea delle due disuguaglianze s12 ^ 0 e s'12 ^ 0. Questo è possibi­
le soltanto se s12 = 0 e s '2 = 0. Se i due eventi in questione non rap­
presentano rin vio e la ricezione di segnali luminosi, gli intervalli
possono essere uguali a zero solo nel caso in cui i due eventi coincido­
no in ognuno dei riferimenti K e K ' . Ovviamente la coincidenza
degli eventi non dipende dalla scelta del sistema di riferimento.
L ’intervallo fra due eventi che accadono in un dato riferimento
in punti diversi e in istanti diversi, uguale nel valore assoluto a ze­
ro, è conveniente chiamarlo intervallo del genere luce. Un intervallo
del genere luce lega eventi che consistono nel passaggio consecutivo
di un’ onda di luce per vari punti dello spazio. Ci siamo assicurati
di ciò all’ inizio del § 2.6.

§ 3.5. Trasformazione delle


componenti della velocità di una
particella nel passaggio da un
sistema di riferimento
inerziale ad un altro
Dalle trasformazioni di Galileo per le coordinate e il tempo (1.2)
si è ottenuta la regola (1.4) di trasformazione della velocità della
particella nel passare da un SRI ad un altro: v’ = v —■V. Questa
regola non soddisfa il secondo postulato di Einstein, in quanto la
velocità della luce nel vuoto risulta diversa in differenti sistemi di
riferimento. Le formule di trasformazione per la velocità, che deriva­
no dalle trasformazioni di Lorentz, soddisfano i postulati di Einstein.
Ora si procederà a ricavare queste formule.
Consideriamo il moto della particella in termini di due SRI,
K e K ' . Le velocità sono determinate come al solito:
nel riferimento K nel riferimento K r
se se
x = x(t)> y = y (t), z = z{f), x' = x' (f'), y' = \ f '), =
allora allora
dx dz_ , dx' , du' t dz'
vX -- di 9 vv di 1 v* = ~dT' vy = ^ T ’ V* = 1 F -
Si intende che tra x, t q x\ tr è stabilita la relazione (mediante
le trasformazioni di Lorentz) in modo che £, ad esempio, si possa

87
assumer© come variabile indipendente. Quando t varia di dt, tutte
le variabili subiscono un incremento; differenziando le trasformazioni
di Lorentz (vedi la (2.16)), otteniamo in termini di differenziali
dx = F (dxf -j- V di’ ), dy — dy\

dz=

Dividendo termine a termine le prime tre uguaglianze della


(3.25) per l ’ultima, otteniamo
dx dx -\~V di' dy dy

dz dzr

In ciascuna delle uguaglianze ottenute dividiamo numeratore e de­


nominatore dei secondi membri per dt\ otteniamo infine

i / “ ZI
e2
(3.26)

Queste sono le formule della trasformazione relativistica delle


velocità. Mediante queste si possono trovare le componenti della
velocità vx, vy, v z nel riferimento K a partire da quelle vx, %, vz
nel riferimento K ! e la velocità del riferìniento K rispetto a K l
(questa velocità risulta —V). Per ottenere le formule della .trasfor­
mazione inversa, bisogna cambiare il segno della velocita V, mettere
l ’ apice alle grandezze senza apice e toglierlo a quelle con apice:
Vy V 1 -1 r , :__ vz V 1-— B2 ^
vx — V
(3.27)
1— B vx 1—B - 1_B —
c
Naturalmente si ottiene lo stesso risultato direttamente dalle formu­
le (3.26)= Si vede dalle (3.26) e (3.27) che un moto uniforme in un
SRI lo sarà in tutti gli altri SRI. Quindi, il moto rettilineo ed uni­
forme si distingue dagli altri tipi di moto. Al contrario, secondo la
cinematica relativistica un moto uniformemente accelerato in un
certo SRI può non esserlo in altri SRI (vedi § 5.1).
Nelle (3.26) e (3.27) Passe x si distingue dagli assi y e z. Ciò è
dovuto al fatto che la velocità relativa dei riferimenti K e K ! è
diretta lungo Passe x. Torniamo alla trasformazione di Galileo (1.4)
passando al limite B -> 0, cioè assumendo formalmente c oov
Ciò significa che per due riferimenti, la cui velocità relativa è picco­
la rispetto a quella della luce, le trasformazioni di Galileo sono
sufficientemente esatte, perciò non dobbiamo ricorrere a concetti

88
relativistici nella vita quotidiana. Ci siamo convinti di nuovo che
la differenza tra i concetti classici e quelli relativistici è legata alla
limitatezza della velocità della luce. Notiamo che le formule (3.26)
e (3.27) si ottengono, naturalmente, in base a un approccio quadridi­
mensionale alla teoria della relatività.
Consideriamo il moto lungo l ’ asse x ' . In questo caso le componenti
della velocità nel riferimento K f saranno vrx = v’\ vv = 0, v'z = 0.
Dalle (3.26) si vede che nel riferimento K le componenti vy e v z
sono uguali a zero. Di conseguenza, nel riferimento K il moto avviene
lungo l ’ asse x e vx = v. Perciò, secondo la (3.26),
v '+ V
v V ® (3.28)
l+ i » ’

Ponendo v' = c, otteniamo v = c dalla (3.28). Questo corri­


sponde al secondo postulato di Einstein: la velocità della luce nel
vuoto è la stessa in tutti i SRI.
Notiamo subito che la sostituzione v' = c nella (3.28) non è
molto conseguente in quanto le particelle materiali, che rappresenta­
no un « segnale », non si possono muovere alla velocità c, mentre la
formula è dedotta per particelle materiali (m^= 0). Comunque, si
può assumere v± = c nella (3=28) considerando i quanti di luce (foto­
ni) come particelle relativistiche (§ 7.6). Inoltre, ci sono particelle
ultrarelativistiche la cui velocità è vicina a quella della luce. Per
esempio, la velocità degli elettroni nell’ acceleratore elettronico di
Erevan differisce da c all’ ottava (!) cifra decimale.
Daremo ora la spiegazione dei risultati di Fizeau come un altro
esempio di utilizzazione della formula della composizione delle
velocità (3.28). In questo esperimento la velocità della luce che si
propaga nell’ acqua a riposo rispetto all’ osservatore (laboratorio)
viene confrontata con quella che si propaga nell’ acqua in moto con
velocità V. La velocità della luce nell’ acqua a riposo è uguale a c!n,
dove n è l ’ indice di rifrazione dell’ acqua. La luce veniva fatta passa­
re attraverso l ’ acqua in moto (fig. 3.7), e la sua velocità veniva
determinata nel sistema di riferimento del laboratorio mediante
l ’ interferenza di due fasci luminosi, uno nel verso di scorrimento
dell5acqua e l ’ altro in senso opposto. Segue dai risultati ottenuti
nell’esperimento di Fizeau che alla velocità di fase della luce nel­
l ’ acqua in quiete si deve aggiungere la velocità dell’ acqua V moltipli­
cata per (1 — Un1). Quindi, se la velocità di fase della luce nell’ ac­
qua in quiete è v* = clnì la velocità di fase, determinata nel rife­
rimento del laboratorio, risulta essere

<3-29>

Usando la formula (3.28), si conclude cbe in virtù della legge della


trasformazione delle velocità nel riferimento del laboratorio

89'
si ha

v '+ V
V , „, v , / V \2 •
1 d------
1+ - ^ y cn L- [ ™ )
Trascurando la grandezza (V/cn)2 a denominatore la cui piccolezza
è dovuta alla velocità non relativistica dell’ acqua ((Vic)2 <C 1),
otteniamo

-V
Nell’ espressione (3.30) nella stessa approssimazione trascuriamo il
termine T/2/c2 ed otteniamo il risultato di Fizeau (3.29). Quindi la

Fig. 3.7. Schizzo schematico dell1esperimento di Fizeau. Una lamina semitraspa-


xente PP separa il raggio di luce proveniente dalla sorgente in due fasci di luce,
uno lungo il flusso d’ acqua e l’ altro nel verso opposto. Fresnel, che studiava la
propagazione della luce in un mezzo in movimento, supponeva che se la velocità
della luce nell’ acqua immobile fosse v e quella della corrente d’acqua 7, la
velocità della luce v per l’ osservatore, rispetto a cui l ’ acqua si muove, sarebbe
v — v' ± kV, dove il segno « + » corrisponde alla propagazione della luce lungo
la corrente dell’acqua, e il segno « — » alla propagazione in senso inverso;
k è chiamato coefficiente di trascinamento. Questo coefficiente fu cercato da
Fizeau, che ha condotto l ’esperimento descritto. È derivato da questo esperi­
mento che k — I r — 1In2. La teoria della relatività spiega naturalmente il
risultato di Fizeau (vedi il testo). I dettagli dell’esperimento si possono trovare
nei libri [13] e [15].

formula di Einstein della trasformazione della velocità fornisce una


naturale interpretazione dei risultati dell’ esperimento di Fizeau
(vedi § 1.7).
Abbiamo già menzionato che l ’ assunto più importante della fisica
contemporanea è Faffermazione circa l ’ impossibilità di trasmissione
dei segnali (interazioni) ad una velocità superiore a quella della
luce. Senza dubbio, con l ’ aiuto di un corpo in moto si può trasmette­
re un segnale (energia, impulso), perciò la velocità di questo corpo
non può superare c. La meccanica relativistica si spinge a dire che la

90
velocità di un corpo materiale (cioè con massa a riposo) è sempre
minore di c e non raggiunge mai tale valore. Ma questo è valido
in un.dato SRI. È possibile scegliere un SRI tale che in esso la velo­
cità di un corpo sia maggiore di c?
Se dalla .meccanica classica seguisse che in un dato SRI la veloci­
tà di un corpo non supera mai la velocità c, si potrebbe ottenere una
velocità maggiore di c mediante la scelta di un riferimento appro­
priato. Infatti secondo la formula (1.4) v = v + V, dove v è la
velocità del corpo rispetto al riferimento K' e V è la velocità relativa
dei riferimenti K e K ' . Se le velocità v* e V superano 0,5c, la veloci­
tà v del corpo nel riferimento K sarà più grande di c.
Ma nella TR R le trasformazioni delle velocità si ottengono in
modo diverso. Si vede dalle (3.26) e (3.27) che le velocità delle parti-
celle non si sommano secondo la regola della composizione dei
vettori. Pertanto, la somma delle velocità nella TR R obbedisce
all’ incredibile regola c + c = c.
Segue dalle formule (3.26) e (3.27) che se le velocità della particel­
la è minore di c nel riferimento K {vie <C 1), la velocità della parti-
cella determinata nel sistema K ' è sempre minore di c. La dimostra­
zione più semplice di questa affermazione per il caso del moto unidi­
mensionale si ricava per mezzo della formula (3.28). Avendo formato
l ’espressione (vie — 1), scriviamo la seguente catena di uguaglianze:

v' Vv'
c T + T -1 c
^ -i
c A 1 Vvf
1 c2 h - £

V'
c
<0. (3.31)
Vv'
i+

Da qui è chiaro che v < c.


Ma è possibile rendere maggiore di c la velocità relativa dei siste­
mi di riferimento mediante passaggi consecutivi da un SRI all’ altro.
In senso stretto, un sistema di riferimento è un sistema di corpi
materiali, perciò per rispondere alla domanda possiamo far uso del
teorema già formulato. Certamente, nella TRR. non si può in ogni
caso ottenere una velocità relativa maggiore di c. Ma otterremo di
nuovo questo risultato con un altro metodo, che è istruttivo di
per sé.
Introduciamo, oltre al riferimento K , due altri riferimenti K f
e K". Qual è la velocità relativa dei riferimenti K e K " , se sono
conosciute le velocità relative dei riferimenti K e K ' , da una parte,
e, dall’ altra, dei riferimenti K' e K "? Supponiamo che la velocità
relativa di K e K' sia uguale a V e che quella di K' e K" sia uguale

91
a W. Se introduciamo le notazioni B1 = e ,B2 = W/c e, corri­
spondentemente, 1/Tj =

a-= r s

x' = T2 (x" + W
f),t' = + (3.33)

Sostituendo le (3.33) nella (3.32) troviamo la relazione, esplicita tra


le coordinate e il tempo nei riferimenti K e K"
x == r 4r 2 (ar + Trr + V f + BiB2r /) =
- ^ { ( 1 + B iB2) x " + ( V + W ) t " } =
= r 1r 2 ( i + B 1B!) ( I - + 1i ± 5 - r ) . (3.34)

modo si ottiene

t = TiT2(l + BjBa; (3.35)


Denotiamo
y+TF _
* tZ ,= u . (3.36)

Calcoliamo i primi fattori nelle espressioni (3.34) e (3.35):

r 4r 2 (i + B tB 2) = — 1 — =
■ A (1 — Bf) (1— B|)
V (1 + B jB ^
1
l + BfB| + 2B1Ba- ( B ? + B I + 2 B 1Ba)
] / (i+ B A P
1
A / B. + B, \2 lV/* l -c»O l
V [ H B A j
Quindi dalle (3.34) e (3.35) si ottiene

T -- x" +1 U t " t— c
!

S>|"«
1

Di conseguenza, le due trasformazioni di Lorentz successive con


le velocità V e W dei riferimenti sono equivalenti ad una trasforma-
zione con la velocità relativa U determinata secondo la (3.36). In
altri termini, le velocità relative dei sistemi di riferimento « si
sommano » anch'esse in accordo con la regola (3.28). Ma abbiamo
già notato che una tale somma non produeejana velocità maggiore
dì quella della luce.
La formula (3.36) si può ottenere facilmente mediante una rota­
zione complessa (vedi § 2.8). In termini geometrici il passaggio da K

92
a A ' e quindi da A ' a A" costituisce una rotazione consecutiva nel
piano (x, t) degli angoli <pv e <p2 con tg cpx = iB1 e tg cp2 = iB 2.
La tangente dell5angolo risultante si può trovare mediante la
formula convenzionale per la tangente della somma di due angoli
(q> = q>! + cp2):
tg <Pi + tg cpa
tgcp
l~ tg c p r t g <p2

ó ;'
,"15 _ iB2
i + B.B, ’
che è proprio la formula (3.36) con B, Bx e B 2 rimpiazzati dai loro
valori. Le due ultime espressioni mostrano che l ’ insieme delle
trasformazioni di Lorentz possiede la proprietà fondamentale di un
gruppo (dal punto di vista della teoria dei gruppi): due trasformazio­
ni di Lorentz successive producono ancora una trasformazione di
Lorentz (è essenziale in questo caso che la velocità relativa è sempre
diretta lungo Tasse x).
Riportiamo Tinterpretazione utile della formula (3.28). Nel
§ 2.7 abbiamo introdotto il parametro # associato alla velocità
relativa dei sistemi di riferimento mediante la relazione B = —th d.
Possiamo introdurre anche il parametro di velocità di una particella
P = —th d. Allora la (3.28) prende la forma seguente:
th 0' + th f l _
(3 = th 0 - t h (0' + #); (3.37)
1+P'B 1+ th O' -th u ~~
Tultimo passaggio dell’equazione è scritto in accordo con le equa­
zioni dell5Appendice I, § 9. Questo è un risultato interessante.
Nella teoria classica, sono le velocità (2.4) che si sommano, mentre
nella teoria relativistica sono i parametri di velocità; quest’ultimo
aspetto verrà usato nel § 5.7.

§ 3.6. Trasformazione del valore


assoluto e della direzione della
velocità di una particella
Dalle formule della trasformazione delle componenti della velocità
(3.26) si possono ottenere le espressioni che determinano il valore
assoluto e la direzione della velocità nel riferimento A , una volta
note le componenti della velocità nel riferimento A ' . Prima di tutto,
è evidente che se la componente della velocità v'z = 0 nel riferimen­
to A \ la componente v z = 0 anche nel riferimento A . Questo signi­
fica che se il moto nel riferimento KJ avviene nel piano (x\ z/'),
anche il moto nel riferimento A avverrà nel piano (x , y). Scegliamo
gli assi x f e y ! in modo che la velocità della particella sia nel piano
(A , y') del riferimento A '. Allora è chiaro che se d ' è l ’ angolo fra la
direzione della velocità v' e l ’ asse x\ allora v'x = v' cos d ', vry =
= v' sin d f. Denoteremo con d l ’ angolo fra la direzione della veloci-

93
tà v e l ’ asse x nel riferimento K, di conseguenza vx = v cos ft, vy =
= v sin ft. Troviamo le formule che legano v e ft a v' e ft'. Avendo*
espresso le componenti v'x e in termini di v' e ft', riscriviamo le
prime due formule della (3.26) nella forma seguente:
v' c o s t ì ' + 7
v cos ft =
= 1 + »> y B ’

v' sin •&' V i — Bz


v sin ft = (3.38)
1 + i Acps»<

Dividendo la seconda formula per la prima, otteniamo l ’ espres­


sione per tg ft:

(3.39)

Per trovare l ’ espressione del valore assoluto della velocità, è suffi­


ciente elevare al quadrato e sommare termine a termine le uguaglian­
ze (3.38); si otterrà subito
W + V Y -^ [W Y
j/ 2+ 7 2+.2 i/ 7 cos ft'— i /2B2 sin2 ft'
v ' COS tì' - g j 2
( h -

(3.40)
Segue dalle formule (3.39) e (3.40) che l ’ angolo d’ inclinazione della
velocità rispetto al corrispondente asse x (ricordiamo che gli assi x
e x coincidono), e il valore assoluto della velocità cambiano nel
passaggio dal riferimento K ' a K (fig. 3.8, a). Naturalmente, lo
stesso avviene in meccanica classica, anche se descritto da altre
equazioni.
Ora deriviamo un’utile formula dalla (3.40). Ci servirà nel capi­
tolo V II. Usando la prima uguaglianza della (3.40), formiamo
l ’ espressione seguente:
/ d'V V2v'2
( l “)— cosft' J — v'2— C2— 2 y '7 co sft'ft — sin2 ft'

c2 ( i - r f t ^ 003^ ') 2

(1 -g -) (1 -g .) ,

c2 ( 1+ 4 ^ COS’&' ) 2 ( l + - ^ - COSQ'Y
Di conseguenza
V2
/ ‘-ìr -V *-
/ ‘ ~S~ a , u'v a,
IH— — cos ft
(3.41)

94
0
Y 1— P'2 / l — Ba
V i — P2= (3.42)
1 + P'B cos fP

Dalla (3.41) è facile ottenere anche un’equazione per il quadrato


del valore assoluto della velocità:

v2 = c2 -
(*--£) (--so (3.43)
(‘+^r
da cui segue immediatamente che se v i e e Vie sono minori di uno,
anche v *< c. Per il caso particolare, quando la velocità veniva deter­
minata dalla (3.28), lo stesso teorema è stato dimostrato in preceden­
za. La formula (3.43) si può ottenere, naturalmente, elevando al
quadrato e sommando entrambi i membri della (3.26).

Fig. 3.8. a) Una particella si muove nel piano {x\ y') del riferimento K '. L’angolo-
d’inclinazione della sua velocità rispetto all’ asse x' è Ù', con tg ù ' — Vylvx. Nel
riferimento K le componenti vy e vx variano secondo la (3.26), da cui è chiaro
che l ’ angolo O non è più uguale a il' (vedi anche la (3.39)). Per il caso illustrato
nella figura, tK > ù. b) La luce si propaga nel riferimento K' lungo l ’asse y\
cioè lungo la perpendicolare al moto del riferimento. È evidente che vx = 0,
v'y = c, = ni2. Nel riferimento K, secondo la (3.26), vx = V, vy —
— c )/* 1 — B2, da cui tg ù = Y 1 — B2/B. L ’ angolo di aberrazione è formato
dalla direzione apparente della luce in arrivo nel riferimento if e la direzione
delia luce nel riferimento K ', l’ angolo formato con l ’asse y. L’angolo di aberra­
zione è a = jt/2 — iL

Dalle formule (3.38) e (3.39) si possono ottenere le equazioni


che determinano la variazione della direzione dei raggi luminosi nel
passaggio dal riferimento K' a quello K. In questo caso, assumendo
v1 = c nella (3.43), si ottiene, come è previsto, v = vr = c. Tenendo'

93
conto di ciò, otteniamo dalle (3.39) e (3.38), rispettivamente
Y 1 62

(3.44)
t g '&= 7“ sin d ' $
B + cos d
V 1—B2 cos d ' + B
(3.45)
sin d — —s in d ', cos d = 1 + B~cosìF~ °
1 + B cos d
L ’ equazione (3.45) descrive Vaberrazione della luce che avviene
quando il fronte d’ onda dell’ onda luminosa cambia la sua direzione
nel passaggio da un SRI ad un altro. Supponiamo che la luce nel
riferimento K f si propaghi lungo la perpendicolare alla direzione di
moto, per esempio, lungo l ’ asse y' (fig. 3.8, b)\ questo significa che
d ' — ji/ 2. Quindi, secondo la (3.44), tg d = ]/" 1 — B2/B.
È conveniente chiamare angolo di aberrazione l ’ angolo formato
dalle direzioni visibili del raggio nei due SRL Nel riferimento K r
la luce si propaga lungo l ’ asse z/', mentre nel riferimento K sotto un
angolo a = jt/2 — d rispetto all’ asse y. Ovviamente l ’ angolo a
è l ’ angolo di aberrazione e
B
tg oc = tg — ft) = cotg ft
Y i —B2 ‘
Il calcolo dell’ angolo di aberrazione a secondo le trasformazioni
di Galileo (fate da soli il calcolo!) fornisce tg a,. = B. Questo signifi­
ca che la formula relativistica differisce da quella non relativistica
per un termine dell’ ordine di B3.
Si possono facilmente ottenere le equazioni per l ’ angolo di aber­
razione nel caso in cui la luce cade sotto un angolo arbitrario rispetto
alla direzione di moto. Assumeremo che B < i. Quindi, in accordo
con la (3.45),
sind — — ^ B 2+ .. BJ (1 —Boos'd'4 - . . . ) sind'.

Tralasciando tutti i termini a partire da B2 e più alti, otteniamo


sin d — sin d ' = —B sin d ' cos d\
L ’ angolo d ' — d — Ad è l ’ angolo di aberrazione. Dato che il secondo
membro, proporzionale a B, è piccolo, anche Ad è piccolo:
a . n, n d+ d' . d—d' a;f a A
sin d — sin d = 2cos — — sin — ^— « — cos d Ad.
Di conseguenza
Ad = B sin d\ (3.46)
Questa è una formula elementare descrivente l ’ aberrazione della luce
che cade sotto un angolo d ' nel riferimento K f. La fig. 3.8 illustra li
cambio di direzione della velocità della particella nel passaggio dal
riferimento K f a K, come anche il calcolo dell’ angolo di aberrazione
nel caso di luce che incide perpendicolarmente (rispetto al moto).
Per il ruolo che ha giocato l ’ aberrazione nello sviluppo della TR R
vedi il Supplemento IL

96
Per concludere, calcoliamo la velocità relativa di due particelle.
È naturale determinarla come la velocità di. una di esse nel riferi­
mento K in cui un’ altra è a riposo. Siano -o[ e v'2 le velocità delle
particelle nel riferimento K '. Scegliamo il riferimento K in modo die
V = — Le velocità delle particelle si determinano immediata­
mente dalla (3.40). Il valore assoluto della velocità v2 è uguale a
zero, mentre quello della prima particella è

(3.47)

Questa espressione definisce il quadrato della velocità relativa delle


due particelle. L ’espressione (3.47) è simmetrica rispetto a v1 e v2.
È stato mostrato per la formula (3.40) che v“ è sempre minore
di c2 (vedi la (3.43)); questo è valido anche per la (3.47): la velocità
relativa delle particelle non può superare la velocità della luce nel
vuoto,
§ 3e?* Metodo del coefficiente k
(metodo radar)
Presenteremo ora un elegante metodo per ottenere le conseguenze
basilari dei postulati di Einstein. Questo metodo si potrebbe esporre
in breve, riferendosi ai risultati ottenuti precedentemente con altri
procedimenti. Comunque, si intende riprendere alcune conclusioni
in modo da rendere autoconsistente questo paragrafo. Il metodo è
notevole in quanto evita l ’impiego esplicito delle coordinate (anche
nella derivazione delle trasformazioni di Lorentz). Sebbene le illu­
strazioni grafiche usate più avanti comprendano le coordinate, esse
hanno carattere ausiliario: queste coordinate non sono indispensabili
per l ’ esposizione ma sono utili per chi ha familiarità con i diagrammi
spazio-tempo.
Si considera soltanto una coordinata spaziale: molte peculiarità
della TRR si rivelano già iu questo caso, che è più semplice e ammet­
te illustrazioni. Allora, supponiamo che gli eventi avvengano sul­
l ’ asse x (e rispettivamente sull’ asse coincidente x del riferimento K ' ,
vedi fig. 1.2). Tutti i ragionamenti usati nel metodo del « coeffi­
cient e k » rappresentano esperimenti ideali che consistono principal­
mente nello scambio di segnali luminosi nel vuoto; si esaminerà il
loro invio, la riflessione e la ricezione. Nell’ analisi finale, questo
gioco con raggi di luce permette di ottenere le conseguenze basilari
dei postulati di Einstein.
L ’ assunzione principale che si fa nei metodo del coefficiente k
si basa sull’effetto Doppler (vedi § 3.3). Nel caso unidimensionale
si tratta sempre di effetto Doppler longitudinale. Quindi, se in un
certo punto del riferimento K è collocato un radar fisso che emette
brevi impulsi con intervallo (periodo) T, un osservatore nel riferi­
mento K l che si allontana dal radar con velocità costante noterà

97
che l ’ intervallo fra gli impulsi in arrivo sarà differente, nonostante?
il fatto che l ’ orologio fissato a] radar e quello dell’ osservatore in K r
vadano nello stesso modo.
Per semplicità non parleremo di radar e ricevitore, ma di due­
osservatori A e A ' a riposo rispettivamente in K e K ' . Quindi, se-
l ’ osservatore A invia segnali luminosi separati, secondo il suo orolo­
gio, dall’ intervallo 7\ l ’ osservatore A ' li riceverà (secondo il suo
orologio) separati da un diverso intervallo di tempo. Designane
questo intervallo con k T . In questo modo appare il coefficiente /q.
la grandezza chiave del metodo in questione.
Sottolineiamo che T e kT sono intervalli temporali tra l ’ invio
del primo e del secondo segnale da parte dell’ osservatore A e la
ricezione di questi segnali dall’ osservatore A ', misurati mediante-
gli orologi che sono a riposo, rispettivamente, in K e K ' .
Partendo dalle proprietà principali dello spazio e del tempo,,
l ’uniformità e l ’ isotropia, si può assumere che il coefficiente k non
dipende né dalla posizione del ricevitore e della sorgente né dal
tempo d ’ invio e di ricezione del segnale, né dalla direzione in cui
s’ invia il segnale (in altre parole, si può scegliere arbitrariamente la
direzione dell’ asse comune x, x nello spazio). Certamente, questa
coefficiente non dipende dall’ intervallo tra l ’ invio dei segnali. Esso
può dipendere soltanto dalla velocità relativa degli osservatori A
e A'. Infatti, come mostra l ’ esperienza, la variazione della frequenza
della luce nell’effetto Doppler dipende soltanto dalla velocità del
moto relativo.
E evidente la ragione della comparsa del coefficiente k. Sup­
poniamo che l ’ osservatore A si trovi all’ origine del sistema K ed
invii dei segnali luminosi all’ osservatore A ' posto all’ origine del
riferimento K ' . Il riferimento K' si allontana da K verso destra.
Supponiamo che il primo segnale venga inviato all’ istante t. È facile
allora stabilire l ’ istante iq, secondo l ’ orologio dell’ osservatore A r
in cui l ’ osservatore A ' riceve il segnale. Infatti, il segnale che sì
propaga a velocità c deve percorrere nel tempo iq, in primo luogo, la
distanza Vt che separava gli osservatori A e A ' all’ istante t. e*
secondo, la distanza V%1 che è percorsa dall’ osservatore A ' nel tem-
y

po rq: ciq = Vt + Eiq, da cui rq = c_~~ t. Il secondo segnale viene


emesso all’ istante t -f- T e raggiunge A ' nel tempo t 2 definito dalla
y T )
relazione ct2 = V (t + T) + E t 2, da cui t 2 = - ^ . La diffe­

renza t 2 — x1 — T fornisce l ’ intervallo di tempo tra i segnali


ricevuti da^ l'. Comunque, non abbiamo ancora trovato l ’espressione
del coefficiente /c, benché possa sembrare il contrario. Il coefficiente
k deve apparire appena si ottiene l ’ intervallo di tempo tra i segnali
in arrivo registrati dall’ orologio de\Yosservatore A'. Ma non abbiamo
ancora determinato la relazione fra le letture degli orologi A e AV

98
Finora abbiamo fatto uso soltanto dell’ uniformità e dell’isotropia
del tempo e dello spazio. Ora useremo la costanza della velocità della
luce nel vuoto in tutti i SRI. Useremo spesso questa proprietà della
luce. La condizione si può formulare come segue: « la luce non può
sorpassare la luce ». Ora passiamo al problema che utilizza esplicita­
mente l ’ equivalenza di tutti gli osservatori inerziali (cioè il primo
postulato di Einstein).
Siamo d ’ accordo che i segnali inviati dall’ osservatore A con un
intervallo di tempo T saranno ricevuti dall’ osservatore A ' (secondo
il suo orologio) con un intervallo kT . Data l ’ equivalenza degli osser­
vatori dobbiamo supporre che i segnali inviati dall’ osservatore A'
con un intervallo T saranno ricevuti da A ad intervalli kT (principio
di relatività per gli osservatori inerziali A e A').
È importante rilevare che questo assunto è basato fortemente
sul fatto che il vuoto non contiene alcun mezzo in cui si propaga la
luce. Se un tale mezzo dovesse esistere, il coefficiente k dovrebbe
dipendere dalla velocità degli osservatori A e A ' rispetto a questo
mezzo. Fu proprio questo mezzo (etere) ad agitare più di tutto le
menti dei fisici del X IX secolo; esso causò una serie di situazioni
drammatiche che precedettero la scoperta della TRR (vedi Supple­
mento II). Al presente è ragionevole adottare il punto di vista con­
temporaneo.
Ora troveremo l ’espressione esplicita del coefficiente k in termini
del moto relativo. In questo procedimento non serve altro che alcuni
esperimenti ideali sull’ invio, la ricezione e la riflessione dei segnali
luminosi. La riflessione può essere trattata, se è necessario, come
l ’ invio dei segnali da parte dell’ « osservatore » nella direzione oppo­
sta nell’ istante in cui riceve il segnale diretto.
Supponiamo d ’ inviare il primo segnale dall’ osservatore A a quel­
lo A r nell’ islante in cui i riferimenti K e K' coincidono. Gli osserva­
tori A e A ', ognuno dei quali si trova nell’ origine del proprio
riferimento, a quell’ istante si trovano nello stesso punto dello spazio.
Naturalmente, la trasmissione del segnale da A a A ' e del se­
gnale opposto da A ' ad A non richiede alcun tempo. Dopo l ’ interval­
lo di tempo T secondo il suo orologio l ’ osservatore A invia un segnale
di luce all’ osservatore A ' che lo riceverà con un intervallo kT dopo
il ricevimento del primo. Supponiamo che A ' mandi indietro ad A
un segnale istantaneamente con la ricezione del secondo segnale
(come una riflessione speculare). I due segnali sono separati dall’ in­
tervallo kT secondo l ’ orologio di A '. Quindi, il segnale di ritorno
sarà inviato da A ' ad A dopo questo intervallo. Ma l ’ osservatore A
non lo riceverà dopo l ’ intervallo k T ; questo intervallo sarà aumenta­
to di k volte e diventerà uguale a k2T. Quindi, secondo l ’ orologio
di A il secondo segnale opposto sarà ricevuto all’ istante k2T. Di
conseguenza, dal punto di vista dell’ osservatore A l ’ intero percorso
del secondo segnale (inviato all’ istante T) verso l ’ osservatore A ' e
indietro era uguale a k2T — T = (k2 — 1) T. Poiché la velocità
della luce è la stessa nelle due direzioni, il tempo di propagazione

99
da A ad A f (o indietro) è uguale a ~ (k2 — 1) T. Da ciò segue che
la determinazione della distanza mediante un radar tra A e A
(al momento della riflessione) fornisce il valore y (kr — 1 ) Tc.
Così abbiamo trovato la distanza fra gli osservatori A e A f
all’istante in cui si riflette il segnale. Ma a che istante avviene la
riflessione secondo l ’ orologio di A? È da notare che parliamo di
orologio posto vicino all’ osservatore A , mentre l ’ evento (la rifles­
sione del segnale nel punto in cui si trova A ') viene considerato nel
punto lontano da A . In questo caso non possiamo misurare diretta­
mente il tempo dell’ avvenire dell’evento, ma dobbiamo assegnare
ad esso un determinato istante di tempo.
Il secondo segnale viene inviato all’ istante T ed è ricevuto di
nuovo all’ istante k2T . Quindi, l ’ istante della riflessione verrà deter­
minato come ~ ( T + k2T) = y (k2 + 1) TV Di conseguenza, du­

rante l ’ intervallo di tempo — (k2 + 1) T l ’ osservatore A f si sposterà

dall’ osservatore A della distanza y (/r — 1) Tc. Quindi la velocità


relativa dell’ osservatore À f è

(A:2— 1) Tc V — 1
V = —__________ (3.48)
P+ l
± ( k * + i)T ’
Ne segue perciò 1

* = }/■ i ± | . (3.49)

Scriviamo subito le due formule che ci serviranno in seguito:


i:z + ' l 1 —1
(3.50)
2k ~ Y i — B* ~ ~ ’ 2
E molto comodo fare uso di un grafico che permette di rappre­
sentare in modo evidente i risultati ottenuti. Introduciamo un siste­
ma di coordinate cartesiane nel piano con assi nr e et. Si vedrà più
avanti che la scelta di coordinate spaziali e temporali con le stesse
dimensioni è inevitabile. Per ora prendiamo semplicemente sul-
Passe delle ordinale la grandezza t proporzionale al tempo: % — et.
Gli assi x e % sono disegnati nella fig. 3.9. Ogni punto del piano
rappresenta un evento definito dalle coordinate (x, t). II moto di un
corpo è una successione di eventi, considerati nell’ arrivo del corpo
in un dato punto in un certo istante ed è rappresentato da una curva
nel piano (x, t ).

1 Più avanti si vedrà che questa formula determina il cambiamento di


frequenza della luce riflessa da uno specchio in moto (vedi § 7.5).

100:
In questo piano il moto uniforme è rappresentato da una retta.
La propagazione di un raggio luminoso a velocità c è rappresentata da
una bisettrice (l’ equazione x — x) che passa nei quadranti I e III,
se la luce si propaga nella direzione delle x positive, e nei quadranti
II e IY se la luce viaggia in direzione opposta. Poiché la velocità
di un corpo è sempre minore di quella della luce, il moto uniforme
di ogni corpo è rappresentato da
una retta che forma un angolo
minore di jt/4 con l ’ asse x.
È facile trovare i punti del
piano che illustrano il moto degli
osservatori A e A'. Nel riferimen­
to K (che è mostrato nella fig. 3.9)
A è a riposo (supponiamo che sia
posto nel punto x — 0). Quindi
la sua «linea d ’universo », cioè la
successione dei punti nel piano
(x, t) corrispondenti agli eventi
che consistono nell’ essere in un
certo istante in un dato punto,
sarà semplicemente l ’ asse delle
ordinate. Dunque, l ’ asse delle
ordinate è la linea dell’universo
dell’ osservatore A. La linea del­
l ’universo dell’ osservatore A f nel Fig* 3.9. Illustrazione grafica per la
riferimento K è una retta incli­ determinazione della velocità relativa
nata rispetto all’ asse x di un dei due osservatori.
angolo oc, la cui tangente è de­
terminata dal rapporto tg a = x!% = xict — vie). Se all’ istante
t = 0 gli osservatori A e A ' si trovano in un punto, la linea
d’universo dell’ osservatore A ' passa per l ’ origine 0. L ’ invio e la
ricezione dei segnali luminosi da parte di A è illustrata dal
diagramma (x, x) come segue. Il primo « scambio » di segnali avviene
nel punto O. Quindi, dopo l ’ intervallo T (nel punto d’universo Aj)^
l’ osservatore A invia un segnale luminoso. La sua propagazione è
descritta dalla retta A XA [ parallela alla bisettrice. L ’ osservatore A r
riceverà il segnale luminoso nel punto d’universo A[. Il propagarsi
del segnale inviato da A ! nella direzione opposta è descritto dalla
retta A ' A 2- (parallela alla bisettrice dei quadranti II e IV che non
è rappresentata nella fig. 3.9). L ’ osservatore A riceverà il segnale
opposto nel punto d’ universo A 2. Secondo la condizione OA1 = T 1
e la definizione del coefficiente k, OA 2 = k2T . Nel riferimento K il
punto A[ è associato all’ istante A 3 (secondo l ’ orologio posto in
x = 0, cioè all’ osservatore A). Ovviamente, OAd = 1/2 {OA1 - f
+ OA2) -= 1/2 (,k2 + 1) T. Il tempo di propagazione del secondo

1 Nelle coordinate x bisognerebbe scrivere OAi — cT, ma per semplicità di


scrittura non lo faremo.
segnale da A ad A ' è, naturalmente, 1/2 (OA 2 — OA x) =
- 1/2 (A:2 - 1) T.
Di nuovo facciamo notare un utile teorema riguardante il coeffi­
ciente k. Si vede dalla (3.49) che il cambiamento di segno della
velocità relativa, cioè della grandezza B, trasforma la grandezza k
in Uh. Ciò significa che 1’ allontanamento e ravvicinamento con lo
stesso valore assoluto di velocità corrispondono a valori reciproci
di k. ‘
Consideriamo il caso in cui ci siano tre sistemi di riferimento
K , K' e K " e tre osservatori posti nelle origini corrispondenti
0, 0\ 0". Poniamo il coefficiente k uguale a k (A, A ' ) per gli
osservatori A e A'] esso dipende solo dalla velocità relativa dei rife­
rimenti K e K' (denotiamola, come prima, con V). Se la velocità
relativa degli osservatori A ' e A " è uguale a W , il coefficiente k
per questi osservatori, k (A\ A "), dipende solo da W. E possibile
trovare k (A, A ") se sono noti k (A, A ') e k ( A ' , A ")? Deriviamo le
equazioni richieste.
Supponiamo che A invii due segnali luminosi separati dall’ inter­
vallo T registrato al suo orologio. L ’ osservatore A ' che riceve questi
segnali troverà che essi sono separati dall’ intervallo k (A, A ') T ,
come segue dalla definizione del coefficiente k. Ma questo tempo
viene registrato con l ’ orologio dell’ osservatore A '. L ’ osservatore A ”
si trova più lontano da A dell’ osservatore A \ quindi i segnali,
sorpassando l ’ osservatore A ', procedono verso A ".
A ll’ istante in cui A ' riceve il primo segnale da A , invia egli
stesso, senza ritardo, un segnale luminoso ad A " (non c’ è da preoccu­
parsi, si tratta di un esperimento ideale!). Ora due segnali si propa­
gano verso l ’ osservatore A uno che viaggia da A e un altro inviato
dall’ osservatore A ' . Ma entrambi sono segnali luminosi, si propagano
alla stessa velocià, e sono inviati da A ' allo stesso istante. Infatti,
si propagano come un segnale unico.
La stessa procedura viene ripetuta dall’ osservatore A ' all’ istante
in cui arriva il secondo segnale da A. E ancora un segnale si propaga
da A ' a A ", formato dai due impulsi luminosi inviati da A e
da A '.
L ’ osservatore A " riceverà i due segnali. Da un lato, secondo la
definizione, egli registrerà col suo orologio che l ’ intervallo tra i
segnali è uguale a k (A, A " ) T. D all’ altro, questi segnali sono in­
viati dall’ osservatore A ' con l ’ intervallo tra essi k (A, A ') T. Se­
condo la definizione, l ’ osservatore A " troverà che l ’ intervallo tra
questi segnali è uguale a k (A*, A ")-k (M, A') T. Ma i segnali da A
e A r arrivano in A " simultaneamente, così che
k (A, A ") = k (A, A ' ) - k (A\ A "). (3.5l)
Il risultato è molto semplice. Conoscendo i coefficienti k per le
due coppie di riferimenti in cui entra un riferimento comune, si
possono ottenere i coefficienti incogniti k per i due sistemi rimasti,
moltiplicando i coefficienti k noti.

102
Graficamente questo risultato viene ottenuto nella fig. 3.10.
Vi sono tracciate le linee d ’universo dei tre osservatori A , A ' e A
T utti gli osservatori erano allo stesso punto 0 nell’ istante t = 0.
Dopo un intervallo T, l ’ osservatore A invia dal punto di universo A x
un segnale luminoso la cui linea
d’universo è rappresentata da una
retta tratteggiata T^A'T". Dalla
condizione OA± = T e dalla defi­
nizione O A [ = k (.A , A ') T, O A "=
= k (.A , T ") 71. D ’ altro canto,
■evidentemente, OA"± = fc (T\
T ") ( A , T ') 21. È da notare che
il diagramma proposto è adatto
soltanto per una descrizione gra­
fica degli « esperimenti ideali »,
ma non si può usare per una de­
terminazione geometrica delle
varie grandezze. Il piano (x, r)
mon è un piano euclideo conven­
zionale (vedi capitolo IV). Co­
munque, combinando una descri­
zione geometrica grafica con le
determinazioni algebriche, non si Fig. 3.10. Per la deduzione della
■dovrebbero fare errori. formula (3.51).
È facile trovare la formula eli
trasformazione delle velocità dei
sistemi di coordinate. Supponiamo di voler trovare la velocità rela­
tiva U dei riferimenti K e K ", supponendo note la velocità V dei
riferimenti K e K' e quella W dei riferimenti K ' e K ”.
Introducendo le notazioni familiari Vie = B tl e Wlc — B 2, otte­
niamo, in accordo con le (3.48), (3.49) e (3.51),
U __ k * - ì _ k*(A, A')-k*(A', A") — ì _ B1+ B2
c “ /c3+ 1 k*{A, V )-/c 2 ( t ', A") + ì ì Jr B 1B2 '
Passando alle notazioni convenzionali, otteniamo la formula
-di trasformazione delle velocità (3.28):

ì+ V
^•
Si vede dai ragionamenti citati che gli istanti in cui avvengono
gli eventi e gli intervalli tra di essi risultano diversi per osservatori
•di diversi SRI. Per metterlo in luce, ritorniamo all’esperimento ana­
lizzato prima che prevedeva lo scambio di segnali luminosi tra gli
osservatori A ed A '. Ricordiamo che il primo « scambio » avviene
all’ istante in cui gli osservatori si trovavano nello stesso punto.
Proprio in quel momento gli orologi di A c A ' sono regolati a segna­
re zero. Quindi dopo l ’ intervallo T del proprio orologio A invia un
segnale verso A '; per definizione, l ’ intervallo di tempo che separa la
ricezione del primo e del secondo segnale da parte di A ' è uguale

103
a kT secondo il proprio orologio. Comunque, l ’ osservatore A as­
segnerà all’ arrivo del segnale verso A ' il tempo 1/2 (k2 + 1) T
e assumerà che i segnali inviati da lui con un intervallo T raggiunge­
ranno A 1 con un intervallo 1/2 (k 2 + 1) T. Come già detto, Io stesso
intervallo secondo l ’ orologio A r è uguale a kT . Quindi, l ’ intervallo
di tempo tra due eventi identici, l ’ arrivo del primo e del secondo
segnale in A \ si dimostra differente: per A r è uguale a kT e per À
vale 1/2 (k2 + 1 ) T. Di conseguenza, abbiamo scoperto che il tempo
del verificarsi dell’evento (l’ arrivo del secondo segnale) è relativoi
è uguale a kT per ed a 1/2 (k2 + 1) T per A . Anche l ’ intervallo
fra i due eventi è differente. Tutto ciò indica che il tempo del verifi­
carsi di eventi, cosi come l ’ intervallo tra gli eventi sono grandezze
relative.
Con quali condizioni coincidono questi valori? Ciò accade quando
kT ex. 1/2 (k 2 + 1) T. Si può dedurre che ciò è possibile quando
k ~ l o , come si vede dalla (3.48), quando Vìe -> 0. Allora, la diffe­
renza nelle letture del tempo e la relatività degli intervalli temporali
tra eventi si possono trascurare in quei SRI le cui velocità relative
sono piccole rispetto a quella della luce.
Tempo proprio. Il metodo del coefficiente k permette di stabilire
facilmente una relazione tra Tintervallo che separa due eventi, avve­
nuti in un certo SRI in un certo punto dello spazio e, quindi, registra­
ti da un solo orologio (intervallo di tempo proprio), e un intervallo
di tempo fra gli stessi eventi registrato mediante due orologi di un
altro SRI in cui gli eventi considerati avvengono in punti diversi.
Torniamo allo scambio di segnali luminosi. Se A manda dei se­
gnali con un intervallo T secondo il proprio orologio, A ' li riceve
con un intervallo kT secondo il proprio orologio. Comunque, come
detto prima (pag. 100), questo intervallo è uguale ad 1/2 (IA + 1) T
in termini di A. Il rapporto fra queste grandezze fornisce la relazione
fra Fintervallo di tempo proprio Ar — kT e l ’ intervallo di tempo At
registrato da due orologi di un altro SRI. Questo rapporto è uguale a
At _ kT _ 2k _ l /r ~A V*
At l/ 2( / c2+ l ) r *2 + 1 ~ V 1 c2 ’

dove nell’ultimo passaggio si usa la relazione (3.48). Questo risultato


ci è ovviamente familiare.
Relatività delle lunghezze di un righello (distanze). Supponiamo dì
avere due punti fermi in un riferimento dove c ’ è l ’ osservatore A*
in quiete. Si può presumere (benché non sia obbligatorio) che questi
punti siano gli estremi del righello. Supponiamo che il righello si
muova dall’ osservatore A all’ osservatore A ' posto all’estremo del
righello che è vicino ad A (non dimentichiamoci che il righello è
orientato lungo la direzione della velocità relativa).
Per determinare la lunghezza del righello, l ’ osservatore A. invia
un segnale all’ istante tx (registrato col suo orologio) ed aspetta il suo
ritorno, dopo la riflessione dall’ estremità lontana del righello. Sia f 4
l ’ istante del ritorno elei segnale riflesso (secondo l ’ oroìogio di A ) a

104
Ovviamente, ristante della riflessione del segnale è uguale a
1/2 (tx + tk). Esattamente nello stesso modo, si può inviare un segna­
le alPestremità vicina del righello (diciamo, all’istante i2) e deter­
minare ristante del suo ritorno (ad esempio, t3). L’ istante della,
riflessione del segnale dall’estremità vicina è uguale a 1/2 (t2 + t3).
Affinché entrambi i segnali siano riflessi simultaneamente (secondo
l 5orologio di A ) da entrambe le estremità del righello, è necessario-
soddisfare la seguente condizione:

~2~ (^i + ^4) = ~y (h + 0) • (3.52)'

In un esperimento ideale questa condizione può essere soddisfatta


scegliendo i tempi d ’ invio del primo e del secondo segnale.
Ma il primo segnale da A l ’ osservatore A \ posto all’ estremo-
vicino del righello, lo riceverà all’ istante kt± (ricordiamo che la let­
tura iniziale degli orologi di A e A ' coincide quando gli osservatori
sono nello stesso punto). Il segnale riflesso dall’ estremo lontano del
righello che ritorna ad A all’ istante tk raggiungerà A ’ all’ istante-
t j k . Infatti, il segnale ricevuto da A ' all’ istante t j k raggiunge l ’ os­
servatore A all’istante (tjk)*k = tk.
Per l ’ osservatore A ' il doppio della lunghezza l0 del righello
viene determinato come Vintervallo di tempo, necessario perché
la luce raggiunga restremo lontano e torni indietro, moltiplicato-
per la velocità della luce, cioè

4 - ( £ - fcft ) c = z0. (3 .53)

La relazione fra i2 e t3 segue direttamente dalla definizione del


coefficiente k:
t3 = kH2. (3.54),

. Gli esperimenti ideali condotti per la misura di lunghezza sono-


illustrati nella fig. 3.11, che, una volta analizzati i diagrammi delle-
figg. 3.9 e 3.10, non richiede ulteriori spiegazioni.
La lunghezza del righello determinata dall’ osservatore A è uguale
alla differenza delle distanze da A agli estremi vicino e lontano del
righello, con la condizione che le distanze siano determinate simulta­
neamente. Questa condizione è garantita dalla verifica dell’ ugua­
glianza (3.52). La distanza da A all’ estremo lontano è uguale a
1/2 (Z4 — D c e quello vicino a 1/2 (t3 — t2) c. Di conseguenza,
A deve assumere come lunghezza del righello

^ — t i)— m — .c])(3.55)

Le relazioni (3.53)-(3.55) permettono di trovare il legame tra l


ed Z0. Segue dalla (3.52) che Z4 = t2 + t3 — A* Sostituendo Pespres­
sione ottenuta per £4 nel primo membro della (3.53) e riprendendo la

1Q5
(3 .5 4 ), o lt e n ia m o
7 _ C i L + L ---h h + j)~ h 1)
-k t !
2 l k =t [ k
c k21
ih — (3.56)

Poiché, in accordo con la (3.52), i2 — L = ^4 ~ ^ dalla (3.55)


segue che

£2 £i: (L h) 4~ (L — L) (L L) (L L)

Ora la (3.56) prende la forma

k - z * 2k
!+ ! =
/i+ B *
dove nell’ultima uguaglianza si tiene conto della formula (3.50).
È esattamente la formula (3.5), ottenuta precedentemente.
Questa derivazione mostra quanto sia essenziale trovare gli
iestremi del righello simultaneamente se si vuole determinarne la
, . lunghezza. Va notato a questo pro-
Linea duniverso posito che la derivazione della
(2.4) contiene, in essenza, un
approccio di tipo radar.
Trasformazioni di Lorentz. Ci
siamo assicurati che il metodo
del coefficiente k può essere im­
piegato per ottenere tutti i corol­
lari fondamentali della TRR,
i postulati di Einstein. Il vantag­
gio di questo procedimento con­
siste nell5evitare l ’ introduzione
esplicita di un sistema di coor­
dinate.
Ma, naturalmente, l ’ applica­
zione alla fisica dei metodi della
TRR richiede E introduzione espli­
cita di un sistema di riferimen­
to. Se è così, ò altrettanto inevi­
Fig. 3.11. Per la determinazione della tabile l ’ introduzione delle trasfor­
lunghezza di un righello in movi­
mento. mazioni di Lorentz. Le trasforma­
zioni di Lorentz si possono ottene­
re col metodo del coefficiente k.
•Consideriamo due riferimenti K e K' i cui rispettivi osservatori
1 ed 4 ' registrano lo stesso evento. In entrambi i riferimenti l ’ ori­
gine è scelto in modo che t = f — 0 quando le due origini 0 e 0'
•coincidono. Quindi all’ istante tx l ’ osservatore A invia un segnale
luminoso ad A ' che viene ricevuto da quest’ultimo (secondo il suo
orologio) all’istante il segnale inviato da A procede ulteriormente

106
accompagnato dal segnale inviato da A ' nell’ istante della ricezione
del segnale da A . Infatti, lungo l ’ asse x si propaga un segnale che
•«consiste di due segnali. Supponiamo che l ’ evento P rappresenti l ’ ar­
rivo di quel segnale in qualche punto (o che l ’ arrivo del segnale coin­
cida con il verificarsi di qualche evento). In quel punto il segnale è
riflesso (o, altrimenti, il segnale di ritorno viene inviato appena
arriva quello diretto). Dapprima, esso raggiunge all’ istante t'2 l ’ os­
servatore A che allo stesso istante invia il suo segnale in direzione
di A . Ora da A ' ad A si propaga
il singolo segnale che consiste, in
pratica, eli due segnali. Esso è ri­
cevuto all’ istante £«> da A (fig.
3.12).
L ’ osservatore A assegnerà al­
l ’ evento P le coordinate nel modo
seguente. Il tempo t del verificarsi
dell’ evento è proprio la semisom­
ma del tempo d ’ invio e ricezione
del segnale in quanto la velocità
della luce « avanti » e « indietro »
è la stessa:

£— ~2 (3.57)
Fig. 3.12. Per la deduzione delle
trasformazioni di Lorentz.
La distanza dal punto dove av­
viene l ’ evento si può trovare se la
velocità del segnale c viene moltiplicata per il tempo impiegato dal
segnale a percorrere l ’ « andata »; questo tempo è uguale alla metà
di tutto il tempo impiegato dal segnale. Poiché il segnale percorre un
cammino chiuso nel tempo t2 — t±, la coordinata x dell’ evento sarà
determinata dall’ osservatore A come

x= — (3.58)

Dalle (3.57) e (3.58) otteniamo

h = * — - f - , t2 = t + ~ .

Ma l ’ osservatore A ' troverà esattamente nello stesso modo che

= f , (3.60)

Secondo la definizione del coefficiente /c, confrontando gli inter­


valli tra lo scambio dei segnali, otteniamo

t[ — 0 = &(L — 0), t2— 0 = k(t'2— 0). (3.61)

107
Secondo le (3.59) e (3.60) otteniamo

(3262)

(3.63)

Moltiplicando in modo incrociato le uguaglianze (3.62) e (3.63)v


otteniamo immediatamente che la grandezza

t'*- (3.64)

mantiene il suo valore in tutti i SRI, cioè è un invariante. Scrivendo


le (3.62) e (3.63) in modo più conveniente per la soluzione

(3.65)
‘■ --f-* (‘ - f ) ■
(3.66)

si trova facilmente che


k*+i_ —1 , 62+ 1
tf : t-
2kc ■X, X = ---727k
7--- X' - ctr
%k 2k

e tenendo conto della (3.50), scopriamo che sono proprio- le trasforma^


zioni di Lorentz:
V
x ' = T { x — Vt), r = r :)

108
IV . SPAZIO-TEMPO QUADRIDIMENSIONALE

nriAliei An £sI*
e quadridimensionali
'Quando introduciamo un sistema coordinato, la posizione di ogni
punto è determinata da tre numeri, detti coordinate di un punto.
Una varietà a tre dimensioni è intesa come insieme di tutti i punti.
sSe vogliamo passare da una varietà allo spazio che ha determinate
proprietà geometriche, dobbiamo definire l ’espressione per la distan­
za tra due punti infinitamente vicini delia varietà. Avendo assegnato
il quadrato della distanza tra tali punti, si possono definire grandezze
geometriche dì base (la lunghezza di un vettore, un angolo tra vetto­
ri, le aree di figure bidimensionali forniate da vettori). La geometria,
le cui principali leggi furono formulate da Euclide, è valida con
grande precisione nel mondo in cui viviamo. In conformità con la
geometria di Euclide, il quadrato della distanza tra due punti infi­
nitamente vicini può essere scritto nella seguente forma, in coordinate
•cartesiane,
ds2 = dx2 + dy2 + dz2. (4.1)

Questa equazione rappresenta nient’ altro che il teorema di Pitagora,


formulato per la diagonale di mi parallelepipedo rettangolare tridi­
mensionale con i lati dx, dy, dz.
Un sistema di coordinate può essere selezionato a piacere (il siste­
ma delle coordinate cartesiane si distingue solo per la sua semplicità),
■e una distanza tra punti, per il suo significato geometrico, non deve
dipendere dalla scelta di un sistema. Questo significa che l ’ espres­
sione (4.1) deve essere un invariante di qualsiasi trasformazione di
coordinate. Una distanza tra due punti qualsiasi deve essere anch’ es­
sa un invariante della trasformazione di coordinate. Così, nella
geometria euclidea l ’ invariante è la distanza tra due punti:

ri 2 = V (z 2 — *i)a + (U—
dove (aq, z/x, z±) e (x2, z/2, z2) sono le coordinate di dne punti nello
spazio. Le (4.1) e (4.2) mettono in relazione le coordinate di due
punti nello spazio. In particolare, le formule di trasformazione delle
coordinate per i passaggi da un sistema cartesiano ad un altro (una
tale transizione è una rotazione, se ignoriamo la traslazione del
sistema che è di scarso interesse) sono date in Appendice I, § 2.

109
Da queste formule si vede che nel nuovo sistema eli coordinate ognf
nuova coordinata è espressa mediante tutte quelle vecchie.
In uno spazio euclideo tridimensionale si possono introdurre
vettori determinati da una terna di numeri, cioè le componenti di-
vettori. Le coordinate di un punto comprendono le componenti,
di un raggio vettore. Conseguentemente, le componenti di ogni vetto­
re si trasformano secondo la legge di trasformazione delle coordinate.
I moduli dei vettori, il loro prodotto scalare e un angolo tra di loro
si trovano mediante le componenti del vettore, in accordo con le leggi
conosciute.
Quali implicazioni comporterebbe la comparsa di una dimensione
in più in uno spazio euclideo? Certamente, è difficile da visualizzare'
con i propri occhi uno spazio quadridimensionale. Ma non ne abbiamo
bisogno. Avendo a disposizione delle relazioni principali per uno
spazio tridimensionale, le riportiamo semplicemente ad uno spazio-
quadridimensionale. Siano x, y, z, w le coordinate di un punto
nello spazio quadridimensionale. Per uno spazio euclideo quadridimen­
sionale il quadrato della distanza tra due punti infinitamente vicini
si scriverà nella seguente forma (riportiamo anche le designazioni
simmetriche):
ds2 = dx2-f- dy2 + dz2 + dw2 = dx°2+ dx*2— dx2^-j- dxz\ (4-3)’
e la distanza tra i punti sarà
r 12= V (*2— Xi)2+
Le espressioni (4.3) e (4.4) saranno gli invarianti della trasforma­
zione delle .coordinate, e le relazioni geometriche basilari saranno-
trovate nello stesso modo in cui erano state ottenute nello spazio
tridimensionale.
§ 4.2. Spazio-tempo
quadridimensionale o spazio
pseudoeuclideo quadridimensionale*
Consideriamo una varietà quadridimensionale formata da « punti »-
le cui coordinate sono quattro numeri x, y, z, x = et che definiscono'
un punto quadridimensionale. Un evento qualsiasi che rappresenta,-
un processo fisico istantaneo può avvenire in ogni punto di questa
varietà. Lo spazio-tempo quadridimensionale è una nozione pura­
mente geometrica. Qualche volta, secondo Minkowski, questo spazio-
è chiamato « universo ». Ogni evento avviene in un punto dell’ univer­
so di Minkowski.
Le proprietà geometriche dell’ universo di Minkowski possono-
essere stabilite dopo che è stata trovata una relazione invariante tra
coordinate di punti, che può essere interpretata come la distanza tra
due punti di una varietà. Quando le distanze tra i punti sono definite­
si può passare dalla varietà allo spazio. Ma da dove si può trovare una
relazione invariante necessaria? Non si deve dimenticare che le-
coordinate dei punti dell’ « universo » sono definite con grandezze

110
fisicamente differenti, cosicché è impossibile presumere a priori che
la « distanza » in questo universo possa essere respressione del tipo
(4.3). Ma la teoria della relatività risponde a questa domanda senza
ambiguità. Rimanendo nell’ ambito dei sistemi di riferimento iner­
ziali, l ’ intervallo tra gli eventi (3.19) rimane invariante per ogni
coppia di eventi (in termini di geometria, per ogni coppia eli punti
dell’universo di Minkowski). 11 passaggio da un SRI ad. un altro è
descritto dalla trasformazione di Lorentz e non c ’ è bisogno di nes-
sun’ altra trasformazione nell’ ambito della TRR. Di conseguenza,
quale forma quadratica invariante di base, che definisce la « distan­
za » nell’universo di Minkowski, possiamo prendere, da considera­
zioni fisiche, l ’espressione per il quadrato dell’ intervallo tra eventi
ds2 — dx2 — dx2 — dy2 — dz2 = dx°2 — dxi2 — dx22 — dx32, (4.5)
dove x — et. E la (4.5) che definisce il quadrato della distanza tra
due punti infinitamente vicini nell’universo di Minkowski. Così,
i postulati di Einstein, dai quali segue l ’ invarianza deH’intervallo
tra gli eventi, indicano che la geometria dello spazio-tempo quadri­
dimensionale (lo spazio di Minkowski) è determinata dalla forma
fondamentale del tipo (4.5). Si è visto dall’ aspetto di questa forma
che le coordinate e il tempo non sono equivalenti.
Nel Supplemento V si vedrà che il passaggio da un sistema di
riferimento inerziale a quello non inerziale altera l ’ aspetto del­
l’ intervallo tra eventi. Benché quest’ espressione rimanga sempre
invariante, la sua forma diventa differente, così che il quadrato del­
l’ intervallo prende la seguente forma:
ds2= g ih (4.6)
dove al secondo membro si intende la sommatoria rispetto a i e k
da 1 a 4 e i coefficienti g ih, detti coefficienti metrici, possono dipen­
dere dalle coordinate e dal tempo. Abbiamo bisogno di questa espres­
sione generale soltanto per ricavare g ik per le (4.3) e (4.5).Usando le
notazioni simmetriche delle (4.3) e (4.5), otteniamo rispettivamente
Soo = £11“ §22 “ £ 3 3 “ 1 ? (U3 )
£00 = Su ~ £22 ~ £ 3 3 == 1 • (4-5 )
È evidente che le (4.3) e (4.5) differiscono per i segni dei coefficienti
metrici. L ’ insieme di questi segni è chiamato segnatura delle formo
quadratiche corrispondenti. La segnatura della (4.3) ha la forma
( 4— 1— |
— f ) , mentre la segnatura della (4.5) è (4----- ---------). Se
uno spazio quadridimensionale fosse formato con un semplice aumen­
to del numero di dimensioni del nostro spazio convenzionale, la
segnatura sarebbe (4— b + 4~)* Un tale spazio differirebbe dal
nostro in nient’ altro che nel numero di dimensioni e si chiamerebbe
spazio euclideo (quadridimensionale). La segnatura dello spazio
considerato nella teoria della relatività ristretta corrisponde a quella
del tipo (4.5), cioè (4---------------)• Il cambiamento di una segnatura
implica una variazione della « distanza » tra i punti dello spazio,

111
delie proprietà delio spazio rispetto a quelle dello spazio euclideo
•abituale. Questo spazio quadridimensionale, che possiede proprietà
^geometriche non usuali, è estremamente importante per la TRPu
È in questo spazio che « avvengono » tutti g i i . eventi fisici,
iranno luogo tutti i fenomeni fisici.
La geometria deH’universQ di Minkowski differisce dalla geo­
metria euclidea, ma non troppo, in quanto i coefficienti nella (4.5),
■rome pure quelli nella (4.3), sono costanti. Dunque, la geometria
definita dalla forma quadratica della (4.5) è solitamente chiamata
Apseudoeuclidea e lo spazio corrispondente spazio pseudo euclideo.
Dunque, lo spazio delle quattro variabili x, y, z, et della teoria
della relatività ristretta è lo spazio pseudoeuclideo quadridimensio­
nale. Esso si ottiene non con una semplice aggiunta della quarta
coordinata (temporale) et alle tre spaziali x, y , z ma mediante la
peculiare definizione (4.5) della distanza invariante tra i punti di
questo spazio.
Un motivo fisico per considerare lo spazio pseudoeuclideo sta nel
'fatto che le letture di spazio e di tempo riguardanti un evento non
.sono equivalenti nella T R R nonostante la loro stretta connessione.

§ 4„3. Vettori e tensori


quadridimensionali

Esattamente come nello spazio tridimensionale, le coordinate di un


punto in uno spazio quadridimensionale si comportano come com­
ponenti di un raggio vettore quadridimensionale tracciato dalPori-
gine del sistema di coordinate al punto dato. Tutti i vettori quadri­
dimensionali saranno indicati con una freccia sopra la lettera, in
particolare, il raggio vettore quadridimensionale sarà indicato
con R . Per comodità dei lettori presenteremo le relazioni di base sia
in notazione complessa sia mediante variabili reali. La notazione
complessa semplifica Posposizione dell 7elettro dinamica, mentre Fuso
delle variabili reali porta al formalismo della teoria dì relatività
generale, dove non si è soliti introdurre coordinate complesse. La
maggior parte delle formule sarà scritta in notazioni simmetriche,
inoltre, la scrittura delle coordinate del vettore quadridimensionale
a due righe permette di richiamare il significato delle notazioni
introdotte. Quindi, introdurremo il raggio vettore quadridimensiona­
le in uno dei seguenti modi:
X ° X 1 X 2 X s

)• (b) (4.7)
T = ci x y z
L 5uso degli indici in alto nella (4.7b) non è casuale. Quando si usano
i valori reali delle coordinate, la differenza tra le componenti co-
e controvarianti del vettore deve essere sottolineata (vedi Appendi­
ce I, § 8), e le componenti controvarianti sono dotate degli indici in
alto. Così il quadrato dell 7io ter vallo tra gli eventi sarà scritto nella

112
forma
ds2 = dx{ + dx\ dx\ + dx\ — ds2= di0*—,d*i* — di** - dx? =
4 -- gik dx1dxh. (b)
= 2 xf=
d dXi (a)
i==1
Diversi da zero: Diversi da zero:
S ii = l, g2SL=U ^00= 1? — li.
SZZ ^ 1» If 44 — 1 • g22= '— L ^33— ^ ^ '
E da notare che gli intervalli dati nelle (4.8a) e (4.8b) hanno segni
opposti. Poiché ds2 può essere sia negativo che positivo, la scelta dei
segni per ds2 non ha importanza pratica.
Le trasformazioni di Lorentz sono trasformazioni delle compo­
nenti del raggio vettore quadridimensionale, che sono le coordinate
di un evento. Le scriveremo di nuovo:
x[ = T (xx+ iBx^ , xQ/= T (x° — Bxi) 1
^ x if = V (xl — B#°),
(a) (b) (4.9)
X f3 - x $ r = x2,
x\ = P (xk— iBxj) ; j;3' =
Ma un raggio vettore quadridimensionale è uno dei vettori quadridi­
mensionali. Perciò se nel sistema di riferimento K sono assegnati i
seguenti vettori quadridimensionali:

A (A iA2A3Ak) [ A (A0A 1A 2A3),


nel riferimento K r le componenti degli stessi vettori saranno determi­
nate come seguo:
A i — P(M1-f- A°' = r (M° — BM1),
A if = T ( A ' — B A 0),
(4.10)
A 2' = A 2, ^
— P (M4— iBAj) ; A 3' = 4 3.

Le (4.8a, h) rappresentano il quadrato di un vettore infinitesimale


(df?)2. Di conseguenza, il quadrato del modulo del vettore quadridi­
mensionale (che è una grandezza invariante) deve essere determinato
in questo modo:

A 2 = g thA iA h = A hA k = 4 ^

^ a^
-(b ) 1 ‘ '
Certamente le formule (4.Ila ) e (4.1 Ih) danno segni opposti per
la grandezza invariante A 2. Ma questo non ha importanza come nel
caso di determinazione dell’ intervallo (vedi Posservazione dopo le

113
(4.8)). Bisogna ricordare, comunque, che i segni diversi dell’ inter­
vallo modificano le condizioni che definiscono gli intervalli e i vetto­
ri « del genere tempo » e « del genere spazio » (riguardo a ciò non
c ’ è coerenza nella letteratura).
Nella (4.11b) abbiamo introdotto coordinate covarianti in accordo-
con le formule dell’Appendice I, § 8 : A h = gi^A1. È facile notare
che A 0 = A°, A t = —A 1, A^ = ~ A 2 e A 3 = ~ A 3.
Come nel caso di uno spazio tridimensionale, avremo a che fare
con i tensori. Più semplicemente la legge di trasformazione delle
componenti del tensore si ottiene come la legge di trasformazione
del prodotto di componenti di due vettori quadridimensionali. Le
formule di trasformazione delle componenti per i vettori quadridi-
mensionali A e B si possono scrivere nelle notazioni simmetriche
(vedi la (2.40a, b))

\Ar- = a nA[, A ^ a nA'\


(a) G>) (4.12)
B h= a hmB'm.

Moltiplicando i due membri di queste equazioni, otteniamo subite


le leggi di trasformazione dei prodotti delle componenti dei vettori

AiB^a^AlB'n,(a) | A iB h(b) (4.13)

Così otteniamo la legge generale di trasformazione dei tensori


T lk = A iB k
e Tih = A W :
T ih—
Tih = a aa hmT'lm.(4.15)

La formula (4.15), in cui è essenziale la differenza tra le coordinate


co- e controvarianti, rappresenta la legge di trasformazione di un
tensore doppiamente controvariante.
Nello spazio quadridimensionale le grandezze fisiche da misurare
saranno costruite in modo da possedere proprietà di trasformazione
definite nel passaggio da un SR.I ad un altro, cioè nelle trasformazioni
di Lorentz. Ma nelle trasformazioni delle coordinate (nell’universo-
di Minkowski si tratta delle quattro coordinate) solo grandezze
tensoriali hanno proprietà di trasformazione definite, inoltre tensori
di valenza (rango) differente si trasformano secondo leggi diverse.
Quindi tutte le grandezze fisiche, cui assegnarne un significato reale,,
devono essere tensori: o scalari (cioè tensori di rango zero), o vettori
quadridimensionali (cioè tensori di primo rango) o, infine, tensori,
di rango maggiore del primo. Vedremo più avanti che un campo elet­
tromagnetico forma un tensore di secondo rango (vedi capitolo VI).
Il passaggio dalle abituali grandezze tridimensionali a quelle qua­
dridimensionali (necessarie, senza dubbio, nel caso delle trasforma­
zioni di Lorentz) non è sempre immediato e si realizza differentemen--

114
te a seconda dei casi. È spesso possibile rappresentare, con qualche
modifica, un normale vettore tridimensionale come la parte spaziale
di quadrivettore. Per la quarta componente la sua espressione sembra
sorprendente a prima vista, ma nell’ analisi finale è naturale. Non
c ’ è niente di strano in questo, in quanto nel limite non relativistico
torniamo sempre da relazioni relativistiche a quelle classiche.
I capitoli V-VII forniranno numerosi esempi di costruzione di
vettori e tensori quadridimensionali.

§ 4.4. Piano pseudoeuclideo


Le particolarità dello spazio pseudoeuclideo si possono illustrare
sull’esempio del piano pseudoeuclideo. Allo scopo uno dei due assi
coordinati deve essere necessariamente l ’ asse del tempo (proporziona­
le al tempo) in quanto nella T R R la geometria puramente spaziale
r
KA ;

0 X zi
r\ x
X —Xg

a) t)
Fig. 4.1. a) La linea d’universo di un corpo a riposo nel punto x = x0. b) La
linea d’universo di un corpo in moto uniforme lungo l ’ asse x.

rimane ancora euclidea, e soltanto lo spazio-tempo è descritto dalla


geometria pseudoeuclidea. Nella nostra scelta del sistema di riferi­
mento è molto conveniente considerare il piano (x, t).
Ricordiamo che il continuum di spazio-tempo quadridimensiona­
le, i cui punti sono gli eventi, è spesso detto imiverso di Minkowski.
Ogni evento del nostro mondo fisico reale avviene in un determinato
punto dell’universo di Minkowski. Considerando una particella,
possiamo pensare che il suo stare in un dato punto ad un dato istante
del tempo sia un evento. Non importa se questa particella si muove
o no, la sequenza degli eventi avvenuti con La particella forma nel­
l ’universo di Minkowski una curva chiamata linea d'universo della
particella.
Tracciamo gli assi x, x del riferimento K l ’un a ll’ altro perpendi­
colari e analizziamo i casi più semplici. Una particella sia a riposo
al punto x — x 0 nel riferimento K ; la sua linea d ’universo nel piano
(x, t) dell’universo di Minkowski sarà una retta parallela all’ asse %
(fig. 4.1, a). Un’ altra particella si muova uniformemente lungo
l ’asse x del riferimento K con velocità v. La sua linea d ’ universo in
questo riferimento sarà una retta inclinata di un angolo ù1 rispetto
all’ asse x (fig. 4.1, b). Un p o’ più tardi vedremo che ù1 = arctg (vie).

115
Esaminiamo ora un moto arbitrario di una particella in questo
riferimento. Il moto di questa particella è rappresentato dalla linea
d ’universo x = x {%) nel piano (x, t), come appare nella fig. 4.2.
L ’ inclinazione della linea d ’universo rispetto all’ asse t in ogni
punto dato è determinata dalla derivata dx/dx in quel punto. Infatti
(vedi la fig. 4.2),
(4.16)

Così, Pungolo d ’inclinazione ò determinato dalla seguente equazione:

D == arctg — arctg p,J (4.17)

dove P = vie e v è la velocità istantanea del punto (corpo). Visto


che P < 1 sempre, l ’angolo # non può superare i 45° per ogni corpo
in moto. La linea d ’universo dei raggi di luce sarà rappresentata
dalla bisettrice dell’ angolo fra gli assi coordinati.

\J
Linea d universo
dei raggi luminosi

Figc 4.2. 11 sistema di coordinate reali x7 r — et. La posizione della particella


ad un istante dato viene determinata da un punto in questo piano. Al moto
della particella corrisponde in questo piano una curva, detta linea d’universo di j
un punto. Le linee d’ universo di punti immobili sono rette parallele all’asse t.
La linea d’universo dei raggi luminosi è la bisettrice dell’ angolo fra gli assi
coordinati. Nel caso di moto con velocità variabile l’angolo formato dalla
tangente alla linea d’universo e l’ asse t è definito dalla relazione# = arctg (zVe),
dove v è la velocità istantanea di una particella»

Abbiamo visto nel § 2.9 che in seguito alle trasformazioni di


Lorentz gli assi r ', x f si ottengono dagli assi t , x , se questi ultimi
vengono spostati, « a forbice », verso la bisettrice, la linea d ’ universo
dei raggi luminosi. Nella fig. 4.3, a , in cui accanto agli assi t , x
sono tracciati gli assi t ', x ' , si vede graficamente la relatività della
simultaneità. Nel riferimento K' tutti gli eventi che giacciono sul­
l ’ asse x\ o sulla retta %' = costante, sono simultanei. In termini

116
geometrici, tutte queste rette, parallele all’ asse x\ rappresentano le
linee di simultaneità nel riferimento K f,
Consideriamo i due eventi A 1 e A 2 situati sull’ asse x' (ambedue
questi eventi avvengono simultaneamente nel riferimento K e al­
l ’ istante t' — 0). Per trovare gli istanti del tempo ai quali questi
due eventi avverranno nel riferimento K , bisogna « proiettare »
questi eventi sull’ asse x, tracciando rette parallele all’ asse x, poiché
nel riferimento K gli eventi, che giacciono sulle rette x = costante

Fig. 4 . 3 . a ) La trasformazione di Lorentz si riduce alla rotazione degli assi


x e x dell1angolo cp = arctg B intorno all5orìgine delle coordinate verso la
bisettrice dell’angolo fra gli assi coordinati e le loro nuove posizioni x \ Le
rette x ; — costante sono parallele ora all’asse Or, mentre le rette X = costante
sono parallele all’ asse O x (siamo passati al sistema di assi coordinati rettilinei
obliqui). La relatività della simultaneità è chiaramente visibile: gli eventi
A ± e A 2 , simultanei nel riferimento K ' (giacenti sulla retta x' = costante) non
sono simultanei nel riferimento K (per trovare i rispettivi istanti nel riferi­
mento A, bisogna proiettarli sull’asse mediante rette parallele all’asse x ) .
b) Qui sono tracciate due linee d’universo di que corpi ( L L e M M ) . La relatività
della distanza tra corpi in moto è visibile molto bene. Per trovare la distanza
tra di loro, bisogna determinare le coordinate di questi corpi, ma necessariamente
in modo simultaneo. Sia uno dei corpi situato nel punto N . Allora in termini
del riferimento K nei medesimo istante il secondo corpo si trova nei punto R .
Ma in termini del riferimento K f il secondo corpo nello stesso istante si trova
nel pnnto P . I segmenti N R e N P che corrispondono alla distanza tra i corpi
hanno differenti lunghezze.

(fig. 4.3, a), sono simultanei. Vediamo che nel riferimento K questi
eventi avvengono ad istanti differenti di tempo ix e t2. Ovviamente,,
questa è solo un’ illustrazione geometrica della relatività della sin­
cronizzazione degli orologi che abbiamo affrontato nel § 2.4.
Un risultato molto importante segue dalla fig. 4.3, ò, in cui
sono tracciate le linee d ’universo di due corpi che si muovono unifor­
memente ma con velocità diverse. Per determinare la distanza tra
di loro ad un determinato istante di tempo, bisogna trovare simulta­
neamente le coordinate di questi corpi nel riferimento in cui viene
cercata questa distanza. Si vede bene che nei riferimenti K e K'
la distanza fra i corpi misurata in uno dei riferimenti K o K r risulta
differente. Data l ’equivalenza dei sistemi di riferimento, nessuna
delle distanze ottenute può essere considerata quella vera. Ma allora,
tutte le leggi della meccanica in cui la forza dipende dalla distanza,
diventano ambigue nel caso di corpi in movimento. Naturalmente,
questo problema non emerge
-Z=~ct 'C X = et
nella meccanica di Newton, dove
il tempo è assoluto.
Consideriamo gli assi x, r del
riferimento K (fig. 4.4). Il qua­
drato dell’ intervallo tra due punti
dell’universo è definito dall’e­
spressione S*2 = (t 2— tQ2— (x 2~
— x-f)2. Per semplicità supponia­
mo che l ’ evento 1 avvenga nel
punto x — 0 all’ istante t — 0,
cioè nel punto 0 . Ogni evento che
Fig. 4.4. L ’intersezione del cono avviene nell’ asse x prima e dopo
spazio-temporale col piano (£,• x). l ’ evento 1 è rappresentato dai
II punto O rappresenta l ’evento 1.
Tutti gli eventi situati nei quadranti punti nel piano (x, t). Poiché il
III e IV rappresentano eventi assolu­ quadrato dell’ intervallo (distan­
tamente lontani rispetto all’ evento 0\ za) dall’ evento 1 a ogni altro
gli eventi situati nel quadrante I evento è uguale a s2 = t2 — x2,
rappresentano il futuro assoluto, men­
tre quelli situati nel quadrante II questo piano è suddiviso in quat­
il passato assoluto. tro quadranti I, II, III, IV
dalle rette x = t , corrisponden­
ti alla sequenza di eventi che consistono nell’ arrivo al punto
x al momento t di un segnale emesso dal punto x — 0 al­
l ’ istante t = 0. L ’intervallo tra gli eventi sulle rette t2 — x2= 0
è del genere luce, e la « distanza » tra tali eventi nel piano
pseudoeuclideo è uguale a zero. Ora consideriamo i quattro quadranti
esterni alle rette del genere luce. Nel quadrante I s2 — t2 — x2 >> 0.
Di conseguenza, l ’intervallo tra ogni evento del quadrante I e l ’ even­
to 1 è del genere tempo. Per tutti gli eventi di questo quadrante
t >> 0 ; di conseguenza, tutti avverranno dopo l ’ evento 1 , e nessuna
scelta di sistema di riferimento può alterare questa situazione. Questo
significa che il quadrante I è la regione del futuro assoluto rispetto
a 0. Anche nel quadrante II s2 >> 0, ma qui per tutti gli eventi
x < 0 ; quindi, il quadrante II è la regione di passato assoluto rispet­
to all’evento 1 .
Nei quadranti III e IV s2 < 0, cioè l ’ intervallo tra ogni evento
posto in questa regione e l ’evento 1 è del genere spazio. Tutti questi
eventi avvengono in punti che non coincidono con il punto in cui è
avvenuto l ’evento 1 , e di nuovo è impossibile alterare questo con la
scelta di un sistema di riferimento. Comunque, si possono trovare

118
sistemi di riferimento, dove un evento dato dal quadrante III o IV
potrebbe avvenire prima o dopo, o, infine, simultaneamente con
l ’ evento 1 , poiché i concetti di « simultaneità », « prima » e « dopo »
per eventi di questa regione sono relativi.
Se si esaminano due eventi posti in modo arbitrario nel piano
(t, x), il carattere dell’ intervallo tra di loro sarà determinato dalla
pendenza della retta congiungente
questi due punti. Se la retta è
inclinata rispetto a ll’ asse x sotto
un angolo superiore a jt/4, l ’ in­
tervallo tra gli eventi 1 e 2 è del
genere tempo; se sotto un angolo
inferiore a n/4, l ’ intervallo è del
genere spazio. Infine, se questa
linea è parallela alla bisettrice,
Teorema pseuaopitagorLca
l ’intervallo è del genere luce. a b 2^b c 2- a c z
Nello spazio quadridimensio­
nale l ’ equazione che descrive la Fig. 4.5. Il teorema pseudopitagorico
propagazione della luce ha la for­ nello spazio pseudoeuclideo.
ma cH2 — x2 — y 2 — z2 = 0. In
termini geometrici, nello spazio quadridimensionale questa equazio­
ne descrive un « cono », chiamato usualmente cono luce. Le cavità
interne di questo cono corrispondono alle regioni di « futuro assolu­
to » e « passato assoluto ».
Il cono luce, su cui giacciono le direzioni del genere luce, viene
caratterizzato anche dal fatto che, in tutti i passaggi da un SRI
ad un altro, la sua posizione nello spazio quadridimensionale per
ogni punto dell’universo rimane invariata.
Un evento consista nell’ arrivo di un raggio luminoso in un certo
punto dell’universo, dove si trova un osservatore. Quindi, si tratta
dell’ osservazione dei segnali luminosi in un punto dato dello spazio
e in un istante dato di tempo. I raggi luminosi possono giungere ad
un dato punto dell’ universo solo lungo quelle direzioni dello spazio
quadridimensionale che giacciono sul « cono luce del passato » fino
a ll’infinito (praticamente sufficientemente lontano in unità luce).
Ogni generatrice di questo cono può essere associata al punto sulla
sfera spaziale di un raggio infinitamente grande nel centro della
quale si trova l ’osservatore. Una tale sfera viene usata per l ’ osserva­
zione dei corpi celesti ed ò chiamata sfera celeste.
Quando disegnamo il piano pseudoeuclideo su un foglio di carta,
non si deve dimenticare che siamo abituati a relazioni tra le lunghez­
ze dei segmenti proprie al piano euclideo. Nella fig. 4.5 è rappresen­
tato un triangolo rettangolo il cui lato AC è uguale a x 2 — x1 e B C ,
a t 2 — iq. Ma in questo piano A B 2 = BC 2 — A C 2, secondo la defini­
zione del quadrato dell’ intervallo, e contrariamente al teorema di
Pitagora; questo è il teorema pseudopitagorico. Quindi, il confronto
di lunghezze dei segmenti nel piano (x, ) deve essere fatto con cau­
t

tela.

119
Nel piano euclideo (xì y) il luogo geometrico dei punti equidistan­
ti dall’origine di coordinate è definito dall’ equazione della circonfe­
renza r2 = x2 -f- y 2 f= costante. Nel piano pseudoeuclideo (x, t),
dove il quadrato della distanza dall’ origine di coordinate è definito
dalla relazione s2 = t2 — x 2, il luogo geometrico dei punti « equi­
distanti » dall’origine di coordinate (fig. 4.6) descriverà quattro
iperboli (,s2 non è necessariamente positivo). Se si sceglie l ’ iperbole
per cui s2 — 1 e si tracciano i raggi dall’ origine di coordinate fino
alla loro intersezione con questa iperbole, il segmento di ciascuna
di questi raggi determinerà la lunghezza unitaria « pseudoeuclidea »
nella direzione corrispondente. E possibile dare un’ interpretazione

Fig. 4.6. Le quattro iperboli equilatere x2 — x2 = t, x2 — x2 = 1 sono tracciate


nel sistema di coordinate (x, x). Poiché le trasformazioni di Lorentz lasciano
invariata l ’espressione x2 — x2 — c2t2 — x2, noi otterremo anche nel nuovo
sistema di assi coordinati obliqui le iperboli x'2 — x 2 = 1, x ’2 — x'2 = 1.
Ma ciò significa che queste quattro iperboli equilatere intersecano, rispettiva­
mente, gli assi x , x, x , x' a distanze dall’ origine uguali all’unità. Le iperboli
tracciate si dicono iperboli di scala.

fisica per il grafico dell’iperbole s2 = 1. Supponiamo che nel pùnto


d ’universo r = 0 , x = 0 siano generate le particelle con varie velo­
cità, ma con la stessa vita t 0 = 1. Quindi il luogo geometrico dei
punti d ’ universo, in cui avviene il decadimento di queste particelle,
sarà l ’ iperbole s2 = 1 , le linee d ’universo di queste particelle saranno
rappresentate dai raggi uscenti dal punto d ’universo (0 , 0) e rag­
giungenti questa iperbole.
Consideriamo due coppie di iperboli equilatere nel piano (x, t):
t2 — x2 = 1 , (4.18)
a:2 — x2 = 1. (4.19)
Si può facilmente suddividere il piano (x, x) in quattro quadranti,
ognuno dei quali contenga un’ iperbole. Le frontiere dei quadranti
sono gli asintoti di queste iperboli. Infatti, sostituendo l ’equazione

120
t = kx del raggio, che attraversa l ’origine di coordinate con pendenza
arbitraria k (k — tg a ), nelle equazioni di iperboli (4.18) e (4.19), si
scopre che la coordinata dell’ intersezione è determinata dall’ equazio­
ne x2 = zh (1/(1 — k2)). Questa equazione ha una radice reale solo
se F < 1. Quando k2 = 1, la coordinata del punto d ’ intersezione
sull’ asse x si sposta àll’ infinito. Questo significa che i raggi x = x
sono gli asintoti di queste iperboli. Quindi le linee d’ universo dei
raggi luminosi x — et sono asintoti delle iperboli (4.18), (4.19).

Fig. 4.7. L’illustrazione geometrica della relatività della lunghezza dei righelli.
È disegnato qui il primo quadrante rappresentato nella fig. 4.6. OA è un righello
a riposo nel riferimento K. Le linee d’universo delle- sue estremità sono 0 x e
A A ". L ’ iperbole x2, — t2 = 4 interseca l’asse x nel punto A e l ’asse x' nel
punto A '. Così, OA = 1 e OA' = 1. Per trovare simultaneamente la posiziono
delle estremità del righello nel riferimento K ', bisogna intersecare le lineo
d’universo delle estremità del righello con una retta %' — costante, per esempio,
l ’asse x (corrispondente all’istante t' = 0). Quindi la lunghezza del righello nel
riferimento K' "risulta uguale a OA". Ma OÀ" < OA 1 = 1 .

Ognuna delle iperboli (4.18) e (4.19) interseca soltanto uno degli


assi: x o j. I punti d ’ intersezione delle iperboli (4.19) con l ’ asse x
sono determinati dalla condizione — 0 . Vediamo che le iperboli
t

(4.19) intersecano l ’ asse x nei punti x = ± 1. In modo similare


troviamo che le iperboli (4.18) intersecano l ’ asse t nei punti t = dz 11
Visto che le iperboli (4.18) e (4.19) tagliano i segmenti unitari sugli,
assi coordinati, è naturale chiamarle di scale.
Poiché l ’ espressione x2 — x2 ^ cH2 — x 2 è l ’ invariante delle
trasformazioni di Lorentz, nel riferimento K ' saranno valide lo
equazioni V 2 — x '2 = 1, x '2 — x '2 = —1, da cui segue diretta-
mente che le stesse iperboli tagliano i segmenti unitari sui nuovi
assi x' e
Si vede direttamente dalla fig. 4.6 che i segmenti unitari sugli
assi x e x f non sono affatto ugnali. Bisogna ricordare comunque che la
rappresentazione del piano pseudoeuclideo in quello euclideo è con­
dizionata e le unità «proprie» di lunghezza sono scelte in modo iden­
tico.
Ora è facile chiarire, in termini geometrici, come avviene la con­
trazione eli un righello in moto. Mostriamo in una figura gli assi x e t
e gli assi x' e Tracciamo una parte dell’ iperbole che passa per il
primo quadrante dei sistemi di coordinate K e K ' (fig. 4.7). li seg­

121
mento OA rappresenta un righello unitario che è fermo in K. Le sue
linee d ’ universo nel sistema K sono rette parallele all’ asse Ox e passano
per i punti 0 q A. Ma in termini di riferimento K ' la posizione simul­
tanea degli estremi della sezione OA all’ istante x' = 0 corrisponde
a ll’ intersezione delle sue linee d’universo con l ’ asse x\ cioè ai punti
0 e A " . Il righello unitario in K' è uguale a OA'; si vede dalla fig. 4.7
che OA " *< OA ' = 1.
Supponiamo ora che un righello unitario sia a riposo nel riferi­
mento K' (fig. 4.8). Quindi la sua lunghezza è uguale a OA' e le sue
linee d’ universo sono parallele a ll’ asse Ox', una delle quali è lo stes­
so asse 0 x\ e l ’ altra è la retta A 'B . Per determinare simultaneamente

F ig . 4 . 8 . È illustrato il caso in cui un righello è a riposo nel riferimento K '.


Le linee d'universo delle sue estremità sono rette parallele a Ox' (lo stesso asse
■Ox' e la retta passano per B ) . La lunghezza del righello in Z è determinata dal­
l ’intersezione di queste linee d’universo con l’asse x (t = 0) e risulta uguale a OB.
Ma OB c OA — 1 e otteniamo quindi lo stesso risultato: la più grande lun­
ghezza del righello si ha nel riferimento dove esso è a riposo.

le coordinate degli estremi del righello in termini del riferimento A ,


le linee d’universo degli estremi del righello devono essere interse­
cate da una retta x = costante. È più conveniente per noi tracciare
la retta x = 0. Dalla fig. 4.8 si vede che OB <C OA — 1.
Soffermiamoci su un’ illustrazione geometrica della relatività di
intervalli di tempo (fig. 4.9) Supponiamo che un orologio sia a riposo
.alPorigine del sistema di coordinate K ' . La sua linea d ’universo
sarà l ’ asse O x'. A ll’ istante t = 0 un orologio in moto si trovava al­
l ’origine del sistema di coordinate K, dove abbiamo confrontato la
sua lettura con uno degli orologi del sistema K ' posto in questo punto.
Come sempre, supponiamo che gli orologi di entrambi i sistemi
registrino il tempo t = 0 e tr = 0 nel momento in cui 0 e 0' coinci­
dono. Allora i segmenti OB e O'B' corrispondono alla lettura di tempo
degli orologi dei sistemi K e K ' .
Al punto d’universo B' la lettura dell’ orologio in moto aumente­
rà di un’unità rispetto a quella del punto O'. Ma il punto B' nel
riferimento K è simultaneo con tutti gli eventi situati sulla retta

122
t—costante che passa per il punto B '. In particolare, la linea d'uni­
verso dell’orologio posto al punto ^ e a riposo in /£, passa per il
punto B '. Questo dimostra che se l ’ orologio in moto in K ' registra

Fig. 4 .9 . L’ illustrazione geometrica della relatività degli intervalli di tempo


tra due eventi. Supponiamo che un orologio sia a riposo nel riferimento K'
e si trovi all:origine del sistema di coordinate 0. La sua linea d’universo coin­
cide con l ’ asse 0%'. La lettura di questo orologio nel punto d’universo B r dif­
ferisce per un’unità dalla sua lettura nel punto O'. Ma nel riferimento K il
punto B' c simultaneo con il punto d’universo B (giacente sulla stessa retta
t — costante con il punto B') in cui l’ orologio (situato in questo punto e a
riposo nel riferimento K) indicherà il tempo, determinato dal segmento OB,
rispetto alla lettura di un altro orologio da K, situato nel punto O. Si vede dalla
figura che OB < O'B' = 1. Questo significa che l ’ intervallo di tempo, impiega­
to per lo spostamento dell’ orologio del riferimento K !, è minore in termini di
K' di quello misurato in K .

l ’ intervallo di tempo proprio O 'B ', l ’ intervallo di tempo registrato


dai due orologi in K (posti ai punti 0 e aq) è uguale a OB. Ma dalla

sulla retta parallela all’ asse x e passano attraverso il punto B , saranno simul­
tanei con questo istante nel riferimento K ' . È chiaro che OB" > OB' = 1,
cioè un orologio immobile registrerà un intervallo di tempo minore di quello
indicato da un orologio in movimento.

figura si vede che l ’ intervallo di tempo registrato dall’ orologio di K'


è minore, poiché O'B' ^ 1 e OB > 1.
Se l ’orologio è a riposo nel sistema K, registrerà un’unità di tempo
nel punto d ’universo B (fig. 4.10) che è simultaneo con il punto B "

123
nel sistema K f (GB" è la lettura dell’ orologio del sistema K f che un
osservatore dal sistema K potrà mettere sul punto B"). Il punto B
è ottenuto come risultato dell’ intersezione della retta, parallela
a ll’asse x r e passante per il punto B , con l ’ asse 6V . Ma GB "
F> QB' = 1 ; di conseguenza, l ’ orologio in moto registrerà di nuove
un intervallo di tempo più lungo di quello registrato dai due orologi
a riposo. La lunghezza dell’ arco (euclidea!) delia linea d ’universo-
è direttamente legata con il tem­
Linea druniverso po proprio del corpo, gli è sempli­
dell orologio Q/ cemente proporzionale: ds=cdx.
Quindi, la lunghezza dell’ arco-
delia linea d ’universo permette di
aver un’ idea del tempo proprio-
che è stato registrato dall’oro­
logio fissato alla particella. Si
deve ricordare, comunque, che
bisogna essere cauti nella valu­
tazione della lunghezza dell’ arco
nel piano pseudoeuclideo. Il ri­
schio è chiaramente visibile dal
fatto che la « lunghezza del­
l ’ arco» che congiunge due punti
sep aratila una distanza spaziale
finita può essere uguale a zero.
Fig. 4.11. La differenza tra il tempo Pensiamo come nel ragionamento'
« proprio » di un corpo e quello delle precedente abbiamo ottenuto il
coordinate registrato da molti orologi
del sistema di riferimento rispetto al corretto risultato sulla base della
quale la particella si muove. geometria. Naturalmente, le pe­
culiarità del piano pseudoeucli-
deo influenzano l ’interpretazione
dei risultati. Per esempio, consideriamo la differenza tra il tempo-
proprio e quello di coordinate, cioè il tempo registrato dall’ orologio’
del sistema rispetto al quale un corpo si muove. Sia l ’orologio Qr
a riposo nell’origine del sistema K ' e la sua linea d ’ universo sia OA%
(fig. 4.11). Come al solito gli orologi coincidenti in O e Or indicane
t - 0 , tf - 0 .
Le linee d ’universo di tutti gli orologi Q a riposo in K sono retter
parallele all’ asse t . Ai punti d ’universo A x, A 2, À 3, . . . si può control­
lare l ’ orologio Q' con gli orologi QXl Q2, . . . che sono sincroniz­
zati in A , e indicano da ogni punto d ’universo A t , A 27 A 3, . . . un
tempo generale, unico per K . Il suo valore nel punto d ’universo A x
è uguale alla lunghezza della linea d ’universo Q^A^ Per l ’ orologio-
Q\ comunque, la lunghezza della linea d ’universo,. che unisce Or
ad A x è uguale a OA1. Ma OA\ — QxA l — O Q da cui è chiaro che
OAx < QxAv Questo implica che l ’ orologio Qf confrontato con gli
orologi Q2, . . . a riposo nel riferimento K è più lento degli orologi
Ql5 Q2, . . . sincronizzati nel riferimento K.

124
Infine, supponiamo che due persone (« gemelli ») si trovino nel
punto 0. In seguito, una di loro (un « viaggiatore ») compie un moto
uniforme e rettilineo tranne un breve intervallo di tempo in cui deve
cambiare la direzione di velocità in quella opposta per tornare al
punto iniziale 0. L ’ altro « gemello » rimane sempre al punto 0. Si

Figo 4.12. Le linee d’universo di due « gemelli ». La linea d’universo del « viag­
giatore » è la spezzata OAB; la linea d’ universo di « colui che resta a casa » è la
retta OB. Il « viaggiatore » subisce un’ accelerazione quando inverte la sua
direzione di velocità nel punto B e perciò si trova in questo intervallo di tempo
in un sistema di riferimento non inerziale. La lunghezza della linea d’universo
di un corpo determina I’ intervallo di tempo proprio del corpo. L’ intervallo dì
tempo proprio per il «viaggiatore» è ovviamente minore di quello che per
« colui che resta a casa » (vedi il teorema pseudopitagorico nella fig. 4.5).

vede dalla fig. 4.12 che la linea d ’universo del « viaggiatore » OAB
è più lunga di quella di « colui che resta a casa ». Comunque, secondo
il teorema pseudopitagorico ciò significa che, secondo il tempo
proprio, il « viaggiatore » ha vissuto meno tempo di «colu i che rimane
a casa ». Torneremo di nuovo su questo problema nel capitolo V i li .

125
V. MECCANICA RELATIVISTICA
DI UNA PARTICELLA

Affinché il principio di relatività eli Einstein sia valido è neces­


sario che le leggi basilari della fisica siano formulate in modo simile
in tutti i riferimenti inerziali con l ’eventuale differenza nella notazio­
ne delle variabili associate a un dato sistema di riferimento. In
termini fisici l ’ultima osservazione implica che in ogni SRI le
misure vengano effettuate per mezzo di strumenti a riposo in quel
riferimento. Ma le trasformazioni di coordinate di un evento nel
passaggio da un SRI ad un altro sono le trasformazioni di Lorentz.
Di conseguenza, le equazioni della meccanica, ad esempio, devono
mantenere la loro sembianza (nel senso suddetto) in ogni SRL Questa
condizione è automaticamente soddisfatta se le equazioni della mec­
canica sono poste in forma di vettori quadridimensionali. Infatti, in
questo caso è nota la legge di trasformazione di ambedue i membri di
tale equazione, ed essa non modifica le sembianze dell’ equazione. Le
equazioni, scritte in forma vettoriale (o più in generale tensoriale), si
dicono equazioni in forma covariante.
L ’equazione di Newton, che lega le forze e le accelerazioni, è cova­
riante rispetto alle trasformazioni di Galileo senza esserlo rispetto
alle trasformazioni di Lorentz. Comunque, le trasformazioni di
Lorentz seguono senza ambiguità dai postulati di Einstein, che sono
stati confermati sperimentalmente. Per soddisfare il principale po­
stulato di Einstein sull’equivalenza dei sistemi di riferimento inerzia­
li, bisogna assicurare la covarianza delle equazioni della meccanica
durante la trasformazione relativistica delle coordinate e del tempor
cioè le trasformazioni di Lorentz. Le equazioni della meccanica richie­
ste sono facili da scrivere usando il concetto della geometria qua­
dridimensionale della TRR. Procediamo in questo modo.
Certamente, lo sviluppo della scienza non cancella le leggi già
note, ma ne definisce soltanto i lim iti di applicazione. C’ è sempre
accordo fra le varie teorie che descrivono i gruppi di fenomeni nei
casi limite. La maggior parte delle equazioni della meccanica classica
corrisponde al caso limite delle equazioni relativistiche con p -* - 0 .
In altre parole, la meccanica classica è il caso limite della meccanica
relativistica che corrisponde al caso di velocità piccole rispetto
a quelle della luce. Ciononostante la meccanica relativistica giunge
a conclusioni che non sono possibili nell’ ambito della meccanica
classica (per esempio, l ’esistenza dell’ energia a riposo di un corpo).

126
§ 5.1. Quadrivelocità e
quadriaccelerazione

Per scrivere le relazioni fra le grandezze fisiche nello spazio-tempo,,


è necessario costruire i quadrivettori richiesti. Mentre facciamo ciò,,
dobbiamo ricordare che nel caso limite di velocità piccole le trasfor­
mazioni di Lorentz si trasformano in quelle di Galileo; non si
manifesta più la relatività degli intervalli di tempo e delle lunghezze,
e le equazioni di Newton corrispondono al principio di relatività di
Galileo se il passaggio da un SPJ ad un altro viene descritto dalle^
trasformazioni di Galileo. In questo caso limite, tempo e spazio nom
sono correlati e possiamo utilizzare le convenzionali grandezze tri­
dimensionali. Perciò, costruendo le grandezze quadridimensionali,
dobbiamo sempre fare in modo che le loro tre componenti (spaziali)
ricalchino le corrispondenti grandezze tridimensionali. Nel caso lim i­
te di velocità piccole (P-> 0) le tre componenti delle grandezze qua­
dridimensionali si devono tramutare nelle grandezze convenzio­
nali della meccanica.
La costruzione della quadrivelocità e della quadriaccelerazione
per analogia con la costruzione delle grandezze corrispondenti nella
spazio tridimensionale in cui la posizione di una particella veniva
assegnata con il raggio vettore tridimensionale r, e la velocità tridi­
mensionale veniva definita come la derivata del raggio vettore rispet­
to al tempo, drldt. La velocità quadridimensionale comunque, non
può essere definita come la derivata del raggio vettore quadridimen­
sionale R rispetto al tempo. Abbiamo bisogno del vettore velocità
quadridimensionale e, allo scopo, il vettore incremento quadridimen­
sionale, i?, cioè dR può essere diviso solo per uno scalare (un invarian­
te delle trasformazioni di Lorentz). Ma né il tempo né il suo diffe­
renziale è uno scalare.
Si può prendere l ’ intervallo e il tempo proprio di una particella
(vedi § 3.3) come grandezza invariante dipendente dal tempo.
Introduciamo ancora il concetto di tempo proprio, associandolo all’ in-
tervallo fra gli eventi. Facciamo uso del fatto che il moto di una par­
ticella nello spazio tridimensionale è una sequenza continua di eventi
che consistono nel fatto che la particella occupa un punto definito
dello spazio in un dato istante di tempo. Supponiamo che le coordi­
nale di una particella del riferimento K varino nel tempo dt di dxr
dy, dz, e che il suo spostamento sia di = Y <^2 - f dy2 + dz2. Consi­
deriamo il sistema inerziale istantaneo K ' comovente con la particel­
la , cioè il riferimento, la cui velocità costante V è uguale alla velocità
istantanea della particella. Nel riferimento K ' le coordinate della
particella non variano durante Fintervallo di tempo infinitesimo'
di’ : dx' = dyr = dz' = 0. Essendo invariante l ’intervallo tra eventi,
si ottiene
ds2 — c2dt2 — dx2 — dy 2 — dz2 = c2dt'2.

127
Nei riferimento K' Pintervallo dt' è Vintervallo di tempo proprio.
In questo capitolo lo designeremo con dx (non usiamo la notazione
x — et adoperata nei capitoli precedenti). D all’ uguaglianza prece­
dente abbiamo
i - i i y j , ,
c 2 d t2

Abbiamo Gitemi Lo un fìculfoin fumili Ciro ( S a a ri i rnn^t.rAIn* l ’ irìva-


rianza del tempo proprio (dx = ds/c). Diamo le equazioni che ci
serviranno in seguito :
dx = df/y1 ds = c d x , y = (1 — j32) “ 1/2, |3(t) = v (t)/c. (5.1)
Vediamo che il tempo proprio di una particella viene registrato da un
orologio di un SRI istantaneo comovente. Ma questi SRI istantanei
comoventi cambiano durante un intervallo di tempo finito nel caso
di una particella in moto acceleratogli tempo proprio finito di tale
particella è definito come il tempo totale registrato da molti SRL
In linea di principio, gli orologi non devono essere legati rigidamen­
te alla particella, in quanto, ogni accelerazione influenza il ritmo
dell’ orologio. Solo nel caso in cui Vaccelerazione provata dalla
particella non influenza praticamente il ritmo dell’ orologio, il
tempo proprio può essere registrato dall’orologio rigidamente legato
alla particella. Comunque, il « tempo proprio » si può ottenere facil­
mente dal tempo che segna Vorologio del riferimento K (rispetto a cui
si muove là particella) se si conosce la dipendenza temporale della
velocità della particella, cioè v = v (t):

Si vede dall’ultima equazione e dalle (5.1) che la coordinata tempora­


le (il tempo registrato da tutti gli orologi di K) è una funzione del
tempo proprio t . Si vede dall’equazione d,s — cdx che accanto al
tempo proprio dx si può usare ugualmente l ’ intervallo dsì inoltre
tutte le equazioni differiscono per varie potenze del fattore inva­
riante c.
Introduciamo ora il vettore velocità quadridimensionale

. (5-2>

Poiché dx è un invariante e dR un vettore, anche V è senza dubbio


un vettore. Mettiamo in luce il senso tridimensionale delle prime tre
componenti della (5.2) nelle notazioni della (4.7a):

** = & = “ * (*=1>2,3), (5.3)

128
dove va sono le componenti della velocità tridimensionale convenzio­
nale. Dunque, le prime tre componenti della velocità quadridimensio­
nale sono quelle della velocità tridimensionale convenzionale mol­
tiplicate per il fattore y che dipende dal valore assoluto della velocità
della particella. La quarta componente va trovata separatamente:
dxA d (ict)
(5.4)
v dt = icy.
Nelle notazioni della (4.7) abbiamo
ax^uj a (et) ,a .—. dx” — dxa
------- - - 7 1
dx r dt dx ^ dt
Come per la (4.7a, b) si può scrivere
-+/U u2 u3 U, \
f Uia U2 -J. / u° u1 u1 u2
u2 u3
us \
v{ . ; (a) Fi . (b) (5.5)
<yvx yvv yvz yvv
\yvx yvz ic y ) yvj
Per p—v 0, cioè per le velocità di un corpo z;<C c, il fattore e le
prime tre componenti della velocità quadridimensionale della (5.5a),
così come le ultime tre componenti della (5.5b), coincidono con la
velocità convenzionale. È particolarmente interessante la quarta
componente nella (5.5a) e quella con apice zero nella (5.5b) della
velocità quadridimensionale. Esse sono diverse da zero anche quando
la particella è in quiete (per v — 0 y = 1, e uk = ic, ma u° — c).
Quest’ ultimo risultato ha un significato ovvio: il tempo non può
essere fermato, fluisce sempre senza interruzione. Non c ’ è « quiete »
nell’ universo quadridimensionale (nel senso che V = 0). Per quan­
to concerne la « velocità dello scorrere del tempo » essa è definita
ovviamente dalla scelta delle unità di tempo.
Le componenti della velocità quadridimensionale si possono an­
che porre nella forma seguente:
V (y v, icy); (a) j V (cy, yv). (b) (5.6)
Il quadrato del vettore quadridimensionale è un invariante. Si
ottiene rispettivamente dalle (4.11a) e (4.11b)
F 2 = y zv 2— c 2y 2 = — c 2; P 2“ ( c2y 2— y ^ v 2) — c2,

li calcolo è più facile se fatto nel sistema di riferimento in cui la


particella è a riposo (v = 0). Allora, nella (5.5a) rimane soltanto
uk— ic, e nella (5.5b) solo u° = c. Di conseguenza,
V2= u l + ul + u2
3+ u l = — c2; (a) F 2 = : u 02 _ ut2_
- u22_ ^ 3 2_ 62; (b) (5.7)
li quadrato della velocità quadridimensionale nelle (5.7a) e (5.7b)
ha segno opposto in virtù della differente determinazione dell’ inter­
vallo (vedi capitolo IV), ma questo segno non cambia per la determi­
nazione appropriata di V2, da cui segue che si ha sempre v < c.
Appena la velocità dello spazio quadridimensionale è scritta in
forma di vettore quadridimensionale, si ottengono subito le equazio­
ni di trasformazione delle sue componenti nel passaggio da un riferi­
mento all’ altro. Siano (i^, u2, u3, w4) le componenti della velocità
quadridimensionale Fnel riferimento K. Secondo le (4.10a) otterremo
nel riferimento K'
u[ — T (mi + ìBw4), u '2 — u 2, u '3 = u 3ì u' = r(w4— ìBuì), (5.8)
ma le velocità quadridimensionali hanno le componenti V (yv>
—>-
icy), V' (y'v\ icy'), la cui sostituzione nella (5.8) dà
y'vx=-T (yvx — yV), y'vy = yvy, y'v'z = yvz, icy' — T (icy — iByvx).
(5.9)
Segue dall’ultima uguaglianza della (5.9) che
V _ 1 (5.10)

Sostituendo questa espressione nelle prime tre uguaglianze della (5.9)

V)i ~ ~Y~ V Z 1

otteniamo le formule per le componenti della velocità in K r dedotte


nel capitolo III dalle trasformazioni di Lorentz.
È da notare che se al posto delle formule di passaggio da K a K f
(5.8), si usano le equazioni del passaggio inverso, si ottengono, invece
della (5.10), le equazioni seguenti:

JL = r ( l ( 5. 10' )

il che permette di ottenere il valore di yly' in termini delle compo­


nenti della velocità nel riferimento K'. Dalla (5.10') segue la for­
mula (3.41) ottenuta in modo diverso
_____ i_____ Y i—p,a ì —Ba
v 'rp + y »;) * + 1 5 -’ i

Segue dalla (5.10) che se una particella è in quiete in K (v — 0) allora


7 ' = F; questo risultato è ovvio, in quanto una particella ferma in K
si muove rispetto a K r con velocità — V.
Lo stesso risultato si ottiene usando la (5.6b) e le formule di
trasformazione (4.10b). Suggeriamo al lettore di ricavarlo. Il nostro
risultato è ovvio: le componenti spaziali della velocità quadridimen­
sionale determinano la trasformazione della velocità tridimensionale
convenzionale.

130
Ora dobbiamo definire l ’ accelerazione quadridimensionale che
costruiremo ancora come vettore quadridimensionale
d2R dV
(5.11)
dx2 dx
ovvero, nelle componenti,
_dui d2xi dui d2xì
(a) w' (b) (5.12)
Wi dx dx2 ’ dx ~~dx2~ •

Più avanti scriveremo alcune formule riguardanti l ’ accelerazione,,


usando le notazioni della (4.7a); ci serviranno soltanto in casi speciali.
Le componenti dell’ accelerazione quadridimensionale si possono
esprimere mediante le componenti dei vettori tridimensionali v e v~
Otteniamo
d , , dt dy . 9 dva, Vg(vv)
w* = - « ^ IT = dT + ^ U T C 2 ( 1 — ^2)2
(5.13)
1-f
in quanto, come è facile verificare,
■ dy __ y óvv
di 73PP: (5.14)
dt
e rj^ = 7 . La quarta componente dell’ accelerazione è

- ir.v
dy

Nel caso di moto uniforme (v = 0) tutte le quattro componenti


dell’ accelerazione si annullano. Nel riferimento in cui una particella
è a riposo
u>l = vx, wl = vy, w°3= vz, = 0, (5.16)
cioè le tre componenti spaziali dell’accelerazione quadridimensionale^
coincidono con le componenti tridimensionali usuali dell’accelerazio­
ne, mentre quella temporale si annulla. Si vede dalla (5.16) che*

w\0— w^2
% = v2 >* 0 .
Data l ’ invarianza del quadrato del modulo di un quadrivettore (vedi
Appendice I, § 1) si può affermare che il quadrivettore accelerazione
è un vettore del genere spazio (vedi la definizione dell’ interval­
lo (4.5)).
Scriviamo le componenti del quadrivettore accelerazione w nella
notazioni della (4.7a, b):
“* / d , , ìc . Ì l i ) = (
“H v i r ( v » ) . — dt ì ' S r -f ) > ( a )

(5.17)
* h w ( cy ). y - i ( 7 1 7 ) ) = (b)

131
L ’ energia della particella g, introdotta qui, sarà definita in
seguito (vedi la (5.32)). Usando le (5.15) e (5.17), si può ottenere
facilmente
wz — w\~ y 6 — >0. (5.18)

Ora . scriviamo le formule di trasformazione dell’ accelerazione


tridimensionale (v = dvldt, vf = dv'/dt') nel passaggio da un SRI ad
un altro. Le trasformazioni di Galileo lasciavano invariata l ’ accelera­
zione tridimensionale della particella. Le trasformazioni di Lorentz
ne cambiano le componenti. Il modo più semplice per derivare le
equazioni di trasformazione delle componenti dell’ accelerazione
tridimensionale è il seguente. Considerando vx e v'x come funzioni di
i e t’ , rispettivamente, tenendo conto della relazione fra t e t' (2.16)
e ponendo (vjc) = (n*/c) — Pi ecc., otterremo dalla (3.26)
du' * £ - b % ' K - V x dv'y)
dvx = dVy=-
r * (i+ B {g * r ( n - B p ;) 2
e nello stesso modo, dvz. Dividendo i due membri di queste equazio­
ni per idue membri dell’equazione dt — T [dt( -f- ~ dxf^, otteniamo
I
V x~~ r 3 (i+B&i) Vxi

Vl + B $ > y-?> yvx) VZ+ B ( P X - P X )


Vv = IK = F2(l + Bp;)3
r 3 (i+ B p p 3
Ovviamente, si può ottenere Io stesso risultato mediante la tra-

sformazione del quadrivettore accelerazione w. Nei riferimenti K e K l


è facile porlo nella forma w (y2v + yvy, icyy), w' {y'2v* + y'v'y\
zcy'y')*
Dalle equazioni di trasformazione delle componenti del quadri-
vettore
wi = F {w[ — iBw[ ) , wk = F (u?* + iBuq)
otteniamo

Tf* + EW = r - y ( t ' ^ + 7 '^ + ^ y ').

Y = r ^ - t 7 ' + B ( v % + i'P i ) ] .

Usando la (5.10')$ vx si troverà da queste relazioni. Dalle formule


di trasformazione per = u?' e u>3 = si ottengono le formule di
trasformazione per vy e v z.
Le formule di trasformazione delle componenti dell’ accelerazione
tridimensionale contengono la velocità della particella. Ma Faccele-

132
razione tridimensionale appare soltanto quando varia la velocità.
Di conseguenza, anche quando l ’ accelerazione tridimensionale è co­
stante in un SRI, varia nel tempo in tutti gli altri riferimenti: nella
meccanica relativistica un moto uniformemente accelerato in un
SRI non lo è in tutti gli altri!

§ 5,2. Quadri!orza ed equazione


del moto quadridimensionale
Diamo qui alcune classiche relazioni tridimensionali cui faremo
iiferimento nel seguito. In meccanica classica la massa della
particella è considerata costante; la designeremo con m. La seconda
legge di Newton in meccanica classica si scrive come segue:

o
dp
= F, (5.19b)
dt

dove F è un vettore tridimensionale della normale forza; la grandezza


p = mv è chiamata quantità di moto classica della particella.
Moltiplicando entrambi i membri della (5.19a) per v dt, otteniamo
mediante sem plici trasformazioni il corollario della seconda legge
di Newton:
d (mv2/2) = Fv dt. (5.20)
Il secondo membro nella (5.20) contiene il lavoro compiuto dalla
forza F; nel primo membro, in virtù della legge di conservazione
dell’ energia deve figurare il cambiamento di energia. Quindi, l ’ener­
gia del corpo si può definire come T = mv2/2 , a meno di una costante
additiva. Qui la costante si assume uguale a zero, in modo che il
corpo a riposo abbia energia nulla. Di conseguenza, l ’energia mv2/2
è associata soltanto al moto del corpo; per questa ragione viene chia­
mata energia cinetica (« energia ui moto »). Sottolineiamo che se fosse
assunto che un corpo a riposo possiede un’energia § 0, l ’energia
« totale » di un corpo in moto sarebbe % = T + &0. La costante g 0
si può interpretare come energia potenziale permanente ovvero ener­
gia interna. Ma in meccanica classica, non c ’ è alcun motivo per far
ciò, ed g 0 si può vedere come una costante arbitraria. Quindi in
meccanica classica l ’energia « totale » di un corpo libero potrebbe
avere qualsiasi segno (secondo il segno della costante g 0). Solita­
mente 6 0 = 0, e l ’energia totale di un corpo libero coincide con
quella cinetica.
Supponiamo ora che la particella si trovi in un campo di poten­
ziale, cioè la forza agente sulla particella si può esprimere come F =
= — grad U , dove U (#, y, z) è un’energia potenziale. Poiché v dt —
= dr e grad U dr — dU, la (5.20) prende la forma
d (mv2!2) - - dU.

133
Da qui segue la legge della conservazione dell'energia totale della
meccanica classica:

± ( T + U )= 0 ;

in altre parole, T + U = costante.


Ora passiamo alla definizione del quadrimpulso P della parti-
cella. Come nel caso dell’ impulso tridimensionale (p = mv) indi­
chiamo il quadrimpulso come il prodotto della massa invariante
(scalare) m per la quadrivelocità F, cioè P — mV. Quindi
-y —
>*

P (myv, imyc); (a) | P (myc, myv). (b) (5.21)

Come sarà chiaro in seguito, è opportuno chiamare la massa in­


variante m massa a riposo. Per analogia con la (5.19) si può supporre
che l ’ equazione del moto quadridimensionale abbia la forma

dP t,
(5.22)

o, in componenti,
du;rt-
(5.23)

dove la differenziazione, ovviamente, è fatta rispetto al tempo


invariante proprio dx (altrimenti non si ottiene una relazione
vettoriale), mentre il secondo membro contiene il quadrivettore
forza F (gq, 3?2j ^ 3, 3f4 ), Clli componenti vanno determinate.
Ricordiamo ancora una volta (vedi § 4.3) perché sia importante
scrivere l ’ equazione del moto in forma vettoriale quadridimensio­
nale (5.22). Il punto è che secondo il primo postulato di Einstein
tutte le leggi fondamentali della fisica devono avere la stessa forma
in tutti i SRI. In termini matematici questo significa che le equazio­
ni descriventi leggi fisiche devono essere scritte in forma covarian­
te rispetto alle trasformazioni di Lorentz. Le equazioni sono scritte
in forma covariante se i loro entrambi membri vengono trasformati,
nelle trasformazioni di Lorentz, nello stesso modo. Ma ciò significa
semplicemente che entrambi i membri debbono essere, rispettiva­
mente, o grandezze scalari (invarianti) o quadrivettori, o, infine,
tensori dello stesso rango (li tratteremo nel capitolo VI). Questo
è sufficiente ad assicurare l ’ invarianza delle relazioni presentate in
questa forma nel passaggio da un SRI ad un altro. Dopo aver scritto
l ’ equaz one del moto in forma vettoriale (5.22) abbiamo assicurato
la covarianza di questa equazione nelle trasformazioni di Lorentz,
cioè il carattere universale del principio di relatività di Einstein.

134
Le componenti del vettore dP/dx ci sono familiari in quanto cono*
—>

sciamo dalla (5.17a, b) le componenti dV/dx e m è un invariante

- S r (? 4 { m y v ) (' a)
(5.24)

Abbiamo denotato le componenti del quadrivettore F con la


lettera gotica $ fornita di indici, cioè F ( gq, 3 L, ^ 3? ) oppu-
re F (£5r°, fy1, ^ 2, gr3). Uguagliando i quadrivettori, si uguaglia­
no le loro componenti. Le prime tre componenti della (5.24a) e le
ultime tre componenti della (5.24b) si ottengono come segue (a =
= 1, 2, 3):

Y ■jf(my va) = (a) | Y - £ f{m y v a) = %a. (5.25)

Determiniamo le prime tre componenti della quadriforza g a.


Ovviamente, sono proporzionali alle componenti della forza tridi­
mensionale in quanto al limite per (3-> 0 dobbiamo riottenere l ’ equa­
zione di Newton. Se si mantiene la definizione Gonvenzionale di
forza e si suppone, come prima, che una « forza determina una varia­
zione di impulso » si deve scrivere

%a = yFa, F = yFa
dove Fa sono le componenti della forza tridimensionale. Sostituendo
le espressioni per gra nel secondo membro della (5.25a), otteniamo

-jf(m y v a) = F a
( a = l , 2, 3),

e moltiplicando ciascuna di queste equazioni per il vettore coordina­


to unitario corrispondente e sommando le espressioni così ottenu­
te, otteniamo l ’ equazione del moto in forma vettoriale:

± { m y v ) = F. (5.26)

Confrontando la (5.26) con l ’equazione del moto non relativistica


(5.19), si nota che differiscono soltanto per la definizione dell’ impul­
so. L ’ impulso (tridimensionale) relativistico è rappresentato dalla
grandezza
p = myv; (5.27)
in questo caso la (5.26) assomiglia in apparenza alla (5.19).
Allora, le tre componenti spaziali della (5.23) hanno dato la
seconda legge di Newton in forma relativistica. Comunque, il si­
gnificato della quarta relazione (o nulla) è ancora da chiarire. A tal
fine bisogna conoscere 5^ (o g°). Ma viene fuori che, assegnando le

135
tre componenti delia quadrìforza, abbiamo determinato anche la quar­
ta componente. Si può essere certi di ciò nel modo seguente. Diffe­
renziando la (5.7a, b) rispetto a t , otteniamo
du5 . ,

H f + U3 + ^4 d% = o, (a)
du0 du1 du3 (5.28)
■— U1 -— u2 = 0. (b)
d% dT d%

Ma secondo la (5.23)
di fy sono determinate nella (5.26) e le componenti dalla (5.5).
Quindi, la (5.28a), ad esempio, si può riscrivere

yvx yFx yFy yFz ■tcy-% *. = 0,


■yvv Yvz 8m
da cui si può ricavare subito §4 (e similmente g°):

g 4 = i f ( i F v ) ; (a) | (b) (5.29)

Diamo la possibilità al lettore di derivare da solo la (5.29b)»


Allora, abbiamo trovato le componenti della quadriforza F detta
forza di Minkowski:
/' »% !i ^»2
2 ^»8
3 »4
&4 \
yFy yF z i-J-

go gi g2
3-3
tf ). (b)
A (Fv)Y^x

Per chiarire il significato della quarta relazione della (5.23) in


termini della (5.5a), o del termine nullo in termini della (5.5b)*
eguagliamo le componenti corrispondenti delle (5.24) e (5.30):

ìy 4 f 1(Fv )'
altrimenti
-ft
Qui si possono ripetere gli stessi ragionamenti riguardanti la
relazione (5.20). Il secondo membro della (5.31) rappresenta il
lavoro compiuto dalla forza; il primo membro deve contenere il
cambiamento di energia. Definiamo l ’energia totale di una particella
libera relativistica come
i = m c 2y = m e2 (1 — p2)"8^ 2; (5.32)
qui p — vie, dove v è il valore assoluto della velocità tridimensionale
del corpo» Sottolineiamo che l ’ energia del corpo è determinata dal­
la (5.31) a meno di un termine costante. La (5.32) indica che una

136
particella a riposo (v — 0 , p = 0) possiede l ’energia f 0 = me2.
Un tale valore della costante non è scelto a piacere, ma giustificato dal
passaggio limite alia formula classica della composizione delle
velocità.
Rimandiamo la discussione dell’equazione relativistica del mo­
to (5.26) e l ’ espressione relativistica per l ’energia di una particella
(5.32) ai §§ 5.3 e 5.4, e nel frattempo tratteremo la trasformazione del­
la quadriforza e le conseguenze che ne derivano. Scriviamo la legge di
trasformazione della forza (in termini della (5.30a)):
& = r (t 5 i+ iB g 4), ‘ = & = s : = r ( g 4- 5m _ ) - (5r33>
Cominciamo con un caso semplice. Supponiamo che la forza
(tridimensionale) F agisca su una particella a riposo nel riferimen­
to K Q. Quindi, secondo la (5.30a), F° (F°, 0). Dalle formule (5.33)
otteniamo
y'F'9 = TF°x, y'F'v = F*v, y'F't + F l y'F 'v' = — YVF%.
Nel caso considerato la particella si muove rispetto a K* con la velo­
cità del sistema di riferimento K°, cioè con velocità — V. Perciò,
7 ' = P ed otteniamo le formule di trasformazione per le componenti
della forza e del lavoro prodotto da questa forza:

F'X = F%, F'y = F i y ' T - & , F'z\


(5.34)
Si vede dalle prime tre relazioni (5.34) che rimangono inalterate
le componenti della forza parallele alla velocità del moto relativo.
Le componenti della forza, perpendicolari alla direzione del moto
relativo cambiano. È facile trovare il significato dell’ultima relazio­
ne della (5.34). Seia particella era a riposo nel riferimento essa
si muove nel riferimento K ' con velocità — V. Il lavoro è compiuto
soltanto dalla componente F x della forza (tutte le altre sono perpen­
dicolari alla direzione del moto). La potenza sviluppata dalla
forza Fx nel riferimento K° è uguale a — F%V che corrisponde al
risultato ottenuto.
Dalle (5.34) si vede che nel caso non relativistico, quando B < 1
la forma tridimensionale non varia nel passaggio da un SRI ad un
altro. Questo latto è in pieno accordo con l ’ idea intuitiva di forza
invariante in ogni sistema di riferimento. Comunque, nel presen­
tare la T R R , ed in particolare, nel derivare certe relazioni della
TRR, quando si fa uso di trasformazione di forze, bisogna sottolineare
prima di tutto la variazione delle componenti delle forze nel pas­
saggio da un SRI ad un altro.
Nel caso generale, usando la (5.30a), otteniamo dalla (5.33)

T' n = r | y , — 7 - v ( f ® ) ] ,
Y(
FV) = n 7

137
Pdscrivenclo le ultime equazioni nella forma

(5.35)

e tenendo conto della (5.10), si ottiene infine

Fx - ~ ( F v ) Fy V 1— B*

(5.36)
(Fv)-VFX

Si vede dalle formule di trasformazione (5.36) per la quadri-


forza che se non c ’ è una forza tridimensionale in un certo SRI, tale
forza non può apparire in nessun altro SRI. Quindi le forze si tra­
sformano nel passaggio da un SRI ad un altro, ma non appaiono
o scompaiono mai.
Da ciò segue immediatamente la validità della legge d ’ inerzia
in ogni SRI. Se in un SRI non c ’ è una forza agente su un corpo ed
esso si muove per inerzia (v = costante), la stessa situazione si
osserva in ogni altro SRI (vedi le (5.27) e (5.32)).

§ 5.3. Equazione relativistica


tridimensionale del moto di una
particella (seconda legge di Newton
in forma relativistica)

Dopo aver scritto l ’equazione del moto nella forma di quadrivetto-


re (5.23) e determinato le componenti della quadriforza (forza di
Minkowski), da un lato, abbiamo soddisfatto il principio di relativi­
tà e, dall’ altro, abbiamo ottenuto le quattro componenti dell’equazio­
ne del molo. Le tre componenti ci forniscono di per sé l ’ « equazione
del moto » in forma tridimensionale (5.27), mentre la quarta compo­
nente ci permette di determinare l ’espressione relativistica dell’ e­
nergia (5.32). L ’equazione (5.27) è stata ricavata assumendo che le
equazioni della dinamica debbano mantenere la loro forma in tutti
i SRI, cioè debbono essere covarianti rispetto alle trasformazioni di
Lorentz. Comunque, anche senza passare da un riferimento all’ altro,
sappiamo che l ’ esatta equazione del moto è la (5.26) e non la (5.19).
Scriviamo queste due equazioni affiancate e chiariamo le differenze
tra di esse:

^ (m v )= F -, (a) I ± {m y v )-F . (b) (5.37)

138
Prima di tutto, è chiaro che per (5 = quando y ~ 1,
l ’ equazione (5.37b) si trasforma nella (5.37a). Questo significa che la
meccanica classica è il caso limite della meccanica relativistica,
quando le velocità delle particelle sono non relativistiche. Inoltre,
per soddisfare il principio di relatività di Galileo in meccanica
-classica, devono essere valide le trasformazioni di Galileo che richie­
dono B <C 1 (vedi § 2.7), cioè la velocità relativa dei riferimenti con­
siderati deve essere non relativistica.
Qualche volta, dal confronto fra le (5.37a) e (5.37b) si conclude
che la differenza tra esse consiste nel fatto che nella (5.37b) la massa
dipende dalla velocità, in modo che prendendo my come massa rela­
tivistica, otteniamo l ’ equazione classica. Ora vediamo che le cose
sono molto più complicate, e nel Supplemento IV discuteremo perché
non ha senso introdurre una massa dipendente dalla velocità.
Per confrontare le (5.37a) e (5.37b), bisogna riscrivere il primo
membro della (5.37b) in base alla seguente identità (vedi anche le
<5.31) e (5.32)):

Raggruppando i termini, le (5.37a) e (5.37b) si possono riscrivere


come segue:
(a)
(5.38)

È interessante che in un SRI comovente con la particella (v — 0)


la (5.38a) coincide con la (5.38b). Da queste relazioni si vede im­
mediatamente che la differenza principale della legge relativistica
della dinamica (5.37b) da quella classica (5.37a) sta nel fatto che
nella prima haccelerazione tridimensionale non coincide, in ge­
nerale, in direzione con la forza. Di conseguenza, il confronto di­
retto delle componenti della forza e dell’ accelerazione, che si fa
facilmente per il caso (5.37a), e impossibile. Si vede dall’equazione
(5.38b) che ci sono soltanto due casi in cui l ’ accelerazione e la for­
za coincidono in direzione e si possono allora confrontare le defi­
nizioni di massa nelle (5.37a) e (5.37b).
a) Supponiamo che la forza agente sulla particella sia sempre
normale alla sua velocità, cioè F J_v. In questo caso dalla (5.38b)
ottiene immediatamente l ’ equazione del moto nella forma seguente:

(5.39)

dove, secondo le (5.31) e (5.32), y = costante. Questo caso si rea­


lizza quando una particella carica si muove in un campo magnetico
costante. La forza di Lorentz F = elvB] è diretta in modo che Fv = 0
(sempre). Si può dire che il moto di una particella relativistica
in un campo magnetico costante si svolge secondo l ’ equazione clas­

139
a, y (> -^ < F »)]-j[F -li(F | ì)l. (b)
sica del moto (5.19), ma con ima massa effettiva (ma costante) my„.
Questo è valido comunque, soltanto per un caso particolare della,
forza soddisfacente la condizione Fv 0. Per esserne certi, con­
sideriamo un altro caso.
b) Supponiamo che la forza agente sulla particella sia sempre­
diretta come la sua velocità. Ovviamente, questo implica il moto
rettilineo della particella (nel caso di una scelta determinata della
velocità iniziale). Un esempio semplice di tale moto lo fornisce una
particella carica che si muove in un condensatore piano (la velocità
iniziale deve essere diretta lungo il campo elettrico). Se F ||u,
allora v(Fv) == F(vv) = Fu2, e dalla (5.38b) otteniamo la seguente-
equazione del moto:
dv
myc --F\
dt
dove y è una variabile.
Allora, nei due casi particolari che permettono un confronto delle
(5.38a) e (5.38b) otteniamo una diversa dipendenza della massa dalla
velocità; ciò indica] che non c ’ è una dipendenza universale della
massa dalla velocità. È opportuno usare la massa a riposo invariante
(vedi Supplemento IV).
Come in meccanica classica, si può scrivere l ’equazione della
dinamica per il caso in cui la massa a riposo varii per lo scambio con
l ’ esterno di energia e di impulso. Se una particella perde in un’unità
di tempo un quadrivettore di impulso II (IQ) = (7 II, i/cyO) per con­
vezione, al posto della (5 .22 ) si può scrivere
dP
d% = f + n,

( m U i ) = g i + n , , (5.40)
drz

dove soltanto è una vera forza meccanica che soddisfa la condi-


zione FV = 0. Scrivendo la (5.40) nelle componenti, otteniamo

■ T T = * + n . - £ - = * ’ +*•
Qui n e d ) sono l ’ impulso e l ’energia forniti alla particella per con­
vezione per unità di tempo. Formato il prodotto

UV = y2 {Hv — Q>)= — <D°,


si vede che la grandezza <D° è la velocità di trasporto convettivo dell’e­
nergia'nel riferimento in cui la particella è in quiete; essa è uguale
alla velocità di cambiamento dell’energia a riposo della particella.
Infatti, differenziando la (5.40), otteniamo

m ~dx~ Ui~ch~ “ (5.41)

140
Moltiplicando ambedue i membri della (5.41) per ut e tenendo
presente die V (dVidx) = 0 e FV = 0, otteniamo
dm dE o
(P u - e — 11 ì U ì ^ c2
dx dx

Assumendo che la vera forza meccanica debba soddisfare la


condizione
dui
m-
dx
nel caso di un trasferimento convettivo di impulso ed energia la
seguente grandezza deve essere considerata come una forza meccanica
(vedi (5.41)):
dui , , ___c& i j ,, H hu h
ti
m- >8 , + ■ n , - -p r ui u i + l i i + u t —
dx

Quando manca una vera forza meccanica, bisogna considerare la forza


meccanica « reattiva »
Rt = + Ui

che soddisfa la condizione R V = 0.


In qualche caso particolare si può ottenere Vimpulso non solo con
mezzi meccanici, ad esempio, mediante radiazione o scambio di
calore tra la particella e 1’ ambiente. Nel caso di puro scambio di calore
il quadrimpulso del calore trasferito alla particella durante il tempo
dx è uguale a 6Qt = IQcfc — (òp, i (8Q/c)).
Di conseguenza, òp — IIdt, òQ = ò d t sono l ’ impulso e l ’ energia
del calore trasferito durante il tempo dt. In questo caso il quadrim­
pulso del calore trasferito è un quad ri volt ore.

§ 5.4. Espressione relativistica


dell’ energia di una particella
Notiamo che la formula (5.31) si può ottenere non solo come la quarta
componente della (5.23), ma direttamente dalla (5.37b) esattamen­
te come la (5.20) segue dalla (5=19) nella meccanica classica. Per
convincersene, moltiplichiamo scalarmente entrambi i membri della
(5.38h) per v; otteniamo
:™ = J- (F»)] = U -F c .

Questa è proprio la (5.31) tenendo conto della (5.14). D ’ altra parte?


la quarta componente della (5.23) ci fornisce la legge di conservazione
dell’energia. L ’ espressione per l ’ energia data dalla (5.32) differisce
essenzialmente da quella classica. Nella meccanica newtoniana si
assume che l ’energia di nn oggetto libero in quiete (cioè un oggetto che
non possiede energia potenziale sia uguale a zero, da cui segue la
definizione univoca dell’energia cinetica T = mv2/2. In meccanica

141
relativistica l ’energia totale di una particella libera si definisce?
come % = mc2y. Questa energia è totale nel senso che include anche
l ’energia di un corpo a riposo (quest’ultima è uguale a me2). Ma
abbiamo già detto che la (5.31) definisce l ’energia a meno di una co­
stante e, scegliendo in modo appropriato la costante (assumendo g 0 =
= — me2), si potrebbe avere, come nella meccanica di Newton, che
l'energia di un corpo in quiete è uguale a zero. Ma è impossibile
farlo nella TRR. Nella meccanica della TRR non bisogna dimenti­
care né le regole di trasformazione delle varie grandezze né il princi­
pio di corrispondenza conia meccanica classica: (nel caso limite (3—^ 0
si deve avere la corrispondenza di molte grandezze classiche e rela­
tivistiche). Sappiamo che le trasformazioni di Lorentz diventano
quelle di Galileo per piccole velocità relative dei sistemi di riferi­
mento (B->- 0, T—>- 1); per piccole velocità delle particelle (p—>- 0)
l ’ impulso relativistico tridimensionale si trasforma in quello classi­
co, myv->- mv.
Supponiamo di aver determinato l ’ energia totale della particel­
la libera nella forma % = mc2y + C; allora nel caso limite p—>■ Q1
dobbiamo ottenere % = me2 -f- C. Esaminiamo ora la trasformazione
delle componenti del quadrimpulso nel passaggio da un SRI ad un
altro. Avviene secondo le equazioni seguenti:
^ = r ( P t + iBP4), P'a=

Sostituendo i valori delle componenti P x, P 2, P 3, P k del quadrimpulso-


dalla (5.21), otteniamo

p * = r (p.v— § - § ) ,

dove p x, p y, p z e px, p'v, pz sono le componenti dell’ impulso relati­


vistico tridimensionale p = myv. Nel caso limite corrispondente al
passaggio alla meccanica classica quando B —>- 0, P*-> 0 e, rispetti­
vamente, Px-*- rrwx, px->- mvx, me2, la prima uguaglianza
della (5.44) porterebbe a mv'x = mvx — m V ----- Ma l ’ultima
uguaglianza dovrebbe dare la legge classica della somma delle velo­
cità vx — vx — V . Sarebbe il caso di C = 0. In questo modo si veri­
fica la validità della (5.32). Bisogna notare che il principio di cor­
rispondenza fra le espressioni classica e relativistica dell’energia
non è valido solo perché nel sistema della meccanica newtoniana non
si può mettere in evidenza l ’esistenza dell’energia a riposo, e la
costante additiva è stata scelta senza tener conto dell’energia a riposo
(vedi in seguito).
Si vede dalla (5.32) che l ’ energia totale non si annulla anche quan­
do la velocità di un corpo è uguale a zero (7 = 1 per v = 0). L ’energia
di una particella libera nel riferimento in cui è a riposo è uguale ad
me2 ed è chiamata energia a riposo g 0. Benché si sia trattato finora
di particelle, non si è discusso del loro carattere elementare. Perciò,
tutte le equazioni ottenute si applicano a qualsiasi corpo complesso

142
(sistema) composto di diverse componenti. Naturalmente, m sarà la
massa totale del corpo, e v la velocità del suo moto come un tutt’uno.
L ’equazione %0 — me2 è valida por ogni corpo in quiete. Perciò la
massa a riposo del corpo definisce l ’energia totale racchiusa in
esso senza tener conto dell’ origine di questa energia.
In meccanica classica l ’energia di un corpo a riposo può essere
sia negativa che positiva: è definita a meno di una costante additiva.
In meccanica relativistica l ’energia di un corpo libero (o l ’ energia
di un sistema chiuso) è sempre positiva e legata alla massa a riposo
del corpo; la massa a riposo di un corpo definisce la sua energia a ri­
poso. L ’ inerzia del corpo risulta una misura dell’energia del corpo.
Ogni volta che l ’ energia del corpo cambia di Ag, la massa del corpo
varia di Am — A%tc2,
Sorge il problema di come possa rimanere nascosta un’energia
così grande, cioè come resti confinata dentro un corpo l ’energia a ripo­
so. Infatti, un grammo di una sostanza contiene circa IO21 erg. La
quantità totale di energia confinata dentro un sistema, comunque,
non è così essenziale come la parte che può essere utilizzata. Sebbene
ogni massa possieda una grande quantità di energia, liberarla non
è affatto facile. Soltanto in tempi recenti si è imparato ad utilizzare
l ’energia atomica. Fino a qualche tempo fa l ’ energia a riposo non
era utilizzabile (e, in conseguenza, la massa era sempre costante).
Poiché il rilascio di energia si manifesta sempre come differenza
d’energia, l ’ esistenza dell’energia a riposo non si manifesta in alcun
modo.
Poiché c2 è molto grande, il cambiamento di una massa che accom­
pagna il cambiamento di energia del corpo è m olto piccolo e non si
può misurare sperimentalmente anche se le misure di peso sono sem­
pre state fra le misure più precise. Per esempio, 1 kg di acqua
scaldata a 100° guadagna soltanto 5 -IO "9 g di massa. Un cambiamen­
to di massa così piccolo non si può misurare nemmeno con le più
sensibili bilance moderne. La formazione di nuclei, tuttavia, coin­
volge cambiamenti di massa apprezzabili; questo difetto di massa
determina l ’energia di legame (vedi § 5.6).
In meccanica relativistica è naturale definire energia cinetica la
parte dell’energia della particella che si annulla per y = 0 e che si
ottiene sottraendo l ’energia a riposo all’ energia totale della particella:
T — % — me2 = me2 (y — 1). (5.44)
Si può ottenere lo stesso risultato, calcolando il lavoro di una
forza secondo l ’ equazione della dinamica relativistica:
dT = Fv d t = v d (myv) = myv dv -f- mv2 dy =

Y2
Di qui

T — m \y3v dv = me2y + costante.

143
Se T = 0 per v = 0 (cioè per y = 1), la costante = — me2, da cui
segue ancora che T = nrn2 (7 — 1).
Troviamo le condizioni per cui l ’espressione (5.44) si converte
nell’ espressione classica per l ’energia cinetica. Sviluppando 7 in
serie

v = y i= p - = 1+ TP 2+TP4+--->
vediamo che
_ m7J2 3 7U

cioè l ’energia cinetica classica ha senso in quanto p < 1 e il termi­


ne p4 può essere trascurato.
Designando con Tcì l ’energia cinetica classica e con Treì quella,
relativistica, la (5.45) si può riscrivere come segue:

^rei = Tcl + -^-m —2- + •« »

o, per il rapporto TTeì/Tcìì

p2 + (termini delPordine di p4 e più alti).

In fisica nucleare, dove si richiede una definizione più precisa del


« limite di applicabilità della meccanica newtoniana », si assume
che ! Tqi= Tcl se il secondo termine del secondo membro dell’equa­
zione è minore deH’un per cento (ricordare che p<C 1 , e la serie de­
cresce rapidamente). Di conseguenza, la frontiera (ovviamente, con-
dizionata) si trova dall’equazione ^p2 = " 0 ,0 1 , P ^ 0 , 12 .
Poiché y = y (v), e y = %!mc2 per una particella, si può parlare
di velocità relativistiche quando l ’ energia totale % di una particella
supera in modo apprezzabile la sua massa a riposo, cioè si può intro­
durre la condizione ($/mc2)^> 1 . Sicuramente entrambe le condizio­
ni sono qualitativamente equivalenti, ma bisogna tener presente che
quando la velocità si avvicina al suo limite (c), l ’energia tende all’ in­
finito. Perciò, piccole variazioni di velocità in vicinanza di c possono
alterare radicalmente l ’ energia della particella.
In fisica nucleare è più conveniente trattare l ’ energia delle par­
ticelle piuttosto che la loro velocità. Naturalmente, particelle di
masse diverse avranno differenti lim iti di energia in cui è applicabile
la meccanica classica. Per esempio, nel caso di elettroni questo limite
è uguale a 3 keV, mentre per i protoni è 7 MeV (è utile per il lettore
ottenere questi valori!).
L ’ espressione (5.32) si può riscrivere come
%= (5.46)
se si tiene conto dell’ energia zero g 0 — me2. L ’energia a riposo § 0
comprende tutti i tipi di energia posseduti da un corpo (0 sistema).
144
La (5.46) mostra che tutti i tipi di energia aumentano di y volte nel
passaggio da un riferimento proprio (comovente) ad un riferimento
inerziale. Non c ’ è niente del genere in meccanica classica. D ’ altra
parte, l ’ energia totale della particella (5.32) e la sua energia cineti­
ca (5.45) crescono senza limite quando y—>- c. Questo risultato ha
pieno significato fisico. Una particella, la cui massa a riposo diffe­
risce da zero non può raggiungere una velocità uguale a c. Questo si
può dedurre dal fatto che la particella richiederebbe un’energia
infinita per raggiungere una tale velocità. In questo caso si ripresen­
ta ancora la limitatezza della velocità della luce nel vuoto. Quando
si trattano i quanti di luce (fotoni) come particelle relativistiche
(vedi § 7.6), bisogna tener presente che essi appartengono ad un’ altra
classe di particelle e non lo diventano come risultato dell’ accelerazio­
ne di particelle convenzionali, cioè mediante transizione dinamica.
La transizione limite v -+ c avviene in natura, ma il punto estremo
della transizione v = c non è mai raggiunto»

§ 5.5o Quadri vettore


energia-impulso
La quarta componente (con indice zero) del quadrimpulso di una
particella libera ha un peso diretto sull’energia della particella.
Ciò è evidente dalla seguente trasformazione diretta^

P k= micy — ~ mc2y — -L %; (a) |P° = mcy — •« (b)

Di conseguenza, il quadri vettore P viene detto anche quadrivetiore


energia-impulso di una particella. Dalla (5.7) e dal fatto che P —
= mV segue che

P2= _ ^ 2 c2; (a) | P 2 = m2c2o (b) (5.47)

La legge di trasformazione delle componenti di P è data dalle (5.42)


e (5.43). Rimane da riscrivere la (5.22) nella forma finale

p { p **|-); <a> | N 4 - ’ *) • (b)


dove p = myv. Consideriamo una particella in un riferimento in cui
il suo momento tridimensionale relativistico p — myv sia uguale
a zero. Il riferimento in cui la particella è a riposo (v — 0) si chiama
sistema di riferimento proprio. Sia £° l ’ energia a riposo in questo
riferimento. Allora nel riferimento K'\ secondo la (5.43)),

g' = rg°, P; = —r — g ° = (5.49)


Si vede dalla (5.49) che il trasporto dell’energia da una parti­
cella è legato alla comparsa di un impulso. Infatti, nel riferimento
proprio una particella possiede un’energia g° che non si muove nello

145
spazio. L ’impulso di una particella (portatore di energia) è uguale
a zero in questo riferimento. Nel riferimento K ' la particella si
muove; la sua velocità è uguale a —V. Questo significa che l ’ener­
gia « fluisce » con questa velocità. La formula (5.49) per p x mostra
che il flusso d’ energia coinvolge l ’ impulso p fx = —T— V. Questo
impulso coincide con l ’ impulso tridimensionale relativistico perché,,
secondo la (5.32), g°/c 2 = la velocità della particella è uguale-
a V, e T coincide con y in questo caso.
Allora, un portatore di energia (una particella, in questo caso) de­
ve possedere un momento. Sebbene abbiamo ottenuto questo risul­
tato per una particella, esso ha un significato generale; lo incontrere­
mo ancora esaminando il campo elettromagnetico (capitolo VI).
Si vuole sottolineare che il fatto di integrare certe grandezze in
un quadrivettore implica una profonda connessione fra di esse. Lo
grandezze componenti un quadrivettore (di solito un vettore tridi­
mensionale ed uno scalare) costituiscono in un certo senso una com­
binazione chiusa: per calcolare l ’ energia e l ’ impulso di una particella
nel riferimento K ' , bisogna conoscerli nel riferimento K (vedi la
(5.43)). La quarta componente (con indice zero) di un quadrivettore
energia-impulso non può mai azzerarsi. Se fosse zero in qualche si­
stema di riferimento, sarebbe uguale a zero in ogni altro riferimento.
Questo è il punto in cui le relazioni relativistiche e classiche diffe­
riscono fondamentalmente. In meccanica classica l ’ energia e l ’ im­
pulso di una particella stazionaria sono uguali a zero.
Il quadrato di un quadrivettore è un importante invariante*
Scriviamolo:

pz — p z — ~ - = —m2c2; (a) | P 2= ---- p 2= m2c2 (b) (5.50)

(abbiamo usato le] relazioni (5.47) e (5.48)). E necessario dire che


è uguale in valore ma di segno opposto nei due casi. Ciò che importa
è che abbiamo trovato una relazione invariante tra l ’ impulso relati­
vistico e l ’ energia relativistica di una particella; è essenziale in
questo caso che l ’ equazione invariante (5.50) determini una massa
invariante, la massa a riposo della particella.
Dalla (5.50) si può esprimere l ’ energia della particella in termini
dell’ impulso:
% = c V p 2 + m2c\ (5.51)

L ’ energia della particella espressa in termini del momento è nota


come funzione hamiltoniana 36 della particella. Quindi, la (5.51) dà
la funzione hamiltoniana della particella. È noto che la derivata
della funzione hamiltoniana rispetto alle componenti dell’ impulso
dà le componenti della velocità della particella:
d% _ d&e _ dx _
3px = 3P x ~ it ' •’
o » = Vj»I. (5.52)

146
La formula (5.52) si può ottenere differenziando la (5.50),

P szA Px “t- P y d P y Pz d p z = ■ c 2 § d %, (5.53)

dove

(5.54)

Ma siccome g — mc2^, e p = myv, allora

(5.55)

per una particella, e ritroviamo la (5.52).


Nel seguito avremo bisogno di una formula che è facilmente
derivabile dalla (5.52): moltiplicando entrambi i membri della
(5.52) per dp, otteniamo v dp = d g . Chi non è particolarmente
incline a trattare i gradienti deve notare come lo stesso risultata
deriva subito dalle (5.37a) e (5.37b) sia nel caso classico che in quello'
relativistico, benché l ’ impulso sia, ovviamente, definito in modo
diverso. Moltiplicando entrambi i membri delle (5.37a) e (5.37b)
per v dt, otteniamo F dr, cioè dg, nel secondo membro e vdp nel pri­
mo. Perciò, sia in meccanica classica che in quella relativistica
abbiamo la medesima formula
dg = v dp, (5.56)

ma la definizione di energia e di impulso è differente.


Nel caso più semplice di moto unidimensionale g = g (p)
si determina secondo la (5.51). Nel piano delle variabili g, p la
velocità è determinata dalla tangente alla curva g — %{p) in un
dato punto. Quando p ^ m c , la (5.51) diventa
(5.51'}

Le particelle con massa a riposo finita, per cui è valida[questa rela­


zione, sono dette ultrarelaiivisiiche. La (5.51') è valida sia per le
particelle ultrarelativistiche che per i fotoni. Vedremo nel § 7.&
che i quanti di luce (fotoni) si possono trattare come particelle rela­
tivistiche. Ma qui è importante notare che sono particelle piuttosto
speciali. In ogni SRI queste particelle hanno un impulso finito ed
un’ energia finita. La loro velocità nel vuoto è la stessa in ogni SRI.
Non possono aver origine mediante accelerazione da nessuna particel­
la che possieda una massa a riposo finita. Infine, dalla (5.50) noi
deduciamo che i fotoni hanno massa a riposo uguale a zero.
Consideriamo alcune altre relazioni per una particella posta
in un campo di potenziale esterno. Poiché il campo si propaga con
velocità finita, si verifica il principio fondamentale della TR R , la
velocità limite della trasmissione dei segnali. La forza che agisce su
una particella è definita dal valore della funzione potenziale nel punto
in cui è posta la particella (il campo è stazionario).

147
Quando una particella si trova in un campo di potenziale, allora
Fv dt — — dU e la (5.31) diventa d (inc2y) — — dU, da cui segue la
legge di conservazione dell’ energia totale di una particella relativi­
stica in un campo di potenziale:
me2,y + U = costante (5.57)
(l’energia è totale nel senso die la somma dell’ energia relativistica
e potenziale della particella rimane costante). In meccanica relati­
vistica l ’energìa cinetica è uguale a me2 (y — 1 ); sostituendo il valore
della costante nel secondo membro a me2, la legge di conservazione
dell’energia si scrive
me2 (7 — 1) + U = costante. (5.58)
Quando la particella si trova in un campo conservativo, la sua
velocità e l ’energia potenziale possono cambiare nel corso del moto
ma il valore % = mc2y + U rimane costante (vedi la (5.57)) in quan­
to è indipendente dal tempo in un dato SRL La grandezza % è chia­
mata energia totale di una particella in un campo conservativo. Certa­
mente questa grandezza rimane costante in ogni SRI ma cambia il
suo valore (invariabile) per un altro nel passaggio da un SRI ad un
altro. La definizione di quadrimpulso per una particella in un campo
conservativo come P = rnV è valida, ma la (5.48) va rimpiazzata
da P [myv, ~ (g — {/)], in quanto myc = ~ myc2 z=-(ò- - ~ ? come

si vede dalle (5.21) e (5.57), e dalla P 2 = — m2c2j al posto della


(5.51) si ottiene
% - s e ■■=c v p * + m*c* + U. (5.59)
La formula (5.59) è la funzione di Hamilton per una particella
in campo conservativo. Proprio come nel caso di una particella libera,
un impulso tridimensionale relativistico si può esprimere mediante
l ’energia, la velocità e l ’ energia potenziale:
1 „ %— U
p = myv - mc2yv - — — v.

La trasformazione della quarta componente del vettore energia-


impulso di una particella in un campo di potenziale mostra che, secon­
do la (5.42) (e facendo inoltre uso della (5.10)), l ’ energia totale
è uguale a %' = mc2y f + Uf nel riferimento K r, come ci si aspetta.

§ 5.6. Massa a riposo di un sistema.


Energia di legame
Finora abbiamo considerato la meccanica di una « particella », cioè
il comportamento di un’ unità singola. Comunque, l ’ « elementarietà »
(indivisibilità) di una particella non è richiesta nei ragionamenti
latti, perciò tutte le conclusioni si possono trasferire a sistemi più
complessi formati di « sottosistemi ».

148
La massa a riposo M di un sistema complesso si definisce, secondo
la formula generale (5.50), come

M zcz= —

dove E è ora l ’energia totale del sistema e P l ’ impulso totale.


Limitiamoci al sistema più semplice costituito di particelle in­
dividuali. Supponiamo dapprima che le particelle non interagiscano
tra loro. Quindi l ’energia ditale sistema sarà la somma delle energie
delle particelle che formano il sistema:
£ = (5.61)
L’ additività delle energie implica l ’ assenza di interazione. L ’ impulso
totale di un sistema si ottiene sempre dalla somma vettoriale degli
impulsi delle singole particelle, cioè è sempre additivo:
P = (5-62)
i-
?,P
i
In questo caso la massa a riposo del sistema si può scrivere
<2 « o 2
M 2c2-- ( 2 p <)- (5.63)

Per trovare la relazione fra la massa a riposo del sistema e le


masse a riposo delle particelle del sistema, si deve passare al sistema
di riferimento in cui il momento totale del sistema è uguale a zero:
P = 0. Perciò dalla (5.63) otteniamo

2 J %i
M = (5=64)

Si vede che la massa a riposo del sistema si esprime come somma delle
energie delle particelle costituenti (divisa per c%). Ma l ’ energia di
una singola particella si può rappresentare, secondo la (5.44), come
la somma dell’energia a riposo e dell’energia cinetica
%t = rrH(? + Tt. (5.65)
Quindi secondo la (5.63) otteniamo

^ = 2 ” *t + - k 2 (5-66)
i ì

La (5.66) conduce ad un risultato importante: la massa a riposo


di un sistema supera la somma delle masse a riposo delie particelle
costituenti una grandezza dell’energia cinetica totale delle particel­
le (divisa per e2) calcolata nel riferimento in cui l ’ impulso totale del
sistema è uguale a zero.
In questo modo giungiamo alla conclusione che in meccanica
relativistica la massa a riposo di un sistema composto di particelle

149
non interagenti non è una grandezza additiva. Una tale proprietà
della massa è impensabile in meccanica classica. Siamo tentati di
dare una nuova definizione di massa per le singole particelle di un
sistema in modo che la massa a riposo del sistema si ottenga come
somma di queste nuove masse, dette qualche volta « relativistiche ».
È facile vedere come si può fare. Nel sistema di riferimento in cui
P = 0 otteniamo dalla (5.64)
Me 2 = , 2 g f = 2 rn
^icK
(5.67)
ì i
Di conseguenza, si può scrivere
M = 2 = S (5.68)
dove mTil = è la massa relativistica. In questo modo abbiamo
ottenuto l ’ additività (che non è affatto obbligatoria), ma nello stesso
tempo andiamo incontro a diverse delusioni. Infatti, l ’ introduzione
della massa relativistica della particella crea l ’ illusione che rammen­
to dell’energia, o della « massa relativistica », della particella che
accompagna l ’ aumento di velocità (impulso), sia associato al cambia­
mento della struttura interna della particella. Ma sicuramente, ciò
non avviene affatto (per esserne sicuri, si può passare ad un altro
riferimento senza avvicinare la particella). Infatti, l ’ energia aumen­
ta con l ’ aumento della velocità grazie alle proprietà speciali dello
spazio-tempo quadridimensionale che derivano dalle trasformazioni
di Lorentz.
Secondo il punto di vista quadridimensionale il termine di « mas­
sa » si riferisce alla norma invariante del quadrivettore energia-
impulso. Introducendo la massa relativistica, applichiamo il termine
« massa » (a meno di un fattore) alla componente temporale del qua­
drivettore energia-impulso, che è, come sappiamo, l ’ energia. Comun­
que, l ’energia e la massa a riposo che intendiamo usare sono essen­
zialmente due concetti fisici differenti.
L ’energia è una grandezza relativa; essa dipende dal SRI in cui
sono considerati la particella o il sistema di particelle. La massa a ri­
poso rimane la stessa in tutti i SRI: è il valore assoluto di un quadri-
vettore. La componente temporale di un quadrivettore (energia)
coincide con il suo valore assoluto (massa a riposo) soltanto quando
sono uguali a zero le componenti spaziali del quadrivettore (il che
significa che sia l ’impulso della particella che l ’ impulso totale del
sistema di particelle è uguale a zero). E soltanto nel caso in cui
l ’energia coincide con l ’energia a riposo essa è proporzionale alla
massa a riposo (con il coefficiente costante c2).
Quindi, possiamo precisare il significato quadridimensionale
dell’ impulso, dell’energia e della massa a riposo di una particella
,(e di un sistema) se trattiamo le prime due grandezze come le com po­
nenti del quadrivettore energia-impulso, e l ’ ultima grandezza come
la norma dello stesso vettore. Gli aspetti metodologici del problema
sono discussi nel Supplemento IV.

150
Esaminiamo ora un sistema composto di particelle interagenti.
La formula (5.63) rimane, ovviamente, valida. La (5.61) deve però
essere rimpiazzata da
E= 2 g , + U, (5.69)
i
dove U indica l ’ energia d’ interazione delle particelle. Questa energia
si definisce come il lavoro richiesto per spezzare il sistema nelle
parti « iniziali » non interagenti. In un sistema stabile U <L 0 in
quanto uno stato di « equilibrio stabilie » è caratterizzato da un
minimo di energia. In un tale sistema la grandezza U è chiamata
energia di legame. Sebbene sia generalmente difficile scrivere l ’ espres­
sione analitica esplicita dell’energia di interazione (vedi § 5.8), si
può valutarne il valore. Dalla relazione (5.60) otteniamo, nel riferi­
mento in cui P = 0,

M — ’ t (5.70)
C2
o in un altro modo

(5.71)
i i
•dove si è fatto uso della relazione %t = m*c2 + T t che vale per
ugni singola particella.
Se si verifica la condizione 2] T t <C U, cioè se l ’ energia cinetica
i
relativistica totale è piccola, allora
M = J > f+ (5.72)
i
È evidente dalla (5.72) che in un sistema di particelle interagenti
la differenza
AM = ^ ì m i ~ M ì (5.73)
i
■chiamata di solito difetto di massa, è sempre diversa da zero. In un
sistema stabile U < 0 e AM > 0. Dal difetto di massa si può cal­
colare l ’ energia di legame:
U = A M -c\ (5.74)
Tale calcolo ha significato solo quando le energie di legame sono
sostanziali. È proprio il caso dei nuclei atomici. E ben noto che i nu­
clei atomici sono molto stabili e questa è l ’ evidenza della loro conside­
revole energia di legame. I nuclei atomici sono composti di protoni
e neutroni, inoltre, ciascun nucleo possiede un numero definito di
protoni e di neutroni. Le masse dei protoni e dei neutroni allo stato
libero (fuori dal nucleo) si possono determinare sperimentalmente.
Anche la massa di un nucleo atomico si può determinare sperimental­
mente. La differenza fra la massa risultante dei protoni e dei neutro-

ibi
ni liberi, che formano il nucleo, e la massa calcolata del nucleo for­
nisce il difetto di massa e, secondo la (5.74), l ’energia di legame.
Proprio in questo modo si determinano, in fisica atomica, le energie
di legame dei nuclei.
Scriviamo separatamente le espressioni per le particelle ultra-
relativisti che (v & c). In questo caso la (5.51Q dà
%- cp (5.75)
e quindi dalla (5.51) otteniamo m = 0, Comunque, per due (e più)
particelle otteniamo dalla (5.63)
M V M X P ir -C S iO V O (5.76)
i i
(in quanto = c^]Pi)- Questo mette in luce il fatto che la massa
i i
a riposo di un sistema composto di particelle con massa a riposo nul­
la non è uguale a zero. Non c ’ è niente di sorprendente in questo, in
quanto le masse a riposo non si sommano!
Infine, poche parole sui sottosistemi « composti ». Determinan­
do, secondo le (5.70) e (5.64), le masse a riposo di un sistema comples­
so, bisogna considerare l ’ energia totale del sistema. Assumiamo che
il sistema comprenda anche un campo elettromagnetico. Designando
con W l ’ energia del campo elettromagnetico otteniamo dalla (5.70)

M = + + (5-77)
i i
Da ciò si può dedurre che l ’energia di un campo elettromagnetico,
come ogni aìtra energia, contribuisce alla massa a riposo di un si-
stema.

§ 5.7* Alcuni problemi


di meccanica relativistica
di una particella
NelDambito di un dato sistema di riferimento inerziale non c ’ è
bisogno delle relazioni quadridimensionali: sono sufficienti l ’ equa­
zione tridimensionale (5.26) e la relazione (5.31). Ricordiamo che
l 'aspetto generale della seconda legge di Newton rimane inalterato
e solo l ’ impulso e l ’energia della particella sono definiti in modo
diverso. Questa nuova definizione, comunque, cambia in modo so­
stanziale le proprietà della soluzione del problema rispetto a quella
ottenuta per lo stesso problema dalle equazioni della meccanica
classica. In particolare, nessuna soluzione di un problema di mecca­
nica relativistica può fornire una velocità della particella superiore
a quella della luce. Altre caratteristiche le rendono diverse; per
metterle in luce, consideriamo alcuni problemi, che risolveremo con
le equazioni di moto della meccanica classica e con quelle relativi­
stiche.

152
Poiché le equazioni che otterremo non ci serviranno in seguitor
in ogni problema si adatta una numerazione individuale.
I.
in presenza di una forza costante. L'equazione del moto prende la
forma (l’ equazione classica è a sinistra e quella relativistica a destra)1

(mv) — (F
\a) j ^ ~ ( m y v )= F , (b) ( 1 )

dove F = costante. Integrando con le condizioni iniziali v = 0 per


f (1 A + + A - n iio r M A
. v/5 u t n u m u m u

mv = (F
t\a) | myv = F
t( y = —
l iA -S -J
La velocità in funzione del tempo si trova algebricamente dalle
(2 a, b):
Ft Ftjm V \ q

Vcl = ■ (a) ^rel *— ' (b)'


iA + t-s -r
(3)
Discuteremo questi risultati nel problema II in quanto, come vedre­
mo, il problema II è proprio una variante del problema I.
II. Moto rettilineo ed uniformemente accelerato di una particel­
la. Se una particella si muove lungo Passe x' (v'y = v'z = 0 ) ne!
riferimento K ' , allora v y = v z — 0 in ogni altro SRI secondo la
(3.26). Consideriamo il moto con accelerazione costante di una parti-
cella lungo Passe comune x, x . Se Paccelerazione della particella-
non varia, le componenti dell5accelerazione nel riferimento in cui la
particella è in quiete (riferimento proprio) sono (w0, 0, 0, 0). La gran­
dezza u>0 è la solita accelerazione tridimensionale diretta lungo Pas­
se x r. Il quadrato del quadrivettore accelerazione è un invariante,
perciò deve valere in tutti i sistemi di riferimento la seguente condi­
zione 1 per il moto uniformemente accelerato:

dove w0 è il valore dell’ accelerazione tridimensionale nel sistema di


riferimento proprio. Sicuramente, questa condizione è diversa dal
richiedere v = 0 2*. Le componenti della quadrivelocità per il moto
unidimensionale in ogni sistema di riferimento hanno la forma V (u± —
1 In questo capitolo faremo uso delio spazio-tempo quadridimensionale,,
la cui quarta dimensione è immaginaria.
2 Se w0 — costante, v è variabile. In meccanica classica un corpo acquista
un’accelerazione costante sotto l ’ azione di una forza costante, mentre in mec­
canica relativistica una forza costante impartisce un’accelerazione costante
solo in un sistema di riferimento comovente istantaneamente.

15&
-= yvXÌ 0, 0, icy) da cui, secondo la (5.23), segue che g 2 = 3 3 — 0,
D i conseguenza, in un SRI arbitrario rimangono le equazioni
du± diL±
m yF, m ^yF v.
dx dx
Denotiamo qui F x — F e vx — v. La condizione (1) prende la
•forma

—- = w\ = costante.
m2 Q
L ’ equazione del moto si scrive
dui
dx y woi ( 2)

'Nella notazione tridimensionale


A -j—C o (3)
dt

Risolvendo il problema I, ci siamo convinti, comunque, che si posso­


no ottenere subito queste equazioni, sostituendo la forza costante
F — mw0 nell’ equazione del moto relativistico. Ma w0 non è lo stesso
■di Vj come si vede dalla (2 ).
Se le condizioni iniziali sono tali che v è uguale a zero per t = 0,
-allora C = 0 ed esprimendo la velocità mediante w0, otteniamo dal­
la (3)

dove vcì indica wQt. Integrando l ’ ultima equazione con le condizioni


iniziali x = 0 , t = 0 , otteniamo l ’ espressione seguente:

+ <5>
La soluzione dell’ equazione del moto classico per una forza co­
stante e con identiche condizioni iniziali prende la forma
vcl = w0t, x = w0t2l 2 .
Se la velocità classica aumenta indefinitamente con il tempo,
-allora, in virtù della disuguaglianza
X
a<Za, se Gt
y 4a2-j-za

dalla (4) segue che la velocità relativistica rimane sempre minore


di c, come deve essere secondo il principio della velocità limite della
trasmissione dei segnali. Le equazioni relativistiche (4) e (5) per la

154
velocità v e la coordinata x si tramutano in quelle classiche per
v j c < 1. Se si riscrive la (4) come v = cf]/~i + c2iw\t2, è evidente
■che c quando t-> oo.
Troviamo la relazione fra la coordinata temporale t e il tempo
proprio r della particella. Se si sceglie l ’ origine comune dei tempi
ìq === Tq == 0, allora (vedi la (3.16))

w%t*fc2
dt —

c
= — Arcsh c (6)
^0 C2 ) ’

Trascurando nel radicando l ’ unità in confronto a w0t/c, ottenia­


mo, quando t-+- o o ,

Si vede che il tempo proprio di un corpo che si muove con accele­


razione uniforme scorre più lentamente del tempo in un sistema di
riferimento « fermo » rispetto al quale si considera il moto.
Rimane ovviamente il problema fisico di quale orologio dovreb­
be contare il tempo proprio della particella descritto dalla formu­
la (6 ), in quanto la relazione dx = (I/ 7 ) dt riguarda un orologio in
moto rettilineo ed uniforme. Abbiamo esaminato in dettaglio questo
problema nel § 3.3.
In conclusione notiamo che un moto relativistico rettilineo uni­
formemente accelerato è chiamalo anche iperbolico perché la dipen­
denza dal tempo dello spazio percorso (vedi la (7) nel seguito) in
termini geometrici rappresenta un’ iperbole. Se una particella carica
si muove in un campo elettrico uniforme e costante, oppure una parti-
cella pesante in un campo gravitazionale costante ed uniforme, il
moto è iperbolico. Scriviamo infine le equazioni principali che de­
scrivono il moto iperbolico:

wQt *_ dv _ wQ (7)
Y ì + (w0t l c ) * ~ ' Y l + (u>0t/c)a 8
D all’ espressione per la derivata temporale della velocità si può
vedere la differenza fra accelerazione « costante » relativistica
e non relativistica.
III.
ed uniforme. Consideriamo le condizioni iniziali seguenti: all’ istan­
te t = 0 le coordinate della particella carica sono x Q = y 0 = 0 ,
e la sua velocità u0 è perpendicolare al campo E. Ciò corrisponde al
problema di una particella che entra in volo in un condensatore piano

155
parallelamente alle sne facce (fig. 5.1). L ’ asse x è diretto lungo E
8 Tasse y lungo i?0. Quindi il moto della particella avviene nel piano

-y

ss*
Fig. 5J« Un elettrone che entra nel campo elettrico uniforme di un condensatore
si trova all’ origine delle coordinate all’ istante t = 0. La forza esercitata da,
parte del campo è diretta lungo l ’ asse x, la velocità iniziale dell’elettrone %
è diretta lungo l ’asse y. La soluzione classica del problema coincide con quella-
del problema sul moto di un punto materiale lanciato orizzontalmente con
velocità i?0 in un campo gravitazionale.

(#, y). Per quanto è possibile, non faremo distinzioni fra le equazioni-
di moto relativistiche e classiche, che scriveremo nella forma comune

^ = eE
dt eja'
dove F — eE è la forza agente da parte del campo elettrici sulla-
particella carica. In componenti,
px = eE , p y -=0.
Da cui l ’ impulso si trova per integrazione:
Px 6E t -j- p Ox, Py Poy
Ma secondo le condizioni iniziali sia nel caso classico che in quello
relativistico p x = 0 e p 0y — p 0 per t — 0. Di conseguenza, si può
scrivere
Px ~ eE t, p Qy — p Q«

Da questo punto terremo conto della differenza nelle definizioni


dell’ impulso:
classica relativistica
P = JllV, p — myv.
Abbiamo In questo caso
dx eEt dy , AX P2 = Px+
di vv = - i r =<4> L ’energia % della particella sarà
v
definita come
Integrando otteniamo
% = c ] f p 2+ m2c2 =
eE t* .
, Y m2ck+ pie2 + (ceEt)2 =
y = v0t + = V $ ì+ (c e E t)* .

156
Ma secondo le condizioni ini­ Usando la relazione (5.55)
ziali x 0 = yQ = 0 per t — 0 ot­ C2 f«
teniamo perciò ^reì ' iP» U j
eE t2 , v otteniamo
x= — ~ * (•)
rei __ dx _ __
La velocità della particella di E
i>2 = + y2
y= ( “ ) 2 i2 + y0
2 c2eEt

aumenta indefinitamente col Vx


tempo. La traiettoria della par­
ticella che si ottiene dalla (*)
eliminando il tempo t, è rap­
a(^ )s+(^)2- <2>
dove v*el si definisce secondo
presentata da una parabola
la (1'). Segue dalla (2') che,
eE
x= ( 2) come nel paragrafo precedente,
2mv%
vrel è sempre minore di c per­
ché
rei = d» = ^ ( 3')
dt Y%l + (ceEt)2
diminuisce col tempo. Integran­
do la (2'), otteniamo, riguardo
le condizioni iniziali,

Integrando la (3r) e tenendo con­


to delle condizioni iniziali, ot­
teniamo
ceEt
y = - f f - Arcs h
Eliminando t dalle espressioni
per x ed y, abbiamo
f Ey_
cpQ

Quindi, se la traiettoria classica era una parabola, quella relati­


vistica risulta una catenaria. Nel caso di y<C c, comunque, la catena­
ria si trasforma in una parabola. Infatti se n/c<C 1, si ha 1,
Po = mv0 ed g 0 = me2. Inoltre, per x piccoli si può assumere
eh :& & 1 + d 2/2!, da cui
r e 2E 2y2 _ me* (eE )2 y 2 _ eE 2
eE 2p\c2 eE 2m2v%c2 2mv% J 5
che è la parabola (2). Questo esempio, come quelli seguenti, mostra
che i problemi di meccanica relativistica non richiedono alcuna
dipendenza della massa dalla velocità: la soluzione si ottiene inte­
grando Tequazione del moto.

157
IV.
ed uniforme. Le equazioni del moto classica e relativistica per la
particella carica in un campo magnetico

(i>

sono le stesse non solo in apparenza. Il fatto è che il campo magne­


tico non fa lavoro sulla particella carica e l ’energia della particella
rimane costante (vedi le (5.20) e (5.31)); ovviamente, le espressioni
per l ’energia nei casi classico e relativistico sono differenti. Usando
la relazione relativistica

/> =
dove % = costante, l ’equazione^ ( 1 ) si può riscrivere nella forma
dv ec2 r D
( 2>
-3T = ~ T
mentre dalla definizione classica d ’ impulso p — mv segue che

dt m
(3)
Perciò, le equazioni del moto relativistica (2) e classica (3) si distin­
guono solo per la costante davanti al prodotto vettoriale. Ricordiamo
come si risolvono le equazioni (2 ) o (3). Orientiamo l ’ asse z lungo il
campo magnetico. Allora B — B k. Per i fattori costanti, che appaio­
no davanti al prodotto fvk) nelle equazioni (2) e (3), introduciamo
le notazioni seguenti:
eB ec2B eB ì ? ------ ;r=r //N
© cl = — © rei = — =* ; — = y [© c l = (Dei y 1 — p 2. (4 >

Ora per precisione risolviamo la (2). Sviluppando il prodotto-


vettoriale [vk], riscriviamo l ’equazione (2 ) nelle componenti

VX=-(ÙVy, Vy= — (ÙVXÌ Vz — 0. (5)


È conveniente ricorrere alle variabili complesse nel piano (vxv
vy). Moltiplicando la seconda relazione della (5) per il numero i e som-
d
mando il risultato alla prima, otteniamo — (yx + ivy) = —io (vx-\-
+ ÌVy)-
Questa equazione si può facilmente integrare:r
Vx+iVy^ae-*® *,
dove a è una costante complessa. Scrivendola nella forma a =-
= VQte-^a con vot ed a reali, la soluzione prende la seguente formar
vx + ivy = v0te - i^ t+a). (6>
Ovviamente, vot è il modulo del numero complesso del primo mem­
bro della (6):
2 2 2
— VX + Vy.

158
Di conseguenza, il valore della velocità della particella rimane
costante nei piano (x, y). L ’ espressione (6 ) si può riscrivere nella
forma

-Ji
che permette l ’ integrazione diretta:
X + iy = 3L. e-i(CDi+a-n/2)B (7),
Ricordando la rappresentazione geometrica del numero complesso
scritto nella forma w = x + iy = re*<P, vediamo che la particella
rimane sempre su una circonferenza di raggio costante r = i?0t/co,.
mentre l ’ angolo tra il suo raggio vettore e l ’ asse # aumenta regolar­
mente col tempo: cp = co£ - f costante. Ciò significa che la proiezio­
ne del moto della particella sul piano (a:, y) è un moto uniforme lunger
la circonferenza di raggio
r vot vot& Pt /OV,
co ec * B — eB ’ W

dove p t è la proiezione dell’ impulso sul piano (x, y) ed co è la velocità,


angolare. Per il m to sull’ asse z, segue dalla terza relazione (5) che
z = z0 z/02£o (9)
Dalle equazioni (8 ) e (9) segue che una particella carica in un campo
magnetico uniforme si muove lungo un’elica il cui asse coincide
con la direzione del campo magnetico, e il raggio si determina dal­
la (8 ). La velocità della particella è costante, come deve essere in un
campo magnetico. Se all’ istante iniziale la velocità della particella
nella direzione del campo magnetico è uguale a zero (v0z = Q), la
particella si muove lungo una circonferenza nel piano perpendicolare-
al campo.
La grandezza ©rel definisce la frequenza ciclica di rotazione
della proiezione della particella sul piano (x, y) perpendicolare alla
direzione del campo magnetico. Questa frequenza è detta ciclotronica.
Come abbiamo visto, cocl = vcorel, cioè la frequenza ciclotronica
delle particelle relativistiche è minore di quella non relativistica.
A velocità piccole 7 —>- 1 e cocl—>- corel.
In conclusione consideriamo l ’ accelerazione guadagnata da^una
particella in un campo elettromagnetico, sia nel caso classico che
in quello relativistico. D all’ equazione generale del[moto
- i f = * { £ + [„£ ] >
otteniamo nel caso classico (p — mv)
Pel = -^ -{E + [v
Per ottenere l ’ accelerazione nel caso relativistico dobbiamo usare
l ’ equazione (5.55) da cui
d p _ v d% <f dv
~dT~~~c^ ~dF ' e2 dt »
ma secondo la (5.31) d%ldt = Fv = eEn, e secondo la (5.32) g /c2 =
= 7717, perciò (cfr. con [ ’ equazione (5.38))

^rel
1 s
: Y ^ c i- myc*
■ v ( E v ) = ^ . v cX— - ^- v{ Ev) .

Il secondo termine nell’ ultimo passaggio si può intendere come la


nascita di un attrito (proporzionale alla velocità); grazie a ciò,
si può capire in termini qualitativi elle l ,accelexiazione di una parti-
cella diminuisce bruscamente quando la particella si avvicina alla
velocità della luce. E ovvio che i?ci = vTeì a meno del fattore j32. Il
moto di una particella carica in un campo elettromagnetico costante
è presentato in dettaglio in [9], § 22; dobbiamo puntualizzare che
nel caso di campi incrociati (mutuamente perpendicolari) per cui
E2 — =7«é= 0 (cfr. § 6.5) il passaggio da un determinato riferimento
inerziale può eliminare uno dei campi e lasciare un campo elettrico
od uno magnetico. In questo sistema di riferimento si possono utiliz­
zare I risultati ottenuti in questo caso.
V.
precedenti, esamineremo simultaneamente i casi classico e relativi­
stico. Per esempio consideriamo il moto di un razzo che può essere
trattato (insieme con i suoi gas di scarico) come un sistema chiuso.
Ricordiamo che la propulsione del razzo è dovuta al fatto che in ogni
intervallo di tempo esso espelle una certa quantità di sostanza ad una
velocità definita rispetto al razzo. Secondo la legge di conservazione
delPimpulso il razzo, insieme con il carburante rimasto, acquista un
impulso in direzione opposta a quella di espulsione dei gas. Sia nel
caso relativistico che in quello classico il problema è di facile solu­
zione nel sistema di riferimento inerziale comovente col razzo.
Poiché la velocità del razzo cambia, operiamo con un riferimento
istantaneamente comovente.

Sia M (t) la massa del razzo Nel caso relativistico si deve


all’ istante t (carburante e con­ considerare non P incremento di
tenitore) e V (t) la sua velocità; velocità, bensì Pincremento del
nel tempo dt il motore del razzo parametro di velocità, in quanto
■espelle una massa dM di gas i parametri di velocità si som­
a velocità costante rispetto al mano (sono additivi) mentre le
razzo v. Scriviamo la legge di velocità no (vedi la (3.37)).
conservazione delPimpulso nel ri­ Scriviamo la relazione fra la
ferimento comovente (caso uni­ velocità e il parametro di velo­
dimensionale): cità # (vedi le (2.27), (2.28)):
(M — dM) dV — v d M - 0 (1) th # = (5, eh fr = 7 ,

fon dM > 0 . Trascurando gli in­ sh = 7 (5, (5)


cili lies imi del secondo ordine se esaminiamo la velocità dei

160
{dM dV), otteniamo gas espulsi, e
dM _ dV th 0 = B, eh 0 — L, sh 0 = TB, (6)
M ~ v * ^
L ’equazione (2) si integra facil­ se consideriamo la velocità del
mente (u = costante) razzo. Ovviamente-,
% — me2 eh d, p = m sh d. (7)
Supponiamo che durante l ’ inter­
dove C è una costante d’ integra­ vallo dt venga espulsa la massa
zione. Scegliendo le condizioni dM a velocità 8 = vie. La velo­
iniziali t = 0, V = 0 e IVI (0) = cità del razzo dopo l ’ espulsione
= M 0, otteniamo finalmente della massa dM aumenta di =
= dV/c. Esprimiamo l ’ incremen­
V= v ì n - & . . (3) to dB mediante l ’ incremento del
La formula (3) determina la ve­ parametro eli velocità (vedi la
locità V (t) del razzo in funzio­ ( 6 ))

ne della velocità dei gas espulsi dB = th (d0). (8 )


e del cambiamento della massa Ora scriviamo le leggi di conser­
del razzo (la massa elei carbu­ vazione dell’ impulso e dell’ ener­
rante bruciato è uguale a M 0 — gia. In un sistema di riferimento
— M ). comovente l ’ impulso del razzo
C’è, comunque, una caratte­ « prima dell’espulsione » è uguale
ristica degna di nota in questa a zero (B = 0). Dopo l ’espulsio­
derivazione. In ogni istante il ne della massa dM il razzo acqui­
razzo ha diversi riferimenti co- sta l ’ impulso (M + dM) sh (d0),
moventi inerziali. L ’incremento mentre l ’ impulso della massa
di velocità nell’ uguaglianza (2 ) dM diretto in direzione opposta
durante l ’ intervallo dt è scritto è uguale a dM sh (d). Quindi,
per sistemi di riferimento iner­
ziali differenti. Nel passaggio —dM sh (d) +
da un sistema di riferimento ad + (M + dM) sh (d0)=O. (9)
un altro tutte le velocità (e gli
incrementi di velocità) si som­ La meccanica relativistica per­
mano in meccanica classica. Per­ mette di tener conto di ogni tra­
ciò, non è importante che la (2 ) sformazione di energia, perciò
si riferisca a SRI diversi; la possiamo scrivere la legge di
velocità finale si può ottenere conservazione dell’energia come
sommando (con integrazione) dMc2 eh (d) + (M + dM) X
gli incrementi di velocità su X c2 eh (dQ) = Mc\ (10)
tutto l ’ intervallo di tempo in
cui la velocità del razzo varia Ma possiamo considerare dQ come
da 0 a V : una grandezza piccola in modo
M V che sh (d0) ~ dQ, eh (dQ) ~ 1,
1 4 M - = - ± \ d (4) di conseguenza, trascurando gli
J M V J v } infinitesimi del secondo ordine
Mq o
È proprio in questo modo che è dM dQ, otteniamo dalla (9)
stata derivata la formula (3). dM sh (d) = M dQ, (11)

161
Quindi è chiaro quanto sia im­ e dalla ( 10 )
portante, in questa derivazione, eh d = —1 . ( 12 )
l ’ additività delle velocità nel
passaggio da un SRI ad un altro. Dividendo termine a termine la
Nel calcolo non si è usata ( 1 1 ) per la ( 12 ), otteniamo
la legge di conservazione del­
l ’energia meccanica perché, da
un lato, è insufficiente (è im­ o
portante in questo caso anche d 0 = - p ^ , (13)
l ’energia termica), e dall’ altro,
non è necessaria quando viene dove M = M (t) è la massa del
calcolata la velocità del razzo. razzo e del combustibile al Ristan­
te t. Poiché in meccanica rela­
tivistica il parametro di veloci­
tà è un valore additivo, il valo­
re finale del parametro di velo­
cità si può trovare per integra­
zione:

6 = |3in ,(14)
dove M q è la massa del razzo
quando la sua velocità è uguale
a zero.
La formula (14) determina
implicitamente la velocità, del
razzo nel momento in cui la
massa del carburante bruciato
è uguale a M 0 — M*

È facile vedere come, se il razzo si muove a velocità non relati­


vistica, la (14) si trasforma nella (3). Infatti, in questo caso B<C 1 e,
di conseguenza, th 0 = B <C 1, da cui th 0 ~ 0 e la (14) coincide con
la (3). Come per tutte le; soluzioni della meccanica relativistica, la
velocità del razzo V non può superare quella della luce c. Anche se
pensiamo di bruciare tutta la massa del razzo (insieme al carburante),
cioè M ^ M q, allora ( M 0/M) oo. Dalla (14) segue soltanto che
0 oo (essendo uguale a 1 il massimo valore eli (3). Ma B — th 0 e per
0 >■ oo th 0 — 1, cioè V -> c.
Sicuramente, per quanto maggiore è la velocità di eiezione, tanto
più efficace è la resa del razzo. Può essere uguale a c la velocità di
eiezione del razzo, cioè (3 = 1? Si può avere questo utilizzando la
luce come gas di reazione: soltanto i fotoni e i neutrini si muovono
alla velocità della luce c. Queste due particelle sono peculiari in quan­
to la loro massa a riposo è uguale a zero (§ 7.6). Che la massa sia
nulla, si vede direttamente dalla (10). Per v c il parametro di
velocità soddisfa la condizione th d = (3 — l . Ma per th # — 1 il

162
eh $ -> oo, e per soddisfare l ’ uguaglianza (10 ) per valori finiti di M ,
è necessario che dM = 0.
Un’analisi più dettagliata delle possibilità di un razzo a fotoni
mostra la sua inapplicabilità per i viaggi spaziali a lungo raggio
(vedi [1 1 ]).
VI.
zialmente da quant’ è l ’ energia che si può osservare nell’ interazione
tra le particelle. Finora ci sono due sorgenti di particelle ad alta
energia: i raggi cosmici e gli acceleratori. I progetti di acceleratori
sono ancora molto lontani dal superare le energie possedute dalle
particelle dei raggi cosmici, mentre la ricerca sistematica della fisica
delle alte energie si è ristretta alla fisica di energia coperta dagli
acceleratori. Gli acceleratori sono macchine complesse e costose la
cui costruzione richiede diversi anni e il cui costo raggiunge una
porzione apprezzabile del bilancio nazionale di ogni paese industria-
lizzato.
Supponiamo che nel sistema del laboratorio le particelle siano
accelerate all’ energia g. Facciamo collidere queste particelle con
altre della stessa specie (per esempio, esaminiamo le collisioni proto­
ne-protone). Il fascio di protoni, che possiede nel sistema di riferi­
mento del laboratorio un’energia g, viene diretto contro un bersa­
glio che contiene idrogeno, in cui i protoni sono praticamente fermi.
È sufficiente considerare la collisione di un protone proiettile e di
un protone bersaglio. Quindi l ’ energia del sistema costituito dalle
due particelle è uguale ad g + m (assumiamo in questo paragrafo
c “ 1). Si pone la seguente questione: è possibile aumentare l ’ energia
di interazione, prendendo due fasci, ciascuno costituito di particelle
di energia § (nel riferimento del laboratorio), e dirigendo questi
fasci uno contro l ’ altro? Di quanto aumenterà l ’energia « utile » dì
interazione? Per il gusto della diversità, tratteremo questo problema
in quelle inusuali unità temporali che sono i metri luce (vedi capi­
tolo II).
Per semplificare il problema, non parleremo più di fasci, ma
considereremo soltanto due particelle. La massima energia utile
(spesa per generare una nuova particella, reazioni nucleari, riscal­
damento di una sostanza ecc.) può essere calcolata nel riferimento del
centro di inerzia, perciò è in questo sistema che si calcola l ’energia
interna del sistema (naturalmente dal nostro punto di vista è « inu­
tile » il moto globale del sistema). Consideriamo due particelle 1 e, 2
che possiedono uguale energia (velocità) nel riferimento K del labora­
torio, e che si muovono una contro l ’ altra. Questo riferimento sarà
per loro il riferimento del centro d ’inerzia, e l ’ energia totale delle
particelle in questo riferimento fornisce l ’ energia utile richiesta.
Questa energia totale è uguale a 2T + 2m, dove T è l ’ energia cine­
tica di ciascuna particella, e 2ni l ’energia a riposo delle particelle
(nelle unità adottate c = 1 ). Troviamo come apparirà la stessa colli­
sione nel riferimento K ’ in cui la particella 1 è a riposo. È proprio il
caso di una particella che collide contro un bersaglio. Considereremo

163
che l ’energia della particella 2 sia calcolata nel riferimento in cui la
particella 1 è a riposo. Rifacciamo il calcolo appropriato secondo la
(5.43), (Non dimentichiamo che si sta considerando la stessa collisio­
ne in un altro sistema di riferimento.) Indichiamo l ’ impulso e l ’ ener­
gia delle particelle 1 e 2 nel riferimento K con (p, £) e ( —p , fe).
K, K>i
1
%
1 a 1 1n1
\J°1\=\/J2\

oF 0
Fig. 5.2. Due particelle si muovono nel riferimento del laboratorio con velocità
uguali dirette in senso opposto. La particella 1 è in quiete nel riferimento K '.

Nel riferimento K' Rimpulso e l ’ energia della particella 1 sono ugua­


li a p[ — 0, g j — m. La fig. 5,2 illustra i riferimenti K e K' e le
velocità delle particelle nel riferimento K. TI riferimento K* è il
riferimento proprio della particella 1, e secondo la (5.49)
%i ==Y%\ = Ym = ym (1 )
(nel nostro caso Y — y in quanto E' è associato alla particella 1)«
Segue immediatamente dalla ( 1 ) che
T+m T
y9 = ■——
m
= —m
L— «- —
m
e

Consideriamo le velocità relativistiche delle particelle quando


1 ; di conseguenza,
p - m ~
Nel nostro caso p •= B ~ i, da cui la grandezza FB che entra nel­
la trasformazione dell’ energia è circa uguale a F. Ora N facile ottel
nere la formula di trasformazione dell’energia della particella 2 ne-
passaggio dal riferimento K a K':
g ; = r ( g 2 - B p2) = F (g + Bp) « r g + Yp « 2 Fg.

2 g è l ’energia che si realizza nella collisione centrale ed equivale


al doppio dell’ energia a riposo delle particelle (che può essere tra­
scurata a velocità relativistiche). Per realizzare questa energia con
la particella 1 ferma, c ’ è bisogno di una energia di F volte maggiore.
Da ciò si dimostra il vantaggio nell’ uso dei fasci opposti.
Lo stesso risultato, comunque, si può ottenere con metodi sem­
plici. Dimostreremo che un nuovo calcolo dell’energìa secondo la
(5.43) è equivalente al calcolo dell’ energia dato dalla formula g = my
sostituendovi l ’ espressione relativistica della velocità relativa delle
particelle 1 e 2.

164
Quindi, sia p 2 — p x = —my$ rim pulso della particella 2 nel
riferimento K e l ’ energia sia g 3 = my. Calcoleremo l ’energia della
particella 2 nel riferimento K' in cui la particella 1 è a riposo.
Secondo la (5.43)
■ g ' = T (g — Bp2) = ' r (wiy + B ttivP) = Tmy (1 + pB),
perché nel nostro caso y — F (nel riferimento K entrambe le parti-
celle hanno la stessa velocità). Comunque, dalla formula (5.10)
segue che (non dimentichiamo che abbiamo p <C 0, vedi fig. 5.2)
Vvs (\
\-
u- T\a\ ==
< — ri

perciò
K =
dove y' è determinato per la velocità della particella 2 nel riferi­
mento K' (cioè la velocità della particella 2 rispetto a quella 1).
Calcoliamo la velocità relativa delle particelle 1 e 2. Abbiamo
—- B
= = 'xB
Nel riferimento K la particella 2 ha la velocità —j{3 e la particella
1 la velocità j3, di conseguenza
ft' — _ ..
i + p2 *
Questa è proprio la velocità relativa della particella 2. Troviamo
ora y
1 _ 1_________„ H-P 1 _
i-p 2
1+ P*
— 72 (1 + P2).
Di conseguenza,
gg = myf = 7717-7 (1 + P2) « 2 Fg,
per p ~ 1 e 7 = T. Come deve essere ritroviamo ancora gli stessi
risultati.

§ 5.8. Leggi di conservazione delia


meccanica relativistica
Finora abbiamo discusso le leggi di conservazione dell’ energia e
dell’ impulso per un punto materiale, ed ora dobbiamo trattare le
leggi di conservazione per un sistema di n punti materiali. Il pro­
blema delle leggi di conservazione ha due aspetti. Il primo coinvolge
Tacquisizione delle leggi di conservazione in termini di un dato
SRI. Il secondo aspetto riguarda l ’ esame del comportamento di gran­
dezze che rimangono costanti nei passaggio da un riferimento iner­
ziale ad un altro. Entrambi questi problemi si risolvono banal­
mente nel caso di sistemi di particelle non interagenti; per le parti-
celle interagenti essi diventano molto complicati.

165
Incominciamo con un sistema di n particelle non interagenti.
Le equazioni del moto e i cambiamenti di energia che competono
alla &-esima particella hanno la forma (vedi le (5.27) e (5.31))
(5.78)

(5.79)

dove F&ì denota una forza che agisce stilla &-esima particella (non
si effettua la somma su k\).
Se si considera una particella che non interagisce con le altre,
F = 0 e dalle (5.78) e (5.79) seguono direttamente la legge di con­
servazione dell’ impulso p(k) — m ^ y ^ v ^ = costante e quella di con­
servazione dell’ energia gd1) = m ^ y ^ c 2 = costante. Infatti, que­
sto caso si manifesta nella relazione seguente per una particella sin­
gola: P 2 = p 2 — g 2 le2 — costante. Nel caso di una particella
individuale che rappresenta un sistema chiuso, P 2 rimane costante
perché p ed g le lo sono individualmente. Notiamo ancora una volta
che p ed ì%!e di una singola particella si combinano per formare un
quadrivettore.
Quando trattiamo con sistemi di n particelle materiali non inte­
ragenti, l ’ impulso totale 2 P ^ e l ’ energia totale del sistema 2
rimangono ovviamente costanti perché lo è individualmente ciascun
addendo.
Le leggi di trasformazione per l ’ impulso, totale e per l ’ energia
totale

P= g = 2 g (k) (5.80)

nel caso del passaggio da un SRI ad un altro sono evidenti: una som­
ma di componenti di un vettore si trasforma come la componente di
un vettore. 1 :
Il problema delle leggi di trasformazione in un sistema di n
particelle interagenti è molto più complicato. Nella meccanica clas­
sica convenzionale l ’ interazione delle particelle nel caso di forze con­
servative si può descrivere per mezzo di un sistema di funzioni
potenziali U = (rP), i<2\ . . ., r(*>), dove rP) (t) determinala
posizione della k-esima particella all’ istante £, considerando la
posizione di tutte le n particelle allo stesso istante. Nell’ analisi
finale si può scegliere un singolo istante di tempo in quanto in mec­
canica classica la velocità di propagazione delle interazioni viene
supposta infinita.
Poiché tale velocità è finita in meccanica relativistica, il calcolo
della forza ad un dato punto richiede che siano note le posizioni delle
particelle agli istanti precedenti. Quindi, è chiaro che la forma della
funzione U è piuttosto complicata nel caso relativistico.

166
Se si scrive l’ espressione per l ’ energia del sistema eli n corpi nella
forma
(5.81)
e per l ’ impulso totale

(5.82)
è possibile la seguente asserzione. Le grandezze P ed i%!c non for­
mano un quaclrivettore in contrasto con quanto abbiamo nel caso
di una particella singola. Inoltre, queste grandezze non sono co­
stanti. L ’equazione g = costante non è valida perché in meccanica
classica l ’energia totale del sistema, inclusa l ’energia potenziale*
rimane costante. La (5.81) non contiene l ’ energia potenziale, e non
c ’ è un modo semplice eli tenerne conto in modo rigoroso. La velocità
finita di propagazione delle interazioni fa variare nel tempo la (5.82).
N ell’ analisi finale questa circostanza chiarisce il fatto paradossale
che le grandezze g eP , che rappresentano la somma delle Componenti
di quadrivettori, non sono essi stessi componenti del quadrivettore.
Infatti, in ogni sistema di riferimento, dove, vengono effettuate le
somme (5.81), e (5.82), gli addendi sono presi simultaneamente nel
senso di simultaneità di un dato sistema di riferimento. Quando pasr
siamo ad un altro riferimento inerziale, si possono cercare i valori
degli impulsi e delle energie delle singole particelle e si possono som­
mare secondo le regole di trasformazione dei quadrivettori. In un
nuovo riferimento, comunque, gli evènti ricalcolati non saranno
simultanei. Per trovare g e P nel nuovo riferimento, bisogna ridurre
queste somme alla simultaneità nel nuovo sistema di riferimento.
É questo nuovo calcolo simultaneo che priva le grandezze P e g delle
proprietà delle componenti del quadrivettore.'
I
moto: l ’ integrale dell’energia, dell’ impulso, del moto del centro
d ’ inerzia, dei momento dell’ impulso ecc. L ’ aspetto approssimato di
questi integrali viene presentato nel libro [16], § 27, per esempio.
Per quanto riguarda il comportamento degli integrali del moto
nel passaggio da un riferimento inerziale all’ altro, l ’energia ed il
momento formano un quadrivettore, e gli integrali del moto del
centro d ’ inerzia ed il momento dell’ impulso formano un quadrivetto­
re antisimmetrico, nell’ approssimazione ((3Co = v^/c <C 1 ), dove
si consideravano i termini (|3(ft))2. Quindi, è chiaro che se tutti questi
integrali rimangono costanti in un sistema di riferimento, rimarran­
no costanti in ogni altro sistema di riferimento.
C’ è un caso in cui le leggi di conservazione dell’ impulso e del­
l ’ energia si possono mettere in forma semplice

y, m C y k ) = 2 m(k)y'(h)v'(*>, (5.83)

yj mih)c2y ^ = Tj m ^ c 2y,^hK (5.84)


Queste equazioni sono valide solo nel caso di particelle veloci
che interagiscono debolmente (o brevemente). Le formule (5.83) e
(5.84) non sono valide durante un’ interazione, ma sono utilizzabili
prima e dopo. In particolare, si possono applicare ad un gas ideale
relativistico ed anche alle « collisioni di microparticelle ».
C’ è un esempio che mostra come le leggi di conservazione in forma
relativistica siano applicabili allo studio delle « collisioni di par­
ticelle ». Supponiamo che una particella di massa m0 colpisca una
particella ferma di massa m1 e la massa totale delle particelle gene­
rate come risultato della « collisione » (« reazione ») è uguale a M-
Le reazioni tra le particelle non sono governate soltanto dalle leggi
di conservazione dell’ impulso e dell’energia, ma anche da altre spe­
cifiche leggi di conservazione. Non le considereremo in questo caso.
Assumeremo semplicemente (per esempio, usando dati sperimentali)
che la reazione può avvenire. La conservazione dell’ impulso e del­
l ’ energia ci permette di chiarire la questione fondamentale: qual è
l ’energia minima della particella proiettile sufficiente per la realiz­
zazione della reazione cui siamo interessati?
« Prima » e « dopo » la reazione valgono le leggi di conservazione
dell’energia e dell’ impulso. In termini quadridimensionali questo
significa che il quadrivettore energia-impulso di un sistema di par­
ticelle rimane costante. Consideriamo la situazione « prima » della
collisione nel sistema di riferimento dei laboratorio. Prima della
collisione le particelle non interagiscono, perciò l ’ energia del sistema
delle particelle è uguale a I 0 + m±c2 e l ’ impulso a p 0, dove g 0 è
l ’energia totale della particella incidente e p Qil suo impulso.
È conveniente considerare la situazione dopo la collisione nel
riferimento del centro d ’ inerzia. In accordo con la legge di conserva­
zione dell’ impulso, questo sistema di riferimento è dotato di moto
rettilineo ed uniforme rispetto a quello del laboratorio e perciò è
anche inerziale (se lo è quello del laboratorio). TI minimo di energia
richiesta per la realizzazione della reazione si ha nel caso in cui tutte
le particelle generate dopo la reazione sono ferme nel riferimento del
centro d ’ inerzia (altrimenti la loro energia sarebbe maggiore). Di
conseguenza (se si cerca il minimo dell’energia), l ’ energia di un si­
stema di particelle che si genera dopo la collisione è uguale a Me2,
e l ’ impulso è uguale a zero (nel riferimento del centro d’ inerzia).
Nel passaggio da un SRI ad un altro il quadrato del quadrivettore
energia-impulso è un invariante.
Scriviamo i quadrivettori energia-impulso di un sistema di par­
ticelle prima e dopo la collisione: P° (p0, %dc + P (0, Me).
Ma i valori assoluti di questi vettori sono uguali a P — P 2 ovvero
M 2c2 = (£ 0/c + m±c)2 — pl> Facendo uso delle relazioni %\!c2 —
~ p \ = mie2, Io = T q + m0c2, otteniamo
M 2c2 = m\c2 + m\c2+ 2mi {T%+ m®e2).

168
Quindi, si deduce immediatamente il valore minimo (« di soglia »)>
dell’energia cinetica delia particella proiettile:

Zrrij (M — mQ— m±) (M - l ì) »

Questa formula si può usare per lo studio di molte reazioni.


Facciamo tre esempi.
Produzione di un mesone n dalla collisione di due nucleoni::
N + N N + N + n. Fotoproduzione di un mesone n da un nu­
cleone: N + 7 N + Ji. Produzione di coppia protone-antiprotone
(p + p ), bombardando un bersaglio contenente protoni (idrogeno)^
p + p - ^ p + p + (p -I- p)-
L ’ interpretazione di queste reazioni deve basarsi sul fatto che,,
comunque, si deve conservare l ’energia. Di conseguenza, Fenergia
cinetica delle particelle iniziali si trasforma (parzialmente) in energia?
a riposo delle particelle prodotte. Parlare di « produzione » di massa*
da energia cinetica è perciò poco accurato.

■169i
VI. TEORIA DI MAXWELL IN FORMA
HE LATI VI STICA

La teoria della relatività mostra come considerare i fenomeni'fisici


in ogni sistema di riferimento inerziale. La TRR si basa sulla com­
pleta equivalenza di tutti i riferimenti inerziali. Perciò, le equazioni
fondamentali cbe descrivono i fenomeni naturali devono essere iden­
tiche in tutti i sistemi di riferimento inerziali; ovviamente, in cia-
:scun riferimento sono scritte nelle variabili opportune, cioè usando
le lunghezze e le scale dei tempi di un dato riferimento.
Il sistema fondamentale delle equazioni che descrivono i fenomeni
elettromagnetici si deve a Maxwell. E degno di nota che il sistema di
equazioni di Maxwell formulato cinquanta anni prima della scoperta
della teoria della relatività ristretta, risulta covariante rispetto alle
trasformazioni di Lorentz, cioè mantiene la sua forma, a meno delle
notazioni di variabili, quando è sottoposto alle trasformazioni di
Lorentz. Ciò significa che il sistema delle equazioni di Maxwell man­
tiene la sua forma in ogni sistema di riferimento inerziale, ed il prin­
cipio di relatività è automaticamente soddisfatto.
Perciò, le equazioni dell’ elettrodinamica non richiedono modi­
fiche in termini della TRR, e può sembrare che la teoria della rela­
tività non ci introduca niente d ’ importante. Le cose stanno però
■diversamente.
Prima di tutto, prima della scoperta della teoria della relatività
non era chiaro in quale riferimento fossero valide le equazioni di
Maxwell. La teoria della relatività ha indicato subito che il sistema
-di equazioni è valido in ogni sistema di riferimento. Quindi, era
naturale riscrivere il sistema delle equazioni di Maxwell in forma
quadridimensionale. Una tale scrittura permette di trovare le equa­
zioni di trasformazione per le grandezze fondamentali della teoria nel
passaggio da un SRI ad un altro. Usando una notazione quadridi­
mensionale, possiamo trovare anche l ’ unità indivisibile di carica e
corrente, di momento elettrico e magnetico, di campo elettrico e
magnetico. Inoltre si scoprono le relazioni tra altre grandezze fisiche.
Tale stretto legame fra grandezze fisiche definite rimase nascosto fino
all’emergere dell’ approccio relativistico ai fenomeni elettromagne­
tici.
Soltanto nell’ ambito della teoria della relatività si può deter­
minare sistematicamente la trasformazione delle componenti del

170
campo elettrico e magnetico nel passaggio da un riferimento iner­
ziale ad un altro. Solo la teoria della relatività indica che bisogna
usare un tensore quadridimensionale antisimmetrico per descrivere
il campo elettromagnetico.

§ 6.1. Sistema di equazioni di


Maxwell tridimensionale,
quadripotenziale e quadricorrente 1*
La teoria di Maxwell è una teoria macroscopica del campo elettro-
magnetico. Secondo questa teoria un campo elettromagnetico in un
mezzo arbitrario è descritto da quattro vettori: l ’ intensità del campo
elettrico E 1l ’ intensità del campo magnetico H , l ’ induzione del campo
elettrico D e V induzione del campo magnetico B.
In un mezzo uniforme ed isotropo il numero dei vettori di campo
necessari per descrivere i fenomeni elettromagnetici si riduce a due,
in quanto i vettori di campo diventano proporzionali fra loro:
D = eE, B = \\H. ( 6 . 1)

I coefficienti costanti e e p sono chiamati, rispettivamente, costante


dielettrica e permeabilità magnetica. Il vuoto è descritto come un
mezzo uniforme ed isotropo con valori definiti di e e jli che si deno­
tano solitamente con £0 e p 0 e si chiamano, rispettivamente, costante
elettrica e magnetica.
Secondo la teoria di Maxwell i vettori campo: seguono due equa­
zioni principali:
rot /7 = / + Ì>, rot H = / - f e È ,

. (a) (b ) ( 6 . 2)
rot P = — B ; rot E = — \iH ;
nella sinistra sono scritte le equazioni per un mezzo arbitrario, sulla
destra quelle per un mezzo uniforme ed isotropo.
Nella teoria di Maxwell i valori medi deh campo elettrico e ma­
gnetico (rispetto ai campi « reali » microscopici) sono definiti dai vet­
tori E e B. Nel caso generale i vettori D ed H sono correlati ai campi
medi delle equazioni seguenti:
D = s0E ^ P, B = po (H + M), (6.3)
dove vengono introdotti due nuovi vettori: il vettore polarizzazione
P e il vettore magnetizzazione 31.
Nella teoria di Maxwell si assume valida la legge di conservazione
della carica; nel caso di distribuzione continua di carica la legge si
scrive come equazione di continuità
-|j- + div 7 = 0 . (6.4)

1 Tutte le equazioni dell’elettrodinamica di questo capitolo sono scritte


nelle unità SI. Per utilità del lettore le formule principali sono scritte anche nel
sistema di unità di Gauss nell5Appendice IL

171
Qui p è la densità di carica e ; = pv è la densità di corrente.
Dalle equazioni (6,2) e (6.4) seguono due equazioni che si possono
facilmente incorporare nelle (6.2) e (6.4):
div B = p. div E = p/s,
(6.5>
div tì — 0; ^ d i v /f = 0 . (b)
Quale densità della forza agente da parte di un campo elettromagne­
tico su cariche libere e correnti si assume l ’espressione
f= p {E + \ v B ]}, (6.6)
che viene detta forza eli Lorentz. Da questa espressione si vede ancora
una volta che E e B sono campi macroscopici medi.
Il sistema delle equazioni di Maxwell si può scrivere non solo
mediante i vettori campo ma anche mediante il potenziale scalare q>
e quello vettoriale A. Consideriamo il caso di un mezzo uniforme ed
isotropo e combiniamo i potenziali cp e A con i campi E e B mediante
le seguenti relazioni:
E " — v<p — A , B — r o tA . (6.7)
Sostituendo queste espressioni nel sistema (6.2b) ed imponendo la
condizione supplementare eli Lorentz

div A + - “ 2-<P= 0 (6 .8)


sui potenziali (si può mostrare che questa condizione è facilmente
soddisfatta), otteniamo le equazioni valide per i potenziali (p ed Ai
□ <P= — f - , U A = —n/\ (6.9)
dove
l d* l
□ vì d ’
2
( 6 . 10)
Y *\»
Nelle (6.9) si è assunto che p = p (r, £), j = j (r, Q, cioè che le
densità di carica e di corrente siano funzioni assegnate delle coor­
dinate e del tempo. Le equazioni (6.7) e (6.9) sono equivalenti al
sistema (6 .2 ).
Adesso vogliamo dare un significato quadridimensionale alle
grandezze che compaiono nelle equazioni di Maxwell e riscrivere le
stesse equazioni di Maxwell in forma quadridimensionale. Comun­
que, procederemo gradualmente, e le equazioni di Maxwell (6.2) e
(6.4) verranno scritte in forma quadridimensionale soltanto nel
§ 6.7. Ora iniziamo col costruire grandezze quadridimensionali, par­
tendo dai potenziali co, A e dalle densità p, pv.
Le equazioni (6.9) sono equazioni differenziali delio stesso tipo?
cioè equazioni di D ’Alembert. Quindi, si possono scrivere subito
come una sola equazione quadridimensionale, purché vengano in­
trodotti il vettore quadripotenziale CP e il vettore densità di quadri-
—>■
corrente s.

172
Per un po’ scriveremo contemporaneamente le definizioni e le
relazioni sia in forma reale che immaginaria, come abbiamo fatto
per la meccanica. Perciò, definiamo il vettore quadripotenziale O
come segue :
p i 0>2 0>3 ®4 1 - p° O1 ® 2 ®3
© (b) (6.11)
L * AvAz (ile) cp! ’ (a ) ® (<p Ax Ay
ecl il vettore quadricorrente
fSi s2 s3 su ) | fs° s1 s2 s 3ì
(b) (6.12)
IJx Jy u 1Cpj | (Cp ]x Jy ] z)
Ricordiamo la definizione del quadriraggio vettore:
x 1 x 2 x3 x^ fr^O -r 2 xi
x 1 x* '-f-3
(a) ' (b)
x y z ict ■et x y z

Le componenti dei quadrivettori <P, ,9, R sono scritte in due righe paral­
lele, rispettivamente, nelle notazioni convenzionali e simmetriche,
e il loro confronto permette di trovare immediatamente il valore
richiesto della componente. Una volta determinato il quadripoten-
2 iaie e la densità di quadricorrente, si può riscrivere la (6.9) per il
vuoto (cioè con s = e0 e \x — li0, dove cl = l /8 0p 0) come una for­
mula unica:
□ © ft = -| * 0v ( * = 1, 2, 3, 4), (a)
(6.13)
n O h^ ~ ix 0sh- (ft = 0, 1, 2, 3). (b)
Ovviamente, le tre equazioni della (6.13a) per k — 1, 2, 3 coin­
cidono con le tre equazioni della (6.9) nel caso del vuoto. Per k = 4
l ’equazione (6.13a) dà Qi/ccp — —p0icp, e poiché c2 = l/( e 0(x0),
otteniamo ancora la (6.9).
Suggeriamo al lettore di verificare che le equazioni (6.13b) coin­
cidano anche con la (6.9) neh vuoto.
Nel caso del vuoto la condizione di Lorentz (6.8) e la legge di
conservazione della carica (6.4) si possono scrivere mediante la qua-

^ ^ _
dridivergenza dei vettori <J> ed s. Infatti, per esempio,
dOi d<b-x dQ>,
div (P =
dXf. dxx dx2 dx3 dx±
3A r dAv dAz d (tcp/c)
dx
■div A
dy dz d (ict)
dsj , dh dì z 3 (icq>)
div s — = div/+ i .
dxi dx 1 dy dz d (ict)
Di conseguenza la condizione di Lorentz e la legge della conserva-
zione della carica nel vuoto hanno la forma div ® = 0, div 9 — 0,
quando sono presentate nella notazione quadridimensionale. Sicu­
ramente, gli stessi risultati si ottengono secondo l ’ approccio tridi­
mensionale usuale. Le conclusioni cui siamo giunti sono molto impor­
tanti. Come si vedrà nelLAppendice I, § 4, la quadridivergenza è
un invariante della trasformazione di Lorentz. Per quanto riguarda
le equazioni (6.13), queste relazioni quadrivettoriali sono valide in
ogni sistema di riferimento inerziale nel vuoto. Perciò, le equazioni
per i potenziali, la condizione di Lorentz e la legge di conservazione*
della carica si possono riscrivere in modo che sia evidente subito
che esse mantengono il loro aspetto in ogni sistema di riferimento iner­
ziale. La notazione covariante delle equazioni per i potenziali in un
mezzo di rifrazione (e =7^ b ^ Llo) verrà discussa in seguito (vedi
§ 6.14 e 6.15).

§ 6.2. Trasformazione
del quadripotenziale e
della quadricorrente
— —y
Il fatto di aver realizzato i quadrivettori 0 e s rende possibile ri­
scrivere immediatamente le equazioni di trasformazione delle com­
ponenti di questi vettori. Scriveremo queste equazioni sia in forma
reale che immaginaria (cfr. la (4.10a, b)):
o ^ r ^ -iB O O , ®2= <d;, o)3- o ;, <d4=- r (cp^+ èb<d');
(6.14a)
O°==r(<D0' + B(D1'), <D* = r ((D^ + E®0'), <D2= <D3= (D3';
(6.14b)
si = r e i — s2 = s ’2, s 3= S3, s4 = r (s' + iBs');
(6.15a)
so = r ( s “' + Bs1'), s i ^ r ^ ' + B s 0'), S2 = s2\ SZ= S3\
(6.15b)
Guardiamo con più attenzione le trasformazioni della densità di
corrente. Una quadricorrente comprende una densità di corrente ed
una densità di carica. E naturale che una corrente ed una densità di
carica si combinino in un singolo quadrivettore. Trattando i sistemi
di riferimento in moto relativo, bisogna tener presente che una carica
può essere a riposo solo in un (« proprio ») sistema di riferimento.
In tutti gli altri SRI la carica è in moto, e in termini di questi rife­
rimenti non è solo una carica ma anche una corrente. Vediamo, per­
ciò, quanto sia facile il passaggio da una carica ferma (elettrostatica)
a quella in ruoto (corrente): basta passare dal riferimento proprio della
carica ad un altro SRI. Quando una corrente viene originata dallo
spostamento delle cariche e da un mezzo 0 un corpo in moto, si parla
di corrente di convezione. È una corrente di convezione che si mani­
festa nel passaggio da un riferimento proprio ad un SRI arbitrario.
La formula 7 = pi? contiene la densità delle cariche che si muo­
vono a velocità v. Altrimenti si può essere fraintesi. Per esempio,
c ’ è flusso di corrente in un metallo anche se p = 0. Infatti, la densità

174
di carica totale nel metallo comprende sia gli ioni che gli elettroni
liberi ed è uguale a zero: p = p.; p_ = 0. Ma certamente, può-
fluire una corrente purché ci sia un moto ordinato di elettroni,
j = p+v+ + p_u_ = p_u_, perché la velocità del moto ordinato degli
ioni è uguale a zero.
Dalle formule (6.15) otteniamo direttamente una corrente di con­
vezione nel passaggio dal riferimento « proprio » della carica. Dun­
que, supponiamo che in un riferimento K ' sia assegnata una densità.!
di carica p' e non ci sia corrente ( /' = 0). Di conseguenza, nel rife­
rimento K' la densità di quadricorrente ha componenti s' (0, 0, 0,.
icp' — icp0), cioè s' = Sg — = 0, s[ = icpQ. Quindi secondo la:
(6.15a), nel riferimento K
Si = V ( —iBicp0) n /p o , .9a = .?3 = 0 , .94 = Ticpo.
(6.16),
In forma esplicita l ’ultima equazione della (6.16) dà

s4== icp = _ Ì £ 6l _
l/" 1 — F 2/ c 2

In questo modo si ottiene la legge di trasformazione della densità,


di carica nel passaggio dal riferimento « proprio », in cui le cariche-
sono a riposo, al riferimento rispetto al quale le cariche si muovono
con velocità V:
n=
----- --------- (6.17)»
/ l —7»/ca
La prima relazione della (6.16) dà la densità di corrente
. Poh : PF. (6.18).
M Jx -
y 1 —7Vca
Come è già stato detto, una corrente associata al moto di un mezzo-
carico o di un corpo carico si chiama corrente di convezione.
Il significato dell’uguaglianza (6.18) è molto semplice. La velo­
cità di una carica a riposo nel riferimento K' è uguale a V rispetto al
riferimento K (che è la velocità del riferimento K'\ lo stesso risultato
si ha dalla formula relativistica della trasformazione delle velocità.
(3.27)). Perciò, la (6.18) rappresenta una corrente di convezione.
Per quanto riguarda la variazione della densità di carica (6.17) essa
è associata ad un cambiamento di volume (in quanto la densità è
la carica dell’ unità di volume). Poiché un volume si trasforma se­
condo la legge
d T = d T 0 ] / T - V*/cz~,
e si considera lo stesso volume fisico che contiene la stessa carica de
allora
de de 1 de Po
Per ~dW : Por -
y i - v y V 1 —P W 2
175.
Naturalmente, la carica totale nel dato volume rimane costante
In ogni sistema di riferimento:
p0 d°T $ — p d f \ (6.19)

L ’ uguaglianza (6.19) esprime Linvarianza della carica racchiusa


in un dato volume. Usando la (6.17), il quadrivcttore s si può espri­
mere in modo diverso. Consideriamo un piccolo elemento di volume
di un mezzo in moto nei riferimento K. Allora nel riferimento K°
comovente con questo elemento la velocità dell’ elemento è v — 0
e p = p0. Nel riferimento K la densità p = p0y e, di conseguenza,
j - - pu — po7 u. Allora 5 (p 07 ^, Po^V) = PoL, dove V è la quadrivelo-
cità di un elemento del mezzo. Allora,

s = p 0F, s* = p0i^. ( 6 . 20)

Abbiamo per s2 la forma seguente:

s* = pfr2 (*2s- * 2) = — p*/c2. ( 6 .2 1 )

Il quadrivettore s è un vettore del genere tempo perché la velocità


della carica v è sempre minore di c.
Se nel riferimento K' c ’ è un conduttore scarico attraverso cui
scorre una corrente, cioè nel riferimento K'

So Oxo,ivo, 720. icpo = 0), ( 6 . 22)


in K si osserva una certa densità di carica p. Infatti, secondo la '(6.15),
Si = r;*o.
Le prime tre formule della (6.23) definiscono l ’ intensità della cor­
rente nel riferimento K 7 l ’ ultima la densità di carica nel riferi­
mento K

P = T U 7*o- (6-24)

Quindi, un osservatore in K troverà una densità p, anche se nel


riferimento K' la densità di carica è uguale a zero. Questo risultato
è facilmente interpretabile in termini geometrici. Supponiamo, che
il conduttore sia in quiete nel riferimento K\ gli ioni del conduttore
sono fermi e gli elettroni si muovono con la stessa velocità media v.
Nel riferimento K le linee d’ universo degli ioni sono rette parallele
all’ asse t , mentre quelle degli elettroni sono rette che formano un
angolo ft = arctg {vie) con l ’ asse . t

La fig. 6.1 mostra i riferimenti K ( x , ) e K' (x , ' ) , le linee


t t

d’ universo degli ioni (linee tratteggiate) e quelle degli elettroni (linee


continue inclinate» all’ asse % di un angolo ft). Poiché il metallo è
neutro in media, ogni segmento del conduttore deve emettere un

176
ugual numero di linee d’ universo di ioni e di elettroni. La densità
di carica deve essere misurata simultaneamente in ciascun sistema
di riferimento. Nel riferimento K essa si determina dal numero di
linee d’universo degli ioni ed elettroni che attraversano l ’ unità di
lunghezza del riferimento. Per esempio, la densità di carica si deter­
mina dal numero di linee d’ universo degli ioni (preso col segno
« -f- ») e il numero di linee d ’universo degli elettroni (col segno
« — ») che attraversano il segmento O A. Un’ iperbole di scala taglia i

Fig. 6.1. Il diagramma di Minkowski che illustra l’ apparire di una densità di


carica nel riferimento K' in un conduttore percorso da corrente che ha densità di
carica nulla nel riferimento La densità di carica totale causata dagli ioni e
dagli elettroni nel conduttore è uguale a zero. La corrente è generata dal moto
degli elttroni, gli ioni sono fermi. Le linee d’universo degli ioni sono tracciate
con linee tratteggiate., quelle degli elettroni da linee inclinate continue. Oltre
al riferimento K (gli assi x , t), è mostrato il riferimento K! (gli assi x ', x');
è tracciata anche un’ iperbole di scala che tagliai segmenti unitari sugli assi x
ed x . Visto che la densità di carica deve essere determinata simultaneamente
in tutti i punti, essa va determinata in tutti i punti del corpo rispettivamente
sull1asse x o x . Si vede che se un segmento unitario nel riferimento K contiene
un numero uguale di ioni e di elettroni, un segmento unitario nel riferimento K!
contiene più ioni che elettroni. Questo significa la comparsa di una densità di
carica positiva nel riferimento K\

i segmenti unitari sull’ asse x ed x\ Sono questi segmenti unitari che


vanno correlati. Ma nel riferimento K f la densità di carica deve
essere calcolata contemporaneamente per tutto il conduttore. Nel
riferimento K' eventi simultanei si pongono su rette parallele al­
l ’ asse x\ ed, in particolare, sullo stesso asse x . Si vede, comunque,
dalla fig. 6.1 che il segmento unitario OA' comprende più cariche
positive di quelle negative. Perciò, il conduttore risulterà carico posi­
tivamente nel riferimento K' anche se è neutro nel riferimento K.
Sicuramente, se si considera un conduttore chiuso, nel riferimento K 9
la sua carica totale rimarrà uguale a zero, ma si osserverà nel rife­
rimento K ' un momento di dipolo elettrico, che non esiste nel rife­
rimento K (vedi § 6.9 e fig. 6.4).

177
§ 6.3. Tensore del campo
elettromagnetico
In elettrodinamica Tintensità di campo elettrico E e V induzione
magnetica B sono espresse convenientemente mediante i potenziali
vettoriale e scalare A e cp nel modo seguente 1:
B = rot A , E = --grad <p — dA/dt. (6.25)
Riscriviamo queste equazioni usando le componenti del qiiadri-
potenziale, inoltre scriveremo per ora le relazioni per il quadri-
spazio complesso:
yP --- J J 1 - dA z dAy d03
IJ X
dxs ’
(6.26)
dy dz dx2
3q> c a0)4 dept .
Jtq
III

— ■ ' ic —
11
«

dx dt i dx± dx±

= “ (V ?ox1
* ?ax^
■ )} . (6.27)

Gli ultimi termini nelle uguaglianze (6.26) e (6.27) sono scritti


sulla base della definizione di componenti del quadripotenziale.
In modo simile, usando le componenti di tp, si possono scrivere le
restanti componenti dei vettori E e B. Otterremo equazioni simili
alle (6.26) e (6.27), dalle quali segue che tutte le componenti dei
vettori E e B si possono esprimere mediante certe combinazioni delle
derivate delle componenti del quadrivettore Ó rispetto alle coor­
dinate quadridimensionali. Queste combinazioni formano il quadri­
tensore antisimmetrico di secondo rango 1
2:

F» - ‘ ( l S r — £ - ) «■ * - 1 , 2 , 3, -4>- (6.28)
Prima di discutere le proprietà matematiche e il significato del­
l ’ espressione (6.28) dobbiamo esaminare lo stesso passaggio nello
spazio reale quadridimensionale. Come abbiamo indicato, in questo
caso bisogna separare le componenti co- e controvarianti dei vettori
e dei tensori. Il tensore del campo elettromagnetico (6.28) è scritto
per comodità nelle componenti covarianti. Quindi se il vettore <p>
ha le componenti controvarianti (<D°, A) le sue componenti covarianti
saranno (<P°, —A). La differenziazione rispetto alle coordinate con­
trovarianti dà ancora coordinate covarianti (vedi Appendice I, § 8)..

1 Nei capitoli precedenti abbiamo usato la lettera B per indicare il rapporto


tra la velocità del riferimento e quella della luce. Qui si è introdotto il vettore
induzione magnetica B e le sue proiezioni Bx, B y, B z. Per evitare confusione
non useremo il simbolo B = Vie nel capitolo, salvo in quei casi in cui il signi­
ficato sia palese.
2 Come nella maggior parte dei libri di elettrodinamica relativistica, usiamo
gli indici i e k nonostante che ogni tanto ricorriamo all’unità immaginaria, anche
indicata con i. Speriamo che ciò non provochi confusione.

178
Perciò, la (6.26) cambia soltanto segno mentre la (6.27) si scrive

E X= E X= . W»o x ggb (6.27')


dx1 | C 9x0 ~ V dz1 / ’
tenendo conto che cp = c<D0, = — <Dl7 £ = z°/c, a; = x1. Perciò,
nel caso del quadrispazio reale introduciamo il quadritensore cova­
riante antisimmetrico di secondo rango
( dOfe dOj \
F ih (6.28')
\ dxi dx& ) ’
che coincide nella forma con la (6.28). Lo scopo d ’introdurre la (6.28)
o la (6.28') è molto importante. I due vettori di campo di Maxwell E
e B si esprimono nel quadrispazio in modo univoco mediante una
certa combinazione di derivate spazio-temporali del quadrivettore
potenziale CD. Il comportamento delle grandezze F ik nel passaggio da
un SRI ad un altro è per noi più significativo. La loro trasformazione
è molto semplice da trovare: le grandezze F ik formano un tensore in
quanto si può vedere facilmente (vedi Appendice I, § 3) che le deri­
vate delle componenti dei quadrivettori rispetto alle coordinate si
trasformano secondo la regola di trasformazione dei tensori. Se gli
indici i e k nelle (6.28) e (6.28') prendono indipendentemente tutti i
valori da 1 a 4 (e da 0 a 3 rispettivamente), otteniamo 16 valori di
Fiu (quattro dei quali sono uguali a zero) espressi mediante le compo­
nenti di E e B. Scriviamo queste componenti in forma di matrici:
cBz CBy — iE x '
/ 0
I ~ cB 0 cBs iFy
F ik = — cBx 0 — iE z
(a)
1
\ iEx ÌEy iE z 0 ,
(6.29)
f 0 cEx CEy cE z
— cEx 0 ~cB z CBy
F ih = fl> )
~cE y cBz 0 — cB x
*>— c E z c cBx 0
Vediamo che le componenti dell’ intensità di campo elettrico e
dell’ induzione magnetica sono componenti del quadritensore del
campo elettromagnetico. Come al solito nella notazione F ik il primo
indice i denota la riga ecl il secondo k la colonna della matrice F ih.
Spesso il tensore (6.29a) si abbrevia in g = (cB, — iE) 1 ed il
tensore (6.29b) in % = (.E, cB), assumendo che le componenti dei
vettori E e B siano poste rispettivamente come nelle (6.29a) e (6.29b)„
Abbiamo ottenuto un risultato diverso rispetto al caso tridimen­
sionale. La teoria di Maxwell tratta abitualmente vettori campo.

1 La lettera gotica g indica le componenti della quadriforza del capitolo V


In questo capitolo la stessa lettera è usata esclusivamente per indicare un ten­
sore.

179
infatti, i vettori E e B sono vettori tridimensionali fintanto che si
tratta della trasformazione del sistema di coordinate (cioè la rota­
zione degli assi coordinati). Non appena si passa a riferimenti in
moto relativo, la si Inazione cambia drasticamente. Nel quadrispazio
E e B non ci sono più vettori, nemmeno quadridimensionali. Benché
E e B si esprimano mediante le componenti del potenziale quadridi­
mensionale, non c ’ è alcun valore che si può aggiungere ai vettori tri­
dimensionali E e B per renderli quadrivettori. Nel quadrispazio un
campo elettromagnetico è una singola grandezza di natura più com­
plicata del qùadHvettore. 1 campi E e B si fondono in un singolo qua­
dri ter sore che si dice tensore del campo elettromagnetico.
La comparsa di un quadritensore, invece di due vettori tridimen­
sionali che descrivono il campo elettromagnetico, ha un chiaro si­
gnificato fisico. I campi elettrico e magnetico sono interconnessi in
modo così stretto che F« apparire » o lo « sparire » di uno dei campi
è determinato dalla scelta del sistema di riferimento. Per esempio,
un campo elettrico « puro » generato da una carica si ha in condizioni
molto particolari quando la carica viene considerata nel riferimento
in cui è a riposo. In ogni altro riferimento inerziale,, questa carica
si muove e, di conseguenza, genera una corrente elettrica che crea
un campo magnetico. D ’ altra parte, abbiamo visto che in un certo
riferimento un conduttore che porta corrente appare neutro, in altri
riferimenti inerziali esso appare carico e, di conseguenza, in questi
riferimenti deve comparire un campo elettrico.
Perciò, è sufficiente, per esempio, che ci sia soltanto un campo elet­
trico nel riferimento K perché appaia un campo magnetico in un
altro riferimento K*. Se nel riferimento K c ’ è solo un campo magne­
tico in un altro riferimento K ' compariranno sia il campo magnetico
che quello elettrico. Proprio questo fatto fisico non si può esprimere
in termini matematici, se tentiamo di mantenere i campi E e B
come vettori. Abbiamo già detto che non ci sono valori per trasfor­
mare i vettori tridimensionali eli un campo elettromagnetico in qua­
drivettorL Inoltre, se ciascuno dei vettori E e B fosse contenuto nel
« proprio » quadrivettore, nelle trasformazioni di Lorentz ciascuno
di questi vettori in un « nuovo » riferimento si esprimerebbe me­
diante le componenti del « proprio » vettore nel « vecchio » riferi­
mento. In tal modo, i vettori l e H si dimostrerebbero non correlati.
L ’esperienza, però, mostra che c ’ è una stretta connessione fra i cam­
pi elettrico e magnetico, cioè ira i vettori E e B.
Due vettori tridimensionali hanno sei componenti indipendenti.
Un quadritensore antisimmetrico di secondo rango possiede esatta­
mente sei componenti indipendenti. Abbiamo visto nelle (6.29a, b)
che i campi E e B formano un quadri tensore antisimrnetrico, il ten­
sore del campo elettromagnetico. Dato che ogni componente di un
tensore in un nuovo sistema di riferimento è una combinazione li­
neare di tutte le componenti di quel tensore nel vecchio riferimento,
un passaggio da un sistema di riferimento ad un altro può produrre
la comparsa di un campo elettrico dovuto al campo magnetico osser­

180
vato in un altro riferimento, e viceversa. In un certo senso, un campo*
elettromagnetico è una formazione chiusa: se un riferimento inerziale
non ha campo elettrico o magnetico, un campo elettromagnetico non
comparirà in nessun altro riferimento inerziale. Tratteremo nel pros­
simo paragrafo la trasformazione delle componenti del campo elet­
tromagnetico mentre ora esamineremo brevemente il campo elet­
tromagnetico nella materia.
Per descrivere il campo nella materia, bisogna introdurre, oltre­
ai campi medi E e B, due altri vettori. Possono essere sia il vettore
induzione elettrica B e l ’ intensità di campo magnetico 2f, che il
vettore polarizzazione elettrica P e il vettore magnetizzazione ili.
Questi quattro vettori sono legati dalle relazioni

D = e0E + P , H = B/[io — M. (6.30)

I vettori H e D formano uno speciale tensore le cui componenti


sono solitamente indicate con f ikj mentre il tensore stesso è abbre­
viato f = (if, — icD). Questo tensore si deriva dalla (6.29a) sosti­
tuendo rispettivamente le componenti II a quelle cB e — icD a quelle
— iE. Riportiamo la matrice delle componenti di questo tensore:

0 Hz ~ H y — icDx
-IIZ 0 H x -- icDy
(6.31)
Hy -H x 0 — icDz
icDx icDy icDz 0

In aggiunta al tensore f, è utile introdurre anche un tensore dei


momenti elettrico e magnetico della materia, la cui definizione si
deduce facilmente dalla (6.30)

mik = \
t
/
LL0
F ~ fik ’ (6.32)

come segue: 3JÌ == (M,icP). Scritto per «

/ 0 M ~M y icP:
I 0 Mx icPì
1t

mi k = (6.33)
-M x 0 icP
i
\ — icPx — icPy 0

lì fatto sostanziale all’origine dei tensori (6.29), (6.31) e (6 .33) è il


profondo legame tra le coppie di grandezze E e B ; H , I) e M, P. Ab­
biamo scritto i tensori f ik e mih soltanto per un quadrispazio com­
plesso; l ’ espressione corrispondente per il quadrispazio reale può»
essere ricavata facilmente dal lettore.

181
§ 6.4. Trasformazione delle
componenti dei campi elettrico
e magnetico
L ’ approccio quadridimensionale ò particolarmente conveniente in
quanto non appena è stabilita la natura matematica di una o dell’ al­
tra grandezza fisica (uno scalare, un quadrivettore, un quadritensore)
il problema della sua trasformazione nel passaggio da un SRI ad
un altro è automaticamente risolto. In meccanica trattiamo i qua-
drivettori. Come stabilito, le componenti dei campi E e B, H e D
ed M c P sono, rispettivamente, le componenti dei tensori (6.29a, b),
(6.31) e (6.33).
Di conseguenza, lo componenti dei vettori tridimensionali si
trasformano secondo la regola di trasformazione delle componenti
del tensore. Per esempio, le componenti, F ih nello spazio complesso,
quadridimensionale, si trasformano come
F ik = C-im
UhlF'm
l,(6.34)
dove a im sono le componenti della matrice della trasformazione di
Lorentz (2.4'la), mentre le componenti F ik sono definite dalla (6.29a).
Per trasformare le componenti della matrice (6.29b) bisogna usare la
matrice delle trasformazioni di Lorentz nella forma (2.41b).
Vogliamo fare un richiamo metodologico. Spesso nell’ esposizione
della lezione si evita di introdurre i tensori per non complicare il
corso. Infatti, spiegare il significato dei tensori e le loro proprietà
in una mezz’ora diciamo è un compito difficile. Non si può, però,
accantonare il fatto che il campo elettromagnetico è un tensore.
Ritorna una vecchia questione: « chiamare gatto un gatto » dal­
l ’ inizio? Naturalmente, non è tanto una questione di nome, quanto
dell’equazione di trasformazione (6.34). Apparentemente questa equa­
zione si può e si deve ottenere nel modo più semplice. Per esempio, si
può derivare facilmente come segue: vediamo dalla (6.28) che le
grandezze F ik sono combinazioni lineari delle derivate delie compo­
nenti del quadrivettore rispetto alle quadricoordinate; la trasforma­
zione delle derivate delle componenti del vettore dovuta alla tra­
sformazione di coordinate si ricava da una semplice analisi (vedi
Appendice I, § 3).
Per memorizzare la regola di trasformazione delle componenti
di tensori, bisogna ricordare che esse si trasformano come il prodotto
delle corrispondenti componenti dei vettori. In un modo o nell’ altro
otteniamo la (6.34). E giunto il momento di chiamare tensore un
tensore, avendo chiarito, anche se parzialmente, il significato delle
componenti del tensore mediante le derivate delle componenti di
vettori rispetto alle coordinate.
Daremo un esempio di come si può ottenere l ’equazione di tra­
sformazione del campo per il caso B z — F12/c. Secondo la (6.34)
l ’equazione di trasformazione per F 12 ha la forma seguente:
F 12 — a ìma 2lF'mli (6.35)
182
Ricordiamo che la somma va eseguita rispetto a due coppie indi-
pendenti di indici m ed l, ciascuno dei quali va da 1 a 4. Perciò nella
somma (6.35) entrano sedici termini, ciascuno dei quali contiene il
prodotto di due componenti a ik e di una componente F ih. Stimoliamo
il lettore che incontra per la prima volta queste equazioni a scrivere
(una volta nella vita!) tutti i sedici termini. Diamo il modo più
semplice per farlo. Prima, sviluppiamo la somma rispetto a m,
per esempio, assegnando ad m i valori 1, 2, 3, 4. Come prima, Vindice
l indica la somma. Otteniamo una somma che consiste di quattro ter­
mini in cui abbiamo eliminato l ’ indice m. Poi si effettua la somma su
l in ciascuno dei quattro termini. Come risultato si ottengono tutti
i sedici termini. Quindi bisogna sostituirvi gli a ik dalla matrice di
Lorentz (vedi la (2.41a)) e le componenti F ik dalla (6.29a). Si vede
subito che molti termini della somma (6.35) sono uguali a zero. Per­
ciò la sommatoria nella (6.35) si può effettuare in modo più semplice.
Infatti, le grandezze ct1?n, con m che va da 1 a 4, costituiscono gli
elementi della prima riga della matrice di Lorentz (vedi la (2.41a)),
mentre la seconda riga è formata dalle grandezze a 2ì con l = 1,2, 3, 4.
Ma la prima riga della matrice ha solo due elementi, a n e a i4, diver­
si da zero. Perciò, per m si devono considerare soltanto i valori 1
e 4. La seconda riga ha solo un elemento diverso da zero, a 22 = 1-
Di conseguenza, si deve prendere soltanto l — 2 e riscrivere la (6.35)
come
F — C $2 ^ 2 2 ^ 1 m F m2 — ( X ^ F 12 - {- C L ^F 42

Y l —y*/c*
Confrontando la seconda e l ’ultima uguaglianze nell’ultima catena
di uguaglianze c riducendo per c. otteniamo

■E’v K+
B7 :T (B '+ ^ E y ).
V 1-
Analogamente ottoniamo le equazioni di trasformazione per le altre
componenti. Scriviamole insieme:
E X= E'X, E V= T (E'v + VB'Z), — ;
(6.36)
B X= B'X, By — T^By — 4 E'z^
,j

Scriveremo anche le equazioni di trasformazione per D ed II


che useremo in seguito:

DX= D 'X, Dy = T ( D l + ^ - H ' x) , DZ= T Ì D 'Z— i n ;


v c ! (6.37)
H X= H'X, H V= T {Hy B z = T (H : + VD'y).

183
Nel quaclrispazio reale si ottengono esattamente gli stessi risultati
(6.36) e (6.37). Non parleremo più di questo spazio in quanto nel
seguito faremo uso soltanto delle equazioni finali che sono identiche,
inoltre differenze sostanziali si riscontrano solo nel passaggio dalla
(6.27) alla (6.27').
Si vede dalle formule (6.36) che tutti i vettori campo cambiano
modulo e direzione passando da un riferimento inerziale K' ad un
altro K . Soltanto le « componenti longitudinali » rimangono inva­
riate, cioè le componenti lungo la direzione del moto relativo (lungo
l ’ asse x).
Scindiamo i campi elettrico E e magnetico B nelle componenti
parallela e perpendicolare alla direzione del moto (i versori i, /, k
sono diretti rispettivamente lungo gli assi x, y, z), cioè
E|
|= E xi, E± — Eyj + E zk .
Sottolineando che il vettore velocità V del sistema di coordinate K f
ha componenti (F, 0, 0), otteniamo
i j k
[VE'] = V 0 0 = ~ j V B ' z + kVB;j ^ V ( - j B ' + kBy),
Bx By B'z
[VE'] = V ( - j E ' z + kE'y).
Qiiindi la (6.36) si può riscrivere in forma vettoriale:
E » - (E' - [VE'}) ||, E ± = T (E'± - tV B '])± ;
(6.38)
B = )E'ÌW|t, fix = r (fi'x + [Fi?'])
E forse il caso di ricordare che tutte le espressioni dei tipo [VAÌ^
sono uguali a zero mentre le espressioni del tipo [VA]± coincidono
con il prodotto vettoriale stesso per ogni A. Le equazioni per le
trasformazioni inverse si ottengono, sostituendo le grandezze con
apice con quelle senza apice e viceversa e cambiando il segno di F:
E ' t = ( E + [ V B ] ) lh E ’± ^ T ( E + [ VB})±]

b \= (b - ± [VE]) , b\ = t ( f i — i-[F J ? ]) .
Nel caso di velocità non relativistiche T / ì, otteniamo dalla (6.38)

E = E' + [B'V], B^B — [E'V]. (6.40)


Sono introdotte qui le seguenti notazioni: E = E |( + E± e B —
= 5|| -|- B jL. Le equazioni della trasformazione inversa da K a K r
si ottengono al solito sostituendo le grandezze con apice con quelle
senza apice e viceversa con un cambiamento contemporaneo del
segno di F:
E ' = E + [ V B ] , B' = B - - ~ [ V E ] . (6.41)

184
Infine scriviamo le equazioni di trasformazione per D ed H .
Non si deve ricalcolare tutto; è sufficiente ricordare che abbiamo ot­
tenuto le equazioni per le componenti del tensore $ = (.cB, — iE)r
ed ora vogliamo trovare le analoghe equazioni per il tensore f =
= (H, — icD). Invece della (6.39) otteniamo le seguenti espressioni
per le componenti corrispondenti:

I> \ \ -[D + ~ [ V I I ] ) ìrD'± = T


H \ = (H -[V D ])U H'± =(6'42>
e nel caso di velocità non relativistiche, per T ~ 1 la (6.41) si tra­
sforma in

D' = D + -^ -[V H ], H ’ = H — [FZ>], (6.43)

Supponiamo che nel riferimento K* il campo magnetico B' = 0.


Allora nel riferimento K la relazione fra E e B diventa molto sem­
plice. Prima di tutto, notiamo che [VE] — [VE± ] in quanto [VE^] —
= 0. Dalla (6.38) si ottiene
E = -E\ + T E '±Ì (6.44>

Zi= r A [VE’]= [ VE\ ] =A [V TÉ’Ù =


= -L [V ,E \ + r

Se nel riferimento K' il campo E' è uguale a zero o nel riferimento K


il campo E è uguale a zero, quindi, si ha, analogamente
E = -[V E ], E' = [VE'], (6.45)
In entrambi i casi ed in ogni sistema di riferimento inerziale,
i campi risultano ortogonali. Dalle formule relativistiche (6.38)
e dalle equazioni approssimate per piccole velocità (6.41) segue che
se in uno dei riferimenti (diciamo K) il campo elettrico o quello ma­
gnetico sono uguali a zero, i campi elettrico e magnetico sono simul­
taneamente perpendicolari in ogni altro riferimento inerziale. Lo
stesso risultato si ottiene utilizzando gli invarianti delle trasforma­
zioni di Lorentz (vedi § 6.5).
Se i campi E' e B' sono mutuamente perpendicolari nel riferi­
mento K ' , esiste un riferimento K in cui uno dei campi scompare.
Verrà mostrato nel § 6.5 che l ’espressione c2B2 — E 2 rimane inva­
riata nelle trasformazioni di Lorentz. Di conseguenza, se la condi­
zione c2B '2 — E '2 < 0 è soddisfatta nel riferimento K \ si può ot­
tenere un puro campo elettrico mediante la scelta appropriata del
sistema di riferimento, mentre nel caso di c2B '2 — E '2 ;> 0 si ot­
tiene un puro campo magnetico. Mostreremo come si trova la velo­
cità V del riferimento K. Supponiamo che tale velocità sia perpendi­
colare a B' nel caso in cui c2B '2 — E '2, <C 0 ed a E' nel caso c2B '2 —
— E ’ 2 >> 0. Perciò Hjj = 0 nel primo caso e E\\ — 0 nel secondo.

185*
Ora bisogna assicurarsi che — 0 nel primo caso; per fare ciò,
bisogna soddisfare la seguente condizione (vedi la (6.38)):
B'x + (1/c2) [V E '] l = 0.
Moltiplicando vettorialmente entrambi i membri di questa e-
spressione peri?' e tenendo conto delle relazioni [V E ']j_ = [VE'y]± =
= [VE'±], [Er [VE'± ]]± = V E ' 2, B'± = B ', otteniamo la velocità V
del rifèrimento
V = — (c2/E'2) [E'B']. (6.46)
Nello stesso modo otteniamo nell’ altro caso
V = (i/B'2) [E'B']. (6.47)
Si può sempre trovare un sistema inerziale in cui i campi elet­
trico e magnetico sono paralleli l ’uno rispetto all’ altro in un punto
dato (vedi, comunque, l ’osservazione sulle onde luminose alla fine
del § 6.5). Ovviamente, se ne
esiste uno, ci sarà un numero
infinito di riferimenti con le stesse
proprietà. Infatti, in ogni sistema
di riferimento inerziale K ' in
moto rettilineo ed uniforme ri­
spetto a K nella direzione coinci­
dente con la direzione comune di
E e B, i campi E' e B' rimangono
Fig. 6.2. Il passaggio ad un sistema
di riferimento K in cui i campi elettri- paralleli, in quanto non variano
nò e magnetico risultano paralleli. le componenti del campo orien­
tate lungo la direzione del moto.
Per trovare almeno un riferimento in cui i campi sono paralleli,
procediamo nel modo seguente. Supponiamo che i campi siano paral­
leli nel riferimento K , cioè [EB] = 0. Dirigiamo la velocità del rife­
rimento K ' (in cui i campi E' e B' non sono più paralleli) lungo la
perpendicolare ai campi E e B; assumiamo che l ’ asse x ì x' sia diretto
lungo la velocità V (vedi fig. 6.2). Allora E x — B x = 0 e l ’ugua­
glianza a zero del prodotto vettoriale equivale a E yB z — E ZB y — 0.
Sostituendovi le componenti di E e B, espresse mediante le compo­
nenti di E' e B ', secondo la (6.36), si arriva alla seguente equazione:

r {E ’y + V B ’Z)r (5 1 + - w Ev) = r r
La velocità V del riferimento si può determinare da questa equa­
zione usando i campi dati E' e B '. Tenendo presente che, secondo la
(6.36), E'x = B'x — 0, troviamo immediatamente la direzione della
velocità V rispetto a E ’ e B '. Infatti, [E'B'] — i (EyB'z — E'zB'y)
e V = V -i, in modo che, risolvendo l ’ equazione precedente, si può
scrivere
V/c2 _ [E'B'}
(6.48)
V 2/c2 ~
1-j- c2B '2-r E ' 2 *

186
Perciò, dai vettori E' e B r dati nel riferimento K ' si può trovare il
riferimento K in cui E e B sono paralleli. La direzione della velocità
di questo riferimento coincide con quella di [E'Bf], mentre il modulo
della velocità è una delle radici dell’ equazione quadratica (6.48).
Sicuramente dalle due radici della (6.48) bisogna scegliere quella per
cui V << c. Il caso E 'B ' — 0 viene esaminato in precedenza: qui
non si possono ottenere campi paralleli, ma è possibile ottenere o
un puro campo magnetico o un puro campo elettrico.
§ 6.5. Invarianti del campo
elettromagnetico
Benché l ’ intensità del campo elettrico E e l ’ induzione del campo ma­
gnetico B varino nelle trasformazioni di Lorentz, ci sono alcune com­
binazioni di questi campi che rimangono invariate. Queste grandezze
sono invarianti di un quadritensore antisimmetrico di rango due.
Useremo due di questi invarianti (vedi Appendice I, § 6):
Ii= I 2 = F ihFìk = ~2 e ihlmF iiiF lm-
Ricordando la definizione dei tensori F ik e F*k
% {cB , — iE), cB)
e tenendo presente che il primo invariante, è la somma dei quadrati
delle componenti di F ik e che il secondo è il prodotto a coppie delle
componenti corrispondenti dei tensori F ik e AU, possiamo scrivere
subito / x = 2 (c2B 2 — E 2), I 2 —2 ic (BE).
Tralasciando fattori costanti inessenziali, si può dire che il
campo elettromagnetico possiede due invarianti (non scriveremo gli
nvarianti del tensore % e gli invarianti misti di ^ e f, che non
sono necessari):
I 1 = c2B 2 — E2, J2 - BE.
Dall’ esistenza di questi due invarianti seguono i risultati di cui
in parte ci siamo occupati in precedenza. Se in un SRI i campi E
e B sono mutuamente ortogonali (EB = 0), sono ortogonali in ogni
altro sistema di riferimento inerziale. Se in un riferimento E — cB,
questa relazione è valida in ogni altro sistema di riferimento.
Bisogna sottolineare che ambedue questi invarianti sono uguali
a zero per le onde luminose noi vuoto. Queste proprietà, cioè B I E
e cB — E , si mantengono in ogni SRL
È chiaro che se / 2 = 0 ed I L =j£= 0, si può sempre trovare un sistema
di riferimento in cui o E — 0 oppure B = 0 (secondo il segno di / Q,
cioè passare ad un puro campo magnetico o ad un puro campo elet­
trico. Al contrario, se E oppure B è uguale a zero, in qualche rife­
rimento, essi saranno mutuamente ortogonali in tutti gli altri rife­
rimenti inerziali. Da notare che la grandezza BE non è un « vero »
scalare, in quanto cambia segno nel passaggio da un sistema di coor­
dinate destrogiro ad uno levogiro e viceversa, mentre la grandezza
(BE)2 è un vero scalare.

187
§ 6 . 6 . Forza di Lorentz
Consideriamo ora le forze agenti sulle cariche elettriche in un campo
elettromagnetico. Per non complicare l ’ esposizione, ci limitiamo ad
una distribuzione volumetrica di cariche L In un riferimento como-
vente K\ in cui Velemento di volume considerato è a riposo insieme
con una carica, la carica subisce una forza esercitata dal campo elet­
trico (il campo magnetico non agisce sulla carica ferma). La forza
che agisce sulla carica contenuta in un volume unitario viene detta
densità di forza. Se una densità di carica è uguale a p0 nel riferimento
comove'nte K \ la densità di forza f è definita dall’ equazione
r -
dove E' è V intensità del campo elettrico in K ' .
Il passaggio ad un altro SRI produce la variazione dei campi E
e B; anche se nel riferimento comovente non c ’ è campo magnetico ed
è presente soltanto il campo elettrico, il campo magnetico comparirà
in ogni altro SRI. Troviamo la densità di forza f espressa mediante
le componenti E e B di un riferimento inerziale arbitrario. Dappri­
ma, esaminiamo il caso di velocità non relativistiche quando F ~ 1 ;
quindi, secondo la (6.17), p = p0F » p0, e, secondo la (6.41), E f —
— E + [VB], e a causa di ciò
/ = / ' = PoE' = P\{E + [VB]}. (6.49)
L ’ ultimo passaggio delia formula (6.49) definisce una grandezza
comunemente detta in elettrodinamica densità delia, forza di Lorentz.
La forza di Lorentz definisce la forza, che agisce sull 1unità di volume
contenente una carica, da parte dei campi elettrico e magnetico nel
riferimento K rispetto al quale la carica si muove con velocità V.
Non sorprende che la forza f del riferimento K' si dimostri uguale-
alla forza / del riferimento K , in quanto, secondo la (5.34), il modulo
della forza non varia nel passaggio da un riferimento all’ altro nel
caso non relativistici.
Naturalmente la formula (6.49) si può usare anche nel caso in cui
la velocità del moto della carica sia diversa nei vari punti dello spa­
zio. In questo caso ciascun elemento di volume avrà il suo riferi­
mento comovente e, di conseguenza, la velocità V sarà diversa nei
vari punti.
Ricaviamo l ’ espressione della forza di Lorentz con un altro me­
todo che illustra esplicitamente come si arriva all’ espressione (6.49).
Supponiamo che il riferimento comovente K r abbia campi elettrico'
e magnetico definiti dai vettori E' e B r.
Facendo uso del principio di sovrapposizione, rappresentiamo
ognuno dei campi come la somma di due campi:
I E[ = 0, B[ = B ';
II E^E\ b ; = 0.
1 Le cariche puntiformi sono discusse, ad esempio, in [8], § 29.
Naturalmente, il campo iniziale è dato proprio dalla somma dei
due campi E* — E[ -f- E'2, B' = B[ + B'2. Comunque, le equazioni I
e II di trasformazione dei campi sono molto semplici e ci permettono
di avere subite una risposta. Nel riferimento K'
r = Poi?' = poi?;. (6.50)
Usando la prima delle formule (6.45), si può scrivere immediata­
mente il campo elettrico I nel riferimento K :
Et - - [ VBX\,
dove Bt è il campo magnetico in K. Secondo la (6.36) il campo elet­
trico II nel riferimento K è uguale a
E2 — È'iJ -r F {E'^yj + E 2
FZk) ~ E 2
nel caso in cui F•~ 1 . Il campo elettrico totale in K è uguale alla
somma di E1 ed' E^:
È = E ± + E 2 = E'% - IVBJ. (6.51)
Il campo magnetico B nel riferimento K è uguale a B± + B 2.
Formando il prodotto vettoriale [VB] = [VBy] + IVB2] si vede dalla
seconda equazione della (6.44), che definisce J52, che il prodotto
| [VB2] |~ (F 2/c2) e lo si può trascurare nel caso non relativistico.
Perciò, [FJ5-J — [VB], e dalla (6.51) otteniamo la forza di Lorentz
(6.49).
Se nel riferimento K il campo elettrico è uguale a zero (E = 0)
ed il campo magnetico è diverso da zero, dalia (6.45) segue che E' =
= [VB']; cosicché, la forza di Lorentz, che sembra agente da parte
di un puro campo magnetico nel riferimento K , sembra prodotta
nel riferimento cornovente K' da un puro campo elettrico. Questi
esempi mostrano ancora una volta Punita del campo elettromagnetico
e la relatività della sua suddivisione in campo elettrico e magnetico.
Vale la pena di dire due parole sulle linee di forza del campo. In
ciascun sistema di riferimento un campo vettoriale può essere corre­
lato con una famiglia di linee di forza vettoriali. Queste linee sono
definite come le curve, la cui tangente in ogni punto coincide con la
direzione del campo vettoriale in quel punto. Le linee di forza per­
mettono una rappresentazione grafica delle proprietà del campo.
Comunque, a differenza di rappresentazioni del secolo scorso, nes­
suno attribuisce a queste linee un significato fisico.
Supponiamo, che si muova una carica o un magnete costante.
Vale la pena di dire che insieme ad essi si muovono il campo e le
linee di forza di questo campo?
Il campo è un mezzo per descrivere quello che accade in un dato
punto dello spazio. Il moto del magnete fa sì che il campo vari sem­
plicemente nel tempo in un punto dato. Cionondimeno, si può par­
lare di moto dei campo indotto da una carica od un magnete che si
muove a velocità costante, in quanto il campo si muove con essi
solidalmente. La velocità di trasporto del campo è la velocità con

189
cui si muove la carica o il magnete. Comunque, è meglio non parlare
di moto delle linee di forza, in quanto ciò non ha significato fisico.
La natura ausiliaria delle linee di forza si dimostra particolarmente
bene col fatto che per uno dei campi esse possono sparire in alcuni si­
stemi di riferimento.
Daremo un altro esempio che illustra il carattere relativo delle
forze che agiscono in un campo elettromagnetico. Consideriamo un
conduttore cilindrico percorso da corrente ed una carica negativa q
che si muove parallelamente al conduttore con velocità V (fig. 6.3).

Fig. 6.3. L ’interazione tra una carica q, che si muove a velocità V parallela-
mente al conduttore percorso da corrente, e la corrente, a) Nel riferimento K
il conduttore è fermo, la carica e gli elettroni si muovono a velocità V. b) Nel
riferimento K ' il conduttore si muove a velocità h, la carica e gli elettroni
sono fermi.

Associamo il riferimento K al conduttore ed il riferimento K ' alla-


carica. Nel riferimento K la carica subisce la forza di Lorentz in­
dotta dal campo magnetico e diretta ad angolo retto rispetto all’ asse
del conduttore. Di conseguenza, la carica si avvicina al conduttore.
Nel riferimento K' la particella carica è in quiete ed il campo magne­
tico non ha effetto su di essa. Allora qual è la ragione che fa deviare
la carica nel riferimento K ' ?
Qui bisogna riprendere la descrizione microscopica di cosa succede
in un conduttore. La corrente in un conduttore si generafper il moto
degli elettroni liberi, in quanto gli ioni positivi e gli elettroni fissi
(di valenza) non possono migrare lungo il conduttore. La densità
degli elettroni di conduzione sia uguale a p_, e la loro velocità nel
riferimento K (rispetto al conduttore) valga i?__. La densità delle ca­
riche ferme è uguale a p+ e, dato che il conduttore è neutro, p+ +
4* P- — 0. Poiché il conduttore è neutro, non c ’ è campo elettrico-
esterno e la forza agente sulla carica q c generata soltanto dal campo
magnetico:
F = q [V B ].
L ’ intensità del campo magnetico indotto da una corrente rettilinea
alla distanza r dall’ asse è data:

dove r è la distanza dall’ asse nel piano perpendicolare alla direzione


della corrente; il vettore B coincide con la tangente alla circonferenza

190
giacente nello stesso piano con centro nell’ asse della corrente. La<
direzione del vettore B è determinata dalla regola del cavatappi.
Quindi, la forza agente sulla carica è diretta verso il conduttore ed
è uguale a
F __ qVjvT 1 21gV
2nr 4 jc80c2 r

La corrente si può esprimere mediante la velocità V- degli elet­


troni di conduzione, la loro densità e l ’ area della sezione trasversale Si
I — jS = p_z
da cui
q p Vu __ q p+S V2
(6.52)
2n s0 r c2 2tts0 r c2 ’

dove si assume per semplicità che le velocità degli elettroni nel me­
tallo e della carica q siano uguali, cioè V — v_.
Ora consideriamo la stessa situazione nel riferimento K r. La cari­
ca q e gli elettroni di conduzione sono fermi nel riferimento
Questa volta, però, le cariche connesse con il conduttore, la cui den­
sità è p+ si muovono rispetto alla carica q. Esse inducono un certo’
campo magnetico B\ ma questo non agisce più sulla carica q, in quanto*
essa è ferma nel riferimento K f. Da ciò è chiaro che nel riferimento K r
deve comparire un campo elettrico, in quanto la carica deve essere
deviata verso l ’ asse anche in K ' . È facile capire la sua origine, in base
ai risultati ottenuti in precedenza. Gli elettroni di conduzione sono*
fermi nel riferimento K \ perciò pi = Tp_ (vedi la (6.17)). Le cariche
positive connesse al conduttore si muovono con velocità —V in K rr
perciò pi = Tp+ (le cariche erano ferme in K). La densità di carica
risultante p' è uguale a pi +• pi nel riferimento K' e, di conseguenza*
p' = p-/r + rp+ = p+ ( r —i/r) = rp+£ 2,
dove vale la relazione p+ = —p_; questa equazione coincide con la
(6.24). Di conseguenza un conduttore in moto si carica positivamente
con densità volumetrica ph Ma il campo elettrico di un cilindro uni­
formemente carico è noto dall’ elettrodin amica. Esso giace nei piani
perpendicolari all’ asse del cilindro ed è orientato lungo i raggi che
partono dall’ asse del cilindro. La sua densità è
F/ _ p s __
2Jie0r 2jis0r 0

Questo implica che la forza che agisce su una carica negativa q


è diretta verso il conduttore, e la sua intensità nel riferimento K r
è uguale a
F r = qE f = g P+^ r B 2.
2jtsq r
Confrontando questo risultato con la (6.52), vediamo che nell’ ap­
prossimazione non relativistica queste forze sono uguali ( f ~ 1 ).

191
Ricordando che le forze si trasformano secondo la (5.34), si vede che
■entrambi i modi di descrizione del fenomeno osservato danno ri-
saltati identici per qualsiasi velocità V. I risultati riguardanti i
•campi nei riferimenti K e K ' sono spiegati nella fig. 6.4.

a)

F ig . 6.4. a) Nel riferimento K la densità di cariche p (p = p+ + p_) è uguale


a zero, mentre la densità di corrente è uguale a / =/=■ 0. Perciò, non esiste il
campo elettrico, c ’è soltanto il campo magnetico B. b) Nel riferimento K!
appare la densità delle cariche p', e la densità di corrente diventa uguale a
Il campo magnetico è uguale a Bf ; ma oltre ad esso appare un campo elettrico E\

In conclusione bisogna sottolineare che tutti i risultati, che ri­


guardano le forze esercitate da un campo elettromagnetico sulle ca­
riche volumetriche, si ottengono facilmente se la densità di forza di
Lorentz (6.49)
/ - p {E + [vB]}

è scritta in forma quadridimensionale. Per passare alla notazione


quadridimensionale, riscriviamo la componente x della forza di
Lorentz come segue:

/* = / i = p E x + PVyBz - p v zB y =
F12
- ( - J ì - ) ,F ì + S2 c ‘ Ss c )

’■— (i71252 + ^1353+ F — — F iksk.

In questa catena di equazioni si tiene conto delle seguenti relazioni:

P— c ^45 PPy — ^2? P^z ^3?

o Flz O __ Fi3 w _ A
- t t y ----------------- — ì r il —

Espressioni analoghe si ottengono per f y = / 2 e / z = / 3. Quindi è


chiaro che il quadrivettore della densità di forza che agisce su una

carica in un campo elettromagnetico, che denotiamo con /, ha le
192
componenti 1*

ft — ~ ^ tksh
(6.53)

Abbiamo già puntualizzato come sia relativa la suddivisione nelle


parti pE e p [vB] delle forze agenti sulla carica da parte dei campi
elettrico e magnetico. Entrambe queste forze costituiscono un tutt’ uno
e si fondono in modo naturale in una singola espressione quadridi­
mensionale (6.53).
Come abbiamo visto, le prime tre componenti della densità con­
ducono all’equazione tridimensionale convenzionale (6.49). Trovia­
mo ora la quarta componente:

fk = F 4hsk\= — {F41*1 + F 42S2 + F 43s 3) (vE),

La grandezza p [vE\ ha un significato che si comprende subito


moltiplicando scalarmente ambo i membri della (6.49) per v. Con­
siderando che [vB] v — 0, si ha
C/17) = p

Il primo membro dell7ultima equazione rappresenta la potenza


della forza di Lorentz per unità di volume (le forze agenti da parte
del campo magnetico non fanno lavoro):

(w .

Perciò abbiamo ottenuto il vettore densità della quadriforza le


cui componenti si possono scrivere come segue:
(7i h h h >
, , , V. (6.54)
^ fy fz ~ j

Consideriamo la forza esercitata da un campo elettromagnetico


sull7unità di volume che contiene la carica p0 nel riferimento K°
—►
comovente con la carica. Perciò / (p0£ ", 0). Passando ad un altro
sistema di riferimento K , otteniamo

h = fv /2= r u = r/', /4= -iBr/;=


Si sono espresse le equazioni della densità di forza nel riferi­
mento K mediante i campi del riferimento K r. Naturalmente una
densità di forza si esprime in termini delle grandezze riferite al rife­
rimento in cui si determina la densità di forza. Facendo uso delle

1 Vogliamo che il lettore non dimentichi che la lettera F con due indici
inferiori rappresenta la componente del tensore f. Le componenti della densità
dellaj[quadriforza hanno un solo indice. -

193
(6.17) e (6.36), otteniamo / (p (E + IVB]), i/cp (Ev)) per le velocità
non relativistiche (trascurando i termini V2!c2).
In conclusione riscriviamo Vequazione del moto della particella!
carica in forma quadridimensionale:
(6.55),

§ 6.7. Covarianza del sistema


di equazioni di Maxwell
Le equazioni di Maxwell definiscono nel modo più adeguato il com­
portamento di un campo elettromagnetico. Esse furono proposte*
molto prima della scoperta della teoria della relatività e sicura­
mente prima dell’ identificazione delle trasformazioni di Lorentz.
Secondo il principio di relatività, l ’ aspetto delle equazioni di Max­
well, deve rimanere costante in tutti i sistemi di riferimento iner­
ziali. Di conseguenza, le equazioni di Maxwell devono essere cova­
rianti rispetto alle trasformazioni di Lorentz. Risulta che il sistemai
di equazioni di Maxwell nella forma proposta dal suo creatore sod­
disfa queste condizioni. Per rendersene conto, bisogna riscrivere in
forma quadridimensionale il sistema delle equazioni di Maxwell,
scritto solitamente in forma tridimensionale. Ci occuperemo proprio-
di questo. Il sistema delle equazioni di Maxwell, come abbiamo visto,,
ha la forma seguente:

rotiT = 7 + © , (a) div D = p; (b) (6.56)

rot E = — B , (a) div B — 0. (b) (6.57)

Abbiamo diviso le equazioni in due righe, combinando le equazioni


per i valori medi dei campi elettrico E e magnetico B e le equazioni
per i vettori ausiliari H e D.
Per ottenere le equazioni (6.56) e (6.57) in forma quadridimen­
sionale abbiamo bisogno dei tensori (6.29a) e (6.31); faremo anche-
uso della definizione del quadrivettore densità di corrente (6.12a).
Comunque, per il futuro va notato che, nel vuoto, i tensori g e f
sono legati dalla relazione

(6.58)

Naturalmente, le equazioni (6.56) si esprimono anche mediante il


tensore (6.31), mentre le equazioni (6.57) mediante il tensore (6.29a).
Consideriamo la componente x dell’ equazione (6.56a):

(6.59)

Ricordando che, secondo la (6/12a), j x = s1 ed usando la prima riga


della (6.31) insieme alle definizioni x t = x, x 2 = y, x 3 — z, xk — ict,

194
dfi3 dfi 3 df14 s
riscriviamo la (6.59) come dx 2 dx3 dx± 1‘ Le altre due
componenti hanno espressioni simili che si possono scrivere in
forma generale (i — 1, 2, 3):
(6.60)
dxh

dove la somma si effettua su k che va da 1 a 4. Si vede facilmente


che, quando i — 4, otteniamo la (6.56b). Perciò le equazioni (6.56)
si riscrivono nella forma della (6.60), ma in termini delle componenti
(6.31) del quadritensore.
Consideriamo ora le quattro equazioni (6.57). Per esempio, la
componente x della (6.57a) si può scrivere

B x + ^ — ^ = 0. (6.61)

Ritornando al tensore (6.29a), si può riscrivere la (6.61) come


segue:
d^23 - , (
dx«
-)=°. (6.62)
i( dxo
Non è difficile notare che i termini consecutivi nella (6.62) si otten­
gono con una permutazione ciclica dei tre indici in ciascun termine
precedente. La struttura dell’ equazione (6.62), comunque, diventa
evidente se introduciamo il tensore F*h che è duale del tensore F ih
(vedi Appendice I, § 6):

Fih — - ^ e iìilmF Imi (6.63)

dove eihìm è un quadritensore unitario completamente antisimme­


trico di rango quattro. Si può vedere facilmente che il tensore duale
F*k differisce dal tensore F ih solo per la permutazione delle compo­
nenti delle parti reale e immaginaria:
B, - — i S* = ( — iE, cB) (6.64)
ovvero, scritto per esteso,
teso,
0 — iE z iEy
iE z 0 — iE xcBy \
Ftk = (6.65)
— iE y iE x 0 1
— cBx — CBy — cB z 0 /

Usando questo tensore, la coppia di equazioni di Maxwell (6.57)


si può riscrivere in forma quadridimensionale come segue:
Wtk 0
: . ( 6 . 66)
dxk

Assicuriamoci che la (6.66) corrisponda alle quattro equazioni (6.57).

195
L ’ equazione (6.66) contiene quattro equazioni (i = i, 2, 3, 4).
Consideriamo, ad esempio» V equazione per i — i :
d
J jh __ afft .
da'fe daq 1 dx$
dF?t _ * °E Z ii dEv | d(cB x ) q
dxA * dy 1■ *' dz d(ict)
o, in altri termini,
dEz Q «
jf-. cioè (rot ff)x = — {B

L ’ equazione (6.66) contiene le altre due componenti dell’ equazione


rot E = —B per i — 2, 3. Per
jìk
d _ ££|i .
diq ‘ dx2
_-££*£-== ' 3(c£*) gtegyj d{cBz) _ Q.
dx4 ^.-r dy dz ?

otteniamo Vequazione (6.57b): div B — 0. Dunque, la (6.66) com­


prende le equazioni di Maxwell (6.57).
Spesso le equazioni (6.57) si esprimono direttamente mediante il
tensore F ik. Mostriamo questa espressione che ci sarà utile in se­
guito. Le equazioni di Maxwell (6.57) possono essere entrambe scrit­
te nella forma (6.66) e come un’ equazione del tipo ottenuto nella
( 6 . 22):
dF ik . dFki , dru _ q
dx-i ~ dxf ~ dxh (6.67)

J\Ton ci sono sommatorie nell’ equazione (6.67). Dei quattro valori


possibili degli indici i, k, l si devono scegliere tre valori differenti
(il lettore si può assicurare che se due di questi sono presi uguali,
allora, tenendo conto dell’ asimmetria del tensore §r (F ih — ~ F hi),
l ’ equazione (6.67) si trasforma in un’ identità). La struttura della
(6.67) mostra che non è importante la distribuzione della terna dei
numeri scelti tra gli indici i, k, l. Questo implica che la (6.67) con­
tiene di fatto diverse equazioni indipendenti, il cui numero è uguale
al numero delle combinazioni possibili, ciascuna contenente tre in­
dici, ottenibili dalla collezione di quattro indici, cioè C\ = C\ = 4.
Il lettore si assicuri che le quattro equazioni (6.57) si ottengono dal­
la (6.67).
Ora si può dimostrare facilmente che le equazioni di Maxwell
sono covarianti. Abbiamo visto che si possono scrivere come le (6.60),
(6.66) o (6.60), (6.67). Ma le (6.60) e (6.66) rappresentano le relazioni
fra quadrivettori in quanto l ’ espressione dfik/dxh è un vettore (vedi
Appendice I, § 5). La (6.60) differisce dalla (6.66) per il vettore zero
che figura nel secondo membro della (6.66). Circa la (6.67), questa
relazióne si presenta esplicitamente in forma tensoriale ed è, di
conseguenza, covariante. Perciò, la stessa notazione quadridimen­
sionale delle equazioni di Maxwell indica la loro covarianza.
IPsistema delle equazioni di Maxwell non si limita alle equazioni
(6.56) e (6.57). Abbiamo già citato la legge di conservazione della
carica in forma covariante (vedi pag. 174). Ci resta da riscrivere le
« equazioni materiali » in forma covariante.

§ 6.8. Equazioni di Minkowski per un


mezzo in movimento (trasformazione
delle equazioni materiali)
Nel paragrafo precedente abbiamo visto che il sistema delle equa­
zioni di Maxwell (6.56) e (6.57) mantiene il suo aspetto in tutti i
riferimenti inerziali. Comunque, le equazioni di Maxwell forniscono
un quadro non ambiguo dèi fenomeni elettromagnetici solo se sono
specificate le equazioni materiali, che caratterizzano il mezzo in
cui avvengono i fenomeni elettromagnetici. Come al solito, chia­
miamo comovente il riferimento in cui il mezzo (o una sua parte)
è in quiete. Nel caso di un mezzo uniforme ed isòtropo le equazioni
materiali hanno nel riferimento comovente la seguente forma:
D' = &E', (6.68)
B' == |xH’ , (6.69)
r= aE \ (6.70)
dove la costante dielettrica e, la permeabilità magnetica p e la
conduttività a sono costanti. Consideriamo il moto di un mezzo
rispetto al riferimento del « laboratorio ». Nel riferimento como­
vente col mezzo sono valide le equazioni di Maxwell per un mezzo
stazionario. In virtù del principio di relatività, le costanti della
materia 8, p, cr devono essere le stesse sia per un mezzo stazionario
nel riferimento del « laboratorio », sia nel riferimento comovente
col mezzo. Dato che si conoscono le equazioni di trasformazione dei
vettori E, B, H e D, si può trovare la relazione tra di essi in ogni
altro riferimento inerziale diverso da K*. Scriviamo le equazioni di
trasformazione necessarie, dividendole in parti longitudinale e
trasversale (rispetto alla velocità V del riferimento) (vedi § 6.4):
E \ = ( E + [ V B ] ) ||, E'X = T ( E + [ V B ] ) X-, (6.71)

B'X = T ( B - ± [ V E ] ) ± (6.71')

i> l= r (z > + U [r a ]}^ ; (6.72)


H ’t - m - l V D ) ) , , H'X = T ( H ~ [ V D ] ) X. (6.73)
Ricordiamo ancora una volta che tutte le espressioni del tipo
IVA] || sono uguali a zero per ogni A in quanto stiamo considerando
la proiezione sulla direzione della velocità, e il prodotto vettoriale

197
è perpendicolare alla velocità V. Se si sostituiscono nelle (6 .68 ) e
(6.69) le espressioni corrispondenti, otteniamo un’espressione iden­
tica per entrambe le componenti (longitudinale e trasversale) in
cui si cancella il fattore V. Queste relazioni si possono combinare
come segue:

D + - L [ V H ] = b (E + [VB]), (6.74)

B - ± - [ V E ] = V,{H-[VD])(6.75)

Le equazioni (6.74) e (6.75) sono dette equazioni di Minkowski;


8 e |x die compaiono in queste equazioni, rappresentano la costante
dielettrica e la permeabilità magnetica del mezzo a riposo. Queste
equazioni differiscono essenzialmente dalle (6 .68) e (6.69) in quanto
coinvolgono simultaneamente tutti e quattro i vettori campo. Usan­
do la (6.75) si può eliminare con facilità B dalla (6.74) ed ottenere
un’ equazione per i tre vettori E, D e H, oppure si elimina D dalla
(6.75) utilizzando la (6.74).
Queste equazioni sembrano più semplici se poste separatamente
in termini delle componenti longitudinali e trasversali:
D \|=-sZ? [i, B\\ = \xH [], (6.76)

( 1- tS t
-? ) u- - 6 (■
1- ÌJ -) ^ + ( ' ! * - w . ) IF »1 -
(6.77)
( * i- S t - 1* ( 1 - -p - ) + ('"r ~

La prima uguaglianza della (6.77) si ottiene dalla (6.74) sosti­


tuendovi l ’ espressione di B dalla (6.75) e prendendo soltanto la com­
ponente trasversale della relazione ottenuta (nello stesso modo si
ottiene la seconda uguaglianza della (6.77)).
Si vede da queste equazioni che se nel riferimento comovente K'
i vettori B ed H , così come D ed E, coincidono in direzione per un
mezzo isotropo, ciò non accade in un altro sistema di riferimento.
Naturalmente, quando si esamina il moto di un mezzo, il caso
più interessante è quello di velocità non relativistiche. Quindi se
nella (6.77) si trascurano i termini V2/c2 e n2V2/c2 rispetto all’ unità
(n = ] / ejLi/e0p 0 è l ’ indice di rifrazione del mezzo, vedi capitolo
VII), le formule (6.76) prendono una forma più semplice:

D = eE + i-*n
)(±
. (6.78)
B = ]iH + - ! - ( » * - 1 ) [VE] .

Questa forma delle equazioni materiali scritte per un mezzo in mo­


vimento viene usata molto frequentemente. Data l ’ equivalenza
di tutti i SRI nel vuoto le ultime relazioni si trasformano nelle
(6 .68 ) e (6.69).

198
È utile riscrivere le equazioni materiali (6.68)-(6.70) nella forma
d i tensore quadridimensionale. Non deriveremo queste equazioni,
le scriveremo per controllare se riotteniamo le (6.68)-(6.70) nel rife­
rimento in cui il mezzo è in quiete. Introduciamo la velocità quadri-

dimensionale V (TV, icT) del mezzo; T viene scritto in quanto si
assume che la velocità del corpo o del mezzo V sia uguale a quella
del riferimento K ' . Nel riferimento comovente K' la quadrivelocità
F ' ha le componenti U[ = 0, U' = 0 , U'3 = 0, U'± = ic.
Il lettore può facilmente verificare che le equazioni tensoriali

(6.79)

(6.81)

portano alle (6 .68 ), (6.69) e (6.70), rispettivamente, se si sostitui­


scono in esse le componenti di V'.
Nelle equazioni (6.79) e (6.80) la somma è eseguita su k. Il nu­
mero totale di equazioni è 4, ma poiché per i — 4 otteniamo un’ iden­
tità, in pratica ci sono soltanto tre equazioni. N ell 1equazione (6.80)
bisogna trovare il numero delle possibili combinazioni di i, k, l
che si possono formare dai valori 1, 2, 3, 4 presi a tre alla volta.
Questo numero è uguale a C\ = 4 , ma poiché la combinazione 1, 2, 3
fornisce un’ identità, ritroviamo ancora una volta le tre equazioni.
Dopo aver derivato le espressioni corrette per le equazioni materiali
nel riferimento K ' , ci convinciamo che la notazione tensoriale è
corretta.
Illustriamo un’ applicazione della notazione tensoriale con l ’ esem­
pio della relazione (6.81). Supponiamo che in un riferimento como­
vente K r (in cui il mezzo è a riposo) esista la densità di corrente e la
densità di carica sia uguale a zero, cioè s\ (/', / ', j'3, 0). La velocità
del mezzo nel riferimento IC è uguale a V' (0, 0, 0, ic). Diamo le
componenti di s\:

c i o è / ' = ai?'; cosi co m e /' = oE'2, / 3 = oE'd. La quarta componente è

a
F'ikU'h^ 0 (s't = tcp' = 0 , = 0).

199
Ma nel sistema eli riferimento rispetto al quale il mezzo è in moto si
ha
.«i = ± F ihUk = ± ( F i2U2 + F ÌSUs + F M =

= — ( — iE x) ter =

*2 = - 7 - FtkUu = -2 - (F2iU1+

= -T ( - c 5 3r F + ( - i£ „ ) icD = o r { £ v + [F I?],},
S3 = a r { ^ z + [F S ]Z}
da cui
U1 = TF, e72 - U3 = 0, - icF.
Il risultato finale è ovvio:
/ = crF (E + [F 5 ]).’ (6.82)
Il suo significato è piuttosto chiaro: la densità di corrente in un mezzo
con conduttività a è determinata dall 7intensità del campo elettrico
nel mezzo, la quale, secondo la (6.41), è proprio un fattore di a, po­
nendo r ~ 1 .
La quarta equazione definisce la densità di carica associata alla
corrente di conduzione:

s4 = tepoond = ~ F \hÙk= ± - (
0

in pieno accordo con la (6.24).


Vale la pena di considerare la legge di Ohm per un mezzo in moto,
cioè l ’ equazione materiale (6.70). Vedremo che la corrente di
convezione pv e la corrente di conduzione sono intimamente connesse,
come diventerà ovvio quando si combinerà j e icp in un unico quadri-
vettore. La differenza tra una corrente di convezione e una di condu­
zione sta nella scelta del sistema di riferimento. Perciò è naturale
che entrambe inducano un campo magnetico.
Assumeremo che la corrente di conduzione rappresenti il moto
delle cariche rispetto al mezzo, mentre la corrente di convezione sia
dovuta alla presenza di cariche nel mezzo dovute al moto di questo
mezzo.
Supponiamo che in un certo riferimento K' ci sia una corrente di
conduzione / ' = - o E ' e, inoltre, una densità di carica p'. Queste
quantità costituiscono insieme la quadricorrente che si può tra­
sportare in qualsiasi sistema di riferimento mediante la (6.15a).
Dopo aver espresso le componenti di j e la densità p mediante j ' é
p' nel riferimento K \ otteniamo
;.%•= r ( ; i — F p'), U = ìy,

200
Si vede dalla prima formula della (6.84) chela corrente di conduzione»
j x incorpora una corrente convettiva PFp' — Fp e perciò non è più
proporzionale a a. Ciò è un inconveniente, in quanto per o = 0
la corrente di conduzione deve annullarsi. Come si può d istin gu er
la corrente di conduzione nel caso generale? Per far ciò, ricordiamo
che se nel riferimento K ' c ’ è una densità di carica p' = p0 si ottiene
una densità di quadricorrente in ogni altro riferimento K (vedi la<
( 6. 20))
(con v)
ài P^i , (6.85)*
dove Ui è la quadrivelocità della carica. Questa corrente deve essere*
chiamata corrente di convezione; in accordo a ciò, st nella (6.85)»
viene indicata con la scritta (conv). Supponiamo di avere una qua­
dricorrente le cui componenti sono e vogliamo rappresentarla;
come somma della corrente di conduzione e di quella di convezione.;
—> —'-y
Prima di tutto esprimiamo p0 mediante s e V. Moltiplicando entram­
bi i membri dell’ equazione st = p0n^ per le componenti di ut corri­
spondenti e sommando, otteniamo skuk = p0u|; ma secondo la-
(5.7) ul = —c2 così si ha

Po= — . (6.86),

Di conseguenza, la corrente di convezione si può mettere nella forma?


g(oonv)= _ J ^ _ u^ -(6.87)*

Per ottenere le componenti della quadricorrente di conduzione biso­


gna sottrarre da s, le componenti della (6.87):
(con d ) _ _ (c o n v ) __ SkUh ut. ( 6 . 88),'
-- òi C2

D ’ altra parte, secondo la (6.81) la grandezza s^conv) si può mettere


nella forma
^cond) _ Fihuk
-(6.89>

Uguagliando le due espressioni, otteniamo .

= F * u h.(6.90 >

Utilizzando le definizioni 5 (/x, j yy j Zì icp), V (yvx,yvy, yvz, icy), si


ha

t + T 2o ( JS ~ p ) = o r Y { j B . + [DB]} (6.91).

in forma tridimensionale.
Separiamo nell’ equazione (6.91) i termini proporzionali alla*
conduttività o. Per questo moltiplichiamo per v entrambi i membri
'della (6.91). Introducendo le notazioni abituali y e p, otteniamo

jv ____ n =
_______P I £
c- y2 ' c2 y
(6.92)

.Sostituendo la (6.92) nella (6.91), otteniamo facilmente

oy[ e [F£] - (E v )} . (6.93)

Perciò il termine « corrente di conduzione » può essere attribuito


alla grandezza 7 (cond) ~ j — pr>. Il campo cbe si manifesta in una
costanza in moto rispetto al sistema di riferimento ò spesso indicato
-con E*
E* = E + [VBÌ. (6.94)
'Quindi la (6.93) si può riscrivere nella seguente forma:

/<cond) = a 7 { £ * - - ^ r ( £ * i > ) } . (6.95)

Questa formula assomiglia molto all’ equazione (5.35) della tra­


sformazione della forza. Per completare il passaggio alle equazioni
delPelettrodinamica dei mezzi in moto, bisogna trovare il modo di
-descrivere le condizioni al contorno nel caso in cui si muove la su­
perficie di separazione del mezzo. La condizione di continuità per
le componenti normali dell’ induzione si ricava dalle equazioni
-div D — 0 e div B — 0, che, secondo le (6.66) e (6.60) mantengono
.la loro forma nel passaggio da un sistema di riferimento ad un altro.
Perciò, sulla superficie di separazione si ha
Dui= D nt, = (6.96)
Esaminiamo ora le condizioni al contorno per le componenti
tangenziali delle intensità di campo. Consideriamo prima un sistema
di riferimento K' comovente con la superficie di separazione, otte­
niamo la condizione di continuità per le componenti tangenziali di
.E' e H' in questo riferimento. Ma in termini del riferimento K,
rispetto a cui la superficie di separazione si muove con velocità u , i
-campi E ed H prendono la seguente forma (vedi le (6.41) e (6.43)):
E' — E + [uB], IE = H — [uD]. (6.97)

Tracciamo la perpendicolare n al piano di separazione ed indichiamo


con un la proiezione della velocità u su questa perpendicolare. Tro­
viamo le proiezioni della (6.97) sul piano perpendicolare ad n. Ricor­
dando che [nEÌ — [n, È n + E t] — [nEt], scriviamo l ’ equazione
.Eh = E't2 come [nE'tl] = [nE[2\, cioè
[nEh + [n [uBJ] = [nE2] + [n [uB2]]

•202
[n i E 2— E j] — u (n ( B 1 — B2)) + (^2 — Ei) ( un ) .
Poiché, secondo la (6.96), nBx = nB2, otteniamo finalmente
[7z, £ 2 - 5 1] = un (JB2 - B 1), (6.98)
e analogamente
pF t f 2 — # *] = — un {D2 — D i). (6.99)
-Queste equazioni, insieme con la (6.96), costituiscono le condizioni
al contorno per i vettori di campo.

§ 6.9. Trasformazione dei momenti


elettrico e magnetico
Se si combina un momento elettrico P ed uno magnetico M in un
singolo tensore antisimmetrico (6.33), possiamo scrivere immediata­
mente le equazioni di trasformazione per le componenti di queste
•grandezze.
Denotiamo rispettivamente con P° e M° la polarizzazione e la
magnetizzazione determinate in un riferimento comovente con la
sostanza. Perciò un osservatore rispetto a cui la sostanza si muove
non velocità V otterrà
M x= ML M y = T (M l + VPV) , M z = T (MI - VPy) ,
/ v \ { v \ (6.100)
P X= PL py= r ( p i — ^M°), p z= t ( p i - ^ m i ) .

'Queste equazioni chiariscono subito la relazione tra i vettori tridi­


mensionali P e M introdotti in precedenza. Si possono ripetere in
•questo caso le considerazioni fatte per la relazione fra i campi elet­
trico e magnetico. Di solito, la magnetizzazione è sempre accompa­
gnata dalla polarizzazione e viceversa. P e M possono essere uguali
a zero soltanto in un sistema di coordinate particolare. Un corpo
polarizzato ma non magnetizzato si manifesta sia polarizzato che
magnetizzato in termini di un osservatore rispetto al quale il corpo
è in moto. Infatti, supponiamo che nel riferimento K ' rispetto al
quale il corpo a riposo sia
M ° - 0, P 0 (P°x,P°y, P°z)¥= 0.
Allora nel riferimento A, rispetto al quale il corpo si muove a velo­
cità F, si ha .
P X= P L Py=TP0 y, P Z= TPL
M x = 0, M y - TV P I M z = - TV Pi.
Di conseguenza, nel riferimento K si osserva la magnetizzazione del
corpo. Se il corpo si muove a velocità non relativistica cioè V ic*C 1
e P « 1
Questo effetto fu trovato sperimentalmente da Eichenwald (vedi
[13, 29]). Al contrario, se nel riferimento IV rispetto al quale il
corpo è a riposo,
P° = 0, M° (Mx, M I M Z
Q)=£ 0,
allora nel riferimento K in cui il corpo si muove con velocità V
si ha
= M y^TM l M z = YMl,
T/- T/
Px= o,

Perciò, il corpo risulta polarizzato nel riferimento K . Se il corpo si


muove a velocità non relativistica, allora

M = ,°P
M= -[M °X ],

Questo implica, per esempio, che un magnete permanente in moto


porta un momento elettrico che dà luogo al fenomeno dell’ induzione
omopolare utilizzato nell’ ingegneria elettrica.
Diamo un esempio per illustrare queste conclusioni. Supponiamo
che la densità di corrente, che finisce entro il circuito rettangolare
A B C D , sia uguale a /, ed il cir­
cuito stesso si muova con velo­
cità V rispetto al riferimento K.
Fissiamo il riferimento IV a questo
circuito (fig. 6.5). Secondo la for­
mula (6.24) compare una carica
p > 0 nel lato BC ed ima corri­
spondente carica p <2 0 nel lato
AD. Ovviamente la carica totale
che compare nel circuito ABCD
/ è uguale a zero. Nello stesso tempo
2
il circuito possiede un momento
Fig. 6.5. La comparsa di un momento elettrico diretto lungo l ’ asse y»
di dipolo in un circuito di corrente Mostreremo che un calcolo ele­
considerato in un riferimento K'
rispetto al quale il circuito si muove. mentare coinciderà con le
conclusioni della TRR. Se in
K ' non c ’ è un momento di
dipolo ma esiste soltanto la componente z di M, secondo la (6 . 10 1 )
compare in K un momento di dipolo P y — — T MI. Nel riferi­
mento IV la corrente che fluisce lungo il rettangolo ABCD possiede
un momento magnetico I S , dove il vettore S è diretto verso i valori
negativi dell’ asse z ed è uguale ad ab (a e b essendo i lati del circuito
rettangolare). Assumendo per semplicità che la sezione del condutto­
re sia uguale alFunità, si ottiene MI = — f ab. 11 momento di
dipolo elettrico che compare nel circuito non è difficile da calcolare.
Secondo la (6.24) p = r -^ -/£ , la distanza‘fra BC ed AD è uguale
a b, e la carica totale in questi lati è pa. La direzione di questo mo­
mento di dipolo coincide con quella dell’ asse y. Quindi, P y = pab —
— L abfx = come deve essere. .

§ 6*10* Alcuni problemi sulla


trasformazione del campo
elettromagnetico
Campo di una carica in moto uniforme. I campi elettrico e magnetico
di una carica in moto uniforme si trovano con facilità mediante la
trasformazione dei campi esistenti nel riferimento K ' in cui la carica
è a riposo. Se una carica elettrica puntiforme e è in quiete nel rife­
rimento K \ abbiamo a che fare con un problema elettrostatico, e
la carica produce soltanto un campo elettrico. Pero, quando la stessa
carica viene considerata in termini del riferimento K che si muove
con velocità —V rispetto a K ' , si trova che essa genera una corrente
rettilinea. Il campo magnetico indotto da una corrente rettilinea
è ben noto: le linee di forza del campo formano circonferenze, i cui
centri coincidono con la corrente; i piani di queste circonferenze sono
perpendicolari alla direzione della corrente. Naturalmente questi
risultati si deducono dalle equazioni di trasformazione del campo.
Ora, poniamo una carica elettrica all’ origine del riferimento
K r. In questo riferimento
e rf
B' = 0, Ee
4ne r '3

o, esprimendoli mediante le proiezioni sugli assi coordinati,


= 0, B ’v = 0, B ’z = 0,
t?! _ e x
■££> x
4318
/o
r '3
1

-titp7f/y e
4ne
y
r '3 ’
E'
— 4ne 7•'*
dove r'2 = x"1 _|_ y 2' z'2 Secondo la (6.36) otteniamo nel rife-
rimento K
E X= E 'X, Ey --- i ( 6 . 102)

B, --B'x = 0, B V= - T ^ E ' Z, (6.103)

Essendo B x = 0, il campo magnetico nel riferimento K si trova


nei piani perpendicolari all’ asse x, cioè perpendicolari alla direzione
della corrente. Le equazioni che descrivono le linee di forza del cam­
po magnetico hanno in K la seguente forma:
dy __ dz dlj _ By
o
dz Bz

2 05
Ma

in quanto z' — z e y' = y por le trasformazioni di Lorentz. Di con­


seguenza, l ’ equazione differenziale per le linee di forza ha la forma'
dyldz — — zty, o y dy + z dz = 0 , cioè d (y2 - f z2) — 0 , da cui è-
ovvio che si ottiene l ’ equazione della circonferenza y2 + z2 — co­
stante. Quindi le linee di forza rappresentano delle circonferenze
cui centri giacciono sull’ asse della corrente.
Sicuramente si possono trasformare oltre ai campi anche i poten­
ziali. Nel riferimento K r il potenziale scalare è uguale a

dove il potenziale vettoriale è uguale a zero: A' — 0. Se il quadripo­


tenziale O ha componenti (^A\ — q/ j nel riferimento K ' , le com­
ponenti nel riferimento K , secondo la (6.14a), hanno la forma se­
guente:

o 2 = o> ;, o>3 = <


i >;,

Sostituendo nel riferimento K ’ i valori delle componenti del


quadripotenziale, otteniamo

^ = r ( — <p' ) = r - 5 -<p', ^ 2 = o, ^3 = 0 ,
z -i-, i f
v (p = r ^ (P •
Così

A = -^r I V = - p - 9 . 9 = rcp'- • (6.104)

Ora dobbiamo esprimere r che compare in cp7me di ante le coordinate


della carica nel riferimento K . Secondo le trasformazioni di Lorentz
x 9 = T (x - Vt), y f = y , z = z, (6.105)
l ’ espressione per r'2 si può scrivere come
r / 2==^'2 + I/'2 + z/ 2 =: r 2 y t ) 2+ y2+ z2 =

= r 2 [ (.z - Vt 2) + = r 29R2, r' = HR, (6.106)

dove si è introdotta la seguente notazione:

9 ft2 = (a :_ F 0 2 + ( l - - ^ - ) ( j /2 + 22). (6-107)

206
Facendo uso della (6.107), si può esprimere il potenziale scalare-q?*.
definito dalla (6.104), mediante
1 1
q>= I V = r - 4x18 r' 4xie
e il potenziale vettoriale A si può scrivere nella forma
v i eV
A =
c2 ^ 4xte c2.;H *
Riscriviamo le espressioni per le componenti del campo E, tenendac­
conto delle (6.102), (6.105) e (6.107). Otteniamo
p _ e ( x — Vt)
x r 24^>i3 5
F — ey (6.108),
y fioretti3 ’
p ______
r24jxs:ji3 ‘
Nel riferimento K' la carica è posta nell’ origine Or (cioè nel punto»-
x = 0). Le sue coordinate nel riferimento K all’istante t saranno*-

F i g . 6 .6 . Per il calcolo dei campi elettrico e magnetico di una carica in moto­


uniforme.

le seguenti: x 0 = Vt, y 0 — 0, z0 = 0. Introduciamo un altro vettore-


B, diretto dal punto O' , dove è posta la carica, al punto d ’ osserva­
zione A le cui coordinate sono (x, y, z) (fig. 6.6). Il vettore B ha la
forma
B = (x — Vt) i + y j + zk, (6.109)
dove i , j , k sono i versori rispettivamente degli assi x, y e z. Molti­
plicando le componenti della (6.108), rispettivamente, per t, j e k
si ha
1 e E
E = E xi + E yì -j- E zk
4ji-8 r 2 s
jì3 •

Se si introduce l ’ angolo tra la direzione di moto della carica (cioè*


l ’ asse x) ed il raggio vettore i?, si ha
x — Vt = B cos O, B 2 — R 2 cos2 'd + y2 + z2
207
se,■■•di conseguenza,
z/2 -f- z2 = i?2 sin2 th (6.110)
Tenendo conto delle (6.109) e (6.110), si può riscrivere la (6.107)
'•come
5R2 = i?2 ( 1 _ I
L
.si r ^ A ) ,

dopo di che Tespressione definitiva di E' è


V2
ì'i_
—-
1 eR
(6.111)
4Jt& K\?3/z
fi-
V
La formula (6.111) rappresenta il campo elettrico di una carica
In moto espresso mediante variabili convenienti, come la distanza
R dalla carica in moto e l ’ angolo 6 formato dalla direzione del punto,
in cui si cerca il campo, e la direzione del moto della carica. La
;(6.111 ) mostra che V intensità del campo dipende dall’ angolo 6.
Per un R fissato Vintensità minima del campo corrisponde alla di­
rezione del moto della carica (6 = 0, n):
F ____n i
Il — 4jtb R2 V c2 )
ed il massimo dell’ intensità si osserva nella direzione perpendicolare
.al moto (6 ' = arc/2):

- 4 jts R 2 Y ‘Y— V2{c2


L ’ intensità del campo elettrico dipende anche dalla velocità della
^carica, con E\\ che decresce ed E ± che aumenta all’ aumentare della
velocità. Il campo elettrico di una carica in moto a velocità relativi­
stica è localizzato all’ interno di due stretti angoli solidi, le cui fron­
tiere sono determinate approssimativamente dalla relazione (F2 X
X sin2 6 /c2) « 1; Tasse di questi angoli solidi è perpendicolare alla
direzione di moto della carica.
Il campo magnetico B della carica in moto si può esprimere nel
riferimento K mediante la formula (6.44) (Bf = 0 nel riferimento
K'y.
B= V E ]. (6.112)
Quando la velocità della carica è piccola, i campi nel vuoto sono
descritti dalle seguenti relazioni approssimate:
1 eR
E--
4 jX8v> R'à

1 e [F i?] _ pò [ eV R ]
jC2 R* 4n Rs 8
(6.113)

L ’ espressione (6.113) rappresenta la legge di Riot-Savart.

208
. Interazione di due cartelle in moto. Prendiamo due cariche et
ed e2 che si muovono parallelamente con la stessa velocità V . De­
terminiamo la forza di interazione fra di esse nel sistema di riferi­
mento K rispetto al quale sono in moto. Prima troviamo la forza
agente sulla carica e1.
La carica e1 subisce Fazione di campi magnetico ed elettrico in­
dotti dalla carica e2. La forza che agisce sulla carica e1 è la forza di
Lorentz: F1 = e1 {E 2 + [VB2]}. Tenendo conto della (6,112) si può
scrivere
P1 rT/- r¥r z? n T7 /TH
*' — I* ir ii/2J] &2)---- r "i*2==

= e l ( l - ^ r ) E 2 + ^ V ( V E 2). (6.114)

I£2 si può trovare dalla (6,111) in cui R è assunto come raggio


vettore tracciato dalla carica e2 ad e1 e # è Fangolo tra 1? e la dire­
zione della velocità F delle cariche. Sostituendo la (6.111) nella
(6.114), otteniamo
( V 2 \ 2^

p . = Jhfi
& A -rr*?J-
4neil3 ( l _ l i s i n a ) 3/2

e^^VV cos 0 |
)3/2
45T&c22?2 j

1—
F2 [3/2
sin2 0
(* -
da cui la componente lungo la direzione del moto è
( l ----cos ■&
el g2
Fx 4Jtei?2 T/2 \ 3/2
sin2 0 J

e quella perpendicolare al moto


F2
sin ‘O'
lg2 (* - (6.115)
4jcei?2 F2 >3/2
sin2 O’
l 1-
Supponiamo che le cariche siano poste su una retta parallela
all’ asse z/, con una delle cariche posta sull’ asse x f in modo che la
distanza tra le cariche è y. A llo ra # — jt /2, F x = 0, e
el*2 (6.116)
4jtgy2 / ‘ ~ 5 -
209
Quest’ equazione si può ottenere in modo semplice. Nel riferi­
mento K\ dove le due cariche sono in quiete, l ’ interazione fra di esse
è di natura elettrostatica e la forza è uguale a e^JAn&y2. La tra­
sformazione di questa forza nel passaggio dal riferimento K r a quello
K mediante le formule (5.35) conduce alla (6.116). Secondo quest’ul­
tima le cariche si respingono nel riferimento K. Ma nel riferimento
K le cariche si muovono producendo due correnti parallele che fluisco­
no nella stessa direzione. Quando tali correnti fluiscono lungo dei
conduttori, si attraggono l ’un l ’ altra. Non c ’ è contraddizione in
questo caso in quanto le situazioni fisiche sono differenti. Conside­
riamo l ’ espressione per la forza (6.116) nel vuoto nel caso di velo­
cità non relativistiche V :

e le2
4ne0y2 (* V2
2c2
I \_ e ±e2
e0i/2
fifa V2
4 jiy 2 * 0 2 *
(6.117)

D ’ altra parte, secondo Ampère, la forza d’ interazione tra due ele­


menti di corrente etV ed e2V nel vuoto si può scrivere

j? _ ho -^]] M'0gl g2 IV __ hogl g2 T /2 ^


12 “ 4Jt i?3 4xt R3 4xr, Rò *

Tenendo presente che R = yj\ otteniamo infine

hogl e2 T72 (6.118)


4 = 4 /2
jxz

La forza (6.117), osservata nel riferimento K rispetto al quale le


cariche sono in moto, consiste della repulsione di Coulomb e dell’ at­
trazione di Ampère, a meno di un fattore 1/2. L ’ espressione ottenuta
per la forza (6.117) si può usare per spiegare le interazioni della cor­
rente nei conduttori con alcune precisazioni. Conduttori percorsi
da una corrente neutra possono attirarsi in queste condizioni. Co­
munque, un conduttore percorso da corrente è neutro soltanto in un
sistema di riferimento (§ 6 . 1 ). È per questo che la repulsione di
Coulomb deve essere considerata. Malgrado ciò, essa risulta usual­
mente più debole dell’ attrazione.

§ 6.11. Tensore energia-impulso-


tensione del campo elettromagnetico
nel vuoto

Il passaggio alle grandezze quadridimensionali mette insieme gran­


dezze le cui relazioni non sono percettibili nel quadro tridimensionale.
Nel caso di una particella libera un quadrivettore mette insieme
energia ed impulso. I campi elettrico e magnetico costituiscono nel
quadrispazio il tensore del campo elettromagnetico. L ’ energia e
l ’ impulso del campo elettromagnetico sono le componenti di un
tensore che, oltre all’ energia (uno scalare nel caso tridimensionale)

210
e l ’ impulso (un vettore tridimensionale), comprende anche il ten­
sore delle tensioni tridimensionale di Maxwell. Adesso vedremo i
risultati della teoria di Maxwell nella forma tridimensionale.
1. Legge di conservazione d ell’energia per le cariche ed il campo.
Questa legge segue direttamente dalle equazioni di Maxwell: molti­
plicando scalarmente la (6.56a) per E e la (6.57a) per H e sottraendo
le espressioni così ottenute, abbiamo

H rot E — E rot II = — jE — DE — BH.


Facendo uso delle seguenti identità II rot E — E rot H = div [EH]
e dldt (jED -+ DII) = 2 (DE + BH) (l’ultima è valida per un mezzo
isotropo in cui D = &E, B = \jlH), otteniamo

da cui, dopo integrazione sul volume arbitrario ed usando il teo­


rema di Gauss-Ostrogradskij, arriviamo a

-^ = — j jE (6.119)
^ s
Il primo membro della (6.119) rappresenta la variazione term
por ale dell’ energia del campo elettromagnetico nel volume TT. Quest’ e­
nergia è definita nella teoria di Maxwell mediante la densità d’ ener­
gia (l’ energia per unità di volume) ' :
w =

integrando sul volume:


( 6 . 121)
cj/Q\

Consideriamo il caso più semplice di cariche nel.vuoto. In questo


caso j = pi?, mentre la densità della forza agente su queste cariche,
cioè la densità della forza di Lorentz, è
/ L= p (E+ [vB]) = p .
Questa forza viene introdotta nella teoria per correlare la teoria del
campo con il campo delle forze che agisce sui corpi carichi collocati
nel campo. Nell’uguaglianza (6.119) figura l ’ espressione jE. Mol­
tiplicando scalarmente la (6.122) per v, otteniamo f L v = pEv = jE.
Perciò, uno dei termini del secondo membro rappresenta il lavoro
fatto dal campo in questo caso sulla carica. Secondo la legge di con­
servazione dell’ energia questo lavoro deve tramutarsi in energia ci­
netica T delle particelle. Di conseguenza,
( ]EdT j f hv d T =
<j/D \

211;
11 secóndo termine del secondo membro della (6.119) rappresenta
il vettore di Poynting
5 = [EH], (6.124)
mentre V integrale stesso rappresenta il flusso del vettore S attraverso
la superficie che racchiude il volume V\ L ’ integrando include anche
dS = n d S 1 il prodotto di una superficie di area dS per il vettore
unitario della sua normale n. Quindi la legge di conservazione del-
l ’ energia per le cariche ed il campo si può scrivere come segue:
(T + W) = ■
— y S dS. (6.125)
s
lì vettore di Poynting (6.124) viene interpretato normalmente
come il flusso d’ energia per unità di tempo attraverso un’ area uni­
taria orientata normalmente rispetto al vettore di Poynting. Una
tale interpretazione non deriva necessariamente dalle equazioni
di Maxwell. La conseguenza diretta delle equazioni di Maxwell è
la relazione integrale (6.119) che si può considerare come la legge
di conservazione dell’ energia. È chiaro che ogni vettore S' che si
aggiunge al vettore di Poynting S e che soddisfa la relazione div S' =
= '0 non modifica la relazione (6.119). L ’ interpretazione gene­
ralmente accettata, comunque, è confermata dagli esperimenti.
2. Legge di conservazione dell'Impulso per le cartelle ed il cam­
po. La legge di conservazione dell’ impulso si può trattare come se­
gue. Moltiplicando vettorialmente la (6.56a) per B e la (6 .57a) per B ,
e sommando le equazioni ottenute termine a termine, otteniamo

p [H rot H] + &[E rot E] = — [jB] + su [HE] — sp [EH] .


Si è tenuto conto che D ~ &E e B = p/ 1 ; infine,

l i [ H r o t H ] + e [ E r o t E ] = — [jB] — (6.126)

Facciamo uso deli’ identità vettoriale

a div a — [a rot a] ( a a% — p « P av) m&-

Sottraendo rispettivamente il primo e il secondo membro della (6.126)


dall’ identità
pH div II + sE div E = pE
(vedi le (6.56b) e (6.57b)), otteniamo l ’ equazione final©
( e E aE fi + VLHaH» + 6afi ± E ! + E £ L j =

n
thè sì può riscrivere nella forma

= + 4 ]6( .1 2 7 )
B
[D

212
dove s'introduce il tensore di Maxwell delle tensioni
^ap = Sap!£? = E aD$ - p E aB p «ar» (6.128)
Il tensore (6.128), simmetrico nel vuoto e nei mezzi isotropi, è
asimmetrico nei mezzi anisotropi, dove è definito secondo F ultima
eguaglianza della (6.128). Integrando su un volume arbitrario nel
dominio dove esiste il campo elettromagnetico, otteniamo

j J g - m i d r = | f L d r + -^r \
T (6.129)

Nella (6.127) si assume ancora di avere cariche libere nel vuoto


soggette alla forza di Lorentz (6.122).
Dalla seconda legge di Newton si ha
]fd T = d
*(6.130)
4® 8
dove P è Fimpulso delle cariche racchiuse nel v o lu m e ^ . L'integrale
sul volume che compare nel primo membro della (6.129) si trasforma
in un integrale esteso alla superficie che contiene il volume Y :

I

- l ^ r mv d r =
a s
§
Le espressioni
Ta$nam$ dS
rappresentano una forza che agisce su una superficie infinitesima
dS le cui componenti normali sono na. I vettori m p sono versori del
sistema di coordinate cartesiano. Potremmo già scrivere la legge di
conservazione dell’ impulso se conoscessimo quello che si considera
l ’ impulso del campo elettromagnetico nella sostanza, Perciò limitia­
moci al caso nel vuoto, dove [DB] — (1 le2) [EH] = S/c2. Quindi
tenendo conto delle (6.130) e (6.131), la (6.129) si può riscrivere

4 (i> + G) = § r o3 nam&d
(S
, 6.132)
s
avendo definito la densità dell’ impulso del campo nel vuoto g come
g = S/c2 (6.133)
e, quindi, Fimpulso del campo nel volume Y come

<?=j gdT

La relazione (6.132) e la definizione (6.133) esprimono la legge


di conservazione dell’ impulso. Per un campo completo, quando sulla
superficie di frontiera Ta $ — 0, otteniamo la legge di conservazione
(d/dt) (P + G) — 0. Il tensore T a $ non è definito in modo univoco:

213
le equazioni di Maxwell danno soltanto l ’ equazione integrale,
(6.132), e se si aggiunge una componente di un tensore arbitrario
Tip che soddisfa la condizione (dT'a ^/dxa) = 0 a ciascuna compo­
nente del vettore G, allora

70

la relazione (6.132) mantiene inalterata la sua validità. Si è pro­


ceduto in questo caso in modo analogo al caso in cui si è scelta un ’e­
spressione per il vettore di Poynting dal teorema di conservazione
dell’ energia o si è cercata un’ espressione per la densità di corrente
di spostamento. La nostra scelta dipende dalla correttezza di tutte
le conseguenze. Il tensore delle tensioni (6.128) nel vuoto, in cui
D = &0E e B = jll0H, insieme alla definizione d’ impulso (6.133),
fornisce risultati fisici ragionevoli.
In conclusione va notato che la relazione (6.132) chiarisce come
la definizione della densità d’ impulso ed il tensore delle tensioni siano
strettamente correlati. Ridefinendo la densità d’ impulso, si modifica
subito l ’ espressione di T aìò (vedi § 6.12).
Riassumiamo i risultati ottenuti nel caso del vuoto: come con­
seguenza delle equazioni di Maxwell si deve assegnare al campo elet­
tromagnetico nel vuoto una densità d’ impulso definita dalla formu­
la (6.133). Quindi la formula (6.132) esprime la legge di Newton:
un incremento dell’ impulso delle cariche e di un campo nel volume
T ‘ è uguale alla somma delle forze agenti su questo volume.
Queste forze si possono scrivere sotto forma di forze di superficie,
cioè di forze che agiscono sulla superficie che racchiude il volume TT.
Il passaggio a termini quadridimensionali si può fare come segue.
Prima di tutto, dimostriamo che la densità di quadriforza f (6.54)
si può riscrivere come una divergenza quadridimensionale del ten­
sore T ik

dove T ih è il tensore energia-impulso-tensione 1; le sue componenti


hanno la seguente forma:

T ik = ± F tmf mh + F Òik (Fsnfsn)- (6.134)

Nel primo termine del secondo membro nella (6.134) la somma


va eseguita su m, e nel secondo su 5 ed n\ F im e f S7l sono le componenti
corrispondenti dei tensori (6.29a) e (6.31).

1 Denoteremo il tensore quadridimensionale (6.134) con la stessa lettera T


che abbiamo usato nel caso tridimensionale (6.128): questo non deve generare
confusione in quanto, come si vedrà, le nove componenti della (6.134) coincidono
con la (6.128) se gli indici i e k variano da 1 a 3.

214
Per ottenere la relazione (6.134) abbiamo bisogno delle equazioni
di Maxwell espresse come nelle (6.60) e (6.67); le riscriviamo qui in
una forma più conveniente:
dfkl
dxt
(6.135)
dFik I dF n d Fki
dxi ‘ dxfc dxi (6.136)

Trasformiamo la densità di forza quadridimensionale:

u - f F - v «r t r = t { i J r • <«-137>
In questo caso abbiamo usato la (6.135) e applicato la regola di
differenziazione del prodotto.
Ora affronteremo il secondo termine dell’ultimo passaggio del-
Puguaglianza (6.137)
i dFjk 1 /r dFjk . , dFki \
dxi 2 dxi ' dxi )
dFju dFu \ „ J_ r ( dFìh -, dFu \
dxi ■f fhl dxh ) 2 jk l V àxi ' dxk )

1
__ _____ _ x d F k i L / ~ Po x d fk i

— 2 lkl dxt ~ ’ 2 V 80 Jkl dxt ~~

i l0 2
__ _____ L i / " d / r \ L
F
(/,s n z )' (6.138)
“ 4 V 8o dxi K!hl} ~ 4 sti/

Nella serie di passaggi (6.138) si sono effettuate le seguenti operazio­


ni. Il secondo passaggio si basa sull’ antisimmetria dei tensori f ki e
F ik che permette di scambiare gli indici in ciascun termine del pro­
dotto senza modificare il prodotto:
X dF jk _ r dF ki
*hl dxi Jlk dxi (6.139)

Di conseguenza, invece di un termine prendiamo la semisomma di


due espressioni uguali che figurano in ambedue i membri della
(6.139). Il terzo passaggio comporta una sostituzione degli indici
muti che non modifica il risultato della somma: P indice l viene so-
stituito da k e viceversa, cioè f ih
axi viene rimpiazzato da fki-r^--
oxk
Il fattore comune f hi viene portato fuori dalla parentesi nel quarto
passaggio, mentre nel quinto viene usata l ’ espressione (6.136).
Nel sesto passaggio si sostituisce F hi, secondo la (6.58), il che è
valido solo nel vuoto.
La (6.138), comunque, rimane valida anche per un mezzo uni­
forme ed isotropo. Si può mostrare facilmente che in tal mezzo le
componenti dei tensori f e g sono proporzionali come in precedenza,
benché le componenti spaziali e quelle temporali abbiano fattori
di proporzionalità diversi. D all’ apparenza dei tensori g = (cB,

215
—ìE) e f — (.H, —icD) è chiaro che le componenti spaziali dipendo­
no dai vettori B ed H, mentre quelle temporali dai vettori D ed E.
Per ottenere le relazioni necessarie B — s E e B = \iH, bisogna porre

(6.140)

(6/141)

Ma in questo caso, partendo dal quinto passaggio della {6.138),


la sequenza dei passaggi si può scrivere come segue:

L'ultim o passaggio della (6.138) ed il terzo della (6.142) sono scritti


secondo la regola di differenziazione del prodotto:

Poiché i fattori a e b nelle (6.140) e (6.141) sono costanti, possono


essere portati sotto il segno di differenziale. Ed infine, per conve­
nienza, introduciamo altri indici muti nella somma, il che non al-
tera la somma fui*7hi = fsn^sn> Perciò, si dimostra l ’ uguaglianza
dei risultati ottenuti nel caso del vuoto e del mezzo uniforme ed iso­
tropo.
Ovviamente questo risultato sul piano formale era ovvio, in
quanto nel sistema SI il vuoto è semplicemente uno dei mezzi uni­
formi ed isotropi finché sono essenziali soltanto le relazioni B = &E
e B, = p ii.
Per riunire il primo termine nella (6.137) con il secondo nella
forma finale (6.138) o (6.142), è necessario che una differenziazione
in ambedue i termini si effettui rispetto alle stesse variabili. Co­
munque, si può passare ad una differenziazione rispetto a variabili
diverse mediante il simbolo di Kronecker
d _« d
dxi ~~ dxi
Ora possiamo scrivere l ’ espressione per /* in forma più completa
(vedi la (6.137)):
1 d
/.-■ H -É r + t4 dx% (fsnPsn)) =

(6.143)

216
Sostituiamo gli indici muti della sommatoria nel primo addendo::
Tindice m sostituirà k, e h sostituirà l nel primo e nel secondo adden­
do. Quindi si ottiene finalmente

F"/-*
i + é—§ f ■
dove T ih è definito secondo la (6=134)»
Perciò, le componenti della quadriforza / si possono esprimere
mediante le componenti del tensore T ik che dipendono dai vettori
campo E e B (ricordiamo che per il vuoto, di cui si tratta in questo
paragrafo, le componenti dei tensori 5 e f sono proporzionali, secondo-
la (6.58), con lo stesso coefficiente di proporzionalità).
Da ciò e dalla definizione del tensore Tik (6.134), si vede che nel
vuoto esso è simmetrico, cioè T ik = Tki. Ciò comporta che questo
tensore ha dieci componenti indipendenti. Nella sostanza il quadri-
tensore perde le proprietà di simmetria.
Cerchiamo ora le componenti di T ik espresse mediante i vettori
campo elettromagnetico. Consideriamo prima l ’ espressione f snF sn°
E proprio la somma dei prodotti a coppie delle rispettive componenti
delle matrici (6.29a) e (6.31). Le componenti richieste si trovano-
subito dalla definizione dei tensori f (H, —icD ) e g (cB, —iE).
Indicando con À i coefficienti di 6^, troviamo

fsnFsn= •2 ( c B H -c D E ) = (6.145),

Il fattore 2 davanti alla parentesi è dovuto alle proprietà anti­


simmetriche di / e F; il prodotto delle componenti a coppie dà due
volte la stessa espressione c (.BH — DE). Ora si può riscrivere come-
segue l ’ equazione delle componenti di Tik (fmk è sostituito da —/ fem):

T i h ~ — ^FimfhmFr 8ikA. (6.146)


Consideriamo ora le componenti individuali. Troviamo, ad esem­
pio, r n :

Tu = — — Fimfim + A — —F 11/ 1 1 — “ F 12 /12 F 13/ 13—

(cBzH z+ c- c E xDx) + “ - ^ =

= - B H + HxBx + ExDx + ¥ L - » f =

= HXB X+ E XDX
-

Sappiamo che Tlx è una componente del tensore tridimensionale


di Maxwell delle tensioni (6.128). In modo simile si può mostrare
che tutte le componenti del tensore r a(5, cioè le componenti i cui
indici i, k prendono i valori da 1 a 3, coincidono col tensore delle-
tensioni di Maxwell (6.128). Rimangono da considerare le compo­
nenti T ikì in cui almeno uno degli indici sia uguale a 4. Cominciamo
con T 44:

T 44 = — — F 4m/4m + A =
BH DE BH
= ExDx + E yDy + E zDz (6.148)
2 2 2

La componente T 44 si dimostra uguale alla densità di energia


del campo elettromagnetico. Troviamo ora T14:

T i4 = T 4i = ------- -- F i m / 4m = — ^ 12 /4 2 + F 13 / 4 3 ) =

— ic {F)yEz DzE y) = ice 0[x0 [2£H]x =

= - ± S x = - i c - ^ - = - i c g x. (6.149)
Nello stesso modo
^24 = ^42 = — (6.150)
^34 = ^43 ~ ÌC^Z-
Le componenti F14) T24, T 34 risultano proporzionali alle compo­
nenti della densità d’ impulso del campo elettromagnetico g = aSVc2.
In seguito risulterà chiaro (vedi la (6.153)) che trattiamo proprio
una densità d’ impulso e non un flusso d ’ energia cui l ’ impulso è
proporzionale. Scriviamo la matrice del tensore energia-impulso-
tensione nel caso di campo elettromagnetico nel vuoto:

(6.151)
Il quadrato in alto a sinistra comprende nove grandezze che defi­
niscono il tensore delle tensioni di Maxwell. Esso diventa una gran­
dezza corretta nel caso relativistico se viene ampliato con le gran­
dezze riguardanti l ’ energia S e w. Assicuriamoci che una volta com­
posto il tensore T ihì si ottengano dalle equazioni (6.125) e (6.132)
le leggi di conservazione dell’ energia e dell’ impulso espresse in
forma tridimensionale. Consideriamo le componenti spaziali della
quadriforza:
___ i_ dSpr __ d T q f r ____ 1 _ dSq = dTq$ dgq
dxp c d ( ict )d x fi c% dt dxg
(6.152)

Abbiamo tenuto presente che l ’ impulso tridimensionale del campo


•elettromagnetico nel vuoto ha componenti ga = S J c 2. Moltiplican-

218
do ciascuna componente f a (a — 1, 2, 3) per il vettore unitario
corrispondente m a (oc = 1 , 2 , 3) e sommando i valori ottenuti, ab­
biamo (/ = è la forza di Lorentz tridimensionale)

<6-i53>
Integrando l ’ identità (6.153) su un volume arbitrario, otteniamo

\ i i V + \ % - d r = \ ^ m „ i r . <6 , 154 )
7/c? fa yo
Il primo membro della (6.154) comporta la variazione dell’ impulso
totale delle particelle e dell’ impulso totale del campo:

TT-
Applicando il teorema di Gauss-Ostrogradskij al secondo membro
delia (6.154), otteniamo

! 4 ^ ™ “ d T = § T^ nvm « dS = § ;
^ 1 s s
nell’ ultimo passaggio ci si è avvalsi della simmetria del tensore T ap.
Ora siamo giunti alla legge di conservazione dell’ impulso (6.132) e
siamo corti che le componenti r i4, T 24, T 34 sono proporzionali alle
componenti dell’ impulso del campo elettromagnetico. L ’ espressione
Tavnam $ si può considerare non solo come la forza che agisce sul­
l ’ elemento di superficie, ma anche come il flusso dell’ impulso at­
traverso l ’ elemento di superficie. La grandezza T a ^m^ fornisce
una componente vettoriale di questo flusso. Entrambe queste in­
terpretazioni sono sicuramente equivalenti.
Consideriamo ora / 4. Da un lato, secondo la (6.54),

h = i L ( v E ) = )v
f(ri6.157)
e dall’ altro
j _ dT4k _ dT41 | dT42 , dT43 ■ dT44 __
^ dx\ dx 1 ' dx 2 1 dx 3 dx±

(6-158)
Di conseguenza, la (6.158) si può riscrivere come

*!L + dÌYS + (vf) = 0.(6.159)

Integrando l ’ espressione (6.159) rispetto ad un volume arbitrario


di campo e tenendo conto delle (6.121) e (6.123) otteniamo

J L (T + W ) = - § S d S , (6.160)
s

2 19
avendo applicato il teorema di Gauss al termine div S dell5equazione
(6.159). È proprio la legge di conservazione dell’ energia (6.125).
Quindi, nella teoria relativistica le tensioni di Maxwell, l ’ im­
pulso e l ’ energia di un campo nel vuoto si amalgamano in una sin­
gola grandezza tensoriale, il tensore energia-impulso-tensione.
Le leggi di conservazione dell’ energia e delFimpulso si manifestano
tramite singole relazioni.
La simmetria del tensore energia-impulso-tensione costituisce
una proprietà di fondamentale importanza. Grazie ad essa, risulta
immediatamente la relazione fondamentale tra le densità di flusso
d ’energia e dell'impulso nei caso di campo elettromagnetico nei
vuoto:
S = gc\ • (6.161)
Si può facilmente verificare che la « traccia » del tensore T ik>
cioè la somma delle sue componenti diagonali, è uguale a zero.
Una volta stabilito il carattere tensoriale delle tensioni, dell’ im­
pulso, del flusso e della densità di energia del campo elettromagne­
tico, si ottengono automaticamente le regole secondo cui si trasfor­
mano queste grandezze nel passaggio da un riferimento inerziale
ad un altro. Scriveremo soltanto quelle formule di trasformazione
che ci serviranno in seguito'. Sostituendo i valori delle componenti
(6.151) nelle formule generali (A.L31), si ottiene

Txs = Tu = T2 { n x - 2 ^ S ' x - ^ r w
('),6.162)

. T ii = T 2 ( w ' + 2 ^ S ' x - ^ T rx x ) , ( 6 . 1 6 3 )

Txv = T a = T (6 .1 6 4 )

&c = r » { ( l + (6 -1 6 5 )

g y - ^ T ( g' y - L r xu) , (6 .1 6 6 )

S, = r U - ^ T ' ZX) . ( 6 .1 6 7 )

§ 6,12. Tensore energia-impulso»


tensione del campo elettromagnetico
in un mezzo*
Tensore di Minkowski
e tensore di Abraham
Il tensore energia-impulso-tensione (EIT) in un mezzo desta inte­
resse soprattutto perché è associato all’ impulso del campo elettro-
magnetico nel mezzo. Quest’ultima grandezza è direttamente cor­
relata alle grandezze osservate negli esperimenti (ad esempio, la
pressione della luce). Questo tensore, comunque, non è definito u n i­

220
vocamente nel mezzo, e la discussione sulla sua « forma propria » è
ancora in còrso.
Cerchiamo la forma generale del tensore EIT in un mezzo uni­
forme ed isotropo. È stato mostrato nel § 6.11 che la forma generale
delle componenti del tensore EIT in un mezzo uniforme ed isotropo
non differisce dal caso nel vuoto; in entrambi i casi (vedi la (6.146))

Till— im/ftm + fiiftA. (6.168)


Comunque, i coefficienti di proporzionalità delle componenti
spaziali e temporali di f e 5 sono diversi in un mezzo (vedi le (6.140)
e (6.141)), ed il tensore T ih definito dalla (6.168) diventa antisim­
metrico in contrasto con il tensore (6.149). L ’ asimmetria si manifesta
a causa delle componenti temporali del tensore; quelle spaziali sono
simmetriche, almeno in un mezzo isotropo. È altrettanto facile
vedere che le componenti spaziali del tensore T ik in un mezzo diffe­
riscono da quelle del vuoto solo per i valori di e e p. Così, ad esempio,
Fa ~ Fimfim + A =

= - t ( cB - T - + cB . % — c° e ì ) + a =
B E — DE
= - H zB z- HyBy - f f xBx + H XB X+ E mDx -
ED + BH
= E XB X+ E XDX

Questa espressione coincide coi valore di Ttl (6.147), la sola diffe­


renza sta nel fatto che le grandezze s e p rimpiazzano e0 e p0 della
(6.147). Nello stesso modo si trova che

7*44 = - 4- + A= t B- = w.
Comunque se
T\k= — jeep, [EH\X—— ( ) (8fx/e0ji0)
allora
T 4i = - {ile)[EH) x= - (ih)
Quindi, il tensore EIT in un'mezzo uniforme ed isotropo, ottenuto
per trasformazione diretta di una quadriforza, non è più simmetrico.
Esso è ehiamato'tensore di Minkowski e le sue componenti hanno la
forma
/ Tu F 12 T 13 — (ile) n2Sx \
l t 2, F'22 T zì — (ile) n2Sy 1 _
F 32 T33 — (i/c) n2Sz I
1
\— cSx — {ile) Sy -
{U {He)Sz * /
( TaSi — {ile) rfiSX
(6.169)
V- {il w j-

221
La (6.169) include Lindice di rifrazione n = ] / efx/eo^o- La densità
d’ impulso corrispondente al tensore (6.169) (cioè le componenti
^14» ^24 5 ^ 34) risulta uguale a

= (6.170)

L ’ i n d i c e « M » in alto che appare nel simbolo della densità d ’im­


pulso sottolinea il fatto che questa densità corrisponde al tensore
di Minkowski, La densità d’ impulso di un campo in un mezzo (6.170)
è maggiore di n2 volte di quella nel vuoto (6.133).
Spesso viene suggerito l ’uso dell’ espressione (6.133) per la de­
scrizione della densità d’ impulso di un campo in un mezzo. Sicura­
mente, in questo modo l ’ impulso totale viene diviso nell’ impulso
del campo e in quello del mezzo stesso. Comunque la densità d’ im­
pulso del campo si può separare nella forma (6.133) solo se si utiliz­
za un altro tensore energia-impulso, diverso dal tensore di Minkowski.
È importante considerare anche la relazione (6.133), in quanto for­
nisce la formulazione più generale della legge d’ inerzia. Poiché il
flusso di energia viene descritto dalle componenti T^a del tensore
energia-impulso, e la densità d’ impulso dalle componenti r a4, la
relazione (6.133) indica la simmetria del tensore. Quindi, dobbiamo
costruire un nuovo tensore simmetrico che soddisfi le condizioni
seguenti: le componenti TaIt = — ìcga, e 7T4a = — {ile) S a; inoltre,
si verifichi la relazione (6.133). Il tensore tridimensionale delle ten­
sioni T a $ deve coincidere con il tensore tridimensionale delle ten­
sioni di Maxwell (6.128). Tale tensore è stato suggerito da Abraham
nella seguente forma:

Poiché Ta $ = T e in virtù della definizione (6.133), questo ten­


sore è simmetrico. L ’ introduzione del tensore di Abraham implica
la comparsa di una forza di volume che agisce sul mezzo. Questa
forza viene chiamata forza di Abraham. Per trovare l ’ intensità,
ricordiamo che le componenti della densità di forza di Lorentz sono
correlate al tensore energia-impulso di Minkowski dal rapporto
qjM
/• “ - S T - (6-172>

E proprio il modo con cui si è ottenuto il tensore di Minkowski.


Segue direttamente dalla relazione (6.172) che
dfW-
(6.173)

222
Sviluppando la somma a secondo membro e permutando i ter­
mini dell’ uguaglianza, otteniamo (vedi la (6.169))
dT
mn (6.174)
ctx$.
dove / L denota la densità di forza di Lorontz.
Ora scriviamo le espressioni (dT^k/dxh) m a per esteso, tenendo
conto della (6.171):

9Tq(3 sgA dTqp dgM


dxk ™a dx$ dt dxp
m r,
dt
(6.175)

Il secondo passaggio della (6.175) tiene conto del fatto che il tensore
delle tensioni di Maxwell è lo stesso sia nel tensore di Minkowski
che in quello di Abraham; il terzo passaggio della (6.175) è la tra­
scrizione identica del secondo. Ma i primi due termini dell’ultimo
passaggio nella (6.175) si possono sostituire, secondo la (6.174), e si
ottiene allora

i s f m - - 4 r = / L+ ' A- <6'™ >


Il secondo membro della relazione (6.176) contiene un termine f A
che rappresenta la derivata della densità d ’impulso; dalla seconda
legge di Newton la derivata rispetto al tempo di una densità d ’ im-
pulso è una densità di forza

i { im i - i i E H ] } . (6.177)

In un mezzo isotropo

~ A i
(6.178)

La densità di forza (6.177) e (6.178) si chiama densità di forza di


Abraham.
I tensori di Minkowski e di Abraham forniscono diverse espres­
sioni per la densità d ’ impulso del campo elettromagnetico. Scri­
viamo le espressioni corrispondenti per la densità d ’ impulso di un’ on­
da elettromagnetica piana. Nel caso di un’onda elettromagnetica
piana che si propaga in un dielettrico uniforme ed isotropo la rela­
zione tra il valore del vettore di PoyntingN, la velocità di fase dell’ on­
da monocromatica v e la densità d’energia dell’ onda w è data dalla
semplice relazione
S = w-v, (6.179)
v = cìn = ( e p / e 0 0
(Li ) h 2 „ (6.180)

223
Le (6.170) e (6.171) forniscono le densità d'impulso:
gM = (n2/c2) S = (n2/c2) w {du) = (wlc) n, (6.181)
gA = (S/d) = (1/c2) (c/rc) — (w/cn)„ (6.182)
Assumiamo che l ’energia del campo elettromagnetico sia quantiz-
zabile, cioè w — ASco, dove N è il numero dei quanti per unità di
volume. Allora dalle (6.181) e (6.182) otteniamo i seguenti impulsi
dei quanti in un mezzo:
pm = (Uco/c) n, (6.183)
p A = (h(ùicn). (6.184)
Quale di queste due equazioni è « vera »? La tecnica della seconda
quantizzazione del campo elettromagnetico nella sostanza conduce
alla (6.183). Assumiamo che V impulso p di un quanto in un mezzo
sia definito come segue:
p = (jhivlc) ns, (6.185)
dove s è un vettore unitario nella direzione di propagazione dell’ ondas
ed il quadrivettore energia-impulso del quanto prende la forma

H i r ™ . -?)•■ (6-186)
Usando la (6.186), si può ottenere l ’espressione corretta che de­
scrive la radiazione di Yavilov-Cerenkov (vedi capitolo V II). Questo
sembra indicare che bisogna preferire la (6.186) ed il tensore di
Minkowski. Comunque, un uso accorto di entrambi i tensori fornisce
risultati corretti. Il punto è che entrambi soddisfano la relazione
(6.127) che è la conseguenza delle equazioni di campo. E importante
sapere come è definito l ’ impulso del campo elettromagnetico nella
sostanza. Nel caso generale, è impossibile suddividere l ’ impulso
totale del campo in parti riguardanti o solo la sostanza o solo il
campo. Ma è proprio ciò che si cerca di fare introducendo l ’ impulso
di Abraham. Quando un’onda luminosa passa dal vuoto in un mezzo,
il suo impulso non viene interamente trasferito nel mezzo; una parte
dell’ impulso è trasmessa al mezzo stesso. Il tensore di Minkowski
sì utilizza ogni volta che si considera un impulso trasmesso intera­
mente; se trattiamo un impulso connesso a radiazione nel mezzo,
bisogna usare il tensore di Abraham. L ’espressione (6.185) fornisce
il valore corretto dell’ impulso del fotone nel caso della radiazione
di Vavilov-Cerenkov (vedi capitolo VII), perché in questo caso è
d ’ importanza primaria l ’ impulso totale trasmesso dall’elettrone di
Cerenkov al mezzo. L ’ impulso totale trasmesso ad un fotone in un
mezzo è proprio uguale a Kùmie. Non stupiamoci del fatto che la
quantizzazione del campo elettromagnetico nei dielettrici conduca
alla (6.185) che descrive l ’impulso. Questa espressione rappresenta
semplicemente Timpulso totale del campo elettromagnetico; questo
impulso è associato sia al campo che alla sostanza (vedi § 7.7).

224
Per quanto riguarda la forza agente sulla sostanza, essa e cor­
relata alla forza di Abraham e, naturalmente, al tensore di Abraham*
Un tentativo di misurare la forza
di Abraham è stato compiuto nel Sospensione e tensioni
1975 con apparente successo. alternata
Nella fig. 6.7 viene illustrato
Passetto dell’esperimento. Un
disco di titanato di bario (e ~
~ 4000, fx ~ |x0) ha un piccolo
foro al centro. Entrambi i bordi
del disco sono ricoperti di allu­
minio e formano perciò un con­
densatore cilindrico. Il disco è
sospeso su un lungo filo di tung­
steno in modo da poter compiere
delle torsioni tra i poli di un
elettromagnete che genera un
campo costante di 10 kGs. Una
tensione alternata con 150 V di
picco è applicata alP armatura Fig. 6.7. Un’ osservazione sperimen­
interna del disco, mentre Pelet­ tale della forza di Abraham.
trodo esterno è messo a terra
mediante un sottile filo d ’oro che non influenza le oscillazioni
del disco. La tensione è applicata in fase con le oscillazioni
caratteristiche del disco.
La forza di Abraham si può anche scrivere nella forma
ds
f A = e0Ho (xroxe— 1) = e0Ho (xmx e — 1) (6.187)
dove
Xg = s/s0, x m = fi/no (6.188)

e si tiene conto dei fatto che il campo magnetico è costante (È — 0).


Nel caso di titanato di bario l e , di conseguenza,

/ A = [e0 (xe — 1) E, p,0H]= [P, Ho (6.189)


l ’ultima equazione deriva dal fatto che in un mezzo uniforme ed
isotropo
p =z B — eqE = (e — &0) E = e0 (Ke — 1) E . (6.190)

Il significato fisico della « forza di Abraham » è ovvio nel caso con­


siderato. P è la frazione della corrente di spostamento causata dal
moto delle cariche legate. In pratica è la forza di Ampère. Non è
difficile stabilire che questa forza induce un momento torcente (il
campo elettrico è diretto radialmente). È essenziale che nessun’ altra
forza legata alla presenza del campo elettromagnetico contribuisce
al momento torcente.

225
Gli autori che hanno proposto quest’ esperimento affermano che
le oscillazioni osservate del disco corrispondono al calcolo basato
sulla presenza della forza di Abraham. Vogliamo puntualizzare an­
cora che questo risultato sperimentale, benché interessante di per
sé, senza dubbio non « sceglie » tra i tensori (6.169) e (6.171). Si
troverà nel § 7.7 qualche commento ulteriore riguardo la scelta di
un’espressione per l ’impulso di un fotone in un mezzo.

§ 6.13. Tensore energia-impulso-


tensione di una carica a simmetria
sferica
Se la carica elettrica nel vuoto è a riposo nel riferimento A , in que 1
riferimento c ’ è un solo campo elettrico ed il tensore energia-impul so-
tensione (EIT) si può scrivere facilmente nella forma

r- - <6-i 9 i >

dove w = &0E 2I2 e Ta{3 = &0E aE^ — SaPu;. Se la carica si muove


rispetto al riferimento K ' a velocità — V, il suo tensore T'ik si trova
dalle equazioni generali per la trasformazione delle componenti di
un tensore. In particolare, per trasformare la densità d ’ impulso
lungo l ’ asse x, cioè (ile) T14, e i a densità d ’energia Tu , si hanno le
seguenti equazioni (vedi A. 1.31):
T'u = - iBT^Ta + TW 44- iBT^(w - T n)y
t 'u= r*r44~B*r r*( w— 5- .
Troviamo l ’energia totale e l ’impulso totale di una carica punti­
forme, tenendo presente che l i passaggio dall’elemento di volume
d Y ' nel riferimento K ' a quello d Y nel riferimento K si effettua me­
diante la formula d Y r = 1/T d Y :

u '= ] r u d r '= d r = r j(w -B ( 6 . 192 )

g 'x = 4 j r ;4d r 1 '= 4j


(6.193)
È ovvio che
^w~dT=\j ^ - d T = U.

Se nel sistema di riferimento proprio della carica K essa possiede


una simmetria sferica in modo che E% — Ey = E\ = E 2!3, allora

d r-* L j& .d r .= - 4 1

526
Di conseguenza, le (6.192) e (6.193) prendono la forma

(6.194)

G '* = -± ± T U . (6.195)

Le componenti dell’ impulso G'y e G'z si annullano, in modo che


G '= -■ § -• £ H7. (6.196)

La comparsa del segno « meno » nell’espressione per G' è dovuta al


fatto che la carica si muove a velocità — V rispetto al riferimento
K '. Confrontando le formule (6.194) e (6.195) con le formule per la
trasformazione dell’ impulso e dell’energia di una particella nel pas­
saggio dal riferimento proprio ad uno arbitrario (vedi la (5.49)),
vediamo che sono differenti, in un primo tempo fu compiuto uno
sforzo per trattare la massa dell’elettrone come se fosse elettromagne­
tica usando la relazione
m ■= Ulc\ (6.197)
La (6.196) mostra che tale interpretazione ci mette nei guai, in quan­
to per « confinare » una carica sono richieste forze addizionali che
neutralizzano la repulsione, cioè un’ energia che non abbiamo preso
in considerazione. Tenendo conto degli sforzi meccanici, possiamo
ottenere la seguente relazione:

G '= -r V ~ , (6.198)

(in completo accordo con le formule (5.49))* I dettagli si possono


vedere in [13].

§ 6.14. Potenziali del campo in


un mezzo ncn conduttore in moto 1

Nel § 6.1 abbiamo introdotto il quadripotenziale del campo elet­


tromagnetico nel vuoto. Sicuramente, il campo elettromagnetico si
può determinare immediatamente dalle equazioni di Maxwell, senza
introdurre i potenziali. In molti casi, però, risulta conveniente
] ’ utilizzazione dei potenziali come grandezze intermedie per deter­
minare i campi E e B anche soltanto per diminuire il numero delle
funzioni da determinare. Conoscendo soltanto quattro componenti
del vettore potenziale, si possono trovare da queste tutte le compo­
nenti dei campi elettrico e magnetico! I potenziali sono ancora più
convenienti da usare nell’elettrodinamica dei mezzi in moto, dove
le equazioni nella materia (6.74) e (6.75) diventano più complicate
che nel caso di un mezzo stazionario.

1 I §§ 6.14 e 6.15 sono scritti da B. M. Bolotovskjj e S. N. Stoljarov.

m
Nel seguito sarà mostrato come si possono ottenere le espressioni
per i potenziali del campo in un mezzo in movimento. Per illustrare
un’ applicazione di questi potenziali, considereremo la propagazione
di un’onda elettromagnetica piana in un mezzo in movimento ri­
spetto ad un osservatore stazionario. Questo esempio ha una rica­
duta diretta sui problemi analizzati nel capitolo VII. In questo
paragrafo applichiamo i metodi dell’ algebra tensoriale descritti
brevemente nell’Appendice I, § 3.
Ora deriviamo le equazioni per il quadripotenziale in un mezzo
in moto. Possiamo descrivere il campo in un mezzo in moto mediante
due tensori: F ik (vedi la (6,29)) e f ih (vedi la (6.31)). Il tensore F ih
è detto qualche volta tensore di campo, ed il tensore f ikì tensore di
induzione.
Introduciamo ora il potenziale di campo quadridimensionale CP
in un mezzo, avendolo definito mediante la seguente relazione:
/ dd)k dOj \
F ìh (6.199)
\ dxi dxfr ) ’
che coincide con la formula (6.28). Conoscendo le quattro componenti
del potenziale <Dk, possiamo usare questa equazione per determinare
tutte le componenti del tensore F ih, cioè l ’induzione magnetica B
ed il campo elettrico E . Per descrivere interamente il campo elettro-
magnetico in un mezzo, bisogna conoscere anche le componenti del
tensore f ik, cioè le componenti dei vettori campo magnetico e dell’in­
duzione elettrica. Se è noto il vettore §r, il vettore induzione f si
può determinare mediante le equazioni materiali (6.79) e (6.80)
che stabiliscono la relazione tra le componenti di questi due tensori
(ricordiamo che la correlazione in forma vettoriale tra i tensori ^
e f è data dalle equazioni di Minkowski (6.74) e (6.75)).
Le equazioni materiali (6.79) e (6.80), che definiscono la rela­
zione fra i tensori ^ e f, s* possono scrivere nella forma di un’ unica
relazione tensoriale
fih = ik6( .200)
Z
dove il tensore di quarto rango e ^ ìm è scelto in modo da rendere
valide le equazioni di Minkowski (6.74) e (6.75). È facile mostrare
che il tensore della forma
Zmm = y c (?>li - ™ - 2UlUl) (6hm-x e r * U kU (6.201)

possiede le proprietà necessarie. Qui 6 è il simbolo di Kronecker


definito dalla formula (A. 1.4) e Uh sono le componenti della veloci­
tà quadridimensionale definita nel capitolo V ed avente le compo­
nenti V (TV, icT), dove V è la velocità tridimensionale del moto del
mezzo. La costante adimensionale x è definita mediante l ’ indice di
rifrazione n:
sp
,==n2— l, n = — = l / ' . ( 6: 202)
eoPo v V S0JLi0

228
È facile vedere che % — 0 nel vuotor e la relazione (6 . 200) fra i
tensori f e ^ prende la forma
1
fin F ih » (6.203)
fV
che corrisponde alle ben note relazioni tra i campi E ed H e le indu­
zioni D e B nel vuoto:
D = s0E, B = \i0H. (6.204)
In un mezzo stazionario il tensore della (6.201) fornisce le se­
guenti relazioni tra i campi e le induzioni:
D = eE, B = [iH. (6.205)
È facile vederlo avendo assunto nella (6.201) Uj — U2 = U3 = 0
ed U4 — ic.
Poiché le componenti del tensore F lm sono espresse mediante le
componenti del potenziale quadridimensionale <X>2, e le componenti
del tensore di induzione f ih sono correlate ad F lm dalla (6 .200), le
componenti del tensore f ih si possono esprimere anche mediante le
componenti del potenziale quadridimensionale CP*. In altre parole,
per determinare tutte le componenti dei campi e delle induzioni in
un mezzo in moto è sufficiente conoscere le quattro funzioni ® 2.
Ora deriviamo le equazioni per i potenziali del campo in un mezzo
in moto. Per questo facciamo uso delPequazione (6.60):

Sostituendovi f ik dalla (6.200), otteniamo


p dFlm __ (6.206)
eiklm dxh ~ ~ Si‘

Utilizzando Pespressione esplicita (6.201) per il tensore 8mm, così


come la formula (6.28), che esprime F ìm mediante le componenti
d>i del potenziale, con semplici trasformazioni riduciamo Pequazio-
ne (6.206) alla seguente forma:

( S ' . - n r V . U O l dxfr L
[-g
dx\f - - -

[ d* 2“
Ldx% %C ‘ (*■£)>}- (6.207)

Ora moltiplicando entrambi i membri delPequazione (6.207) per


il tensore

e facendo uso della relazione

{òil-K c -^ U iUl)( 6 J« + X p r c - ^ a . ) = 6i«.

229
che è facile da controllare, otteniamo finalmente

(■v * £ ) > ■ - £ ( )=
= ( 6 t« + ) sf. (6.209)

Il sistema di equazioni (6.209) definisce tutte le componenti dei


potenziale <Da dalle sorgenti st di un dato campo in un mezzo in
moto.
Questo sistema si può semplificare con opportune condizioni
imposte ai potenziali, per esempio si può richiedere che valga la
seguente relazione:
dOk
dxk
-*c-*u ku n d®m
dxfo
-0 « ( 6 . 210)

Questa condizione è la generalizzazione della ben nota condi­


zione di Lorentz imposta ai potenziali nel vuoto (vedi la (6.8)). La
validità della condizione (6.210) si dimostra come nel caso dell’ elet­
trodinamica convenzionale.
Quando è soddisfatta la condizione (6.210), la (6.209) diventa
più semplice e prende la forma

{ i f -
Il sistema (6.211) è più conveniente rispetto al sistema (6.209)
in quanto comprende quattro equazioni, ciascuna dello quali in­
clude solo ama componente del vettore potenziale (a = 1, 2, 3, 4).
Per sorgenti esterne date, la soluzione del sistema (6.211) definisce
completamente il campo generato da queste sorgenti nel mezzo in
movimento.
Se il mezzo in movimento ha una frontiera di separazione, il
sistema (6.211) deve essere completato con le condizioni al contorno
necessarie (vedi § 6.8).
Come esempio per risolvere le equazioni ottenute, consideriamo
un campo elettromagnetico in un mezzo in movimento in assenza di
sorgenti esterne (correnti e cariche). Poiché in questo caso tutti gli
Si = 0, il sistema ( 6 . 2 trasforma in un sistema di quattro equa­
zioni uniformi
{ i — ( 6. 212)

In virtù della condizione complementare (6.210) soltanto tre delle


quattro quantità <Pa sono indipendenti. In accordo a ciò possiamo
assumere 0 4 = 0, e trattare le tre grandezze rimanenti O l7 <D2, cp3
come componenti di un certo vettore che denotiamo con A. Così
vediamo che nel caso di una tale trasformazione di gauge il vettore
potenziale (Da per il mezzo in moto è il potenziale vettore tridimen­
sionale A.

230
In questo caso il sistema di equazioni (6.212) si può riscrivere
in termini del potenziale A:

+ U V “ °> <6-213>
dove B = Vie, con la condizione complementare

d i v 4 - c- ^ i 5y[ ( F v ) + ^ - ] ( V A ) = 0 , (6.214)

che segue dalla coudizione complementare (6.210) per <D4 = 0. Se


conosciamo la soluzione dell’equazione (6.213) per il potenziale A, i
campi E e B si possono esprimere mediante A secondo la formula
(6.28) che nel nostro caso ha una forma semplice
B = x o tA , (6.215)

Conoscendo E e B, si possono trovare D ed H mediante le equa­


zioni materiali di Minkowski (6.74) e (6.75) per un mezzo in moto.
L ’ equazione (6.213) descrive la propagazione in un mezzo in
moto di onde elettromagnetiche libere (onde elettromagnetiche libe­
re implicano di solito un campo in assenza di cariche e di correnti).
Passiamo alla soluzione di questa equazione. Cercheremo il poten­
ziale vettore A nella forma di un’ onda elettromagnetica piana:
■A = A QeiW - hr\ (6.216)
Sostituendo questa espressione nell’ equazione (6.213), otteniamo

{( - w + -£ -) + ^ r l 4 i) (k V -= ° -

La relazione (6.217) mostra che l ’ ampiezza A 0 dell’ onda piana è di­


versa da zero solo per quelle onde che soddisfano la condizione

+ <6 '218>
L ’ equazione (6.218) si può derivare facilmente dall’equazione di
dispersione che è valida per onde piane monocromatiche in un mezzo
stazionario:
k2 — coW = 0, k2 = k2.
Riscriviamola nella forma
n2— l
(ik2 C2 co2 = 0.
In questo caso le parentesi comprendono il quadrato del vettore
d ’onda quadridimensionale nel vuoto k (fc, ico/c), la grandezza in­
variante rispetto alle trasformazioni di Lorentz. La grandezza in
parentesi mantiene la sua forma e il suo valore numerico in tutti
i sistemi di riferimento inerziali. Il secondo addendo dell’ultima
equazione si trasforma come la frequenza co. Nel riferimento in cui

231
il mezzo è in moto con velocità V, co può essere sostituita da
cù' = (cd— U V )fY 1 — F 2/c 2
(vedi § 7.2),
JJa queste considerazioni l ’ equazione di dispersione prende la
forma (6.218)

nel sistema di riferimento rispetto al quale il mezzo si muove con


velocità V. Questa condizione definisce una relazione fra il vettore
d'onda k e la frequenza co dell’ onda elettromagnetica piana che si
propaga nel mezzo in moto. Le condizioni complementari (6.214)
per una tale onda prendono la forma

(6.219)
Dalla condizione (6.219) dell’ annullarsi del prodotto scalare
segue che in un mezzo in moto il vettore A 0 non è perpendicolare alla
direzione di propagazione dell’ onda definita dal vettore d ’ onda k, ma
ad una combinazione lineare del vettore d ’ onda k e del vettore velo­
cità V del mezzo. Nei due casi specifici, quando l ’ onda si propaga
nel vuoto (n = 1) e quando il mezzo è stazionario (V — 0), la con­
dizione (6.219) si trasforma nella ben nota condizione di trasversa­
lità delle onde elettromagnetiche libere: A 0k = 0, da cui segue che
nelle onde elettromagnetiche libere i vettori E , H, B e D sono per­
pendicolari al vettore d’onda, cioè alla direzione di propagazione
dell’ onda. In un mezzo in moto, comunque, le onde non sono tra­
sversali, in generale. Infatti, nel caso di onde piane (6.216) i campi
E e B si determinano in base alle formule (6.215):
B = — i [kA0] el^ kr\ E = — zg>4 0e4«°*-fcr>.
Da ciò 3 i vede che il vettore B è perpendicolare al vettore d ’ onda
k, mentre il vettore E no (in quanto il vettore A 0 non è trasversale
secondo la condizione (6.219)).
L ’ equazione (6.217) che ìegq il vettore d ’ onda k e la frequenza co
di un’ onda in un mezzo ih moto include il prodotto scalare kV.
Questo significa che le condizioni di propagazione dell’ onda dipen­
dono dall’ angolo tra la direzione di propagazione (o il vettore
d ’ onda k) e la velocità del mezzo F. Questa circostanza chiarisce
come la luce sia portata avanti dal mezzo in movimento. Consideria­
mo questo fenomeno in dettaglio nel caso di velocità piccole. Poi­
ché la quantità B = Vie è piccola, ometteremo nell’equazione (6.218)
tutte le potenze di B superiori alla prima. Avremo

232
Risolvendo nella stessa approssimazione le equazioni quadratiche
ottenute per co, otteniamo

“ ■ = ± T % - + « ' ( 1- js O - (6'220)
Dai due segni davanti al primo addendo del secondo membro
si deve scegliere il segno più, in quanto nel caso V = 0 ottenian o la
ben nota relazione fra co e k in un mezzo stazionario:
co _ j __
(6. 221)
ir

in questo caso abbiamo introdotto 1’ indice di rifrazione n del mezzo


stazionario. La grandezza c!n è la velocità di fase della luce nel
mezzo stazionario.
Indicando con d l ’ angolo fra i vettori k e V la relazione (6.200)
prende la seguente forma:

+ V c .s » (l- 4 - ) [(6.222)

con la scelta indicata del segno.


Come nel caso del mezzo stazionario (vedi la (6.221)), la grandez­
za co/k nell’ espressione (6.222) definisce la velocità di fase della luce
ma in questo caso in un mezzo isotropó in moto. Confrontando le
espressioni (6.222) e (6.221), vediamo che la velocità di fase della
luce in un mezzo in moto è diversa nelle varie direzioni. Se la luce
si propaga lungo il moto del mezzo (cos d — 1), la velocità di fase è
uguale a
CD

T
Se la luce si propaga nella direzione opposta al m,oto del mezzo
(cos d = —1), allora
© c
k n (*
Il fattore (1 —1/rr) è il cosiddetto coefficiente di trascinamento della
luce che fu trovato sperimentalmente da Fizeau usando l ’ acqua
coree mezzo in moto.

§ 6.15. Potenziali del campo in


un mezzo conduttore in moto»
Prima di parlare delle equazioni del campo in un mezzo conduttore in moto
richiamiamo i principali aspetti della propagazione della luce in un mezzo
stazionario in presenza della conduttività.
In questo caso le equazioni di Maxwell prendono la forma

lot E — — B, rot H = D -\ -j+ o E ,


(6.223)
d iv l? = pg divl? = 0.
233
Qui p e j sono la densità di carica e la densità di corrente indotte dalle sorgenti
« estranee ». In seguito ci limiteremo a consider are. le equazioni (6.223) in assenza
di sorgenti « estranee », cioè assumeremo p = 0 e 7 = 0. Si assùme una soluzione
delle equazioni (6.223) nella forma
E = E0e^kr' m\ D = D0ei(kr' mt),
H = H0ei^kr- <ù% B = B ^ hr^ ,
dove E0\ D 0, H0, B0 sono ampiezze costanti che non dipendono n dalle coor­
dinate né dal tempo. Quindi cerchiamo la soluzione sotto forma di onda piana
con il vettore d’ onda ft e la frequenza co.
Sostituendo le espressioni dei campi (6.224) nelle equazioni (6.223) e tenen­
do presente che p = 0 e j = 0, otteniamo le seguenti equazioni algebriche, non
differenziali, che collegano ampiezza dei campi:
[kj E q] —(ùB0ì [ft, IIQ] = co7>0 ìgEq,
(1cD0) = 0 , (fcB 0) = 0.

Abbiamo fatto uso delle seguenti equazioni:


rot (E0elkr) = i [ft, E0] e'lkr,
div (.E0eikr) = i(kE 0) e ikr.

Il sistema (6.225) deve essere accompagnato dalle equazioni materiali che


definiscono la relazione fra campi e induzioni. Nel caso più semplice di un
mezzo isotropo e stazionario si assumono le seguenti relazioni:
Dq= &EQ9 B0=\ xH0. (6.226)

Supporremo che le grandezze s e jjl non dipendano dalle ampiezze del campo
(il che assicura una relazione lineare tra i campi 2?0, H0 e le induzioni-D0» # 0»
rispettivamente). Comunque, e e p, possono dipendere, in generale, non solo
dai valori del campo, ma anche dalla frequenza co e dalla lunghezza d’ onda
X — 2 7i l k . Se s e jul dipendono solo dalla frequenza, si dice che ha luogo una
dispersione di frequenza. Ma se s e p dipendono dalla lunghezza d’ onda, il mezzo
si dice dotato di dispersione spaziale. v ;
Se le equazioni materiali (6.226) si sostituiscono nelle (6:225), si ottengono
le equazioni che contengono soltanto le ampiezze dei campi E q e H 0:
[ft, E0] = [MùHq, ^[kH0] = s(ùE0— ìgEQ9
s (ft£0) = 0S p{kH0) = 09

Nel seguito assumeremo che s e fx non si annullino. Quindi dalle ultime due
equazioni segue che i campi E0 e H0 sono perpendicolari al vettore d’onda ft.
Tali onde si dicono trasversali. Non considereremo qui le onde longitudinali che
si hanno, ad esempio, quando s = 0 (in questo caso è facile vedere che E0 jj ft).
Moltiplicando vettorialmente la prima equazione della (6.227) per il vettore
d’onda ft, si ottiene
[k[kE0]]=\i(ù[kH0]. (6.228)
Ora il valore di [kH0] si può prendere dalla seconda equazione della (6.227),
ed il doppio prodotto vettoriale si scrive con l’ ausilio della nota formula
[ft [kE0]J= ft (ft£0) - ft2£ 0= — ft2# 0.
Nell’ ultima equazione si è tenuto conto del carattere trasversale del campo E0l
cioè la relazione {kE0) ~ 0. Come risultato di queste trasformazion si ha
(ft2— epcù2— iacop) E0= 0. (6.229)

234
Consegue ate mente l’ ampiezza E0 dell’ onda elettromagnetica trasversale
in un mezzo conduttore stazionario può essere diversa da zero soltanto se è
soddisfatta la seguente equazione:
ft2— SfXG)2— iapcD = 0e (6*230)
Questa condizione si dice relazione di dispersione. Si può vedere facilmente che
la stessa relazione di dispersione (6.230) deve essere soddisfatta perché il vettore
magnetico H0 sia diverso da zero in un’onda trasversale. Per mostrarlo, è suffi­
ciente moltiplicare vettorialmente per k la seconda equazione della (6.227)
e quindi far uso della prima equazione.
Assumiamo che la frequenza co dell’ onda sia una grandezza data e che il
campo dipenda soltanto dalla coordinata z e dal tempo. Perciò si possono rap­
presentar i campi E ed H nella forma
E = E 0e{hz- ia,t, (6.23/i)
inoltre, come ciò segue dalla (6.227), possiamo assumere che il vettore E0 sia
diretto nel verso positivo dell’ asse x ed il vettore H0 in quello positivo del­
l ’asse y. Quindi i tre vettori ft, E0ì H 0 formano una terna di vettori destrorsa.
Nel caso di una frequenza co fissata l ’equazione di dispersione (6.230) dà
per il vettore d’onda k i valori seguenti:

h ,2= ± c o y +

In un mezzo conduttore il vettore d’ onda k è una grandezza complessa.


Nel seguito sarà importante che la conduttività o sia sempre positiva. Questo
si può capire anche dal fatto che il calore di Joule emesso nell’ unità di volume
del mezzo conduttore per unità di tempo è uguale a Q — J con(pE7 = °E 2 > 0.
Assumiamo che la frequenza o> sia una grandezza positiva. Allora nel­
l’espressione (6.232) anche la parte immaginaria del radicando è positiva. Assu­
mendo che le permeabilità s e fi siano anch’esse positive, troviamo che la solu­
zione kx si trova nel primo quadrante del piano della variabile complessa (cioè
le parti reale ed immaginaria della soluzione kx sono positive):
kx = k[ + ik"L (*i, ft " > 0). (6,233)
La seconda soluzione k2 è diversa dalla prima soltanto per il segno
k2 — — kx — — k[ — ik'{ (6.234)
e possiamo presentare entrambe le soluzioni mediante una sola equazioni
k = d z k 'd z ik '\ (6,235)
dove k' e k n sono quantità positive. La quantità ± ft' è la parte reale del vettore
d’ onda ft, mentre la quantità ± ft" è la sua parte immaginaria.
Sostituendo la (6.235) nella (6.231), si ottiene
E= E0 e*h~Z'ei(±
t) j
'z-a
k H= H0 236)

In queste formule bisogna prendere o tutti i segni in alto dell’ esponente o tutti
quelli in basso (nel caso in cui c’è una scelta tra « ± » o « + »). In questo modo
otteniamo le due soluzioni per i campi E , H : una proporzionale a
e- h"z9ei(k'z-(ùi) (6.237)
e l ’ altra proporzionale a
eh " z ^ (6.238)
A prima vista sembra che una di esse, (6.237), si smorza esponenzialmente
all’ aumentare di z (il fattore e~k"z)t mentre la seconda (6.238), aumenta espo­
nenzialmente (il fattore ek"z). In realtà, ambedue le soluzioni rappresentano

235
onde smorzanti. Per assicurarcene, consideriamo^ ad esempio l ’equazione
(6,238). La si può trattare come un’onda del tipo
g-t(ft'z+cùi)) (6.239)

la cui ampiezza è uguale a ek"z, cioè aumenta esponenzialmente con z. Bisogna


tener presente che una tale rappresentazione è valida soltanto se la parte imma­
ginaria k" del vettore d’onda k è piccola rispetto alla parte reale k\ cioè l ’ am­
piezza dell’ onda cambia poco in una distanza dell’ ordine della sua lunghezza
d ’onda.
La fase dell’ onda (6.239) è definita dall’espressione che compare nell’ e­
sponente:
q>= k'z-\-(ùt. (6.240)
Questa fase è costante per

%— — p -1 + costante, (6.241)

cioè i piani di fase costante si muovono lungo l ’ asse con velocità


= — © /*'. (6.242)

Questa velocità vf si dice velocità di fase dell’ onda e determina la direzione di


propagazione dell’ onda. Il segno meno nella (6.242) significa che l ’ onda (6.238)
si propaga nella direzione negativa dell’ asse z. Ma se ci muoviamo nella dire­
zione negativa dell’ asse z insieme all’ onda, la sua ampiezza, proporzionale al
fattore e , si attenuerà esponenzialmente. Si può vedere che l’ onda (6.237)
si propaga nella direzione positiva dell’ asse z alla stessa (in modulo) velocità di
fase. L ’ ampiezza dell’ onda è proporzionale al fattore e~k"z e, quindi, si attenua
anch’essa nella direzione di propagazione.
Perciò, in un mezzo conduttore ci sono due onde di data frequenza che si
propagano in direzioni opposte e posseggono la stessa velocità di fase. L’ ampiez­
za di ciascuna di queste onde si attenua esponenzialmente nella direzione di
propagazione.
Segue dalle equazioni di Maxwell che tra le ampiezze E0 ed J/0 esiste la
dipendenza che si esprime, per esempio, mediante la prima equazione della
(6.227). Prendendo in considerazione questa equazione/’ possiamo scrivere le
espressioni per i campi (6.231) nella forma

E = EùeZfh"g•ei(±k'z~ ,
i ? = —— [ftE ] ( 6 . 2 4 3 )
JLICO 0i J
Così, per determinare l ’onda elettromagnetica libera piana in un mezzo
conduttore, bisogna specificare, non solo le caratteristiche del mezzo e, fi, cr5
ma anche la polarizzazione del campo, cioè, per esempio, la direzione e l’ am­
piezza del campo elettrico E0.
Dalla soluzione (6.232) dell’equazione di dispersione (6.230) si vede che il
vettore d’ onda k è una grandezza complessa. Poiché si considera il caso unidi­
mensionale in cui il campo dipende soltanto dalla coordinata z e dal tempo, si
può assumere che il vettore d ’onda k sia diretto lungo l ’ asse 2:
k = k' + ik\ (6.244)
dove entrambi i vettori k! e h " sono diretti lungo l ’asse 2. Quindi in accordo con
la terza equazione della (6.227), il vettore E0 è perpendicolare all’ asse 2. Suppo­
niamo che il vettore sia diretto lungo l ’ asse x\
B0~ { E 0, 0 S 0). (6.245)

236
Quindi,
H 0— (0,0),

(6,247)
cioè il campo magnetico è diretto lungo Tasse y, come si vede dalla (6.243),
Per semplicità assumiamo che la grandezza E 0 sia reale. Allora è una
randezza complessa in quanto Tespressione per f f Q (6.247) include la grandezza
complessa k (6.232).
Rappresentiamo il vettore d’onda k nella forma

k = k'-\-ik"=> | i

dove | fc | — (V/c')a + 0 ")2i tg <p =


campo (6.243) si possono riscrivere come

Ex = E0e - h"zeiih'z- at\


(6.249)
Hy = — |k {

dove, per semplicità, abbiamo usato soltanto i segni superiori nella (6.243).
Si vede da queste equazioni che in un mezzo conduttore le onde dei campi
elettrico e magnetico sono spostate in fase di un angolo tp — arctg (k"lkf).
Quando non c’è conduttività k" — 0 e lo spostamento in fase scompare.
I campi fisici reali E ed H non possono essere grandezze complesse, perciò
il significato fisico va attribuito o alla parte reale o a quella immaginaria dei=
l ’ espressione (6.249). Prendendo, ad esempio, la parte reale, otteniamo

Ex = Eni cos (k'z — (ùt),


(6.250)
E y = —— | k |EQe^ h"z cos {k’ z— ©t + qp)®

Anche la parte immaginaria delia (6.249) conduce a soluzioni equivalenti:


E x = EQe “ k'f'z sin (&' 2— (ùt) ,
(6,251)
Un =“ l k \ E tf k"z sin (&'z — co* + cp).

In conclusione, analizziamo la (6.232) del vettore d’ onda k nel caso di bassa


ed alta conduttività del mezzo. Scriviamo ancora l ’ espressione (6.232), sceglien­
dovi per semplicità il segno positivo

k = coye|i + I ~ ~ (6.252)

Se il valore assoluto del secondo termine del radicando è molto minore del
primo (bassa conduttività), vale quindi la seguente approssimazione:

k — co V + i j / " “ *— = k' -{-ih** (6.253)

In questo caso

fe'=coy, 8|x, k" = j / r ~ - y . (6.254)

237
Si vede da queste formule che nel caso di bassa conduttività, la distanza L
a cui l’onda (6.250) si smorza di e volte, è inversamente proporzionale alla con­
duttività
L= (6.255)
k"

Se s, \i e o non dipendono dalla frequenza, la quantità L ha lo stesso valore


per onde di tutte le frequenze.
Nel caso limite opposto di alta conduttività possiamo trascurare il primo
termine del radicando nella (6.252) rispetto al secondo. Questo comporta

* = (1 + 0 (6.256)
In questo caso le parti reale e immaginaria del vettore d’onda k hanno lo stesso
modulo. La distanza L entro cui l’onda si attenua di e volte è uguale a

Questa grandezza è detta profondità dello skin-strato; il termine viene dal


fatto che se un’onda elettromagnetica piana cade su un buon conduttore (metal­
lo), si smorza rapidamente e perciò il campo è diverso da zero soltanto in un
sottile strato in prossimità della superficie, la profondità (spessore) di questo
strato è dello stesso ordine di grandezza di L . Se o e p, non dipendono dalla
frequenza, la profondità dello skin-strato è inversamente proporzionale alla
radice quadrata della frequenza dell’onda incidente.
Nel ragionamento precedente abbiamo supposto che la frequenza co del­
l’onda elettromagnetica sia una grandezza assegnata e si è determinato il vettore
d’onda k utilizzando la relazione di dispersione (6.230). Si potrebbe procedure in
modo diverso, cioè assegnare una lunghezza d’onda o il suo corrispondente vetto­
re d’onda reale k = 2n./X e, in base all’equazione di dispersione, calcolare la
frequenza dell’onda co espressa mediante il vettore d’onda k ed i parametri del
mezzo e, jLi, o :
co / 4/^
1*2=—*---- ± 1V / --------- (6.258)
*J 8 8fX

Non analizzeremo a lungo questa espressione; notiamo, tuttavia, che entrambe


le radici co1? 2 hanno sempre la parte immaginaria negativa nel caso di e, p, e o
positivi, il che corrisponde allo smorzamento dell’onda col tempo. Infatti, la
dipendenza temporale del campo ha la forma La grandezza co è definita
dall’espressione complessa (6,258) che si può scrivere co = co' + io", dove co'
è la parte reale della frequenza ed co" è la parte immaginaria. Quando co" c 0
si può facilmente vedere che il fattore si smorza col tempo secondo la
legge e+<à"t (non dimentichiamo che co" è negativo mentre il tempo va solo nella
direzione positiva!).
Consideriamo ora le equazioni che descrivono i potenziali di un campo elet­
tromagnetico in un mezzo conduttore in moto. Si sa che in un mezzo conduttore
stazionario uniforme ed isotropo la corrente di conduzione jconé e(^ ^ campo
elettrico E sono connessi:
/'cond —
Quando si passa alle notazioni quadridimensionali, si deve assumere che le
componenti della corrente formino un vettore quadridimensionale ed il campo
elettrico sia espresso mediante gli elementi del tensore di rango due F ih (vedi
la (6.29)). Perciò, nella scrittura invariante relativistica la grandezza or deve
essere espressa mediante gli elementi di un certo tensore di rango tre:
7 co n d =
m , G m h lF k ln
(6.259)
238
Si può controllare facilmente che il tensore di rango tre si può esprimere
come segue:

Omhi — ~2 ~($mhUl « (6.260)


Sostituendo questa espressione nella (6.259), otteniamo / cond = nel riferi-
mento in cui il mezzo è stazionario (Ux = U2 = U3 = 0, U4 = ic). Se il mezzo
si muove con velocità, V, si ottiene dalle (6.259) e (6.260), tenendo conto della
(6.29a),
ìi, conci” (6. 261)
Secondo la formula (6.81) questa relazione equivale alle se uenti formule:

7oond = o r {£ + [FB]}, Peoni = c r ( - 3 -

La prima ha un significato fisico immediato: c la legge di Ohm per un condut­


tore in moto. Nella prima relazione il fattore o definisce il campo elettrico nel
riferimento del mezzo stazionario. La seconda relazione indica che se il con­
duttore stazionario percorso da corrente è elettricamente neutro, nel suo muo­
versi con velocità V su di esso apparirà una carica elettrica (vedi § 6. 1, in cui
è data l ’interpretazione fisica di questo fenomeno).
Nel caso di un mezzo conduttore in moto l ’ equazione (6.60) de^e essere
riscritta:
dfmk
dxk =(Sm~F"sm, cond)»
dove sm,cond = cord è definita dalle formule (6.259), (6.260) e (6.261)
Tenendo conto della (6.261), l ’ultima uguaglianza si scrive
d/mfe
dxk
' mhUk —sm•
Sostituiamo in questa equazione la grandezza fmk dalla (6.200), in cui il
tensore emkin ® definito dalla (6.201). Allora l ’ultima equazione diventa l ’ equa­
zione che descrive le componenti del tensore Se esprimiamo ora Fmh me­
diante i potenziali del campo secondo la (6.199), otteniamo l ’equazione
potenziali del campo in un mezzo conduttore in moto:
f d* x
\dx\- c2 C^-sr)
— [1C
(<
& m h “f
1+X
Qui i potenziali G>m soddisfano l ’ulteriore condizione complementare
U, ,u kj Sk* (6.262)

dOh x, 7 dOf
dxk ■UkUt •
c2 -o\.iUk®h = 0,
dxfr
che è la generalizzazione della condizione (6.210) al caso di un mezzo conduttore.
Quando in un mezzo le sorgenti sh sono assenti, otteniamo dalla (6.262)
il seguente sistema. di equazioni omogenee:

Questo sistema definisce la propagazione di onde elettromagnetiche libere


un mezzo in moto che nel riferimento stazionario ha costante dielettrica e,
permeabilità magnetica p e conduttività 0 .
Se l ’ onda elettromagnetica piana del tipo (6.216) si propaga in tale mezzo,
il legame fra la frequenza co e il vettore d’ onda k ha la forma
co2
A-2. ---------- x r* (c o - feF)2-|-io[ir ( ù > - 7 i F ) - 0 . (6.263)

239
Questa equazione di dispersione segue dall1equazione differenziale precedente
se si tiene conto che l’operatore di gradiente = dldr applicato ad un’ onda
piana del tipo (6.216) equivale a moltiplicare per —ik, e l’ operatore di diffe­
renziazione rispetto al tempo d/dt equivale a moltiplicare per 10. Quando la
conduttività del mezzo o si annulla, l ’ equazione (6.263) si trasforma nella
(6.218).
Dopo avere assegnato la frequenza o> e la direzione di propagazione del­
l ’ onda, si può definire il modulo del vettore d’ onda k (e, quindi, la lunghezza
d’ onda X = 2n/k) dall’ equazione (6.263). Inversamente, assegnati il modulo e
la direzione del vettore d’ onda si può determinare la frequenza dell’ onda co.
Se si assume data una di queste grandezze, k o 0, l’ equazione (6.263) diventa
un’equazione quadratica rispetto all’ altra. Questa equazione ha coefficienti
complessi, e perciò le sue soluzioni saranno complesse. Dalla forma dell’onda
(6.216) segue che se; la sua frequenza è complessa, l’ onda non è più monocroma­
tica e si amplifica o si smorza esponenzialmente nel tempo. In questo caso
l ’ indice di smorzamento (0 di amplificazione) è uguale alla parte immaginaria
della frequenza 0. Se la parte immaginaria ©" della frequenza co è positiva,
Fonda si smorza, e se è negativa, Fonda si amplifica nel tempo.
Se sono assegnate nell’ equazione (6.263) la frequenza 0 e la direzione di
propagazione dell’onda (l’ angolo 0 fra V e &), otteniamo un’equazione quadratica
per il valore assoluto di k. La soluzione di questa equazione dà, in generale,
valori dì k complessi. In questo caso le due radici complesse coniugate del­
l ’equazione (6.263) corrispondono all’amplificazione 0 allo smorzamento espo­
nenziale dell’ onda nello spazio. In seguito ci limiteremo al caso di un piccolo
smorzamento, quando la parte immaginaria della soluzione dell’ equazione
(6.263) per k si può considerare piccola rispetto a quella reale. In questo caso
particolare il segno della parte immaginaria di k non definisce se Fonda si
amplifica 0 si smorza nello spazio. Infatti, sia k! + ik ” una delle soluzioni delle
equazioni (6.263) Gon 0 e 0 assegnati, con k' reale e k" immaginaria. La direzione
del vettore d’ onda è definita dal vettore unitario n in modo tale che
k — kn = (k' + ik") n.
Dirigiamo l’ asse z del sistema di coordinate cartesiane lungo il vettore n.
Allora Fonda (6.216) si scrive
A= -* r ) . ei«*t - fe'z) a (6.264)

Per lo smorzamento piccolo (k" <c &')> Fespressione (6.264) si considera come
la definizione di un’onda che ha vettore d’onda k! e la frequenza 0, l ’ ampiezza
di quest’ onda cambia secondo la legge esponenziale ek"z. Supponiamo che k"
sia una grandezza positiva. Per giungere a qualche conclusione riguardo al
comportamento dell’ onda, bisogna conoscere la direzione di propagazione
dell’ onda, cioè il segno della sua velocità di fase. La velocità di fase dell’onda
è uguale al rapporto 0//F. Infatti, il piano di fase costante dell’ onda (6.264)
è definito dalla relazione^ 0* — k'z — costante, da cui z = %-t — coS^ ? -t- 6
“ k k
Si vede dall’ultima relazione che il piano di fase costante viaggia con velocità
<ù/k'. Se co/k' >* 0, l ’ onda (6.264) si propaga nella direzione positiva dell’asse
Allora per k" > 0, Fonda si amplifica, e per F < 0, si smorza. Se calk' C 0,
Fonda si propaga nella direzione negativa dell’ asse 2. Allora per k" > 0 Fonda
si smorza nella direzione della sua propagazione (sebbene la sua ampiezza
aumenti nella direzione positiva dell’ asse z). Perciò per determinare se Fonda
si smorza 0 si amplifica, non basta conoscere la legge di variazione spaziale
dell5ampiezza, bisogna conoscere anche la direzione delia sua propagazione.
G’è un metodo semplice che rende possibile trovare se Fonda si smorza o si
amplifica nella direzione della sua propagazione. Analizziamo l ’espressione
<ùk"lk’ . Se questo prodotto è positivo, Fonda si amplifica nella direzione della
sua propagazione; nel caso contrario l’ onda si smorza. Si vede facilmente che
l ’espressione <ùk7fc'_ è il prodotto della velocità di fase dell’ onda per il decre­
mento di smorzamento dell’ onda nello spazio.

240
Consideriamo ora la soluzione' deli’equazione di dispersione '(6.263:). Sia:Ji­
ll modulo del vettore d’onda e la sua direzione formi un angolo 0^con vettore,
velocità V del mezzo. In questo caso kV — k V cos 0. L’equazione di dispersione'
(6.263) è un’ equazione quadratica rispetto alla frequenza©. Risolvendola nel
caso di bassa conduttività o e omettendo tutte le potenze di cr superiori al primo
ordine, otteniamo
co,, 2« = ( i + x r 2)- ‘ j [ x r w cos /À J +

+ (6.265)

dove x = ^ 2 , B=
Questa equazione mostra che se. nel riferimento del mezzo stazionario ep >*
> e0p0, cioè Per « — (?i2 — 1)/c 3 > 0, la parte immaginaria della frequenza
© è sempre positiva per entrambe le soluzioni, qualsiasi sia la velocità V del
moto del mezzo. Questo significa che per un dato vettore d’onda k l ’onda (6.216)
si smorza sempre nel tempo. Il decremento di smorzamento è proporzionale alla
conduttività <7.
Consideriamo ora il caso in cui le grandezze date dell’ onda (6.216) siano
la frequenza © e la direzione di propagazione, definita dall’ angolo 0. Allora,
dall’ equazione di dispersione (6.263) si può determinare il modulo del vettore'
d’onda k che corrisponde ai valori dati di © e 6. Le soluzioni di questa equazione:
hanno la forma klì2 ~ K,z + ^ ' 1,2- Per cr piccoli otteniamo dopo piccole tra­
sformazioni
c /c '= G > (i+ x r 2) (xBr® COS0+ / À ) " 1,
2c r = — ca|xr(l— B2cos 20) ( l + B c o s e / a ) -1; (6.266)
e/c'= — co (xB r 2cos 0 + / À ) (1 — xB 2r 2cos29)-1,
2 ck'i= cojir (1 + B cos 0
Qui la grandezza A è sempre positiva per le assunzioni fatte in precedenza.
Usando la (6.266) si possono ottenere le espressioni per i prodotti (àk"lì2lk'lì2a
Esse hanno la forma seguente:
© __ gpc2P (1 — B2cos 20) (xBL 2c o s Q -f]/A )
1_ ~ 2 (1+ xr2) (l + B cos 0 / A) ’’
© __ ______o\ic2T (l-f-B cos 0 y A)
K2_ 2 (x B r 2c o s e + )/" A ) / A '
Si vede immediatamente da ciò che se x > 0, i prodotti ©AJ J k f 2sono sempre
negativi, qualsiasi sia la velocità del moto del mezzo. Questo significa che in
un mezzo conduttore in moto Fonda (6.216) si smorza sempre nella direzione
della sua propagazione. L’unica peculiarità del mezzo in moto consiste nel fatto
che per la velocità del moto del mezzo, soddisfacente la condizione
1 — xB 2F2 cos2 0 = 0 o B = 1/(1 + x cos2 0), le parti reale ed immaginaria
della seconda soluzione cambiano simultaneamente segno.
I potenziali ottenuti risolvendo le equazioni (6.211) e (6.262) si usano con
successo per risolvere altri problemi (vedi la bibliografia alla fine del libro),
molti dei quali però, non rientrano nello scopo del libro.

241
VII. FENOMENI OTTICI E TEORIA DELLA RELATIVITÀ
RISTRÉTTA

La luce, pur essendo un caso particolare di onde elettromagnetiche*


viene descritta dalla teoria di Maxwell. Come si è visto nel capitolo
precedente, la teoria di Maxwell soddisfa tutte le richieste della
teoria della relatività, e perciò deve descrivere correttamente tutte
le proprietà di un oggetto tipicamente relativistico come la luce.
Ma anche nella teoria della relatività la propagazione della luce nei
vuoto occupa una posizione particolare. Abbiamo già sottolineato
che la velocità della luce nel vuoto è la velocità limite per la tra­
smissione di un segnale ed una velocità limite non ottenibile per corpi
dotati di massa a riposo finita. Inoltre, alla base della TRR c ’ è il
fatto che la velocità della luce nel vuoto è la stessa in tutti i SRI.
La teoria di Maxwell è una teoria macroscopica; in questo capi­
tolo conviene esaminare V approccio microscopico e per certi versi
anche metodi di meccanica quantistica. Intendiamo introdurre
a questo punto i fotoni. Per certi aspetti, Vintroduzione di concetti
quantistici porta ad un quadro più descrittivo. L’ utilizzazione della
teoria della relatività diventa indispensabile se consideriamo i feno­
meni ottici associati al moto dei corpi (effetto Doppler, aberrazione).

§ 7.1. Proprietà delle onde luminose


piane

La teoria di Maxwell mostra che in un mezzo uniforme ed isotropo


(e = costante, p = costante) con conduttività a = 0, i vettori
dipendenti dal tempo E ed IT (così come D e B che sono proporzionali)
soddisfano le equazioni d ’ onda
d*E
□ J?= A E - 4 r 0,
V3 ~dt2
(7.1)
d*H
□ H = AH-----l- 0.
V2 dt2

Questo significa che in un mezzo uniforme non conduttore le


onde si possono propagare, con velocità di fase v = 1 /V ep definita
completamente dalle proprietà del mezzo. Una delle possibili solu­

242
zioni della (7.1) conduce alle onde piane:
E = E 0e ^ ~ h>'\ (7.2)
dove co è la frequenza circolare (si assume che i vettori campo dipen­
dano in modo armonico dal tempo, il vettore d ’ onda k sia diretto
lungo la normale alla superficie di uguali fasi (fronte d’ onda)).
Segue dalla (7.1) che il valore assoluto del vettore d ’ onda k è uguale
a (o/i? se le onde si propagano in un mezzo e ad co/c se si propagano
nel vuoto. Poiché n — Y sfx/e0Po> si può scrivere nel caso generale
k~ ~ ~ ns, (7.3)
dove s è un vettore unitario orientato lungo la direzione di propaga­
zione. Nel caso del vuoto, n ■= 1. La fase dell’ onda (7.2) è uguale
a iùt — kr e perciò la superficie di uguali fasi è definita dall’ equazio­
ne (ùt — kr — costante. Ad un dato istante essa rappresenta il
piano kr = costante, con il vettore della normale orientato lungo k
(r è il solito raggio vettore tridimensionale). Al passare del tempo
questo piano si sposta nello spazio parallelo a se stesso secondo l ’ equa­
zione kr = costante - 4- gjt.
Le onde piane (7.2) devono soddisfare non solo le equazioni
d ’ onda (7.1), ma anche le equazioni di Maxwell (6.56) e (6.57) in
assenza di cariche (p = 0) e correnti (j = 0); sostituendo la (7.2)
nelle equazioni di Maxwell, otteniamo i risultati seguenti. In un’ on­
da piana che si propaga in un mezzo uniforme i vettori E, H e k
formano una terna destrorsa, cioè sono mutuamente perpendicolari
e il prodotto vettoriale di ogni coppia, presa nell’ ordine indicato,
definisce la relazione del terzo vettore.
Per la relazione tra le ampiezze, vale la seguente equazione:
V yJI
mo E = cB.
La direzione del vettore di Poynting S coincide con quella del
vettore k , mentre il suo valore assoluto è uguale al prodotto della den­
sità d ’ energia dell’ onda piana per la velocità di propagazione dell’ on­
da v, cioè S = wv, o S = wv (k/k), dove w è la. densità d’ energia
dell’ onda elettromagnetica. Il risultato ha un chiaro significato
fisico: il vettore di Poynting determina il flusso di energia per unità
di tempo attraverso un’ area unitaria normale all’ onda incidente.
Ma l ’ energia che attraversa per unità di tempo l ’ area unitaria è con­
tenuta dentro un cilindro, la cui direttrice è formata dal contorno
di quell’ area unitaria e le generatrici da rette parallele alla direzione
di propagazione dell’ onda. L ’ altezza del cilindro deve essere presa
uguale a v. In questo caso la grandezza v definisce il volume del cilin­
dro costruito, ed il prodotto vw, l ’ energia del campo elettromagnetico
contenuta nel cilindro. Tutto ciò risulta in S — viv, È da notare
anche che per un’ onda piana
+p#2
~2
mentre nel vuoto w = SqE2.

243
L ’ impulso dell1unità di volume g (densità d'im pulso);del campo
elettromagnetico nel vuoto è uguale a &'le2 . Nel caso di onda piana
nel vuoto, quando S — cw, otteniamo g — (wlc) (klk)A da cui
g — wlc. (7.4)
La densità d’ impulso del campo in un mezzo verrà esaminata nel
§ 7 del presente capitolo. Ricordando gli invarianti I x è 12 del cam­
po elettromagnetico (§ 6.5), troviamo che, nel caso di onda piana
nel vuoto, entrambi gli invarianti si annullano. Questo ^gnifica
che in qualsiasi riferimento i vettori E ed H dell’ onda piana sono
ortogonali, ed il rapporto tra le loro ampiezze è sempre lo stesso- Nel
riferimento 1C un’ onda piana deve prendere la forma
■E' = E\e^ (7.5)
La fase dell’ onda nel punto d ’universo R (r, ict) non può dipen­
dere dalla scelta del sistema di riferimento, perciò la fase (ùt — kr
deve essere un invariante delle trasformazioni di Lorentzo Di com
seguenza, : ;
coi — kxx — k yy — k xz = o o t' — k'xx f — k'yy r — k'zzr. (7.6)
Sostituendo dalla (2.37) le formule di trasformazione per x ,.z/', z\ tf
nel secondo membro della (7.6), otteniamo

cot-—kxx — kyy — kzz = coT x j — kxT (x — Vt) — k%tj~k'zz.

Questa è un’ identità rispetto a t, x, y, z. Tenendo presente che k =


— (Sòie e kx — —Sxi ky — R sy> fcz ~ ~ s z (s è un versore che coincide
con la direzione di &), otteniamo
co— coT (1 Bri), (ùsx = coT (B + (ùsy = (ù'syi cosz=co'Sz (7.7)

Da queste equazioni si ottengono facilmente le formule che


descrivono l ’ effetto Doppler (la variazione di lunghezza d’ onda della
luce emessa da una sorgente in moto rispetto all’ osservatore) e l ’ aber­
razione della luce (il cambiamento di direzione del raggio luminoso
nel passaggio da un sistema inerziale ad un altro); per evitare ripeti­
zioni, descriveremo in modo diverso le formule (7.7) e poi, nel pros­
simo paragrafo, indagheremo sulle conseguenze.
Comincererno con l ’ approccio quadridimensionale. È già stato
sottolineato che la fase (ùt — kr deve essere un invariante delle
trasformazioni di Lorentz. Ma questa espressione diventa automati­
camente un invariante se viene rappresentata come il prodotto
scalare di quadrivettori (Tinvarianza del prodotto scalare è mostra­
ta nell’ Appendice I, § 4). A questo scopo è sufficiente introdurre
—^
il quadrivettore d’ onda k (&, i(ù/c) insieme al quadriraggio vettore
R (r, ìct). Allora, cùt — kr = — kR, L ’ introduzione del quadrivetto-

244
re d ’ onda conviene1soprattutto perché si ottiene Immediatamente la
regola per la trasformazione delle sue componenti nel passaggio da
un SRI ad un altro. Se un’ onda luminosa piana si propaga nel
riferimento K ' la sua direzione e la frequenza, osservata cambiano
passando al riferimento K. Vedremo che anche l ’ ampiezza dell’ onda
piana varia. Le equazioni di trasformazione delle grandezze che carat­
terizzano l ’ onda luminosa nei riferimenti K e K ' si ottengono facil­
mente se si tiene presente che in un’ onda luminosa piana il vettore
d’ onda Jc\ convenzionale e i ((o/c) formano il quadrivettore k.

§ 7.2. Quadrivettore d’ onda. Effetto


Doppiere Aberrazione della luce
Consideriamo un’ onda luminosa piana osservata nel sistema di
riferimento I\ e descritta dal quadrivettore il riferimento K r
è scelto in modo che il raggio luminoso si propaga nel piano (x\ y f)
ad angolo 0 con l ’ asse x f. Scriviamo le componenti del quadrivettore:

:K - - W c o s # ' — — cos k' = k f sin # ' — s in # ' ,


(7.8)
o, =

Ora troviamo le componenti del quadrivettore k nel riferimento K .


Secondo le equazioni generali (4.10a)
= & 4 = r ( * ;+ .® * ;) . (7.9)
Poiché * 3 = 0, nel riferimento K il raggio si propaga anche nel pia-
no + , z/). Di conseguenza, il quadrivettore k ha le componenti
k cos'd, ~ sin#, 0, nel riferimento K . Dall’ultima equazio­
ne (7.9) troviamo

i—
c =F \
( t ^c + 1 iB —
c c o s # 's)ì
o
1 + B cos U'
CO - co' coT (1 + B cos # '). (7.10)
] A — B2
Di conseguenza, se nel riferimento K ' la frequenza della luce è co',
nel riferimento K sarà differente, secondo la (7.10). (cfr. le (7.7)).
Segue dalla prima formula (7.9) che

— c o s d - P f— c o s r - 7 B i — )
c Ve c )
o, se viene considerata la (7.10),
cos + B
cos $ — (cos #' + B) = 1+ B cos {B (7.11)
La seconda formula (7.9) insieme con la (7.10), dà
/ 1 - B2 sin il'
sin ft = — s i n#' : r sin f t ' = (7.12)
0) 1-j-B cos 1 r ( l + B co sft') •
Usando le (7.11) e (7.12) si può facilmente trovare l ’ espressione di
sin ft' mediante ft:
sin d
sin ft' (7.12')
r (1 — B costì) ‘

È da notare che la (7.12') si ottiene immediatamente dalla (7.12),


sostituendo le quantità con indici con quelle senza indici e viceversa,
e prendendo la velocità V col segno opposto. Le equazioni ottenute
permettono di dare un’ interpretazione quantitativa a due fenomeni
ottici tipici: l ’ effetto Doppler e l ’ aberrazione della luce. L ’ effetto
Doppler (esso si osserva per onde di ogni tipo) consiste nel fatto che
nel caso di moto relativo della sorgente e delDosservatore (ricevitore)
la frequenza (del suono o della luce) determinata dall’ osservatore
è diversa da quella misurata nel riferimento in cui la sorgente è a ri­
poso.
Supponiamo che la sorgente sia a riposo nel riferimento IC .
Allora gli strumenti in questo riferimento determinano l ’ autofre­
quenza propria co0 della sorgente di luce (co0 = co').
Quando si determina la frequenza co nel riferimento K , bisogna
convertire l ’ angolo ft' nell’ angolo ft. Segue dall’ equazione (7.11) che
cos ft — B
cos ft' 1— B cos ft
da cui 1 + B cos ft' = (1 — B2)/(l — B cos ft), e, di conseguenza
la (7.10) si può riscrivere nella forma finale
YT- -B2 (7.13)
CO (D0 ^ B COS ^

Questa è l ’ equazione che descrive l ’ effetto Doppler. Un osservatore


del riferimento K osserverà la frequenza co della radiazione che diffe­
risce dall’ autofrequenza co0 della sorgente. La frequenza osservata co
dipende non solo dalla velocità relativa della sorgente e dell’ osser­
vatore (B — Vie), ma anche dall’ angolo ft formato dalla luce rispetto
all’osservatore.
In particolare, se la radiazione viene lungo la direzione della
velocità relativa, si osserva il cosiddetto effetto Doppler longitudinale.
Se il riferimento IC è alla destra di K , la sorgente si allontana
dall’ osservatore e la luce si propaga nella direzione opposta all’ as­
se x (fig. 7.1, a). Di conseguenza, cos ft = cos n = — 1. Allora dalla
(7.13) otteniamo per la frequenza co e per il periodo T = 2n/co

T ~ T‘ V S -
Un osservatore che riceve la luce dalla sorgente che si allontana
da lui trova che la frequenza diminuisce.

246
Al contrario, quando il riferimento K r è alla sinistra di K
(fig 7.1, b) cos'd = 1 e la sorgente si avvicina all’ osservatore:
/■ 1 + B . T “1/ __ 2_
co = co,- o j /
1— B ,ioK 1t B
La frequenza della luce ricevuta dall’ osservatore aumenta rispetto
all’ autofrequenza naturale co0. A meno di termini in B2 le ultime

K K
Osservatore Sorgente
a)
Luce xx

K K
Sorgente 3=0 Osservatore
b)
V Luce

Osservatore
Fig. 7.1. Effetto Doppler longitudinale: a) l ’ osservatore e la sorgente si allonta.
nano; b) l ’ osservatore e la sorgente si avvicinano; c) effetto Doppler trasversale-

due formule si possono riscrivere come segue (il modo più semplice
è di moltiplicare sia il numeratore che il denominatore del radicando
per il numeratore):
co = coq ( 1 — B ), co =:==coq (1 B ).
Entrambe le formule si possono riunire.
co— co0 Ao) , ,,
----------= ------— -f- -D.
co0 co0

Dunque, l ’ effetto Doppler trasversale è un effetto del primo


ordine rispetto a B. A meno di termini del secondo ordine rispetto
a B le formule ottenute coincidono con quelle classiche che seguono
da considerazioni elementari (§ 3.3).
Se la luce è osservata in direzione perpendicolare alla velocità
della sorgente, (fig. 7.1, c), questo caso corrisponde a d = it/2 e si di­
ce effetto Doppler trasversale', la variazione di frequenza è descritta
dalla formula
co — co0] / 1 — B2

247
e dipende già da BN Se lé velocità del moto della sorgente sono non
relativistiche, lo sviluppo binomiale fornisce :
co = co0 (1 “ ” B1
2/2>.
Questo è un effetto del secondo ordine, e la sua osservazione è più
difficile delPosservazione dell’ effetto trasversale. Non bisogna mera­
vigliarsi-se l ’ effetto Doppler trasversale è stato osservato, solo nel
1938 (Ives), e la formula relativistica è stata confermata in pieno h
Ci piace puntualizzare ancora una volta che nella teoria classica non
dovrebbe esistere nessun effetto Doppler trasversale (cfr. § 3.3).
L ’ effetto Doppler trasversale si manifesta soltanto a causa della
relatività degli intervalli di tempo fra gli eventi.
Riscriviamo la formula (7.13) nella forma usata nel § 6.15.
Raggruppiamo tutte le grandezze che riguardano il riferimento
K nella parte destra: ; .
<B0 = r w ( i —X cos ft) = r ( © — -j- v cos ft) = r ( o — . . 14)

L ’ autofrequenza compare nel primo membro, mentre il secondo


contiene la frequenza osservata nel sistema di riferimento in moto
con velocità F, con la direzione di propagazione della luce definita
dal vettore k.
Le (7.11) e (7.12) coincidono con le formule derivate direttamente
dalle formule di trasformazione delle velocità; perciò descrivono
pienamente il fenomeno dell’ aberrazione menzionato nel § 3.6.
In particolare, l ’ espressione per l ’ angolo di aberrazione segue
dalle. (7.11) e (7.12):
sintì' V i — B 2
tg ft (7.15)
B + cos ih
Per concludere questo paragrafo, deriviamo la formula di tra­
sformazione per l ’ elemento di angolo solido scritto in coordinate
sferiche. Orienteremo l ’ asse polare lungo la direzione del moto rela­
tivo dei due riferimenti (l’ asse x, x ) . Nel riferimento K ' l ’ eleinento di
angolo solido dQ' si scrive come dQr^ sin.ft' dIL <7cp' — — d (cosdQcfcp'.
Poiché le coordinate y e z non cambiano, la coordinata cp, che è la
proiezione sul piano perpendicolare alla direzione del moto, non
cambia: cp = cp' e dcp = dcp;. Dalla formula che precede la (7.13)
segue che
1 — B2
d (cos # ') - sin # dp,
(1— B cos é )2
da cui si ottiene la formula cercata
1 dQ
dQ' = T2(1 — B cos i sin Ù d$ dcp — (7.16)
r 2(1 — B cos d )2
perciò nel riferimento K l ’ elemento di angolo solido dQ è uguale a
dQ = sin d db dcpe
1 I dettagli dell’esperimento di Ives si possono trovare nella monografia
di G. S. Landsberg, Ottica, Edizioni Mir, 1979 (in italiano).

248
§ 7.3. Onda piana limitata nello»
spazio. Trasformazione dell’ energia
e dell9ampiezza di un’ onda piana

Calcoliamo le componenti del tensore energia-impulso-tensione nel


caso di un'onda piana. Orientiamo l ’ asse x lungo la direzione di
propagazione dell’ onda, l ’ asse y' lungo il vettore E' e l ’ asse z’ lungo»
il vettore B f. Con tale scelta degli assi, E# = D'x = B'x = H'x —
— E fz ~ D'z — Hy = By = 0. Il tensore T'ik prende la forma sem­
plice (vedi le (6.128)3 (6.148) e (6.451)):

( — w9 00 —ìw f
0 0 Q 0
(7J7>

0 0 0 0
Avremo bisogno anche delle componenti del tensore T'ik nel caso-
— iw' 0 0 ip'
di un’ onda piana che si propaga nel piano (x*, y f) ad un angolo d '
rispetto all’ asse x . Tale passaggio si effettua mediante una semplice
rotazione del sistema di coordinate; la matrice dr questa trasforma­
zione di coordinate prende la forma

/ cosd ' *— si nd- 0 0


I sind* cos d ' 0 0
(7.18)
i o 0 1 0
V . 0 0 0 1

Trasformando le componenti del tensore (7.17) mediante la matrice


(7.18) secondo la regola generale di trasformazione dei tensori^
otteniamo il tensore T*ik

/ — w* cos2 d # — w* s in d 'c o s d ' 0 — iw9cos d*


I — wf sin d ' cos d ' —w 9sin2 d ' 0 — ìwf sin d '
Tik = \ 0 0 0 0
\ .— ìw' cos d ' — ih? 's in d ' 0 wr
(7.19)
Perciò in particolare,

w' = w', S'x = cw! cos d\ — — wf cos2 d '. (7.20)

Dimostriamo ora il seguente teorema: un’ onda piana limitata


nello spazio lungo la direzione di propagazione (un’ onda di queste
tipo è chiamata anche « treno d’ onde ») possiede un impulso ed un’ e­
nergia che formano un quadrivettore simile al quadrivettore energia-
impulso di una particella materiale (questo teorema è un caso parti--

249n
colare di un teorema più generale 1). Per dimostrarlo dobbiamo
conoscere la formula che definisce il cambiamento di volume occu­
pato dal treno d ’ onde nel passaggio da un riferimento inerziale ad
un altro. Le difficoltà che si incontrano derivano dal fatto che il
treno d ’ onde si muove alla velocità della luce c e ciò significa che
il volume del treno non può essere misurato nel proprio sistema di
riferimento (è impossibile introdurre un riferimento che si muove
alla velocità della luce!). Comunque, si può tralasciare d’ introdurre
un volume proprio, facendo un passaggio limite alla velocità della
luce. In questo caso, secondo la (3.28),

r = n / i (7.21)

:Se si considera questo volume nel riferimento K, la sua velocità v


.sarà determinata dall’equazione (3.41) e, quindi, il valore 7 ‘ di
questo volume nel riferimento K sarà uguale a

— B2
Y1
r = r „ | / i — J ■ = r0 T r-
B cos d ' 1 + — B cos •&'
c
da seconda uguaglianza deriva dalla (3.41). Qui v' è la velocità del
moto nel riferimento K '. Ora, passando al limite z/-*- c, otteniamo
la formula richiesta
Y 1— B2
T = T r 1-| B c o s ù ' ’ (7.22)

Così, se un certo volume è uguale a 7r> nel riferimento K r, nel rife­


rimento K , che si muove con velocità V rispetto a K ' si osserva un
volume il cui valore è determinato dalla (7.22). Si capisce che c ’ è
una relazione analoga per i differenziali dei volumi:
Y 1— B2 1
dT = dT' 1 + B cos ù ' r (14- B cos iL)
dT7 (7.23)

Ritorniamo a dimostrare il teorema. Applicando le formule generali


di trasformazione dei tensori (A. 1.31) al tensore (7.17) otterremo le
componenti della quarta riga della matrice T ih nel modo seguente:
Ta = + B)2, r 42 = 0,
Tu = o, r 44 =

1 II teorema generale è presentato in [13], § 57 e nel libro di W. Heitler


The Quantum Theory of Radiation, Oxford, 1954, § 2. Il teorema generale si può
•così formulare: nel dominio di spazio, dove il tensore Tik soddisfa la condizione
Tik = 0 e Tik = 0 alle frontiere, le componenti Tik costituiscono le com­
ponenti di un. quadrivettore.

250
<c per il tensore (7.19) le componenti
Tu = - i W (B + cos d ') (1 + B cos d ' ) ,
T 42 = — iTw' sin d ' ( 1 + B cos d ' ) , (7.25)
r 43 = o , r 44= r 2 w '( i + B c o s # ') 2-
Naturalmente, quando 0 ' = 0, le formule (7.25) si trasformano nel­
le (7.24). Mostriamo ora che le componenti (7.25) e, quindi, nel caso
particolare, anche le (7.24), m oltiplicate per il volume o p erl’ ele-
mento di volume, si trasformano come vettori nell’opportuno sistema
•di riferimento. Infatti, ad esempio,
Ttld T — T ( — iw'cos d ' — ì B m;') = T (T'^dT' —
Ti3d r = T'ì3d T ' = 0, (7.26)
Tkkd T = T (w'+ Bin' cos d) d T ' = T (T'u d T ' +
Confrontando le formule ottenute (7.26) con le formule di tra­
sformazione dei vettori, si conclude che le grandezze Tkl, 7’42, r 43, r 44,
•cioè le componenti della quarta riga del tensore (7.17) o (7.19)m olti-
plicate per l ’ elemento di volume corrispondente, formano un qua-
drivettore.
Naturalmente questo risultato si mantiene dopo l ’ integrazione
sul volume o la moltiplicazione per il volume totale, se le componenti
Tjf, del tensore non dipendono dalle coordinate come per il caso
d ell’ onda piana.
Troviamo l ’ energia totale del treno d ’ onde nel riferimento
•(vedi la (7.19))
U ' = \ f ' lidT'=\w'dT'.(7.27)

Le componenti dell1impulso totale del treno d ’ onde sono definite


dalle formule seguenti:

G’x =-Vf'^dT' = - f
4~ V
G'y = ~C J V ^ ' = 4 s C
i n d ', G’z = 0 .
c <7'28>
Calcoli simili si possono fare anche nel riferimento K\ le (7.25) per­
mettono di compiere direttamente la trasformazione dell’ energia
totale:

u = J TVid T = T (1 + B cos 0')* J r (1 ^ ' s-^ y = T (1 + B cos d ')


(7.29)
Calcoliamo anche le componenti dell’impulso totale
6*= 4 JT ikd T = 4 ( — *r) (B + cos d') j =

= — r (B + cos d ') = — cos d, (7.30)


c c
251
dove abbiamo usato nell’ ultima uguaglianza la formula (7.11); nello
stesso modo, usando la (7.12), otteniamo

Gv = \ TyjdT = —,Uì sin •&'= — F (i -|- B cos § ') Ue sin $ = — sin


y cJ ^ c c v 7 c
Allora in ogni sistema eli riferimento inerziale possiamo introdurre
il quadrivettórè

F ' cos {F, -p—sin ft', 0, i — ■ (7.31)

con P '2 ~ 0 in tntti i riferimenti.


Segete dàlia condizione P '2 = 0 che l ’ onda di luce nel vuoto non
può essere a riposo in nessun sistema di riferimento inerziale. Com
frontando le componenti P ' (7.31) con le componenti (7.8) vediamo
che le formule di trasformazione per U' ed to' devono essere le stes­
se. Questo implica che il rapporto U 'ìco' deve essere invariante. Di
conseguenza, l ’ energia dello stesso treno d’ onclc misurata da osserva­
tori diversi risulta differente. Il rapporto tra le energie è uguale ah
rapporto tra le frequenze della radiazione monocromatica che forma
il treno d ’ onde. Le frequenze sono determinate dagli stessi osserva­
tori che misurano l ’ energia. Il treno è supposto sufficientemente
lungo in quail Lo, in caso contrario , non potrebbe essere, neppure
approssimativamente monocromatico.
Dalle formule ottenute si trova facilmente la legge di trasforma­
zione dèlie ampiezze nell’ onda piana. Infatti, dalla (7.25) otteniamo
la formula’ seguente per la trasformazione della densità di energia:
w = w'T2 (1 + B cosft')2*
Confrontando questa espressione con la formula di trasformazione
della frequenza (7.10)
co — coT (1 -f- B cos ft'),
si vede che la densità d ’ energia si trasforma come il quadrato della
frequenza. Poiché la densità d’ energia è una funzione quadratica
delle ampiezze del campo di un’ onda piana, esse si trasformano
secondo la stessa regola della frequenza.
Per illustrare Papplicazione di un’ onda elettromagnetica come
un sistema, la cui energia ed impulso formano un quadrivettore,
consideriamo come si trasforma la distribuzione angolare della
radiazione di un oscillatore di dipolo nel passaggio dal riferimen­
to K ' in cui il suo centro d ’ inerzia è fermo ad un altro SRI. Nel
riferimento in cui il centro d’ inerzia dell’ oscillatore è a riposo e l ’ as­
se polare è diretto lungo l ’ asse clelPoscillatore,l’ intensità della radia­
zione di' nella direzione (ft', tp') è uguale a d i' (ft', cp') = costante X
X sin2ft'<7Q'. Ma l ’ intensità della radiazione eli — d&!dt, cioè
l ’ energia irradiata in una data direzione per unità di tempo, è una
grandezza relativa. La sua legge eli trasformazione è facilmente

252'
definibile; nel caso della radiazione d z — c d P , dove d P è la frazio­
ne dell’ impulso che sfugge con la radiazione in una data direzione,
essendo noto che dz — cdP\
Secondo le trasformazioni di
Lorentz
dz' — Y (de - VdP) = r (de —-
— VdP cos ft) = Yds (1 — B cos ftj,

dt' — -^rdt
{ dt è il tempo proprio). D ivi­
dendo termine a termine bugiia-r
glianza superiore per quella
inferiore, otteniamo
^T de ds>* 1 __
a i ~ ~1T = — (1 — Bcos ft) ~
— dr
f 2(1— B cos ft) *
Quindi otteniamo immediata­ Fig. 7.2. La variazione della distri­
buzione angolare della . radiazione di
mente il risultato cercato: un oscillatore di dipolo nel passaggio
sin2 ft'^Q' da un riferimento K' in cui l ’ oscil­
d i — costante « latore è a riposo (B — 0) 'ad! un rife­
F2(i — B cos ft)
rimento K , rispetto al quale si muove
sin 2ft'dQ (B = 1/2). Si vede come il massimo
= costante « della radiazione si inclina verso la
F4 (1 —B cos ft)3
direzione di moto, dell’oscillatore.
L’asse dell’ oscillatore è orientato nella
( i — ‘— } sin2^ direzione del moto dell’ oscillatore.
= costante - ~7 y ~ dQ,
1 1—— cos ft
)
dove abbiamo usato le formule (7.16) e (7,12'). Si vede dalla formula
ottenuta che la dipendenza angolare della radiazione nel riferimen­
to K, rispetto al quale l ’ oscillatore si muove, è essenzialmente diver­
sa dalla dipendenza angolare nel riferimento K \ specialmente nel
caso in cui V ^ c. In questo caso il massimo della radiazione si
osserva in una direzione che forma un angolo acuto con l ’ asse dell’ o-
scillatore (fig. 7.2).
Vale la pena di considerare come si comporta nel riferimento
K una radiazione isotropa nel riferimento K ' . Abbiamo a disposizio­
ne tutte le formule necessarie. In questo caso di' ($', < p ')= costan­
t e \dQ' e
d i' costante
dl = dQ* =
F2(1 — B cos ft) F2(1— B cos ft)

costante °dQ r
r* (1 —Bcos d)2 ~ costante dQ.
(, V 3
1--------cos
c

253
D all’ultima formula si può vedere in K « Veffetto di un riflet­
tore ». La radiazione si concentra attorno alla direzione = 0, ini
quanto il valore del denominatore è minimo per C os'O c 1 (con il
rapporto Vie fissato).

§ 7.4. Pressione di un’ onda


elettromagnetica (luce)
su una superficie
La pressione sulla superficie di un corpo, cioè la forza che agisce per
unità di superficie, è definita dal flusso d’ impulso che passa attraverso
l ’ area unitaria e dalle proprietà ottiche della superficie; il flusso si
esprime mediante le componenti
spaziali del tensore energia-
impulso-tensione T a p che per le
onde piane prende a seconda
della direzione di propagazione
la forma (7.17) o (7.19). Quando
l ’onda si propaga lungo l ’ asse
x\ come mostra la (7.17), il
tensore delle tensioni ha soltanto
una componente diversa da zero,
cioè Txx = *— w '. Per trovare
sione esercitata da un’ onda elettro-
magnetica su una superficie.
il flusso d ’ impulso che attraversa
il dato elemento di superficie,,
bisogna definire la direzione della
normale a questa superficie n (na). Allora (vedi capitolo V I) il flusso*
d ’ impulso che attraversa l ’ elemento dS, la cui normale è nT
è uguale a (fig. 7.3)
T'a^nim'^dS' = T'^n^m^dS',
poiché soltanto un termine della doppia sommatoria è diverso da ze­
ro. Il valore della pressione sull’ area unitaria normale all’ asse x
è uguale a p = T[x = Txx — ] w' |. Se un impulso di luce si propaga
a velocità c, l ’ area unitaria riceve un’ energia per unità di tempo
uguale a w'c = . Ma abbiamo visto che w' — p ' , da cui
p' = %’ ìc. (7.32)
Di conseguenza, la pressione della luce è uguale all’ energia di
un’ onda elettromagnetica, incidente sull’ area unitaria per unità di
tempo, divisa per c purché l ’ onda sia assorbita.
Óra determiniamo la forza con cui un’ onda luminosa su una pare­
te agisce, incidente sulla stessa parete con un certo angolo e riflessa
da essa. Sia 'd l ’ angolo d ’ incidenza. Denotiamo con n la normale alla
parete, e con s e s' rispettivamente i vettori unitari diretti lungo la
direzione di propagazione delle onde incidente e riflessa. Il flusso
d’ impulso che attraversa l ’ area unitaria fornisce la pressione p le cui
componenti sono le seguenti: -
P$ = T7a£na + = ( T + Tap)
254
dove r aP e Ta$ sono le componenti del tensore delle tensioni delle^
onde incidente e riflessa.
Le componenti di T a $ per l ’ onda che propaga con un angolo $
rispetto all’ asse x sono date dalla (7.19). Il vettore d ’ onda tridimen­
sionale del raggio riflesso differisce da quello incidente per la sosti­
tuzione di # a —'0'. Introduciamo il coefficiente di riflessione R in
modo che w * = R w . Ricordando che TX1— T[± cos2# = — w cos2#
e T12 = T '4 s in # c o s # = — w sin # cos'd, otteniamo l ’ espressione;
seguente per la forza normale (pressione della luce):
p x = (w + Rw) cos2 # — w (1 + R) cos2 #
e per la forza tangenziale:
p y — w (1 — R) sin # cos #.
Scriviamo i valori della pressione normale p x per due casi parti­
colarmente interessanti. Nel caso d’ incidenza normale (d = 0) la
pressione è uguale a 2w se l ’ onda è riflessa completamente ed a w se-
è completamente assorbita. Nel caso di radiazione isotropa p x va
mediato su tutte le direzioni, cioè bisogna prendere il valore medio
di cos2d. Ma il valore medio del quadralo del coseno direttore del
vettore unitario spazialmente isotropo è uguale ad 1/3. Perciò nel
caso d ’ assorbimento totale della radiazione isotropa la pressione
è definita dalla formula p = w/3.
Sicuramente, tutte queste formule si possono ottenere mediante
ragionamenti elementari. Procedendo dal modulo della densità
d’ impulso del campo elettromagnetico g = Sic2 e dall’ espressione
per il vettore di Poynting in un’ onda piana S = wc, otteniamo g =
= iole (w è la densità d’ energia). Quando un’ onda piana cade su
una parete con un angolo #, l ’ area unitaria guadagna per unità di
tempo tutta l ’ energia e l ’ impulso che sono racchiusi in un cilindro
obliquo la cui base è formata dall’ area unitaria e la cui generatrice
è uguale alla velocità di propagazione della luce. Il volume di tale
cilindro è uguale a c cosd. Perciò 1 cm2 di parete guadagna l ’ energia-
% — wc c o s # durante 1 s, mentre l ’ impulso Gx trasmesso nella dire­
zione perpendicolare alla parete durante 1 s è uguale a Gx = g c o s fì-c x
X cos#=w ; cos 2#. Ma l ’ impulso trasmesso all’ area unitaria per unità,
di tempo è proprio uguale alla pressione p. Introducendo come in
precedenza il coefficiente di riflessione R , otteniamo p = w (1 +
+ R) cos2#.

§ 7.5. Variazione di frequenza della


luce nella riflessione da ima
superficie in moto (specchio)
Supponiamo che in un riferimento K si propaghi un raggio luminoso
con angolo # 0 rispetto all’ asse x nel piano (x, y). Uno specchio posto
parallelamente all’ asse y si muove rispetto al riferimento K con
velocità V, Il raggio luminoso che raggiunge lo specchio è da esso

255
inflesso. Vogliamo trovare la frequenza e la direzione di propagazio­
ne del raggio riflesso in termini del riferimento K.
E conveniente introdurre il riferimento K ' solidale con lo spec­
chio. In questo caso il problema si risolve come segue. Nel riferi­
mento K il quadrivettore del raggio luminoso è specificato, cioè
sono note la frequenza e la direzione di propagazione della luce. La
frequenza della luce e la direzione del raggio nel riferimento K f sono
'facili da trovare usando le formule di trasformazione di Lorentz.
Nel riferimento K ' in cui lo specchio è fermo è valida P usuale legge
di riflessione: l ’ angolo di incidenza è uguale all7angolo di riflessione.
Questo implica che il quadrivettore del raggio riflesso differisce da
quello incidente soltanto per il segno della componente lungo l ’ asse x
del vettore d’ onda. Per ottenere il quadrivettore del raggio riflesso
nel riferimento K , bisogna applicare ancora una volta le trasformazio­
ni di Lorentz.
Ora nel riferimento K la luce si propaghi con frequenza o)0 sotto
un angolo u 0 all’ asse x nel piano (x, y ). Le componenti del quadrivet­
tore k0 nel riferimento K saranno

k[ k° cos %70 = cos u0, k\ = G,


(7.33)
k\ — k° sin # 0 == sin k\ == i ~~ = ik\

Troviamo le componenti del quadrivettore k! dello stesso raggio


nel riferimento K'\ secondo le trasformazioni di Lorentz (4.10a)
otteniamo
+ K = k l k[ = Y (k \ -im \ ). (7.34)

La componente k[ altera il segno nella riflessione dallo specchio che


è fermo nei riferimento K '; perciò, il quadrivettore k ” del raggio
riflesso avrà la forma ^
— T (k li-iB k l)ì k ''= :k l k; = k°3ì k l ^ T i k l - i B k l ) . (7.35)

Nel riferimento K il raggio riflesso sarà descritto dal vettore k che


• —
si deriva dal quadrivettore
Lorentz da K 'a K :
*! = r (hi -

= - r 2 - ^ { ( l + B 2) cos t>0— 2B}, (7.36)

= k\ = ^ -sin d 0i ks = = 0, (7.37)

= T (kl + iBkl) = d { ( ! + B2) A-»— 2iBkl) =


= i f 2 -^ -{(1 + B2) - 2 B cos 6'0}. (7.38)

256
Poiché k3 — k\ ~ 0, dopo la riflessione la luce rimane nel piano di
propagazione (x, y). Assumendo che
03 a
k. — —
c cos i h* = ~ sin d‘
2 c
(7.39)

34
/c3 = 0,

II
otteniamo dalla (7.38)
co _(1-f-B2)—2Bcos d0 (7.40)
iZrjp
Dì conseguenza5la frequenza co della luce riflessa osservata nel riferi­
mento K non è uguale alla frequenza co0 della luce incidente.
Nel riferimento A la tangente
dell’ angolo di riflessione si ottie­
ne nella forma seguente:
ta A — A — — sin (1 — B2)
' k± (1 + B2) cos ru0— 2B “
(7.41)
Si vede dalla (7.41) che di +=
=+ d 0; perciò V angolo di incidenza
e l ’ angolo di riflessione sono
diversi nel riferimento K
(fig. 7.4, a).
È interessante scrivere le for­
mule che riguardano il caso di
incidenza normale della luce sullo
specchio. Sia d 0 = 0 l ’ angolo di
incidenza nel riferimento K.
Allora otteniamo
1— B q f
CO = C0Q -y j p -g - , COS U = — 1,

sm d = 08 (7.42) b)
Dalla (7.42) segue che anche la Fég. 7A « Riflessione della luce da
luce riflessa si propaga lungo la uno specchio in movimento, a). Lo
specchio si muove lungo la normale
normale allo specchio, sebbene al suo piano. Nella riflessione, la
in direzione opposta a quella frequenza cambia e l ’ angolo di inci­
iniziale. Il riferimento K f in cui denza non è uguale all’angolo di ri­
lo specchio è in quiete si muove flessione. b) Lo specchio si muove
parallelamente al suo piano. Nella
nella stessa direzione in cui si riflessione la frequenza rimane inva­
propaga la luce. La frequenza riata; l ’ angolo di incidenza è uguale
della luce diminuisce nella ri­ a quello di riflessione.
flessione.
Se lo specchio si muove verso il raggio, la grandezza B cambia
segno, e quindi otteniamo
1+ B
03 = co0 c o s d ^ — l, s ind^O*
1— B *
La frequenza della luce aumenta nella riflessione.

2§7
Facendo uso di quest’ effetto, si può determinare la velocità di
un oggetto in moto, per esempio un’ automobile. Quando un’ auto
si muove verso un osservatore, la variazione di frequenza nella
riflessione si può determinare dalla (7.40) a meno di termini in
~ B2 (Aco = o) — o)0):
Aco 2B
2B . (7.43)
co0 ~ 1— B
Se, per esempio, la velocità di quest’ automobile è di 72 km/h =
20
= 20 m/s, allora B = -g-jog ~ 0 ,6 -IO-7. Questa variazione relativa
di frequenza può essere facilmente osservata con strumenti ordinari.
Abbiamo considerato il caso in cui lo specchio si muove lungo la
sua normale. ■Comunque lo .specchio si può muovere parallela­
mente al proprio piano (fig. 7.4, b). In questo caso dobbiamo modi­
ficare qualche cosa nelle formule usate. Le formule (7.33) e (7.34)
rimangono invariate. Comunque, il segno di k 2 si modifica nella
riflessione; perciò
k{ = r {k{ + iBk\), k; = - k°2ì k"3= k°3ì k\ = r (k\ - iBft°). (7.44)
Siccome k3 = k°3 = 0, il raggio riflesso rimane nel piano (x, y) come
prima. Ritornando al riferimento K , otteniamo
k t = T ( k { - iBkl) = A®, (7.45)
* 2 = -* a
°, (7.46)
A3 = 0, (7.47)
K = r (k'I + iBkl) = K- (7.4S)
Dalla (7.48) otteniamo immediatamente che co = co0 e scrivendo
t g $ = k j k ly troviamo che tg d = — t g d 0, cioè $ = — d 0. Quindi,
quando lo specchio si muove parallelamente a se stesso, la frequenza
della luce incidente è uguale a quella della luce riflessa, e l ’ angolo di
incidenza è uguale all’ angolo di riflessione (nel riferimento K ).
In conclusione, scriviamo le formule corrispondenti alla rifles­
sione da uno specchio che si muove lungo la normale al suo piano
nell’ approssimazione non relativistica, cioè nel caso in cui la velo­
cità dello specchio è piccola: B = Vlc<C 1. Trascurando tutti
i termini dell’ ordine di B2, otteniamo
co = (D0 (1 — 2B cos do),
cos d = — cos d 0+ '2B sin2 d 0,
sin d = sin d 0+ 2B sin d 0 cos d 0.
Nel caso di incidenza normale- sullo specchio (d0 = 0) il raggio
è riflesso in direzione opposta a queila iniziale mentre la frequenza
varia secondo la legge

. co.= C00 (1 — 2 ) , (7.49)

258
se lo specchio si muove nella stessa direzione del raggio luminoso.
Se lo specchio si muove verso la luce, allora

(7.50)

Le formule (7.49) e (7.50) permettono un’ interpretazione imme­


diata. La luce riflessa può essere immaginata come proveniente da
una sorgente immaginaria posta dietro lo specchio, essendo uguale
a 2V la velocità della sorgente immaginaria. Di conseguenza, se la
sorgente immaginaria è rimpiazzata da una reale con la stessa auto­
frequenza co0, il cambiamento di frequenza secondo le (7.49) e (7.50)
corrisponde all’ effetto Doppler per questa sorgente.
Gli esempi considerati di luce riflessa da uno specchio in m ovi­
mento rappresentano casi particolari di un problema generale che
coinvolge i fenomeni elettromagnetici che hanno luogo sulla fron­
tiera in moto che separa due mezzi.

§ 7.6. Quanti di luce (fotoni)


come particelle relativistiche
La meccanica relativistica che abbiamo presentato nel capitolo V
trattava le particelle che possiedono una massa a riposo finita (diver­
sa da zero). Ciò si manifesta, in particolare, nel fatto che il quadrim-
—>• ■—>•

pulso della particella P — mV ha senso soltanto a condizione che


m =/= 0. Le particelle, la cui massa a riposo è diversa da zero, sono
dette tardoni. Tutte queste particelle non possono raggiungere la
velocità c per accelerazione. Questo si vede dal fatto che per raggiun­
gere questa velocità limite sono necessari un’ energia ed un impulso
infiniti (g = mc2y, p = myv, ma per c il fattore y->- oo). La
soluzione di tutti i problemi concreti citati nel capitolo V testimo­
nia che v rimane minore di c in tutti i casi.
N ell’ investigare l ’ interazione del campo elettromagnetico con
le microparticelle, i fisici hanno concluso che in tale interazione la
microparticella, per esempio un elettrone, guadagna sempre dal cam­
po elettromagnetico un’ energia ed un impulso definiti (per semplici­
tà discutiamo solo il caso di radiazione monocromatica, cioè una
radiazione di frequenza data co). L ’ipotesi che il campo elettromagne­
tico scambia energia con un elettrone in quantità definite (quanti)
fu fatta per la prima volta da A. Einstein nel contesto della teoria
dell’ effetto fotoelettrico (1905). Per spiegare lo scattering di quanti y
ad alta energia da parte degli elettroni, bisogna assumere che il
campo elettromagnetico trasferisca non solo un’ energia definita
all’ elettrone, ma anche un impulso definito (effetto Compton, 1923).
Queste proprietà del campo elettromagnetico, che interagisce con
un elettrone, si possono descrivere graficamente in termini di inte­
razione di « particelle di luce », dotate di un’ energia e di un impulso
definiti, con un elettrone. Naturalmente, sarebbe estremamente in­
genuo immaginare il campo elettromagnetico costituito da particelle

259
sim ili a palle da biliardo. Questo concetto delle « particelle di luce »
è utilizzabile in pieno per descrivere lo scambio di energia e di im­
pulso tra il campo e le microparticelle. Ricordando ciò, il concetto
di particelle di luce (chiamate quanti di luce o fotoni) non dà luogo
ad incomprensioni.
Quali proprietà bisogna attribuire al fotone per trattarlo come
una particella relativistica? Una delle proprietà del fotone da indaga­
re, la relazione tra energia ed impulso, si può ottenere dall1elettro-
dinamica macroscopica. Infatti, la pressione P della luce che cade su
una parete nel vuoto è data dalla relazione (7.32)
P = g/c, (7.51)
dove % denota l ’ energia guadagnata dall’ area unitaria delia parete
per unità di tempo. Ora immaginiamo che i fotoni cadano sulla pare­
te (nel seguito si vedrà che il fatto essenziale è che l 1energia e l ’ im­
pulso si trasmettono per quantità discrete). Immaginiamo la luce
come un’ onda piana in modo che tutti i fotoni si muovono nella
stessa direzione. Supponiamo che ciascun fotone porti una energia s
ed un impulso p. Se l ’ unità di area della parete assorbe N fotoni
per unità di tempo, essa guadagna l ’energia Ne e l ’ impulso Np.
Ma l ’ impulso guadagnato dall’unità di area della parete per unità
di tempo è proprio la pressione della luce P 1 in modo che P = Np
ed % — Ne. Perciò] dalla (7.51) segue la relazione fra energia ed
impulso del fotone:
p = eie. (7.52)
Ma nel caso di particelle relativistiche la relazione fra l ’ energia,
Timpulso e la velocità del moto è stabilita dall1espressione p =
= (e/c2)v, da cui è chiaro che la relazione (7.52) è valida solo se
v = c. Allora, il fotone si può interpretare come particella relativi­
stica se la sua velocità è c.
Come per ogni particella relativistica, si può costruire nel vuoto
—>
il quadrivettore energia-impulso P Qd, ie/c) di un fotone. Usando le
formule generali per il calcolo del quadrato del quadrivettore e tenen­
do conto della (7.52), otteniamo P 2 =; 0. D ’ altra parte, per parti-
celle convenzionali P 2 = — m2c2 (vedi la (5.47)). Questo significa
che la massa a riposo del fotone è uguale a zero. Per permettere
alla particella (immaginaria) di raggiungere la velocità relativistica
lim ite, dobbiamo scartare la massa a riposo finita.
La massa a riposo del fotone si è dimostrata uguale a zero, e a
prima vista questo fatto sembra piuttosto inquietante. Siamo abi­
tuati che ogni corpo e particella in natura possiede una massa fini­
ta. Fino a tempi recentissimi la massa era considerata un attributo

1 Secondo la legge di Newton F = dpidt. Dividendo entrambi i membri


dell’ equazione per l ’area su cui agisce la forza, si ottiene la pressione, cioè
p — Fls = (1/s) (dpldt); l ’incremento dell’impulso trasmesso all’ area unitaria
per unità di tempo compare nel secondo membro.
indispensabile alla materia intesa come realtà oggettivamente
esistente. I fisici erano anche convinti che la massa a riposo defini­
sca le caratteristiche individuali di ogni corpo o particella. In mec­
canica classica ogni entità dotata di massa può essere seguita, almeno
teoricamente, al passare del tempo.
Fino all’ inizio di questo secolo la luce fu considerata un fenomeno
misterioso; perfino i fisici dubitavano della sua natura materiale.
Ma nel 1901 P. N. Lebedev scoprì sperimentalmente la pressione
della luce. Questa pressione è generata da un flusso di impulso.
P m rn o rii m i noi a tì r v n o ^At> o n a -n o v + ìO A l nh a 1n 1vi /i a yyauI o c o a
x j- 4.1 i i u v.4. i x x u ia \j u x u i ± u u u jjjjx p u i t i u u i u j i i. V-'JLJ. x cu x jju i ta o o u

energia. Ma se la luce possiede sia energia che impulso, la sua natura


materiale è fuori discussione. Sebbene la massa a riposo di un singolo
fotone sia uguale a zero, non c ’ è niente di strano in ciò. In natura ci
sono oggetti con massa a riposo finita ed oggetti con massa a riposo
nulla. Questi ultimi si muovono alla velocità della luce e non si
possono fermare; in tutti i riferimenti la loro velocità è la stessa.
Fermandosi, cessano la loro esistenza, passando ad altre forme di
materia. Il fatto che le forme di materia che con massa a riposo
nulla si convertono in quelle che hanno massa a riposo finita (e vice­
versa), mette in luce un’ equivalenza di queste forme.
Le espressioni per l ’ energia e l ’ impulso del fotone non si possono
ottenere in termini di meccanica relativistica. I fisici contemporanei,
però, hanno scoperto che in tutti i fenomeni di emissione ed assorbi­
mento, nell’ interazione con la materia la luce si comporta come un
insieme di quasi-particelle, ciascuna delle quali possiede energia
Tuo ed impulso fusile (qui h è la costante di Planck, U — 6,626 X
X IO-34 J-s, e co è la frequenza circolare della luce). Ad ogni atto
elementare d’ interazione con la materia partecipa una quasi-parti-
cella di questo tipo, chiamata da Einstein a suo tempo quanto di
luce; in queste interazioni sono valide le leggi di conservazione
dell’ energia e dell’ impulso. L ’espressione 8 = ha) si può considerare
come l ’ energia del quanto luminoso e p = ~ s il suo impulso, dove s
e un versore diretto lungo il raggio luminoso. Perciò, se un quanto
di luce (fotone) si considera come una particella relativistica, il suo
quadrivettore energia-impulso prende la forma P {jik, i ~ j , dove

h = k$, k — 2jt/À. — ~ . Eliminando da tutte le componenti di P il


fattore comune, cioè la costante di Planck h, abbiamo ancora lo
stesso quadrivettore k ottenuto in precedenza per un vettore d’ onda,
ma definito ora per un fotone: k (k , ik), k = c o /c , P = hk. Poiché
l ’impulso quadridimensionale del fotone coincide, a meno del fatto­
re U, col vettore d ’ onda quadridimensionale introdotto nel § 7.2,
tutti i risultati ottenuti per un’ onda sono applicabili ad un fotone.
Si tratta delle formule che descrivono l ’effetto Doppler, l ’ aberrazione
della luce, la variazione della frequenza della luce nella riflessione

261
da uno specchio in moto. In termini della teoria fotonica della luce
si può derivare facilmente la formula per la pressione della luce.
Infatti, supponiamo che un fotone cada sulla superficie di un corpo
con un angolo d. La componente normale del suo impulso è uguale
a frcocosd/c (fig. 7.5). Nell’ as­
sorbire il fotone la parete gua­
dagna proprio quest’ impulso
lungo la direzione normale. Se
il fotone è riflesso, il modulo
dell’ impulso trasmesso dipende
dal coefficiente di riflessione
(dalla probabilità di riflessione
del fotone), indicato con R.
Allora, la componente dell’ im­
jFig. 7.5. Per il calcolo della pressione
pulso trasmessa perpendicolar­
della luce. L’ area di base del cilindro mente alla parete per la riflessione
obliquo è uguale a S — i. del fotone sarà uguale a (1 + i?) X
X (.hcùìc) cosd, dove R ^ ì . Se n in­
dica il numero dei fotoni in 1 cm3,
tutti i fotoni in un cilindro obliquo con la generatrice, uguale a c,
cadranno in 1 cm2 di area della parete in 1 s. Il volume di questo
cilindro con la base di 1 cm2 è uguale a c cos d. Di conseguenza,
nc cosd fotoni cadranno al secondo in un 1 cm2 di parete, e trasmet­
teranno alla parete l ’ energia Kaone cosd (se tutti i fotoni sono assorbi­
ti) e la componente normale dell’ impulso

. nc cos d (1 + R) cos d = Horn (1 + 7?) cos2 d.

L ’ impulso trasmesso all’ area unitaria della parete per unità di tem­
po è proprio la pressione sulla parete; perciò p — w (1 + 7 ? ) cos2 d,
dove w = nhco è la densità d ’energia del fascio. Questo risultato
coincide con quello ricavato nel § 7.4.
Sfortunatamente, finora si introduce la « massa del fotone »,
definendola dalla formula presa dalla meccanica relativistica delle
particelle con massa a riposo finita, cioè mi = &/c2 (e = Koù). Prima
di tutto, la formula e = me2 vale esplicitamente per il caso in =+ 0
(vedi capitolo V) ed è abbastanza irrilevante per ni = 0. Inoltre, la
massa mt non ha nessun significato fisico. È anche privo di senso
parlare di proprietà inerziali del fotone: in tutti i riferimenti esso
si muove con velocità c, cioè un fotone nel vuoto non può essere
accelerato o rallentato (può essere solo distrutto). Nella statistica
quantistica i fotoni sono trattati come particelle identiche, il che
fornisce i risultati corretti. Comunque, se la « massa del fotone »
avesse qualche significato, il fotone « blu » dovrebbe essere « più
pesante » del « rosso », il che violerebbe l ’ identità delle particelle.
Al contrario, la sola proprietà comune dei fotoni è la loro massa
a riposo nulla. Qualche volta la massa del fotone mi si usa per spie­
gare la deviazione di un raggio luminoso in un campo gravitazionale.

262
È più che incoerente, trattare un oggetto relativistico, come la
luce, in termini della meccanica classica. Nella teoria della relati­
vità la deviazione della luce in un campo gravitazionale si ottiene,
certamente, senza introdurre una qualche massa del fotone. Infine
c ’ è qualcuno che vuole avere la « legge di conservazione della massa »
anche in fisica relativistica. Siccome la massa a riposo non è additi­
v i (§ 5.6), nuove « masse» sono introdotte sulla base della relazione
m — g-le2. Questo è, comunque, piuttosto privo di senso in quanto
la conservazione di tale « massa » è proprio una conseguenza della
legge di conservazione dell’ energia che è sempre valida. Per riassu­
mere, si può dire che l ’ introduzione della massa del fotone non dà
alcun vantaggio, complicando senza nessun bisogno il concetto di
massa (vedi §§ 5.6, 5.7).
Ritornando alla massa a riposo nulla del fotone, facciamo alcuni
commenti. Non c ’ è un SRI reale in cui il fotone è a riposo, e quindi
la massa a riposo del fotone non è una grandezza osservabile. (Altret­
tanto privo di significato è parlare del passare del tempo nel riferi­
mento solidale con il fotone). La massa nulla del fotone non significa
affatto assenza-, di massa. Per esempio, la temperatura di 0° C non
significa che il corpo è privo di un’ energia interna. Bisogna ricordare
che nella TRBBci sono lo linee d’universo di lunghezza nulla che
non sono meno significative delle altre. Certamente ciò è dovuto
alla velocità della luce che si distingue dalle altre velocità. Oltre
ai fotoni, nel vuoto ci sono altre particelle « reali », i neutrini, che
si muovono aneli’ essi alla velocità c. Anche la loro massa a riposo
è uguale a zero ed è una grandezza non osservabile. Dopo tutto, il
problema se il fotone ha massa nulla o no si può risolvere sperimen­
talmente. Ci sono metodi in grado di evidenziare Pinfluenza della
massa a riposo del fotone se è diversa da zero. A mano a mano che.
questi esperimenti vengono condotti, il limite inferiore della « massa
a riposo » del fotone scende gradualmente più in basso. Alla fine del
1975 questo limite era arrivato al valore m <C 10“ 63 kg.

§ 7.7. Quanti di luce in un mezzo.


Effetto Vavilov-Cerenkov.
Effetto Doppler anomalo
Si è visto nel paragrafo precedente e nel § 6.12 che l ’ impulso di un
fotone in un mezzo si determina mediante la (6.183), se si procede dal
tensore di Minkowski e mediante la (6.184), se si parte dal tensore di
Abraham. L ’ energia del fotone rimane costante nel passaggio da un
mezzo all’ altro, purché non varii la frequenza di oscillazioni. Allora
quale espressione dell’ impulso bisogna usare applicando la leggè di
conservazione dell’ impulso ai « quanti di luce in un mezzo »? Non
c’ è alcuna risposta diretta e alcune considerazioni a riguardo saranno
fatte alla fine del paragrafo. Ora mostreremo che se si utilizzano i
quanti di luce (fotoni) in un mezzo nella forma data dalla (6.183),
possiamo ottenere risultati utili riguardo la cinematica della

263
radiazione, cioè le condizioni imposto alla frequenza ed alla direzio­
ne della radiazione. Queste condizioni sono definite dalle leggi di
conservazione dell’ energia e dell’ impulso. Comincerexno con ima
derivazione elementare della condizione per la radiazione di Vavilov-
Cerenkov.
In questo caso la radiazione è emessa da una particella che non
ha gradi di libertà interni. Scriveremo le leggi di conservazione per
il sistema elettrone-radiazione. Naturalmente, le leggi di conserva­
zione di per sé non rispondono al problema di come si manifesta la
radiazione. Questo problema si risolve con calcoli basati sulle equa­
zioni dell’ elettrodinamica. Comunque, se le leggi di conservazione
non valgono, la radiazione è assente a fortiori.
Supponiamo di aver emesso un quanto di luce. Se l ’ energia e l ’ im­
pulso dell’ elettrone prima della radiazione erano g 0, p 0 e dopo di­
ventano g 1? p ± le leggi di conservazione hanno la forma
= (7.53)
&P = Po— Pi= •

Scritte così, queste leggi presuppongono che il cambiamento di


energia e d ’impulso dell’ elettrone sia connesso soltanto alla radia­
zione. Si possono facilmente trovare le conseguenze richieste dalle
(7.53) e (7.54) ricordando che, secondo la legge di Newton, Ap =
— F •At; moltiplicando entrambi i membri per v e ricordando che
FvAt — Ag, otteniamo
Ag - vAp (7.55)
(naturalmente questa relazione vale soltanto per piccole variazioni
d ’ impulso).
Sostituendo le (7.53) e (7.54) nella (7.55) possiamo cancellare
ìlio; poi notiamo che vs = v cos d1, dove $ è l ’ angolo tra la direzione
del moto deH’ elettrone e la propagazione della radiazione. Quindi la
condizione cinematica finale per Vangolo d* della radiazione si scrive
come segue:
cos ■&= — . (7.56)
nv v }

Questa è la condizione per la radiazione di Vavilov-Cerenkov. Essa


non è soddisfatta se un elettrone si muove uniformemente nel vuoto
(n — 1), in quanto |cos d |^7 1, e ia velocità v dell’ elettrone è sem­
pre minore di c. Di conseguenza, un elettrone che si muove unifor­
memente nel vuoto non irradia.
Abbiamo ottenuto questo risultato direttamente dal principio di
relatività: una carica ferma in un certo SRI non irradia. Questa cari­
ca è dotata di moto rettilineo ed uniforme rispetto ad un altro SRL
Si può avere radiazione in tutti i SRI oppure in nessuno di essi. Di
conseguenza, un elettrone in moto uniforme non irradia. Questo
ragionamento, comunque, non è corretto per un elettrone che si
muove in un mezzo, in quanto qui compare una nuova velocitai
caratteristica, cioè la velocità di moto dell’ elettrone rispetto al
mezzo, che definisce al tempo stesso il sistema di riferimento « pri­
vilegiato » solidale col mezzo.
Da notare che nella nostra approssimazione i risultati finali non
contengono la grandezza Ti nonostante si siano usate le idee quantomec­
caniche. Il risultato ottenuto in questo caso è classico. Le idee delln
meccanica quantistica sono state utilizzate a scopo puramente
metodologico. Si fa uso delle due leggi di conservazione che non
richiedono un’utilizzazione obbligata della meccanica quantistica,
È facile ottenere la condizione per la radiazione tenendo conto-
dell’ impulso di rinculo. Introduciamo il quadrivettore energia-
impulso (o brevemente qnadrimpnlso) del quanto di luce nel mezzo*

(7.57>

L ’ emissione di un fotone da un elettrone deve obbedire alla legge-


di conservazione del quadrivettore energia-impulso (in altre parole,.
le leggi di conservazione dell’ energia e dell’ impulso). Sia p 0 il qua-
drimpulso dell’ elettrone prima della radiazione e p quello dopo la
radiazione, mentre il qnadrimpnlso del quanto di luce sia jt, cioè-

p&(myQv0, imy0c), p\myv, imyc), n^— ns, i — J,

La legge di conservazione del qnadrimpnlso ha la forma

jPo — p n
o, in componenti,

Poi = Pz•

Elevando al quadrato Fultima relazione, si [ottiene


/>*,— 2poi3t*+ ni = pi,

dove ciascun termine implica la sommatoria sull’ indice i. Comunque*,


data l ’invarianza del quadrato dell’ impulso di una particella ph =
= pi, si ha
(7.58)»

(semplificare i termini è vietato; ambedue i membri implicano»


sommatorie indipendenti). Calcoliamo separatamente i due membri
della (7.58):

265.
Uguagliando queste due espressioni e tenendo presente che v0s =
— cosd, dove # ò l ’ angolo tra la luce emessa e la direzione del
moto dell’ elettrone, otteniamo

:Se si considera l ’ assorbimento di un quanto al posto della radiazione,


bisogna cambiare il segno davanti ad Hco nell’ ultima formula. Quan­
do hcù/mc2 1 (il che è vero per la luce visibile e l ’ elettrone), si ritor­
na alla condizione classica per la radiazione (7.56):

cos u<* = -----


c — —1
Vt

La cinematica della radiazione tratta anche i problemi del cam­


biamento di frequenza della luce e della sua direzione di propagazio­
ne nel passaggio da un SRI ad un altro. Intendiamo cioè l ’ effetto
Doppler e l ’ aberrazione. Sicuramente, questi problemi si risolvono
facilmente in termini della TRR. Nel § 7.2 abbiamo considerato la
propagazione della luce nel vuoto. In questo vogliamo ottenere le
formule per un mezzo isotropo ed uniforme il cui indice di rifrazione
è uguale ad n\ si vedrà che queste formule sono sostanzialmente
-diverse dal caso del vuoto.
Infatti, tutti i calcoli sono leggermente diversi da quelli del
§ 7.2 e quindi li presenteremo in forma abbreviata; in fondo discute­
remo in dettaglio i risultati ottenuti. Dal quadrivettore n si ottiene
il quadrivettore di un fotone in un mezzo, proporzionale al primo:

(7.59)

Si assume che nel riferimento K' la luce si propaga nel piano


(x\ y') con un angolo rispetto all’ asse x \ il mezzo è a riposo nel
riferimento K ' . Quindi

k'^-^-rccos tì', -y - ns
in tì', 0, (7.60)

Le componenti del vettore k nel riferimento K si trovano dalle


-stesse formule (7.9) dalle quali si vede, come in precedenza, che il
raggio rimane nel piano (x, y) del riferimento K . Invece della (7.10)
otterremo
co = coT (1 + Brc co stì'), (7.61)

.266
ed invece delle (7.11) e (7.12)
n cos ft' + B
n cos ft (7.62)
1+ Bn cos ft' 1

_____ sin ft'


sin ■&= (7.63)
r (1 + B?i cos ft') ‘

Quindi, la formula finale dell’ effetto Doppler prende la forma


<9fr. la (7.13))
03' V i — B2
(7.64)
1— cos ft

(come in precedenza ' = . T (


od co — kV) (c-fr. la (7.14)), e per l ’ angolo
di aberrazione (cfr. la (7.15))
n j / h — B2
tgf ft - sin ft'. (7.65)
B—j~n cos ft'

Una sorgente monocromatica con autofrequenza co0 sia in quiete


nel riferimento I C , cioè si muove con velocità uniforme V rispetto
a K. Allora od' = co0. Si vede dalla formula (7.64) che per n > 1
(cioè per mezzi comuni come l ’ acqua e il vetro) B /z c o s ft ^ 1 anche
per la velocità V <C c, cioè il denominatore può annullarsi o addi­
rittura diventare negativo. Poiché il cambiamento di segno della
frequenza implica al massimo una variazione della fase di oscilla­
zioni,
cos ( —at) = cos cot, sin ( —coi) = — sin <ot = sin (cot + jx/2)7

la frequenza si può sempre considerare una grandezza positiva. Di


conseguenza, la formula per l ’ effetto Doppler in un mezzo si può
finalmente scrivere
Q)0 V i - B *
|1 — Bn cos ^ | •
(7.66)

Prima di tutto va notato che dalla (7.66) si vede che un mezzo


non influenza l ’ effetto Doppler trasversale: per ft = jx/ 2 si ottiene
esattamente la stessa equazione (7.14) del vuoto. Ci convinciamo
ancora una volta che l ’ effetto Doppler trasversale deriva dalla rela­
tività degli intervalli di tempo fra eventi.
Quando 1 — Brc-cosft = 0, il denominatore della (7.66) si annul­
la, come richiede la condizione della radiazione di Cerenkov. Se
si muove una particella, che non ha gradi di libertà interni, essa
irraggia in un cono intorno alla direzione di propagazione. Nel caso
di una sorgente neutra il cono di Cerenkov divide lo spazio in due par­
ti rispetto all’ effetto Doppler osservabile. La condizione 1 —

267
— B n cos# > 0 è valida fuori dal cono di Cerenkov (fig. 7.6), dove
si osserva l ’ effetto Doppler normale per cui (day/d'ù) > 0, come

Fi g. 7. 6, a) Spiegazione cinematica deila comparsa della radiazione di Vavilov-


Cerenkov. Sono mostrate le posizioni di una particella carica in molo uniforme
agli istanti t1 e t.z. Nell’intervallo di tempo t2 — il fronte d’onda assumerà la
posizione mostrata nella figura dalla circonferenza tratteggiala, b) Il cono di
Cerenkov divide Io spazio intorno alla sorgente nelle due regioni dell’effetto
Doppler anomalo e normale.

accade sempre nel vuoto. « Dentro » il cono di Cerenkov 1 — B/z)<


X co s# < 0 e (cZco/cZD1
) <C 0; questo caso corrisponde all1effetto
Doppler anomalo.
È interessante confrontare le formule per l ’ aberrazione della
luce nel vuoto e in un mezzo. Per il caso di incidenza normale nel
riferimento K ' , otteniamo in K per l ’ angolo di aberrazione a la
relazione seguente:
B
tg a (7.67)
y i ~ b2 n
La sola differenza rispetto al caso del vuoto (vedi la (7.15)) consiste
nella comparsa dell’ indice di rifrazione n che figura al denominatore.
Non c ’ è singolarità per V = chi.
In conclusione dobbiamo decidere quale espressione per l ’ impul­
so del fotone si debba considerare « corretta ». Come si è puntualizza­
to nel § 6.12, due diverse espressioni per l ’ impulso del fotone in un
mezzo ^ = ~ n e pA corrispondono a una diversa divisio­
ne della densità dell’ impulso del campo elettromagnetico nel
mezzo in « densità d ’ impulso del campo » e « densità d ’ impulso del
mezzo stesso ». Poiché nel considerare l ’ effetto Cerenkov ci interessa
l ’ impulso totale perso dall’ elettrone, e tale impulso viene definito
dall’ espressione gM, l ’ uso di gM fornisce i risultati corretti 1.

1 Per ulteriori dettagli vedi V. L. Ginzburg, y<X>H (Successi delle scienze


fisiche) 110, 309 (1973); V. L. Ginzburg, V. A. Ugarov, YOIi 118, 175 (1976)-
268
V ili. SU ALCUNI « PARADOSSI » DELLA TEORIA
DELLA RELATIVITÀ RISTRETTA

Se si consulta il dizionario, si vede che la parola « paradosso » lia


almeno tre significati: un giudizio diverso da quello generalmente
accettato per la sua originalità; una sorprendente deduzione da
certe assunzioni, ed un risultato che sembra incredibile a prima
vista, ma che si dimostra corretto ad un’ analisi più approfondita.
Nello studio della TR R , si possono trovare esempi che illustrano
tutti i significati della parola « paradosso ».
Per quanto riguarda un « giudizio generalmente accettato »,
con riferimento alla TR R , si tratta delle idee della fisica classica
sulle proprietà dello spazio e del tempo, in particolare. Le idee
classiche di spazio e di tempo coincidono in gran parte con quei
concetti che si acquisiscono negli anni di scuola e nella vita pratica
di ogni giorno. Queste idee abituali diventano generalmente accet­
tate, e la loro applicazione si basa, crediamo, sul « senso comune ».
Ma può accadere che il senso comune, che è un accumulo delle convin­
zioni acquisite, ne contenga qualcuna che può essere falsa. Queste
false convinzioni vengono alla luce con il progredire della scienza.
Spesso risulta che certe idee sono valide solo approssimativamente,
ed il campo di applicazone deve essere limitato. E proprio ciò che
è accaduto per alcuni concetti con la comparsa della TRR.
Nella vita quotidiana ed in meccanica classica, ad esempio,
siamo convititi che il tempo abbia un significato assoluto. Natural­
mente, questo è sostanzialmente corretto. La teoria della relatività
ha mostrato che gli istanti di tempo di un evento misurati in diversi
SRI sono differenti, cioè relativi. Comunque, è psicologicamente
difficile abituarsi alla relatività del tempo, tanto più che essa si
manifesta soltanto a velocità relativistiche (che i corpi macroscopici
non raggiungono mai) e mai nella vita quotidiana. La relatività del
tempo, la relatività della simultaneità e degli intervalli di tempo tra
gli eventi si correlano con la relatività delle lunghezze campione dota­
te di un moto relativo. Dal punto di vista del senso, comune, che ci
fa credere nel tempo assoluto, queste conclusioni sono paradossali.
In termini della fisica contemporanea non sono affatto paradossi. La
relatività del tempo è proprio una moderna interpretazione dei risul­
tati delle misure ottenuti per il tempo del verificarsi di un evento.
In ogni modo, questa rappresentazione è conforme al concetto di tempo
secondo il materialismo dialettico, secondo cui il tempo, come una
forma di esistenza della materia in moto eterno, può dipendere dal
moto della materia.
I risultati « paradossali » della cinematica nella TRR sono ben
noti e citati nei libri divulgativi. Si tratta della relatività delle lun­
ghezze campione (« contrazione » delle lunghezze), relatività della
simultaneità e delle distanze fra gli eventi e relatività degli interval­
li di tempo tra gli eventi. Tutte queste conclusioni elio si allontanano
dai risultati classici « generalmente accettati » sono state discusse in
dettaglio nei §§ 3,1-3.3. Nei prossimi tratteremo i paradossi che sono
stati eliminati dai fondamenti della TRR.

§ 8.1. Più veloce della luce


Come si è visto nel § 3.4 il principio di casualità richiede che la velo­
cità di trasmissione di un segnale, cioè la velocità di trasmissione
dell’ energia e dell’ impulso, sia finito. Il moto di ogni particella con
la massa a riposo nulla è sempre un segnale (tale particella (in moto)
porta sempre energia ed impulso.) Quindi, è chiaro che la velocità del
moto di tali particelle non può superare la velocità della luce nel
vuoto. La cinematica della teoria della relatività mostra che se in
un dato SRI la velocità della particella è v <C c, in ogni altro SRI K f
la sua velocità è v' < c (vedi § 3.5). Consideriamo un altro utile esem­
pio a questo proposito.
Supponiamo che nel riferimento K due particelle si muovano Luna
verso l ’ altra ad uguali velocita (fig. 8.1). La sola condizione che
la TRR impone alle velocità delle particelle è che siano minori di c.

K,
_

/ z
1

1
1
1
1 1

Vf= V
-1

x}x r
Fig. 8.1. Due particelle che si muovono Tuna verso l ’ altra si possono « avvici­
nare » a velocità maggiore di c.

Qual è la velocità relativa di queste particelle in K ? Sia v la velocità


della particella 1 (denotata con iq); allora la velocità v2 della parti-
cella 2 è uguale a —v. La velocità relativa delle particelle vTe\ =
= tq — v2 = v — ( —v) = 2v. Se v >* c!2, da qui segue che vve\ >* c.
Questa velocità implica che un segnale sta viaggiando più veloce
della luce?
Nell’ esempio considerato vTe\ è la velocità con cui diminuisce
la distanza fra le particelle. Questa^ distanza diminuisce in questo
caso ad una velocità superiore a quella della luce; Nessun « segnale »
si può trasmettere a questa velocità.

27©
Per determinare la possibile velocità di trasmissione del segnale
dobbiamo fare nel modo seguente. Un osservatore posto sulla parti-
cella 1 vuole trasmettere un segnale (informazione) mediante la
particella 2. A ll’ istante in cui le particelle viaggiano affiancate Puna
all’ altra egli invia un « pacchetto d’informazione» alla particella 2.
Ma la velocità con cui l ’ informazione lascia la particella 1 non è
affatto la velocità con cui varia in K la distanza fra le particelle*
ma è la velocità della particella 2 rispetto a quella 1. In altre parole*
la velocità di trasmissione di un’ informazione (segnale) e la distanza
percorsa dal portatore dell’ informazione per unità di tempo. La
distanza di per sé non può essere un portatore d’ informazione.
Dunque, per calcolare la velocità di trasmissione di un segnale*
bisogna calcolare la velocità della particella 1 rispetto alla 2 (o vice­
versa). Allo scopo fissiamo un riferimento K° alla particella !..
Assumendo V — v, otteniamo i\ — 0 dalla formula generale
v— V
V ~~ 1 — vV■
Questo è un risultato ovvio, naturalmente: K r coincide con la parti-
cella 1. La velocità z;', si calcola come segue:
, — v— v 2v __ 2vie
v2~ iq -^ /c2 “ “ l + ua/ca “ i + i;2/c2
Questa è la velocità relativa delle particelle considerate. L ’ ultimo'
passaggio dell’ uguaglianza è stato scritto per dimostrare che v'2 C c.
La dimostrazione per il caso generale è fornita più avanti.
Siano vx = cqc, z;2 = a 2c le velocità delle particelle che si
avvicinano Luna all’ altra nel riferimento K; la teoria della relati­
vità richiede solo che siano soddisfatte le condizioni a±<C. 1 e a 2 <7 1.
11 caso in cui a x <i 0,5 ed oc2 *< 0,5 non è dì grande interesse in quanto
in K non c ’ è alcuna velocità superiore a c. Supponiamo che a± + oc2 >
> 1;
Introduciamo un riferimento K' in cui v[ — 0; abbiamo già visto
che in quésto caso V = zq. Quindi
,_ v2— V _ — cuc — a xc a 1~j~a2
1 — v.2V/c* l-j-a-|Oc2 l - h a 1a 2 Co
Dimostriamo che ax + a 2 < 1 + a1a 2. Riscriviamo questa disu­
guaglianza trasferendo tutti i termini del secondo membro: arla 2 —
ai — a 2 + 1 > 0. Raggruppando i termini, otteniamo
(oq — 1) (a 2 — 1) > 0,
che è corretta in quanto sono soddisfatte le condizioni imposte ad ax
ed a 2. Il caso considerato in precedenza corrisponde ad ax = a 2.
Quindi, in un dato. SRI una particella convenzionale (m ^ 0) non
può essere accelerata alla velocità c, né questa velocità hi può raggiun­
gere come risultato di un passaggio da un SRI ad un, altro. Ma è an­
cora possibile trovare in natura velocità che superano quella della
luce? "

271
Il primo esempio lo suggerisce immediatamente. Prendiamo un
.solido, una sbarra assolutamente rigida (corpo) e spingiamola.
Entrambe le estremità cominceranno a muoversi contemporaneamente
ed un segnale sarà trasmesso istantaneamente. Comunque, in questo
caso è erronea l ’ assunzione iniziale. Non ci sono corpi assolutamente
rigidi in natura. Tutti i corpi sono simili ad una molla di differente
rigidità. La trasmissione dell’ impulso (colpo o spinta) da un’ estremi­
tà del corpo all’ altra si effettua sotto forma di moto di onde elastiche.
E la velocità delle onde elastiche nei solidi è molto minore di quella
della luce. Così, la TRR sottolinea ancora una volta che non esistono
corpi assolutamente rigidi in natura. Comunque, un cambiamento
d ’ impulso istantaneo richiede una forza infinita, anche nel contesto
della meccanica di Newton.
Benché la TRR limiti esplicitamente la velocità di trasmissione
del segnale, non ci sono restrizioni sulle velocità che non sono legate
alla trasmissione dei segnali e quindi possono superare c. Di solito

^ B

Fig* 8.2. Il punto d’intersezione di due rette in movimento si può muovere a


velocità superiore a c.

un paradosso consiste nei fatto che si rivela una certa velocità superio­
re a c e si afferma che questa velocità è quella di trasmissione di un
segnale. N ell’ analisi finale, si può sempre mostrare che la velocità
considerata non ha relazione con la trasmissione del segnale. Consi­
deriamo ora qualche esempio.
La retta AB si muove parallelamente a se stessa alla velocità Vx
(perpendicolare ad AB) ed anche la retta CD si muove parallelamen­
te a se stessa a velocità V 2 (perpendicolare a CD). L ’ angolo fra le rette
è uguale a d. Qual è la velocità di spostamento del punto d ’ intersezio­
ne M di queste rette (fig. 8.2)?
La velocità relativa dei punto M lungo la retta A B causata dal
moto della retta CD è uguale ad u2 = F 2/sin {h La velocità del moto
del punto M lungo la retta CD a causa del moto della retta A B
è uguale ad ux = Fj/sinft. La somma geometrica delle velocità ux ed u2
dà (fig. 8.2)
V m = i1T^

Questa formula mostra che per $ - > 0 la velocità VM oo; essa


può superare anche c. Questo fatto, comunque, non contraddice affat-
to la teoria della relatività. In primo luogo, il punto d’ intersezione
delle rette non è un corpo materiale. In secondo luogo, questo punto

272
non si può utilizzare per trasmettere un segnale (informazione) in
quanto in ogni istante dato deve essere formato da nuovi punti delle
due rette (il punto d ’intersezione non può essere « segnato »).
È eli un grande interesse il caso di un’ incidenza obliqua di un’ on­
da luminosa piana su un piano (fig. 8.3). Consideriamo il punto
d ’ intersezione del fronte d’ onda col piano x = 0 (il punto A nella
fig. 8.3). . Al passare del tempo questo punto si muove verso destra.
E facile trovare la velocità dello
spostamento: avendo scelto il seg­
mento BD uguale a c, otteniamo
AD — c/sin'd. Ma AD è proprio
il cammino percorso dal punto A
per un’ unità di tempo, cioè la
velocità del punto A . P oich é.
sin'9*^1, questa velocità può facil­
mente essere maggiore di c. Per
rendere più drammatica la situa­
zione, immaginiamo che il piano
x = 0 sia coperto da uno strato Fig. SS, II punto di contatto di
luminescente. Quindi un punto un’ onda elettromagnetica incidente
luminoso viaggerà lungo Passe con |una superficie piana si può muo­
più velocemente della luce. Sicu­ vere con velocità maggiore di c.
ramente, un punto luminoso, la
cui velocità è v >> c, si può realizzare in modo più semplice, per così
dire « manualmente ». Sistemiamo delle lampadine elettriche lungo
Passe x ed accendiamole una dopo l ’ altra (indipendentemente) da sini­
stra a destra con un certo intervallo di tempo. Naturalmente si può otte­
nere una macchia luminosa che si muove a qualsiasi velocità. Da
questo secondo esempio si vede che in questo processo non si trasmet­
te e non si può trasmettere alcuna informazione, in quanto ciascuna
sorgente irradia indipendentemente. Ma è possibile ottenere velocità
maggiori di quella della luce mediante una rotazione relativamente
lenta di un corpo solido di raggio considerevole? Per esempio, un
disco di raggiro r — c che ruota con velocità angolare co ~ 1 avrebbe
alle sue estremità una velocità lineare y ^ c e superiore. Comunque,
una tale velocità non può mai essere raggiunta a causa delle proprie­
tà relativistiche dell’ equazione del moto. Non appena la velocità
lineare di alcune parti del corpo aumenta, le forze richieste per
accelerare queste parti diventano sempre] maggiori, e di conseguen­
za la velocità lineare delle parti più lontane del corpo non può supera­
re in ogni caso e.
Se è impossibile ruotare un corpo solido, proviamo a ruotare un
raggio di luce.. Poniamo nell’ origine delle coordinate un riflettore
e facciamolo ruotare con velocità angolare Q. Circoscriviamo una
sfera stazionaria di raggio c attorno all’ origine. Quindi il riflesso
viaggerà lungo la superficie di questa sfera alla velocità lineare

V — QCe

273
Questa velocità può superare la velocità della luce. Un esempio di
tale raggio lo può fornire « un punto luminoso » da una pulsar ruotan­
te. Il « punto luminoso » della pulsar della Nebulosa del Granchio*
viaggia sulla superficie della Terra alla velocità di circa IO24 cm/s.
Ma come nel caso precedente non viene trasmesso alcun segnale
a questa velocità. Infatti, ogni punto dello schermo (la Terra) riceve
mia nuova porzione d’ energia luminosa dal riflettore (pulsar), ma
non dai punti vicini dello schermo. Perciò, è impossibile trasmettere
un’ informazione da un punto all’ altro dello schermo.
Infatti, la stessa idea si può realizzare come segue. Uri raggio
luminoso dalla sorgente I cade su uno specchio formato da varie facce
che ruota con frequenza angolare
or. A seconda della frequenza o>
e della distanza dallo schermo,
si può ottenere un moto del raggio
luminoso (Timmagine della sor­
gente) con una velocità lineare
superiore a c. Costruiamo uno
specchio riflettente a forma di un
elissoide e poniamo uno specchio
rotante in uno dei suoi punti
Fig. 8.4. Un « riflesso » da uno spec­ focali (fig. 8.4). Quindi iTraggio-
chio ruotante e che corre lungo lo
schermo lontano può muoversi con riflesso dallo specchio passerà
velocità maggiore di quella della attraverso il secondo punto focale
luce c. secondo la ben nota proprietà di
una superficie ellittica. In questo
secondo punto focale si può sistemare un ricevitore-analizzatore.
Il riflesso che si muove lungo lo specchio rappresenta l ’ immagine
della sorgente indipendentemente dalla velocità del punto.
La velocità di fase delle onde elettromagnetiche in un mezzo può
essere maggiore della velocità c. La velocità di fase delle onde in un
mezzo v è definita dalla formula v = chi, dove n è l ’indice di rifra­
zione. Ci sono casi in cui l ’ indice di rifrazione n < 1 e, quindi,
v > c. Tutti questi casi sono connessi ad un mezzo ed a certe frequen­
ze delle onde elettromagnetiche. Per esempio, molte sostanze hanno
un indice di rifrazione n <i i nel campo dei raggi X duri. La stessa
disuguaglianza vale per il plasma. Ma anche in questo caso non c ’ è
contraddizione con la TRR. Il fatto è che la velocità di trasmissione
del segnale non è definita dalla velocità di fase. In un mezzo disper­
sivo, cioè in un mezzo il cui indice di rifrazione dipende dalla fre­
quenza della luce che lo attraversa, un segnale si può trasmettere
mediante onde elettromagnetiche il cui spettro di frequenze è suf­
ficientemente stretto (gruppo d’ onde). La velocità del segnale è la
velocità dell’ energia trasmessa da questo gruppo; come mostra un’ a­
nalisi più dettagliata (vedi [36]), la velocità di trasmissione dell’ e-
nergia (dell’ « ampiezza del gruppo ») è definita dalla velocità di
gruppo. Ma la velocità di gruppo risulta sempre minore di c con
l ’ eccezione della regione di dispersione anomala, dove la velocità di

2 74
gruppo supera formalmente c . In questa regione, però, il concetto di
velocità di gruppo, e quindi di velocità di trasmissione del segnale,
perde senso. Perciò con processi ondulatori, un segnale si trasmette,
sempre a velocità minore di c.

§ 8.2. Paradosso del filo


e della leva
Supponiamo elle nel riferimento K 0 (il sistema di riferimento proprio)
sia a riposo un telaio rettangolare piano A B CD, lungo la diagonale
del quale AC è teso un filo elastico che tende dai due lati una sfera,.

x0
a) b) c)
Fig. 8.5. Un telaio rettangolare sulla cui diagonale è sospeso un filo elastico che
tende una sfera m. a) L ’ aspetto dell’esperienza nel sistema di riferimento pro­
prio K°; b) lo stesso osservato nel riferimento K; c) seia sfera è rimpiazzata da
un manubrio, esso subisce l ’azione di una coppia di forze nel riferimento K.

la cui massa è uguale a m (fig. 8.5, a). Nel riferimento K° la direzione


del filo si determina dal triangolo A B C . Ponendo A B = aQ e BC —-
= ò0, abbiamo
tg a 0= b0/a0.
Nel riferimento K° le forze elastiche sono dirette lungo il filo,,
perciò si può anche scrivere che
tg a 0 = b0/a0 = F l J F {y , (8.1)'
dove Fi indica la forza diretta verso il vertice C (relazioni simili
valgono anche per FI).
Ora passiamo al riferimento K rispetto al quale il riferimento K 0'
si muove con velocità F. Come al solito, si assume che gli assi x 0.
e x coincidono.e gli assi y 0 e y e z0ì z sono, rispettivamente, paralle­
li. Secondo le formule di trasformazione delle lunghezze e delle for­
ze (3.5) e (5.34) abbiamo ’
a — a0, 6 = fc0 (1 — B 2) 1/2, (8.2)
F ix = F\x, F iy = yi°F
(1 — B2) 1/2. (8.3)

275'
Si vede da ciò che l ’ uguaglianza (8.1) non vale più; nel rifer-
mento A F angolo che definisce la direzione del filo e quello che defini­
sce la direzione delle forze non sono affatto uguali:
tg a ' = b!a = (&a/a0) (1 — B2)1/ 2= F-1 b0/a0= tg a 0/F,

tg a"= F J F ly=

Sebbene la somma delle forze rimanga come prima uguale a zero,


queste forze nel riferimento K formano un certo angolo rispetto al
filo (fig. 8.5, b). A prima vista questa circostanza sembra sorpren­
dente. Infatti, cosa succede, ad esempio, se tagliamo il filo nella
sezione 2. Nel riferimento K° Faccelerazione, nell’ istante iniziale,
deve essere parallela alla direzione della forza (questo è un caso
esplicitamente non relativistico ed è applicabile la legge di Newton)
cioè essa è diretta lungo il filo. Sembra che nel riferimento A Facce­
lerazione debba formare un certo angolo rispetto al filo, in quanto la
direzione del filo e quella della forza F\ non coincidono. Queste affer­
mazioni sono chiaramente contraddittorie, ma il paradosso si risolve
facilmente: in dinamica relativistica l ’ accelerazione, generalmente,
non coincide con la forza agente e sebbene la forza è diretta sotto un
certo angolo alla direzione del filo, l ’ accelerazione è diretta lungo il
filo. Il paradosso stesso fornisce nn utile esempio delle peculiarità
dell’ equazione relativistica della dinamica.
Assicuriamoci che in entrambi i riferimenti F accelerazione della
sfera sia diretta lungo il filo. Conviene scrivere l ’ equazione relati­
vistica dei moto nella forma
rn dvldi = y"1 [F — (v/c2) (Fv)];

qui m è la massa della sfera, F è la forza convenzionale tridimensio­


nale che agisce sulla sfera, v è la velocità della sfera, y — (1 —
— p2)"1/2, dove p = v/c.
Nel riferimento A 0 all’ istante t — 0 quando il filo 2 è tagliato
m dv°/dt = F\
o, in componenti,
m dvx/dt = F I*, m dvyfdt = F\y .

Dividendo termine a termine la prima relazione per la seconda, otte­


niamo la formula che definisce il moto all’ istante iniziale:
dv°x/dvy=

Secondo F(8.1) la direzione di questa accelerazione coincide con


quella del filo, come deve essere. Allora in A 0 le forze e le accelerazioni
sono parallele, ed il moto è diretto lungo il filo all’ istante
iniziale.
Passiamo ora al riferimento A . In questo riferimento il corpo si
muove con la velocità del riferimento A 0, cioè F. Perciò, y = f e le

276
componenti deli’ accelerazione si possono scrivere nel modo seguente:
m d v jd t = [Fix - {Vìe*)= (8 . 6)
m dvy/dt = F iy/T; (8.7)
abbiamo tenuto conto che la velocità della sfera coincide con la
velocità del riferimento K , cioè è uguale a F e ha componenti (F, 0,
0); Flx e F ly sono le componenti della forza nel riferimento K 1. Per
trovare la direzione dell’ accelerazione in K, dividiamo termine a ter­
mine l ’ (8.6) per P(8.7):
dvJdvy — ( FiJ F iy)lY2‘ = V tg a 0IT2 = tg a 0/T — tga% (8,8)
dove nel terzo passaggio della catena di equazioni si è utilizzata la
formula (8.5) e nell’ ultimo l ’ (8.4). Ma si vede dall’ (8.8) che l ’ acce­
lerazione in K all’ istante iniziale è anch’ essa diretta lungo il filo,
e non c ’ ò alcun paradosso.
Immaginiamo, comunque, che invece della sfera pensata come
puntiforme, i fili tendano un solido, ad esempio unjmanubrio.

Fig. 8 .6 . Il paradosso della leva. Se nel riferimento K° la leva è in equilibrio,


un momento risultante delle forze è uguale a zero; ma se si considera la stessa
leva nel riferimento K, in accordo con le formule della trasformazione. delle
lunghezze e delle forze, compare un momento delle forze diverso da zero. La
TRR dà una spiegazione molto elegante del perché anche in termini del rife­
rimento K la leva sarà in quiete (vedi il testo).

Quindi nel riferimento K sulle sfere del manubrio agirebbe una cop­
pia di forze (fig. 8.5, c) ed il manubrio si sposterebbe rispetto alla
diagonale del telaio.
È ovvio, comunque, che nel riferimento proprio l ’ asse del manu­
brio coincide con la diagonale del telaio. Certamente, si cade in un
paradosso. Questo paradosso rappresenta un caso del ben noto parados­
so della leva, che ora discuteremo. Supponiamo che una leva sia
a riposo nel riferimento K° (fig. 8.6). Esso è in equilibrio malgrado
che su di esso agiscano due forze, F°x ed Fy, ciascuna delle quali
1 È facile convincersi che le (8.6) ed (8.7) corrispondono a due casi eccezio­
nali deir equazione relativistica in cui forza ed accelerazione sono parallele;
in un primo tempo le masse corrispondenti furono dette in questo caso « trasver­
sale » e «longitudinale». Ora queste definizioni alquanto incongruenti sono
state tralasciate sebbene rendano bene il carattere tensoriale della relazione tra
la forza e l ’ accelerazione in meccanica relativistica.

277
è diretta lungo i rispettivi assi coordinati. L ’equilibrio è assicurato
dall’uguaglianza dei momenti delle forze in i l 0:
F h l = 'l(F8,9)
questi momenti sono orientati in direzione opposta.
La stessa leva si può considerare in termini del riferimento K
rispetto al quale la leva si muove rigidamente con velocità V. Scri­
vendo l ’ espressione per i momenti delle forze F x ed F y in K , si nota
che esse non sono più uguali, e, di conseguenza, appare un momento
risultante delle forze agenti sulla leva. Infatti, secondo le (5.34)
e (3.5) abbiamo
f x= f I
ix = i x0 y i - B \
La differenza dei momenti delle forze F x ed F y produce un mo­
mento di rotazione in K
L = F xlv- F ylx = F l l l - { i - W ) Fyfx = B*zFylx— (8.10)
dove viene usata l ’ (8.9). Il paradosso consiste in ciò: sebbene sia
ben noto che la leva è in quiete, nel riferimento K sulla leva agisce
il momento di forze e, quindi, la leva dovrebbe essere in rotazione.
La brillante soluzione di questo paradosso fu opera di Lane. Ci siamo
■abituati al fatto che un momento della forza induce una rotazione;
in altre parole, causa la comparsa di un momento dell’ impulso del
sistema. Nel riferimento K il momento della forza definisce infatti
la velocità con cui aumenta il momento dell’ impulso, ma quest’ au­
mento non è associato alla rotazione della leva. Allora da dove pro­
viene Lincremento del momento dell’ impulso? Consideriamo il
lavoro compiuto dalle forze F x ed F y nel riferimento K. In questo
riferimento la leva si muove, e la forza F x compie il lavoro —FXV
per unità di tempo. La forza F y non fa lavoro in quanto è diretta
perpendicolarmente alla direzione della velocità della leva. Di con­
seguenza, all’ estremità della leva, nel punto di applicazione della
forza F x, si compie un lavoro, e l ’ energia delia leva in quel punto
aumenta della quantità —F XV per unità di tempo. Questo significa
che la massa della leva nel punto di applicazione della forza aumen­
ta di —FxV!c2 per unità di tempo. Moltiplicando questa grandezza
per la velocità V della leva, otteniamo l ’ incremento dell’ impulso
—F xB2. Quindi il momento dell’ impulso aumenta di —F xl yB2 per
unità di tempo. Questo è proprio il momento addizionale (8.10).
Quindi il momento addizionale non descrive una rotazione, ma defini­
sce la velocità con cui varia il momento dell’ impulso del sistema.
Questa spiegazione ha alcuni punti deboli. Nella TR.R non esistono
corpi assolutamente rigidi, e dobbiamo ammettere la deformazione
della leva; nel ragionamento precedente si è assunto implicitamente
che la leva mantenesse la sua forma. Nel riferimento K° dobbiamo
considerare i bracci della leva piegati sotto l ’ azione delle forze
Fi ed F I

278
Considerando la leva, ricadiamo in un altro risultato paradossale.
Supponiamo che non agisca nessuna forza fino all’ istante £ = 0 in cui
F[ ed « sono accese » istantaneamente nel riferimento K°. In ogni
istante viene mantenuto l ’equilibrio nel riferimento K°. Nel riferi­
mento K le forze non si accendono contemporaneamente e c’ è un in­
tervallo di tempo in cui la forza F1 è già in azione mentre la forza F 2
non è ancora « accesa ». Di conseguenza, compare un momento della
forza. Infatti, il seguente esempio mostra che sono qui essenziali
proprio le forze applicate in punti diversi del corpo (il paradosso
appare, ovviamente, nel considerare dei solidi). Nel riferimento
K° poniamo un solido di lunghezza 1° lungo l ’ asse x°. Fino all’ istante
t — 0 non agisce su di esso nessuna forza, e all’istante t = 0 da ambo
i lati vengono accese forze uguali, dirette in versi opposti. Nel riferi-
menio K° viene mantenuto sempre l ’ equilibrio, mentre nel riferi­
mento K c ’ è un intervallo di tempo in cui le forze non sono bilanciate
e quindi il corpo deve cominciare a muoversi. Lasciamo questo para­
dosso all’ analisi del lettore.

§ 8.3. Tachioni
Questo nome viene attribuito alle particelle la cui velocità supera
quella della luce nel vuoto. Fin dall’ inizio bisogna chiarire che si
sta parlando di particelle ipotetiche: finora i tentativi di osservare
sperimentalmente queste particelle sono falliti. Ma la stessa idea
della loro esistenza sembra paradossale: la velocità finita della tra­
smissione dei segnali è fondamentale nella T R R , e la velocità limite
è proprio la velocità c. Sicuramente, la velocità di per sé non ha
restrizioni (vedi § 8.1), ma la propagazione dell’ impulso e dell’ ener­
gia è trasmissione di un segnale. Il moto delle particelle cui si è fatto
riferimento può servire da segnale. Inoltre, le particelle ordinarie,
aventi una massa a riposo finita, Desistenza delle quali è ormai fami­
liare, non possono raggiungere la velocità della luce. Dall’ equazione
relativistica del moto di tali particelle segue che la velocità della luce
si può raggiungere solo dopo un tempo infinito (per non accennare
al fatto che l ’ energia necessaria sarebbe infinita). Allora il problema
dell’ esistenza nel nostro universo convenzionale di particelle più
veloci della luce non si pone nemmeno.
Si può, comunque, assumere che esiste uno speciale gruppo di
particelle la cui conversione in particelle ordinarie e viceversa
è impossibile. Queste particelle potrebbero essere generate in certe
trasformazioni nucleari con velocità maggiori di quella della luce
dall’ inizio della loro esistenza. L ’ assunzione riguardo la generazione
dei tachioni è la stessa della descrizione della generazione dei fotoni:
dall’ inizio i fotoni si generano con la velocità della luce, e non com­
paiono « dinamicamente » come risultato dell’ accelerazione di parti-
celle convenzionali.
Come nel § 3.5 si può mostrare che se la velocità di una particel­
la v supera la velocità della luce c in un SRI, ciò accade in ogni

279
altro SRL Di conseguenza, le particelle convenzionali (fotoni)
e i tachioni formano gruppi separati; è impossibile un passaggio da
un gruppo all’ altro mediante accelerazione; il passaggio da un SRI
ad un altro lascia la particella nello stesso gruppo a cui apparteneva
nel SRI iniziale,,
Assumendo l ’ esistenza di queste particelle, consideriamo le im­
plicazioni cinematiche di tale assunzione.
Dunque, assumiamo che la velocità v del tachione (determinata
con mezzi convenzionali) sia maggiore di c, cioè p = (vie) > 1.
Perciò per l ’intervallo fra due eventi, le posizioni di un tachione
in due punti dello spazio in due istanti di tempo, otteniamo come al
solito (il moto unidimensionale lungo l ’ asse x')
ds2 = c2dt2 — dx2 = c2 (1 — p2) dt2.

Per un tachione (a differenza delle particelle convenzionali) ds2 <C 0*


cioè l ’ intervallo è del genere spazio; abbiamo visto nel § 3.4 che in
questo caso i concetti « dopo » e « prima» per due eventi non sono
più assoluti. Di conseguenza, ci sono sistemi di riferimento in cui il
tachione si muove in una direzione, ed altri in cui esso si muove in
direzione opposta. Si può trovare la condizione imposta alla velocità
di un tachione perché il suo moto in un certo sistema K* sia « oppo­
sto ». Nel sistema K ' si ottiene per un tachione
. M ’ = r (A i — r F A *) = r (1 — pB) Ai.

In ogni SRI si assume B < 1. Gli intervalli di tempo At' e At


hanno segno opposto (ciò significa che la sequenza degli eventi varia
nel tempo) purché 1 — pB <C 0. Da ciò segue la condizione richiesta
V > c2/V; è chiaro che v > c. Le differenze nella descrizione del moto
di un tachione nei riferimenti K e K ' si vedono chiaramente nella
fig. 8.7, a. Nel riferimento K le linee di simultaneità sono parallele
all’ asse x, e prolungandole sull’ asse positivo et, noi contrassegnamo
la posizione del tachione sempre più a destra: il tachione si muove
verso destra. Nel riferimento K' le linee di simultaneità sono paral­
lele all’ asse x ' . Disegnandole in modo che esse intersechino l ’ asse et'
sempre più lontano lungo la direzione positiva dell’ asse et', si trova
che il tachione si sposta sempre più sulla sinistra: il tachione si
muove verso sinistra.
Lo stesso risultato si può esporre in modo più drammatico
(fig. 8.7, b). Supponiamo che in K un tachione esca dal punto O
e arrivi al punto d ’universo P. Nel riferimento K , come si vede nella
figura, un tachione « è emesso » all’ istante t — 0 (« prima ») ed è arri­
vato al punto P all’istante t±, cioè « dopo ». Nella stessa figura sono
tracciati gli assi spaziale e temporale del riferimento K ' (le linee di
simultaneità in K ' sono parallele all’ asse x'). Si vede dalla figura
che nel riferimento K' il tachione era prima nel punto P (all’ istante
—t't), poi si muoveva verso il punto (9, in cui è stato assorbito (all’ i­
stante t' = 0). In questo modo, soltanto scegliendo opportunamente

280
il sistema di riferimento, si può ottenere il moto del tachione nella
direzione opposta dello spazio e scoprire in un sistema di riferimento
F assorbimento di un tachione invece della sua emissione.

Fig. 8.7. a) Il moto di un tachione considerato in due SRL Nel riferimento K


il tachione si muove verso destra, in K' verso sinistra. La linea in grassetto è
la linea d’universo del tachione, b) L’inversione della sequenza temporale degli
eventi per un tachione in moto.

Nello stesso tempo, vogliamo accennare ad un esempio curioso di


« tachione luminoso », cioè un tachione che emette luce. La fig. 8.8

Fig. 8 . 8 « L’ osservazione di una particella luminosa che si muove con velocità


maggiore di quella della luce.

illustra che un osservatore fermo nel riferimento K « v e d rà » due


tachioni che divergono in direzioni opposte.

281
Ora torniamo all’inversione temporale della sequenza degli
eventi e, in particolare, allo scambio tra « emissione » ed« assorbi­
mento». À prima vista, questa situazione contraddice la nota
relazione causa-effetto. Infatti, supponiamo di sapere che la sor­
gente dei tachioni è posta nel punto 0. La sorgente è la « causa »
della generazione dei tachioni. Il moto di un tachione verso P
è r « effetto » della generazione del tachione. L ’ osservazione nel
riferimento K' mostra, però, che il tachione lascia il punto P e viene
assorbito nel punto 0. Non L iporta quanto possa sembrar strano,
bisogna ammettere che la sequenza osservata non contraddice le
relazioni causa-effetto, chiarendo bene cosa intendiamo. Per esem­
pio, si può ragionare come segue.
Supponiamo che A sia la causa e B l ’ effetto, se una ripetizione
dell’ evento A agli istanti Zx, Z2, . . . scelti in modo arbitrario
produce senza dubbio il verificarsi dell’ evento B agli istanti t± -f-
+ T, Z2 + T, • • •In questo caso sono essenziali le ripetizioni control­
late dell’evento A e la loro correlazione con Pevento B. In questo
senso le relazioni causa-effetto non dipendono da quale evento avvie­
ne « prima » e quale « dopo ». La sequenza temporale degli eventi
non è coinvolta nella definizione della relazione causa-effetto e non
si può usare per stabilire la differenza tra la causa e l ’ effetto.
Nel nostro esempio l ’ evento da controllare nel riferimento K'
è l ’ assorbimento di un tachione. Questo assorbimento controllato
sarà sempre, preceduto dal moto del tachione da P a 0. Dobbiamo
considerare l ’ assorbimento del tachione come causa ed il suo moto
come effetto. La definizione di causa-effetto citata è in conflitto
con l ’ affermazione usuale secondo cui « il senso assoluto della nozio­
ne di « prim a» e « dopo »... è un requisito essenziale perché abbia
senso il concetto di « causa » ed « effetto »». Naturalmente, se la
« causa » e « l ’ effetto » avvengono nello stesso punto dello spazio
{in un dato SRI), la causa deve precedere l ’effetto. Ma allora l ’ inter­
vallo fra gli eventi è del genere tempo a fortiori, ed in ogni SRI l ’ effet­
to avviene « dopo » la causa. I tachioni si comportano invece in
modo differente. Tutti gli « eventi » che coinvolgono i tachioni
avvengono, dal nostro punto di vista, in punti diversi. La sequenza
inversa di eventi non è di alcun significato.
Quindi, la sequenza temporale inversa degli eventi non contrad­
dice le nozioni convenzionali di causa-tempo. Comunque, bisogna
soddisfare a tutti i costi una condizione. È impossibile influenzare
il passato dal presente. Un segnale inviato da un dato punto dello
spazio non può raggiungerlo prima di essere stato inviato.
Se i tachioni fossero usati come segnali, sarebbe possibile, come
si vede dalla fig. 8.9, inviare un segnale in modo che un altro segnale,
causato dal primo, raggiunga il punto iniziale (ciclo causa-effetto)
prima che venga emesso il primo segnale. La fig. 8.9 mostra le linee
d ’universo di due corpi, I e / / , che erano inizialmente in quiete, in
seguito si sono mossi di moto rettilineo ed uniforme con uguali
velocità ed infine sono tornati di nuovo in quiete. I punti d ’universo
282
A e A ' giacciono sulla linea di simultaneità die coincide per entram­
bi i corpi in moto. I punti d ’universo C e C giacciono sulla linea
di simultaneità che coincide con entrambi i corpi in quiete. La

F i g . 8.9. Il ciclo chiuso causa-effetto con partecipazione di segnali più veloci


della luce. Le linee I e II sono le linee d’ universo dei due sistemi di riferimento.
Dal punto A viene inviato il primo segnale AB più veloce della luce (AA' è
la linea di simultaneità). Dal riferimento I I (il punto C) un segnale CD più
veloce della luce viene inviato di ritorno al punto C ed arriva nel punto D
del riferimento I prima che venga inviato il primo segnale (il punto A).
Le linee di simultaneità e le linee d’ universo dei segnali più veloci della
luce sono tracciate come nella fig. 2. 6, b.

figura illustra anche le linee d ’universo dei due segnali più veloci del­
la luce A B e CD. Avendo inviato il segnale A B e poi (dopo la ricezio­
ne del segnale AB) l ’ altro segnale CD, si riceverà il segnale CD nel
punto D prima che sia inviato il segnale da A .
Perciò, abbiamo ottenuto l ’esempio di un ciclo chiuso causa-
effetto che indica esplicitamente la possibilità di esercitare un’ influ­
enza sul passato. Certo, questo risultato riguarda tutti i segnali che
si muovono più veloci della luce, ma se è applicato ai tachioni, ciò
significa che i tachioni stessi (a differenza delle particelle convenzio­
nali) non possono servire come segnali.
Se si assume che i tachioni esistono e sono soddisfatte le richieste
■del ciclo causa-effetto, la possibilità di invertire la sequenza tempo­
rale degli eventi per i tachioni permette di sfuggire a un’ obiezione
legata alle proprietà « dinamiche » di queste particelle. Se si assume
che le relazioni fondamentali della TRR valgono per i tachioni,
dalle formule di trasformazione per la velocità e l ’ energia della
particella (vedi capitoli III e V)

r = rg(i-pB)
•segue che l ’energia del tachione diventa negativa in quei riferi­
menti in cui è scambiata la frequenza degli eventi (e dove la velocità
cambia di segno in quanto Ai e Al' sono di segno opposto). L ’energia

2 83
negativa di un tachione è inammissibile in quanto essa implica la
possibilità di ottenere energia illimitata. Infatti, la generazione di
una coppia di tachioni, uno con energia positiva e V altro con ener­
gia negativa, non richiederebbe energia, e il tachione con energia
positiva potrebbe compieife lavoro utile.
Abbiamo visto, comunque (vedi fig. 8.8), che se nel riferimen­
to K si osserva l ’ emissione e l ’ assorbimento di un tachione, nel
riferimento K ' dove la velocità del tachione soddisfa la condizione
v > c3/F, lo stesso processo si può descrivere come l ’ assorbimento
di un tachione in moto opposto e possedente energia positiva. Questo-
fatto permette di evitare le difficoltà associate con l ’ energia negativa..
Infine, alcune notazioni suLTimpulso e l ’ energia dei tachioni.
Nel caso unidimensionale (px = p) la TRR (vedi capitolo V) fornisce
la seguente equazione:
§2 __ p *c* _ m2c\ (8.11)

Costruendo un grafico % — % (p), si ottiene un’iperbole, inoltre,


come si è visto (§ 5.5)

v - d%ldp. (8 . 12)

Se la particella è accelerata, nel piano (g, p) essa si muove lungo


l ’ ipèrbole (8.11). La pendenza della tangente è sempre minore di c,
indipendentemente dal modo in cui aumenta l ’ energìa della parti-
cella: sia per accelerazione sia per il passaggio da un sistema di
riferimento all’ altro. Siccome l ’ energia della particella è positiva,
il ramo inferiore dell’ iperbole è distaccato. Da notare anche che gli
asintoti dell’ iperbole g 2 — p V 2 — 0 corrispondono ai fotoni. Se si
assume che i tachioni obbediscono alle formule basilari della mecca­
nica relativìstica (vedi capitolo V), le grandezze p = myv ed % —
= mc2y diventano immaginarie, in quanto y = (1 — j32) -1/2 e (3 > 1,
in modo che y = iy#, dove i/y% — ] / |32 — 1 .1 valori reali dell’ im­
pulso e dell’ energia si possono ottenere, purché si usi come massa
la quantità im%. Perché una massa immaginaria dovrebbe essere
migliore di un’ energia o di un impulso immaginari? Il punto è che m#
è la massa immaginaria propria del tachione, e non c ’ è alcun sistema
di riferimento in cui un tachione può stare in quiete (un sistema
di riferimento consiste di particelle convenzionali e la sua velocità
non può superare c). Perciò la massa propria del tachione non può
essere osservata e si può pensare che abbia un valore qualsiasi.
Ma allora nel piano (gg p) dobbiamo considerare altre due
iperboli che corrispondono alia massa immaginaria propria b2 —
— p V 2 = —m2c4. Di conseguenza, si debbono analizzare tre iperboli
nel piano (!', p) (fig. 8.10). La pendenza della tangente a queste
iperboli è maggiore di c in ogni punto. Certamente, il fattore y
figura non solo nell’ espressione per l ’ impulso e l ’ energia, ma anche
nella definizione di lunghezza (mediante la lunghezza propria e di

284
intervalli di tempo mediante il tempo proprio. Naturalmente,
possiamo facilmente rifiutare le grandezze « proprie » consideran­
dole inosservabili»
Consigliando al lettore altri testi per i dettagli, riassumiamo.
Negli ultimi anni sono stati compiuti diversi tentativi per analizzare
le proprietà delle particelle, la cui velocità supera in termini

F i g a 8 ,1 0 * Tachioni <§ particelle convenzionali nel piano , p ).

della TRR. La TRR afferma che le velocità che non si associano


alla propagazione fisica di qualcosa possono avere un valore qual­
siasi» Le particelle convenzionali si muovono sèmpre con velocità
minore di c; ogni « segnale » ha velocità minore di c. Di conseguenza*
il tachione stesso non può servire come segnale, cioè la sua intera­
zione con il nostro mondo è alquanto limitata. Potrebbe darsi die
Finterazione dei tachioni con il nostro mondo avvenga mediante
lo scambio di segnali elettromagnetici.
Partendo dal principio « tutto ciò che non è proibito ha il diritto
di esistere », dobbiamo ammettere resistenza dei tachioni. Infatti,
in teoria la loro esistenza non è direttamente vietata. Però sembra
poco probabile che queste particelle esistano realmente. L ’ ultima
affermazione è suffragata sperimentalmente.

§ 8A« Paradosso dell’ orologio


Questo paradosso, ammesso che si possa parlare di paradosso, è de­
terminato dalle diverse misure dell5intervallo di tempo tra eventi
nei diversi SRI, di cui si è ripetutamente parlato. Richiamiamo
brevemente i risultati di cui avremo bisogno in seguito»

285
Si abbia nel riferimento K' un corpo in quiete e supponiamo che
vengano registrati due eventi nel punto x agli istanti t[ e £' secondo
un orologio in moto insieme con il corpo ed il riferimento K ' . L ’ in­
tervallo t'2 — 1[ è l ’ intervallo di tempo proprio indicato con à t .
Gli stessi due eventi saranno registrati dagli osservatori di K in due­
punti del riferimento K agli istanti tx e t2 mediante due orologi.
L ’ intervallo di tempo fra gli stessi due eventi sarà uguale a At —
= t2 —' t1. Sappiamo che
A t - 1 / T h ^A^, (8.13>
cioè l ’ intervallo di tempo proprio tra gli eventi è minore dell’inter­
vallo tra gli stessi eventi registrato dagli orologi del riferimento
rispetto al quale il corpo si muove (cfr. § 3.3).
La formula (8.13) mostra chiaramente un’ asimmetria nello
scorrere del tempo. Si può argomentare come segue. Poiché tutti
gli orologi di K sono sincronizzati, l ’ intervallo At misurato da
orologi diversi di K può considerarsi come un intervallo misurato-
dallo stesso orologio di K. Allora risulta che le indicazioni dei duo
orologi identici in due SRI, K e K r, sono diverse. Ma la TRR è basata
sulla completa simmetria dei sistemi inerziali! E questa simmetria
esiste! Abbiamo dimenticato un punto importante nel nostro ragio­
namento. Visto che la simultaneità è relativa, gli orologi sincronizza­
ti in un sistema di riferimento non lo sono in mi altro. La sincroniz­
zazione degli orologi è relativa! La grandezza At non è affatto l ’ in­
tervallo di tempo proprio dell’ orologio del riferimento K. Facciamo
il calcolo richiesto.
Supponiamo che l ’ orologio I I I sia in quiete all’ origine del
riferimento K' che si muove con velocità V rispetto a K. L ’ orologio I
sincronizzato nel riferimento K e in riposo in esso si trova nel punto-
xx = a e l ’ orologio IT nel punto x 2 = b.
La coordinata variabile dell’ orologio I I I nel riferimento A
è uguale a x 3 = Vt. Di conseguenza, le coordinate degli orologi I +
I I e I I I nel riferimento K saranno le seguenti:
x1 = a (per l ’ orologio / ) , (8.14)
x 2 z=- b (per l ’ orologio II), (8.15)
x 3 = Vt (per l ’ orologio II I). (8.16)
Dalla formula di trasformazioni di Lorentz (2.11) x = F (x +
+ Vt') si può ottenere la dipendenza dal tempo tr della coordinata x r
nel riferimento K ' e della coordinata x in K nella forma seguente:
* '= ~ V t ' + -

In questo modo troveremo x'v x'2; per quanto riguarda x'3, è ovvio
che ^g — 0. Di conseguenza,
x[ = —Vt' + a/T (per l ’ orologio /) , (8.17)
x'2 = —Vt' + bIT (per l ’ orologio II), (8.18)
x'3 — 0 (per l ’ orologio III). (8.19)

286
Come al solito, si assume che le indicazioni degli orologi eli due
riferimenti siano confrontabili, quando gli orologi sono posti nello
stesso punto. Quindi si possono fare i confronti seguenti. Primo,
le indicazioni dell’ orologio I I I si possono confrontare con quelle
dell’ orologio I quando gli orologi sono vicini; denoteremo le rispet­
tive letture con t[ e tx\ secondo, si possono confrontare le letture
degli orologi I I I e / / , quando, l ’ orologio I I I si trova vicino a I I ;

Fig. 8.11. Spiegazione della totale simmetria di due sistemi di riferimento iner­
ziali rispetto al « rallentarsi » temporale. In ogni sistema di riferimento l ’ inter­
vallo di tempo proprio tra due eventi risulterà minore dell’intervallo tra gli
stessi eventi misurato da due orologi di un qualsiasi altro SRI.

denotiamo queste letture con t'2 e t2 (fig. 8.11). Quando la lettura


dell’ orologio I I I coincide con quella dell’ orologio / , entrambi si
trovano nel punto x = 0; perciò, secondo l ’ (8.17) gli istanti di
tempo t[ e £' saranno dati dalla seguente relazione: t[ = a/VT e t ' =
== blVT. Nello stesso tempo dall’ (8.16) otteniamo tx — a!V, t2 —
= blV, cioè tx — IX e t2 = P^. I tempi tx e t2 sono le letture di
due orologi diversi sincronizzati in K.
Data la sincronizzazione in questo riferimento l ’ orologio I
segna l ’ istante t2 quando l ’ orologio I I segna lo stesso istante t2.
La differenza t2 — t± è il tempo nel riferimento K in cui la lettura
dell’ orologio I I I varia di t'2 — 1[. In termini del riferimento K
il ritmo dell’ orologio -III è definito dalla relazione seguente:

= = (8.20)

come deve essere, in quanto i2 — t[ è l ’ intervallo di tempo proprio.


Poiché |t'2 — t[ |^ |t2 — tx |, l ’ orologio in moto osservato dal
riferimento K è in ritardo. Sappiamo bene tutto ciò. Ora facciamo
il passo decisivo: vogliamo confrontare il ritmo degli orologi I e I I
come appare nel riferimento IC . Per confrontare il ritmo degli
orologi, bisogna analizzare quello di un orologio, diciamo l ’ orolo­
gio I L Comunque, abbiamo soltanto una lettura diretta di quest’ oro­
logio: quando l ’ orologio I I è di fronte all’ orologio I I I , quest’ ultimo
segna t'2 e l ’ orologio I I segna t2. L ’ altra lettura dell’ orologio I I
deve essere calcolata (cfr. il § 2.4). Troveremo dove è posto e -cosa

287
segna l ’ orologio I I quando dì fronte all’ orologio I I I si trova Toro­
logio / . Analizziamo la situazione in termini del riferimento K ' .
Quando Porologio I I I si trova di fronte all’ orologio I, esso segna
il tempo t[ = alVY. L ’ orologio I I si trova alla distanza x 2 — —
= (b — a)/T dalLoroìogio I (vedi le (8/17) e (8.18)). Ma quando
l ’ orologio I si trova di fronte all’ orologio I I I , le loro coordinate
sono x[ = xz — 0. Perciò, x'2 = (b — a)/T è la coordinata dell’ oro­
logio I I nell’istante in cui gli orologi I I I e I coincidono. Ora è facile
trovare la lettura dell’ orologio I I in quell’istante. Introduciamo
x ' = (b — a)/T e t[ = a /FT nella formula

i= r ( r .

(Poiché gli orologi sono sincronizzati nel riferimento iT', t[ coincide


con la lettura dell’ orologio di K f posto nei punto x 2 in modo che
t[ = £'.) Come risultato, otteniamo la lettura dell’ orologio I I :

t= PQ + F —f — = z h Jr ’-^r (8.21)

Se gli orologi I e I I fossero sincronizzati, essi segnerebbero lo stesso


tempo. Ma gli orologi sono sincronizzati solo in K e non in K \
Si vede che, in termini di K ', l ’ orologio di K non è sincronizzato,
e mostra la seguente differenza:

6 = 7F (b — a),

che aumenta quando gli orologi si allontanano uno dal alPtro. Abbia
mo già ottenuto questo risultato nel § 2.4. Poiché nel riferimento K
la distanza b — a = V (t2 — £*), la lettura dell’ orologio I I sarà
t = tx + (F/c2) (t2 — lx). Mettendo insieme la differenza del tempo
segnato e di quello calcolato £, otteniamo

Ì2— Ì = (É2— t i ) ~

o 9 secondo F(8.20),

* * -* = (? ;-* * ) f • .

Questo significa che l ’ osservatore nel riferimento R' noterà che


l ’ orologio in moto rispetto a lui è in ritardo. Perciò, è dimostrata
la perfetta equivalenza dei riferimenti.
Questo risultato conferma la piena equivalenza dei due riferimenti
inerziali considerati: se nei due SRI ci sono due orologi identici,
gli intervalli di tempo proprio registrati da questi due orologi sono
uguali. Sicuramente, non può essere altrimenti, in quanto il principio
di relatività è uno dei principi basilari della TRR: se il ritmo di due
orologi identici fosse diverso in due SRI, sarebbe possibile in questo
modo distinguere fisicamente questi riferimenti.

288
Questa è soltanto la spiegazione introduttiva. Il paradosso degli
orologi è, ovviamente, diverso. Supponiamo di confrontare la lettura
di due orologi: uno dal riferimento K e uno da K ' . Naturalmente,
immediatamente dopo il confronto gli orologi divergeranno e si
allontaneranno sempre di più. Ma se noi portiamo indietro in qual­
che modo uno di questi orologi al punto in cui è posto l ’ altro orolo­
gio e confrontiamo di nuovo le due letture, che cosa dobbiamo aspet­
tarci? È la risposta a questa domanda che costituisce il paradosso
dell’ orologio. La risposta non è affatto semplice, e invitiamo il
lettore ad armarsi di pazienza.
Prima di tutto, notiamo che tutte le formule della TRR sono
grandezze misurate in termini di sistemi di riferimento inerziale.
Tutte le misure di tempo condotte nella TRR sono compiute me­
diante orologi in quiete in uno o nell’ altro SRI. Dopo aver confron­
tato una volta due orologi, non siamo più in grado di metterli insieme
nello stesso punto dello spazio senza portarli fuori del sistema di
riferimento in cui sono in quiete durante il confronto iniziale.

Fig. 8.12. Le linee d’universo di due orologi I e II. La linea d’universo OD


corrisponde a ll’orologio I in quiete in K . Prima l ’orologio I I si allontana uni­
formemente dall’ orologio I (la linea OT), poi, cambiando, nel punto T, la velo­
cità in quella uguale ma diretta in direzione opposta, si avvicina all1orologio I.
Nel punto D si trovano vicini e si può di nuovo confrontare la loro indicazione
(il primo.,'confronto è avvenuto nel punto 0). Il confronto delle letture degli
orologi è proprio quello che viene chiamato il paradosso dell’orologio. Nel
particolare è mostrata la linea d’universo di un orologio che ritorna indietro
al punto D.

Infatti, se il moto è rettilineo, è necessario prima rallentare uno


degli orologi e poi accelerarlo nella direzione opposta per ottenere
la stessa velocità. In questo caso l ’ orologio, la cui direzione del
moto è cambiata, si troverà nello stesso punto dell’ orologio con cui
era stato confrontato inizialmente. Tutto ciò si può vedere molto
bene nel diagramma di Minkowski in cui sono tracciate le linee
d’ universo dei due orologi I e I I (fig. 8.12).
Il « paradosso dell’ orologio » va analizzato mediante il metodo
del coefficiente k (§ 3.7). Faremo uso del diagramma spazio-tempo
della fig. 8.12. Esso illustra le linee d’ universo di tre orologi: T oro-

289
logio / posto nell1origino di K (la linea 61D), l ’ orologio I I a riposo*
nell1origine di K ’ (la linea OT) ed infine, l ’ orologio I I I fermo in
K " (la linea TD). Troviamo gli intervalli di tempo misurati diret­
tamente. A ll’ istante t — t' = 0, (quando coincidono le origini Q
ed O') avviene lo scambio iniziale di segnali luminosi che è istan­
taneo, in quanto gli orologi di K e K ' sono posti nello stesso punto.
Gli orologi I I e I I I si incontrano nel punto d’ universo T; in quel­
l ’ istante un segnale luminoso è inviato dal punto T verso l ’ orologio / .
Supponiamo che l ’ orologio I I registri l ’ intervallo di tempo proprio»
à t 2 tra i suoi incontri con gli orologi I e I I E Quindi, come sappia­

mo, l ’ orologio I deve registrare l ’ intervallo di tempo k à t 2 tra


l ’ incontro degli orologi I e I I e l ’ arrivo del segnale luminoso da T.
Ma il segnale da T è stato inviato nell’ istante dell’ incontro degli
orologi I I e I I I e perciò, se l ’ orologio I I I registra l ’ intervallo di
tempo proprio à t 3 dall’ incontro degli orologi I I e I I I fino al suo*
arrivo nel punto D , è possibile trovare l ’ intervallo di tempo tra la
ricezione del segnale luminoso da parte dell’ orologio I (il punto E)
e l ’ incontro degli orologi I e I I I nel punto D. Abbiamo visto nel
§ 3.7 che se cambia il segno della velocità relativa dei due sistemi
di riferimento, il coefficiente k si muta in i/k. Di conseguenza,
l ’ intervallo di tempo raffigurato nella fig. 8.12 dal segmento ED
è uguale a à t Jk. Data la simmetria dell’ esperimento immaginario
discusso è chiaro che à t 2 — à t 3. Indicando con A t il valore di
questo intervallo di tempo, si conclude che l ’ intervallo di tempo»
registrato dall’ orologio I tra l ’ incontro con gli orologi I I e I I I
è uguale a

*(AT1) + -^S-=(fc* + l ) - £ . (8.22)

Il tempo totale registrato dai due osservatori (orologi I I e I I I )


è uguale a 2 A t . Questo valore è sempre minore dell’ (8.22) poiché
dalla disuguaglianza (k — l) 2 >* 0 segue immediatamente che
/c2 + 1 > 2k.
L ’ ovvio vantaggio di questo modo di procedere sta nel fatto-
che tutte le misure di tempo sono compiute da orologi che sono
in quiete nel sistema di riferimento inerziale. Così, l ’ intervallo
di tempo fra gli eventi, misurato da due osservatori inerziali, è più
breve di quello misurato da un solo osservatore. Da notare che in
questo caso, a differenza del caso in cui si confrontava l’ intervallo
temporale misurato da un orologio, con quello misurato da due
orologi di un altro SRI, si confrontano gli intervalli di tempo misu­
rati dagli orologi di tre SRI.
Dunque, l ’uso di due orologi (I e II) ci ha condotto alla conclu­
sione sulle diverse misure degli intervalli di tempo. Qualche volta
si suggerisce di usare lo stesso orologio nel sistema di riferimento
K r e K ": nel punto T l ’ orologio I I è spostato al riferimento K"
per misurare l ’ intervallo di tempo in questione con lo stesso orologio.

290
Vale la pena di insistere su questo suggerimento. Anche se misuriamo
l ’ intervallo di tempo fra gli eventi O e D con due orologi (1 e / / ) ,
questi orologi non sono affatto equivalenti nel caso considerato.
Quando l ’ orologio I I è spostato da K ' a K", esso subisce un’ accelera­
zione e si porta in un sistema non inerziale. La sua linea d’ universo
è già una curva (vedi l ’ incastratura della fig. 8.12). Ma il moto
inerziale non è affatto equivalente a quello non inerziale. È possibile
che un orologio che si muove per inerzia registri un intervallo più
lungo rispetto ad un orologio in moto non inerziale. Non c ’ è in
questo caso alcuna contraddizione; la stessa conclusione si ottiene
con la teoria della gravitazione di Einstein.
Abbiamo già detto (vedi § 3.3) che un’ accelerazione, in via di
principio, influenza il ritmo di un orologio. Un orologio « corretto »
si trova di solito nel sistema di riferimento inerziale. Supponiamo
che la linea d’ universo di una particella sia incurvata (ciò significa
che la particella subisce un’ accelerazione). Ad ogni istante del
moto accelerato possiamo trovare un osservatore inerziale che si
muove lungo la tangente alla traiettoria del moto autentico con la
velocità istantanea del moto effettivo. L ’ orologio che si muove con
un’ accelerazione va « correttamente » se la sua marcia coincide con
quella dell’ orologio costruito in modo identico, ma che si muove
insieme all’ osservatore inerziale nel modo indicato.
In quale punto della linea d’ universo appare la differenza fra
le letture degli orologi « inerziale » e « non inerziale »? Dal principio
di relatività segue che i ritmi degli orologi identici sono gli stessi
in tutti i SRI. Quindi è chiaro che la differenza di letture dei due
orologi, portati nello stesso punto dello spazio, è causata dall’ accele­
razione dell’ orologio, cioè dalla parte incurvata della linea d’ uni­
verso. Spesso si sente obiettare che la parte incurvata si può rendere
piccola a piacere, cioè assicurare l ’ accelerazione per tempi molto
brevi. La differenza di letture può essere molto grande. Bisogna
tener in mente, comunque, che un’ accelerazione che agisce per un
tempo breve implica la comparsa di forze immense, e l ’ inversione
di una velocità relativistica è associata ad un’ accelerazione consi­
derevole. Inoltre, la differenza di lunghezza fra le linee d’ universo
incurvata e retta che collegano gli stessi punti è determinata non
dalla lunghezza della sua parte incurvata, ma dalla curvatura comples­
siva della linea d ’universo. Questo fatto è illustrato molto bene
nella fig. 8.13: sebbene il cammino I I dalla città A a quella B sia
« praticamente una linea retta per quasi tutto il tempo », esso è,
senza dubbio, più lungo del cammino da A a B lungo la retta con­
giunta / . Se un’ accelerazione non influenza il ritmo dell’ orologio,
la lunghezza della linea d ’ universo della particella determina l ’ in­
tervallo di tempo proprio.
Finora si è parlato di intervalli di tempo registrati da uno o due
orologi. Ritornando al problema iniziale, ci si può chiedere cosa
segnano gli orologi / e I I I nell’ istante in cui si incontrano nel
punto D? Ricordiamo che gli insiemi degli orologi in A , K r e K "

291
sono si nero ruzzati in modo che, all’ istante in cui le origini (9, Or
ed 0" coincidono, i tre orologi dai tre sistemi segnino t = t' = t” —
= 0. Ora prestiamo attenzione al diagramma nella fig. 8.14. In esso
le linee d’ universo degli orologi / , I I e I I I sono completate dalle

Fig. 8.13. Il cammino I tra le città A e B è più breve del cammino / / , sebbene
il cammino I I sia diverso da quello rettilineo soltanto in un breve tratto. La
differente lunghezza non è causata tanto dalla parte curvilinea quanto dal fatto
che il cammino I I non è una retta nel suo insieme.

linee di simultaneità dei riferimenti IC e K n. Il passaggio dal rife­


rimento K' al riferimento K " (cioè ad un altro insieme di orologi
sincronizzati) significa un salto della linea di simultaneità da A T
a TB nel diagramma 8.14. Questa transizione spiega la sostanziale

F ig. 8.14. Il passaggio dal riferimento K' ai riferimento K" significa un cambia­
mento della linea di simultaneità. Da A T si passa a TB.

differenza nelle letture degli orologi I e I I I . La sostituzione di due


organismi umani ai due orologi ci porta al cosiddetto « paradosso
dei gemelli ». Il passaggio ad organismi viventi, in ogni modo,
comporta una serie di complicazioni per cui diamo al lettore Lindi­
cazione bibliografica [31].

292
§ 8.5, « Equivalenza » fra massa
ed energia. Massa a riposo nulla

In questo paragrafo torniamo a problemi già discussi; il motivo


di questa ripetizione non è quello di scoprire nuovi paradossi, ma
quello di avere la possibilità di analizzare insieme alcuni risultati
che erano stati presentati separatamente. Saranno forniti anche
utili esempi.
Sappiamo (§ 5.6) che ogni sistema fisico dotato delhenergia
So nel sistema di riferimento proprio (P° = 0) ha una massa a riposo
Mo = Nella relazione %0 indica tutta l’energia del sistema.
Illustreremo ciò con due esempi.
1. Si considera un sistema chiuso composto di n punti materiali
non interagenti che subiscono collisioni elastiche (in fisica classica
questo modello corrisponde ad un gas perfetto). Indichiamo le
masse a riposo dei punti con m{02\ . . ., ml0n) e le loro velocità
quadridimensionali nel sistema di riferimento proprio K° con
Uq1-, v(02) , . . v(0n\ Passiamo ora ad un altro riferimento iner­
ziale K la cui velocità relativa è diretta lungo Passe x. In K le com­
ponenti delle velocità tridimensionali dei punti si ricaveranno dalle
seguenti formule:

4% + V Co V l - B '2
(8.23)
,;x, 0V . , ^ 4 V
i+

Faremo anche uso della (3.17),

(8.24)
.,

che riscriveremo nelle notazioni adottate nel libro:

^ ( 1-
)■

L ’ impulso risultante del sistema è definito dalla sommatoria


degli impulsi delle singole particelle:

P= 2 (P0 = 2 m(oftVoi)4 A) = 0).


Perciò,

P* = 2 m ^ t h)v ^ = 2 m pryW (i£>0+ F) =

=r 2 + r -J- 2 .+ r = rJ f
293
Si può vedere facilmente che
p y = /><« = 0 e P z = P <0) - 0.
E in accordo con essa, l ’ energia del sistema è

8= 2 rn (^ yW = V < V 2r Y® ( 1 + - ^ ) = T 2 < >cV


0ft) = ^
siccome

2 m » w Ts*) 2

Di conseguenza, nel caso di sistèmi chiusi

P = r |>F, M 0= |f-, (8.25)

dove V è la velocità del moto del centro di inerzia. Questo significa


che la massa a riposo M 0 del sistema è uguale a %tc2. In termini
della teoria cinetica della materia l ’energia a riposo § 0 del sistema
deve includere anche l’ energia termica. Comunque, sappiamo già
che la massa a riposo del sistema comprende non solo le masse
a riposo delle singole particelle, ma anche la loro energia cinetica
totale; quest’ energia, dal punto di vista macroscopico è proprio
il calore.
2. Consideriamo una collisione anelastica di due corpi. Un siste­
ma di due corpi si può considerare chiuso e perciò si può applicare
a questo processo la legge di conservazione del quadrimpulso. Indi­
chiamo con M o la massa a riposo del corpo che si forma dopo la
collisione e con 7?z0(1) e m(02) le masse a riposo dei due corpi che colli­
dono. La legge di conservazione dell’ energia-impulso si può scrivere
in forma quadridimensionale come segue:
m ^Ui" + ?n{02ìUi^ = M 0ut, (8.26)

dove iij è la velocità del corpo singolo che si forma dopo la colli­
sione. Le prime tre equazioni dell’ (8.26) per i — 1, 2, 3 permettono
di trovare le tre componenti della velocità del corpo singolo. La quar­
ta equazione (i — 4) si scriverà nella forma
m(0l)y {U + fr?.Q2)y(2> == M 0y.

Nel sistema di riferimento, in cui il nuovo corpo è in quiete, si ha

/-ee* ' c-m


M, = -

Questa uguaglianza si può anche scrivere come segue:

M 0= - L (7n “ ’ c* (v<‘ >- 1) + < ’ C2 (Y(2) - DI + + < ’• (8.27)

294
Si vede dall’ (8.27) che la massa a riposo M 0 del nuovo sistema
contiene la somma delle masse a riposo delle particelle iniziali
m*lj + m(02) ed una certa massa in più associata al fatto che l ’ energia
cinetica relativistica delle due particelle (l’ espressione in parentesi
quadra) è slata trasformata in qualche altro tipo di energia (ad
esempio, calore). Dunque, in meccanica relativistica la legge di
conservazione dell’ energia include tutti i tipi di energia, e non
sol tanto quelli che si considerano in meccanica.
Infine, bisogna sottolineare ancora una volta che le relazioni
ottenute indicano la proporzionalità della massa a riposo e dell’ ener­
gia a riposo; è molto importante che ciò sia valido soltanto nel
sistema di riferimento proprio. Generalmente, l ’ energia e la massa
a riposo, in termini quadridimensionali, hanno proprietà diverse
nel caso delle trasformazioni di Lorentz (§ 5.7), e parlare di conver­
sione di « massa » in energia, come si fa qualche volta, è privo di
significato.
Torniamo alla massa a riposo nulla. Naturalmente, dal punto
di vista classico una massa a riposo nulla è piuttosto strana. Abbiamo
■visto (§ 7.6) che bisogna attribuire una massa a riposo nulla alle
particelle che si muovono alla velocità c (secondo le idee-contempo­
ranee tali particelle sono i quanti di luce (fotoni) ed i neutrini).
Come si sa, la velocità c occupa una posizione privilegiata nella
TRR: in tutti i SRI sperimentalmente realizzabili questa velocità
si mantiene invariata. Si potrebbe terminare qui, ma vogliamo fare
qualche ulteriore commento.
Ovviamente, senza cadere in contraddizione, si deve ritenere
*che la materia (nel senso filosofico), dotata di massa a riposo finita,
è equivalente alla materia la cui massa a riposo è nulla. Vedremo
che l ’ ultimo caso si realizza piuttosto raramente in natura, ma in
linea di principio è realizzabile. Queste due forme di materia si
mutano l ’ uria nell’ altra e soffermiamoci ora su un esempio di tale
conversione. Si tratta della creazione di coppie elettrone-positrone
da parte di quanti gamma (fotoni ad alta energia) e della reazione
inversa cjii collisione fra un elettrone ed un positrone (questa reazione
è conosciuta sotto il nome ormai obsoleto di « annichilazione » di
particelle). Questa reazione comporta la fine dell’ esistenza di parti-
celle dotate di massa a riposo finita (un elettrone ed un positrone),
■e porta alla comparsa di due fotoni. Ciò che è essenziale è che questa
reazione soddisfa lo leggi di conservazione dell’ energia e dell’ impulso.
Sia i fotoni (con massa a riposo nulla) che gli elettroni e i positroni
■(che hanno una massa a riposo) sono caratterizzati da energia ed
impulsi definiti. Le quantità corrispondenti che risultano da queste
reazioni rimangono le stesse; un fotone, come oggetto reale, è defini­
to dal suo impulso e dalla sua energia. La massa a riposo del fotone,
uguale a zero, caratterizza un fotone non meno della massa finita
di un elettrone e di un positrone.
Se. si considera la collisione elettrone-positrone in un riferimento
del centro d’ inerzia (in questo riferimento le particelle vanno incontro
una all’ altra con velocità vx e v2 uguali ma dirette in verso opposto)
la legge di conservazione dell’ energia prende la forma
tìiqc2 , m0c2
— 2h\. (8.28)

Questa uguaglianza mostra che l ’ energia totale di un elettrone e di


un positrone è uguale all’ energia dei due fotoni che si formano.
Se teniamo presente che nel riferimento del centro d’ inerzia v1 =
la frequenza osservata di questi due fotoni sarà
rriftC '2
v = ---- / — . (8.29)
h V 1—p2 ■
Dalla legge di conservazione dell’ impulso segue che le energie
dei due fotoni creati sono uguali: gli impulsi dei fotoni devono
essere uguali in modulo (e opposti in direzione), e l ’ energia di un
fotone è proporzionale al suo impulso.
Quando un elettrone ed un positrone si muovono a velocità
non relativistiche, la frequenza dei fotoni che risultano dall5anni­
chilazione è uguale a v = mediti che è in buon accordo coi risultati
sperimentali.
L ’ esempio presentato non è certo l ’ unico. Si può menzionare
il decadimento del mesone neutro (re0) (una massa a riposo è uguale
approssimativamente a 200 masse a riposo dell’ elettrone): K ° -> 2 < y.
Consideriamo ora n fotoni della stessa frequenza che si muovono'
in varie direzioni. L ’ energia di questo sistema di fotoni è uguale
alla somma delle energie dei singoli fotoni: % = = nkv\ l ’ im­
pulso P del sistema di fotoni è uguale alla somma degli impulsi
dei fotoni,

P — 2 Pi (5r + 52+ ■•* + 57i)?

dove st è un versore orientato lungo la direzione di propagazione


dell’ i-esimo fotone. Secondo la definizione, la massa a riposo M
dell’ insieme dei fotoni si può trovare dall’ espressione

M 2C2 = IL_p 3= ( l i b i )2 _ ( J n ) :2 + *2 + . . . + Sn)K

Il secondo membro dell’ (8.30) si annulla solo se tutti i fotoni


si propagano nella stessa direzione. Questo risultato è stato ottenuto
nel § 7.3: un treno limitato di onde piane ha massa a riposo nulla.
Comunque, due fotoni, le cui direzioni di propagazione formano un
certo angolo possiedono una massa a riposo finita. Infatti, dalla
formula generale (8.30) si ottiene

M 2c 2 = 2- ( ) 2 (2 + 2 cos G) = ( 2 ( 1 - cos2 £■) • (8.31)

296
Dunque, una nube di radiazione elettromagnetica, costituita da
fotoni, aventi ciascuno massa a riposo nulla, possiede una massa
a riposo positiva, e quindi, induce un campo gravitazionale.
Partendo dal fatto che anche due fotoni nel caso generale hanno
una massa a riposo, si può tentare di evitare la discussione sulla
massa a riposo nulla di un fotone. Ma un singolo fotone si può osser­
vare 1 in via di principio, e, perciò, bisogna dare un’ interpretazione
ad una massa a riposo nulla.
Per chiarire la causa che ha condotto alla comparsa della « massa
a riposo nulla » è meglio usare i concetti quadridimensionali. Consi­
deriamo il quadrimpulso di una particella di massa a riposo finita m::
P , % = t n c 2y . .

La massa a riposo è il modulo del quadrivettore P:


P2 :— —p 2 = ? n 2c 2 , /« 99V

che è un invariante. Nel quadrivettore energia-impulso l ’ energia:


è la componente temporale mentre le componenti spaziali sono le-
componenti dell’ impulso tridimensionale. È importante ricordare-

>
che le proprietà basilari del quadrivettore P coincidono con quelle-
del quadrivettore V in quanto P — mV. D ’ altra parte

V = — , dR* = dsz, V2= ( - J - ) 2 - (8.33).

Perciò, nel caso di linee d’ universo di lunghezza nulla (ds = 0)


la massa a riposo delle corrispondenti particelle si annulla in quanto
P 2 = 0. Perciò i fotoni si muovono lungo linee di lunghezza nulla.
C’ è ancora un’ altra questione che sembra paradossale a prima-
vista. Come trasferisce un fotone, con massa a riposo nulla, una:
massa a riposo finita da un punto all’ altro? L ’ assorbimento di un
fotone dimostra che ciò avviene così. Cedendo la sua energia, per
esempio, al solido, un fotone lo riscalda aumentando così la sua:
massa a riposo.
Analizziamo un semplice esempio. Ad un’ estremità di un carrello1
in grado di muoversi senza attrito viene emesso un fotone, assorbito*
in seguito all’ altra estremità del carrello. Prima dell’ emissione del
fotone l ’ energia del carrello in quiete è = Afe2 (fig. 8.15). II
sistema è chiuso, il suo quadrimpulso rimane costante e la somma
dell’ impulso tridimensionale del carrello e del fotone è uguale a zero-
come prima. La somma delle energie del carrello e del fotone è g 0..
La massa del sistema rimane costante anche se la massa del carrello-
diminuisce e quella del fotone è uguale a zero. Non c’ è ragione d l

1 0. Friesh, Prendiamo un fotone e..., YOH (Successi delle scienze fisiche)-


90, 379 (1966).

297'
preoccuparsi: la massa non è una grandezza additiva! Quando il
"fotone è assorbito all’ altra estremità del carrello l’ energia del carrello
è ancora g 0, ma da un’ estremità del carrello all’ altra è stata già
trasferita l ’ energia hv e la distribuzione di massa lungo il carrello
è già diversa da quella iniziale.
Infine, si osservi die le conclusioni della TRE. permettono di
precisare in concetto di sistema « chiuso ». In meccanica un sistema
è detto chiuso se i corpi costituenti non interagiscono con i corpi
esterni ». Un’ interazione è descritta per mezzo di forze. In chimica

Radiazione

Me2 M e2
Carrello
che subLsce\
un rinculo

Prim a d e lla Dopo [assorbimento


radiazione

ÌFig. 8.15. Un fotcne trasferisce massa anche se la sua massa è uguale a zero
Prima dell’emissione del fotone l ’ energia del carrello è uguale ad fè0. In un
sistema chiuso il quadrimpulso si conserva, perciò l ’ impulso tridimensionale del
carrello e del fotone è uguale a zero come prima e l ’energia totale del. carrello
e del fotone <£0. La massa del sistema rimane costante, sebbene la massa del
carrello sia diminuita e quella del fotone sia nulla (la massa non è additiva!).
Quando il fotone è assorbito all’altra estremità del carrello, la sua energia
diventa uguale ancora ad <$„, ma l ’ energia hv è già stata trasferita da un’e­
stremità all’altra del carrello e la distribuzione della massa lungo il carrello
è diversa da quella iniziale.

si preferisce chiamare chiuso un sistema che non scambia sostanza


con l ’ esterno (quindi, secondo l ’ idea non relativistica, la massa
è costante). Passando ai processi termici con sistema chiuso si intende
un sistema termoisolato. Comunque la TRR dichiara che ogni
trasmissione di energia è collegata con una trasmissione d ’ impulso
(ciò è valido anche per la trasmissione di calore); uria trasmissione
di energia comporta un cambiamento di massa del sistema. Queste
definizioni si possono combinare in una sola, considerando chiuso
un sistema in cui l ’ energia e l ’ impulso si conservano (il qnadrivettore
energia-impulso). L ’energia e l ’ impulso rimangono costanti in un
sistema meccanico chiuso. Questo sistema è termoisolato. Secondo
la definizione convenzionale M e2 = (é/c)2 — P 2 la sua massa rimane
■costante. Naturalmente, la legge di conservazione della massa di
un sistema chiuso non implica l ’ additività delle masse del sistema.
Questo fatto vale in modo particolare per la generazione di nuove
particelle.

.298
SUPPLEMENTI

I. Chi ha sviluppato la teoria della


relatività ristretta e come? 1
(V. L. Ginzburg)
La teoria della relatività è una delle più grandi scoperte di tutti
i tempi; inoltre, riguarda il nostro secolo. Quest’ultimo fatto è parti­
colarmente significativo, in quanto questa teoria non è tanto una
parte della storia della scienza (o, se si vuole, non solo una parte
della storia della scienza), ma una teoria fisica con applicazioni
•dirette molto estese. A ciò si deve il grande interesse per la storia
dell’ evoluzione della teoria della relatività. Essa ha richiesto la
revisione dei concetti fondamentali di spazio e di tempo, e perciò
delle basi della fisica classica (prerelativistica). I vecchi concetti
sono stati duri a morire ed i nuovi hanno faticato ad affermarsi: le
controversie e le polemiche sono andate avanti per decenni. Inoltre,
hanno coinvolto rappresentanti di altre scienze, oltre ai fisici.
La teoria della relatività è stata e rimane il centro di un vasto
interesse. Questo è ovviamente vero anche per la sua storia, per
quanto riguarda E evoluzione delle idee e Lordine della priorità.
Perciò ancora oggi, settanta anni dopo l ’ enunciazione della
teoria della relatività ristretta, la gente si chiede ancora chi l ’ ha
sviluppata e come.
La teoria della relatività ristretta è più spesso associata al nome
di A. Einstein,, mentre H. Lorentz, H. Poincaré, e pochi altri sono
menzionati come suoi predecessori. Ma ci sono altri punti di vista
che, per esempio, citano Lorentz, Poincaré ed Einstein come i prin­
cipali autori della TR R . Quale punto di vista è più giusto e quali
sono gli argomenti? La risposta a questa domanda, come a quella
nel titolo di questo Supplemento, dovrebbe interessare il lettore
di questo libro. Nel seguito ci sono alcune osservazioni a riguardo.
Tre lavori sono considerati fondamentali nello sviluppo della
TR R . L ’ autore del primo di essi (1904) fu il professore olandese
Hendrik Lorentz (1853-1928), una delle figure di primo piano della
fisica teorica, insignito nel 1902 del premio Nobel per la fisica.
L ’ autore del secondo lavoro (1906, una breve anticipazione era
stata pubblicata nel 1905) fu il famoso matematico francese Henri
Poincaré (1854-1912), famoso anche per le sue ricerche fisiche e nella

1 Questa è la versione rivista dell’ articolo di V. L. Ginzburg, apparso in


forma definitiva nella Piaccolta di Einstein, 1974 (Mosca, 1976, in russo).

299
metodologia della scienza. Infine, il terzo lavoro (1905) fu scritto da
uno sconosciuto impiegato dell’ Ufficio Brevetti Federale Svizzero,
Albert Einstein (1879-1955).
È noto che i nuovi lavori di scrittori e poeti famosi e popolari
attraggono immediatamente 1’ attenzione di tutti, mentre quelli di
scrittori emergenti devono combattere contro la diffidenza. Nella
scienza questa tendenza, quando Uè, è più pronunciata. Come mai,
nel caso della TR R , è avvenuto il contrario: è stato il lavoro di
Einstein ad essere acclamato e riconosciuto?. Una risposta chiara
a questa domanda è stata data da VV. Pauli nel suo noto articolo
Teoria della relatività pubblicato per la prima volta nel 1921 nel-
VEnciclopedia matematica. Il libro di Pauli fu ristampato e tradotto
in altre lingue (l’ edizione in russo apparve nel 1947). Pauli conclude
il suo saggio sulla storia della teoria della relatività ristretta con le
parole: « È stato Einstein, infine, che completò la formulazione
basilare di questa nuova disciplina. Il suo lavoro del 1905 fu dato
alle stampe circa nello stesso momento dell’ articolo di Poincaré
e fu scritto senza che l ’ autore fosse a conoscenza del precedente
lavoro di Lorentz del 1904. Esso conteneva non solo tutti i risultati
essenziali contenuti negli altri due articoli, ma mostrava una com­
prensione interamente nuova e molto profonda dell’ intero problema ».
Un altro eminente fisico, M. Born, ricorda le sue impressioni dopo
la lettura del lavoro di Einstein: « Sebbene mi fosse piuttosto fam i­
liare l ’ idea relativistica e le trasformazioni di Lorentz, i ragiona­
menti di Einstein furono per me una rivelazione».
È questa chiarezza profonda ed interamente nuova, quasi una
rivelazione,, che assicurò il successo al lavoro di Einstein, che lo rese
fondamentale per E enunciazione della teoria della relatività ristretta.
Alla storia delia scienza interessano più di tutto due questioni.
La prima è « come »: come sono apparse e si sono evolute le idee,
come è stata preparata e come si è giunti alla scoperta? La seconda
domanda è « chi »: chi ha fatto la scoperta, ha dato corpo all’ idea,
l ’ha trasformata in «carne ed ossa», l ’ ha elaborata e le ha dato>
un posto nella comunità scientifica? La domanda « come? » sembra
quella fondamentale, principale: è connessa al contenuto stesso
della scienza ed al metodo delia ricerca scientifica. La domanda
« chi? » può sembrare secondaria; infatti, non ha alcun peso sull’ es­
senza del problema, se si considera la fisica e non, diciamo, la psi­
cologia della creatività scientifica o la sociologia o la vita di questa
o quella persona. Attualmente è difficile, se non impossibile, trac­
ciare una linea fra il « come? » ed il « chi? ». La scienza è portata
avanti da persone e se il prodotto finale — la totalità di certe affer­
mazioni, equazioni, relazioni, ecc. — è spersonalizzato o, più
precisamente, quasi spersonalizzato, il processo iniziale di scoperta
o deduzione e dello sviluppo delle equazioni e delle relazioni riflette
le caratteristiche ed i tratti tipici degli scopritori. Perciò, per quanto
riguarda la storia della scienza, alle domande « come? » e « chi? »
bisogna rispondere contemporaneamente.

300
Vogliamo premettere alcune osservazioni con due parole sulla
teoria della relatività ristretta (questo libro tratta i punti fonda­
mentali con maggiori dettagli, ma è utile riassumere a questo punto
la situazione).
Uno dei concetti fondamentali della fisica è quello di sistema
di riferimento inerziale. Un sistema di riferimento usato per definire
le coordinate ed i tempi degli eventi è inerziale se in esso vale la legge di
inerzia, cioè se un corpo isolato (non soggetto a forze) si muove di
moto rettilineo ed uniforme. Per essere precisi, questa definizione
non è priva di obiezioni e merita di essere chiarita, in quanto rimane
poco chiaro quale corpo si può considerare isolato. Grossolanamente
parlando, un isolamento è garantito, se tutti gli altri corpi sono
sufficientemente lontani. Un esempio di un « buon » sistema iner­
ziale è un sistema di coordinate, la cui origine coincide col Sole
e gli assi diretti verso le stelle lontane. La legge d’ inerzia vale un
po’ meno, ma ancora con precisione sufficiente, sulla Terra (trascu­
rando la gravità). Un sistema di riferimento, ruotante rispetto ad
un sistema inerziale, non lo sarà, la differenza tra i due sistemi
è tanto più grande quanto maggiore è la velocità angolare.
Se un dato sistema è inerziale, ogni altro sistema in moto unifor­
me e rettilineo rispetto ad esso è aneli’ esso inerziale. La generalizza­
zione di questa conclusione a tutti i fenomeni meccanici — l ’ affer­
mazione che i fenomeni meccanici avvengono nello stesso modo in
tutti i sistemi inerziali — è proprio il contenuto del principio clas­
sico, o galileiano, di relatività. Più precisamente, la definizione
e Papplicazione del principio comprende una determinata assunzione
prerelativistica che riguarda la connessione fra coordinate e tempo
degli eventi nei diversi sistemi inerziali, tPerciò, se un tale sistema
IC (coordinate x\ y ', z' e tempo t') si muove rispetto ad un dato
sistema inerziale K (coordinate x, y, z e tempo t) con velocità V
dirette lungo gli assi positivi x, x (che coincidono), allora, come
si è considerato prima della nascita di TRR,
x = x — Vt, y' = y, z' = 2, t' = .£
(trasformazioni di Galileo).
La natura assoluta del tempo — la sua indipendenza dal moto
del sistema di riferimento (da cui L’uguaglianza t' = t) — era assun­
ta, in generale, in tutti i sistemi di riferimento.
Nel moto uniforme l ’ accelerazione del corpo è, ovviamente,
nulla. Quindi nelle trasformazioni di Galileo, cioè in ogni sistema
inerziale, l ’ accelerazione è la stessa. Perciò, in queste trasforma­
zioni, la legge della dinamica, la seconda legge di Newton (massa X
X accelerazione — forza), rimane invariata se ia massa, la forza
•e l ’ accelerazione rimangono le stesse nei sistemi K e K f. Quest’ ulti­
ma affermazione è assunta (e sperimentalmente dimostrata) e si
giunge alla conclusione che il principio classico di relatività vale
nella meccanica di Newton. In generale, Pinvarianza nelle trasfor­
mazioni di Galileo delle equazioni che esprimono le leggi fisiche
fondamentali garantisce la validità del principio classico di relati­
vità.
Tempo fa, fino alla metà e anche alia fine del X IX secolo si
credeva che la fisica si potesse costruire completamente sulla base*
delle equazioni del moto di Newton. Perciò si pensava che il prin­
cipio classico di relatività fosse sempre valido. Comunque lo sviluppo-
deli’ elettro dinamica gettò delle ombre sul principio classico di
relatività. Le equazioni delTelettrodinamica (equazioni di Maxwell)-
non mantengono la loro forma nelle trasformazioni di Galileo,,
perciò la loro applicazione porta alla seguente conclusione: in elet­
trodinamica il principio di relatività fallisce e, in particolare, lai
luce e le altre onde elettromagnetiche si propagano in modo diffe­
rente nei diversi sistemi inerziali, anche nel vuoto. Se il mezzo-
portatore di luce allora introdotto — l ’ etere — è in quiete in un
sistema di riferimento inerziale (K ), la velocità della luce in esso,,
indipendentemente dalla direzione, ò c = 3 -IO10 crn/s. In un altro»
sistema di riferimento K ' , che si muove con velocità V rispetto-
ali’ etere (lungo gli assi x e x'), la velocità della luce è, come risulta:
ovvio dalle trasformazioni di Galileo, c — c — V lungo gli assi
x e x ed c = c -(- V nella direzione opposta, ecc.
Ma gli esperimenti smentiscono una conclusione apparentemente
ovvia; tutti gli esperimenti, a partire da quello famoso di Michelson
condotto nel 1881 e ripetuto diverse volte, confermano la validità
del principio di relatività in elettrodinamica, come in tutta la
fisica. Ma, secondo il principio di relatività, come può la velocità
della luce essere la stessa in diversi sistemi di riferimento, quando»
le trasformazioni di Galileo conducono a conclusioni opposte?
C’ è voluto quasi un quarto di secolo di domande inquietanti
per giungere alla conclusione che costituisce il cuore e la base della
TRR: le trasformazioni di Galileo devono essere sbagliate. Più
precisamente, come accade in questi casi, non sono proprio sbagliate,,
ma approssimate. Le equazioni esatte, che legano le coordinate ed
il tempo nei riferimenti K e K \ sono
V
x — vt

(le trasformazioni di Lorentz). Se la velocità V dei sistemi inerziali


è sufficientemente piccola rispetto alla velocità della luce c, le
trasformazioni di Lorentz diventano le trasformazioni di Galileo;
quindi il grado di precisione è dato dal parametro V2/c2. Per un
satellite in orbita vicino alla Terra V ^ 8 km/s, e V2/c2 & 10“ 9.
La velocità della Terra rispetto al Sole è V » 30 km/s e V2/c2 &
« 10“8. È ovviò da questi esempi che nel campo dei fenomeni che
incontriamo ogni giorno le trasformazioni di Galileo, e la meccanica
di Newton ad esse associata, sono valide con un alto grado di preci­
sione. Ma in elettrodinamica e nello studio delle particelle relati-
302
cistiche, che viaggiano a velocità v, confrontabili con quella della)
luce c nel vuoto, sono necessarie le trasformazioni di Lorentz. Uno»
dei corollari è l ’ equazione
x 2 + ÌJ1 + -22 — c2t2 = x '2 + y '2 + z'2 — c2t'2.
Ricordando che l ’ equazione del fronte di un’ onda luminosa sferica
ha la forma x 2 + y2 + z2 — cH2 = 0, l ’ equazione precedente verifica»
immediatamente la validità del principio di relatività per la pro­
pagazione della luce: in tutti i sistemi inerziali la velocità della;
luce è la stessa ed è uguale a c.
La TRR rappresenta proprio una costruzione teorica basata sul
principio di relatività e sulle trasformazioni di Lorentz. La caratte­
ristica principale della TRR è il nuovo, rispetto alla fisica prerela­
tivistica, concetto spazio-temporale che risulta dalla sostituzione-
delie trasformazioni di Galileo con quelle di Lorentz. Il contenuto'
di queste ultime, in senso fisico, non si riduce alle stesse semplici
formule ridotte che legano le coordinate ed' il tempo x , y , z ', tr
con x, y, z, t. Come sempre in fisica, è necessario stabilire il signi­
ficato di tutte le grandezze, porre le basi dei metodi impiegati per
misurare il tempo e le coordinate e chiarire le proprietà dei righelli
e degli orologi usati. Uno dei problemi è quello della sincronizzazione
degli orologi in ciascuno dei riferimenti K e K f. Le coordinate ed.
il tempo che figurano nelle trasformazioni di Lorentz sono definiti
in modo che eventi simultanei nel riferimento K (tempo t) non lo
siano nel riferimento K ' (tempo t'). Il rifiuto del tempo assoluto
è una conclusione radicale (che dobbiamo ad Einstein). Per la sua
importanza e difficoltà questa conclusione può essere confrontata
con il rifiuto dell’ idea di una Terra stazionaria, su cui si basa il
sistema eliocentrico di Copernico.
Ora si può affrontare direttamente la questione: chi ha sviluppato
la teoria della relatività ristretta, e come?
La strada della TRR si snoda, come appare chiaramente da
quanto detto, attraverso una difficoltà fondamentale., che è stato-
necessario superare: il principio di relatività vale sperimentalmente
in elettrodinamica (e non solo in meccanica), ma è incompatibile
con le trasformazioni di Galileo. Lorentz e gli altri cercarono di
rimuovere la contraddizione senza abbandonare le trasformazioni
di Galileo, assumendo che tutti i corpi in moto rispetto all’ etere si
contraggono. Se un righello, la cui lunghezza a riposo rispetto
all’ etere è. Z0, nel moto con velocità V avrà una lunghezza
l0 V i — (Vie)2, allora si può spiegare perché alcuni esperimenti
non rivelano il moto dei corpi rispetto all’ etere, ed i loro risultati
non dipendono dalla velocità del moto della Terra rispetto al Sole.
Comunque l ’ ipòtesi della contrazione non è adeguata a tutti gli
esperimenti; emergono nuovi fatti che si accordano al principio-
di relatività e richiedono ulteriori ipotesi per la loro spiegazione.
Naturalmente una tale situazione e intollerabile, e Lorentz si sforzò
ostinatamente, di « mostrare che molti fenomeni elettromagnetici,

303
•a rigore, cioè senza trascurare i termini di grado superiore, non
dipendono dai moto del sistema ». Allo scopo Lorentz dovette
mostrare che per un corpo in moto uniforme ed rettilineo (rispetto
all’ etere) le equazioni dell’ eie Uro dinamica ammettono soluzioni che
corrispondono in un certo modo alle soluzioni per un corpo in quiete.
La corrispondenza è assicurata passando alle nuove variabili
x\ ij\ z\ t\ mediante le trasformazioni di Lorentz ed introducendo
nuovi (con l’ apice) vettori campo elettromagnetico. In seguito
a queste trasformazioni la forma delle equazioni del campo non
cambia, cioè esse hanno la stessa forma per le vecchie (senz’ apice)
e le nuove (con apice) grandezze. Questa proprietà è conosciuta
come invarianza; nel caso in questione, invarianza delle equazioni
del campo elettromagnetico rispetto alle trasformazioni di Lorentz.
Oggi, dopo lo sviluppo della TR R , ciò è proprio la conferma della
validità del principio eli relatività in elettrodinamica, ma Lorentz
non considerava il tempo t' come il tempo del riferimento in moto;
egli lo chiamò tempo locale e pensò che aveva a che fare « semplice­
mente con grandezze ausiliari introdotte con l ’ aiuto di espedienti
matematici. In particolare, la variabile t' non poteva chiamarsi
« tempo » nello stesso senso delia variabile £ ». Nel 1915 Lorentz
rafforzò questa opinione: « La regione principale del mio errore era
stata di considerare sempre soltanto la variabile t come tempo vero,
mentre il mio tempo locale t' doveva essere considerato come una
grandezza matematica ausiliare. Nella teoria di Einstein, d’ altra
parte, t' gioca lo stesso ruolo di £ ». Nel 1927, un anno prima della
sua morte, Lorentz chiarì ciò ancora più precisamente: « Per me
c’ era soltanto un tempo vero, lo consideravo la mia trasformazione
temporale come una semplice ipotesi euristica di lavoro. Dunque,
la teoria della relatività praticamente è lavoro esclusivo di Einstein ».
Posso aggiungere che dopo aver riletto i lavori di Lorentz e Poincaré
(70 anni dopo la loro pubblicazione), conoscendo già il risultato (il
che, ovviamente, facilita la comprensione), ho avuto difficoltà
a comprendere perché Pinvarianza delle equazioni dell’ elettrodinami­
ca rispetto alle trasformazioni di Lorentz, dimostrata in questi
lavori, si può considerare al tempo, stesso la prova della validità del
principio di relatività.
Inoltre, Lorentz e Poincaré consideravano questo principio sempli­
cemente come un’ asserzione sull’ impossibilità di osservare il moto
uniforme di un corpo rispetto all’ etere. Non si richiedono particolari
sforzi per procedere da questo a considerare equivalenti tutti i rife­
rimenti inerziali (che è la formulazione contemporanea del principio
di relatività), purché le trasformazioni di Lorentz siano considerate
come il passaggio ad un sistema di riferimento in moto.
Come abbiamo visto, è proprio quello che Lorentz non con­
siderò in modo definitivo. Poincaré fu meno chiaro. Nei suoi articoli
del 1905-1906 egli affermò semplicemente che le equazioni della
elettrodinamica « possono essere soggette all’ importante trasforma­
zione scoperta da Lorentz, che spiega perché non è possibile alcuna

304
dimostrazione sperimentale del moto assoluto della Terra » L Secondo
il mio punto di vista questa « spiegazione » non va oltre quella di
Lorentz. In generale Poincaré scrive: « I risultati che ho ottenuto
sono in accordo con quelli di Lorentz nei punti principali. Io cercai
soltanto di completarli e modificarli in certi dettagli. Alcune dif£e=
renze, come vedremo in seguito sono di minor importanza » 1 2.
D ’ altra parte alcuni commenti di Poincaré nei primi lavori, articoli
e pubblicazioni suonano quasi profetici. Vi si tratta della necessità
di definire il concetto di simultaneità e della possibilità di usare
allo scopo segnali luminosi, del principio di relatività. Comunque,
egli non sviluppò queste considerazioni e nei suoi lavori del 1905
e 1906 seguì Lorentz. Come è stato sottolineato in precedenza, essi
si sforzarono di dimostrare e dimostrarono per quali ipotesi il moto
rettilineo di un corpo rispetto all5etere non è misurabile. Ma Einstein
nel suo lavoro del 1905 rovesciò, potremmo dire, Finterà questione
mostrando che, una volta accettato il principio di relatività e sin­
cronizzati gli orologi con l ’ aiuto della luce (ed