Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Edizioni Mir
1 edizione: 1982
Titolo originale: Spetsialnaja teorija otnosxtelnosti
© Copyright by Nauka, 1977, Mosca
Prefazione
6
V i li . Su alcuni «paradossi» della teoria della relatività ristretta 269
§ 8.1. Più veloce della luce (270). § 8.2. Paradosso del filo e della
leva (275). § 8.3. Tachioni (279). § 8.4. Paradosso dell’ orologio (285).
§ 8.5. « Equivalenza » fra massa ed energia. Massa a riposo nulla (293).
Supplementi 299
Appendice I 343
Bibliografia 371
7
PREFAZIONE
1 Nel seguito il termine « teoria della relatività ristretta » sarà spesso abbre
viato in TRR.
9
gine delle coordinate. Il più semplice sistema di coordinate è quello
cartesiano. Esso si costruisce tracciando tre rette mutuamente per
pendicolari, cioè i tre assi coordinati X , Y , Z. In termini fisici, co
munque, queste non sono soltanto linee rette. In linea teorica, gli
assi coordinati sono solidi rigidi non deformabili 1. A questo pro
posito gli strumenti e gli altri oggetti di un dato sistema di riferi
mento sono sempre fissati agli assi e quindi va tenuto presente che
un sistema di coordinate in fisica è sempre un oggetto materiale.
Nel sistema di coordinate cartesiano i punti sono facilmente
individuabili. Da ciascun punto IVI dello spazio si possono costruire
le perpendicolari agli assi X , Y , Z o, in altri termini, proiettare questo
punto sugli assi coordinati. Misurando in una scala opportuna la
•distanza della proiezione di un punto dall’ origine lungo gli assi
X , Y, Z si ottengono i numeri x, iy, _z, che sono chiamati coordinate
cartesiane del punto. La distanza può essere misurata mediante una
trasposizione passo per passo della scala unitaria, dall’ origine della
proiezione di un punto sull’ asse. Infatti, tale procedura, usata per
la misura delle lunghezze nella vita di ogni giorno, può essere usata
per determinare la lunghezza di un intervallo o di un oggetto a riposo
rispetto ad un dato sistema di coordinate. Come vedremo più avanti,
la teoria della relatività ristretta offre un metodo molto conveniente
per misurare le distanze senza dover trasporre passo per passo una
scala rigida (vedi capitolo II). Naturalmente i due metodi sono equi
valenti.
Quindi, grazie all’ introduzione di coordinate cartesiane, ogni
punto dello spazio acquista tre numeri, che sono le tre coordinate
.x, y, z. Comunque, il principio obiettivo della fisica è lo studio del
moto. Pur se il moto di tipo meccanico è il più semplice, la sua de
scrizione richiede misure di tempo e quindi il sistema di coordinate
deve essere fornito anche di un orologio. Questo orologio è necessario
per registrare Faccadere di un evento nei vari punti dello spazio.
Di quanti orologi si ha bisogno?
Nella meccanica classica non ci sono esitazioni riguardo la ri
sposta a questa domanda e si assume tacitamente che è sufficiente un
orologio fermo in un dato sistema di riferimento. È utile eviden
ziare le implicazioni di questa assunzione. Supponiamo che l ’ oro
logio sia posto a ll’ origine del sistema di coordinate. Gli eventi pos
sono aver luogo in ogni punto dello spazio compresi quelli sufficien
temente lontani dall’ origine. Come si può, allora, registrare un even
to se l ’ orologio è posto lontano dal punto dove l ’evento stesso è
accaduto? Ovviamente, nell’esatto momento in cui avviene un even
to, bisogna inviare un certo segnale dal punto, in cui avviene l ’even
to, all’ orologio posto nell’ origine. Se la velocità del segnale è finita,
esso raggiungerà l ’ orologio qualche tempo dopo l ’ inizio dell’evento,
e l ’ intervallo di tempo dipenderà dalla distanza tra il punto dove
1 La TRR nega Resistenza di solidi assoluti (vedi capitolo V ili), ma per gli
assi coordinati è sufficiente che non siano molto elastici.
10
è accaduto l ’evento e l ’ orologio. Comunque la meccanica classica
si fonda sulla propagazione dei segnali a velocità infinita. È ovvio,
in questo caso, che sia sufficiente un solo orologio fissato rigidamente
in un punto del sistema di coordinate.
È implicito che l ’ inizio di un evento sia registrato come segue:
al momento in cui l ’evento ha luogo in un determinato punto dello
spazio un segnale viene inviato da quel punto all’ orologio, ed il
tempo di arrivo è proprio il tempo d ’ inizio dell’evento (la velocità
del segnale è infinita!). Il concetto di segnale infinitamente veloce
si applica, naturalmente, non solo alla registrazione degli eventi.
Esso è intrinsecamente contenuto nella meccanica classica newtonia
na: le interazioni tra i corpi sono trasmesse a velocità infinita
(vedi § 1.4).
La fisica moderna, tuttavia, afferma che tutti i segnali (intera
zioni) sono trasmessi a velocità finita; in altre parole, esiste una ve
locità finita per la trasmissione delle interazioni. Come si può con
ciliare, dunque, questa affermazione con il fatto che la meccanica
newtoniana, basata sull’ assunzione di velocità infinita dei segnali,
si adatta eccellentemente a molti problemi (per esempio, predice in
modo esemplare il moto dei pianeti del sistema solare)? La risposta è
molto semplice. La velocità limite con cui viene trasmesso un segna
le, o un’ interazione, è molto elevata, in accordo con questa idea
è la velocità di un’ onda elettromagnetica nel vuoto, che è uguale a
circa 3* IO8 m/s. Ne consegue che, appena le velocità degli oggetti sono
considerevolmente inferiori a quella della luce nel vuoto e le distan
ze caratteristiche sono tali che il tempo di propagazione della luce
sia trascurabile, la meccanica newtoniana è valida ed è sufficiente
un orologio per registrare il tempo dell’evento. Nello stesso tempo
è chiaro che, nel caso di velocità elevate (v ^ c) e di sistemi estesi,
il tempo di un evento deve essere registrato in modo diverso e l ’ in
tera meccanica deve basarsi su altre premesse. Infatti, è proprio
ciò che la teoria della relatività ristretta fa quando prende esplici
tamente in considerazione la velocità finita della trasmissione dell’ in
terazione.
Torniamo ora sul sentiero classico. Un sistema di riferimento
è formato da un oggetto di riferimento con un sistema di coordinate,
un sistema di unità di lunghezza ed un orologio fissato rigidamente
a ll’ oggetto di riferimento, in fisica si ricorre sempre ad un sistema
di riferimento, poiché ogni misura compiuta con uno strumento pro
duce un risultato correlato al sistema di riferimento in cui lo stru
mento è a riposo.
§ 1.2. Scelta del sistema
di riferimento
Per trattare problemi concreti scegliamo un sistema di riferimento
conveniente ed un conveniente sistema di coordinate. Come si può
sfruttare Y opportunità di questa scelta? Per l ’ orologio, in meccanica
classica ogni sistema di riferimento ha bisogno di un solo orologio
11
Ideale. Ma un oggetto di riferimento, l ’ origine e le direzioni degli
assi coordinati si possono scegliere a piacere. È ben noto come questo
fatto venga utilizzato in geometria. Per esempio, l'equazione dell’el
lisse ha la forma semplice x,2/a2 4- y2lh2 — 1 soltanto se l ’ origine è
posta al centro delPellisse e gli assi coordinati coincidono con gli
assi principali. Senza dubbio, tutte le caratteristiche tipiche dell’ el
lisse rimangono inalterate per qualsiasi scelta del sistema di coor
dinate, .ma tutte le formule diventano incomparabilmente più
complesse. È importante sottolineare che in geometria analitica
le transizioni da un sistema di coordinate ad un altro modificano
soltanto la forma algebrica delle equazioni degii oggetti geometrici*
mentre gli oggetti stessi rimangono naturalmente inalterati.
N ell’ analisi dei fenomeni fisici, la costruzione di un sistema
di riferimento può essere fatta con una certa arbitrarietà. Comunque*
sono implicite le due principali proprietà dello spazio vuoto: omo
geneità ed isotropia. Omogeneità è l ’ identità di tutti i punti dello
spazio. Questa proprietà è essenziale essendo quella che ci permette
di usare la fisica. Si è dimostrato che le leggi della fisica sono le
stesse in vari punti della Terra e ovunque dentro il sistema solare.
È proprio questo che permette di porre l ’ origine nel punto più con
veniente. Quando si ruota un sistema di coordinate intorno all’ ori
gine ci aspettiamo che non ci siano cambiamenti. Questo significa
che tutte le direzioni che si departono da un punto dato hanno lo
medesime proprietà. Questa è l ’esatta isotropia dello spazio. In
meccanica classica (o, più precisamente, in sistemi di riferimento do
ve valgono le leggi di Newton, vedi § 1.5) si assume che lo spazio
libero sia omogeneo ed isotropo.
À differènza della geometria, in fisica c ’ è un’ altra scelta di si
stemi di riferimento: quelli in moto relativo agli altri. Questo è
superfluo in geometria, ma in fisica sistemi di riferimento in moto
relativo sono inevitabili. Per esempio, esperimenti di fisica possono
essere condotti a bordo di una nave spaziale e sulla Terra. Questi
sono due sistemi di riferimento, ciascuno dei quali può avere stru
menti immobili rispetto al riferimento. Non appena consideriamo
sistemi di riferimento che si muovono relativamente l ’uno all’ altro*
sorgono due questioni sostanzialmente diverse, ma fondamentali.
1. In che modo il moto del sistema di riferimento influenza £
fenomeni fisici osservati in esso, cioè le leggi della fisica cambiano
passando da un sistema di riferimento ad un altro?
2. Supponiamo di osservare un fenomeno fisico mediante uno
strumento in quiete in un dato sistema di riferimento e di ottenere*
dalle misure delle grandezze tipiche del fenomeno, determinati va
lori. Lo stesso fenomeno può essere osservato in un altro sistema di
riferimento in moto rispetto al primo. Le misure condotte nel se
condo sistema daranno determinati numeri che definiscono le stesse
grandezze fisiche. Come sono correlate queste grandezze?
È importante notare che in entrambi i sistemi si osserva lo stesso
fenomeno. Dobbiamo sapere come correlare queste grandezze. Dopo
12
tutto, un sistema di riferimento è una costruzione artificiale creata
allo scopo di compiere misure. I fenomeni stessi, come le leggi della
natura, non possono dipendere dalla scelta del sistema di riferimen
to. Il fenomeno naturale è una realtà oggettiva al di fuori dei nostri
sensi e delle nostre misure.
Naturalmente i risultati delle misure possono essere diversi in
differenti sistemi di riferimento, ma in ogni caso dobbiamo saper
convertire 1 risultati delle osservazioni ottenuti in un sistema in
quelli ottenuti, o cbe si possono ottenere, in un altro. In breve,
abbiamo bisogno di un metodo per trasformare i risultati delle mi
sure. Come si può trovare un tale metodo?
La risposta alla prima domanda ci conduce al principio di re
latività e, attraverso la legge di Newton, ci permette di distinguere
una classe speciale di sistemi di riferimento rappresentata dai siste
mi inerziali (§ 1.5). La risposta alla seconda domanda è data dalle
regole di trasformazione delle coordinate di un evento, cioè le tra
sformazioni di Galileo in meccanica classica (§ 1.3) o le trasformazio
ni di Lorentz in meccanica relativistica (§§ 2.4, 2.5, 2.7).
13
zione di questi riferimenti al § 1.5. Per il momento consideriamo due
sistemi di riferimento K e K r in moto uniforme e rettilineo (trasla
zione) l ’uno rispetto all’ altro, in termini di geometria. Assumiamo
che il sistema di riferimento K ' si muova relativamente a A a velo
cità F. Supponiamo che ad un dato istante t il raggio vettore del
punto M nel riferimento K ' sia uguale a r\ Allora, come si vede dalla
fig. 1.1, r = r — R, dove r è
il raggio vettore dello stesso
punto nel riferimento K , e R è
il raggio vettore dell’ origine del
sistema di coordinate K ' preso
dall’ origine di K. Questa rela
zione è valida per ogni istante
di tempo e R varia secondo la
nota legge R — Vt + J?0, dove
R 0 è il raggio vettore che deter
mina l ’ origine 0' al tempo t = 0.
Tenendo presente che all’ istante
t — 0 entrambe le origini coinci
dono, R = Vi e si ottiene la
legge di trasformazione in forma
vettoriale
Fig. 1.1. I due sistemi di riferimento
K e K ’ con gli assi x, y, z e x , y' , z' r —r v t, (1.1)
diretti arbitrariamente. Il sistema K'
si muove relativamente a K con velo
cità V. Il raggio vettore del punto M,dove le componenti del vettore V
uguale al vettore r nel sistema i£, sono definite nel sistema K . A
nel sistema È! è uguale a d r '. Secondo
la regola di somma vettoriale r = questo punto possiamo sfruttare
= r' -j- R, dove R è il raggio vettorel ’ isotropia dello spazio e ruotare
dell’ origine O’ . ognuno dei sistemi K e K ' intor
no alle rispettive origini. E conve
niente farlo nel modo seguente. Ruotando i sistemi di riferimento,
orientiamo gli assi x e x lungo la direzione della velocità relativa
dei sistemi K e K r. Poi ruotando i sistemi lungo gli assi comuni x , x\
orientiamo gli assi z/, y' e z, z' parallelamente gli uni agli altri, in
tal modo, non perdendo di generalità fisica, siamo giunti alle posi
zioni reciproche dei sistemi di coordinate mostrati nella fig. 1.2.
In questo caso la velocità V ha le componenti (F, 0, 0). L ’ origine del
sistema K ' si muove lungo l ’ asse comune x, x a velocità F, mentre
all’ istante iniziale entrambe le origini coincidono. Si vede dalla
formula vettoriale (1.1) o direttamente dalla fig. 1.2 che la relazione
tra le coordinate del punto M (dove è accaduto l ’ evento) nei sistemi
K e K ' è determinata dalle equazioni
= 2 — F £ ,y = y, z' z.,
Ora, per stabilire definitivamente quali sono le coordinate dell’ e
vento nel sistema K \ bisogna conoscere il tempo dell’ evento per
mezzo dell’ orologio nel sistema K r (ora abbiamo due orologi, uno nel
14
sistema K e un altro nel sistema K '). Poiché in entrambi i sistemi
usiamo segnali infinitamente veloci, la velocità relativa finita dei
sistemi è inessenziale per tali segnali: la velocità infinita rimane in
finita in entrambi i sistemi. Di conseguenza il tempo dell’ evento re
gistrato dagli orologi dei due sistemi sarà lo stesso, cioè t — tV
Fig. 1.2. I due sistemi di riferimento K e K! con gli assi p arali elissi muovono
relativamente Tuno all’altro a velocità V (V è la velocità di K' rispetto a K).
In fisica classica le coordinate di un « evento » si trasformano nel passaggio dai
riferimento K a K' secondo le formule delle « trasformazioni di Galileo » x —
— x — Vt, y = y, z' = z, t ' ~ t
15
trasformazione delle « coordinate » di un evento da K a K ' (1.2)
è chiamata trasformazione galileiana. Si vuole richiamare l ’ attenzio
ne dei lettori sul fatto che il tempo risulta la quarta coordinata di
un evento e quando si parla di coordinate di un evento, si intendono
quattro numeri (x, y, z, t). Questo si fa non solo per brevità di linguag
gio. Nella teoria della relatività ristretta una simile terminologia
trova una completa giustificazione (vedi capitolo IV).
Abbiamo già sottolineato l ’ equivalenza di due sistemi in moto
rettilineo uniforme relativamente l ’ uno all’ altro. I sistemi K e K \
cui taremo riferimento (1 ora m poi, differiscono soltanto per ia ve
locità V del sistema K ' rispetto a K , ovvero — V del sistema K rispet
to a K f. Quindi, per ottenere le formule di trasformazioni inverse,
è sufficiente scambiare di posto le grandezze con indice e senza indice,
cambiando segno a F. Si ha
X = X' + Vt'y
y = y', (4.3)
z = z\
t t\
Naturalmente le stesse equazioni si possono ottenere direttamente
per via analitica.
Si noti una delle conseguenze delle trasformazioni di Galileo.
Supponiamo che due eventi accadano sull’ asse x del sistema K : uno
nel punto x ± all’ istante tly l ’ altro nel punto x 2 all’ istante t2 (t± G)*
È possibile scegliere un riferimento K f in cui entrambi gli eventi
accadano1nello stesso punto dello spazio? Troviamo le coordinate
x di questi eventi nel riferimento K ':x [ = x 1 — Vt1? x'2 — x 2 — Vt2;
calcoliamo la differenza x'2 — x[ = x 2 — xx — V (t2 — tt). Ponendo
x 2 — x 'i = 0, otteniamo l ’equazione che determinala velocità del
riferimento K ' rispetto a K: V = (x2 — x ±)/(t2 — G)* 41 significato
di questo risultato è molto semplice: durante il tempo t2 — ty il
sistema K ' riesce a portare il punto x[ nel punto in cui avviene il
secondo evento al tempo richiesto. Si vede che è sempre possibile
scegliere un sistema K ' che soddisfa alla condizione richiesta. Co
munque, ciò è possibile solo perché in meccanica classica la velocità
V può assumere qualsiasi valore. Nella teoria della relatività, dove
la velocità di un sistema di riferimento, come di ogni altro corpo
materiale, è limitata, il sistema di riferimento cercato non esiste
sempre.
Prima di procedere nel principio di relatività galileiana accordia
moci su un termine. Per semplicità di linguaggio si dirà « diversi
osservatori » ovvero « osservatori in diversi sistemi di riferimento ».
Nel passato questa terminologia ha provocato molta discussione,
perché molti hanno immaginato che questo implicasse un approccio
soggettivo alle misure fisiche. Ma la presenza di un « osservatore »
non è affatto indispensabile per le misure: esse si possono fare con
strumenti senza la partecipazione degli uomini. E proprio il caso,
16
per esempio, delle astronavi, anche quando ci sono uomini a bordo.
Un « osservatore nel sistema K ». infatti, va inteso come l ’ insieme
degli strumenti in quiete in questo sistema. Non bisogna stupirsi
del fatto che strumenti posti in diversi sistemi di riferimento diano
differenti risultati di misura riguardo allo stesso fenomeno, in
quanto il moto relativo è un fatto fondamentale fisico. L ’ oggettività
delle leggi della natura si manifesta nel fatto che, conoscendo i
risultati di un’ osservazione in un sistema di riferimento, si possono
trovare i risultati dell’ osservazione dello stesso fenomeno in altri
riferimenti. Si può sperare che dopo questi chiarimenti il termine
« osservatore » che appare in queste pagine non dia luogo ad obie
zioni.
§ 1.4. Principio di relatività
galileiana. Seconda legge di
Newton
Il principio di relatività galileiana riguarda esclusivamente i feno
meni meccanici; fu il primo passo verso V acquisizione del principio
di relatività che abbraccia tutta la fisica. Galileo ha messo in luce
che il moto rettilineo ed uniforme non influenza i fenomeni mecca
nici. È necessario chiarire il significato di ciò. Come sappiamo già
è necessario un sistema di riferimento per la descrizione di ogni
fenomeno fisico, inclusi quelli meccanici. Consideriamo due sistemi
di riferimento in moto rettilineo ed uniforme relativamente l ’uno
all’ altro. Conduciamo un « esperimento meccanico » in uno di questi
riferimenti: ad esempio, studiamo il moto di un pendolo matematico
o la caduta libera di corpi. Il principio di relatività afferma che e-
sperimenti identici condotti nei due sistemi menzionati portano a
risultati identici. Quindi, è impossibile mettere in evidenza il moto
relativo dei riferimenti per mezzo di tali esperimenti. Ovviamente
il moto relativo si evidenzia facilmente in molti modi purché ven
gano condotti esperimenti di altro tipo.
La prima formulazione del principio di relatività che si trova
nel libro di Galileo Dialogo sui due massimi sistemi del mondo, tole
maico e copernicano (1632), è di natura puramente qualitativa. Fac
ciamo un breve estratto da questo libro, che illustra l ’ essenza del
problema.
« Rinchiudetevi con alcuni amici nella cabina principale sot
tocoperta di una grande nave, portate con voi delle mosche, delle
farfalle, altri piccoli animali volanti. Portate un grande recipiente
d’ acqua con dei pesci. Appendete una bottiglia che si svuota goccia
a goccia dentro un largo catino sotto di essa. Con la nave ancora1
ferma, osservate attentamente come gli animaletti volano con eguale :
velocità in tutti i lati della cabina. I pesci nuotano indifferentemente
in tutte le direzioni. Le gocce cadono dentro il recipiente sottostante. ;
Nello scagliare qualcosa ai vostri amici, non c ’ è bisogno di tirarlo
più forte in una direzione che in un’ altra, a parità di distanza. Saltan
do a piedi uniti, si fanno passi eguali in ogni direzione. Dopo aver
17
osservato tutto ciò con attenzione (anche se non ci sono dubbi, con
la nave ferma, che tutto ciò accada come descritto), fate muovere
la nave ad una velocità qualsiasi in modo che il moto sia uniforme
e senza fluttuazioni. Scoprirete che non c ’è alcun cambiamento in
tutti gli effetti citati, né potrete dire, da nessuno di essi, se la nave
si stia muovendo o stia ancora ferma ».
Dalla formulazione qualitativa del principio di relatività di
Galileo — l ’ identità dei risultati di identici esperimenti meccanici
condotti da due osservatori in moto uniforme e rettilineo relativa
mente l ’uno all’ altro — seguono corollari essenziali. Infatti se
sono note le leggi, che governano i fenomeni meccanici, e tutti
gli esperimenti identici di meccanica producono lo stesso risultato
nei diversi sistemi di riferimento, le leggi della meccanica devono
essere le stesse in tali riferimenti. In altre parole, le equazioni della
meccanica devono essere le stesse in tutti i sistemi di riferimento
in moto uniforme e rettilineo gli uni rispetto agli altri.
In questo modo, le equazioni principali della meccanica scritte
mediante le coordinate e con la lettura di un orologio nel proprio
sistema di riferimento devono avere la stessa forma. Nello stesso
tempo è chiaro che molte grandezze variano nella transizione da un
riferimento all’ altro. Infatti, consideriamo il moto di una particel
la 1 nel sistema K ; in genere esso è definito come la dipendenza dal
tempo del raggio vettore r = r (t). In accordo con la (1.1), il moto
della stessa particella in K ' è definito dal raggio vettore variabile
r ’ (t) — r (t) — Vt. Differenziando entrambi i termini dell’ultima
equazione rispetto a t e tenendo conto che dr'/dt — v' e dr/dt = v si
ottiene ’
v' = v — V. (1.4)
Quindi la velocità della particella nei riferimenti K e K ' è differente.
Le grandezze che variano nella transizione da un sistema di coordi
nate all’ altro sono chiamate relative. Allora le coordinate x e la ve
locità di una particella sono grandezze relative. La sua accelerazio
ne, comunque, è la stessa in entrambi i riferimenti K e K '; questo
diventa subito evidente, differenziando l ’ (1.4),
= (F = costante).
Il fatto che l ’ accelerazione di corpi sia la stessa per tutti gli osserva
tori in moto rettilineo ed uniforme è immediatamente evidente. Ma
questo risultato rende possibile la comprensione dell’ espressione
« le equazioni hanno la stessa forma in tutti i sistemi di riferimento ».
L ’ equazione fondamentale della meccanica classica è quella che e-
sprime la seconda legge di Newton. Questa equazione pone in relazio
18
ne la forza F che agisce su un corpo e l ’ accelerazione acquistata dal
corpo sotto l ’ azione di questa forza:
n § = F ‘> (1.5)
il fattore m è chiamato massa del corpo.
Se le leggi della meccanica sono veramente le stesse in tutti i
sistemi in moto uniforme e rettilineo, l ’ equazione (1.5) deve mante
nere la sua forma in tutti i sistemi di riferimento di questo tipo.
Non è difficile vedere come questo avvenga realmente. Abbiamo
già mostrato che le accelerazioni sono le stesse in tutti i sistemi di
riferimento in esame. Ma cosa succede alle forze nel passaggio da
un riferimento ad un altro? Supponiamo di analizzare due corpi I
e IT; supponiamo che la forza della loro interazione dipenda dalla
distanza fra di essi, dalla velocità relativa e dal tempo. Ma nessuna
di queste grandezze cambia nelle trasformazioni di Galileo. In
fatti, scriviamo le coordinate e le velocità dei corpi I e II nei rife
rimenti A e K ' usando le trasformazioni di Galileo
T rasform a
C o o rd in a te e velo cità
C oo rd in a te in K ' z io n i d e lle
dei corpi I e II in K velo cità
I x ii ÌJiì z iì v i x i = x 1 — V i , z[ = z 1 v
II Z 2’ ^2 X% = h i, y g y 25 ^2 = = Zg
19
tanto per la designazione delle variabili. (Si suppone, ovviamente,
che la massa sia una grandezza costante; Vinvarianza della massa
è uno dei postulati basilari della meccanica classica 1.) L ’equazione
che descrive la seconda legge di Newton nel riferimento K, nell’ ipo
tesi di forze che dipendono dalla distanza e dal tempo, ha la forma
seguente:
t = f ( 0 2. f ) .
Un’ equazione che no^ cambia nel caso di una trasformazione
delle variabili che appaiono in essa (in altre parole, i termini della
quale risultano invarianti) è chiamata invariante rispetto ad una
data trasformazione. In questo modo, abbiamo mostrato che l ’ equa
zione che esprime la seconda legge di Newton è invariante rispetto
alle trasformazioni di Galileo.
Ora possiamo formulare più precisamente le condizioni per cui
« esperimenti identici conducono a risultati identici ». L ’equazione
di Newton (1.5) è un’equazione ordinaria del secondo ordine. La
sua soluzione descrive il moto del sistema. Perche le soluzioni del-
l ’equazione (1.5) coincidano nei riferimenti K e K ' (proprio ciò
assicura l ’« identità del moto ») è necessario che coincidano le con
dizioni iniziali. L ’ invarianza delle equazioni basilari della mecca
nica assicura che i fenomeni della meccanica si svolgano in modo
uguale ih tutti i sistemi di riferimento in moto rettilineo ed uniforme
gli uni rispetto agli altri, soltanto quando le condizioni iniziali coin
cidono in questi riferimenti.
Se le condizioni iniziali differiscono, per lo stesso fenomeno,
in diversi sistemi di riferimento, il fenomeno stesso sembrerà diffe
rente. Ad esempio, mentre una goccia d ’ acqua cade verticalmente
per un osservatore che si trova su una piattaforma, la stessa goccia
si muoverà lungo una parabola per un osservatore su un treno (sup
poniamo che la goccia di acqua cada con un’ accelerazione). Comun
que, i dati iniziali in questi riferimenti erano differenti; dal punto
di vista di un osservatore sul treno la goccia d’ acqua alPistante
iniziale aveva una componente orizzontale della velocità; un osser
vatore che si trovava sulla piattaforma considerava che alPistante
iniziale la goccia d’ acqua non aveva nessuna componente orizzon
tale della velocità.
1 Si. noti che in meccanica newtoniana si considera anche il caso del moto
di corpi di massa variabile (una propulsione a jet, il moto di una goccia con
condensazione), ma in tutti questi casi un corpo o dona materia all’ ambiente o
l ’ acquista da esso. Quando si parla di variazione di massa nella TRR (vedi
Supplemento IV), si intende che la massa del corpo rimane costante nel rife
rimento in quiete, cioè non c’è scambio tra il corpo e l ’ ambiente.
20
Abbiamo già detto in precedenza che in meccanica newtoniana
un’ interazione tra corpi si suppone a velocità infinita. Adesso siamo
in grado di spiegare questo in dettaglio. L ’« interazione » tra corpi
è caratterizzata da forze. In meccanica classica le forze sono consi
derate dipendenti dalle distanze tra corpi; lo stesso si considera va
lido per i corpi in moto relativo gli uni agli altri. Ma la distanza
tra due corpi in moto deve essere espressa come
x (tt)]2+ [y2 (t— 4(i)]2 + [z2 (t) — z4 (t)]2„
Assumendo che un’ interazione, cioè una forza, si trasmetta a
veloci Là finita, non si può presumere che nnell’
oli'
equazione che defi
nisce questa forza, figuri ancora r12. Se ci interessa la forza agente
da parte del corpo II sul corpo I, la posizione del corpo II deve essere
registrata non al momento t ma in anticipo di un intervallo di tempo
necessario perché l ’ interazione « si trasmetta » dal corpo l i al cor
po L Se si trascura questo ritardo, ciò significa di fatto che la velo
cità di propagazione dell’ interazione viene considerata infinita. Pro
prio in questo modo sono trattati I problemi in meccanica newtonia
na.
Lo stesso accade quando s’introduce un’energia potenziale. Scri
vendo, come al solito, una forza centrale per l ’interazione di due
particelle nella forma
F = - V U ( \ ri - 2 |),
si trascura esplicitamente il ritardo nella trasmissione dell’ intera
zione.
La trasmissione istantanea delle interazioni (in passato conside
rate come azione a lungo raggio) ci appare sorprendente ed oscura.
La trasmissione di qualsiasi segnale (cioè un impulso e l ’energia
capaci di compiere qualche azione, per esempio la commutazione
di un dato dispositivo) richiede del tempo. Come ci insegna l ’espe
rienza è impossibile trasmettere istantaneamente un segnale « da
qui » ad un altro luogo (« là »). Per quanto riguarda la trasmissione
delle interazioni l ’ epoca di Newton non aveva sviluppato altra
idea ad eccezione dell’ azione a lungo raggio. La velocità finita della
trasmissione delle interazioni apparve insieme con il concetto di
campo, introdotto nella teoria dell’ elettromagnetismo da Maxwell.
Nella teoria di Maxwell l ’ interazione delle cariche o delle correnti
si realizza per mezzo di un campo cui si attribuisce un’ esistenza in
dipendente. Segue dalla teoria che un campo si propaga a velocità
finita e ciò significa che l ’ interazione si propaga con la velocità di
propagazione del campo. La velocità di propagazione di un campo
elettromagnetico nel vuoto gioca un ruolo fondamentale nella teo
ria della relatività. Essa è designata con la lettera c ed è circa ugua
le a 3 -IO8 m/s. Poiché la variazione di campo si trasmette da punto
a punto, le teorie dei campi vengono chiamate a corto raggio. Come
si vedrà in seguito, la teoria della relatività in linea di principio ri
fiuta l ’ azione a lungo raggio.
21
§ 1.5. Leggi di Newton e sistemi
di riferimento inerziali
22
dall’ osservatore nel sistema inerziale che non ci sono forze agenti
sul corpo. Quindi la seconda legge di Newton non è valida nel si
stema di riferimento in moto accelerato rispetto al riferimento iner
ziale. Molti lettori hanno già compreso, naturalmente, che passando
in un sistema di riferimento in moto accelerato, si manifesta una
« forza d ’ inerzia » che non è propriamente una forza nel senso della
meccanica di Newton (vedi Supplemento V). Poiché le leggi di
Newton non sono valide in tutti i sistemi di riferimento, Newton
ha dovuto precisare che esiste un certo sistema di riferimento in cui
tutte queste leggi sono valide. L prima legge di Newton è equiva-
lente, infatti, a questa afferma
zione. Questa legge postula che A sse d i rotazione
si può avere un sistema di rife d ella Terra
rimento inerziale (cioè un rife
rimento in cui vale la legge
d ’inerzia). In altre parole, si può
trovare un sistema di riferimento,
in cui un corpo, che non inte
ragisce con altri corpi, si muove
di moto rettilineo ed uniforme
per inerzia.
La legge d ’ inerzia rappresen F ig. 1.3. L’ esperimento di Foucault
ta un caso particolare della leg ideato per riconoscere uno dei SRI.
Per semplicità il disegno illustra
ge di conservazione dell’ impulso. l ’ esperimento di Foucault condotto
Da un lato, è una conseguenza al Polo. In realtà l ’ esperimento fu
della seconda e della terza legge condotto a Parigi, ma questo non
ne cambia la sostanza.
di Newton, dall’ altro, una con
seguenza della seconda legge e
dell’ ipotesi sull’ omogeneità dello spazio (equivalenza di tutti i suoi
punti), cioè la meccanica newtoniana assume l ’ omogeneità dello
spazio in ogni sistema di riferimento inerziale.
Ora supponiamo di conoscere un sistema di riferimento inerziale.
In accordo col principio di relatività di Galileo tutti i sistemi in
moto rettilineo ed uniforme rispetto ad esso saranno anch’essi iner
ziali. È chiaro quindi che c ’ è un numero infinito di sistemi di rife
rimento inerziali.
Come si può individuare almeno un sistema di riferimento iner
ziale? Naturalmente la scoperta di un tale riferimento è una questio
ne di esperienza. Il famoso esperimento del pendolo, condotto per
la prima volta da Foucault, è adatto allo scopo. Per semplicità de
scriveremo l ’esperimento come se fosse condotto ad uno dei poli
terrestri (fig. 1.3). Una pesante palla è sospesa ad un filo che è at
taccato ad un riferimento costruito al Polo. Il punto di sospensione
del pendolo è collocato sull’ asse della Terra; l ’ attacco del filo è
libero e quindi il riferimento non trascina il filo nella rotazione at
torno all’ asse terrestre. La posizione d ’ equilibrio del pendolo coin
cide con l ’ asse terrestre. Se uno allontana il pendolo dalla posizione
di equilibrio e quindi lo lascia andare con velocità iniziale nulla,
23
esso comincerà ad oscillare su un certo piano. Le due forze che agi
scono sul pendolo sono la forza di gravità mg e quella del vincolo T
del filo; entrambe le forze agiscono sul piano P di oscillazione e non
possono variare questo piano. Se la seconda legge di Newton fosse
valida sulla Terra, il piano delle oscillazioni del pendolo dovrebbe
mantenere l ’ orientazione rispetto alla Terra. Ma nelTesperimento
la Terra si tira indietro da sotto il pendolo e quindi « registra »
il fatto che nel sistema di coordinate assocciato alla Terra la seconda
legge non è a rigore valida.
Non bisogna stupirsi troppo di ciò, dato che le leggi di Newton
possono ancora essere usate con grande vantaggio sulla Terra. E
evidente, ad esempio, che Tiritera ingegneria e la meccanica teorica
si basano sulla seconda legge di Newton senza correzioni. Certamente
questo è dovuto al fatto che le correzioni sono piccole: esse sono le
gate alla rotazione della Terra che non è molto veloce. La Terra può
essere considerata un sistema inerziale anche in un libro di scuola.
Ma fondamentalmente la Terra non è un sistema inerziale. Un
riferimento inerziale comporta un sistema di coordinate rispetto
al quale il piano delle oscillazioni del pendolo rimane costante.
Questo sistema può essere trovato dallo stesso esperimento di Fou
cault. Il sistema può sembrare abbastanza « esotico ». Il suo centro
è collocato sul Sole e i tre assi coordinati sono diretti sulle stelle
« fisse » (cioè le stelle che si muovono rigidamente insieme alla co
siddetta sfera celeste). Per il ruolo singolare del Sole il riferimento
inerziale così trovato viene detto eliocentrico. Nella scelta del si
stema di riferimento è molto importante la scelta delia direzione
degli assi coordinati. La scelta deiTorigine nei centro d’ inerzia del
Sole è conveniente perché il Sole è l ’ oggetto più massivo di tutto il
sistema solare. 11 movimento dei pianeti risulta particolarmente
semplice in questo riferimento. È da notare che gli assi del riferi
mento eliocentrico non partecipano alla rotazione del Sole. Per
altro, il sistema di riferimento, i cui assi coordinati sono fissati
rigidamente alla Terra (cioè ruotano con essa), è detto geocentrico.
Come messo in luce dall’esperimento di Foucault, questo riferimen
to non è inerziale.
Quindi le leggi di Newton sono applicabili nel riferimento elio-
centrico. In accordo col principio di relatività di Galileo le leggi
di Newton sono ancora valido in tutti i sistemi di riferimento in
moto rettilineo ed un if orme rispetto a quello eliocentrico. Chiame
remo tutti questi sistemi sistemi di riferimento inerziali 1. Benché
il numero di tali sistemi sia infinito, essi sono dispersi tra tutti i
possibili tipi di riferimento. Se fosse possibile rinchiudere tutti i
tipi di riferimento dentro un sacco e tirarne fuori uno a caso, otter
remmo molto probabilmente un riferimento non inerziale.
24
L ’esperimento di Foucault non è certamente runico che permette
di apprezzare la deviazione del sistema di riferimento geocentrico
da quello inerziale. Indicheremo un altro esperimento di questo tipo.
Quando un oggetto pesante è lasciato cadere da una certa altezza,
non cade verticalmente come dovrebbe a causa della forza di gra
vità, ma viene deviato leggermente verso est. La deviazione dalla
verticale dei corpi in caduta libera mette in evidenza il carattere
non inerziale del riferimento geocentrico e ci permette dì trovare un
riferimento inerziale.
In meccanica c ’ è ancora una legge di conservazione per i sistemi
chiusi che è la legge di conservazione dei momento delia quantità
di moto. Essa è una conseguenza della seconda e terza legge di New
ton, proprio come la legge di conservazione della quantità di moto
in un sistema chiuso. Inoltre, essa può essere ottenuta come conse
guenza della seconda legge con l ’ assunzione dell’ isotropia dello
spazio. Questo implica che la meccanica di Newton jjresuppone
uno spazio isotropo.
La legge di conservazione di energia per sistemi chiusi è di nuovo
una conseguenza della seconda legge di Newton nell’ ipotesi sul ca
rattere potenziale delle forze che agiscono fra le particelle del si
stema. D ’ altro canto essa deriva dalle equazioni del moto del si
stema e dall’ assunta uniformità del tempo. Ne segue che l ’ uniformi-
tà dei tempo è uno dei presupposti della meccanica newtoniana.
Perciò un sistema di riferimento inerziale può essere individuato
come quello rispetto a cui lo spazio è uniforme ed isotropo e il tempo
è uniforme.
Qualche volta un sistema di riferimento inerziale è definito come
un riferimento fissato rigidamente ad un oggetto in moto libero;
benché sia fondamentalmente vera, questa affermazione non serve
per la determinazione sperimentale dei SRL Non abbiamo a disposi
zione « oggetti in moto libero », poiché non si può annullare la gra
vità. È più corretto, perciò, definire i SRI come riferimenti in cui
sono valide tutte e tre le leggi di Newton.
I sistemi inerziali si distinguono fra gli altri (non inerziali)
non solo in meccanica. Una carica elettrica non irradia onde elet
tromagnetiche quando è a riposo in un sistema di riferimento iner
ziale, mentre irradia in un sistema di riferimento non inerziale.
I sistemi di riferimento inerziali hanno un ruolo importantis
simo in fisica. È per questi sistemi di riferimento che si sono regi
strate le familiari leggi fisiche, li passaggio ad un riferimento non
inerziale comporta considerevoli difficoltà. La teoria della relatività
ristretta ci insegna come descrivere tutti i tipi di fenomeni fisici in
ogni sistema di riferimento inerziale 1. Ma cosa significa e cosa si
25
può fare in pratica? Abbiamo molto da discutere prima di poter
dare una risposta a queste domande.
26
dai corpi materiali collocati nello spazio. Sicuramente i concetti
di tempo e di spazio di Newton ci sembrano molto scolastici. Co
munque, non devono essere sottostimati. Riportiamo a questo pro
posito un breve brano da un libro [11]:
« Nelle conversazioni con degli autori di questo libro in varie
occasioni negli anni, Einstein dimostrò il suo grande rispetto per
Newton. Egli sottolineò che Newton fu perfino più consapevole dei
critici del X V II secolo delle difficoltà connesse alle idee di spazio e
di tempo assoluti. In ogni caso, per quel tempo il postulare queste
idee era Punico modo pratico di risolvere il problema delle descri
zioni del moto ».
Naturalmente si pone una questione: come può funzionare con
tanta efficienza la meccanica classica basata su concetti di spazio
e tempo difficilmente spiegabili? Si torna a punto che questi con
cetti sono quasi corretti e la deviazione è insignificante nella vita
quotidiana. La deviazione dalla meccanica classica diviene chiara
mente visibile solo quando si studiano microparticelle anche nelle
condizioni dello spazio esterno in cui la fisica moderna ha cominciato
ad addentrarsi. Tali ricerche richiedono, però, condizioni partico
lari ed un equipaggiamento abbastanza sofisticato.
Per finire questo breve paragrafo è necessario fornire una rapida
presentazione dell’ attuale approccio al problema. Dal moderno punto
di vista non esiste spazio assoluto e, quindi, non c ’ è moto assoluto.
Tutti i sistemi di riferimento inerziali sono equivalenti. La teoria
della relatività ristretta mostra che le letture del tempo di un evento
sono differenti in diversi sistemi di riferimento inerziali. Quindi,
lo scorrere del tempo dipende, dallo stato di moto. La teoria della
gravitazione di Einstein va ancora oltre. Secondo questa teoria le
proprietà dello spazio e del tempo non sono assegnate per sempre,
ma sono determinate dagli oggetti che si trovano nello spazio. Dato
che in accordo con il materialismo dialettico spazio e tempo sono
forme di esistenza della materia, le conclusioni della teoria della
gravitazione di Einstein appaiono più soddisfacenti dei concetti
newtoniani di spazio e di tempo.
§ 1.7. Come la fisica si è andata
avvicinando alla teoria della
relatività
Dal punto di vista della fisica moderna è interessante ricostruire
come gli effetti relativistici siano stati messi in evidenza prima della
creazione della teoria della relatività. Questo paragrafo non pretende
di essere un saggio storico (il Supplemento II è più indirizzato a que
sto scopo), ma ò inteso soltanto come premessa per la comprensione
dei prossimi due paragrafi, dove sono presentati i primi principi della
teoria.
Senza dubbio, il primo passo nello sviluppo della teoria della
relatività ristretta fu la scoperta di Galileo del principio di relatività
dei fenomeni meccanici.
27
Nasce spontaneo il quesito: perché Galileo limitò il suo principio
alla meccanica? La risposta è immediata: nell’epoca di Galileo non
c ’erano « altre branche della fisica », come le definiamo oggi. In
fatti, la meccanica rappresentava l ’ intera fisica. Se poi consideriamo
che fino alla fine del X IX secolo si tentò di spiegare tutti i fenomeni
fisici sulla base della meccanica, diviene chiaro come il principio
di relatività di Galileo racchiudesse l ’ « intera fisica » del tempo.
Il, passo successivo sulla strada verso la relatività si ebbe quando
fu stabilita la velocità finita della luce. La conclusione fu raggiunta
da Romer sulla base delle sue osservazioni astronomiche (1676).
Prima di Romer la velocità della luce era considerata infinita.
Il principio di relatività galileiano fu espresso in forma mate
matica soltanto dopo che furono scritte le equazioni della meccanica
(Newton, Phìlosophiae Naturalis Principici Mathematica, 1687).
Poiché coordinate e tempo sono le variabili principali nelle equazio
ni della meccanica, la loro trasformazione per il passaggio da un
riferimento ad un altro, in moto rispetto al primo, richiede equazio
ni appropriate per la trasformazione delle coordinate e del tempo nel
passaggio citato. Segue dal principio di relatività di Galileo che la
trasformazione delle coordinate e del tempo richieste non devono
alterare la forma delle leggi di Newton (§ 1.4). Queste trasformazioni
sono quelle di Galileo.
Nel 1851 fu condotto al Panthéon di Parigi Pesperimento del
pendolo di Foucault che dimostrò definitivamente la rotazione della
Terra ed indicò il sistema di riferimento inerziale (§ 1.5). Infatti,
con questo esperimento si può concludere la descrizione dei fenomeni
meccanici, legati direttamente alla teoria della relatività.
I] principio di relatività galileiano, le leggi di Newton e le tra
sformazioni di Galileo sono strettamente correlati. La conseguenza
diretta delle trasformazioni di Galileo è la formula classica della
trasformazione della velocità (1.4): v' = v — V. Nel 1851 Fizeau
condusse un esperimento per mostrare che questa formula non è
sempre corretta. L ’ esperimento di Fizeau con l ’ acqua corrente fu
condotto schematicamente come segue. Nel riferimento K V acqua
scorre lungo un tubo a velocità F, e viene misurata la velocità della
luce nell’ acqua. Ora si può ragionare (in termini puramente cine
matici). Fissiamo nel riferimento K ' l ’ acqua che scorre. In questo
sistema di riferimento la velocità vf della luce è data dalla solita re
lazione u' — chi, dove n è l ’ indice di rifrazione dell’ acqua. Per
trovare la velocità della luce nel riferimento K, bisogna semplice-
mente applicare l ’ (1.4) e si ottiene quindi v - chi + V. Ma il risul
tato di Fizeau (confermato anche da moderne misure) fu
28
La teoria della relatività deve moltissimo alla teoria di Maxwell
(1856—1873) formulata prima in alcuni articoli e poi pubblicata
nei due volumi Treatise on Electricity and Magnetism (1873). Fu la
prima teoria di campo in cui Vinterazione veniva trasmessa a velo
cità finita, che è la velocità di propagazione del campo. La teoria
prevedeva un valore definito per questa velocità che è precisamente
uguale a 1/]/"e0p0 nel vuoto, dove s0 e p0 sono le costanti elettriche
e magnetiche. Naturalmente sorse subito il problema se fosse soddi
sfatto il principio di relatività; in altri termini, se le equazioni di
29
§ 1.8. Generalizzazione del principio
della relatività galileiana
30
vita. In particolare, questo significa che in un sistema di riferimento,
in cui le equazioni di Maxwell sono scritte in forma convenzionale
(vedi capitolo VI), la velocità di propagazione delle onde elettroma
gnetiche (della luce) c è uguale a l / ] / e 0(x0, mentre in tutti gli altri
sistemi di riferimento in moto rispetto al primo, la velocità è diffe
rente. Ma il vuoto occupa un posto speciale rispetto ai sistemi di
riferimento. In più, esso è degno di nota perché non ha un « mezzo »
dotato di massa a riposo. Ad un mezzo materiale si può sempre as
sociare un riferimento, cioè scegliere un riferimento tale in cui il
mezzo è in quiete come tu tt’uno o in una regione limitata. Ma questo
riferimento particolare è quello scelto. Un altro sistema di riferi
mento equivalente in moto rettilineo al primo deve avere le stesse
proprietà del mezzo immobile. Ma questo crea una diversa situazio
ne fisica. Così, la presenza del mezzo individua sempre un riferi
mento tra tutti gli altri. Ma è impossibile evidenziare tale riferimen
to nel vuoto perché non ci sono sistemi di riferimento in cui il vuoto
è a riposo. Di conseguenza, tutti i sistemi di riferimento sono equi
valenti rispetto al vuoto. Ne segue logicamente che (purché tutti gli
osservatori inerziali siano equivalenti) la velocità delle onde elettro-
magnetiche (della luce) deve essere la stessa, 1/]/ £0jui0, *n tutti i
SRI.
La formula classica della trasformazione delle velocità (1.4)
mostra che questo non è proprio il caso. Poniamo uguale a c la ve
locità della luce nel vuoto in un riferimento inerziale K . In un
altro riferimento inerziale K ' la velocità della luce nel vuoto c'
è uguale a c — V. Quindi la velocità della luce nel vuoto c è uguale
a 1/ ] / e0|
li0 soltanto in un sistema di riferimento privilegiato. Quin
di il principio di relatività non sembra corretto per i fenomeni elet
tromagnetici.
Il ragionamento precedente era basato su un assunto fondamenta
le assolutamente inaccettabile per la fisica del X I X secolo: le onde
elettromagnetiche (la luce), si possono propagare nel vuoto o, in
altri termini, non è necessaria la materia per la loro propagazione.
Questo è un punto difficile da capire quando si inizia a passare dalla
fisica classica a quella relativistica.
Ma cosa si può fare in una tale situazione? Tre possibilità sono
aperte per logica.
1) Si potrebbe assumere che il principio di relatività copra sol
tanto la meccanica e non abbia nulla a che fare con Felettrodina
mica in cui esiste un sistema di riferimento « assoluto ». Ma, come
detto in precedenza, una tale possibilità va respinta in considerazio
ne delle relazioni generali fra i fenomeni fisici.
2) Il principio di relatività dovrebbe essere considerato come
universalmente applicabile e poiché il sistema delle equazioni di
Maxwell non soddisfa questo principio (esso cambia la sua forma
per le trasformazioni di Galileo) esso non può essere accettato. Ma
il sistema di equazioni di Maxwell si è dimostrato una teoria affi
di
daMle ed esauriente all’interno di un sistema di riferimento inerziale
(quello del laboratorio). D ’ altro canto, la meccanica di Newton e
le trasformazioni di Galileo ad essa associate hanno mostrato di
non essere sempre corrette. À causa di ciò sembrerebbe ragionevole
mantenere il sistema di equazioni di Maxwell.
3) Se il principio di relatività si considera valido per tutti i
fenomeni naturali, e le equazioni di Maxwell si ritengono esatte, il
passaggio- da un sistema di riferimento ad un altro non può essere
descritto dalle trasformazioni di Galileo (che modificano la forma
delle equazioni di Maxwell). D ’ altra parte, una nuova trasformazione
non può lasciare invariata la forma delle equazioni della meccanica.
Di conseguenza, le equazioni della meccanica vanno modificate in
modo che la nuova trasformazione le lasci inalterate.
Quest’ultima possibilità illustra concisamente il programma
portato a termine dalla teoria della relatività ristretta: 1) il prin
cipio di relatività si estende a tutti i fenomeni naturali, 2) la velocità
della luce nel vuoto è la stessa in tutti i SRI (questo discende dall’ in
varianza delle equazioni di Maxwell).
Ma come devono essere le trasformazioni delle coordinate e
del tempo per soddisfare i due requisiti precedentemente posti?
Le trasformazioni cercate saranno proprio trasformazioni di Lo-
rentz, che esamineremo da vicino nel prossimo capitolo. In conclu
sione vogliamo puntualizzare quanto segue.
Non appena il principio eli relatività galileiana fu esteso a tutti
i fenomeni fisici, esso divenne 1’ autentico principio della fisica. È
il caso di sottolineare la differenza fra legge fisica e principio fisico.
Quando si parla di legge fisica, si intende la sua validità per una
classe limitata di fenomeni fisici. Ad esempio, le leggi di Newton
descrivono i fenomeni meccanici. Le equazioni di Maxwell sono per
tinenti all’elettrodinamica e quindi sono le leggi dell’eie ttrodinami-
ca. Le tre leggi della termodinamica riguardano i fenomeni termici.
I principi fisici invece hanno importanza universale, perciò riguar
dano tutti i fenomeni fisici.
Il più noto principio fisico è quello della conservazione del
l ’energia. Il famoso libro di M. Planck dedicato alla conservazione
dell’energia è intitolato II principio della conservazione dell1energia
(1931). Noi crediamo che la legge di conservazione dell’energia valga
per tutti i fenomeni fisici, così come siamo convinti che la legge di
conservazione della quantità di moto è vera per tutti i fenomeni
fisici. Il principio di relatività ha un posto nella fisica, subito dopo
il principio di conservazione dell’energia e della quantità di moto.
32
dotta da un corpo sull’ altro) è spesso citata come trasmissione di
un segnale (è questo il termine più spesso usato nella teoria della
relatività). Trasmettere un segnale significa trasmettere energia e
quantità di moto (considerate inseparabili nella teoria relativistica,
vedi § 5.5), capaci di « accendere » un certo sistema (ad esempio, un
meccanismo di relè).
Non è deducibile in alcun modo che in natura la velocità di pro
pagazione dei segnali debba avere un valore limite. Tuttavia, sia
la teoria che gli esperimenti mostrano che tutte le interazioni a noi
note si propagano a velocità finita,
può propagarsi un segnale è quella della luce nel vuoto (ricordiamo
che essa è anche la velocità di propagazione nel vuoto delle onde
elettromagnetiche di qualsiasi frequenza). Come già detto, la teoria
classica assumeva tacitamente che un segnale possa propagarsi a
velocità infinita.
Se si ammette resistenza in natura di una velocità limite di
propagazione dei segnali, il suo valore assoluto deve essere lo stesso
in tutti i sistemi di riferimento inerziali. Infatti, tutti questi rife
rimenti sono equivalenti in base al principio di relatività, ed è im
possibile, con esperimenti fisici, mettere in evidenza differenze fra
essi. Se la velocità limite di propagazione delle interazioni fosse
diversa in vari sistemi inerziali, sarebbe possibile distinguerli Tuno
dall’ altro. E ciò è impossibile se il principio di relatività ha validità
universale. Quindi da ciò segue immediatamente che la velocità
della luce nel vuoto deve essere la stessa in tutti i riferimenti iner
ziali. E cosa succede se la sorgente si muove verso l ’osservatore o se
l ’ osservatore si muove verso la sorgente? Tale moto non modifica
la velocità limite di trasmissione del segnale. Quindi la velocità
delia luce nel vuoto non può dipendere dal moto né della sorgente,
né dell’ osservatore.
Ovviamente la velocità della luce nel vuoto ha proprietà uniche.
Tutte le velocità sono relative, cioè esse cambiano nel passaggio
da un riferimento inerziale ad un altro. Ma il valore assoluto della
velocità c rimane lo stesso. Benché fra i riferimenti inerzial. non
ce ne sia uno privilegiato, c ’è una velocità privilegiata in 1utti.
Entrambe queste circostanze sono strettamente legate al fattto che
le onde elettromagnetiche si possono propagare nel vuoto; in altri
termini, non c ’ è bisogno di un mezzo materiale per la loro propaga
zione. Ovviamente l ’assumere una velocità privilegiata (invariante)
modifica drasticamente il quadro classico, cioè la relazione (1.4) e,
di conseguenza, le (1.2) e (1.3).
In ogni caso, per quanto un ragionamento logico sia bello e
rigoroso l ’esperimento ha avuto e avrà sempre un ruolo fondamen
tale in fisica. Un esperimento conferma le due circostanze seguenti:
1) in un dato SRI la velocità della luce nel vuoto è uguale in tutti
i punti ed in tutte le direzioni; 2) in tutti i SRI questa velocità ha
lo stesso valore. Ci riferiamo qui agli esperimenti di Michelson-Morlev
e Kennedy-Thomdike descritti nel Supplemento IL
33
IL POSTULATI DI EINSTEIN.
INTERVALLO TRA EVENTI.
TRASFORMAZIONI DI LORENTZ
34
lungo l ’ asse x, che raggiunge il punto x 2 all’ istante t2. Alierà
c = (x2 — ^i)/(h — h)- Ora i medesimi due eventi, l ’ invio e la
ricezione del segnale, sono visti dal riferimento K '. L ’ invio del se-
gnale, per l ’ osservatore in K ' , avviene al punto x[ all’ istante e
la ricezione al punto x'2 all’ istante Nonostante il fatto che i rife
rimenti K e K ' siano in molo relativo lungo l ’ asse comune x, x\
noi dobbiamo ottenere che il rapporto (x'2 — #')/(£' — £') sia uguale
a c. Dal punto di vista del « buon senso » non deve essere così (diven
ta chiaro se si disegna il diagramma dell’esperimento). Comunque,;
è proprio ciò che dice il postulato IL
Abbiamo formulato il postulato II nel modo in cui l ’ha fatto Einstein
stesso nel suo articolo del 1905. Comunque, oggi è opportuno formularlo diver
samente. E precisamente, procedendo dall’ assunto che in natura c ’è una velo
cità limite di propagazione del segnale (interazione). Questa è l ’ affermazione
principale. Poi si suppone che questa velocità limite sia la velocità delle onde
elettromagnetiche (della luce) nel vuoto. L ’ultimo assunto non è obbligatorio:
in linea di principio la TRR non perderebbe senso se la velocità limite fosse
diversa, ma la TRR fa uso anche di questo assunto. Dal fatto che la velocità
della luce nel vuoto è la velocità limite della trasmissione delle interazioni,
segue direttamente che essa deve avere lo stesso valore in tutti i SRI (vedi § 1.9),
35
sicuri che le equazioni fondamentali della fisica siano le stesse in
tutti i sistemi dì riferimento, cioè siano covarianti rispetto a tali
trasformazioni'. Il significato del termine « covariante » sarà spiegato
nel § 4.3. Ora occupiamoci delle « equazioni fondamentali » della
fisica.
Le leggi di Newton sono considerate le leggi fondamentali della
meccanica, quelle di Maxwell le leggi fondamentali doli’ elettrodi
namica e nella termodinamica si considerano fondamentali le equa
zioni che esprimono il suo primo e secondo principio.
Grandezze relative in fisica classica erano conosciute, mi esempio
la velocità, le coordinate, le direzioni delle velocità; ma la teoria
della relatività ristretta ha aggiunto loro, contrariamente all 5intui
zione comune, gli intervalli di tempo relativo fra eventi e lunghezze
di scale relative, cioè le distanze. E questo il « prezzo » da pagare
per estendere il principio di relatività a tutti i fenomeni fisici.
Il carattere dominante della teoria della relatività, a dispetto
del nome, non è affatto la relatività delle varie grandezze, cioè la
loro dipendenza dalla scelta del sistema di riferimento. L'essenza
della teoria della relatività sta proprio nel contrario. Essa mostra
che le leggi di natura in un sistema di riferimento inerziale non
dipendono dalla scelta del riferimento e dalla posizione e dal moto
dell 5osservatore, ma i risultati delle misure condotte in diversi si
stemi di riferimento possono essere correlate fra loro. Parlando in
termini filosofici, la teoria della relatività mette in risalto il carat
tere oggettivo delle leggi della natura e non la relatività della co
noscenza.
Ovviamente, tentare di modificare un nome ormai storicamente
stabilito, che fu proposto non da Einstein ma da Planck nel 1906,
è completamente inutile. Comunque c ’ è un punto al quale si può
prestare attenzione; la controversia sul nome corretto per la teoria,
-« speciale » o « parziale », è inessenziale. In un certo senso il pro
blema è come restringere la teoria ai sistemi di riferimento inerziali.
Essenzialmente questa restrizione comporta che la teoria è corretta
in assenza di campi gravitazionali o, praticamente, in campi deboli.
Questo è il motivo per cui il nome più .corretto è teoria della relati
vità « ristretta » che è quello adottato nella letteratura francese.
Sebbene i postulati di Einstein siano i principi primi della teo
ria relativistica, essi non sono sufficienti al suo sviluppo. La costru
zione di un sistema di riferimento relativistico è di fondamentale
importanza per la teoria, perciò porremo V attenzione su questo a-
spetto.
§ 2*2» Sistema di riferimento
relativistico
Nella costruzione di un sistema di riferimento relativistico, così
come nella costruzione dell5intera teoria, si assumono validi entram
bi i postulati di Einstein. Inoltre, si assume la velocità della luce
nel vuoto come velocità limite della trasmissione dei segnali. L ’ ul-
36
tinta affermazione non è contenuta nei postulati di Einstein. Come
vedremo in seguito, però, essa deve essere inevitabilmente incorpora
ta nella teoria se si vuole tener conto del principio di causalità
(vedi § 3.4).
Nel § 1.1 abbiamo parlato in dettaglio di come si costruisce un
sistema di riferimento in meccanica classica. Abbiamo detto che
era sufficiente avere un orologio in ogni riferimento, in quanto ve
niva assunta la possibilità di usare segnali infinitamente veloci.
Ma nella TRR è esplicitamente prevista una velocità limite del se
gnale e, se le velocità in questione diventano vicine a quella limite,
è sconveniente e addirittura impossibile usare un solo orologio. Ma
sono proprio queste velocità cbe interessano la teoria della relativi
tà.
Quindi, bisogna aggiungere una serie di orologi al sistema di
coordinate (costruito esattamente come descritto nel § 1.1). In prin
cipio, la T RR comporta cbe gli orologi siano collocati in ogni punto
dello spazio. Questo non è in pratica necessario, ma come questione
di principio deve esserci un orologio in ogni punto dove è registrato
Raccadere di un evento. Tutti gli orologi di un sistema di riferimento
sono in quiete rispetto ad esso. Si assume nella TRR cbe si abbiano
a disposizione tutti gli orologi identici di cui si ha bisogno. Questa
ipotesi è facilmente realizzabile al giorno d’ oggi. Secondo la mecca
nica quantistica tutte le microparticelle della stessa specie sono
identiche. In particolare le frequenze di oscillazione caratteristiche
degli atomi della stessa specie coincidono esattamente. Ponendo
come orologi gli atomi stessi e come campione di tempo i periodi
delle oscillazioni caratteristiche, abbiamo a disposizione un numero
sufficiente degli orologi richiesti.
Le lunghezze campione possono essere considerate nello stesso
modo. La lunghezza d ’ onda di una radiazione caratteristica di un
dato atomo può essere scelta adeguatamente come lunghezza unita
ria. Già prima dell’ avvento della meccanica quantistica si pensava
di utilizzare come lunghezza campione la radiazione eli un dato
atomo: proprio così agli inizi del X X secolo è stata immortalata
da Michelson la lunghezza del metro.
Quando consideriamo due SRI in moto Tuno rispetto all’ altro,
la lunghezza campione e gli orologi di ciascun riferimento sono in
quiete soltanto rispetto al « proprio » sistema di riferimento. E
possibile pensare di avere identiche lunghezze campione ed orologi
in differenti SRI, se questi orologi e lunghezze sono soltanto un ri
ferimento? In certa letteratura si può trovare un ragionamento che
lunghezze campione ed orologi si possono trasferire da un SRI al
l ’ altro. Non ci sono dubbi che non si debba fare così. Nel trasferi
mento dei campioni di lunghezze e degli orologi da un SRI all’ altro
si impartisce loro un’ accelerazione. Secondo la teoria, l ’ accelerazio
ne varia i campioni di lunghezze e il passare del tempo. Vediamo
alcuni esempi immediati: lasciate cadere un orologio od un righello
sul pavimento. L ’ orologio si può fermare e il righello si rompe. Anche
37
un orologio atomico si rompe quando l ’ atomo viene distrutto. Tutto
ciò è l ’effetto dell’ accelerazione.
Ma per ottenere i medesimi campioni di tempo e di lunghezze in
differenti SRI, non c ’ è bisogno di trasferire nulla da un riferimento
all’ altro. È sufficiente prendere una sostanza pura in ciascun siste
ma di riferimento e la sua radiazione ci permetterà di definire i
campioni cercati.
Bisogna sottolineare quanto sia importante avere in ogni SRI
campioni di lunghezza e di tempo che siano realmente identici a
quelli degli altri sistemi di riferimento. Infatti, il principio di
relatività e l ’equivalenza di tutti i SRI insieme con l ’ identità dei
campioni di tempo e di lunghezze rendono completa l ’ identità di
questi sistemi di riferimento.
In questo modo, ogni SRI ha un adeguato numero di orologi.
L ’istante del verificarsi di un evento in un dato punto è la lettura
di un orologio posto nel punto dove accade l ’evento nell’ istante in
cui accade. Se due eventi accadono in punti differenti dello spazio
e gli orologi in questi punti registrano lo stesso tempo per gli eventi
vuol dire che essi sono simultanei. Ma ovviamente il sincronismo
degli eventi che accadono in punti differenti dello spazio dipende
da come è fatta la lettura iniziale del tempo di questi orologi (sup
ponendo che lo scandire del tempo sia identico). Quindi la determi
nazione del sincronismo degli eventi e l ’ aggiustamento del tempo di
lettura iniziale per tutti gli orologi di un dato SRI (la sincronizza
zione degli orologi) sono la stessa cosa. Bisogna sottolineare che la
sincronizzazione degli orologi (ovvero la determinazione del sincro
nismo degli eventi) può essere compiuta in modi diversi. Verrà spie
gato in seguito il vantaggio della sincronizzazione suggerita da Ein
stein. Ancora va detto che il sincronismo degli eventi è fissato e la
sua determinazione può essere fatta non in un unico modo.
Mostriamo un esempio di come sia importante il modo con cui
determinare il sincronismo degli eventi. Come si trova la velocità
di una particella? Poniamo che la particella si muova lungo l ’ asse x.
Per avere la sua velocità, bisogna conoscere la posizione xx al tempo
h e la posizione x 2 al tempo t2. Supponendo il moto uniforme, la
velocità è uguale a (x2 — xl)/(t2 — £x). Ma l ’ arrivo della particella
in x1 è registrato dall’ orologio posto in x l9 mentre l ’ arrivo in x 2 è
segnato dall’ orologio in x 2. Per la determinazione della velocità,
bisogna assicurarsi che l ’ orologio in x 2 segni, all’istante t±ì lo stesso
tempo dell’ orologio in x1. Solo in questo caso avrebbe senso la stima
di velocità. Ma questo implica proprio che i due orologi siano sin
cronizzati.
Chiarito che sincronizzazione degli orologi e determinazione
del sincronismo sono la stessa cosa, passiamo alla procedura per
la sincronizzazione di un orologio all’ interno di un SRI. La prima
cosa che viene in mente è di raccogliere tutti gli orologi in un punto,
verificarli e poi riportarli alle loro posizioni iniziali. Ma, seguendo
Einstein, dobbiamo rifiutare questo modo di procedere perché ogni
38
spostamento degli orologi comporta un’ accelerazione degli orologi
stessi, ed ogni accelerazione influenza lo scandire dell’ orologio.
Quindi è meglio prima collocare gli orologi al loro posto e poi ve
rificarli 1.
Come si possono verificare, ovvero sincronizzare, gli orologi
disseminati in vari punti dello spazio? Poniamo un orologio, che
chiameremo di riferimento, nell’ origine delle coordinate di un dato
SRI (naturalmente questo orologio non differisce minimamente
da tutti gli altri). Si può mandare un segnale da questo orologio
di riferimento ad un altro del SRI. Si assume che la distanza fra
l ’ origine e gli orologi sia nota (nessun orologio viene usato per de
terminare queste distanze !). Conoscendole velocità di trasmissione
del segnale, si può determinare il tempo che il segnale impiega ad
andare dall’ orologio di riferimento a ciascuno degli orologi del SRI.
Se il segnale parte dall’ orologio di riferimento a t —= 0, un orologio
sincronizzato deve segnare proprio quel tempo di propagazione nel
l ’ istante in cui il segnale lo raggiunge. Sebbene si possa usare qual
siasi segnale, è più conveniente scegliere un segnale luminoso nel
vuoto, in quanto esso si propaga alla stessa velocità in tutti i SRI.
L ’utilizzazione di un segnale di luce nel vuoto per la sincronizza
zione è un ulteriore fattore che assicura la completa equivalenza di
tutti i SRI.
Quindi, un « agente » per a sincronizzazione è un raggio di lu
ce. Descriviamo ora la procedura della sincronizzazione secondo Ein
stein (in un dato SRI).
1. Gli orologi vanno posti nei rispettivi punti e messi in fun
zione. Le coordinate dei punti in cui sono posti gli orologi sono note,
così come le distanze tra ciascun orologio e quello di riferimento
(posto nell’ origine delle coordinate).
2. Ad un istante arbitrario tx un segnale luminoso viene in
viato dall’ orologio di riferimento all’ orologio da sincronizzare. Il
segnale viaggia nel vuoto lungo il cammino stabilito ed il suo arrivo
è registrato da un osservatore o da un dispositivo.
3a. Il quadrante dell’ orologio deve segnare, al momento del
l ’ arrivo del segnale, il tempo t = tx -f- rie, essendo r la distanza
dall’ orologio di riferimento. Così si è scelta la lettura « iniziale »
dell’ orologio, l ’ orologio è « verificato » rispetto a quello di riferi
mento.
Si può usare un metodo equivalente.
3b. Si pone uno specchio in ogni punto dove è sistemato un oro
logio in modo da riflettere la luce sulla sua sorgente. Se l ’ orologio
di riferimento registra il ritorno del segnale all’ istante t2, Listante
registrato dall’ orologio vicino allo specchio deve essere uguale a
t = t± + (h +
1 Esiste una voluminosa letteratura per « illustrare » che un trasporto
infinitamente lento degli orologi non influenza il loro battere. È certamente
plausibile in termini fisici. Ma visto che la teoria della relatività tratta velocità
e distanze relativistiche, una tale procedura è priva d’ interesse.
39
| L ’ultima tecnica di sincronizzazione ha un punto delicato. Usan
do la procedura Sa si presume nota la velocità della luce c. Ma ab
biamo già visto che due orologi sincronizzati servono a determinare
la velocità del moto in una direzione. D ’ altro canto, la velocità della
luce si determina normalmente dal moto di un fascio lungo un per
corso chiuso. In particolare, in presenza di un solo orologio, la
velocità della luce si può trovare mediante riflessione da uno spec
chio. In questo caso bisogna usare la procedura 3b e conoscere la
distanza fra l ’ orologio di riferimento e lo specchio. Se questa distan
za è uguale ad r, allora c = 2r/(t2 — t,). In ogni caso, se la velocità
della luce che si propaga « in avanti» non è uguale a quella che
« torna indietro », non possiamo stabilire nulla. È impossibile ac
certarlo sperimentalmente perché i nostri orologi sono sincronizzati
per dare il valore c alla velocità della luce. Comunque, la teoria
della relatività parte dall’ assunzione che la velocità della luce nel
vuoto è la stessa in tutte le direzioni; inoltre, la totalità dei dati
sperimentali non contraddice questo punto né le conseguenze della
teoria.
Ora noi abbiamo un sistema di riferimento relativistico, un si
stema di coordinate (con assi rigidi) ed orologi sincronizzati rigida
mente connessi al sistema. Questi orologi in un dato SRI saranno
indicati come « insieme » di orologi. La procedura di sincronizzazio
ne, secondo Einstein, sarà tale da potersi utilizzare nello stesso modo
in ogni SRI.
Secondo la regola di sincronizzazione adottala, il sincronismo
di eventi può essere determinato come segue. Supponiamo che due
eventi sì verifichino in due punti ugualmente distanti da un terzo.
Se all’ istante in cui avvengono i due eventi vengono inviati dei
segnali luminosi dai due punti al terzo, gii eventi sono considerati
simultanei se entrambi i segnali raggiungono il terzo punto allo
stesso istante.
Ovviamente, un moto accelerato dei corpi può essere trattato
nell3ambito del SRL mentre non si può considerare un moto acce
lerato dei sistemi di riferimento (rispetto a inerziali). Poiché i campio
ni di lunghezza e gli orologi sono rigidamente fissati al loro SRI,
è ovvio che tali campioni e tali orologi non devono essere accelerati.
D ’ altronde, io studio di un’ accelerazione sni campioni di lunghezze
e sugli orologi ci farebbe entrare nello specifico della loro struttura
e priverebbe la teoria del suo carattere universale*
40
tempo di un evento, compatibili con i postulati di Einstein chiama
te trasformazioni di Lorentz. Comunque questo metodo (ne facciamo*
uso nel § 3.2) non è un passo obbligatorio. Ora illustreremo alcuni
« esperimenti ideali » dai quali trarremo le necessarie conclusioni.
Gli esperimenti ideali hanno un ruolo importante nelle conclusioni-
delia TR R ; essi rappresentano esperimenti immaginari che non sono
necessariamente condotti in pratica. Infatti essi sono ragionamenti
che permettono, date certe premesse \ di analizzarne le conseguenze.
Si passa alla descrizione di alcuni esperimenti ideali i cui risultati
verranno riottenuti in seguito, quando discuteremo le conseguenze
delle trasformazioni di Lorentza
Incominciamo con un esperimento molto semplice che illustra
qualitativamente la relatività del sincronismo, se il secondo postu
lato di Einstein è soddisfatto; in seguito riotterremo lo stesso risul
tato con un altro metodo. L ’esperimento è condotto nel treno di
Einstein; questo termine viene dato ad ogni treno in moto rettili
neo ed uniforme ma (è desiderabile!) con velocità relativistica. Nell’ e-
sperimenlo ideale si può assumere anche questa ultima richiesta. È
facile trovare il punto di mezzo del treno (questo si fa nel sistema di
riferimento del treno e non presenta difficoltà). L ’osservatore 1
è posto nel mezzo del treno e l ’ osservatore 2 alla stazione. Dalie-
estremità del treno-che sono egualmente distanti dall’ osservatore 1
verso di lui sono inviati segnali luminosi. L ’ esperimento ideale è
fatto in modo che i segnali che viaggiano dalle estremità del treno
arrivino all’ osservatore 1 proprio nel momento in cui questo raggiun
ge l ’ osservatore 2 (negli esperimenti ideali non importa come questo
si realizzi in pratica). Sono essenziali per noi le conclusioni che i
due osservatori traggono dal simultaneo arrivo dei segnali nel punto-
centrale del treno.
Osservatore 1. I segnali luminosi devono percorrere un’ eguale*
distanza per raggiungermi. Quindi sono inviati simultaneamente.
Osservatore 2 . I segnali luminosi mi raggiungono quando la metà
del treno mi passa vicino, di conseguenza, essi sono inviati qualche
tempo prima. Ma « prima » la testa del treno era più vicina della
coda. Quindi, il segnale dalla coda è stato inviato leggermente in
anticipo per poter giungere a me contemporaneamente al segnalo
proveniente dalla testa.
È evidente da questo semplice ragionamento che dne eventi si
multanei in un sistema di riferimento (il riferimento del treno nel
nostro esempio) non lo sono affatto in un altro (nel nostro caso il
riferimento « Terra »).
Tutti gli esperimenti ideali successivi saranno di natura quanti
tativa. In tutti verranno considerati due SRI detti K e K' la cui
1 Non si deve pensare che gli « esperimenti ideali» siano caratteristici solo-
delia teoria della relatività. Una serie di « esperimenti ideali » rivolti alla
meccanica quantistica si trova nella discussione di N. Bohr e A. Einstein, y<t>K
(Successi delle scienze fisiche) 66, 571 (1958).
41
velocità relativa è diretta lungo l ’ asse comune x , x (vedi fig. 1 .2 ).
Si assume che gli assi cartesiani dei due riferimenti coincidano all’ i-
;stante iniziale t = V = 0.
a)
direzione perpendicolare a quella del moto relativo dei due S R I. Pren
diamo due righelli della stessa lunghezza in ciascun sistema di rife
rimento K e K ' e poniamoli lungo i corrispondenti assi y e y r. I
righelli BC e B 'C r sono mostrati
nella fig. 2.1. A e A ' sono i punti
medi dei righelli in ciascun riferi
mento. Supponiamo che i righelli
si muovano in modo che, quando
gli assi y e y' coincidono, coinci
dono anche i punti A e A '. I rife
rimenti K e K ' sono geometrica
mente identici all’ istante t = t' =
= 0. La questione è: quale lun
ghezza per il righello B 'C 'm isurerà
un osservatore nel riferimento K ,
Fig. 2.1 L’ « esperimento ideale » che
'permette di stabilire che la lunghezza e quale invece per il righello BC ,
dei righelli, orientati perpendicolar quando la misura viene compiuta
mente alla direzione di moto relativo dall’ osservatore del riferimento
dei sistemi di coordinate, non varia K'? Gli osservatori devono regi
al misurarli in un qualsiasi SRI.
strare la posizione dei due estremi
dei righelli simultaneamente nei
.rispettivi sistemi di riferimento. P e rii caso considerato qui è conve
niente stabilire il sincronismo come segue. Quando i punti C' e B' si
trovano sull’ asse y, da questi punti si mandano due segnali luminosi
al punto A '. Nel riferimento K ' i segmenti A 'C ' e B fA ' sono uguali,
la velocità della luce c è la stessa, così entrambi i segnali raggiunge
ranno il punto A ' simultaneamente. Quindi, nel riferimento K\
i punti C e B' attraverseranno l ’ asse y' simultaneamente. Esattamen
te allo stesso modo i punti C e B attraverseranno simultaneamente
l ’ asse y' nel riferimento K ' , come visto nel riferimento K. A ll’ i
stante t = V = 0 (quando gli assi y e y' coincidono) misuriamo le
lunghezze del righello B 'C r nel riferimento K e del righello BC nel
riferimento K ' . In questo caso tutti e quattro i punti C, C", B , B\
•si trovano sull’ asse comune y, y r e gli osservatori nei due sistemi
possono comparare i loro risultati. Se risulta che CB > C B ' o vice
versa C'B' > CB, si può mettere in luce la differenza fra il riferi
mento K e K ', il che è inammissibile in base all’ assunto iniziale
circa l ’equivalenza di tutti i sistemi di riferimento inerziali. Per
ciò gli osservatori dei riferimenti K e K' possono soltanto affermare
che CB = C 'B '.
Di conseguenza, le lunghezze (e le unità di lunghezza) orientate
perpendicolarmente alla direzione del moto relativo rimangono co-
: stanti in ogni SRI. Ma questo implica che le coordinate dei punti
lungo gli assi perpendicolari al moto rimangono anche esse invariate.
42
Così, proprio come nelle trasformazioni di Galileo si ha
y f = y, z' = Z- ( 2 .1 )
b)
si osservano i ritmi di orologi nei due riferimenti K e K ' in moto
l ’ uno rispetto all’ altro, si possono confrontare le letture di un oro
logio in un riferimento con quelle di diversi orologi nell’ altro rife
rimento, in quanto due orologi appartenenti a diversi sistemi di
riferimento si trovano soltanto una volta nello stesso punto dello
spazio. In uno dei riferimenti ci devono essere almeno due orologi
a)
Fig. 2.2. L’ « esperimento ideale » da cui segue che l ’ intervallo di tempo proprio
tra due eventi è sempre minore dell’ intervallo di tempo tra gli stessi eventi
registrati da due orologi in qualsiasi SRI (esperimento « dell’ orologio luce »).
a) Per il calcolo dell’ intervallo di tempo proprio tra la partenza e l ’ arrivo del
segnale luminoso all’ origine O' del sistema di coordinate, b) Per il calcolo del
l ’ intervallo di tempo tra gli stessi eventi nel riferimento K rispetto al quale la
sorgente di luce e lo specchio sono in moto.
43
di un triangolo equilatero. Dato che il cammino della luce nel ri
ferimento K è maggiore di quello nel riferimento iD, ci si aspetta che
Fintervallo di tempo At tra la partenza e F arrivo del segnale, mi
surato nel sistema K 1 sia maggiore di At'. Infatti, Fosservatore del
riferimento K accerta che i due eventi, cioè remissione della luce
dal punto 0 ' ed il suo ritorno in 0 \ avvengono in due distinti punti
dello spazio 0 e B (fig. 2.2b). LÙntervallo di tempo Ai fra i due even
ti nel riferimento K sarà misurato in questo caso da due orologi
separati dalla distanza VAt lungo la direzione di moto. La velocità
della luce è c in tutti i sistemi di riferimento; quindi, dopo aver di
viso la lunghezza dei due lati del triangolo OAB per la velocità
della luce c, otteniamo per Dintervallo Ai F espressione implicita
A* = 2 ) / z l + ^ y j c »
At = -^ 2. . J1
y A - ze2i
U T 1/2
dove R = ( 1
ù2 /
Poiché z0 z'0, allora
At'i At'ì
At: ■TAt', (2 . 2)
Vz> V B2
v s
dove si è posto R = Vie. Dato che i due eventi avvengono nello
stesso punto nel riferimento K \ essi sono registrati dallo stesso oro
logio. Un intervallo di tempo fra eventi registrato dallo stesso orolo
gio (il che implica che gli eventi avvengono nello stesso punto dello
spazio) viene detto intervallo di tempo proprio tra questi eventi.
Ovviamente, un intervallo il cui inizio e la cui fine sono registrati
in punti diversi del riferimento e, di conseguenza, con diversi oro
logi non sarà un intervallo proprio. Nell’ esempio già considerato
Fintervallo di tempo proprio è uguale a A t'. Si è visto dall’equazione
(2 .2 ) che un intervallo di tempo proprio fra eventi è il più breve
quando viene misurato nel sistema di riferimento in cui gii eventi
avvengono nello stesso punto dello spazio. Come vedremo nel § 3.4,
si possono indicare le condizioni, per cui esiste un tale sistema di
riferimento, in cui due eventi dati avvengono nello stesso punto.
Quindi abbiamo raggiunto la più importante conclusione: Finterval
lo di tempo tra due eventi è una grandezza relativa; il suo valore
dipende dalla scelta del sistema di riferimento. Niente del genere
era noto in fisica classica, dove gli intervalli di tempo avevano carat
tere assoluto.
Questo esempio illustra come perfino la lettura del tempo sia
differente in diversi riferimenti. Quando le origini O ed 0 ' coincidono*
44
allora gli orologi del riferimento K e K ’ posti in quei punti registrano
gli istanti t1 0 e £' = 0 (secondo le nostre condizioni iniziali).
Quando la luce e tornata ad 0\ l ’ orologio del riferimento K ' ha
registrato il tempo t\ = t[ + A f . Ma allo stesso istante nello stesso
punto si trova l ’ orologio del sistema K (non quello che era in 0 ,
ma un altro sincronizzato con esso). In questo caso Porologio regi
stra t2 = t± At. Gome abbiamo già stabilito At At\ cioè le
letture degli orologi sono diverse. Questo significa che gli istanti
dell’ avvenire degli eventi sono registrati in modo diverso in diffe
renti sistemi di riferimento. È da notare che questo calcolo della
lettura deir orologio nel riferimento K corrisponde pienamente alla
regola di sincronizzazione di un orologio secondo Einstein, descritta
nel .. § 2 .2 .
c)
direzione della velocità relativa. Un sistema di riferimento, in cui il
corpo è a riposo, è per questo corpo un sistema di riferimento pro
prio. È consuetudine designare questo riferimento con K°. Supponia
mo che il righello posto lungo basse x° sia a riposo nel riferimento
scelto. Denotiamo la lunghezza del righello in questo riferimento
(la lunghezza propria del righello) con Z0. Per trovare la lunghezza
del righello in un altro sistema di riferimento, bisogna determinare
simultaneamente (in tale riferimento) le coordinate degli estremi
del righello. La simultaneità di misura non è importante soltanto
nel riferimento K° in cui il righello è a riposo. Dato che nella vita
quotidiana viene misurata la lunghezza propria degli oggetti, la
procedura è semplice e viene effettuata mediante la trasposizione
diretta della lunghezza campione.
Se si tratta di sistemi di riferimento in moto l ’uno rispetto all’ al
tro, il righello è a riposo in un unico sistema di riferimento, e ri
spetto a tutti gli altri riferimenti esso si muove. E la diretta tra
sposizione della misura unitaria diventa impossibile. Facciamo uso
del metodo della misura di lunghezza, adatto anche per misurare
la lunghezza di un righello in moto rispetto al riferimento.
Poniamo l ’ estremità sinistra del righello nell’ origine O0, dove
è posta anche una sorgente di luce I. A ll’estremità destra del ri
ghello è posto uno specchio S perpendicolare agli assi x e x 0 (fig. 2.3a).
Consideriamo ora due eventi. Primo evento: un segnale luminoso
è inviato dalla sorgente / verso lo specchio lungo l ’ asse x 0 all’ istante
t = t0 = 0. Secondo-evento: il segnale luminoso riflesso dallo spec
chio S torna indietro verso l ’estremità sinistra nel punto O0. Entram
bi gli eventi vengono registrati nel punto O0 da un orologio. In
questo modo l ’ intervallo di tempo fra gli eventi è Pintervallo di
tempo proprio At0 che può essere scritto nella forma
(2-3)
45
le la sorgente / del riferimento K si trova in 0 e lo specchio S è nel pun
to Sv A ll’ istante della riflessione lo specchio si è spostato nel punto
S 2 e la sorgente I nel punto I 1. A ll’ istante dell’ arrivo del segnale,
riflesso dallo specchio S, all’estremità sinistra del righello la sorgen
te si trova nel punto / 2. Gli istanti di tempo corrispondenti al pri
mo e al secondo evento sono registrati nel riferimento K in punti
diversi e, di conseguenza, con diversi orologi. Questo implica che
l ’ intervallo At tra questi due eventi si può esprimere in termini di
At0 in accordo con la (2.2). Nel propagarsi della luce verso destra,
At — ti + l2- c_ y + c + y - c c ‘
46
girello Z0 (nel riferimento K°) alla lunghezza impropria l in un altro-
riferimento K.
Così abbiamo dedotto direttamente dai postulati di Einstein la.
relatività degli intervalli temporali fra gli eventi e la relatività delle
lunghezze (dei righelli) delle scale. Entrambe queste grandezze in
meccanica classica erano equivalenti in ogni sistema di riferimento.
Questi risultati sono inerenti alla teoria della relatività e richiedono
un1approfondii a discussione. Comunque, rimandiamo la discussione-
dei risultati ottenuti fino ai §§ 3.2, 3.3., poiché questi risultati,
data la loro importanza, saranno ottenuti ancora con metodi diversi,,
che evidenzieranno alcune nuove proprietà, essenziali per E inter
pretazione delle equazioni (2 .2 ) e (2.4).
4?
in tutti gli altri punti dello spazio. Questo è un risultato molto im
portante: l ’ orologio sincronizzato in un sistema di riferimento è
non sincronizzato in un altro sistema di riferimento inerziale; In
altre parole, se nel riferimento K ' fissiamo simultaneamente le let
ture di tutti gli orologi del riferimento K , si vedrà che gli orologi
nel riferimento K segnano un tempo diverso. Ora otteniamo le equa
zioni richieste.
Normalmente una relazione fra le indicazioni degli insiemi di
orologi sincronizzati nei riferimenti K e K* si stabilisce come segue.
Quando le origini dei riferimenti K e K f coincidono, gli orologi di
K e K ' che sono collocati nell’ origine comune segnano t = 0 e t! = 0 .
Come vedremo più avanti, non segue da ciò che gli orologi dei rife
rimenti K e K r segnano lo stesso tempo in tutti gli altri punti dello
spazio.
Abbiamo bisogno di una formula della trasformazione delle coor
dinate dei punti delio spazio nella transizione dal riferimento K
■a K '. Quando le origini delle coordinate coincidono, il retìcolo delle
coordinate del riferimento K ! è contratto di 1 /F volte rispetto al
riferimento K (le unità di scala proprie sono le stesse nei riferimenti
K e K '). Di conseguenza, all’ istante iniziale le coordinate x ed x r
sono legate dal rapporto (vedi la (2.4))
1
/ 1 — B2 )■
D all 1istante t il reticolo delle coordinate del riferimento K s si spo
sterà rigidamente delia distanza Ft, così avremo in queiristante
x = x f/V + Vt, Quindi, se la coordinata del punto nel riferimento
K è uguale a x all’ istante £, la sua coordinata x f nel riferimento K*
sarà uguale a
x 9 (.X, t) =■ r \(x — Vt). (2.5)
Il reticolo delle fcoordinate non varia lungo gli assi y e k (§ 2,3)?
•e ^perciò
y' = y,P; = z-
Ora siamo interessati alla lettura deH’ orologio del riferimento K f
posto nel punto x all’ istante t; designarne questa lettura con tr (x, t).
Questa grandezza si può definire in molti metodi, ma ora lo otter
remo usando una procedura di sincronizzazione dell’ orologio.
Facciamo ciò nel modo seguente: quando le origini delle coordinate .
0 ed 0 ! coincidono e le letture dei due orologi (uno da K e l ’ altro
da K f) sono uguali a zero, si manda un segnale luminoso lungo l ’ asse
comune x nel verso crescente delle x e x\ Consideriamo poi ristante
t dell’ orologio nel riferimento K . In questo istante il segnale è arri
vato al punto x2 — et del riferimento K , L ’ arrivo del segnale al pun
to x 2 n ell’istante t rappresenta l ’evento le cui coordinate in K sa
ranno (x2ì t). Nel sistema K r lo stesso evento avrà le coordinate
(x 2, i[), in accordo col secondo postulato x'z = et'r Ma l ’ equazione
48
(2,5) è valida per tutti gli eventi, perciò, sostituendo x 2 e x* in en
trambi i membri e dividendo per c, otteniamo
- T t ( l — B). (2.6)
Ciò significa che un orologio dell’ insieme di orologi del riferimento
K ! segna al punto x 2 il tempo che non coincide affatto con il
tempo t segnato allo stesso punto dall’ orologio del riferimento A.
Abbiamo così due diverse letture di tempo, ciò è già stato discusso
al § 2,3.
Ora possiamo cercare la lettura eli un ulteriore orologio uei ri
ferimento A ' all’ istante t. A ll’ istante t l ’ origine O' si troverà nel
Kr
ìV | |Istante i
i
t-0 A t r t /r t'2=r(i-$)t
---(J---------------------3^
j Ax=c(1-B)t |
t*-0 X f* V t X f C t X
Fig. 2.4o La non sincronia degli orologi del riferimento K' in termini del riferì-
mento K . Quando le origini 0 ed O' coincidono, i due orologi dei riferimenti K
e /£', che si trovano in quel punto, sono azzerati in modo da segnare t = 0 e
t' — 0. All’istante t (secondo l ’ orologio di K) si possono trovare le letture
dell’orologio del riferimento K f nei punti x1 — Vt e x2 = et.
E questo a dispetto del fatto che tutti gli orologi dell’ insieme del
riferimento A ' sono stati sincronizzati nel loro riferimento. Ma
il calcolo mostra che tutti questi orologi sono nonsincronizzati nel
riferimento A . Abbiamo trovato che la non sincronia dipende da
quale punto del riferimento A si sceglie per il confronto. Troviamo
la differenza di lettura degli orologi del riferimento A ' nei punti
49
x 2 e x ±:
At' = *; - t r = PB£ (B - 1 ).
Questa differenza di lettura si accumula nella distanza Ax =
= z 2 — Xx = et (1 — B). Avendo supposto che la non sincronia
dipende linearmente dalla distanza lungo l ’ asse x ì si può determinare-
una non sincronia per unità di lunghezza:
At' _ _ -p _B
( 2 . 8>
dx 1 C8
Si vede dalla (2.8) che la non sincronia per unità di lunghezza
non dipende dalla scelta dell’istante £, ma è definita unicamente
dalla distanza fra gli orologi del
t ’(x, 0)% riferimento A ', calcolata nel si
Corologia in Kr stema A ; otterremo per una coppia
va aranti t=0 arbitraria di punti
a -t'i= —r — (x2—xi).
t ’ (x, t ) = j r - T ^ - ( x - V t ) = T(t-^(2.10)
50
Le equazioni (2.5), (2.6) e (2.10) costituiscono le trasformazioni
di Lorentz. Ovviamente, la derivazione della (2.10) può sembrare
laboriosa e anche superflua. Infatti, applicando il ragionamento che
ci ha condotto all’ equazione (2.5) per il passaggio dal riferimento
K' a K , otteniamo
x (x\ t') = T (x' + Vtr). (2 . 1 1 )
Risolvendo la (2.11) rispetto a f e sostituendo x secondo la
(2.5) otteniamo direttamente la (2.10):
51
Ora introduciamo nelle equazioni di trasformazione un termine del
secondo ordine:
52
Ora deriviamo ie equazioni di trasformazione per le variabili
x e t. Poiché la trasformazione è lineare, allora
x = A 1±x + A ^ t -[- A 10, (■&}
e, viceversa,
X — A 21X -}~ A 22^ “f* A 21),
dove tutti i coefficienti A sono costanti. Dalle condizioni iniziali
si ha t = 0 e tf = 0 quando le origini 0 e Or coincidono. Quindi
A 10 = 0 e A 20 = 0- Osservando il punto O' possiamo dire che la sua
OUUlUliiUtU AkjC
7 UgUUIO riPequaz inno \/->\
/
otteniamo
0 - + ^-12^
conseguentemente, A 12/A u = —'F. Indicando 1 A 12 con Y\ possiamo
riscrivere l ’ equazione (*) nella forma (vedi § 2.4)
= r / (x — Vt), (2.13)
e con ragionamenti analoghi,
x = Y (x* + Vt'), (2.14)
Quindi il problema si riduce alla determinazione dei coefficienti
r e PC Data l ’uniformità del tempo e dello spazio e l ’isotropia dello
spazio, entrambi questi coefficienti possono dipendere soltanto dal
valore assoluto della velocità V.
È facile vedere che T = PC Infatti, supponiamo che nel riferi
mento K una scala collocata lungo Passe x abbia la propria lunghezza
Z0. Collochiamo un suo estremo all’ origine del sistema di riferimen
to, allora le coordinate dei suoi estremi saranno, rispettivamente,
x v = 0 e x2 = lQ. A ll’ istante t = t' — 0 (ricordiamo che in questo
istante i sistemi K e K ' coincidono geometricamente) in accordo con
la (2.14) x[ = 0 e x'2 — IJY. Di conseguenza, la lunghezza della
scala in termini di K ' è uguale a V = x\ — x[ = IJ PC Prendiamo
la seal a della stessa lunghezza, immobile nel riferimento e col
locata lungo l ’ asse x. Allora le coordinate degli estremi saranno
x[ = 0 e x'2 = Z0. Ma in termini del riferimento K queste coordina
te saranno = 0 e x 2 = IJY' all’ istante t = 0 come nella (2.13).
In conseguenza, la sua lunghezza è ugnale a I - i 2 — xi — Z0/T\
cioè la scalasi è contratta di P' volte. I riferimenti K e K ' sono
equivalenti, la loro velocità relativa è la stessa, perciò la contra
zione deve essere identica e quindi T = P\
Cerchiamo di definire la grandezza P. La differenza tra il riferi
mento K e K' sta solo nella loro velocità relativa, e Y deve dipen
dere solo dal valore assoluto della velocità V . Utilizziamo ora il
postulato sull’ invarianza della velocità della luce nel vuoto in
tutti i SPJ. A ll’ istante t = t' = 0 (quando le origini O e 0 ' dei due
53
riferimenti coincidono) viene mandato un segnale luminoso dall’ ori
gine comune. Supponiamo che P evento consista nell’ arrivo del
segnale in un certo istante (t nel riferimento K o t' in K ') in un cer
to punto (x in K e x in K ') posto sull’ asse x. Nel riferimento K
questo punto ha la coordinata x = et, mentre in K' lo stesso punto
ha la coordinata x = et'. Questi istanti e coordinate sono correlati
dalle trasformazioni (2.13) e (2.14) e, sostituendo queste espressioni
per x e x nelle (2.13) e (2.14), otteniamo
et' = T* (e — F), et = Tt' (c + V).
Moltiplicando termine a termine entrambi i membri di queste
due espressioni e cancellando il termine tt', si ottiene
i i
r (2.15)
Y 1 —B2 ’
Quindi
r' = r(, + r'± = T (ru— Vt) + r ± = T [ ( r „ + ^ j . ) — Vt] — (\ — T ) r L,
rV lV(rV)ì
r± = r — r i[ = r — V V2 V2 ‘
54
Di conseguenza,
rV
t' = T [ t — C2 )■
55.
In questo esperimento ideale abbiamo a che fare con due eventi.
Il primo consiste nell’ invio di un segnale dall’ origine xG = 0 *
y0 = 0 , z0 = 0 all’ istante t0 = 0 , il secondo nell’ arrivo del segnale
in un punto arbitrario della sfera con le coordinate x, y, z all’ istante
t. Se mettiamo insieme l ’espressione
56
può dipendere dalia direzione delia velocità relativa dei due SRI*,
perché altrimenti ciò implicherebbe la non equivalenza delle diver
se direzioni nello spazio. Data Visotropia dello spazio dobbiamo
presumere che a possa dipendere soltanto dal valore assoluto della
velocità relativa dei riferimenti inerziali in questione.
Consideriamo tre SRI denotandoli rispettivamente con A , K r
e A ", inoltre Vx è la velocità di K ' rispetto a A e V 2 è la velocità
di A" rispetto a A . Possiamo scrivere che
ds* = a (Vi) ds\, (*);
— = —
a (VA riA
\• ùj —a- \ r
Considerando direttamente i riferimenti A ' e A", si può scrivere
dsl =
dove V12 è il valore assoluto della velocità del riferimento A ' rispet
to a A ". Sostituendo l ’ultima espressione nell’ equazione (*) e com
parandola con Pequazione (**), troviamo che
57
§ 2.7. Trasformazioni di Lorentz
come conseguenza dell’ invarianza
dell’ intervallo tra gli eventi
Nel paragrafo precedente si è mostrato che le coordinate di due
■eventi devono soddisfare l ’ equazione
cH'1 — x '2 = cH2 — x2 o x 2 — cH'2 = x 2 — cH2 (2.19)
nel passaggio da un riferimento inerziale ad un altro. Qui supponiamo
per semplicità che uno degli eventi abbia coordinate (0 , 0 , 0 , 0 )
e, visto raccordo sui sistemi di riferimento, ciò significa che questo
evento avrà coordinate (0 , 0 , 0 , 0 ) in un altro riferimento.
Facciamo un altro passo per semplificare la notazione. Il lettore
ha già notato quanto sia comune il prodotto et della velocità della
luce per il tempo. Introduciamo una nuova unità di tempo, il me
tro luce; l ’ intervallo di tempo in cui la luce percorre una distanza di
1 m. Ovviamente 1 m è percorso in He secondi.
La luce percorre % metri nel tempo x - = t s; quindi è chiaro
che
t (luce-m) — et (s). (2 . 20)
Questa unità non appare eccezionale se si pensa che la distanza in
astronomia è misurata in termini di tempo (e la velocità della
luce), cioè in anni luce.
Allora, se il tempo è misurato in metri luce, l ’ espressione
per l ’ intervallo invariante tra eventi diventa piuttosto semplice:
x '2 — x '2 = x2 — x2. ( 2 .2 1 )
Il modo più semplice di trovare trasformazioni che soddisfino
la (2.21) è il seguente. Sappiamo (§ 2.5) che trasformazioni di
coordinate e del tempo devono essere lineari. Scriviamo tali tra
sformazioni con coefficienti indeterminati costanti nella forma
x = axx + b±t , /o
x' = + b2t .
Sostituendo l ’espressione (2.22) al primo membro della (2.21)
e raggruppando i coefficienti di x 2, x2 e 2 , otteniamo
x t
58
te nell’ Appendice I, § 9);
a1 = eh dq, a 2 = sh dq, b2 = eh # 2, b1 = s h d 2.
In questo caso le prime due uguaglianze dalla (2.24) sono auto
maticamente soddisfatte, e dalla terza, riscritta nella forma
= bJb-L, segue th # 1 = th *0*2, e per soddisfare questa equa
zione è sufficiente porre d x = d 2 = $'• Quindi la trasformazione
( 2 . 22 ) diventa
x' — x eh d + t sh d,
t ' = £ sh d -[-T eh d. (-^.25)
11 parametro d può dipendere solo dalla velocità relativa V.
È chiamato parametro velocità e gioca un ruolo importante nella
T R R (vedi § 3.5). Per definirlo, si deve usare la prima uguaglianza
della (2.25). Assumendo x = 0 per l ’ origine O' , otteniamo
~ = — th d. (2.26)
59
§ 2.8c Valori complessi nella TRR*.
Designazioni simmetriche
Qualche volta per comodità formale si introduce una coordinata tem
porale immaginaria % — ict = ir. Questo procedimento è utile-
nell’ ambito della teoria della relatività ristretta, perché ci libera
dalla necessità di introdurre e distinguere coordinate co- e contro-
varianti (vedi Appendice I, § 8 ). L ’introduzione di tali coordinate
è inevitabile nell’ elettrodinamica relativistica, a meno die non
si usi un tempo immaginario. Si deve sottolineare die l ’ introduzione
di un tempo immaginario è solo una questione ui convenienza e se
ne può fare a meno: perciò non c ’ è niente di misterioso nella com
parsa del numero i. Nella forma finale tutte le formule per le coor
dinate e il tempo contengono il numero i, e ciò conferma una volta di
più che esso gioca soltanto un ruolo ausiliario.
Quindi introduciamo formalmente una coordinata immaginaria
t = ilet. Allora
60
Assumendo x come funzione di t , differenziamo la (2.32a) rispetto
•a t . Otterremo dx cos cp + dr sin cp = 0, da cui segue
dx 1 dx
dt — tg<p
a, di conseguenza,
tg (p = iB . (2.33)
La tangente è una grandezza immaginaria; questo ci fa pensare
ancora una volta che tra le variabili c ’ è una grandezza immaginaria.
Usando le formule convenzionali della trigonometria si trovano
dalla (2.33)
v i+ t
(2.34)
COS (p = — r- 1 = - ----- — rr= z
/ i + i g 2«p Y i- -B*
■dove si è introdotta la sostituzione F = (1 — gi à usata
nella (2/15). Sostituendo il valore di cos cp e sin cp nella (2.32),
•otteniamo le trasformazioni cercate per le variabili x, r:
61
si vede che è sufficiente sostituire cp = — nella (2.25) per
convertirla nella (2.32). Così, nel piano delle variabili reali
x, t abbiamo, dal punto di vista formale, la rotazione di un sistema
cartesiano di un angolo immaginario. Questa rotazione ricorda assai
poco una rotazione autentica del sistema cartesiano e le formule
(2.25) che la definiscono sono una « parodia » delle formule (2.31).,
che descrivono una rotazione reale. Spiegheremo più avanti il si
gnificato geometrico della « rotazione » degli assi x e t secondo le
(2.32), in questo paragrafo scriveremo le trasformazioni di Lorentz.
in forma simmetrica per poterle usare d ’ ora in poi.
Introduciamo le notazioni simmetriche delle variabili fonda-
mentali come segue:
x1 = x, x2 = y , x 3 = z, = let = ìt (2.38)
per il tempo immaginario e
x° = et = t , x1 == X, X2 = Z/, X3 = z (2.39)
per il tempo reale.
L ’ insieme delle variabili (2.38) sarà comodo per l ’ espressione
deH’elettrodinamica relativistica. Per quanto riguarda l ’ insieme
delle variabili (2.39) esso si usa nel libro [9] che contiene la descri
zione della teoria generale della relatività, e la transizione dalla
TRR alla teoria della relatività generale senza l ’ ausilio dell’unità
immaginaria risulta più complessa. Riscriviamo le corrispondenti
trasformazioni di variabili (2.30) (in forma reale):
£0= Tx°' + I W ' + 0 •x*' + 0 -a *'9
x 1= PBa?0' -f- Re1' -f-O-z2' ,
(2.30')
x2—0-xQ' -f-0-a;1' + 1-a;2' + 0-£3',
a* = 0-a*' + 0 -x if + 0 -& ' +
la (2.36) (con il tempo immaginario):
x i = Tx[ + 0-x'2 -f- 0-z'3— iBRr',
z2 = 0 •x[ + 1 •x'2+ 0 ■x'3+ 0 •x[,
(2.36')
£3 = 0 - £ '+ 0 « # ' + l- - 0 •xAÌ
24 — iBP •x[ + 0 •x\ + 0 ■x'3+ r •
Le trasformazioni (2.30') e (2.36') si possono riscrivere in forma
abbreviata
x l = aihZ'k (a), I xi = ai*:** (b). (2.40)
62
la forma di matrici
/ r TB 0 0\ r 0 o -- ì B r \
/ TB r 0 0 1 0 1 0
'■
‘ ih ' (a) 0 i (b), (2.41)
lo 0 1 0 I 0 0 1
0
\0 0 0 1/ iBr o o r /
che sono dette matrici delle trasformazioni di Lorentz. Matrici di
questa forma sono usate sempre nella trasformazione di coordinate
e di tempo nel passaggio da un riferimento inerziale all’ altro. Queste
matrici differiscono soltanto per il valore della velocità relativa V y
cioè per il diverso valore di B = Vie.
Le equazioni della transizione inversa, cioè il passaggio dal
riferimento^ K a K r, si ottengono con la sostituzione di B a —B.
Designamo con la matrice della transizione da K a K' in modo'
che
x ir = aihxh, zi = a'ikx h. (2.42)
Per la matrice con elementi reali la sostituzione indicata porta
ad una matrice a'ik completamente nuova. Ma la matrice a'ik si
trasforma in a ki (con righe e colonne trasposte), quando si sostitui
sce — B al posto di B, in modo che
x'i = akixh. (2 A3)
63
no:
, 1
asse t : t — — x;
D
asse#' : T = Bx. (2.44)
L ’ angolo tra gli assi x e x è definito dalla relazione cp — arctg B.
Quindi, le trasformazioni di Lorentz si riducono ad una conversione
da un sistema di riferimento rettangolare x, % a quello obliquo x ' ,
t '; gli assi x e x ruotano attorno all’ origine, nella direzione della
bisettrice del l ’ angolo coordinato, duello stesso angolo cp — arctg B
64
IIL CONSEGUENZE DELLE TRASFORMAZIONI
DI LORENTZ. CLASSIFICAZIONE DEGLI INTERVALLI
E PRINCIPIO DI CAUSALITÀ»
METODO DEL COEFFICIENTE k
65
È ciò che si fa comunemente quando si misura, per esempio, un tes
suto o la lunghezza di una stanza.
È anche piuttosto semplice la misura di un intervallo di tempo
tra due eventi che avvengono nello stesso punto dove si trova 1’ orolo
gio. Occorre soltanto registrare ristante in cui avviene il primo
evento e quello in cui avviene il secondo. La differenza nelle letture
dell’ orologio ci darà l ’ inlervallo di tempo richiesto. In questo modo,
ad esempio, si stabilisce la durata di una lezione o di un incontro di
calcio.
Ma come si misura la lunghezza di un corpo in moto rispetto a
noi? Supponiamo che un treno ci passi accanto a grande velocità
e di volerne determinare la lunghezza. Non è certo facile per un
uomo. Egli deve annotare simultaneamente la posizione della testa
del treno (locomotiva) e della coda rispetto ad un certo punto fisso
sul terreno. Ma appena ha annotato la posizione della locomotiva e
comincia a voltare la testa, la coda del treno è andata avanti. Di
conseguenza, bisogna avere gran cura nel segnare simultaneamente
le posizioni della testa e della coda del treno.
Una volta segnate sul terreno le posizioni delle estremità del tre
no, si può facilmente misurare la lunghezza con i metodi convenzio
nali, cioè la lunghezza del corpo a riposo.
Come si misurano, invece, gli intervalli di tempo tra eventi che
accadono in punti diversi dello spazio? Ricordiamo come si misura
il tempo di uno sprinter nella gara dei cento metri. Gli eventi in
questo caso sono la partenza dell’ atleta ed il] suo arrivo. E c ’ è un
solo orologio! Il colpo dello starter serve come segnale d ’ inizio della
gara e fa partire un contasecondi che si trova all’ arrivo. Il suono si
propaga in aria alla velocità di 300 m/s, e l ’ atleta comincia a correre
prima che il giudice che si trova all’ arrivo faccia partire il conta-
secondi. Questo non è essenziale, tuttavia, data la bassa velocità del
corridore (circa 36 km/h = 10 m/s, che è piccola rispetto alla
velocità del suono). Ma da questo esempio si ha la sensazione che la
misura dell’ intervallo di tempo tra due eventi che hanno luogo in
punti diversi richiede una certa attenzione.
Nel § 2.1 abbiamo discusso come viene trattato il problema
nell’ ambito della teoria della relatività: ciascun riferimento inerzia
le ha il proprio sistema di coordinate e orologi a riposo sono posti in
tutti i punti in cui sono necessari. Questi orologi sono sincronizzati
all’ interno del sistema di riferimento, in modo che letture uguali
degli orologi corrispondono allo stesso istante di tempo nel riferi
mento.
Quando passiamo a confrontare eventi di due riferimenti K
e K\ leghiamo la lettura dell’ insieme sincronizzato di orologi del
sistema K all’ analogo insieme di K ' ponendo t = 0 e V = Ó alle
origini coincidenti 0 e 0 ' (vedi § 2.2). Ricordiamo che le trasforma
zioni di Lorentz sono proprio una conversione delle coordinate di un
evento nel riferimento K , cioè delle coordinate {x, y, z, t), nelle
coordinate dello stesso evento nel riferimento K '. Dalle formule
66
(2.16) o (2.29) o (2.40) otteniamo (x , y ', z , t') espresse mediante
(x, y, z, t). Ovviamente, tutte le conseguenze, sorprendenti dal
punto di vista del « senso comune », dei postulati di Einstein discussi
nel capitolo II si riottengono dalle trasformazioni di Lorentz. Ora
ci occuperemo di ciò.
Dapprima deriviamo due utili equazioni che ci saranno necessarie
in seguito. Consideriamo due eventi arbitrari I (x±, iq, zl7 t±) e II
(x2, z/2, z2, t2). Per la conversione delle coordiante e dei tempi di que
sti eventi nel riferimento K ' abbiamo, in accordo co n ia (2.37a, b)5
xx = r (zi - ■Vti).
Prendendo le differenze t' e x„ -x, cioè sottraendo l ’equa
zione in basso da quella in alto, e definendo Ax = x 2 — xl7 Ax' =
— x'2 — x'v At' — t'2 — t[, At = t2 — tl7 si ottengono le equazioni
richieste (le equazioni per il passaggio inverso sono date accanto):
Ax' = T (Az — FA (3.1) Ax = P (Ax' + V At'), (3.1')
Af = T (At (3.2)
At' = - T ^ - A x . (3.3)
67
nel § 2.4. È sufficiente porre V = 0 nella formula (2.37b) per ot
tenere immediatamente la (2.9) che non era in px^ecedenza facil
mente ottenibile. Non appena si assume At = 0 nella formula
(3.2), si ottiene la (2.8). Questo dimostra quanto una « trasformazione »
possa essere oscura in apparenza.
Nella vita quotidiana una violazione delia simultaneità in diver
si riferimenti non è percepibile: la differenza temporale At ò pro
porzionale a B/c, come si vede dalla (3.2), assumendo At — 0 (la
simultaneità nel riferimento K ). Dalla stessa (3.2) si vede tuttavia
che se Ble Ax ha un valore apprezzabile, anche At' assume un certo
valore se Ax è grande.
È importante sottolineare che la relatività della simultaneità
è imposta dal fatto che la velocità della luce è finita. Se formal
mente si fa un passaggio al limite per c oo (ciò significa che
B -> 0), la simultaneità diventa assoluta. Questo risultato corri
sponde al caso di piccole velocità relative dei sistemi di riferimento.
Si vede dalle formule (3.1) e (3.1') che due eventi che avvengono
in punti dello spazio con la stessa coordinata x nel riferimento K
(cioè allo stesso punto nel riferimento K) hanno coordinate x' diverse
nel riferimento K ' . Infatti dalla (3.1) otteniamo Ax' = T (Ax —
— V At) = —TV At. Ma Al è Vintervallo di tempo proprio, e quindi
F At — At', da cui Ax = — V At'. Il significato di quest’ ultimo ri
sultato è evidente; esso definisce Io spostamento del punto £ rispetto
al riferiménto K f registrato in K ' .
68
problema della simultaneità delle misure delle coordinate degli
estremi: la sua lunghezza può essere misurata con ogni mezzo.
Nel riferimento K le coordinate degli estremi del righello si
determinano dalla trasformazione di Lorentz (vedi la (2.37 a))
x't = T (x2— Vi2), x[ = T (xì — Vti).
Costruendo la differenza — x[, si ottiene
— x'i — T l f a — Xi) — V (tz — ti)}. (3.4)
La lunghezza propria del righello costituisce il primo membro della
(3.4). In parentesi graffe nel secondo membro troviamo Ax e Ai
per i due eventi, essendo x 2 la posizione dell’estremo sinistro del
righello all’ istante Z3 e x1 la posizione dell’estremo destro all’ istante
tx (nel riferimento K).
La grandezza Ax sarà la lunghezza del righello nel riferimento
K solo se le posizioni degli estremi sono registrate simultaneamente
in questo riferimento. Altrimenti si può avere qualsiasi valore per
Ax. Riprendiamo l ’esempio citato all’ inizio del § 3.1 riguardo la
misura di lunghezza di un treno in movimento: si è segnata la
posizione della coda del treno e ci si volge lentamente con la testa
verso il suo inizio. Se si segna la posizione della testa della locomotiva
e si misura la distanza fra i segni, essa risulterà maggiore della lun
ghezza propria del treno. Procediamo ora in senso opposto: prima
segnamo la posizione della testa della locomotiva e poi giriamoci
lentamente verso la coda del treno.. È facile convincersi che, se si
volge il capo con una certa lentezza,, la lunghezza del treno può per
fino essere nulla. Questo è proprio il senso della formula (3.4).
Quindi, per determinare senza ambiguità la lunghezza del righello
nel riferimento K, bisogna considerare i due eventi simultanei in
K : la coincidenza dell’estremo sinistro del righello con un certo
riferimento spaziale in K (diciamo aq) e dell’ estremo destro con
un altro riferimento in K (diciamo x 2). Questo significa che Ax — ì
solo se Ai = 0. Ma allora dalla (3.4) segue che i0 = PZ, dove ì
è la lunghezza del righello determinata nel riferimento K. Como
è consuetudine l ’ultima equazione si scrive come segue:
1= 1o ] / K
Ovviamente, per le stesse condizioni del problema, si può fa^
uso delle equazioni di trasformazione inversa:
^2 = r « + F«'), Xi = r (x[ + vt[).
Sottraendo l ’ uguaglianza destra da quella sinistra, si ottiene
Ax - rz0+ t v (*; - 1 [) = rz0+ t v a ? .
Ma Ax diventa la lunghezza Z solo se At = 0. Esprimendo At' in
termini di At e Ax dalla (2.37b), Af = T (At — P/c 2Ax), ed assu
mendo Ai = Q nell’ equazione, otteniamo ancora la (3.5).
Ci sono due metodi per determinare la lunghezza di un righello
in movimento che, naturalmente, conducono allo stesso risultato.
Sia il righello AB a riposo nel riferimento K, in modo che l ’ estremi-
tà sinistra A coincida con l ’ origine 0 (fig. 3.1). A ll’istante t — 0
l ’ origine del riferimento K' coincide con 0 (la lettura dell’ orologio
in O’ è t' = 0 ) . Quindi l ’ osservatore in B registra il momento in
cui (9' attraversa il punto B. Sia questo istante t. La velocità del
riferimento K' è nota. Quindi la lunghezza propria del righello è
0r 0f
0
4* 3 *
Fig. 3.1. Per il calcolo della lunghezza di un righello in moto.
i = ± i 0= i 0y r ~ B i .
70
amente in questo riferimento, lo coordinate degli estremi del righel
lo. Gli eventi che sono simultanei nel riferimento K' sono ritardati
l ’ uno rispetto all’ altro di A £ = P (Atf -f- V/c2k x ) = TV/cH0 nel
riferimento K (fig. 3.2). Ma in questo tempo l ’ estremo x[ si sposta
nella direzione del moto della distanza F A t — TB2l0. Quindi la
lunghezza misurata del righello sarà minore di Tl0 della grandezza
FAZ, cioè
z = rz0—rB2z0- 10] / T ^ b "2.
Ricordiamo che la (3.5) è stata ottenuta direttamente dai po
stulati di Einstein (§ 2.3). Ora è il momento di entrare nel signi
ficato fisico della (3.5). Abbiamo trovato che la lunghezza di un corpo
V&t _ l/ h W
X
U_____ Ho._____^
Fig. 3.2. Relatività delle lunghezze di righelli come conseguenza della relatività
del verificarsi simultaneo di due eventi.
71
un dato sistema di riferimento, si deve adottare la grandezza l
come lunghezza del corpo nella (3.5), e non Z0.
È estremamente inopportuno parlare di « contrazione di Lorentz »
alludendo alla formula (3.5), sebbene lo stesso G. A. Lorentz abbia
per primo suggerito questa formula nel 1892. Comunque, è stata
interpretata (vedi Supplemento II) piuttosto diversamente da quan
to discusso precedentemente.
Fu Einstein a parlare chiaramente sulla realtà della contrazione
di Lorentz: « Non c ’ è da discutere se la contrazione di Lorentz è
reale o no. La contrazione non è reale, in quanto essa non esiste per
un osservatore che si muove con il corpo; comunque, essa è reale,
in quanto può essere provata in linea di principio con mezzi fisici
per un osservatore che non si muove con il corpo».
Spesso si solleva un’ altra questione: qual è la lunghezza «ef
fettiva » del righello?^ Il problema sulla lunghezza del righello indi
pendentemente dal sistema di riferimento è priva di senso. Il
righello ha la sua lunghezza) in ciascun riferimento; questa è la sua
lunghezza «effettiva». Tutti i riferimenti inerziali sono equivalenti
ed equivalenti sono i valori di lunghezza determinati in questi rife
rimenti. In ogni riferimento il righello si comporta come se avesse
la lunghezza determinata in questo riferimento. Sebbene tutti i
SRI sono equivalenti fra di loro, c ’ è ancora un sistema di coordina
te «selezionato» abituale, che è proprio quello in cui il righello è
a riposo. Dal punto di vista dei nostri concetti abituali questa è
proprio la lunghezza «effettiva» del righello; siamo pronti ad adot
tarla come lunghezza vera, ma quest’ultima definisce il comporta
mento dal righello soltanto in questo « proprio » sistema di riferi
mento.
Infine, l ’ultimo rilievo. Il righello esiste obiettivamente, cioè al
di fuori della nostra coscienza e di noi stessi. Ma c ’ è una lunghezza
prima che sia fatta la misura? Una lunghezza come un certo numero
è il risultato di misure e di una scelta di unità di misura. Natural
mente, il righello possiede un’estensione (lunghezza, se si vuole)
come qualità prima della misura, ma il valore numerico della lun
ghezza si origina solo dopo la misura. Allora, il valore numerico della
lunghezza dei corpi oggettivamente esistenti emerge solo dopo la
misura, e il risultato della misura, come abbiamo stabilito, dipende
dagli strumenti di quale riferimento usiamo.
Consideriamo righelli che hanno la stessa lunghezza propria
Z' e Z" (Z' = l'I) nei due riferimenti K ' e K ". Le misure condotte nel
riferimento K' danno
(3.6)
Le misure nel riferimento K" danno
(3.7)
Le disuguaglianze (3.6) e (3.7) non sono affatto contradditorie,
perché la (3.6) si è ottenuta per le scale e gli orologi del riferimento
72
K\ e la (3.7) per quelli del riferimento K " . La differenza nei valori
di lunghezza del righello è dovuta alla diversa definizione della
simultaneità nei due riferimenti. La difficoltà d ’ interpretazione
delle conclusioni della TRR non sta nell’ esistenza di grandezze re
lative, ma nella messa in luce dell’equivalenza di tutti i sistemi di
riferimento inerziali. Le disuguaglianze (3.6) e (3.7) indicano proprio
questa equivalenza.
Le conclusioni della TRR circa la relatività della lunghezza
di corpo in moto è in parte inusuale perché nella vita quotidiana
non percepiamo tale effetto. Consideriamo il moto più veloce che
si raggiunge, cioè quello orbitale della Terra. In questo caso V =
= 30 km/s. Il rapporto V/c~ IO-4 e l = Z0] / T — IO"8' » lQ(1 —
— -* 1 0 -8) ^ l q\.: Bisogna sottolineare ancora una volta che la con
trazione delle lunghezze è una conseguenza diretta della lim i
tatezza della velocità della luce. Se la velocità della luce fosse
infinita, la lunghezza del righello sarebbe la stessa in tutti i siste
mi di riferimento, in accordo con la formula (3.5). Si può vederlo
dal fatto che per co la simultaneità dell’ evento diventa asso
luta.
Sebbene fino ad ora abbiamo sempre discusso la relatività della
lunghezza dei corpi (righelli), bisogna tenere in mente che stiamo
trattando della relatività delle distanze tra due punti fissi in un
riferimento, quando vengono misurati con gli. strumenti di un al
tro riferimento.
Consideriamo un cubo in quiete nel riferimento K con i lati
Ax, Ay, Az e con volume proprio À fL = AxAyAz. Secondo le tra
sformazioni di Lorentz in un SRI arbitrario K ' abbiamo Ax' =
= ( 1 /T) Ax, Ay' = Ay, Az' — Az e, di conseguenza,
A T 9 ss Ax'Ay'Az' = ( 1 /T) AxAyAz = ( 1 /T) A T 0-
Quindi, il cambiamento del volume del cubo nel passaggio dal ri
riferii e determinato da
T '= T'oV 1— B2. (3.8)
Segue dai risultati ottenuti che il volume proprio di un corpo è
Rinvariante della trasformazione di Lorentz:
T 'd T ' = T "d T " = T 0-
d)
Wig, 3.3. Osservazione visuale di un cubo che sorpassa un osservatore: a) la
'rispettiva posizione dell’ osservatore e del cubo $ = 0; b) l ’ aspetto visibile del
cubo in moto; c) la possibile interpretazione dell’ aspetto visibile del cubo fatta
da un osservatore: la rotazione del cubo di un angolo cp = arcsin (3; d) l ’ osserva
zione del cubo in volo sotto un angolo ih
75
Bisogna dire, comunque, che una «rotazione del cubo» in moto a
velocità relativistica qualitativamente è stata fotografata. Riman
diamo il lettore interessato ai dottagli al [27].
In generale, un’ immagine « visibile » può differire in modo es
senziale per diversi osservatori. Un semplice esempio. Un osservato
re si trovi ad una certa distanza da un piano su cui s’ illuminano si
multaneamente nei riferimento, dove sono a riposo il piano e l ’ os
servatore, delle lampadine ovvero si produce il flash luminoso. Allo
ra, data la limitazione della velocità della luce, l ’ osservatore vedrà
K rk |1
1
o\ lo
—>■-----r*” or\i 1
ii x} x r
i]
i
i!
L i-
Lastra fotografica
76
Definiamo ora an intervallo di tempo tra gli eventi considerati
nel riferimento K . In accordo con la (3.2) At = TAt' = TAt0. Que-
sto risultato ci è già familiare (2 . 2 ).
Comunque, se gli eventi nel riferimento K' accadono in un punto
dello spazio, ciò non avviene in ogni altro riferimento K. Infatti,
supponiamo che due eventi avvengano nel riferimento K' ad istanti
diversi ma nello stesso punto, cioè Ax' = 0 ma Atr =^= 0. Dalla
(3.1) Ax = TV, At' =£. 0. Il significato dell’ultimo risultato è
ovvio: tutti i punti del riferimento IV si muovono rispetto a K
alla velocità F, e Ax è proprio lo spostamento di ogni punto nel
riferimento K ! nell’ intervallo considerato. Poiché T A f — TAt0 =
= At, segue che Ax — VAi.
Perciò gli intervalli di tempo fra la medesima coppia di eventi
si dimostrano diversi in differenti SRI. Osserveremo il minimo
intervallo temporale fra gli eventi nel sistema di riferimento in cui
gli eventi accadono nel medesimo punto e, di conseguenza, sono re
gistrati con lo stesso orologio, cioè l ’ intervallo di tempo proprio
è minimo.
Un intervallo di tempo tra gli eventi in termini del riferimento
K può essere misurato come segue. Il punto del riferimento K ' ,
in cui avvengono i due eventi considerati, si muove a velocità F
rispetto al riferimento K. Se gli eventi accadono nel riferimento K
nei punti x1 e x%, l ’ intervallo di tempo At tra gli eventi è, ovvia
mente, At — Ax/V. Ma secondo la (3.1) Ax — TV At' (Ax' = 0),
da cui si ha di nuovo
At —TAi0=
/ 1 -B 2
La conferma sperimentale diretta delle conclusioni della TPiR
riguardanti la relatività degli intervalli di tempo è ampiamente
conosciuta. Delle particelle leggere (muoni) furono scoperte, da
un lato, in un laboratorio come risultato della scissione dei nuclei,
dall’ altro, nei raggi cosmici. Il tempo di vita (dimezzamento)
dei muoni misurati in laboratorio risultò uguale a circa 2 -IO" 6 s.
Tale tempo di vita si può considerare come tempo di vita proprio, in
quanto le velocità dei muoni di laboratorio sono non relativistiche
(vedi la (3.9); con la velocità del sistema di coordinate K f si intende
la velocità del riferimento legato al muone). Nell 1intervallo At° =
= 2 »10 “6 s un muone si disintegra in altre particelle.
E noto che i muoni osservati.nei raggi cosmici alla superficie ter
restre si formano negli strati superiori dell’ atmosfera all’ altezza di
5-6 km. come conseguenza della radiazione cosmica primaria. La ve
locità con cui questi muoni raggiungono la Terra è confrontabile
con quella della luce. Secondo la (3.9) il tempo di dimezzamento
At di un muone nel riferimento del laboratorio è uguale a At =
~ TAt0. Per il muone F ~ 10 è nel sistema del laboratorio At =
— 2 «IO-5 s. In questo tempo un muone percorre una distanza e At =
= 3» IO10 X 2 -10 ~5 ^ 6 km. Se non esistesse l ’effetto di relatività de
77
gli intervalli di tempo, il mnone percorrerebbe soltanto 600 m, e
non rileveremmo i muoni al livello del mare. Allora, soltanto la
trasformazione relativistica degli intervalli di tempo può spiegare il
flusso dei mnoni osservabile sulla Terra.
Un esempio eccellente della relatività degli intervalli di tempo
è costituito dalTeffetto Doppler. Esso consiste nel fatto che una
sorgente di luce ed un osservatore (ricevitore) si muovono l ’uno
rispetto all’ altro \ la frequenza della luce determinata dall’ osserva
tore è diversa da quella che rileverebbe l ’ osservatore se fosse in
quiete rispetto alla sorgente. La frequenza della luce determinata
[K A/r
A U /f' \K.r
I
,1
—
O^VJ_ o
vr —H! xx1 I x x '
t= o t =T t=0 t=T
Sorgente Osservatore Sorgente Osservatore
a) à)
Fig. 3.5. Per la deduzione delle formule per l ’effetto Doppler longitudinale:
a) un osservatore si allontana dalla sorgente; b) un osservatore si avvicina alla
sorgente.
78
è uguale a c — V, perciò un raggio luminoso impiegherà un tempo-
aggiuntivo VTi(c — V) per raggiungere l ’ origine O' . Quindi, l ’ os
servatore in 0 riceverà l ’ impulso dopo un intervallo di tempo (regi
strato dall’ orologio in K)
(3.11).
r = ì T F 7'- n - j / j f l T « “ fi” «
79-
ottiene dalla (3/10). Non c'è niente da modificare nella (3.10)
in termini della teoria classica, visto che gli intervalli di tempo sono
g li stessi in tutti i sistemi di riferimento. La differenza fra l'equazio
ne classica e quella relativistica è essenziale a meno di B2. L'ulti
ma uguaglianza approssimata nella (3.12) dà proprio l ’espressione
classica ottenuta dalla (3.10). Visto che il rapporto B è determina
to dalla velocità relativa della sorgente e dell 1osservatore, esso è
molto piccolo almeno per sorgenti macroscopiche, e l ’effetto Doppler
è definito principalmente dalla variazione della distanza fra sor
gente e osservatore.
Comunque, c'è un caso di velocità nulla fra sorgente ed osserva
tore, anche se i riferimenti, in cui sono in quiete la sorgente e l ’ osser-
vatore, si muovono l'uno rispetto all’ altro. Questo accade quando la
sorgente in moto viene osservata quando la sua velocità è perpendi
colare alla direzione dell’ osservazione (linea di vista) (fig. 3.6, a).
A ll’ istante dell’ osservazione illustrato nella fig. 3.6, a la distanza
fra sorgente e osservatore non varia. Di conseguenza non c ’ è effetto
Doppler dal punto di vista classico. Ma in termini della teoria della
relatività il periodo d’ invio del segnale nel riferimento K' (denotia
molo con 71', questo è l'intervallo di tempo proprio, cosicché co0 =
= 2n/T'0) deve essere sincronizzato col tempo dell’ osservatore in ac
cordo con la formula (3.9), cioè T ----- T'J\/ t — B2, da cui ottenia
mo per l'effetto Doppler trasversale la formula
(D ^ fP F ^ o . (3.14)
Questa equazione è del secondo ordine rispetto a B. L ’effetto tra
sversale è 1più difficile da rilevare di quello longitudinale, ciò no
nostante esso fu osservato nel 1938. La sua scoperta, come si vede
dai ragionamenti precedenti, è una dimostrazione diretta della
relatività degli intervalli fra eventi. Bisogna sottolineare una volta
di più che l ’esistenza dell’effetto Doppler trasversale segue soltanto
dalla TR R . L ’ equazione dell’ effetto Doppler si può ricavare facilmen
te considerando la radiazione sotto l'angolo rispetto alla direzione
del moto della sorgente (fig. 3.6, b). Se il primo impulso è emesso
nel punto A e il secondo nel punto B , la differenza di cammino dei
raggi paralleli che viaggiano sotto un angolo d rispetto alla direzio
ne della velocità è uguale a VT cos ù. È chiaro da ciò che Tr =
= T — ----- ------ in termini dell’ osservatore e, di conseguenza, co' =
80
eventi in ogni altro riferimento può essere calcolato dalla (3.9). Nasce
il problema seguente: è sempre possibile convertire un intervallo
temporale misurato in un riferimento arbitrario in un intervallo
proprio? Si dimostra che ciò non è sempre possibile, e le condizio
ni, per le quali ciò è possibile, saranno date nel § 3.4.
Introduciamo ora il concetto di te m p o p r o p r io d i u n c o r p o . Sup
poniamo che il corpo sia. in moto rettilineo ed uniforme rispetto al
riferimento K. Il riferimento K' si può associare al corpo in moto;
esso è fermo in tale riferimento, cosi che gli eventi che accadono
81
inerziale K * che si muove a velocità V. In questo sistema di rife
rimento vale la relazione d r = ] / 1 — fì2d t. Questa equazione è
anche valida approssimativamente per una particella comovente
istantaneamente del riferimento K ' . Il riferimento K* differisce
da quello istantaneamente comovente K ' in quanto quest’ultimo,
K\ possiede un’ accelerazione, mentre il primo, K *, no sebbene
entrambi si muovono in un dato istante con la stessa velocità. Ma per
quanto più breve è l ’ intervallo d t, tanto più applicabile è la rela
zione d% = ] / 1 — (32 d t per il riferimento K ' . Integrata questa espres
sione, otteniamo l ’espressione precisa per t , che è in effetti il
tempo « proprio » risultante di un sistema di coordinate K*.
Partendo da questi ragionamenti riterremo che se 1 intervallo
di tempo fra eventi, accaduti con il corpo, e misurato da un orologio
fisso al riferimento comovente con il corpo risulta uguale a dir, allo
ra P intervallo -diM m p ó d t fra gli stessi eventi, misurato dall’ orologio
di un altro SRI rispetto al quale il corpo si muove, vale, secondo la
(3-9),
dt == yd X j
dove
: ^ )= 7 != F ’ P= U <3-15>
ora v = v (t) è la velocità del corpo (e non del riferimento); data
la circostanza sono state introdotte le notazioni p e 7 . Quando la
velocità del corpo varia seguendo la dipendenza v = v (£), la relazio
ne tra l ’ intervallo di tempo finito r e quello registrato dall’ orologio
del riferimento rispetto a cui il corpo è in moto, si ottiene per inte
grazione
T - T 0= j ] / 1 - ( ù r ) 2 ^ - (3-16>
K
Cos’ è la grandezza che si vede al primo membro della (3.16) ?
La si può chiamare, naturalmente, tempo proprio del corpo. Ma
come si misura? A rigore, la relazione (3.9) è valida per gli orologi
in un sistema di riferimento inerziale, ma sei l ’ orologio è fissato
ad un corpo in moto arbitrario, esso subirà delle accelerazioni. Sen
za dubbi un’ accelerazione influenza il ritmo dell’ orologio (in grado
diverso a seconda della costruzione dell’ orologio; se non ci credi,
fai cadere il tuo orologio sul pavimento). Di conseguenza, è difficile
parlare di lettura di tempo fatta mediante questi orologi. Una ragio
nevole interpretazione della formula (3.16) sta nel fatto che t — Tq.
è l ’ intervallo di tempo risultante misurato in molti riferimenti iner
ziali comoventi con il corpo 0 , il che è lo stesso, il tempo registrato
da un orologio fissato rigidamente al corpo e n o n a ffetto p e r n u lla da
u n a c celera zio n e d el co r p o .
Bisogna sottolineare che le differenze di letture degli orologi
di diversi sistemi di riferimento inerziali che abbiamo ottenuto non
82
hanno relazione con qualsiasi irregolarità del ritmo degli orologi in
uno o nell’ altro riferimento. Come nel caso di variazione di lunghez
za del righello, noi ci imbattiamo qui in differenti metodi di misura
del tempo. Tutti gli orologi in tutti i sistemi di riferimento cam
minano in modo idealmente esatto. Le misure di intervalli di tempo
tra due eventi condotte mediante due insiemi di orologi di diversi
riferimenti, sincronizzati all’ interno dei rispettivi riferimenti, por
tano ai risultati ottenuti: l ’ intervallo di tempo proprio tra due eventi
si dimostra sempre il minore.
Consideriamo un esempio (piuttosto simile a quello discusso in
rapporto alla variazione della scala delle lunghezze) che mostra
come il rallentarsi del tempo sia causato dai differenti metodi di
confronto. Prendiamo due orologi identici: A nel riferimento K
e A ' in K' (possono essere atomi della stessa specie). Osserviamo
l ’ orologio A ' nel riferimento K\ cioè confrontiamo l ’ orologio A
con l ’ insieme di orologi sincronizzati con A'. Allora gli osservatori
di K ' scopriranno che l ’ orologio A va più lentamente rispetto all’ in
sieme di orologi del riferimento K ' . Al contrario, gli osservatori
del riferimento K che vedono un orologio A ' del riferimento K ’
scopriranno che esso va più lentamente dell’ insieme di orologi di K.
Sono contradditori questi risultati? No. Si vede chiaramente che i
metodi di confronto dell’ orologio nel primo e nel secondo caso sono
differenti. L ’ orologio che viene confrontato con gli altri orologi di
un altro sistema ritarda sempre. Questa stupefacente situazione si
dimostra inevitabile. L ’equivalenza di tutti i SRI è alla base della
teoria della relatività, e quando emerge un valore relativo, emerge
nello stesso modo in tutti i SRI.
83
distanze spaziali e temporali tra gli eventi:
lt\= (A x)* + (A y )* + {Az)\ Ai = tl2. (3.18)
Dopo aver scritto il quadrato deir intervallo fra due eventi nel
riferimento K come s22 = cH\2 — Z22 e nel riferimento K ' come
s'2 = c2Z'2 — Z'|, otteniamo la condizione per l ’ invarianza del-
V intervallo s'2 = s22 nella forma
= (3.19)
gli eventi in un riferimento arbitrario K , si scopri-
C o n s id e r a n d o
rà probabilmente che essi avvengono in punti diversi dello spazio
© a diversi istanti di tempo.
È possibile mediante la scelta del sistema di riferimento K '
assicurarsi che: a) gli eventi I e II avvengano allo stesso punto
dello spazio; b) gli eventi I e II avvengano nello stesso istante e,
infine, c) gli eventi I e II avvengano in un punto dello spazio e
nello stesso istante? Cominciamo dall1inizio.
a) E possibile scegliere un sistema K \ in cui questi eventi av
vengano allo stesso punto dello spazio, cioè abbiano la medesima
posizione? Questo significa che in K r deve essere l[2 = 0. Ma allora
dalla (3.19) segue che
= = (3.20)
cioè > 0 e l ’ intervallo s12 deve essere reale. Nel riferimento K*
gli eventi considerati avvengono in un punto dello spazio e T inter
vallo di tempo tra di essi è uguale, a meno del fattore a, a
V = | l = (3-21)
Per questo gli intervalli reali fra gli eventi vengono detti intervalli
del genere tempo. La condizione per un intervallo del genere tempo
si può scrivere nella forma Z12 <C c£ia.
Consideriamo il moto di una particella dotata di massa a riposo
(la meccanica convenzionale tratta solamente oggetti di questo tipo).
Supponiamo per semplicità che la particella si muova uniformemente
lungo Passe x, coprendo la distanza A x'nel tempo At. Nel riferimen
to K f questa particella percorrerà la distanza Ax' nel tempo AV
che viene determinato in accordo con le (3.1) e (3.2). Il rapporto
ÀT
— = v è la velocità della particella nel riferimento K . Tenendo con
to di ciò, riscriviamo le (3.1) e (3.2):
A x' = T x— VAt) —r
(A (4f-y)
A t’ = T { A t - ^ (A
Tl —
x)= ) ( l - ^ ) Af.
«4
stessa posizione. Dal fecondo membro della formula otteniamo im
mediatamente la risposta evidente V ~ v. È proprio il riferimento
comovente con la particella. Dalla (3.23) segue un’ altra importante
conseguenza. Sia Ai — t2 — ix > 0. Questo implica che revento II
avviene dopo Tevento I. C’ è un riferimento K' in cui Atf <C 0,
cioè la sequenza temporale degli eventi è invertita rispetto al riferi
mento K? La (3.23) mostra che il segno di At' coincide cori quello
di At quando ^1 — > 0. Ma questa condizione è sempre soddi
sfatta visto che la velocità v del corpo è sempre minore di c. (Il siste
ma di riferimento è anch’esso un corpo materiale.) La stessa condi
zione è soddisfatta anche per ogni coppia di eventi legata da un
intervallo del genere tempo. Infatti il terzo passaggio della (3.23)
77 \
^
(1 -----T'T a ì J * Secondo
A x, e se ct12 >> Z12, cAt >> Ax a fortiori.
la (3.18),
Questo implica che il
Z12 ^
85
unto l ’evento I a quello dell’evento II nell’ intervallo di tempo tra i
due eventi. Senza pretesa di generalità nell’ impostazione del proble
ma assumeremo che un evento possa influenzare un altro solamente
mediante interazione fisica (di forza). Quindi, se l ’evento I ha avuto
luogo, un « segnale » di ciò può raggiungere il punto in cui accadrà
l ’evento II prima del verificarsi dell’evento II. Questo significa che
l ’evento I può essere la causa dell’evento i l, e l ’evento II può essere
l ’ effetto dell’evento I. In questo caso i due eventi sono legati da una
relazione causa-effetto. Dunque, gli eventi separati da un intervallo
del genere tempo possono avere una relazione causa-effetto in termini
fisici. È ovvio che essi possono non essere in una tale relazione. Si
tratta della possibilità di principio. È essenziale che in questi inter
valli la sequenza temporale non può essere invertita: l ’effetto non
può influenzare la sua causa.
b)
miniamo ancora le condizioni d ’ invarianza dell’ intervallo (3.19)
e determiniamo se si può trovare un sistema di coordinate K r in
cui gli eventi I e II in esame accadono simultaneamente. Ciò signifi
ca che in questo sistema t'12 = 0.
Quindi s[2 = —l C 0. Il quadrato dell’ intervallo tra gli eventi
deve essere negativo, e l ’ intervallo risulta immaginario. Nel riferi
mento K' gli eventi in questione accadono allo stesso istante, e l ’ in
tervallo tra di essi si riduce (a meno del numero i) ad un intervallo
spaziale Z'2 = is12. Perciò gli intervalli immaginari sono detti inter
valli del genere spazio. La condizione di un intervallo del genere
spazio può essere scritta nella forma Z12 > ct12.
Si può trovare un sistema di riferimento in cui At' = 0 per due
eventi dati? Assumendo At' = 0, otteniamo dalla (3.2)
v = cSt - <3-24>
Visto che si può sempre scegliere gli eventi in modo che Z12 = Ax,
segue dalla condizione di un intervallo del genere spazio che in
questo caso A x ^ > c -A t . La (3.24) mostra che possiamo ottenere
V < c, cioè in linea di principio un tale riferimento si può scegliere.
Il rapporto Ax/c-At appare nel terzo passaggio dell’uguaglianza
(3.23); come abbiamo rilevato, esso può essere maggiore dell’ unità.
y ^ oc \
( 1 — — J può essere reso negati-
vo con una scelta appropriata di V.
Ne segue che la sequenza temporale di due eventi legati da un
iniervallo del genere spazio può essere invertita in seguito al passag
gio da un SRI ad un altro. Ciò non si applica agli eventi che possono
essere legati da una relazione causa-effetto. Ma in termini fisici essi
non possono essere in tale relazione. Infatti, la condizione l\2 > cHl2
indica che nell’ intervallo di tempo tra i due eventi nessun « segnale »
si può trasmettere dal punto dove è accaduto l ’evento I a quello in
cui accadrà l ’ evento II. Di conseguenza, eventi separati da un inter
vallo del genere spazio non possono avere relazione causa-effetto.
86
Allora, la teoria della relatività ristretta è in grado di indicare le
condizioni secondo cui è possibile o meno una relazione causa-effetto.
E un criterio molto importante che non può essere ricavato in forma
generale da altre premesse. Bisogna sottolineare una volta di più,
che tutti i nostri ragionamenti sono basati sulla velocità finita dei
segnali trasmessi.
c)
siano o simultanei, o nello stesso punto, cioè siano soddisfatte le due
condizioni t'12 = 0 e Z'2 = 0, sarebbe necessaria una verifica contem
poranea delle due disuguaglianze s12 ^ 0 e s'12 ^ 0. Questo è possibi
le soltanto se s12 = 0 e s '2 = 0. Se i due eventi in questione non rap
presentano rin vio e la ricezione di segnali luminosi, gli intervalli
possono essere uguali a zero solo nel caso in cui i due eventi coincido
no in ognuno dei riferimenti K e K ' . Ovviamente la coincidenza
degli eventi non dipende dalla scelta del sistema di riferimento.
L ’intervallo fra due eventi che accadono in un dato riferimento
in punti diversi e in istanti diversi, uguale nel valore assoluto a ze
ro, è conveniente chiamarlo intervallo del genere luce. Un intervallo
del genere luce lega eventi che consistono nel passaggio consecutivo
di un’ onda di luce per vari punti dello spazio. Ci siamo assicurati
di ciò all’ inizio del § 2.6.
87
assumer© come variabile indipendente. Quando t varia di dt, tutte
le variabili subiscono un incremento; differenziando le trasformazioni
di Lorentz (vedi la (2.16)), otteniamo in termini di differenziali
dx = F (dxf -j- V di’ ), dy — dy\
dz=
dz dzr
i / “ ZI
e2
(3.26)
88
relativistici nella vita quotidiana. Ci siamo convinti di nuovo che
la differenza tra i concetti classici e quelli relativistici è legata alla
limitatezza della velocità della luce. Notiamo che le formule (3.26)
e (3.27) si ottengono, naturalmente, in base a un approccio quadridi
mensionale alla teoria della relatività.
Consideriamo il moto lungo l ’ asse x ' . In questo caso le componenti
della velocità nel riferimento K f saranno vrx = v’\ vv = 0, v'z = 0.
Dalle (3.26) si vede che nel riferimento K le componenti vy e v z
sono uguali a zero. Di conseguenza, nel riferimento K il moto avviene
lungo l ’ asse x e vx = v. Perciò, secondo la (3.26),
v '+ V
v V ® (3.28)
l+ i » ’
<3-29>
89'
si ha
v '+ V
V , „, v , / V \2 •
1 d------
1+ - ^ y cn L- [ ™ )
Trascurando la grandezza (V/cn)2 a denominatore la cui piccolezza
è dovuta alla velocità non relativistica dell’ acqua ((Vic)2 <C 1),
otteniamo
-V
Nell’ espressione (3.30) nella stessa approssimazione trascuriamo il
termine T/2/c2 ed otteniamo il risultato di Fizeau (3.29). Quindi la
90
velocità di un corpo materiale (cioè con massa a riposo) è sempre
minore di c e non raggiunge mai tale valore. Ma questo è valido
in un.dato SRI. È possibile scegliere un SRI tale che in esso la velo
cità di un corpo sia maggiore di c?
Se dalla .meccanica classica seguisse che in un dato SRI la veloci
tà di un corpo non supera mai la velocità c, si potrebbe ottenere una
velocità maggiore di c mediante la scelta di un riferimento appro
priato. Infatti secondo la formula (1.4) v = v + V, dove v è la
velocità del corpo rispetto al riferimento K' e V è la velocità relativa
dei riferimenti K e K ' . Se le velocità v* e V superano 0,5c, la veloci
tà v del corpo nel riferimento K sarà più grande di c.
Ma nella TR R le trasformazioni delle velocità si ottengono in
modo diverso. Si vede dalle (3.26) e (3.27) che le velocità delle parti-
celle non si sommano secondo la regola della composizione dei
vettori. Pertanto, la somma delle velocità nella TR R obbedisce
all’ incredibile regola c + c = c.
Segue dalle formule (3.26) e (3.27) che se le velocità della particel
la è minore di c nel riferimento K {vie <C 1), la velocità della parti-
cella determinata nel sistema K ' è sempre minore di c. La dimostra
zione più semplice di questa affermazione per il caso del moto unidi
mensionale si ricava per mezzo della formula (3.28). Avendo formato
l ’espressione (vie — 1), scriviamo la seguente catena di uguaglianze:
v' Vv'
c T + T -1 c
^ -i
c A 1 Vvf
1 c2 h - £
V'
c
<0. (3.31)
Vv'
i+
91
a W. Se introduciamo le notazioni B1 = e ,B2 = W/c e, corri
spondentemente, 1/Tj =
a-= r s
x' = T2 (x" + W
f),t' = + (3.33)
modo si ottiene
r 4r 2 (i + B tB 2) = — 1 — =
■ A (1 — Bf) (1— B|)
V (1 + B jB ^
1
l + BfB| + 2B1Ba- ( B ? + B I + 2 B 1Ba)
] / (i+ B A P
1
A / B. + B, \2 lV/* l -c»O l
V [ H B A j
Quindi dalle (3.34) e (3.35) si ottiene
T -- x" +1 U t " t— c
!
S>|"«
1
92
a A ' e quindi da A ' a A" costituisce una rotazione consecutiva nel
piano (x, t) degli angoli <pv e <p2 con tg cpx = iB1 e tg cp2 = iB 2.
La tangente dell5angolo risultante si può trovare mediante la
formula convenzionale per la tangente della somma di due angoli
(q> = q>! + cp2):
tg <Pi + tg cpa
tgcp
l~ tg c p r t g <p2
ó ;'
,"15 _ iB2
i + B.B, ’
che è proprio la formula (3.36) con B, Bx e B 2 rimpiazzati dai loro
valori. Le due ultime espressioni mostrano che l ’ insieme delle
trasformazioni di Lorentz possiede la proprietà fondamentale di un
gruppo (dal punto di vista della teoria dei gruppi): due trasformazio
ni di Lorentz successive producono ancora una trasformazione di
Lorentz (è essenziale in questo caso che la velocità relativa è sempre
diretta lungo Tasse x).
Riportiamo Tinterpretazione utile della formula (3.28). Nel
§ 2.7 abbiamo introdotto il parametro # associato alla velocità
relativa dei sistemi di riferimento mediante la relazione B = —th d.
Possiamo introdurre anche il parametro di velocità di una particella
P = —th d. Allora la (3.28) prende la forma seguente:
th 0' + th f l _
(3 = th 0 - t h (0' + #); (3.37)
1+P'B 1+ th O' -th u ~~
Tultimo passaggio dell’equazione è scritto in accordo con le equa
zioni dell5Appendice I, § 9. Questo è un risultato interessante.
Nella teoria classica, sono le velocità (2.4) che si sommano, mentre
nella teoria relativistica sono i parametri di velocità; quest’ultimo
aspetto verrà usato nel § 5.7.
93
tà v e l ’ asse x nel riferimento K, di conseguenza vx = v cos ft, vy =
= v sin ft. Troviamo le formule che legano v e ft a v' e ft'. Avendo*
espresso le componenti v'x e in termini di v' e ft', riscriviamo le
prime due formule della (3.26) nella forma seguente:
v' c o s t ì ' + 7
v cos ft =
= 1 + »> y B ’
(3.39)
(3.40)
Segue dalle formule (3.39) e (3.40) che l ’ angolo d’ inclinazione della
velocità rispetto al corrispondente asse x (ricordiamo che gli assi x
e x coincidono), e il valore assoluto della velocità cambiano nel
passaggio dal riferimento K ' a K (fig. 3.8, a). Naturalmente, lo
stesso avviene in meccanica classica, anche se descritto da altre
equazioni.
Ora deriviamo un’utile formula dalla (3.40). Ci servirà nel capi
tolo V II. Usando la prima uguaglianza della (3.40), formiamo
l ’ espressione seguente:
/ d'V V2v'2
( l “)— cosft' J — v'2— C2— 2 y '7 co sft'ft — sin2 ft'
c2 ( i - r f t ^ 003^ ') 2
(1 -g -) (1 -g .) ,
c2 ( 1+ 4 ^ COS’&' ) 2 ( l + - ^ - COSQ'Y
Di conseguenza
V2
/ ‘-ìr -V *-
/ ‘ ~S~ a , u'v a,
IH— — cos ft
(3.41)
94
0
Y 1— P'2 / l — Ba
V i — P2= (3.42)
1 + P'B cos fP
v2 = c2 -
(*--£) (--so (3.43)
(‘+^r
da cui segue immediatamente che se v i e e Vie sono minori di uno,
anche v *< c. Per il caso particolare, quando la velocità veniva deter
minata dalla (3.28), lo stesso teorema è stato dimostrato in preceden
za. La formula (3.43) si può ottenere, naturalmente, elevando al
quadrato e sommando entrambi i membri della (3.26).
Fig. 3.8. a) Una particella si muove nel piano {x\ y') del riferimento K '. L’angolo-
d’inclinazione della sua velocità rispetto all’ asse x' è Ù', con tg ù ' — Vylvx. Nel
riferimento K le componenti vy e vx variano secondo la (3.26), da cui è chiaro
che l ’ angolo O non è più uguale a il' (vedi anche la (3.39)). Per il caso illustrato
nella figura, tK > ù. b) La luce si propaga nel riferimento K' lungo l ’asse y\
cioè lungo la perpendicolare al moto del riferimento. È evidente che vx = 0,
v'y = c, = ni2. Nel riferimento K, secondo la (3.26), vx = V, vy —
— c )/* 1 — B2, da cui tg ù = Y 1 — B2/B. L ’ angolo di aberrazione è formato
dalla direzione apparente della luce in arrivo nel riferimento if e la direzione
delia luce nel riferimento K ', l’ angolo formato con l ’asse y. L’angolo di aberra
zione è a = jt/2 — iL
93
conto di ciò, otteniamo dalle (3.39) e (3.38), rispettivamente
Y 1 62
—
(3.44)
t g '&= 7“ sin d ' $
B + cos d
V 1—B2 cos d ' + B
(3.45)
sin d — —s in d ', cos d = 1 + B~cosìF~ °
1 + B cos d
L ’ equazione (3.45) descrive Vaberrazione della luce che avviene
quando il fronte d’ onda dell’ onda luminosa cambia la sua direzione
nel passaggio da un SRI ad un altro. Supponiamo che la luce nel
riferimento K f si propaghi lungo la perpendicolare alla direzione di
moto, per esempio, lungo l ’ asse y' (fig. 3.8, b)\ questo significa che
d ' — ji/ 2. Quindi, secondo la (3.44), tg d = ]/" 1 — B2/B.
È conveniente chiamare angolo di aberrazione l ’ angolo formato
dalle direzioni visibili del raggio nei due SRL Nel riferimento K r
la luce si propaga lungo l ’ asse z/', mentre nel riferimento K sotto un
angolo a = jt/2 — d rispetto all’ asse y. Ovviamente l ’ angolo a
è l ’ angolo di aberrazione e
B
tg oc = tg — ft) = cotg ft
Y i —B2 ‘
Il calcolo dell’ angolo di aberrazione a secondo le trasformazioni
di Galileo (fate da soli il calcolo!) fornisce tg a,. = B. Questo signifi
ca che la formula relativistica differisce da quella non relativistica
per un termine dell’ ordine di B3.
Si possono facilmente ottenere le equazioni per l ’ angolo di aber
razione nel caso in cui la luce cade sotto un angolo arbitrario rispetto
alla direzione di moto. Assumeremo che B < i. Quindi, in accordo
con la (3.45),
sind — — ^ B 2+ .. BJ (1 —Boos'd'4 - . . . ) sind'.
96
Per concludere, calcoliamo la velocità relativa di due particelle.
È naturale determinarla come la velocità di. una di esse nel riferi
mento K in cui un’ altra è a riposo. Siano -o[ e v'2 le velocità delle
particelle nel riferimento K '. Scegliamo il riferimento K in modo die
V = — Le velocità delle particelle si determinano immediata
mente dalla (3.40). Il valore assoluto della velocità v2 è uguale a
zero, mentre quello della prima particella è
(3.47)
97
che l ’ intervallo fra gli impulsi in arrivo sarà differente, nonostante?
il fatto che l ’ orologio fissato a] radar e quello dell’ osservatore in K r
vadano nello stesso modo.
Per semplicità non parleremo di radar e ricevitore, ma di due
osservatori A e A ' a riposo rispettivamente in K e K ' . Quindi, se-
l ’ osservatore A invia segnali luminosi separati, secondo il suo orolo
gio, dall’ intervallo 7\ l ’ osservatore A ' li riceverà (secondo il suo
orologio) separati da un diverso intervallo di tempo. Designane
questo intervallo con k T . In questo modo appare il coefficiente /q.
la grandezza chiave del metodo in questione.
Sottolineiamo che T e kT sono intervalli temporali tra l ’ invio
del primo e del secondo segnale da parte dell’ osservatore A e la
ricezione di questi segnali dall’ osservatore A ', misurati mediante-
gli orologi che sono a riposo, rispettivamente, in K e K ' .
Partendo dalle proprietà principali dello spazio e del tempo,,
l ’uniformità e l ’ isotropia, si può assumere che il coefficiente k non
dipende né dalla posizione del ricevitore e della sorgente né dal
tempo d ’ invio e di ricezione del segnale, né dalla direzione in cui
s’ invia il segnale (in altre parole, si può scegliere arbitrariamente la
direzione dell’ asse comune x, x nello spazio). Certamente, questa
coefficiente non dipende dall’ intervallo tra l ’ invio dei segnali. Esso
può dipendere soltanto dalla velocità relativa degli osservatori A
e A'. Infatti, come mostra l ’ esperienza, la variazione della frequenza
della luce nell’effetto Doppler dipende soltanto dalla velocità del
moto relativo.
E evidente la ragione della comparsa del coefficiente k. Sup
poniamo che l ’ osservatore A si trovi all’ origine del sistema K ed
invii dei segnali luminosi all’ osservatore A ' posto all’ origine del
riferimento K ' . Il riferimento K' si allontana da K verso destra.
Supponiamo che il primo segnale venga inviato all’ istante t. È facile
allora stabilire l ’ istante iq, secondo l ’ orologio dell’ osservatore A r
in cui l ’ osservatore A ' riceve il segnale. Infatti, il segnale che sì
propaga a velocità c deve percorrere nel tempo iq, in primo luogo, la
distanza Vt che separava gli osservatori A e A ' all’ istante t. e*
secondo, la distanza V%1 che è percorsa dall’ osservatore A ' nel tem-
y
98
Finora abbiamo fatto uso soltanto dell’ uniformità e dell’isotropia
del tempo e dello spazio. Ora useremo la costanza della velocità della
luce nel vuoto in tutti i SRI. Useremo spesso questa proprietà della
luce. La condizione si può formulare come segue: « la luce non può
sorpassare la luce ». Ora passiamo al problema che utilizza esplicita
mente l ’ equivalenza di tutti gli osservatori inerziali (cioè il primo
postulato di Einstein).
Siamo d ’ accordo che i segnali inviati dall’ osservatore A con un
intervallo di tempo T saranno ricevuti dall’ osservatore A ' (secondo
il suo orologio) con un intervallo kT . Data l ’ equivalenza degli osser
vatori dobbiamo supporre che i segnali inviati dall’ osservatore A'
con un intervallo T saranno ricevuti da A ad intervalli kT (principio
di relatività per gli osservatori inerziali A e A').
È importante rilevare che questo assunto è basato fortemente
sul fatto che il vuoto non contiene alcun mezzo in cui si propaga la
luce. Se un tale mezzo dovesse esistere, il coefficiente k dovrebbe
dipendere dalla velocità degli osservatori A e A ' rispetto a questo
mezzo. Fu proprio questo mezzo (etere) ad agitare più di tutto le
menti dei fisici del X IX secolo; esso causò una serie di situazioni
drammatiche che precedettero la scoperta della TRR (vedi Supple
mento II). Al presente è ragionevole adottare il punto di vista con
temporaneo.
Ora troveremo l ’espressione esplicita del coefficiente k in termini
del moto relativo. In questo procedimento non serve altro che alcuni
esperimenti ideali sull’ invio, la ricezione e la riflessione dei segnali
luminosi. La riflessione può essere trattata, se è necessario, come
l ’ invio dei segnali da parte dell’ « osservatore » nella direzione oppo
sta nell’ istante in cui riceve il segnale diretto.
Supponiamo d ’ inviare il primo segnale dall’ osservatore A a quel
lo A r nell’ islante in cui i riferimenti K e K' coincidono. Gli osserva
tori A e A ', ognuno dei quali si trova nell’ origine del proprio
riferimento, a quell’ istante si trovano nello stesso punto dello spazio.
Naturalmente, la trasmissione del segnale da A a A ' e del se
gnale opposto da A ' ad A non richiede alcun tempo. Dopo l ’ interval
lo di tempo T secondo il suo orologio l ’ osservatore A invia un segnale
di luce all’ osservatore A ' che lo riceverà con un intervallo kT dopo
il ricevimento del primo. Supponiamo che A ' mandi indietro ad A
un segnale istantaneamente con la ricezione del secondo segnale
(come una riflessione speculare). I due segnali sono separati dall’ in
tervallo kT secondo l ’ orologio di A '. Quindi, il segnale di ritorno
sarà inviato da A ' ad A dopo questo intervallo. Ma l ’ osservatore A
non lo riceverà dopo l ’ intervallo k T ; questo intervallo sarà aumenta
to di k volte e diventerà uguale a k2T. Quindi, secondo l ’ orologio
di A il secondo segnale opposto sarà ricevuto all’ istante k2T. Di
conseguenza, dal punto di vista dell’ osservatore A l ’ intero percorso
del secondo segnale (inviato all’ istante T) verso l ’ osservatore A ' e
indietro era uguale a k2T — T = (k2 — 1) T. Poiché la velocità
della luce è la stessa nelle due direzioni, il tempo di propagazione
99
da A ad A f (o indietro) è uguale a ~ (k2 — 1) T. Da ciò segue che
la determinazione della distanza mediante un radar tra A e A
(al momento della riflessione) fornisce il valore y (kr — 1 ) Tc.
Così abbiamo trovato la distanza fra gli osservatori A e A f
all’istante in cui si riflette il segnale. Ma a che istante avviene la
riflessione secondo l ’ orologio di A? È da notare che parliamo di
orologio posto vicino all’ osservatore A , mentre l ’ evento (la rifles
sione del segnale nel punto in cui si trova A ') viene considerato nel
punto lontano da A . In questo caso non possiamo misurare diretta
mente il tempo dell’ avvenire dell’evento, ma dobbiamo assegnare
ad esso un determinato istante di tempo.
Il secondo segnale viene inviato all’ istante T ed è ricevuto di
nuovo all’ istante k2T . Quindi, l ’ istante della riflessione verrà deter
minato come ~ ( T + k2T) = y (k2 + 1) TV Di conseguenza, du
(A:2— 1) Tc V — 1
V = —__________ (3.48)
P+ l
± ( k * + i)T ’
Ne segue perciò 1
* = }/■ i ± | . (3.49)
100:
In questo piano il moto uniforme è rappresentato da una retta.
La propagazione di un raggio luminoso a velocità c è rappresentata da
una bisettrice (l’ equazione x — x) che passa nei quadranti I e III,
se la luce si propaga nella direzione delle x positive, e nei quadranti
II e IY se la luce viaggia in direzione opposta. Poiché la velocità
di un corpo è sempre minore di quella della luce, il moto uniforme
di ogni corpo è rappresentato da
una retta che forma un angolo
minore di jt/4 con l ’ asse x.
È facile trovare i punti del
piano che illustrano il moto degli
osservatori A e A'. Nel riferimen
to K (che è mostrato nella fig. 3.9)
A è a riposo (supponiamo che sia
posto nel punto x — 0). Quindi
la sua «linea d ’universo », cioè la
successione dei punti nel piano
(x, t) corrispondenti agli eventi
che consistono nell’ essere in un
certo istante in un dato punto,
sarà semplicemente l ’ asse delle
ordinate. Dunque, l ’ asse delle
ordinate è la linea dell’universo
dell’ osservatore A. La linea del
l ’universo dell’ osservatore A f nel Fig* 3.9. Illustrazione grafica per la
riferimento K è una retta incli determinazione della velocità relativa
nata rispetto all’ asse x di un dei due osservatori.
angolo oc, la cui tangente è de
terminata dal rapporto tg a = x!% = xict — vie). Se all’ istante
t = 0 gli osservatori A e A ' si trovano in un punto, la linea
d’universo dell’ osservatore A ' passa per l ’ origine 0. L ’ invio e la
ricezione dei segnali luminosi da parte di A è illustrata dal
diagramma (x, x) come segue. Il primo « scambio » di segnali avviene
nel punto O. Quindi, dopo l ’ intervallo T (nel punto d’universo Aj)^
l’ osservatore A invia un segnale luminoso. La sua propagazione è
descritta dalla retta A XA [ parallela alla bisettrice. L ’ osservatore A r
riceverà il segnale luminoso nel punto d’universo A[. Il propagarsi
del segnale inviato da A ! nella direzione opposta è descritto dalla
retta A ' A 2- (parallela alla bisettrice dei quadranti II e IV che non
è rappresentata nella fig. 3.9). L ’ osservatore A riceverà il segnale
opposto nel punto d’ universo A 2. Secondo la condizione OA1 = T 1
e la definizione del coefficiente k, OA 2 = k2T . Nel riferimento K il
punto A[ è associato all’ istante A 3 (secondo l ’ orologio posto in
x = 0, cioè all’ osservatore A). Ovviamente, OAd = 1/2 {OA1 - f
+ OA2) -= 1/2 (,k2 + 1) T. Il tempo di propagazione del secondo
102
Graficamente questo risultato viene ottenuto nella fig. 3.10.
Vi sono tracciate le linee d ’universo dei tre osservatori A , A ' e A
T utti gli osservatori erano allo stesso punto 0 nell’ istante t = 0.
Dopo un intervallo T, l ’ osservatore A invia dal punto di universo A x
un segnale luminoso la cui linea
d’universo è rappresentata da una
retta tratteggiata T^A'T". Dalla
condizione OA± = T e dalla defi
nizione O A [ = k (.A , A ') T, O A "=
= k (.A , T ") 71. D ’ altro canto,
■evidentemente, OA"± = fc (T\
T ") ( A , T ') 21. È da notare che
il diagramma proposto è adatto
soltanto per una descrizione gra
fica degli « esperimenti ideali »,
ma non si può usare per una de
terminazione geometrica delle
varie grandezze. Il piano (x, r)
mon è un piano euclideo conven
zionale (vedi capitolo IV). Co
munque, combinando una descri
zione geometrica grafica con le
determinazioni algebriche, non si Fig. 3.10. Per la deduzione della
■dovrebbero fare errori. formula (3.51).
È facile trovare la formula eli
trasformazione delle velocità dei
sistemi di coordinate. Supponiamo di voler trovare la velocità rela
tiva U dei riferimenti K e K ", supponendo note la velocità V dei
riferimenti K e K' e quella W dei riferimenti K ' e K ”.
Introducendo le notazioni familiari Vie = B tl e Wlc — B 2, otte
niamo, in accordo con le (3.48), (3.49) e (3.51),
U __ k * - ì _ k*(A, A')-k*(A', A") — ì _ B1+ B2
c “ /c3+ 1 k*{A, V )-/c 2 ( t ', A") + ì ì Jr B 1B2 '
Passando alle notazioni convenzionali, otteniamo la formula
-di trasformazione delle velocità (3.28):
ì+ V
^•
Si vede dai ragionamenti citati che gli istanti in cui avvengono
gli eventi e gli intervalli tra di essi risultano diversi per osservatori
•di diversi SRI. Per metterlo in luce, ritorniamo all’esperimento ana
lizzato prima che prevedeva lo scambio di segnali luminosi tra gli
osservatori A ed A '. Ricordiamo che il primo « scambio » avviene
all’ istante in cui gli osservatori si trovavano nello stesso punto.
Proprio in quel momento gli orologi di A c A ' sono regolati a segna
re zero. Quindi dopo l ’ intervallo T del proprio orologio A invia un
segnale verso A '; per definizione, l ’ intervallo di tempo che separa la
ricezione del primo e del secondo segnale da parte di A ' è uguale
103
a kT secondo il proprio orologio. Comunque, l ’ osservatore A as
segnerà all’ arrivo del segnale verso A ' il tempo 1/2 (k2 + 1) T
e assumerà che i segnali inviati da lui con un intervallo T raggiunge
ranno A 1 con un intervallo 1/2 (k 2 + 1) T. Come già detto, Io stesso
intervallo secondo l ’ orologio A r è uguale a kT . Quindi, l ’ intervallo
di tempo tra due eventi identici, l ’ arrivo del primo e del secondo
segnale in A \ si dimostra differente: per A r è uguale a kT e per À
vale 1/2 (k2 + 1 ) T. Di conseguenza, abbiamo scoperto che il tempo
del verificarsi dell’evento (l’ arrivo del secondo segnale) è relativoi
è uguale a kT per ed a 1/2 (k2 + 1) T per A . Anche l ’ intervallo
fra i due eventi è differente. Tutto ciò indica che il tempo del verifi
carsi di eventi, cosi come l ’ intervallo tra gli eventi sono grandezze
relative.
Con quali condizioni coincidono questi valori? Ciò accade quando
kT ex. 1/2 (k 2 + 1) T. Si può dedurre che ciò è possibile quando
k ~ l o , come si vede dalla (3.48), quando Vìe -> 0. Allora, la diffe
renza nelle letture del tempo e la relatività degli intervalli temporali
tra eventi si possono trascurare in quei SRI le cui velocità relative
sono piccole rispetto a quella della luce.
Tempo proprio. Il metodo del coefficiente k permette di stabilire
facilmente una relazione tra Tintervallo che separa due eventi, avve
nuti in un certo SRI in un certo punto dello spazio e, quindi, registra
ti da un solo orologio (intervallo di tempo proprio), e un intervallo
di tempo fra gli stessi eventi registrato mediante due orologi di un
altro SRI in cui gli eventi considerati avvengono in punti diversi.
Torniamo allo scambio di segnali luminosi. Se A manda dei se
gnali con un intervallo T secondo il proprio orologio, A ' li riceve
con un intervallo kT secondo il proprio orologio. Comunque, come
detto prima (pag. 100), questo intervallo è uguale ad 1/2 (IA + 1) T
in termini di A. Il rapporto fra queste grandezze fornisce la relazione
fra Fintervallo di tempo proprio Ar — kT e l ’ intervallo di tempo At
registrato da due orologi di un altro SRI. Questo rapporto è uguale a
At _ kT _ 2k _ l /r ~A V*
At l/ 2( / c2+ l ) r *2 + 1 ~ V 1 c2 ’
104
Ovviamente, ristante della riflessione del segnale è uguale a
1/2 (tx + tk). Esattamente nello stesso modo, si può inviare un segna
le alPestremità vicina del righello (diciamo, all’istante i2) e deter
minare ristante del suo ritorno (ad esempio, t3). L’ istante della,
riflessione del segnale dall’estremità vicina è uguale a 1/2 (t2 + t3).
Affinché entrambi i segnali siano riflessi simultaneamente (secondo
l 5orologio di A ) da entrambe le estremità del righello, è necessario-
soddisfare la seguente condizione:
^ — t i)— m — .c])(3.55)
1Q5
(3 .5 4 ), o lt e n ia m o
7 _ C i L + L ---h h + j)~ h 1)
-k t !
2 l k =t [ k
c k21
ih — (3.56)
£2 £i: (L h) 4~ (L — L) (L L) (L L)
k - z * 2k
!+ ! =
/i+ B *
dove nell’ultima uguaglianza si tiene conto della formula (3.50).
È esattamente la formula (3.5), ottenuta precedentemente.
Questa derivazione mostra quanto sia essenziale trovare gli
iestremi del righello simultaneamente se si vuole determinarne la
, . lunghezza. Va notato a questo pro-
Linea duniverso posito che la derivazione della
(2.4) contiene, in essenza, un
approccio di tipo radar.
Trasformazioni di Lorentz. Ci
siamo assicurati che il metodo
del coefficiente k può essere im
piegato per ottenere tutti i corol
lari fondamentali della TRR,
i postulati di Einstein. Il vantag
gio di questo procedimento con
siste nell5evitare l ’ introduzione
esplicita di un sistema di coor
dinate.
Ma, naturalmente, l ’ applica
zione alla fisica dei metodi della
TRR richiede E introduzione espli
cita di un sistema di riferimen
to. Se è così, ò altrettanto inevi
Fig. 3.11. Per la determinazione della tabile l ’ introduzione delle trasfor
lunghezza di un righello in movi
mento. mazioni di Lorentz. Le trasforma
zioni di Lorentz si possono ottene
re col metodo del coefficiente k.
•Consideriamo due riferimenti K e K' i cui rispettivi osservatori
1 ed 4 ' registrano lo stesso evento. In entrambi i riferimenti l ’ ori
gine è scelto in modo che t = f — 0 quando le due origini 0 e 0'
•coincidono. Quindi all’ istante tx l ’ osservatore A invia un segnale
luminoso ad A ' che viene ricevuto da quest’ultimo (secondo il suo
orologio) all’istante il segnale inviato da A procede ulteriormente
106
accompagnato dal segnale inviato da A ' nell’ istante della ricezione
del segnale da A . Infatti, lungo l ’ asse x si propaga un segnale che
•«consiste di due segnali. Supponiamo che l ’ evento P rappresenti l ’ ar
rivo di quel segnale in qualche punto (o che l ’ arrivo del segnale coin
cida con il verificarsi di qualche evento). In quel punto il segnale è
riflesso (o, altrimenti, il segnale di ritorno viene inviato appena
arriva quello diretto). Dapprima, esso raggiunge all’ istante t'2 l ’ os
servatore A che allo stesso istante invia il suo segnale in direzione
di A . Ora da A ' ad A si propaga
il singolo segnale che consiste, in
pratica, eli due segnali. Esso è ri
cevuto all’ istante £«> da A (fig.
3.12).
L ’ osservatore A assegnerà al
l ’ evento P le coordinate nel modo
seguente. Il tempo t del verificarsi
dell’ evento è proprio la semisom
ma del tempo d ’ invio e ricezione
del segnale in quanto la velocità
della luce « avanti » e « indietro »
è la stessa:
£— ~2 (3.57)
Fig. 3.12. Per la deduzione delle
trasformazioni di Lorentz.
La distanza dal punto dove av
viene l ’ evento si può trovare se la
velocità del segnale c viene moltiplicata per il tempo impiegato dal
segnale a percorrere l ’ « andata »; questo tempo è uguale alla metà
di tutto il tempo impiegato dal segnale. Poiché il segnale percorre un
cammino chiuso nel tempo t2 — t±, la coordinata x dell’ evento sarà
determinata dall’ osservatore A come
x= — (3.58)
h = * — - f - , t2 = t + ~ .
= f , (3.60)
107
Secondo le (3.59) e (3.60) otteniamo
(3262)
(3.63)
t'*- (3.64)
(3.65)
‘■ --f-* (‘ - f ) ■
(3.66)
108
IV . SPAZIO-TEMPO QUADRIDIMENSIONALE
nriAliei An £sI*
e quadridimensionali
'Quando introduciamo un sistema coordinato, la posizione di ogni
punto è determinata da tre numeri, detti coordinate di un punto.
Una varietà a tre dimensioni è intesa come insieme di tutti i punti.
sSe vogliamo passare da una varietà allo spazio che ha determinate
proprietà geometriche, dobbiamo definire l ’espressione per la distan
za tra due punti infinitamente vicini delia varietà. Avendo assegnato
il quadrato della distanza tra tali punti, si possono definire grandezze
geometriche dì base (la lunghezza di un vettore, un angolo tra vetto
ri, le aree di figure bidimensionali forniate da vettori). La geometria,
le cui principali leggi furono formulate da Euclide, è valida con
grande precisione nel mondo in cui viviamo. In conformità con la
geometria di Euclide, il quadrato della distanza tra due punti infi
nitamente vicini può essere scritto nella seguente forma, in coordinate
•cartesiane,
ds2 = dx2 + dy2 + dz2. (4.1)
ri 2 = V (z 2 — *i)a + (U—
dove (aq, z/x, z±) e (x2, z/2, z2) sono le coordinate di dne punti nello
spazio. Le (4.1) e (4.2) mettono in relazione le coordinate di due
punti nello spazio. In particolare, le formule di trasformazione delle
coordinate per i passaggi da un sistema cartesiano ad un altro (una
tale transizione è una rotazione, se ignoriamo la traslazione del
sistema che è di scarso interesse) sono date in Appendice I, § 2.
109
Da queste formule si vede che nel nuovo sistema eli coordinate ognf
nuova coordinata è espressa mediante tutte quelle vecchie.
In uno spazio euclideo tridimensionale si possono introdurre
vettori determinati da una terna di numeri, cioè le componenti di-
vettori. Le coordinate di un punto comprendono le componenti,
di un raggio vettore. Conseguentemente, le componenti di ogni vetto
re si trasformano secondo la legge di trasformazione delle coordinate.
I moduli dei vettori, il loro prodotto scalare e un angolo tra di loro
si trovano mediante le componenti del vettore, in accordo con le leggi
conosciute.
Quali implicazioni comporterebbe la comparsa di una dimensione
in più in uno spazio euclideo? Certamente, è difficile da visualizzare'
con i propri occhi uno spazio quadridimensionale. Ma non ne abbiamo
bisogno. Avendo a disposizione delle relazioni principali per uno
spazio tridimensionale, le riportiamo semplicemente ad uno spazio-
quadridimensionale. Siano x, y, z, w le coordinate di un punto
nello spazio quadridimensionale. Per uno spazio euclideo quadridimen
sionale il quadrato della distanza tra due punti infinitamente vicini
si scriverà nella seguente forma (riportiamo anche le designazioni
simmetriche):
ds2 = dx2-f- dy2 + dz2 + dw2 = dx°2+ dx*2— dx2^-j- dxz\ (4-3)’
e la distanza tra i punti sarà
r 12= V (*2— Xi)2+
Le espressioni (4.3) e (4.4) saranno gli invarianti della trasforma
zione delle .coordinate, e le relazioni geometriche basilari saranno-
trovate nello stesso modo in cui erano state ottenute nello spazio
tridimensionale.
§ 4.2. Spazio-tempo
quadridimensionale o spazio
pseudoeuclideo quadridimensionale*
Consideriamo una varietà quadridimensionale formata da « punti »-
le cui coordinate sono quattro numeri x, y, z, x = et che definiscono'
un punto quadridimensionale. Un evento qualsiasi che rappresenta,-
un processo fisico istantaneo può avvenire in ogni punto di questa
varietà. Lo spazio-tempo quadridimensionale è una nozione pura
mente geometrica. Qualche volta, secondo Minkowski, questo spazio-
è chiamato « universo ». Ogni evento avviene in un punto dell’ univer
so di Minkowski.
Le proprietà geometriche dell’ universo di Minkowski possono-
essere stabilite dopo che è stata trovata una relazione invariante tra
coordinate di punti, che può essere interpretata come la distanza tra
due punti di una varietà. Quando le distanze tra i punti sono definite
si può passare dalla varietà allo spazio. Ma da dove si può trovare una
relazione invariante necessaria? Non si deve dimenticare che le-
coordinate dei punti dell’ « universo » sono definite con grandezze
110
fisicamente differenti, cosicché è impossibile presumere a priori che
la « distanza » in questo universo possa essere respressione del tipo
(4.3). Ma la teoria della relatività risponde a questa domanda senza
ambiguità. Rimanendo nell’ ambito dei sistemi di riferimento iner
ziali, l ’ intervallo tra gli eventi (3.19) rimane invariante per ogni
coppia di eventi (in termini di geometria, per ogni coppia eli punti
dell’universo di Minkowski). 11 passaggio da un SRI ad. un altro è
descritto dalla trasformazione di Lorentz e non c ’ è bisogno di nes-
sun’ altra trasformazione nell’ ambito della TRR. Di conseguenza,
quale forma quadratica invariante di base, che definisce la « distan
za » nell’universo di Minkowski, possiamo prendere, da considera
zioni fisiche, l ’espressione per il quadrato dell’ intervallo tra eventi
ds2 — dx2 — dx2 — dy2 — dz2 = dx°2 — dxi2 — dx22 — dx32, (4.5)
dove x — et. E la (4.5) che definisce il quadrato della distanza tra
due punti infinitamente vicini nell’universo di Minkowski. Così,
i postulati di Einstein, dai quali segue l ’ invarianza deH’intervallo
tra gli eventi, indicano che la geometria dello spazio-tempo quadri
dimensionale (lo spazio di Minkowski) è determinata dalla forma
fondamentale del tipo (4.5). Si è visto dall’ aspetto di questa forma
che le coordinate e il tempo non sono equivalenti.
Nel Supplemento V si vedrà che il passaggio da un sistema di
riferimento inerziale a quello non inerziale altera l ’ aspetto del
l’ intervallo tra eventi. Benché quest’ espressione rimanga sempre
invariante, la sua forma diventa differente, così che il quadrato del
l’ intervallo prende la seguente forma:
ds2= g ih (4.6)
dove al secondo membro si intende la sommatoria rispetto a i e k
da 1 a 4 e i coefficienti g ih, detti coefficienti metrici, possono dipen
dere dalle coordinate e dal tempo. Abbiamo bisogno di questa espres
sione generale soltanto per ricavare g ik per le (4.3) e (4.5).Usando le
notazioni simmetriche delle (4.3) e (4.5), otteniamo rispettivamente
Soo = £11“ §22 “ £ 3 3 “ 1 ? (U3 )
£00 = Su ~ £22 ~ £ 3 3 == 1 • (4-5 )
È evidente che le (4.3) e (4.5) differiscono per i segni dei coefficienti
metrici. L ’ insieme di questi segni è chiamato segnatura delle formo
quadratiche corrispondenti. La segnatura della (4.3) ha la forma
( 4— 1— |
— f ) , mentre la segnatura della (4.5) è (4----- ---------). Se
uno spazio quadridimensionale fosse formato con un semplice aumen
to del numero di dimensioni del nostro spazio convenzionale, la
segnatura sarebbe (4— b + 4~)* Un tale spazio differirebbe dal
nostro in nient’ altro che nel numero di dimensioni e si chiamerebbe
spazio euclideo (quadridimensionale). La segnatura dello spazio
considerato nella teoria della relatività ristretta corrisponde a quella
del tipo (4.5), cioè (4---------------)• Il cambiamento di una segnatura
implica una variazione della « distanza » tra i punti dello spazio,
111
delie proprietà delio spazio rispetto a quelle dello spazio euclideo
•abituale. Questo spazio quadridimensionale, che possiede proprietà
^geometriche non usuali, è estremamente importante per la TRPu
È in questo spazio che « avvengono » tutti g i i . eventi fisici,
iranno luogo tutti i fenomeni fisici.
La geometria deH’universQ di Minkowski differisce dalla geo
metria euclidea, ma non troppo, in quanto i coefficienti nella (4.5),
■rome pure quelli nella (4.3), sono costanti. Dunque, la geometria
definita dalla forma quadratica della (4.5) è solitamente chiamata
Apseudoeuclidea e lo spazio corrispondente spazio pseudo euclideo.
Dunque, lo spazio delle quattro variabili x, y, z, et della teoria
della relatività ristretta è lo spazio pseudoeuclideo quadridimensio
nale. Esso si ottiene non con una semplice aggiunta della quarta
coordinata (temporale) et alle tre spaziali x, y , z ma mediante la
peculiare definizione (4.5) della distanza invariante tra i punti di
questo spazio.
Un motivo fisico per considerare lo spazio pseudoeuclideo sta nel
'fatto che le letture di spazio e di tempo riguardanti un evento non
.sono equivalenti nella T R R nonostante la loro stretta connessione.
)• (b) (4.7)
T = ci x y z
L 5uso degli indici in alto nella (4.7b) non è casuale. Quando si usano
i valori reali delle coordinate, la differenza tra le componenti co-
e controvarianti del vettore deve essere sottolineata (vedi Appendi
ce I, § 8), e le componenti controvarianti sono dotate degli indici in
alto. Così il quadrato dell 7io ter vallo tra gli eventi sarà scritto nella
112
forma
ds2 = dx{ + dx\ dx\ + dx\ — ds2= di0*—,d*i* — di** - dx? =
4 -- gik dx1dxh. (b)
= 2 xf=
d dXi (a)
i==1
Diversi da zero: Diversi da zero:
S ii = l, g2SL=U ^00= 1? — li.
SZZ ^ 1» If 44 — 1 • g22= '— L ^33— ^ ^ '
E da notare che gli intervalli dati nelle (4.8a) e (4.8b) hanno segni
opposti. Poiché ds2 può essere sia negativo che positivo, la scelta dei
segni per ds2 non ha importanza pratica.
Le trasformazioni di Lorentz sono trasformazioni delle compo
nenti del raggio vettore quadridimensionale, che sono le coordinate
di un evento. Le scriveremo di nuovo:
x[ = T (xx+ iBx^ , xQ/= T (x° — Bxi) 1
^ x if = V (xl — B#°),
(a) (b) (4.9)
X f3 - x $ r = x2,
x\ = P (xk— iBxj) ; j;3' =
Ma un raggio vettore quadridimensionale è uno dei vettori quadridi
mensionali. Perciò se nel sistema di riferimento K sono assegnati i
seguenti vettori quadridimensionali:
A 2 = g thA iA h = A hA k = 4 ^
^ a^
-(b ) 1 ‘ '
Certamente le formule (4.Ila ) e (4.1 Ih) danno segni opposti per
la grandezza invariante A 2. Ma questo non ha importanza come nel
caso di determinazione dell’ intervallo (vedi Posservazione dopo le
113
(4.8)). Bisogna ricordare, comunque, che i segni diversi dell’ inter
vallo modificano le condizioni che definiscono gli intervalli e i vetto
ri « del genere tempo » e « del genere spazio » (riguardo a ciò non
c ’ è coerenza nella letteratura).
Nella (4.11b) abbiamo introdotto coordinate covarianti in accordo-
con le formule dell’Appendice I, § 8 : A h = gi^A1. È facile notare
che A 0 = A°, A t = —A 1, A^ = ~ A 2 e A 3 = ~ A 3.
Come nel caso di uno spazio tridimensionale, avremo a che fare
con i tensori. Più semplicemente la legge di trasformazione delle
componenti del tensore si ottiene come la legge di trasformazione
del prodotto di componenti di due vettori quadridimensionali. Le
formule di trasformazione delle componenti per i vettori quadridi-
mensionali A e B si possono scrivere nelle notazioni simmetriche
(vedi la (2.40a, b))
114
te a seconda dei casi. È spesso possibile rappresentare, con qualche
modifica, un normale vettore tridimensionale come la parte spaziale
di quadrivettore. Per la quarta componente la sua espressione sembra
sorprendente a prima vista, ma nell’ analisi finale è naturale. Non
c ’ è niente di strano in questo, in quanto nel limite non relativistico
torniamo sempre da relazioni relativistiche a quelle classiche.
I capitoli V-VII forniranno numerosi esempi di costruzione di
vettori e tensori quadridimensionali.
0 X zi
r\ x
X —Xg
a) t)
Fig. 4.1. a) La linea d’universo di un corpo a riposo nel punto x = x0. b) La
linea d’universo di un corpo in moto uniforme lungo l ’ asse x.
115
Esaminiamo ora un moto arbitrario di una particella in questo
riferimento. Il moto di questa particella è rappresentato dalla linea
d ’universo x = x {%) nel piano (x, t), come appare nella fig. 4.2.
L ’ inclinazione della linea d ’universo rispetto all’ asse t in ogni
punto dato è determinata dalla derivata dx/dx in quel punto. Infatti
(vedi la fig. 4.2),
(4.16)
\J
Linea d universo
dei raggi luminosi
116
geometrici, tutte queste rette, parallele all’ asse x\ rappresentano le
linee di simultaneità nel riferimento K f,
Consideriamo i due eventi A 1 e A 2 situati sull’ asse x' (ambedue
questi eventi avvengono simultaneamente nel riferimento K e al
l ’ istante t' — 0). Per trovare gli istanti del tempo ai quali questi
due eventi avverranno nel riferimento K , bisogna « proiettare »
questi eventi sull’ asse x, tracciando rette parallele all’ asse x, poiché
nel riferimento K gli eventi, che giacciono sulle rette x = costante
(fig. 4.3, a), sono simultanei. Vediamo che nel riferimento K questi
eventi avvengono ad istanti differenti di tempo ix e t2. Ovviamente,,
questa è solo un’ illustrazione geometrica della relatività della sin
cronizzazione degli orologi che abbiamo affrontato nel § 2.4.
Un risultato molto importante segue dalla fig. 4.3, ò, in cui
sono tracciate le linee d ’universo di due corpi che si muovono unifor
memente ma con velocità diverse. Per determinare la distanza tra
di loro ad un determinato istante di tempo, bisogna trovare simulta
neamente le coordinate di questi corpi nel riferimento in cui viene
cercata questa distanza. Si vede bene che nei riferimenti K e K'
la distanza fra i corpi misurata in uno dei riferimenti K o K r risulta
differente. Data l ’equivalenza dei sistemi di riferimento, nessuna
delle distanze ottenute può essere considerata quella vera. Ma allora,
tutte le leggi della meccanica in cui la forza dipende dalla distanza,
diventano ambigue nel caso di corpi in movimento. Naturalmente,
questo problema non emerge
-Z=~ct 'C X = et
nella meccanica di Newton, dove
il tempo è assoluto.
Consideriamo gli assi x, r del
riferimento K (fig. 4.4). Il qua
drato dell’ intervallo tra due punti
dell’universo è definito dall’e
spressione S*2 = (t 2— tQ2— (x 2~
— x-f)2. Per semplicità supponia
mo che l ’ evento 1 avvenga nel
punto x — 0 all’ istante t — 0,
cioè nel punto 0 . Ogni evento che
Fig. 4.4. L ’intersezione del cono avviene nell’ asse x prima e dopo
spazio-temporale col piano (£,• x). l ’ evento 1 è rappresentato dai
II punto O rappresenta l ’evento 1.
Tutti gli eventi situati nei quadranti punti nel piano (x, t). Poiché il
III e IV rappresentano eventi assolu quadrato dell’ intervallo (distan
tamente lontani rispetto all’ evento 0\ za) dall’ evento 1 a ogni altro
gli eventi situati nel quadrante I evento è uguale a s2 = t2 — x2,
rappresentano il futuro assoluto, men
tre quelli situati nel quadrante II questo piano è suddiviso in quat
il passato assoluto. tro quadranti I, II, III, IV
dalle rette x = t , corrisponden
ti alla sequenza di eventi che consistono nell’ arrivo al punto
x al momento t di un segnale emesso dal punto x — 0 al
l ’ istante t = 0. L ’intervallo tra gli eventi sulle rette t2 — x2= 0
è del genere luce, e la « distanza » tra tali eventi nel piano
pseudoeuclideo è uguale a zero. Ora consideriamo i quattro quadranti
esterni alle rette del genere luce. Nel quadrante I s2 — t2 — x2 >> 0.
Di conseguenza, l ’intervallo tra ogni evento del quadrante I e l ’ even
to 1 è del genere tempo. Per tutti gli eventi di questo quadrante
t >> 0 ; di conseguenza, tutti avverranno dopo l ’ evento 1 , e nessuna
scelta di sistema di riferimento può alterare questa situazione. Questo
significa che il quadrante I è la regione del futuro assoluto rispetto
a 0. Anche nel quadrante II s2 >> 0, ma qui per tutti gli eventi
x < 0 ; quindi, il quadrante II è la regione di passato assoluto rispet
to all’evento 1 .
Nei quadranti III e IV s2 < 0, cioè l ’ intervallo tra ogni evento
posto in questa regione e l ’evento 1 è del genere spazio. Tutti questi
eventi avvengono in punti che non coincidono con il punto in cui è
avvenuto l ’evento 1 , e di nuovo è impossibile alterare questo con la
scelta di un sistema di riferimento. Comunque, si possono trovare
118
sistemi di riferimento, dove un evento dato dal quadrante III o IV
potrebbe avvenire prima o dopo, o, infine, simultaneamente con
l ’ evento 1 , poiché i concetti di « simultaneità », « prima » e « dopo »
per eventi di questa regione sono relativi.
Se si esaminano due eventi posti in modo arbitrario nel piano
(t, x), il carattere dell’ intervallo tra di loro sarà determinato dalla
pendenza della retta congiungente
questi due punti. Se la retta è
inclinata rispetto a ll’ asse x sotto
un angolo superiore a jt/4, l ’ in
tervallo tra gli eventi 1 e 2 è del
genere tempo; se sotto un angolo
inferiore a n/4, l ’ intervallo è del
genere spazio. Infine, se questa
linea è parallela alla bisettrice,
Teorema pseuaopitagorLca
l ’intervallo è del genere luce. a b 2^b c 2- a c z
Nello spazio quadridimensio
nale l ’ equazione che descrive la Fig. 4.5. Il teorema pseudopitagorico
propagazione della luce ha la for nello spazio pseudoeuclideo.
ma cH2 — x2 — y 2 — z2 = 0. In
termini geometrici, nello spazio quadridimensionale questa equazio
ne descrive un « cono », chiamato usualmente cono luce. Le cavità
interne di questo cono corrispondono alle regioni di « futuro assolu
to » e « passato assoluto ».
Il cono luce, su cui giacciono le direzioni del genere luce, viene
caratterizzato anche dal fatto che, in tutti i passaggi da un SRI
ad un altro, la sua posizione nello spazio quadridimensionale per
ogni punto dell’universo rimane invariata.
Un evento consista nell’ arrivo di un raggio luminoso in un certo
punto dell’universo, dove si trova un osservatore. Quindi, si tratta
dell’ osservazione dei segnali luminosi in un punto dato dello spazio
e in un istante dato di tempo. I raggi luminosi possono giungere ad
un dato punto dell’ universo solo lungo quelle direzioni dello spazio
quadridimensionale che giacciono sul « cono luce del passato » fino
a ll’infinito (praticamente sufficientemente lontano in unità luce).
Ogni generatrice di questo cono può essere associata al punto sulla
sfera spaziale di un raggio infinitamente grande nel centro della
quale si trova l ’osservatore. Una tale sfera viene usata per l ’ osserva
zione dei corpi celesti ed ò chiamata sfera celeste.
Quando disegnamo il piano pseudoeuclideo su un foglio di carta,
non si deve dimenticare che siamo abituati a relazioni tra le lunghez
ze dei segmenti proprie al piano euclideo. Nella fig. 4.5 è rappresen
tato un triangolo rettangolo il cui lato AC è uguale a x 2 — x1 e B C ,
a t 2 — iq. Ma in questo piano A B 2 = BC 2 — A C 2, secondo la defini
zione del quadrato dell’ intervallo, e contrariamente al teorema di
Pitagora; questo è il teorema pseudopitagorico. Quindi, il confronto
di lunghezze dei segmenti nel piano (x, ) deve essere fatto con cau
t
tela.
119
Nel piano euclideo (xì y) il luogo geometrico dei punti equidistan
ti dall’origine di coordinate è definito dall’ equazione della circonfe
renza r2 = x2 -f- y 2 f= costante. Nel piano pseudoeuclideo (x, t),
dove il quadrato della distanza dall’ origine di coordinate è definito
dalla relazione s2 = t2 — x 2, il luogo geometrico dei punti « equi
distanti » dall’origine di coordinate (fig. 4.6) descriverà quattro
iperboli (,s2 non è necessariamente positivo). Se si sceglie l ’ iperbole
per cui s2 — 1 e si tracciano i raggi dall’ origine di coordinate fino
alla loro intersezione con questa iperbole, il segmento di ciascuna
di questi raggi determinerà la lunghezza unitaria « pseudoeuclidea »
nella direzione corrispondente. E possibile dare un’ interpretazione
120
t = kx del raggio, che attraversa l ’origine di coordinate con pendenza
arbitraria k (k — tg a ), nelle equazioni di iperboli (4.18) e (4.19), si
scopre che la coordinata dell’ intersezione è determinata dall’ equazio
ne x2 = zh (1/(1 — k2)). Questa equazione ha una radice reale solo
se F < 1. Quando k2 = 1, la coordinata del punto d ’ intersezione
sull’ asse x si sposta àll’ infinito. Questo significa che i raggi x = x
sono gli asintoti di queste iperboli. Quindi le linee d’ universo dei
raggi luminosi x — et sono asintoti delle iperboli (4.18), (4.19).
Fig. 4.7. L’illustrazione geometrica della relatività della lunghezza dei righelli.
È disegnato qui il primo quadrante rappresentato nella fig. 4.6. OA è un righello
a riposo nel riferimento K. Le linee d’universo delle- sue estremità sono 0 x e
A A ". L ’ iperbole x2, — t2 = 4 interseca l’asse x nel punto A e l ’asse x' nel
punto A '. Così, OA = 1 e OA' = 1. Per trovare simultaneamente la posiziono
delle estremità del righello nel riferimento K ', bisogna intersecare le lineo
d’universo delle estremità del righello con una retta %' — costante, per esempio,
l ’asse x (corrispondente all’istante t' = 0). Quindi la lunghezza del righello nel
riferimento K' "risulta uguale a OA". Ma OÀ" < OA 1 = 1 .
121
mento OA rappresenta un righello unitario che è fermo in K. Le sue
linee d ’ universo nel sistema K sono rette parallele all’ asse Ox e passano
per i punti 0 q A. Ma in termini di riferimento K ' la posizione simul
tanea degli estremi della sezione OA all’ istante x' = 0 corrisponde
a ll’ intersezione delle sue linee d’universo con l ’ asse x\ cioè ai punti
0 e A " . Il righello unitario in K' è uguale a OA'; si vede dalla fig. 4.7
che OA " *< OA ' = 1.
Supponiamo ora che un righello unitario sia a riposo nel riferi
mento K' (fig. 4.8). Quindi la sua lunghezza è uguale a OA' e le sue
linee d’ universo sono parallele a ll’ asse Ox', una delle quali è lo stes
so asse 0 x\ e l ’ altra è la retta A 'B . Per determinare simultaneamente
122
t—costante che passa per il punto B '. In particolare, la linea d'uni
verso dell’orologio posto al punto ^ e a riposo in /£, passa per il
punto B '. Questo dimostra che se l ’ orologio in moto in K ' registra
sulla retta parallela all’ asse x e passano attraverso il punto B , saranno simul
tanei con questo istante nel riferimento K ' . È chiaro che OB" > OB' = 1,
cioè un orologio immobile registrerà un intervallo di tempo minore di quello
indicato da un orologio in movimento.
123
nel sistema K f (GB" è la lettura dell’ orologio del sistema K f che un
osservatore dal sistema K potrà mettere sul punto B"). Il punto B
è ottenuto come risultato dell’ intersezione della retta, parallela
a ll’asse x r e passante per il punto B , con l ’ asse 6V . Ma GB "
F> QB' = 1 ; di conseguenza, l ’ orologio in moto registrerà di nuove
un intervallo di tempo più lungo di quello registrato dai due orologi
a riposo. La lunghezza dell’ arco (euclidea!) delia linea d ’universo-
è direttamente legata con il tem
Linea druniverso po proprio del corpo, gli è sempli
dell orologio Q/ cemente proporzionale: ds=cdx.
Quindi, la lunghezza dell’ arco-
delia linea d ’universo permette di
aver un’ idea del tempo proprio-
che è stato registrato dall’oro
logio fissato alla particella. Si
deve ricordare, comunque, che
bisogna essere cauti nella valu
tazione della lunghezza dell’ arco
nel piano pseudoeuclideo. Il ri
schio è chiaramente visibile dal
fatto che la « lunghezza del
l ’ arco» che congiunge due punti
sep aratila una distanza spaziale
finita può essere uguale a zero.
Fig. 4.11. La differenza tra il tempo Pensiamo come nel ragionamento'
« proprio » di un corpo e quello delle precedente abbiamo ottenuto il
coordinate registrato da molti orologi
del sistema di riferimento rispetto al corretto risultato sulla base della
quale la particella si muove. geometria. Naturalmente, le pe
culiarità del piano pseudoeucli-
deo influenzano l ’interpretazione
dei risultati. Per esempio, consideriamo la differenza tra il tempo-
proprio e quello di coordinate, cioè il tempo registrato dall’ orologio’
del sistema rispetto al quale un corpo si muove. Sia l ’orologio Qr
a riposo nell’origine del sistema K ' e la sua linea d ’ universo sia OA%
(fig. 4.11). Come al solito gli orologi coincidenti in O e Or indicane
t - 0 , tf - 0 .
Le linee d ’universo di tutti gli orologi Q a riposo in K sono retter
parallele all’ asse t . Ai punti d ’universo A x, A 2, À 3, . . . si può control
lare l ’ orologio Q' con gli orologi QXl Q2, . . . che sono sincroniz
zati in A , e indicano da ogni punto d ’universo A t , A 27 A 3, . . . un
tempo generale, unico per K . Il suo valore nel punto d ’universo A x
è uguale alla lunghezza della linea d ’universo Q^A^ Per l ’ orologio-
Q\ comunque, la lunghezza della linea d ’universo,. che unisce Or
ad A x è uguale a OA1. Ma OA\ — QxA l — O Q da cui è chiaro che
OAx < QxAv Questo implica che l ’ orologio Qf confrontato con gli
orologi Q2, . . . a riposo nel riferimento K è più lento degli orologi
Ql5 Q2, . . . sincronizzati nel riferimento K.
124
Infine, supponiamo che due persone (« gemelli ») si trovino nel
punto 0. In seguito, una di loro (un « viaggiatore ») compie un moto
uniforme e rettilineo tranne un breve intervallo di tempo in cui deve
cambiare la direzione di velocità in quella opposta per tornare al
punto iniziale 0. L ’ altro « gemello » rimane sempre al punto 0. Si
Figo 4.12. Le linee d’universo di due « gemelli ». La linea d’universo del « viag
giatore » è la spezzata OAB; la linea d’ universo di « colui che resta a casa » è la
retta OB. Il « viaggiatore » subisce un’ accelerazione quando inverte la sua
direzione di velocità nel punto B e perciò si trova in questo intervallo di tempo
in un sistema di riferimento non inerziale. La lunghezza della linea d’universo
di un corpo determina I’ intervallo di tempo proprio del corpo. L’ intervallo dì
tempo proprio per il «viaggiatore» è ovviamente minore di quello che per
« colui che resta a casa » (vedi il teorema pseudopitagorico nella fig. 4.5).
vede dalla fig. 4.12 che la linea d ’universo del « viaggiatore » OAB
è più lunga di quella di « colui che resta a casa ». Comunque, secondo
il teorema pseudopitagorico ciò significa che, secondo il tempo
proprio, il « viaggiatore » ha vissuto meno tempo di «colu i che rimane
a casa ». Torneremo di nuovo su questo problema nel capitolo V i li .
125
V. MECCANICA RELATIVISTICA
DI UNA PARTICELLA
126
§ 5.1. Quadrivelocità e
quadriaccelerazione
127
Nei riferimento K' Pintervallo dt' è Vintervallo di tempo proprio.
In questo capitolo lo designeremo con dx (non usiamo la notazione
x — et adoperata nei capitoli precedenti). D all’ uguaglianza prece
dente abbiamo
i - i i y j , ,
c 2 d t2
. (5-2>
128
dove va sono le componenti della velocità tridimensionale convenzio
nale. Dunque, le prime tre componenti della velocità quadridimensio
nale sono quelle della velocità tridimensionale convenzionale mol
tiplicate per il fattore y che dipende dal valore assoluto della velocità
della particella. La quarta componente va trovata separatamente:
dxA d (ict)
(5.4)
v dt = icy.
Nelle notazioni della (4.7) abbiamo
ax^uj a (et) ,a .—. dx” — dxa
------- - - 7 1
dx r dt dx ^ dt
Come per la (4.7a, b) si può scrivere
-+/U u2 u3 U, \
f Uia U2 -J. / u° u1 u1 u2
u2 u3
us \
v{ . ; (a) Fi . (b) (5.5)
<yvx yvv yvz yvv
\yvx yvz ic y ) yvj
Per p—v 0, cioè per le velocità di un corpo z;<C c, il fattore e le
prime tre componenti della velocità quadridimensionale della (5.5a),
così come le ultime tre componenti della (5.5b), coincidono con la
velocità convenzionale. È particolarmente interessante la quarta
componente nella (5.5a) e quella con apice zero nella (5.5b) della
velocità quadridimensionale. Esse sono diverse da zero anche quando
la particella è in quiete (per v — 0 y = 1, e uk = ic, ma u° — c).
Quest’ ultimo risultato ha un significato ovvio: il tempo non può
essere fermato, fluisce sempre senza interruzione. Non c ’ è « quiete »
nell’ universo quadridimensionale (nel senso che V = 0). Per quan
to concerne la « velocità dello scorrere del tempo » essa è definita
ovviamente dalla scelta delle unità di tempo.
Le componenti della velocità quadridimensionale si possono an
che porre nella forma seguente:
V (y v, icy); (a) j V (cy, yv). (b) (5.6)
Il quadrato del vettore quadridimensionale è un invariante. Si
ottiene rispettivamente dalle (4.11a) e (4.11b)
F 2 = y zv 2— c 2y 2 = — c 2; P 2“ ( c2y 2— y ^ v 2) — c2,
V)i ~ ~Y~ V Z 1
JL = r ( l ( 5. 10' )
130
Ora dobbiamo definire l ’ accelerazione quadridimensionale che
costruiremo ancora come vettore quadridimensionale
d2R dV
(5.11)
dx2 dx
ovvero, nelle componenti,
_dui d2xi dui d2xì
(a) w' (b) (5.12)
Wi dx dx2 ’ dx ~~dx2~ •
- ir.v
dy
w\0— w^2
% = v2 >* 0 .
Data l ’ invarianza del quadrato del modulo di un quadrivettore (vedi
Appendice I, § 1) si può affermare che il quadrivettore accelerazione
è un vettore del genere spazio (vedi la definizione dell’ interval
lo (4.5)).
Scriviamo le componenti del quadrivettore accelerazione w nella
notazioni della (4.7a, b):
“* / d , , ìc . Ì l i ) = (
“H v i r ( v » ) . — dt ì ' S r -f ) > ( a )
(5.17)
* h w ( cy ). y - i ( 7 1 7 ) ) = (b)
131
L ’ energia della particella g, introdotta qui, sarà definita in
seguito (vedi la (5.32)). Usando le (5.15) e (5.17), si può ottenere
facilmente
wz — w\~ y 6 — >0. (5.18)
Y = r ^ - t 7 ' + B ( v % + i'P i ) ] .
132
razione tridimensionale appare soltanto quando varia la velocità.
Di conseguenza, anche quando l ’ accelerazione tridimensionale è co
stante in un SRI, varia nel tempo in tutti gli altri riferimenti: nella
meccanica relativistica un moto uniformemente accelerato in un
SRI non lo è in tutti gli altri!
o
dp
= F, (5.19b)
dt
133
Da qui segue la legge della conservazione dell'energia totale della
meccanica classica:
± ( T + U )= 0 ;
dP t,
(5.22)
o, in componenti,
du;rt-
(5.23)
134
Le componenti del vettore dP/dx ci sono familiari in quanto cono*
—>
- S r (? 4 { m y v ) (' a)
(5.24)
%a = yFa, F = yFa
dove Fa sono le componenti della forza tridimensionale. Sostituendo
le espressioni per gra nel secondo membro della (5.25a), otteniamo
-jf(m y v a) = F a
( a = l , 2, 3),
± { m y v ) = F. (5.26)
135
tre componenti delia quadrìforza, abbiamo determinato anche la quar
ta componente. Si può essere certi di ciò nel modo seguente. Diffe
renziando la (5.7a, b) rispetto a t , otteniamo
du5 . ,
u±
H f + U3 + ^4 d% = o, (a)
du0 du1 du3 (5.28)
■— U1 -— u2 = 0. (b)
d% dT d%
Ma secondo la (5.23)
di fy sono determinate nella (5.26) e le componenti dalla (5.5).
Quindi, la (5.28a), ad esempio, si può riscrivere
go gi g2
3-3
tf ). (b)
A (Fv)Y^x
ìy 4 f 1(Fv )'
altrimenti
-ft
Qui si possono ripetere gli stessi ragionamenti riguardanti la
relazione (5.20). Il secondo membro della (5.31) rappresenta il
lavoro compiuto dalla forza; il primo membro deve contenere il
cambiamento di energia. Definiamo l ’energia totale di una particella
libera relativistica come
i = m c 2y = m e2 (1 — p2)"8^ 2; (5.32)
qui p — vie, dove v è il valore assoluto della velocità tridimensionale
del corpo» Sottolineiamo che l ’ energia del corpo è determinata dal
la (5.31) a meno di un termine costante. La (5.32) indica che una
136
particella a riposo (v — 0 , p = 0) possiede l ’energia f 0 = me2.
Un tale valore della costante non è scelto a piacere, ma giustificato dal
passaggio limite alia formula classica della composizione delle
velocità.
Rimandiamo la discussione dell’equazione relativistica del mo
to (5.26) e l ’ espressione relativistica per l ’energia di una particella
(5.32) ai §§ 5.3 e 5.4, e nel frattempo tratteremo la trasformazione del
la quadriforza e le conseguenze che ne derivano. Scriviamo la legge di
trasformazione della forza (in termini della (5.30a)):
& = r (t 5 i+ iB g 4), ‘ = & = s : = r ( g 4- 5m _ ) - (5r33>
Cominciamo con un caso semplice. Supponiamo che la forza
(tridimensionale) F agisca su una particella a riposo nel riferimen
to K Q. Quindi, secondo la (5.30a), F° (F°, 0). Dalle formule (5.33)
otteniamo
y'F'9 = TF°x, y'F'v = F*v, y'F't + F l y'F 'v' = — YVF%.
Nel caso considerato la particella si muove rispetto a K* con la velo
cità del sistema di riferimento K°, cioè con velocità — V. Perciò,
7 ' = P ed otteniamo le formule di trasformazione per le componenti
della forza e del lavoro prodotto da questa forza:
T' n = r | y , — 7 - v ( f ® ) ] ,
Y(
FV) = n 7
137
Pdscrivenclo le ultime equazioni nella forma
(5.35)
Fx - ~ ( F v ) Fy V 1— B*
(5.36)
(Fv)-VFX
138
Prima di tutto, è chiaro che per (5 = quando y ~ 1,
l ’ equazione (5.37b) si trasforma nella (5.37a). Questo significa che la
meccanica classica è il caso limite della meccanica relativistica,
quando le velocità delle particelle sono non relativistiche. Inoltre,
per soddisfare il principio di relatività di Galileo in meccanica
-classica, devono essere valide le trasformazioni di Galileo che richie
dono B <C 1 (vedi § 2.7), cioè la velocità relativa dei riferimenti con
siderati deve essere non relativistica.
Qualche volta, dal confronto fra le (5.37a) e (5.37b) si conclude
che la differenza tra esse consiste nel fatto che nella (5.37b) la massa
dipende dalla velocità, in modo che prendendo my come massa rela
tivistica, otteniamo l ’ equazione classica. Ora vediamo che le cose
sono molto più complicate, e nel Supplemento IV discuteremo perché
non ha senso introdurre una massa dipendente dalla velocità.
Per confrontare le (5.37a) e (5.37b), bisogna riscrivere il primo
membro della (5.37b) in base alla seguente identità (vedi anche le
<5.31) e (5.32)):
(5.39)
139
a, y (> -^ < F »)]-j[F -li(F | ì)l. (b)
sica del moto (5.19), ma con ima massa effettiva (ma costante) my„.
Questo è valido comunque, soltanto per un caso particolare della,
forza soddisfacente la condizione Fv 0. Per esserne certi, con
sideriamo un altro caso.
b) Supponiamo che la forza agente sulla particella sia sempre
diretta come la sua velocità. Ovviamente, questo implica il moto
rettilineo della particella (nel caso di una scelta determinata della
velocità iniziale). Un esempio semplice di tale moto lo fornisce una
particella carica che si muove in un condensatore piano (la velocità
iniziale deve essere diretta lungo il campo elettrico). Se F ||u,
allora v(Fv) == F(vv) = Fu2, e dalla (5.38b) otteniamo la seguente-
equazione del moto:
dv
myc --F\
dt
dove y è una variabile.
Allora, nei due casi particolari che permettono un confronto delle
(5.38a) e (5.38b) otteniamo una diversa dipendenza della massa dalla
velocità; ciò indica] che non c ’ è una dipendenza universale della
massa dalla velocità. È opportuno usare la massa a riposo invariante
(vedi Supplemento IV).
Come in meccanica classica, si può scrivere l ’equazione della
dinamica per il caso in cui la massa a riposo varii per lo scambio con
l ’ esterno di energia e di impulso. Se una particella perde in un’unità
di tempo un quadrivettore di impulso II (IQ) = (7 II, i/cyO) per con
vezione, al posto della (5 .22 ) si può scrivere
dP
d% = f + n,
( m U i ) = g i + n , , (5.40)
drz
■ T T = * + n . - £ - = * ’ +*•
Qui n e d ) sono l ’ impulso e l ’energia forniti alla particella per con
vezione per unità di tempo. Formato il prodotto
140
Moltiplicando ambedue i membri della (5.41) per ut e tenendo
presente die V (dVidx) = 0 e FV = 0, otteniamo
dm dE o
(P u - e — 11 ì U ì ^ c2
dx dx
141
relativistica l ’energia totale di una particella libera si definisce?
come % = mc2y. Questa energia è totale nel senso che include anche
l ’energia di un corpo a riposo (quest’ultima è uguale a me2). Ma
abbiamo già detto che la (5.31) definisce l ’energia a meno di una co
stante e, scegliendo in modo appropriato la costante (assumendo g 0 =
= — me2), si potrebbe avere, come nella meccanica di Newton, che
l'energia di un corpo in quiete è uguale a zero. Ma è impossibile
farlo nella TRR. Nella meccanica della TRR non bisogna dimenti
care né le regole di trasformazione delle varie grandezze né il princi
pio di corrispondenza conia meccanica classica: (nel caso limite (3—^ 0
si deve avere la corrispondenza di molte grandezze classiche e rela
tivistiche). Sappiamo che le trasformazioni di Lorentz diventano
quelle di Galileo per piccole velocità relative dei sistemi di riferi
mento (B->- 0, T—>- 1); per piccole velocità delle particelle (p—>- 0)
l ’ impulso relativistico tridimensionale si trasforma in quello classi
co, myv->- mv.
Supponiamo di aver determinato l ’ energia totale della particel
la libera nella forma % = mc2y + C; allora nel caso limite p—>■ Q1
dobbiamo ottenere % = me2 -f- C. Esaminiamo ora la trasformazione
delle componenti del quadrimpulso nel passaggio da un SRI ad un
altro. Avviene secondo le equazioni seguenti:
^ = r ( P t + iBP4), P'a=
p * = r (p.v— § - § ) ,
142
(sistema) composto di diverse componenti. Naturalmente, m sarà la
massa totale del corpo, e v la velocità del suo moto come un tutt’uno.
L ’equazione %0 — me2 è valida por ogni corpo in quiete. Perciò la
massa a riposo del corpo definisce l ’energia totale racchiusa in
esso senza tener conto dell’ origine di questa energia.
In meccanica classica l ’energia di un corpo a riposo può essere
sia negativa che positiva: è definita a meno di una costante additiva.
In meccanica relativistica l ’energia di un corpo libero (o l ’ energia
di un sistema chiuso) è sempre positiva e legata alla massa a riposo
del corpo; la massa a riposo di un corpo definisce la sua energia a ri
poso. L ’ inerzia del corpo risulta una misura dell’energia del corpo.
Ogni volta che l ’ energia del corpo cambia di Ag, la massa del corpo
varia di Am — A%tc2,
Sorge il problema di come possa rimanere nascosta un’energia
così grande, cioè come resti confinata dentro un corpo l ’energia a ripo
so. Infatti, un grammo di una sostanza contiene circa IO21 erg. La
quantità totale di energia confinata dentro un sistema, comunque,
non è così essenziale come la parte che può essere utilizzata. Sebbene
ogni massa possieda una grande quantità di energia, liberarla non
è affatto facile. Soltanto in tempi recenti si è imparato ad utilizzare
l ’energia atomica. Fino a qualche tempo fa l ’ energia a riposo non
era utilizzabile (e, in conseguenza, la massa era sempre costante).
Poiché il rilascio di energia si manifesta sempre come differenza
d’energia, l ’ esistenza dell’energia a riposo non si manifesta in alcun
modo.
Poiché c2 è molto grande, il cambiamento di una massa che accom
pagna il cambiamento di energia del corpo è m olto piccolo e non si
può misurare sperimentalmente anche se le misure di peso sono sem
pre state fra le misure più precise. Per esempio, 1 kg di acqua
scaldata a 100° guadagna soltanto 5 -IO "9 g di massa. Un cambiamen
to di massa così piccolo non si può misurare nemmeno con le più
sensibili bilance moderne. La formazione di nuclei, tuttavia, coin
volge cambiamenti di massa apprezzabili; questo difetto di massa
determina l ’energia di legame (vedi § 5.6).
In meccanica relativistica è naturale definire energia cinetica la
parte dell’energia della particella che si annulla per y = 0 e che si
ottiene sottraendo l ’energia a riposo all’ energia totale della particella:
T — % — me2 = me2 (y — 1). (5.44)
Si può ottenere lo stesso risultato, calcolando il lavoro di una
forza secondo l ’ equazione della dinamica relativistica:
dT = Fv d t = v d (myv) = myv dv -f- mv2 dy =
Y2
Di qui
143
Se T = 0 per v = 0 (cioè per y = 1), la costante = — me2, da cui
segue ancora che T = nrn2 (7 — 1).
Troviamo le condizioni per cui l ’espressione (5.44) si converte
nell’ espressione classica per l ’energia cinetica. Sviluppando 7 in
serie
v = y i= p - = 1+ TP 2+TP4+--->
vediamo che
_ m7J2 3 7U
145
spazio. L ’impulso di una particella (portatore di energia) è uguale
a zero in questo riferimento. Nel riferimento K ' la particella si
muove; la sua velocità è uguale a —V. Questo significa che l ’ener
gia « fluisce » con questa velocità. La formula (5.49) per p x mostra
che il flusso d’ energia coinvolge l ’ impulso p fx = —T— V. Questo
impulso coincide con l ’ impulso tridimensionale relativistico perché,,
secondo la (5.32), g°/c 2 = la velocità della particella è uguale-
a V, e T coincide con y in questo caso.
Allora, un portatore di energia (una particella, in questo caso) de
ve possedere un momento. Sebbene abbiamo ottenuto questo risul
tato per una particella, esso ha un significato generale; lo incontrere
mo ancora esaminando il campo elettromagnetico (capitolo VI).
Si vuole sottolineare che il fatto di integrare certe grandezze in
un quadrivettore implica una profonda connessione fra di esse. Lo
grandezze componenti un quadrivettore (di solito un vettore tridi
mensionale ed uno scalare) costituiscono in un certo senso una com
binazione chiusa: per calcolare l ’ energia e l ’ impulso di una particella
nel riferimento K ' , bisogna conoscerli nel riferimento K (vedi la
(5.43)). La quarta componente (con indice zero) di un quadrivettore
energia-impulso non può mai azzerarsi. Se fosse zero in qualche si
stema di riferimento, sarebbe uguale a zero in ogni altro riferimento.
Questo è il punto in cui le relazioni relativistiche e classiche diffe
riscono fondamentalmente. In meccanica classica l ’ energia e l ’ im
pulso di una particella stazionaria sono uguali a zero.
Il quadrato di un quadrivettore è un importante invariante*
Scriviamolo:
146
La formula (5.52) si può ottenere differenziando la (5.50),
dove
(5.54)
(5.55)
147
Quando una particella si trova in un campo di potenziale, allora
Fv dt — — dU e la (5.31) diventa d (inc2y) — — dU, da cui segue la
legge di conservazione dell’ energia totale di una particella relativi
stica in un campo di potenziale:
me2,y + U = costante (5.57)
(l’energia è totale nel senso die la somma dell’ energia relativistica
e potenziale della particella rimane costante). In meccanica relati
vistica l ’energìa cinetica è uguale a me2 (y — 1 ); sostituendo il valore
della costante nel secondo membro a me2, la legge di conservazione
dell’energia si scrive
me2 (7 — 1) + U = costante. (5.58)
Quando la particella si trova in un campo conservativo, la sua
velocità e l ’energia potenziale possono cambiare nel corso del moto
ma il valore % = mc2y + U rimane costante (vedi la (5.57)) in quan
to è indipendente dal tempo in un dato SRL La grandezza % è chia
mata energia totale di una particella in un campo conservativo. Certa
mente questa grandezza rimane costante in ogni SRI ma cambia il
suo valore (invariabile) per un altro nel passaggio da un SRI ad un
altro. La definizione di quadrimpulso per una particella in un campo
conservativo come P = rnV è valida, ma la (5.48) va rimpiazzata
da P [myv, ~ (g — {/)], in quanto myc = ~ myc2 z=-(ò- - ~ ? come
148
La massa a riposo M di un sistema complesso si definisce, secondo
la formula generale (5.50), come
M zcz= —
2 J %i
M = (5=64)
Si vede che la massa a riposo del sistema si esprime come somma delle
energie delle particelle costituenti (divisa per c%). Ma l ’ energia di
una singola particella si può rappresentare, secondo la (5.44), come
la somma dell’energia a riposo e dell’energia cinetica
%t = rrH(? + Tt. (5.65)
Quindi secondo la (5.63) otteniamo
^ = 2 ” *t + - k 2 (5-66)
i ì
149
non interagenti non è una grandezza additiva. Una tale proprietà
della massa è impensabile in meccanica classica. Siamo tentati di
dare una nuova definizione di massa per le singole particelle di un
sistema in modo che la massa a riposo del sistema si ottenga come
somma di queste nuove masse, dette qualche volta « relativistiche ».
È facile vedere come si può fare. Nel sistema di riferimento in cui
P = 0 otteniamo dalla (5.64)
Me 2 = , 2 g f = 2 rn
^icK
(5.67)
ì i
Di conseguenza, si può scrivere
M = 2 = S (5.68)
dove mTil = è la massa relativistica. In questo modo abbiamo
ottenuto l ’ additività (che non è affatto obbligatoria), ma nello stesso
tempo andiamo incontro a diverse delusioni. Infatti, l ’ introduzione
della massa relativistica della particella crea l ’ illusione che rammen
to dell’energia, o della « massa relativistica », della particella che
accompagna l ’ aumento di velocità (impulso), sia associato al cambia
mento della struttura interna della particella. Ma sicuramente, ciò
non avviene affatto (per esserne sicuri, si può passare ad un altro
riferimento senza avvicinare la particella). Infatti, l ’ energia aumen
ta con l ’ aumento della velocità grazie alle proprietà speciali dello
spazio-tempo quadridimensionale che derivano dalle trasformazioni
di Lorentz.
Secondo il punto di vista quadridimensionale il termine di « mas
sa » si riferisce alla norma invariante del quadrivettore energia-
impulso. Introducendo la massa relativistica, applichiamo il termine
« massa » (a meno di un fattore) alla componente temporale del qua
drivettore energia-impulso, che è, come sappiamo, l ’ energia. Comun
que, l ’energia e la massa a riposo che intendiamo usare sono essen
zialmente due concetti fisici differenti.
L ’energia è una grandezza relativa; essa dipende dal SRI in cui
sono considerati la particella o il sistema di particelle. La massa a ri
poso rimane la stessa in tutti i SRI: è il valore assoluto di un quadri-
vettore. La componente temporale di un quadrivettore (energia)
coincide con il suo valore assoluto (massa a riposo) soltanto quando
sono uguali a zero le componenti spaziali del quadrivettore (il che
significa che sia l ’impulso della particella che l ’ impulso totale del
sistema di particelle è uguale a zero). E soltanto nel caso in cui
l ’energia coincide con l ’energia a riposo essa è proporzionale alla
massa a riposo (con il coefficiente costante c2).
Quindi, possiamo precisare il significato quadridimensionale
dell’ impulso, dell’energia e della massa a riposo di una particella
,(e di un sistema) se trattiamo le prime due grandezze come le com po
nenti del quadrivettore energia-impulso, e l ’ ultima grandezza come
la norma dello stesso vettore. Gli aspetti metodologici del problema
sono discussi nel Supplemento IV.
150
Esaminiamo ora un sistema composto di particelle interagenti.
La formula (5.63) rimane, ovviamente, valida. La (5.61) deve però
essere rimpiazzata da
E= 2 g , + U, (5.69)
i
dove U indica l ’ energia d’ interazione delle particelle. Questa energia
si definisce come il lavoro richiesto per spezzare il sistema nelle
parti « iniziali » non interagenti. In un sistema stabile U <L 0 in
quanto uno stato di « equilibrio stabilie » è caratterizzato da un
minimo di energia. In un tale sistema la grandezza U è chiamata
energia di legame. Sebbene sia generalmente difficile scrivere l ’ espres
sione analitica esplicita dell’energia di interazione (vedi § 5.8), si
può valutarne il valore. Dalla relazione (5.60) otteniamo, nel riferi
mento in cui P = 0,
M — ’ t (5.70)
C2
o in un altro modo
(5.71)
i i
•dove si è fatto uso della relazione %t = m*c2 + T t che vale per
ugni singola particella.
Se si verifica la condizione 2] T t <C U, cioè se l ’ energia cinetica
i
relativistica totale è piccola, allora
M = J > f+ (5.72)
i
È evidente dalla (5.72) che in un sistema di particelle interagenti
la differenza
AM = ^ ì m i ~ M ì (5.73)
i
■chiamata di solito difetto di massa, è sempre diversa da zero. In un
sistema stabile U < 0 e AM > 0. Dal difetto di massa si può cal
colare l ’ energia di legame:
U = A M -c\ (5.74)
Tale calcolo ha significato solo quando le energie di legame sono
sostanziali. È proprio il caso dei nuclei atomici. E ben noto che i nu
clei atomici sono molto stabili e questa è l ’ evidenza della loro conside
revole energia di legame. I nuclei atomici sono composti di protoni
e neutroni, inoltre, ciascun nucleo possiede un numero definito di
protoni e di neutroni. Le masse dei protoni e dei neutroni allo stato
libero (fuori dal nucleo) si possono determinare sperimentalmente.
Anche la massa di un nucleo atomico si può determinare sperimental
mente. La differenza fra la massa risultante dei protoni e dei neutro-
ibi
ni liberi, che formano il nucleo, e la massa calcolata del nucleo for
nisce il difetto di massa e, secondo la (5.74), l ’energia di legame.
Proprio in questo modo si determinano, in fisica atomica, le energie
di legame dei nuclei.
Scriviamo separatamente le espressioni per le particelle ultra-
relativisti che (v & c). In questo caso la (5.51Q dà
%- cp (5.75)
e quindi dalla (5.51) otteniamo m = 0, Comunque, per due (e più)
particelle otteniamo dalla (5.63)
M V M X P ir -C S iO V O (5.76)
i i
(in quanto = c^]Pi)- Questo mette in luce il fatto che la massa
i i
a riposo di un sistema composto di particelle con massa a riposo nul
la non è uguale a zero. Non c ’ è niente di sorprendente in questo, in
quanto le masse a riposo non si sommano!
Infine, poche parole sui sottosistemi « composti ». Determinan
do, secondo le (5.70) e (5.64), le masse a riposo di un sistema comples
so, bisogna considerare l ’ energia totale del sistema. Assumiamo che
il sistema comprenda anche un campo elettromagnetico. Designando
con W l ’ energia del campo elettromagnetico otteniamo dalla (5.70)
M = + + (5-77)
i i
Da ciò si può dedurre che l ’energia di un campo elettromagnetico,
come ogni aìtra energia, contribuisce alla massa a riposo di un si-
stema.
152
Poiché le equazioni che otterremo non ci serviranno in seguitor
in ogni problema si adatta una numerazione individuale.
I.
in presenza di una forza costante. L'equazione del moto prende la
forma (l’ equazione classica è a sinistra e quella relativistica a destra)1
(mv) — (F
\a) j ^ ~ ( m y v )= F , (b) ( 1 )
mv = (F
t\a) | myv = F
t( y = —
l iA -S -J
La velocità in funzione del tempo si trova algebricamente dalle
(2 a, b):
Ft Ftjm V \ q
15&
-= yvXÌ 0, 0, icy) da cui, secondo la (5.23), segue che g 2 = 3 3 — 0,
D i conseguenza, in un SRI arbitrario rimangono le equazioni
du± diL±
m yF, m ^yF v.
dx dx
Denotiamo qui F x — F e vx — v. La condizione (1) prende la
•forma
—- = w\ = costante.
m2 Q
L ’ equazione del moto si scrive
dui
dx y woi ( 2)
+ <5>
La soluzione dell’ equazione del moto classico per una forza co
stante e con identiche condizioni iniziali prende la forma
vcl = w0t, x = w0t2l 2 .
Se la velocità classica aumenta indefinitamente con il tempo,
-allora, in virtù della disuguaglianza
X
a<Za, se Gt
y 4a2-j-za
154
velocità v e la coordinata x si tramutano in quelle classiche per
v j c < 1. Se si riscrive la (4) come v = cf]/~i + c2iw\t2, è evidente
■che c quando t-> oo.
Troviamo la relazione fra la coordinata temporale t e il tempo
proprio r della particella. Se si sceglie l ’ origine comune dei tempi
ìq === Tq == 0, allora (vedi la (3.16))
w%t*fc2
dt —
c
= — Arcsh c (6)
^0 C2 ) ’
wQt *_ dv _ wQ (7)
Y ì + (w0t l c ) * ~ ' Y l + (u>0t/c)a 8
D all’ espressione per la derivata temporale della velocità si può
vedere la differenza fra accelerazione « costante » relativistica
e non relativistica.
III.
ed uniforme. Consideriamo le condizioni iniziali seguenti: all’ istan
te t = 0 le coordinate della particella carica sono x Q = y 0 = 0 ,
e la sua velocità u0 è perpendicolare al campo E. Ciò corrisponde al
problema di una particella che entra in volo in un condensatore piano
155
parallelamente alle sne facce (fig. 5.1). L ’ asse x è diretto lungo E
8 Tasse y lungo i?0. Quindi il moto della particella avviene nel piano
-y
ss*
Fig. 5J« Un elettrone che entra nel campo elettrico uniforme di un condensatore
si trova all’ origine delle coordinate all’ istante t = 0. La forza esercitata da,
parte del campo è diretta lungo l ’ asse x, la velocità iniziale dell’elettrone %
è diretta lungo l ’asse y. La soluzione classica del problema coincide con quella-
del problema sul moto di un punto materiale lanciato orizzontalmente con
velocità i?0 in un campo gravitazionale.
(#, y). Per quanto è possibile, non faremo distinzioni fra le equazioni-
di moto relativistiche e classiche, che scriveremo nella forma comune
^ = eE
dt eja'
dove F — eE è la forza agente da parte del campo elettrici sulla-
particella carica. In componenti,
px = eE , p y -=0.
Da cui l ’ impulso si trova per integrazione:
Px 6E t -j- p Ox, Py Poy
Ma secondo le condizioni iniziali sia nel caso classico che in quello
relativistico p x = 0 e p 0y — p 0 per t — 0. Di conseguenza, si può
scrivere
Px ~ eE t, p Qy — p Q«
156
Ma secondo le condizioni ini Usando la relazione (5.55)
ziali x 0 = yQ = 0 per t — 0 ot C2 f«
teniamo perciò ^reì ' iP» U j
eE t2 , v otteniamo
x= — ~ * (•)
rei __ dx _ __
La velocità della particella di E
i>2 = + y2
y= ( “ ) 2 i2 + y0
2 c2eEt
157
IV.
ed uniforme. Le equazioni del moto classica e relativistica per la
particella carica in un campo magnetico
(i>
/> =
dove % = costante, l ’equazione^ ( 1 ) si può riscrivere nella forma
dv ec2 r D
( 2>
-3T = ~ T
mentre dalla definizione classica d ’ impulso p — mv segue che
dt m
(3)
Perciò, le equazioni del moto relativistica (2) e classica (3) si distin
guono solo per la costante davanti al prodotto vettoriale. Ricordiamo
come si risolvono le equazioni (2 ) o (3). Orientiamo l ’ asse z lungo il
campo magnetico. Allora B — B k. Per i fattori costanti, che appaio
no davanti al prodotto fvk) nelle equazioni (2) e (3), introduciamo
le notazioni seguenti:
eB ec2B eB ì ? ------ ;r=r //N
© cl = — © rei = — =* ; — = y [© c l = (Dei y 1 — p 2. (4 >
158
Di conseguenza, il valore della velocità della particella rimane
costante nei piano (x, y). L ’ espressione (6 ) si può riscrivere nella
forma
-Ji
che permette l ’ integrazione diretta:
X + iy = 3L. e-i(CDi+a-n/2)B (7),
Ricordando la rappresentazione geometrica del numero complesso
scritto nella forma w = x + iy = re*<P, vediamo che la particella
rimane sempre su una circonferenza di raggio costante r = i?0t/co,.
mentre l ’ angolo tra il suo raggio vettore e l ’ asse # aumenta regolar
mente col tempo: cp = co£ - f costante. Ciò significa che la proiezio
ne del moto della particella sul piano (a:, y) è un moto uniforme lunger
la circonferenza di raggio
r vot vot& Pt /OV,
co ec * B — eB ’ W
^rel
1 s
: Y ^ c i- myc*
■ v ( E v ) = ^ . v cX— - ^- v{ Ev) .
160
{dM dV), otteniamo gas espulsi, e
dM _ dV th 0 = B, eh 0 — L, sh 0 = TB, (6)
M ~ v * ^
L ’equazione (2) si integra facil se consideriamo la velocità del
mente (u = costante) razzo. Ovviamente-,
% — me2 eh d, p = m sh d. (7)
Supponiamo che durante l ’ inter
dove C è una costante d’ integra vallo dt venga espulsa la massa
zione. Scegliendo le condizioni dM a velocità 8 = vie. La velo
iniziali t = 0, V = 0 e IVI (0) = cità del razzo dopo l ’ espulsione
= M 0, otteniamo finalmente della massa dM aumenta di =
= dV/c. Esprimiamo l ’ incremen
V= v ì n - & . . (3) to dB mediante l ’ incremento del
La formula (3) determina la ve parametro eli velocità (vedi la
locità V (t) del razzo in funzio ( 6 ))
161
Quindi è chiaro quanto sia im e dalla ( 10 )
portante, in questa derivazione, eh d = —1 . ( 12 )
l ’ additività delle velocità nel
passaggio da un SRI ad un altro. Dividendo termine a termine la
Nel calcolo non si è usata ( 1 1 ) per la ( 12 ), otteniamo
la legge di conservazione del
l ’energia meccanica perché, da
un lato, è insufficiente (è im o
portante in questo caso anche d 0 = - p ^ , (13)
l ’energia termica), e dall’ altro,
non è necessaria quando viene dove M = M (t) è la massa del
calcolata la velocità del razzo. razzo e del combustibile al Ristan
te t. Poiché in meccanica rela
tivistica il parametro di veloci
tà è un valore additivo, il valo
re finale del parametro di velo
cità si può trovare per integra
zione:
6 = |3in ,(14)
dove M q è la massa del razzo
quando la sua velocità è uguale
a zero.
La formula (14) determina
implicitamente la velocità, del
razzo nel momento in cui la
massa del carburante bruciato
è uguale a M 0 — M*
162
eh $ -> oo, e per soddisfare l ’ uguaglianza (10 ) per valori finiti di M ,
è necessario che dM = 0.
Un’analisi più dettagliata delle possibilità di un razzo a fotoni
mostra la sua inapplicabilità per i viaggi spaziali a lungo raggio
(vedi [1 1 ]).
VI.
zialmente da quant’ è l ’ energia che si può osservare nell’ interazione
tra le particelle. Finora ci sono due sorgenti di particelle ad alta
energia: i raggi cosmici e gli acceleratori. I progetti di acceleratori
sono ancora molto lontani dal superare le energie possedute dalle
particelle dei raggi cosmici, mentre la ricerca sistematica della fisica
delle alte energie si è ristretta alla fisica di energia coperta dagli
acceleratori. Gli acceleratori sono macchine complesse e costose la
cui costruzione richiede diversi anni e il cui costo raggiunge una
porzione apprezzabile del bilancio nazionale di ogni paese industria-
lizzato.
Supponiamo che nel sistema del laboratorio le particelle siano
accelerate all’ energia g. Facciamo collidere queste particelle con
altre della stessa specie (per esempio, esaminiamo le collisioni proto
ne-protone). Il fascio di protoni, che possiede nel sistema di riferi
mento del laboratorio un’energia g, viene diretto contro un bersa
glio che contiene idrogeno, in cui i protoni sono praticamente fermi.
È sufficiente considerare la collisione di un protone proiettile e di
un protone bersaglio. Quindi l ’ energia del sistema costituito dalle
due particelle è uguale ad g + m (assumiamo in questo paragrafo
c “ 1). Si pone la seguente questione: è possibile aumentare l ’ energia
di interazione, prendendo due fasci, ciascuno costituito di particelle
di energia § (nel riferimento del laboratorio), e dirigendo questi
fasci uno contro l ’ altro? Di quanto aumenterà l ’energia « utile » dì
interazione? Per il gusto della diversità, tratteremo questo problema
in quelle inusuali unità temporali che sono i metri luce (vedi capi
tolo II).
Per semplificare il problema, non parleremo più di fasci, ma
considereremo soltanto due particelle. La massima energia utile
(spesa per generare una nuova particella, reazioni nucleari, riscal
damento di una sostanza ecc.) può essere calcolata nel riferimento del
centro di inerzia, perciò è in questo sistema che si calcola l ’energia
interna del sistema (naturalmente dal nostro punto di vista è « inu
tile » il moto globale del sistema). Consideriamo due particelle 1 e, 2
che possiedono uguale energia (velocità) nel riferimento K del labora
torio, e che si muovono una contro l ’ altra. Questo riferimento sarà
per loro il riferimento del centro d ’inerzia, e l ’ energia totale delle
particelle in questo riferimento fornisce l ’ energia utile richiesta.
Questa energia totale è uguale a 2T + 2m, dove T è l ’ energia cine
tica di ciascuna particella, e 2ni l ’energia a riposo delle particelle
(nelle unità adottate c = 1 ). Troviamo come apparirà la stessa colli
sione nel riferimento K ’ in cui la particella 1 è a riposo. È proprio il
caso di una particella che collide contro un bersaglio. Considereremo
163
che l ’energia della particella 2 sia calcolata nel riferimento in cui la
particella 1 è a riposo. Rifacciamo il calcolo appropriato secondo la
(5.43), (Non dimentichiamo che si sta considerando la stessa collisio
ne in un altro sistema di riferimento.) Indichiamo l ’ impulso e l ’ ener
gia delle particelle 1 e 2 nel riferimento K con (p, £) e ( —p , fe).
K, K>i
1
%
1 a 1 1n1
\J°1\=\/J2\
oF 0
Fig. 5.2. Due particelle si muovono nel riferimento del laboratorio con velocità
uguali dirette in senso opposto. La particella 1 è in quiete nel riferimento K '.
164
Quindi, sia p 2 — p x = —my$ rim pulso della particella 2 nel
riferimento K e l ’ energia sia g 3 = my. Calcoleremo l ’energia della
particella 2 nel riferimento K' in cui la particella 1 è a riposo.
Secondo la (5.43)
■ g ' = T (g — Bp2) = ' r (wiy + B ttivP) = Tmy (1 + pB),
perché nel nostro caso y — F (nel riferimento K entrambe le parti-
celle hanno la stessa velocità). Comunque, dalla formula (5.10)
segue che (non dimentichiamo che abbiamo p <C 0, vedi fig. 5.2)
Vvs (\
\-
u- T\a\ ==
< — ri
perciò
K =
dove y' è determinato per la velocità della particella 2 nel riferi
mento K' (cioè la velocità della particella 2 rispetto a quella 1).
Calcoliamo la velocità relativa delle particelle 1 e 2. Abbiamo
—- B
= = 'xB
Nel riferimento K la particella 2 ha la velocità —j{3 e la particella
1 la velocità j3, di conseguenza
ft' — _ ..
i + p2 *
Questa è proprio la velocità relativa della particella 2. Troviamo
ora y
1 _ 1_________„ H-P 1 _
i-p 2
1+ P*
— 72 (1 + P2).
Di conseguenza,
gg = myf = 7717-7 (1 + P2) « 2 Fg,
per p ~ 1 e 7 = T. Come deve essere ritroviamo ancora gli stessi
risultati.
165
Incominciamo con un sistema di n particelle non interagenti.
Le equazioni del moto e i cambiamenti di energia che competono
alla &-esima particella hanno la forma (vedi le (5.27) e (5.31))
(5.78)
(5.79)
dove F&ì denota una forza che agisce stilla &-esima particella (non
si effettua la somma su k\).
Se si considera una particella che non interagisce con le altre,
F = 0 e dalle (5.78) e (5.79) seguono direttamente la legge di con
servazione dell’ impulso p(k) — m ^ y ^ v ^ = costante e quella di con
servazione dell’ energia gd1) = m ^ y ^ c 2 = costante. Infatti, que
sto caso si manifesta nella relazione seguente per una particella sin
gola: P 2 = p 2 — g 2 le2 — costante. Nel caso di una particella
individuale che rappresenta un sistema chiuso, P 2 rimane costante
perché p ed g le lo sono individualmente. Notiamo ancora una volta
che p ed ì%!e di una singola particella si combinano per formare un
quadrivettore.
Quando trattiamo con sistemi di n particelle materiali non inte
ragenti, l ’ impulso totale 2 P ^ e l ’ energia totale del sistema 2
rimangono ovviamente costanti perché lo è individualmente ciascun
addendo.
Le leggi di trasformazione per l ’ impulso, totale e per l ’ energia
totale
P= g = 2 g (k) (5.80)
nel caso del passaggio da un SRI ad un altro sono evidenti: una som
ma di componenti di un vettore si trasforma come la componente di
un vettore. 1 :
Il problema delle leggi di trasformazione in un sistema di n
particelle interagenti è molto più complicato. Nella meccanica clas
sica convenzionale l ’ interazione delle particelle nel caso di forze con
servative si può descrivere per mezzo di un sistema di funzioni
potenziali U = (rP), i<2\ . . ., r(*>), dove rP) (t) determinala
posizione della k-esima particella all’ istante £, considerando la
posizione di tutte le n particelle allo stesso istante. Nell’ analisi
finale si può scegliere un singolo istante di tempo in quanto in mec
canica classica la velocità di propagazione delle interazioni viene
supposta infinita.
Poiché tale velocità è finita in meccanica relativistica, il calcolo
della forza ad un dato punto richiede che siano note le posizioni delle
particelle agli istanti precedenti. Quindi, è chiaro che la forma della
funzione U è piuttosto complicata nel caso relativistico.
166
Se si scrive l’ espressione per l ’ energia del sistema eli n corpi nella
forma
(5.81)
e per l ’ impulso totale
(5.82)
è possibile la seguente asserzione. Le grandezze P ed i%!c non for
mano un quaclrivettore in contrasto con quanto abbiamo nel caso
di una particella singola. Inoltre, queste grandezze non sono co
stanti. L ’equazione g = costante non è valida perché in meccanica
classica l ’energia totale del sistema, inclusa l ’energia potenziale*
rimane costante. La (5.81) non contiene l ’ energia potenziale, e non
c ’ è un modo semplice eli tenerne conto in modo rigoroso. La velocità
finita di propagazione delle interazioni fa variare nel tempo la (5.82).
N ell’ analisi finale questa circostanza chiarisce il fatto paradossale
che le grandezze g eP , che rappresentano la somma delle Componenti
di quadrivettori, non sono essi stessi componenti del quadrivettore.
Infatti, in ogni sistema di riferimento, dove, vengono effettuate le
somme (5.81), e (5.82), gli addendi sono presi simultaneamente nel
senso di simultaneità di un dato sistema di riferimento. Quando pasr
siamo ad un altro riferimento inerziale, si possono cercare i valori
degli impulsi e delle energie delle singole particelle e si possono som
mare secondo le regole di trasformazione dei quadrivettori. In un
nuovo riferimento, comunque, gli evènti ricalcolati non saranno
simultanei. Per trovare g e P nel nuovo riferimento, bisogna ridurre
queste somme alla simultaneità nel nuovo sistema di riferimento.
É questo nuovo calcolo simultaneo che priva le grandezze P e g delle
proprietà delle componenti del quadrivettore.'
I
moto: l ’ integrale dell’energia, dell’ impulso, del moto del centro
d ’ inerzia, dei momento dell’ impulso ecc. L ’ aspetto approssimato di
questi integrali viene presentato nel libro [16], § 27, per esempio.
Per quanto riguarda il comportamento degli integrali del moto
nel passaggio da un riferimento inerziale all’ altro, l ’energia ed il
momento formano un quadrivettore, e gli integrali del moto del
centro d ’ inerzia ed il momento dell’ impulso formano un quadrivetto
re antisimmetrico, nell’ approssimazione ((3Co = v^/c <C 1 ), dove
si consideravano i termini (|3(ft))2. Quindi, è chiaro che se tutti questi
integrali rimangono costanti in un sistema di riferimento, rimarran
no costanti in ogni altro sistema di riferimento.
C’ è un caso in cui le leggi di conservazione dell’ impulso e del
l ’ energia si possono mettere in forma semplice
y, m C y k ) = 2 m(k)y'(h)v'(*>, (5.83)
168
Quindi, si deduce immediatamente il valore minimo (« di soglia »)>
dell’energia cinetica delia particella proiettile:
■169i
VI. TEORIA DI MAXWELL IN FORMA
HE LATI VI STICA
170
campo elettrico e magnetico nel passaggio da un riferimento iner
ziale ad un altro. Solo la teoria della relatività indica che bisogna
usare un tensore quadridimensionale antisimmetrico per descrivere
il campo elettromagnetico.
. (a) (b ) ( 6 . 2)
rot P = — B ; rot E = — \iH ;
nella sinistra sono scritte le equazioni per un mezzo arbitrario, sulla
destra quelle per un mezzo uniforme ed isotropo.
Nella teoria di Maxwell i valori medi deh campo elettrico e ma
gnetico (rispetto ai campi « reali » microscopici) sono definiti dai vet
tori E e B. Nel caso generale i vettori D ed H sono correlati ai campi
medi delle equazioni seguenti:
D = s0E ^ P, B = po (H + M), (6.3)
dove vengono introdotti due nuovi vettori: il vettore polarizzazione
P e il vettore magnetizzazione 31.
Nella teoria di Maxwell si assume valida la legge di conservazione
della carica; nel caso di distribuzione continua di carica la legge si
scrive come equazione di continuità
-|j- + div 7 = 0 . (6.4)
171
Qui p è la densità di carica e ; = pv è la densità di corrente.
Dalle equazioni (6,2) e (6.4) seguono due equazioni che si possono
facilmente incorporare nelle (6.2) e (6.4):
div B = p. div E = p/s,
(6.5>
div tì — 0; ^ d i v /f = 0 . (b)
Quale densità della forza agente da parte di un campo elettromagne
tico su cariche libere e correnti si assume l ’espressione
f= p {E + \ v B ]}, (6.6)
che viene detta forza eli Lorentz. Da questa espressione si vede ancora
una volta che E e B sono campi macroscopici medi.
Il sistema delle equazioni di Maxwell si può scrivere non solo
mediante i vettori campo ma anche mediante il potenziale scalare q>
e quello vettoriale A. Consideriamo il caso di un mezzo uniforme ed
isotropo e combiniamo i potenziali cp e A con i campi E e B mediante
le seguenti relazioni:
E " — v<p — A , B — r o tA . (6.7)
Sostituendo queste espressioni nel sistema (6.2b) ed imponendo la
condizione supplementare eli Lorentz
172
Per un po’ scriveremo contemporaneamente le definizioni e le
relazioni sia in forma reale che immaginaria, come abbiamo fatto
per la meccanica. Perciò, definiamo il vettore quadripotenziale O
come segue :
p i 0>2 0>3 ®4 1 - p° O1 ® 2 ®3
© (b) (6.11)
L * AvAz (ile) cp! ’ (a ) ® (<p Ax Ay
ecl il vettore quadricorrente
fSi s2 s3 su ) | fs° s1 s2 s 3ì
(b) (6.12)
IJx Jy u 1Cpj | (Cp ]x Jy ] z)
Ricordiamo la definizione del quadriraggio vettore:
x 1 x 2 x3 x^ fr^O -r 2 xi
x 1 x* '-f-3
(a) ' (b)
x y z ict ■et x y z
Le componenti dei quadrivettori <P, ,9, R sono scritte in due righe paral
lele, rispettivamente, nelle notazioni convenzionali e simmetriche,
e il loro confronto permette di trovare immediatamente il valore
richiesto della componente. Una volta determinato il quadripoten-
2 iaie e la densità di quadricorrente, si può riscrivere la (6.9) per il
vuoto (cioè con s = e0 e \x — li0, dove cl = l /8 0p 0) come una for
mula unica:
□ © ft = -| * 0v ( * = 1, 2, 3, 4), (a)
(6.13)
n O h^ ~ ix 0sh- (ft = 0, 1, 2, 3). (b)
Ovviamente, le tre equazioni della (6.13a) per k — 1, 2, 3 coin
cidono con le tre equazioni della (6.9) nel caso del vuoto. Per k = 4
l ’equazione (6.13a) dà Qi/ccp — —p0icp, e poiché c2 = l/( e 0(x0),
otteniamo ancora la (6.9).
Suggeriamo al lettore di verificare che le equazioni (6.13b) coin
cidano anche con la (6.9) neh vuoto.
Nel caso del vuoto la condizione di Lorentz (6.8) e la legge di
conservazione della carica (6.4) si possono scrivere mediante la qua-
—
^ ^ _
dridivergenza dei vettori <J> ed s. Infatti, per esempio,
dOi d<b-x dQ>,
div (P =
dXf. dxx dx2 dx3 dx±
3A r dAv dAz d (tcp/c)
dx
■div A
dy dz d (ict)
dsj , dh dì z 3 (icq>)
div s — = div/+ i .
dxi dx 1 dy dz d (ict)
Di conseguenza la condizione di Lorentz e la legge della conserva-
zione della carica nel vuoto hanno la forma div ® = 0, div 9 — 0,
quando sono presentate nella notazione quadridimensionale. Sicu
ramente, gli stessi risultati si ottengono secondo l ’ approccio tridi
mensionale usuale. Le conclusioni cui siamo giunti sono molto impor
tanti. Come si vedrà nelLAppendice I, § 4, la quadridivergenza è
un invariante della trasformazione di Lorentz. Per quanto riguarda
le equazioni (6.13), queste relazioni quadrivettoriali sono valide in
ogni sistema di riferimento inerziale nel vuoto. Perciò, le equazioni
per i potenziali, la condizione di Lorentz e la legge di conservazione*
della carica si possono riscrivere in modo che sia evidente subito
che esse mantengono il loro aspetto in ogni sistema di riferimento iner
ziale. La notazione covariante delle equazioni per i potenziali in un
mezzo di rifrazione (e =7^ b ^ Llo) verrà discussa in seguito (vedi
§ 6.14 e 6.15).
§ 6.2. Trasformazione
del quadripotenziale e
della quadricorrente
— —y
Il fatto di aver realizzato i quadrivettori 0 e s rende possibile ri
scrivere immediatamente le equazioni di trasformazione delle com
ponenti di questi vettori. Scriveremo queste equazioni sia in forma
reale che immaginaria (cfr. la (4.10a, b)):
o ^ r ^ -iB O O , ®2= <d;, o)3- o ;, <d4=- r (cp^+ èb<d');
(6.14a)
O°==r(<D0' + B(D1'), <D* = r ((D^ + E®0'), <D2= <D3= (D3';
(6.14b)
si = r e i — s2 = s ’2, s 3= S3, s4 = r (s' + iBs');
(6.15a)
so = r ( s “' + Bs1'), s i ^ r ^ ' + B s 0'), S2 = s2\ SZ= S3\
(6.15b)
Guardiamo con più attenzione le trasformazioni della densità di
corrente. Una quadricorrente comprende una densità di corrente ed
una densità di carica. E naturale che una corrente ed una densità di
carica si combinino in un singolo quadrivettore. Trattando i sistemi
di riferimento in moto relativo, bisogna tener presente che una carica
può essere a riposo solo in un (« proprio ») sistema di riferimento.
In tutti gli altri SRI la carica è in moto, e in termini di questi rife
rimenti non è solo una carica ma anche una corrente. Vediamo, per
ciò, quanto sia facile il passaggio da una carica ferma (elettrostatica)
a quella in ruoto (corrente): basta passare dal riferimento proprio della
carica ad un altro SRI. Quando una corrente viene originata dallo
spostamento delle cariche e da un mezzo 0 un corpo in moto, si parla
di corrente di convezione. È una corrente di convezione che si mani
festa nel passaggio da un riferimento proprio ad un SRI arbitrario.
La formula 7 = pi? contiene la densità delle cariche che si muo
vono a velocità v. Altrimenti si può essere fraintesi. Per esempio,
c ’ è flusso di corrente in un metallo anche se p = 0. Infatti, la densità
174
di carica totale nel metallo comprende sia gli ioni che gli elettroni
liberi ed è uguale a zero: p = p.; p_ = 0. Ma certamente, può-
fluire una corrente purché ci sia un moto ordinato di elettroni,
j = p+v+ + p_u_ = p_u_, perché la velocità del moto ordinato degli
ioni è uguale a zero.
Dalle formule (6.15) otteniamo direttamente una corrente di con
vezione nel passaggio dal riferimento « proprio » della carica. Dun
que, supponiamo che in un riferimento K ' sia assegnata una densità.!
di carica p' e non ci sia corrente ( /' = 0). Di conseguenza, nel rife
rimento K' la densità di quadricorrente ha componenti s' (0, 0, 0,.
icp' — icp0), cioè s' = Sg — = 0, s[ = icpQ. Quindi secondo la:
(6.15a), nel riferimento K
Si = V ( —iBicp0) n /p o , .9a = .?3 = 0 , .94 = Ticpo.
(6.16),
In forma esplicita l ’ultima equazione della (6.16) dà
s4== icp = _ Ì £ 6l _
l/" 1 — F 2/ c 2
P = T U 7*o- (6-24)
176
ugual numero di linee d’ universo di ioni e di elettroni. La densità
di carica deve essere misurata simultaneamente in ciascun sistema
di riferimento. Nel riferimento K essa si determina dal numero di
linee d’universo degli ioni ed elettroni che attraversano l ’ unità di
lunghezza del riferimento. Per esempio, la densità di carica si deter
mina dal numero di linee d’ universo degli ioni (preso col segno
« -f- ») e il numero di linee d ’universo degli elettroni (col segno
« — ») che attraversano il segmento O A. Un’ iperbole di scala taglia i
177
§ 6.3. Tensore del campo
elettromagnetico
In elettrodinamica Tintensità di campo elettrico E e V induzione
magnetica B sono espresse convenientemente mediante i potenziali
vettoriale e scalare A e cp nel modo seguente 1:
B = rot A , E = --grad <p — dA/dt. (6.25)
Riscriviamo queste equazioni usando le componenti del qiiadri-
potenziale, inoltre scriveremo per ora le relazioni per il quadri-
spazio complesso:
yP --- J J 1 - dA z dAy d03
IJ X
dxs ’
(6.26)
dy dz dx2
3q> c a0)4 dept .
Jtq
III
— ■ ' ic —
11
«
dx dt i dx± dx±
= “ (V ?ox1
* ?ax^
■ )} . (6.27)
F» - ‘ ( l S r — £ - ) «■ * - 1 , 2 , 3, -4>- (6.28)
Prima di discutere le proprietà matematiche e il significato del
l ’ espressione (6.28) dobbiamo esaminare lo stesso passaggio nello
spazio reale quadridimensionale. Come abbiamo indicato, in questo
caso bisogna separare le componenti co- e controvarianti dei vettori
e dei tensori. Il tensore del campo elettromagnetico (6.28) è scritto
per comodità nelle componenti covarianti. Quindi se il vettore <p>
ha le componenti controvarianti (<D°, A) le sue componenti covarianti
saranno (<P°, —A). La differenziazione rispetto alle coordinate con
trovarianti dà ancora coordinate covarianti (vedi Appendice I, § 8)..
178
Perciò, la (6.26) cambia soltanto segno mentre la (6.27) si scrive
179
infatti, i vettori E e B sono vettori tridimensionali fintanto che si
tratta della trasformazione del sistema di coordinate (cioè la rota
zione degli assi coordinati). Non appena si passa a riferimenti in
moto relativo, la si Inazione cambia drasticamente. Nel quadrispazio
E e B non ci sono più vettori, nemmeno quadridimensionali. Benché
E e B si esprimano mediante le componenti del potenziale quadridi
mensionale, non c ’ è alcun valore che si può aggiungere ai vettori tri
dimensionali E e B per renderli quadrivettori. Nel quadrispazio un
campo elettromagnetico è una singola grandezza di natura più com
plicata del qùadHvettore. 1 campi E e B si fondono in un singolo qua
dri ter sore che si dice tensore del campo elettromagnetico.
La comparsa di un quadritensore, invece di due vettori tridimen
sionali che descrivono il campo elettromagnetico, ha un chiaro si
gnificato fisico. I campi elettrico e magnetico sono interconnessi in
modo così stretto che F« apparire » o lo « sparire » di uno dei campi
è determinato dalla scelta del sistema di riferimento. Per esempio,
un campo elettrico « puro » generato da una carica si ha in condizioni
molto particolari quando la carica viene considerata nel riferimento
in cui è a riposo. In ogni altro riferimento inerziale,, questa carica
si muove e, di conseguenza, genera una corrente elettrica che crea
un campo magnetico. D ’ altra parte, abbiamo visto che in un certo
riferimento un conduttore che porta corrente appare neutro, in altri
riferimenti inerziali esso appare carico e, di conseguenza, in questi
riferimenti deve comparire un campo elettrico.
Perciò, è sufficiente, per esempio, che ci sia soltanto un campo elet
trico nel riferimento K perché appaia un campo magnetico in un
altro riferimento K*. Se nel riferimento K c ’ è solo un campo magne
tico in un altro riferimento K ' compariranno sia il campo magnetico
che quello elettrico. Proprio questo fatto fisico non si può esprimere
in termini matematici, se tentiamo di mantenere i campi E e B
come vettori. Abbiamo già detto che non ci sono valori per trasfor
mare i vettori tridimensionali eli un campo elettromagnetico in qua
drivettorL Inoltre, se ciascuno dei vettori E e B fosse contenuto nel
« proprio » quadrivettore, nelle trasformazioni di Lorentz ciascuno
di questi vettori in un « nuovo » riferimento si esprimerebbe me
diante le componenti del « proprio » vettore nel « vecchio » riferi
mento. In tal modo, i vettori l e H si dimostrerebbero non correlati.
L ’esperienza, però, mostra che c ’ è una stretta connessione fra i cam
pi elettrico e magnetico, cioè ira i vettori E e B.
Due vettori tridimensionali hanno sei componenti indipendenti.
Un quadritensore antisimmetrico di secondo rango possiede esatta
mente sei componenti indipendenti. Abbiamo visto nelle (6.29a, b)
che i campi E e B formano un quadri tensore antisimrnetrico, il ten
sore del campo elettromagnetico. Dato che ogni componente di un
tensore in un nuovo sistema di riferimento è una combinazione li
neare di tutte le componenti di quel tensore nel vecchio riferimento,
un passaggio da un sistema di riferimento ad un altro può produrre
la comparsa di un campo elettrico dovuto al campo magnetico osser
180
vato in un altro riferimento, e viceversa. In un certo senso, un campo*
elettromagnetico è una formazione chiusa: se un riferimento inerziale
non ha campo elettrico o magnetico, un campo elettromagnetico non
comparirà in nessun altro riferimento inerziale. Tratteremo nel pros
simo paragrafo la trasformazione delle componenti del campo elet
tromagnetico mentre ora esamineremo brevemente il campo elet
tromagnetico nella materia.
Per descrivere il campo nella materia, bisogna introdurre, oltre
ai campi medi E e B, due altri vettori. Possono essere sia il vettore
induzione elettrica B e l ’ intensità di campo magnetico 2f, che il
vettore polarizzazione elettrica P e il vettore magnetizzazione ili.
Questi quattro vettori sono legati dalle relazioni
0 Hz ~ H y — icDx
-IIZ 0 H x -- icDy
(6.31)
Hy -H x 0 — icDz
icDx icDy icDz 0
mik = \
t
/
LL0
F ~ fik ’ (6.32)
/ 0 M ~M y icP:
I 0 Mx icPì
1t
mi k = (6.33)
-M x 0 icP
i
\ — icPx — icPy 0
—
181
§ 6.4. Trasformazione delle
componenti dei campi elettrico
e magnetico
L ’ approccio quadridimensionale ò particolarmente conveniente in
quanto non appena è stabilita la natura matematica di una o dell’ al
tra grandezza fisica (uno scalare, un quadrivettore, un quadritensore)
il problema della sua trasformazione nel passaggio da un SRI ad
un altro è automaticamente risolto. In meccanica trattiamo i qua-
drivettori. Come stabilito, le componenti dei campi E e B, H e D
ed M c P sono, rispettivamente, le componenti dei tensori (6.29a, b),
(6.31) e (6.33).
Di conseguenza, lo componenti dei vettori tridimensionali si
trasformano secondo la regola di trasformazione delle componenti
del tensore. Per esempio, le componenti, F ih nello spazio complesso,
quadridimensionale, si trasformano come
F ik = C-im
UhlF'm
l,(6.34)
dove a im sono le componenti della matrice della trasformazione di
Lorentz (2.4'la), mentre le componenti F ik sono definite dalla (6.29a).
Per trasformare le componenti della matrice (6.29b) bisogna usare la
matrice delle trasformazioni di Lorentz nella forma (2.41b).
Vogliamo fare un richiamo metodologico. Spesso nell’ esposizione
della lezione si evita di introdurre i tensori per non complicare il
corso. Infatti, spiegare il significato dei tensori e le loro proprietà
in una mezz’ora diciamo è un compito difficile. Non si può, però,
accantonare il fatto che il campo elettromagnetico è un tensore.
Ritorna una vecchia questione: « chiamare gatto un gatto » dal
l ’ inizio? Naturalmente, non è tanto una questione di nome, quanto
dell’equazione di trasformazione (6.34). Apparentemente questa equa
zione si può e si deve ottenere nel modo più semplice. Per esempio, si
può derivare facilmente come segue: vediamo dalla (6.28) che le
grandezze F ik sono combinazioni lineari delle derivate delie compo
nenti del quadrivettore rispetto alle quadricoordinate; la trasforma
zione delle derivate delle componenti del vettore dovuta alla tra
sformazione di coordinate si ricava da una semplice analisi (vedi
Appendice I, § 3).
Per memorizzare la regola di trasformazione delle componenti
di tensori, bisogna ricordare che esse si trasformano come il prodotto
delle corrispondenti componenti dei vettori. In un modo o nell’ altro
otteniamo la (6.34). E giunto il momento di chiamare tensore un
tensore, avendo chiarito, anche se parzialmente, il significato delle
componenti del tensore mediante le derivate delle componenti di
vettori rispetto alle coordinate.
Daremo un esempio di come si può ottenere l ’equazione di tra
sformazione del campo per il caso B z — F12/c. Secondo la (6.34)
l ’equazione di trasformazione per F 12 ha la forma seguente:
F 12 — a ìma 2lF'mli (6.35)
182
Ricordiamo che la somma va eseguita rispetto a due coppie indi-
pendenti di indici m ed l, ciascuno dei quali va da 1 a 4. Perciò nella
somma (6.35) entrano sedici termini, ciascuno dei quali contiene il
prodotto di due componenti a ik e di una componente F ih. Stimoliamo
il lettore che incontra per la prima volta queste equazioni a scrivere
(una volta nella vita!) tutti i sedici termini. Diamo il modo più
semplice per farlo. Prima, sviluppiamo la somma rispetto a m,
per esempio, assegnando ad m i valori 1, 2, 3, 4. Come prima, Vindice
l indica la somma. Otteniamo una somma che consiste di quattro ter
mini in cui abbiamo eliminato l ’ indice m. Poi si effettua la somma su
l in ciascuno dei quattro termini. Come risultato si ottengono tutti
i sedici termini. Quindi bisogna sostituirvi gli a ik dalla matrice di
Lorentz (vedi la (2.41a)) e le componenti F ik dalla (6.29a). Si vede
subito che molti termini della somma (6.35) sono uguali a zero. Per
ciò la sommatoria nella (6.35) si può effettuare in modo più semplice.
Infatti, le grandezze ct1?n, con m che va da 1 a 4, costituiscono gli
elementi della prima riga della matrice di Lorentz (vedi la (2.41a)),
mentre la seconda riga è formata dalle grandezze a 2ì con l = 1,2, 3, 4.
Ma la prima riga della matrice ha solo due elementi, a n e a i4, diver
si da zero. Perciò, per m si devono considerare soltanto i valori 1
e 4. La seconda riga ha solo un elemento diverso da zero, a 22 = 1-
Di conseguenza, si deve prendere soltanto l — 2 e riscrivere la (6.35)
come
F — C $2 ^ 2 2 ^ 1 m F m2 — ( X ^ F 12 - {- C L ^F 42
Y l —y*/c*
Confrontando la seconda e l ’ultima uguaglianze nell’ultima catena
di uguaglianze c riducendo per c. otteniamo
■E’v K+
B7 :T (B '+ ^ E y ).
V 1-
Analogamente ottoniamo le equazioni di trasformazione per le altre
componenti. Scriviamole insieme:
E X= E'X, E V= T (E'v + VB'Z), — ;
(6.36)
B X= B'X, By — T^By — 4 E'z^
,j
183
Nel quaclrispazio reale si ottengono esattamente gli stessi risultati
(6.36) e (6.37). Non parleremo più di questo spazio in quanto nel
seguito faremo uso soltanto delle equazioni finali che sono identiche,
inoltre differenze sostanziali si riscontrano solo nel passaggio dalla
(6.27) alla (6.27').
Si vede dalle formule (6.36) che tutti i vettori campo cambiano
modulo e direzione passando da un riferimento inerziale K' ad un
altro K . Soltanto le « componenti longitudinali » rimangono inva
riate, cioè le componenti lungo la direzione del moto relativo (lungo
l ’ asse x).
Scindiamo i campi elettrico E e magnetico B nelle componenti
parallela e perpendicolare alla direzione del moto (i versori i, /, k
sono diretti rispettivamente lungo gli assi x, y, z), cioè
E|
|= E xi, E± — Eyj + E zk .
Sottolineando che il vettore velocità V del sistema di coordinate K f
ha componenti (F, 0, 0), otteniamo
i j k
[VE'] = V 0 0 = ~ j V B ' z + kVB;j ^ V ( - j B ' + kBy),
Bx By B'z
[VE'] = V ( - j E ' z + kE'y).
Qiiindi la (6.36) si può riscrivere in forma vettoriale:
E » - (E' - [VE'}) ||, E ± = T (E'± - tV B '])± ;
(6.38)
B = )E'ÌW|t, fix = r (fi'x + [Fi?'])
E forse il caso di ricordare che tutte le espressioni dei tipo [VAÌ^
sono uguali a zero mentre le espressioni del tipo [VA]± coincidono
con il prodotto vettoriale stesso per ogni A. Le equazioni per le
trasformazioni inverse si ottengono, sostituendo le grandezze con
apice con quelle senza apice e viceversa e cambiando il segno di F:
E ' t = ( E + [ V B ] ) lh E ’± ^ T ( E + [ VB})±]
b \= (b - ± [VE]) , b\ = t ( f i — i-[F J ? ]) .
Nel caso di velocità non relativistiche T / ì, otteniamo dalla (6.38)
184
Infine scriviamo le equazioni di trasformazione per D ed H .
Non si deve ricalcolare tutto; è sufficiente ricordare che abbiamo ot
tenuto le equazioni per le componenti del tensore $ = (.cB, — iE)r
ed ora vogliamo trovare le analoghe equazioni per il tensore f =
= (H, — icD). Invece della (6.39) otteniamo le seguenti espressioni
per le componenti corrispondenti:
185*
Ora bisogna assicurarsi che — 0 nel primo caso; per fare ciò,
bisogna soddisfare la seguente condizione (vedi la (6.38)):
B'x + (1/c2) [V E '] l = 0.
Moltiplicando vettorialmente entrambi i membri di questa e-
spressione peri?' e tenendo conto delle relazioni [V E ']j_ = [VE'y]± =
= [VE'±], [Er [VE'± ]]± = V E ' 2, B'± = B ', otteniamo la velocità V
del rifèrimento
V = — (c2/E'2) [E'B']. (6.46)
Nello stesso modo otteniamo nell’ altro caso
V = (i/B'2) [E'B']. (6.47)
Si può sempre trovare un sistema inerziale in cui i campi elet
trico e magnetico sono paralleli l ’uno rispetto all’ altro in un punto
dato (vedi, comunque, l ’osservazione sulle onde luminose alla fine
del § 6.5). Ovviamente, se ne
esiste uno, ci sarà un numero
infinito di riferimenti con le stesse
proprietà. Infatti, in ogni sistema
di riferimento inerziale K ' in
moto rettilineo ed uniforme ri
spetto a K nella direzione coinci
dente con la direzione comune di
E e B, i campi E' e B' rimangono
Fig. 6.2. Il passaggio ad un sistema
di riferimento K in cui i campi elettri- paralleli, in quanto non variano
nò e magnetico risultano paralleli. le componenti del campo orien
tate lungo la direzione del moto.
Per trovare almeno un riferimento in cui i campi sono paralleli,
procediamo nel modo seguente. Supponiamo che i campi siano paral
leli nel riferimento K , cioè [EB] = 0. Dirigiamo la velocità del rife
rimento K ' (in cui i campi E' e B' non sono più paralleli) lungo la
perpendicolare ai campi E e B; assumiamo che l ’ asse x ì x' sia diretto
lungo la velocità V (vedi fig. 6.2). Allora E x — B x = 0 e l ’ugua
glianza a zero del prodotto vettoriale equivale a E yB z — E ZB y — 0.
Sostituendovi le componenti di E e B, espresse mediante le compo
nenti di E' e B ', secondo la (6.36), si arriva alla seguente equazione:
r {E ’y + V B ’Z)r (5 1 + - w Ev) = r r
La velocità V del riferimento si può determinare da questa equa
zione usando i campi dati E' e B '. Tenendo presente che, secondo la
(6.36), E'x = B'x — 0, troviamo immediatamente la direzione della
velocità V rispetto a E ’ e B '. Infatti, [E'B'] — i (EyB'z — E'zB'y)
e V = V -i, in modo che, risolvendo l ’ equazione precedente, si può
scrivere
V/c2 _ [E'B'}
(6.48)
V 2/c2 ~
1-j- c2B '2-r E ' 2 *
186
Perciò, dai vettori E' e B r dati nel riferimento K ' si può trovare il
riferimento K in cui E e B sono paralleli. La direzione della velocità
di questo riferimento coincide con quella di [E'Bf], mentre il modulo
della velocità è una delle radici dell’ equazione quadratica (6.48).
Sicuramente dalle due radici della (6.48) bisogna scegliere quella per
cui V << c. Il caso E 'B ' — 0 viene esaminato in precedenza: qui
non si possono ottenere campi paralleli, ma è possibile ottenere o
un puro campo magnetico o un puro campo elettrico.
§ 6.5. Invarianti del campo
elettromagnetico
Benché l ’ intensità del campo elettrico E e l ’ induzione del campo ma
gnetico B varino nelle trasformazioni di Lorentz, ci sono alcune com
binazioni di questi campi che rimangono invariate. Queste grandezze
sono invarianti di un quadritensore antisimmetrico di rango due.
Useremo due di questi invarianti (vedi Appendice I, § 6):
Ii= I 2 = F ihFìk = ~2 e ihlmF iiiF lm-
Ricordando la definizione dei tensori F ik e F*k
% {cB , — iE), cB)
e tenendo presente che il primo invariante, è la somma dei quadrati
delle componenti di F ik e che il secondo è il prodotto a coppie delle
componenti corrispondenti dei tensori F ik e AU, possiamo scrivere
subito / x = 2 (c2B 2 — E 2), I 2 —2 ic (BE).
Tralasciando fattori costanti inessenziali, si può dire che il
campo elettromagnetico possiede due invarianti (non scriveremo gli
nvarianti del tensore % e gli invarianti misti di ^ e f, che non
sono necessari):
I 1 = c2B 2 — E2, J2 - BE.
Dall’ esistenza di questi due invarianti seguono i risultati di cui
in parte ci siamo occupati in precedenza. Se in un SRI i campi E
e B sono mutuamente ortogonali (EB = 0), sono ortogonali in ogni
altro sistema di riferimento inerziale. Se in un riferimento E — cB,
questa relazione è valida in ogni altro sistema di riferimento.
Bisogna sottolineare che ambedue questi invarianti sono uguali
a zero per le onde luminose noi vuoto. Queste proprietà, cioè B I E
e cB — E , si mantengono in ogni SRL
È chiaro che se / 2 = 0 ed I L =j£= 0, si può sempre trovare un sistema
di riferimento in cui o E — 0 oppure B = 0 (secondo il segno di / Q,
cioè passare ad un puro campo magnetico o ad un puro campo elet
trico. Al contrario, se E oppure B è uguale a zero, in qualche rife
rimento, essi saranno mutuamente ortogonali in tutti gli altri rife
rimenti inerziali. Da notare che la grandezza BE non è un « vero »
scalare, in quanto cambia segno nel passaggio da un sistema di coor
dinate destrogiro ad uno levogiro e viceversa, mentre la grandezza
(BE)2 è un vero scalare.
187
§ 6 . 6 . Forza di Lorentz
Consideriamo ora le forze agenti sulle cariche elettriche in un campo
elettromagnetico. Per non complicare l ’ esposizione, ci limitiamo ad
una distribuzione volumetrica di cariche L In un riferimento como-
vente K\ in cui Velemento di volume considerato è a riposo insieme
con una carica, la carica subisce una forza esercitata dal campo elet
trico (il campo magnetico non agisce sulla carica ferma). La forza
che agisce sulla carica contenuta in un volume unitario viene detta
densità di forza. Se una densità di carica è uguale a p0 nel riferimento
comove'nte K \ la densità di forza f è definita dall’ equazione
r -
dove E' è V intensità del campo elettrico in K ' .
Il passaggio ad un altro SRI produce la variazione dei campi E
e B; anche se nel riferimento comovente non c ’ è campo magnetico ed
è presente soltanto il campo elettrico, il campo magnetico comparirà
in ogni altro SRI. Troviamo la densità di forza f espressa mediante
le componenti E e B di un riferimento inerziale arbitrario. Dappri
ma, esaminiamo il caso di velocità non relativistiche quando F ~ 1 ;
quindi, secondo la (6.17), p = p0F » p0, e, secondo la (6.41), E f —
— E + [VB], e a causa di ciò
/ = / ' = PoE' = P\{E + [VB]}. (6.49)
L ’ ultimo passaggio delia formula (6.49) definisce una grandezza
comunemente detta in elettrodinamica densità delia, forza di Lorentz.
La forza di Lorentz definisce la forza, che agisce sull 1unità di volume
contenente una carica, da parte dei campi elettrico e magnetico nel
riferimento K rispetto al quale la carica si muove con velocità V.
Non sorprende che la forza f del riferimento K' si dimostri uguale-
alla forza / del riferimento K , in quanto, secondo la (5.34), il modulo
della forza non varia nel passaggio da un riferimento all’ altro nel
caso non relativistici.
Naturalmente la formula (6.49) si può usare anche nel caso in cui
la velocità del moto della carica sia diversa nei vari punti dello spa
zio. In questo caso ciascun elemento di volume avrà il suo riferi
mento comovente e, di conseguenza, la velocità V sarà diversa nei
vari punti.
Ricaviamo l ’ espressione della forza di Lorentz con un altro me
todo che illustra esplicitamente come si arriva all’ espressione (6.49).
Supponiamo che il riferimento comovente K r abbia campi elettrico'
e magnetico definiti dai vettori E' e B r.
Facendo uso del principio di sovrapposizione, rappresentiamo
ognuno dei campi come la somma di due campi:
I E[ = 0, B[ = B ';
II E^E\ b ; = 0.
1 Le cariche puntiformi sono discusse, ad esempio, in [8], § 29.
Naturalmente, il campo iniziale è dato proprio dalla somma dei
due campi E* — E[ -f- E'2, B' = B[ + B'2. Comunque, le equazioni I
e II di trasformazione dei campi sono molto semplici e ci permettono
di avere subite una risposta. Nel riferimento K'
r = Poi?' = poi?;. (6.50)
Usando la prima delle formule (6.45), si può scrivere immediata
mente il campo elettrico I nel riferimento K :
Et - - [ VBX\,
dove Bt è il campo magnetico in K. Secondo la (6.36) il campo elet
trico II nel riferimento K è uguale a
E2 — È'iJ -r F {E'^yj + E 2
FZk) ~ E 2
nel caso in cui F•~ 1 . Il campo elettrico totale in K è uguale alla
somma di E1 ed' E^:
È = E ± + E 2 = E'% - IVBJ. (6.51)
Il campo magnetico B nel riferimento K è uguale a B± + B 2.
Formando il prodotto vettoriale [VB] = [VBy] + IVB2] si vede dalla
seconda equazione della (6.44), che definisce J52, che il prodotto
| [VB2] |~ (F 2/c2) e lo si può trascurare nel caso non relativistico.
Perciò, [FJ5-J — [VB], e dalla (6.51) otteniamo la forza di Lorentz
(6.49).
Se nel riferimento K il campo elettrico è uguale a zero (E = 0)
ed il campo magnetico è diverso da zero, dalia (6.45) segue che E' =
= [VB']; cosicché, la forza di Lorentz, che sembra agente da parte
di un puro campo magnetico nel riferimento K , sembra prodotta
nel riferimento cornovente K' da un puro campo elettrico. Questi
esempi mostrano ancora una volta Punita del campo elettromagnetico
e la relatività della sua suddivisione in campo elettrico e magnetico.
Vale la pena di dire due parole sulle linee di forza del campo. In
ciascun sistema di riferimento un campo vettoriale può essere corre
lato con una famiglia di linee di forza vettoriali. Queste linee sono
definite come le curve, la cui tangente in ogni punto coincide con la
direzione del campo vettoriale in quel punto. Le linee di forza per
mettono una rappresentazione grafica delle proprietà del campo.
Comunque, a differenza di rappresentazioni del secolo scorso, nes
suno attribuisce a queste linee un significato fisico.
Supponiamo, che si muova una carica o un magnete costante.
Vale la pena di dire che insieme ad essi si muovono il campo e le
linee di forza di questo campo?
Il campo è un mezzo per descrivere quello che accade in un dato
punto dello spazio. Il moto del magnete fa sì che il campo vari sem
plicemente nel tempo in un punto dato. Cionondimeno, si può par
lare di moto dei campo indotto da una carica od un magnete che si
muove a velocità costante, in quanto il campo si muove con essi
solidalmente. La velocità di trasporto del campo è la velocità con
189
cui si muove la carica o il magnete. Comunque, è meglio non parlare
di moto delle linee di forza, in quanto ciò non ha significato fisico.
La natura ausiliaria delle linee di forza si dimostra particolarmente
bene col fatto che per uno dei campi esse possono sparire in alcuni si
stemi di riferimento.
Daremo un altro esempio che illustra il carattere relativo delle
forze che agiscono in un campo elettromagnetico. Consideriamo un
conduttore cilindrico percorso da corrente ed una carica negativa q
che si muove parallelamente al conduttore con velocità V (fig. 6.3).
Fig. 6.3. L ’interazione tra una carica q, che si muove a velocità V parallela-
mente al conduttore percorso da corrente, e la corrente, a) Nel riferimento K
il conduttore è fermo, la carica e gli elettroni si muovono a velocità V. b) Nel
riferimento K ' il conduttore si muove a velocità h, la carica e gli elettroni
sono fermi.
190
giacente nello stesso piano con centro nell’ asse della corrente. La<
direzione del vettore B è determinata dalla regola del cavatappi.
Quindi, la forza agente sulla carica è diretta verso il conduttore ed
è uguale a
F __ qVjvT 1 21gV
2nr 4 jc80c2 r
dove si assume per semplicità che le velocità degli elettroni nel me
tallo e della carica q siano uguali, cioè V — v_.
Ora consideriamo la stessa situazione nel riferimento K r. La cari
ca q e gli elettroni di conduzione sono fermi nel riferimento
Questa volta, però, le cariche connesse con il conduttore, la cui den
sità è p+ si muovono rispetto alla carica q. Esse inducono un certo’
campo magnetico B\ ma questo non agisce più sulla carica q, in quanto*
essa è ferma nel riferimento K f. Da ciò è chiaro che nel riferimento K r
deve comparire un campo elettrico, in quanto la carica deve essere
deviata verso l ’ asse anche in K ' . È facile capire la sua origine, in base
ai risultati ottenuti in precedenza. Gli elettroni di conduzione sono*
fermi nel riferimento K \ perciò pi = Tp_ (vedi la (6.17)). Le cariche
positive connesse al conduttore si muovono con velocità —V in K rr
perciò pi = Tp+ (le cariche erano ferme in K). La densità di carica
risultante p' è uguale a pi +• pi nel riferimento K' e, di conseguenza*
p' = p-/r + rp+ = p+ ( r —i/r) = rp+£ 2,
dove vale la relazione p+ = —p_; questa equazione coincide con la
(6.24). Di conseguenza un conduttore in moto si carica positivamente
con densità volumetrica ph Ma il campo elettrico di un cilindro uni
formemente carico è noto dall’ elettrodin amica. Esso giace nei piani
perpendicolari all’ asse del cilindro ed è orientato lungo i raggi che
partono dall’ asse del cilindro. La sua densità è
F/ _ p s __
2Jie0r 2jis0r 0
191
Ricordando che le forze si trasformano secondo la (5.34), si vede che
■entrambi i modi di descrizione del fenomeno osservato danno ri-
saltati identici per qualsiasi velocità V. I risultati riguardanti i
•campi nei riferimenti K e K ' sono spiegati nella fig. 6.4.
a)
/* = / i = p E x + PVyBz - p v zB y =
F12
- ( - J ì - ) ,F ì + S2 c ‘ Ss c )
o Flz O __ Fi3 w _ A
- t t y ----------------- — ì r il —
ft — ~ ^ tksh
(6.53)
(w .
1 Vogliamo che il lettore non dimentichi che la lettera F con due indici
inferiori rappresenta la componente del tensore f. Le componenti della densità
dellaj[quadriforza hanno un solo indice. -
193
(6.17) e (6.36), otteniamo / (p (E + IVB]), i/cp (Ev)) per le velocità
non relativistiche (trascurando i termini V2!c2).
In conclusione riscriviamo Vequazione del moto della particella!
carica in forma quadridimensionale:
(6.55),
(6.58)
(6.59)
194
dfi3 dfi 3 df14 s
riscriviamo la (6.59) come dx 2 dx3 dx± 1‘ Le altre due
componenti hanno espressioni simili che si possono scrivere in
forma generale (i — 1, 2, 3):
(6.60)
dxh
B x + ^ — ^ = 0. (6.61)
195
L ’ equazione (6.66) contiene quattro equazioni (i = i, 2, 3, 4).
Consideriamo, ad esempio» V equazione per i — i :
d
J jh __ afft .
da'fe daq 1 dx$
dF?t _ * °E Z ii dEv | d(cB x ) q
dxA * dy 1■ *' dz d(ict)
o, in altri termini,
dEz Q «
jf-. cioè (rot ff)x = — {B
B'X = T ( B - ± [ V E ] ) ± (6.71')
197
è perpendicolare alla velocità V. Se si sostituiscono nelle (6 .68 ) e
(6.69) le espressioni corrispondenti, otteniamo un’espressione iden
tica per entrambe le componenti (longitudinale e trasversale) in
cui si cancella il fattore V. Queste relazioni si possono combinare
come segue:
D + - L [ V H ] = b (E + [VB]), (6.74)
B - ± - [ V E ] = V,{H-[VD])(6.75)
( 1- tS t
-? ) u- - 6 (■
1- ÌJ -) ^ + ( ' ! * - w . ) IF »1 -
(6.77)
( * i- S t - 1* ( 1 - -p - ) + ('"r ~
D = eE + i-*n
)(±
. (6.78)
B = ]iH + - ! - ( » * - 1 ) [VE] .
198
È utile riscrivere le equazioni materiali (6.68)-(6.70) nella forma
d i tensore quadridimensionale. Non deriveremo queste equazioni,
le scriveremo per controllare se riotteniamo le (6.68)-(6.70) nel rife
rimento in cui il mezzo è in quiete. Introduciamo la velocità quadri-
—
dimensionale V (TV, icT) del mezzo; T viene scritto in quanto si
assume che la velocità del corpo o del mezzo V sia uguale a quella
del riferimento K ' . Nel riferimento comovente K' la quadrivelocità
F ' ha le componenti U[ = 0, U' = 0 , U'3 = 0, U'± = ic.
Il lettore può facilmente verificare che le equazioni tensoriali
(6.79)
(6.81)
a
F'ikU'h^ 0 (s't = tcp' = 0 , = 0).
199
Ma nel sistema eli riferimento rispetto al quale il mezzo è in moto si
ha
.«i = ± F ihUk = ± ( F i2U2 + F ÌSUs + F M =
= — ( — iE x) ter =
*2 = - 7 - FtkUu = -2 - (F2iU1+
= -T ( - c 5 3r F + ( - i£ „ ) icD = o r { £ v + [F I?],},
S3 = a r { ^ z + [F S ]Z}
da cui
U1 = TF, e72 - U3 = 0, - icF.
Il risultato finale è ovvio:
/ = crF (E + [F 5 ]).’ (6.82)
Il suo significato è piuttosto chiaro: la densità di corrente in un mezzo
con conduttività a è determinata dall 7intensità del campo elettrico
nel mezzo, la quale, secondo la (6.41), è proprio un fattore di a, po
nendo r ~ 1 .
La quarta equazione definisce la densità di carica associata alla
corrente di conduzione:
s4 = tepoond = ~ F \hÙk= ± - (
0
200
Si vede dalla prima formula della (6.84) chela corrente di conduzione»
j x incorpora una corrente convettiva PFp' — Fp e perciò non è più
proporzionale a a. Ciò è un inconveniente, in quanto per o = 0
la corrente di conduzione deve annullarsi. Come si può d istin gu er
la corrente di conduzione nel caso generale? Per far ciò, ricordiamo
che se nel riferimento K ' c ’ è una densità di carica p' = p0 si ottiene
una densità di quadricorrente in ogni altro riferimento K (vedi la<
( 6. 20))
(con v)
ài P^i , (6.85)*
dove Ui è la quadrivelocità della carica. Questa corrente deve essere*
chiamata corrente di convezione; in accordo a ciò, st nella (6.85)»
viene indicata con la scritta (conv). Supponiamo di avere una qua
dricorrente le cui componenti sono e vogliamo rappresentarla;
come somma della corrente di conduzione e di quella di convezione.;
—> —'-y
Prima di tutto esprimiamo p0 mediante s e V. Moltiplicando entram
bi i membri dell’ equazione st = p0n^ per le componenti di ut corri
spondenti e sommando, otteniamo skuk = p0u|; ma secondo la-
(5.7) ul = —c2 così si ha
Po= — . (6.86),
= F * u h.(6.90 >
t + T 2o ( JS ~ p ) = o r Y { j B . + [DB]} (6.91).
in forma tridimensionale.
Separiamo nell’ equazione (6.91) i termini proporzionali alla*
conduttività o. Per questo moltiplichiamo per v entrambi i membri
'della (6.91). Introducendo le notazioni abituali y e p, otteniamo
jv ____ n =
_______P I £
c- y2 ' c2 y
(6.92)
•202
[n i E 2— E j] — u (n ( B 1 — B2)) + (^2 — Ei) ( un ) .
Poiché, secondo la (6.96), nBx = nB2, otteniamo finalmente
[7z, £ 2 - 5 1] = un (JB2 - B 1), (6.98)
e analogamente
pF t f 2 — # *] = — un {D2 — D i). (6.99)
-Queste equazioni, insieme con la (6.96), costituiscono le condizioni
al contorno per i vettori di campo.
M = ,°P
M= -[M °X ],
2 05
Ma
^ = r ( — <p' ) = r - 5 -<p', ^ 2 = o, ^3 = 0 ,
z -i-, i f
v (p = r ^ (P •
Così
206
Facendo uso della (6.107), si può esprimere il potenziale scalare-q?*.
definito dalla (6.104), mediante
1 1
q>= I V = r - 4x18 r' 4xie
e il potenziale vettoriale A si può scrivere nella forma
v i eV
A =
c2 ^ 4xte c2.;H *
Riscriviamo le espressioni per le componenti del campo E, tenendac
conto delle (6.102), (6.105) e (6.107). Otteniamo
p _ e ( x — Vt)
x r 24^>i3 5
F — ey (6.108),
y fioretti3 ’
p ______
r24jxs:ji3 ‘
Nel riferimento K' la carica è posta nell’ origine Or (cioè nel punto»-
x = 0). Le sue coordinate nel riferimento K all’istante t saranno*-
1 e [F i?] _ pò [ eV R ]
jC2 R* 4n Rs 8
(6.113)
208
. Interazione di due cartelle in moto. Prendiamo due cariche et
ed e2 che si muovono parallelamente con la stessa velocità V . De
terminiamo la forza di interazione fra di esse nel sistema di riferi
mento K rispetto al quale sono in moto. Prima troviamo la forza
agente sulla carica e1.
La carica e1 subisce Fazione di campi magnetico ed elettrico in
dotti dalla carica e2. La forza che agisce sulla carica e1 è la forza di
Lorentz: F1 = e1 {E 2 + [VB2]}. Tenendo conto della (6,112) si può
scrivere
P1 rT/- r¥r z? n T7 /TH
*' — I* ir ii/2J] &2)---- r "i*2==
= e l ( l - ^ r ) E 2 + ^ V ( V E 2). (6.114)
p . = Jhfi
& A -rr*?J-
4neil3 ( l _ l i s i n a ) 3/2
e^^VV cos 0 |
)3/2
45T&c22?2 j
1—
F2 [3/2
sin2 0
(* -
da cui la componente lungo la direzione del moto è
( l ----cos ■&
el g2
Fx 4Jtei?2 T/2 \ 3/2
sin2 0 J
r«
F2
sin ‘O'
lg2 (* - (6.115)
4jcei?2 F2 >3/2
sin2 O’
l 1-
Supponiamo che le cariche siano poste su una retta parallela
all’ asse z/, con una delle cariche posta sull’ asse x f in modo che la
distanza tra le cariche è y. A llo ra # — jt /2, F x = 0, e
el*2 (6.116)
4jtgy2 / ‘ ~ 5 -
209
Quest’ equazione si può ottenere in modo semplice. Nel riferi
mento K\ dove le due cariche sono in quiete, l ’ interazione fra di esse
è di natura elettrostatica e la forza è uguale a e^JAn&y2. La tra
sformazione di questa forza nel passaggio dal riferimento K r a quello
K mediante le formule (5.35) conduce alla (6.116). Secondo quest’ul
tima le cariche si respingono nel riferimento K. Ma nel riferimento
K le cariche si muovono producendo due correnti parallele che fluisco
no nella stessa direzione. Quando tali correnti fluiscono lungo dei
conduttori, si attraggono l ’un l ’ altra. Non c ’ è contraddizione in
questo caso in quanto le situazioni fisiche sono differenti. Conside
riamo l ’ espressione per la forza (6.116) nel vuoto nel caso di velo
cità non relativistiche V :
e le2
4ne0y2 (* V2
2c2
I \_ e ±e2
e0i/2
fifa V2
4 jiy 2 * 0 2 *
(6.117)
210
e l ’ impulso (un vettore tridimensionale), comprende anche il ten
sore delle tensioni tridimensionale di Maxwell. Adesso vedremo i
risultati della teoria di Maxwell nella forma tridimensionale.
1. Legge di conservazione d ell’energia per le cariche ed il campo.
Questa legge segue direttamente dalle equazioni di Maxwell: molti
plicando scalarmente la (6.56a) per E e la (6.57a) per H e sottraendo
le espressioni così ottenute, abbiamo
-^ = — j jE (6.119)
^ s
Il primo membro della (6.119) rappresenta la variazione term
por ale dell’ energia del campo elettromagnetico nel volume TT. Quest’ e
nergia è definita nella teoria di Maxwell mediante la densità d’ ener
gia (l’ energia per unità di volume) ' :
w =
211;
11 secóndo termine del secondo membro della (6.119) rappresenta
il vettore di Poynting
5 = [EH], (6.124)
mentre V integrale stesso rappresenta il flusso del vettore S attraverso
la superficie che racchiude il volume V\ L ’ integrando include anche
dS = n d S 1 il prodotto di una superficie di area dS per il vettore
unitario della sua normale n. Quindi la legge di conservazione del-
l ’ energia per le cariche ed il campo si può scrivere come segue:
(T + W) = ■
— y S dS. (6.125)
s
lì vettore di Poynting (6.124) viene interpretato normalmente
come il flusso d’ energia per unità di tempo attraverso un’ area uni
taria orientata normalmente rispetto al vettore di Poynting. Una
tale interpretazione non deriva necessariamente dalle equazioni
di Maxwell. La conseguenza diretta delle equazioni di Maxwell è
la relazione integrale (6.119) che si può considerare come la legge
di conservazione dell’ energia. È chiaro che ogni vettore S' che si
aggiunge al vettore di Poynting S e che soddisfa la relazione div S' =
= '0 non modifica la relazione (6.119). L ’ interpretazione gene
ralmente accettata, comunque, è confermata dagli esperimenti.
2. Legge di conservazione dell'Impulso per le cartelle ed il cam
po. La legge di conservazione dell’ impulso si può trattare come se
gue. Moltiplicando vettorialmente la (6.56a) per B e la (6 .57a) per B ,
e sommando le equazioni ottenute termine a termine, otteniamo
l i [ H r o t H ] + e [ E r o t E ] = — [jB] — (6.126)
n
thè sì può riscrivere nella forma
= + 4 ]6( .1 2 7 )
B
[D
212
dove s'introduce il tensore di Maxwell delle tensioni
^ap = Sap!£? = E aD$ - p E aB p «ar» (6.128)
Il tensore (6.128), simmetrico nel vuoto e nei mezzi isotropi, è
asimmetrico nei mezzi anisotropi, dove è definito secondo F ultima
eguaglianza della (6.128). Integrando su un volume arbitrario nel
dominio dove esiste il campo elettromagnetico, otteniamo
j J g - m i d r = | f L d r + -^r \
T (6.129)
I
4®
- l ^ r mv d r =
a s
§
Le espressioni
Ta$nam$ dS
rappresentano una forza che agisce su una superficie infinitesima
dS le cui componenti normali sono na. I vettori m p sono versori del
sistema di coordinate cartesiano. Potremmo già scrivere la legge di
conservazione dell’ impulso se conoscessimo quello che si considera
l ’ impulso del campo elettromagnetico nella sostanza, Perciò limitia
moci al caso nel vuoto, dove [DB] — (1 le2) [EH] = S/c2. Quindi
tenendo conto delle (6.130) e (6.131), la (6.129) si può riscrivere
4 (i> + G) = § r o3 nam&d
(S
, 6.132)
s
avendo definito la densità dell’ impulso del campo nel vuoto g come
g = S/c2 (6.133)
e, quindi, Fimpulso del campo nel volume Y come
<?=j gdT
213
le equazioni di Maxwell danno soltanto l ’ equazione integrale,
(6.132), e se si aggiunge una componente di un tensore arbitrario
Tip che soddisfa la condizione (dT'a ^/dxa) = 0 a ciascuna compo
nente del vettore G, allora
70
214
Per ottenere la relazione (6.134) abbiamo bisogno delle equazioni
di Maxwell espresse come nelle (6.60) e (6.67); le riscriviamo qui in
una forma più conveniente:
dfkl
dxt
(6.135)
dFik I dF n d Fki
dxi ‘ dxfc dxi (6.136)
u - f F - v «r t r = t { i J r • <«-137>
In questo caso abbiamo usato la (6.135) e applicato la regola di
differenziazione del prodotto.
Ora affronteremo il secondo termine dell’ultimo passaggio del-
Puguaglianza (6.137)
i dFjk 1 /r dFjk . , dFki \
dxi 2 dxi ' dxi )
dFju dFu \ „ J_ r ( dFìh -, dFu \
dxi ■f fhl dxh ) 2 jk l V àxi ' dxk )
1
__ _____ _ x d F k i L / ~ Po x d fk i
i l0 2
__ _____ L i / " d / r \ L
F
(/,s n z )' (6.138)
“ 4 V 8o dxi K!hl} ~ 4 sti/
215
—ìE) e f — (.H, —icD) è chiaro che le componenti spaziali dipendo
no dai vettori B ed H, mentre quelle temporali dai vettori D ed E.
Per ottenere le relazioni necessarie B — s E e B = \iH, bisogna porre
(6.140)
(6/141)
(6.143)
216
Sostituiamo gli indici muti della sommatoria nel primo addendo::
Tindice m sostituirà k, e h sostituirà l nel primo e nel secondo adden
do. Quindi si ottiene finalmente
F"/-*
i + é—§ f ■
dove T ih è definito secondo la (6=134)»
Perciò, le componenti della quadriforza / si possono esprimere
mediante le componenti del tensore T ik che dipendono dai vettori
campo E e B (ricordiamo che per il vuoto, di cui si tratta in questo
paragrafo, le componenti dei tensori 5 e f sono proporzionali, secondo-
la (6.58), con lo stesso coefficiente di proporzionalità).
Da ciò e dalla definizione del tensore Tik (6.134), si vede che nel
vuoto esso è simmetrico, cioè T ik = Tki. Ciò comporta che questo
tensore ha dieci componenti indipendenti. Nella sostanza il quadri-
tensore perde le proprietà di simmetria.
Cerchiamo ora le componenti di T ik espresse mediante i vettori
campo elettromagnetico. Consideriamo prima l ’ espressione f snF sn°
E proprio la somma dei prodotti a coppie delle rispettive componenti
delle matrici (6.29a) e (6.31). Le componenti richieste si trovano-
subito dalla definizione dei tensori f (H, —icD ) e g (cB, —iE).
Indicando con À i coefficienti di 6^, troviamo
fsnFsn= •2 ( c B H -c D E ) = (6.145),
(cBzH z+ c- c E xDx) + “ - ^ =
= - B H + HxBx + ExDx + ¥ L - » f =
= HXB X+ E XDX
-
T 44 = — — F 4m/4m + A =
BH DE BH
= ExDx + E yDy + E zDz (6.148)
2 2 2
T i4 = T 4i = ------- -- F i m / 4m = — ^ 12 /4 2 + F 13 / 4 3 ) =
= - ± S x = - i c - ^ - = - i c g x. (6.149)
Nello stesso modo
^24 = ^42 = — (6.150)
^34 = ^43 ~ ÌC^Z-
Le componenti F14) T24, T 34 risultano proporzionali alle compo
nenti della densità d’ impulso del campo elettromagnetico g = aSVc2.
In seguito risulterà chiaro (vedi la (6.153)) che trattiamo proprio
una densità d’ impulso e non un flusso d ’ energia cui l ’ impulso è
proporzionale. Scriviamo la matrice del tensore energia-impulso-
tensione nel caso di campo elettromagnetico nel vuoto:
(6.151)
Il quadrato in alto a sinistra comprende nove grandezze che defi
niscono il tensore delle tensioni di Maxwell. Esso diventa una gran
dezza corretta nel caso relativistico se viene ampliato con le gran
dezze riguardanti l ’ energia S e w. Assicuriamoci che una volta com
posto il tensore T ihì si ottengano dalle equazioni (6.125) e (6.132)
le leggi di conservazione dell’ energia e dell’ impulso espresse in
forma tridimensionale. Consideriamo le componenti spaziali della
quadriforza:
___ i_ dSpr __ d T q f r ____ 1 _ dSq = dTq$ dgq
dxp c d ( ict )d x fi c% dt dxg
(6.152)
218
do ciascuna componente f a (a — 1, 2, 3) per il vettore unitario
corrispondente m a (oc = 1 , 2 , 3) e sommando i valori ottenuti, ab
biamo (/ = è la forza di Lorentz tridimensionale)
<6-i53>
Integrando l ’ identità (6.153) su un volume arbitrario, otteniamo
\ i i V + \ % - d r = \ ^ m „ i r . <6 , 154 )
7/c? fa yo
Il primo membro della (6.154) comporta la variazione dell’ impulso
totale delle particelle e dell’ impulso totale del campo:
TT-
Applicando il teorema di Gauss-Ostrogradskij al secondo membro
delia (6.154), otteniamo
! 4 ^ ™ “ d T = § T^ nvm « dS = § ;
^ 1 s s
nell’ ultimo passaggio ci si è avvalsi della simmetria del tensore T ap.
Ora siamo giunti alla legge di conservazione dell’ impulso (6.132) e
siamo corti che le componenti r i4, T 24, T 34 sono proporzionali alle
componenti dell’ impulso del campo elettromagnetico. L ’ espressione
Tavnam $ si può considerare non solo come la forza che agisce sul
l ’ elemento di superficie, ma anche come il flusso dell’ impulso at
traverso l ’ elemento di superficie. La grandezza T a ^m^ fornisce
una componente vettoriale di questo flusso. Entrambe queste in
terpretazioni sono sicuramente equivalenti.
Consideriamo ora / 4. Da un lato, secondo la (6.54),
h = i L ( v E ) = )v
f(ri6.157)
e dall’ altro
j _ dT4k _ dT41 | dT42 , dT43 ■ dT44 __
^ dx\ dx 1 ' dx 2 1 dx 3 dx±
(6-158)
Di conseguenza, la (6.158) si può riscrivere come
J L (T + W ) = - § S d S , (6.160)
s
2 19
avendo applicato il teorema di Gauss al termine div S dell5equazione
(6.159). È proprio la legge di conservazione dell’ energia (6.125).
Quindi, nella teoria relativistica le tensioni di Maxwell, l ’ im
pulso e l ’ energia di un campo nel vuoto si amalgamano in una sin
gola grandezza tensoriale, il tensore energia-impulso-tensione.
Le leggi di conservazione dell’ energia e delFimpulso si manifestano
tramite singole relazioni.
La simmetria del tensore energia-impulso-tensione costituisce
una proprietà di fondamentale importanza. Grazie ad essa, risulta
immediatamente la relazione fondamentale tra le densità di flusso
d ’energia e dell'impulso nei caso di campo elettromagnetico nei
vuoto:
S = gc\ • (6.161)
Si può facilmente verificare che la « traccia » del tensore T ik>
cioè la somma delle sue componenti diagonali, è uguale a zero.
Una volta stabilito il carattere tensoriale delle tensioni, dell’ im
pulso, del flusso e della densità di energia del campo elettromagne
tico, si ottengono automaticamente le regole secondo cui si trasfor
mano queste grandezze nel passaggio da un riferimento inerziale
ad un altro. Scriveremo soltanto quelle formule di trasformazione
che ci serviranno in seguito'. Sostituendo i valori delle componenti
(6.151) nelle formule generali (A.L31), si ottiene
Txs = Tu = T2 { n x - 2 ^ S ' x - ^ r w
('),6.162)
. T ii = T 2 ( w ' + 2 ^ S ' x - ^ T rx x ) , ( 6 . 1 6 3 )
Txv = T a = T (6 .1 6 4 )
&c = r » { ( l + (6 -1 6 5 )
g y - ^ T ( g' y - L r xu) , (6 .1 6 6 )
S, = r U - ^ T ' ZX) . ( 6 .1 6 7 )
220
vocamente nel mezzo, e la discussione sulla sua « forma propria » è
ancora in còrso.
Cerchiamo la forma generale del tensore EIT in un mezzo uni
forme ed isotropo. È stato mostrato nel § 6.11 che la forma generale
delle componenti del tensore EIT in un mezzo uniforme ed isotropo
non differisce dal caso nel vuoto; in entrambi i casi (vedi la (6.146))
= - t ( cB - T - + cB . % — c° e ì ) + a =
B E — DE
= - H zB z- HyBy - f f xBx + H XB X+ E mDx -
ED + BH
= E XB X+ E XDX
7*44 = - 4- + A= t B- = w.
Comunque se
T\k= — jeep, [EH\X—— ( ) (8fx/e0ji0)
allora
T 4i = - {ile)[EH) x= - (ih)
Quindi, il tensore EIT in un'mezzo uniforme ed isotropo, ottenuto
per trasformazione diretta di una quadriforza, non è più simmetrico.
Esso è ehiamato'tensore di Minkowski e le sue componenti hanno la
forma
/ Tu F 12 T 13 — (ile) n2Sx \
l t 2, F'22 T zì — (ile) n2Sy 1 _
F 32 T33 — (i/c) n2Sz I
1
\— cSx — {ile) Sy -
{U {He)Sz * /
( TaSi — {ile) rfiSX
(6.169)
V- {il w j-
221
La (6.169) include Lindice di rifrazione n = ] / efx/eo^o- La densità
d’ impulso corrispondente al tensore (6.169) (cioè le componenti
^14» ^24 5 ^ 34) risulta uguale a
= (6.170)
222
Sviluppando la somma a secondo membro e permutando i ter
mini dell’ uguaglianza, otteniamo (vedi la (6.169))
dT
mn (6.174)
ctx$.
dove / L denota la densità di forza di Lorontz.
Ora scriviamo le espressioni (dT^k/dxh) m a per esteso, tenendo
conto della (6.171):
Il secondo passaggio della (6.175) tiene conto del fatto che il tensore
delle tensioni di Maxwell è lo stesso sia nel tensore di Minkowski
che in quello di Abraham; il terzo passaggio della (6.175) è la tra
scrizione identica del secondo. Ma i primi due termini dell’ultimo
passaggio nella (6.175) si possono sostituire, secondo la (6.174), e si
ottiene allora
i { im i - i i E H ] } . (6.177)
In un mezzo isotropo
~ A i
(6.178)
223
Le (6.170) e (6.171) forniscono le densità d'impulso:
gM = (n2/c2) S = (n2/c2) w {du) = (wlc) n, (6.181)
gA = (S/d) = (1/c2) (c/rc) — (w/cn)„ (6.182)
Assumiamo che l ’energia del campo elettromagnetico sia quantiz-
zabile, cioè w — ASco, dove N è il numero dei quanti per unità di
volume. Allora dalle (6.181) e (6.182) otteniamo i seguenti impulsi
dei quanti in un mezzo:
pm = (Uco/c) n, (6.183)
p A = (h(ùicn). (6.184)
Quale di queste due equazioni è « vera »? La tecnica della seconda
quantizzazione del campo elettromagnetico nella sostanza conduce
alla (6.183). Assumiamo che V impulso p di un quanto in un mezzo
sia definito come segue:
p = (jhivlc) ns, (6.185)
dove s è un vettore unitario nella direzione di propagazione dell’ ondas
ed il quadrivettore energia-impulso del quanto prende la forma
H i r ™ . -?)•■ (6-186)
Usando la (6.186), si può ottenere l ’espressione corretta che de
scrive la radiazione di Yavilov-Cerenkov (vedi capitolo V II). Questo
sembra indicare che bisogna preferire la (6.186) ed il tensore di
Minkowski. Comunque, un uso accorto di entrambi i tensori fornisce
risultati corretti. Il punto è che entrambi soddisfano la relazione
(6.127) che è la conseguenza delle equazioni di campo. E importante
sapere come è definito l ’ impulso del campo elettromagnetico nella
sostanza. Nel caso generale, è impossibile suddividere l ’ impulso
totale del campo in parti riguardanti o solo la sostanza o solo il
campo. Ma è proprio ciò che si cerca di fare introducendo l ’ impulso
di Abraham. Quando un’onda luminosa passa dal vuoto in un mezzo,
il suo impulso non viene interamente trasferito nel mezzo; una parte
dell’ impulso è trasmessa al mezzo stesso. Il tensore di Minkowski
sì utilizza ogni volta che si considera un impulso trasmesso intera
mente; se trattiamo un impulso connesso a radiazione nel mezzo,
bisogna usare il tensore di Abraham. L ’espressione (6.185) fornisce
il valore corretto dell’ impulso del fotone nel caso della radiazione
di Vavilov-Cerenkov (vedi capitolo VII), perché in questo caso è
d ’ importanza primaria l ’ impulso totale trasmesso dall’elettrone di
Cerenkov al mezzo. L ’ impulso totale trasmesso ad un fotone in un
mezzo è proprio uguale a Kùmie. Non stupiamoci del fatto che la
quantizzazione del campo elettromagnetico nei dielettrici conduca
alla (6.185) che descrive l ’impulso. Questa espressione rappresenta
semplicemente Timpulso totale del campo elettromagnetico; questo
impulso è associato sia al campo che alla sostanza (vedi § 7.7).
224
Per quanto riguarda la forza agente sulla sostanza, essa e cor
relata alla forza di Abraham e, naturalmente, al tensore di Abraham*
Un tentativo di misurare la forza
di Abraham è stato compiuto nel Sospensione e tensioni
1975 con apparente successo. alternata
Nella fig. 6.7 viene illustrato
Passetto dell’esperimento. Un
disco di titanato di bario (e ~
~ 4000, fx ~ |x0) ha un piccolo
foro al centro. Entrambi i bordi
del disco sono ricoperti di allu
minio e formano perciò un con
densatore cilindrico. Il disco è
sospeso su un lungo filo di tung
steno in modo da poter compiere
delle torsioni tra i poli di un
elettromagnete che genera un
campo costante di 10 kGs. Una
tensione alternata con 150 V di
picco è applicata alP armatura Fig. 6.7. Un’ osservazione sperimen
interna del disco, mentre Pelet tale della forza di Abraham.
trodo esterno è messo a terra
mediante un sottile filo d ’oro che non influenza le oscillazioni
del disco. La tensione è applicata in fase con le oscillazioni
caratteristiche del disco.
La forza di Abraham si può anche scrivere nella forma
ds
f A = e0Ho (xroxe— 1) = e0Ho (xmx e — 1) (6.187)
dove
Xg = s/s0, x m = fi/no (6.188)
225
Gli autori che hanno proposto quest’ esperimento affermano che
le oscillazioni osservate del disco corrispondono al calcolo basato
sulla presenza della forza di Abraham. Vogliamo puntualizzare an
cora che questo risultato sperimentale, benché interessante di per
sé, senza dubbio non « sceglie » tra i tensori (6.169) e (6.171). Si
troverà nel § 7.7 qualche commento ulteriore riguardo la scelta di
un’espressione per l ’impulso di un fotone in un mezzo.
r- - <6-i 9 i >
d r-* L j& .d r .= - 4 1
526
Di conseguenza, le (6.192) e (6.193) prendono la forma
(6.194)
G '* = -± ± T U . (6.195)
G '= -r V ~ , (6.198)
m
Nel seguito sarà mostrato come si possono ottenere le espressioni
per i potenziali del campo in un mezzo in movimento. Per illustrare
un’ applicazione di questi potenziali, considereremo la propagazione
di un’onda elettromagnetica piana in un mezzo in movimento ri
spetto ad un osservatore stazionario. Questo esempio ha una rica
duta diretta sui problemi analizzati nel capitolo VII. In questo
paragrafo applichiamo i metodi dell’ algebra tensoriale descritti
brevemente nell’Appendice I, § 3.
Ora deriviamo le equazioni per il quadripotenziale in un mezzo
in moto. Possiamo descrivere il campo in un mezzo in moto mediante
due tensori: F ik (vedi la (6,29)) e f ih (vedi la (6.31)). Il tensore F ih
è detto qualche volta tensore di campo, ed il tensore f ikì tensore di
induzione.
Introduciamo ora il potenziale di campo quadridimensionale CP
in un mezzo, avendolo definito mediante la seguente relazione:
/ dd)k dOj \
F ìh (6.199)
\ dxi dxfr ) ’
che coincide con la formula (6.28). Conoscendo le quattro componenti
del potenziale <Dk, possiamo usare questa equazione per determinare
tutte le componenti del tensore F ih, cioè l ’induzione magnetica B
ed il campo elettrico E . Per descrivere interamente il campo elettro-
magnetico in un mezzo, bisogna conoscere anche le componenti del
tensore f ik, cioè le componenti dei vettori campo magnetico e dell’in
duzione elettrica. Se è noto il vettore §r, il vettore induzione f si
può determinare mediante le equazioni materiali (6.79) e (6.80)
che stabiliscono la relazione tra le componenti di questi due tensori
(ricordiamo che la correlazione in forma vettoriale tra i tensori ^
e f è data dalle equazioni di Minkowski (6.74) e (6.75)).
Le equazioni materiali (6.79) e (6.80), che definiscono la rela
zione fra i tensori ^ e f, s* possono scrivere nella forma di un’ unica
relazione tensoriale
fih = ik6( .200)
Z
dove il tensore di quarto rango e ^ ìm è scelto in modo da rendere
valide le equazioni di Minkowski (6.74) e (6.75). È facile mostrare
che il tensore della forma
Zmm = y c (?>li - ™ - 2UlUl) (6hm-x e r * U kU (6.201)
228
È facile vedere che % — 0 nel vuotor e la relazione (6 . 200) fra i
tensori f e ^ prende la forma
1
fin F ih » (6.203)
fV
che corrisponde alle ben note relazioni tra i campi E ed H e le indu
zioni D e B nel vuoto:
D = s0E, B = \i0H. (6.204)
In un mezzo stazionario il tensore della (6.201) fornisce le se
guenti relazioni tra i campi e le induzioni:
D = eE, B = [iH. (6.205)
È facile vederlo avendo assunto nella (6.201) Uj — U2 = U3 = 0
ed U4 — ic.
Poiché le componenti del tensore F lm sono espresse mediante le
componenti del potenziale quadridimensionale <X>2, e le componenti
del tensore di induzione f ih sono correlate ad F lm dalla (6 .200), le
componenti del tensore f ih si possono esprimere anche mediante le
componenti del potenziale quadridimensionale CP*. In altre parole,
per determinare tutte le componenti dei campi e delle induzioni in
un mezzo in moto è sufficiente conoscere le quattro funzioni ® 2.
Ora deriviamo le equazioni per i potenziali del campo in un mezzo
in moto. Per questo facciamo uso delPequazione (6.60):
( S ' . - n r V . U O l dxfr L
[-g
dx\f - - -
[ d* 2“
Ldx% %C ‘ (*■£)>}- (6.207)
229
che è facile da controllare, otteniamo finalmente
(■v * £ ) > ■ - £ ( )=
= ( 6 t« + ) sf. (6.209)
{ i f -
Il sistema (6.211) è più conveniente rispetto al sistema (6.209)
in quanto comprende quattro equazioni, ciascuna dello quali in
clude solo ama componente del vettore potenziale (a = 1, 2, 3, 4).
Per sorgenti esterne date, la soluzione del sistema (6.211) definisce
completamente il campo generato da queste sorgenti nel mezzo in
movimento.
Se il mezzo in movimento ha una frontiera di separazione, il
sistema (6.211) deve essere completato con le condizioni al contorno
necessarie (vedi § 6.8).
Come esempio per risolvere le equazioni ottenute, consideriamo
un campo elettromagnetico in un mezzo in movimento in assenza di
sorgenti esterne (correnti e cariche). Poiché in questo caso tutti gli
Si = 0, il sistema ( 6 . 2 trasforma in un sistema di quattro equa
zioni uniformi
{ i — ( 6. 212)
230
In questo caso il sistema di equazioni (6.212) si può riscrivere
in termini del potenziale A:
+ U V “ °> <6-213>
dove B = Vie, con la condizione complementare
d i v 4 - c- ^ i 5y[ ( F v ) + ^ - ] ( V A ) = 0 , (6.214)
{( - w + -£ -) + ^ r l 4 i) (k V -= ° -
+ <6 '218>
L ’ equazione (6.218) si può derivare facilmente dall’equazione di
dispersione che è valida per onde piane monocromatiche in un mezzo
stazionario:
k2 — coW = 0, k2 = k2.
Riscriviamola nella forma
n2— l
(ik2 C2 co2 = 0.
In questo caso le parentesi comprendono il quadrato del vettore
d ’onda quadridimensionale nel vuoto k (fc, ico/c), la grandezza in
variante rispetto alle trasformazioni di Lorentz. La grandezza in
parentesi mantiene la sua forma e il suo valore numerico in tutti
i sistemi di riferimento inerziali. Il secondo addendo dell’ultima
equazione si trasforma come la frequenza co. Nel riferimento in cui
231
il mezzo è in moto con velocità V, co può essere sostituita da
cù' = (cd— U V )fY 1 — F 2/c 2
(vedi § 7.2),
JJa queste considerazioni l ’ equazione di dispersione prende la
forma (6.218)
(6.219)
Dalla condizione (6.219) dell’ annullarsi del prodotto scalare
segue che in un mezzo in moto il vettore A 0 non è perpendicolare alla
direzione di propagazione dell’ onda definita dal vettore d ’ onda k, ma
ad una combinazione lineare del vettore d ’ onda k e del vettore velo
cità V del mezzo. Nei due casi specifici, quando l ’ onda si propaga
nel vuoto (n = 1) e quando il mezzo è stazionario (V — 0), la con
dizione (6.219) si trasforma nella ben nota condizione di trasversa
lità delle onde elettromagnetiche libere: A 0k = 0, da cui segue che
nelle onde elettromagnetiche libere i vettori E , H, B e D sono per
pendicolari al vettore d’onda, cioè alla direzione di propagazione
dell’ onda. In un mezzo in moto, comunque, le onde non sono tra
sversali, in generale. Infatti, nel caso di onde piane (6.216) i campi
E e B si determinano in base alle formule (6.215):
B = — i [kA0] el^ kr\ E = — zg>4 0e4«°*-fcr>.
Da ciò 3 i vede che il vettore B è perpendicolare al vettore d ’ onda
k, mentre il vettore E no (in quanto il vettore A 0 non è trasversale
secondo la condizione (6.219)).
L ’ equazione (6.217) che ìegq il vettore d ’ onda k e la frequenza co
di un’ onda in un mezzo ih moto include il prodotto scalare kV.
Questo significa che le condizioni di propagazione dell’ onda dipen
dono dall’ angolo tra la direzione di propagazione (o il vettore
d ’ onda k) e la velocità del mezzo F. Questa circostanza chiarisce
come la luce sia portata avanti dal mezzo in movimento. Consideria
mo questo fenomeno in dettaglio nel caso di velocità piccole. Poi
ché la quantità B = Vie è piccola, ometteremo nell’equazione (6.218)
tutte le potenze di B superiori alla prima. Avremo
232
Risolvendo nella stessa approssimazione le equazioni quadratiche
ottenute per co, otteniamo
“ ■ = ± T % - + « ' ( 1- js O - (6'220)
Dai due segni davanti al primo addendo del secondo membro
si deve scegliere il segno più, in quanto nel caso V = 0 ottenian o la
ben nota relazione fra co e k in un mezzo stazionario:
co _ j __
(6. 221)
ir
+ V c .s » (l- 4 - ) [(6.222)
T
Se la luce si propaga nella direzione opposta al m,oto del mezzo
(cos d = —1), allora
© c
k n (*
Il fattore (1 —1/rr) è il cosiddetto coefficiente di trascinamento della
luce che fu trovato sperimentalmente da Fizeau usando l ’ acqua
coree mezzo in moto.
Supporremo che le grandezze s e jjl non dipendano dalle ampiezze del campo
(il che assicura una relazione lineare tra i campi 2?0, H0 e le induzioni-D0» # 0»
rispettivamente). Comunque, e e p, possono dipendere, in generale, non solo
dai valori del campo, ma anche dalla frequenza co e dalla lunghezza d’ onda
X — 2 7i l k . Se s e jul dipendono solo dalla frequenza, si dice che ha luogo una
dispersione di frequenza. Ma se s e p dipendono dalla lunghezza d’ onda, il mezzo
si dice dotato di dispersione spaziale. v ;
Se le equazioni materiali (6.226) si sostituiscono nelle (6:225), si ottengono
le equazioni che contengono soltanto le ampiezze dei campi E q e H 0:
[ft, E0] = [MùHq, ^[kH0] = s(ùE0— ìgEQ9
s (ft£0) = 0S p{kH0) = 09
Nel seguito assumeremo che s e fx non si annullino. Quindi dalle ultime due
equazioni segue che i campi E0 e H0 sono perpendicolari al vettore d’onda ft.
Tali onde si dicono trasversali. Non considereremo qui le onde longitudinali che
si hanno, ad esempio, quando s = 0 (in questo caso è facile vedere che E0 jj ft).
Moltiplicando vettorialmente la prima equazione della (6.227) per il vettore
d’onda ft, si ottiene
[k[kE0]]=\i(ù[kH0]. (6.228)
Ora il valore di [kH0] si può prendere dalla seconda equazione della (6.227),
ed il doppio prodotto vettoriale si scrive con l’ ausilio della nota formula
[ft [kE0]J= ft (ft£0) - ft2£ 0= — ft2# 0.
Nell’ ultima equazione si è tenuto conto del carattere trasversale del campo E0l
cioè la relazione {kE0) ~ 0. Come risultato di queste trasformazion si ha
(ft2— epcù2— iacop) E0= 0. (6.229)
234
Consegue ate mente l’ ampiezza E0 dell’ onda elettromagnetica trasversale
in un mezzo conduttore stazionario può essere diversa da zero soltanto se è
soddisfatta la seguente equazione:
ft2— SfXG)2— iapcD = 0e (6*230)
Questa condizione si dice relazione di dispersione. Si può vedere facilmente che
la stessa relazione di dispersione (6.230) deve essere soddisfatta perché il vettore
magnetico H0 sia diverso da zero in un’onda trasversale. Per mostrarlo, è suffi
ciente moltiplicare vettorialmente per k la seconda equazione della (6.227)
e quindi far uso della prima equazione.
Assumiamo che la frequenza co dell’ onda sia una grandezza data e che il
campo dipenda soltanto dalla coordinata z e dal tempo. Perciò si possono rap
presentar i campi E ed H nella forma
E = E 0e{hz- ia,t, (6.23/i)
inoltre, come ciò segue dalla (6.227), possiamo assumere che il vettore E0 sia
diretto nel verso positivo dell’ asse x ed il vettore H0 in quello positivo del
l ’asse y. Quindi i tre vettori ft, E0ì H 0 formano una terna di vettori destrorsa.
Nel caso di una frequenza co fissata l ’equazione di dispersione (6.230) dà
per il vettore d’onda k i valori seguenti:
h ,2= ± c o y +
In queste formule bisogna prendere o tutti i segni in alto dell’ esponente o tutti
quelli in basso (nel caso in cui c’è una scelta tra « ± » o « + »). In questo modo
otteniamo le due soluzioni per i campi E , H : una proporzionale a
e- h"z9ei(k'z-(ùi) (6.237)
e l ’ altra proporzionale a
eh " z ^ (6.238)
A prima vista sembra che una di esse, (6.237), si smorza esponenzialmente
all’ aumentare di z (il fattore e~k"z)t mentre la seconda (6.238), aumenta espo
nenzialmente (il fattore ek"z). In realtà, ambedue le soluzioni rappresentano
235
onde smorzanti. Per assicurarcene, consideriamo^ ad esempio l ’equazione
(6,238). La si può trattare come un’onda del tipo
g-t(ft'z+cùi)) (6.239)
%— — p -1 + costante, (6.241)
E = EùeZfh"g•ei(±k'z~ ,
i ? = —— [ftE ] ( 6 . 2 4 3 )
JLICO 0i J
Così, per determinare l ’onda elettromagnetica libera piana in un mezzo
conduttore, bisogna specificare, non solo le caratteristiche del mezzo e, fi, cr5
ma anche la polarizzazione del campo, cioè, per esempio, la direzione e l’ am
piezza del campo elettrico E0.
Dalla soluzione (6.232) dell’equazione di dispersione (6.230) si vede che il
vettore d’ onda k è una grandezza complessa. Poiché si considera il caso unidi
mensionale in cui il campo dipende soltanto dalla coordinata z e dal tempo, si
può assumere che il vettore d ’onda k sia diretto lungo l ’ asse 2:
k = k' + ik\ (6.244)
dove entrambi i vettori k! e h " sono diretti lungo l ’asse 2. Quindi in accordo con
la terza equazione della (6.227), il vettore E0 è perpendicolare all’ asse 2. Suppo
niamo che il vettore sia diretto lungo l ’ asse x\
B0~ { E 0, 0 S 0). (6.245)
236
Quindi,
H 0— (0,0),
(6,247)
cioè il campo magnetico è diretto lungo Tasse y, come si vede dalla (6.243),
Per semplicità assumiamo che la grandezza E 0 sia reale. Allora è una
randezza complessa in quanto Tespressione per f f Q (6.247) include la grandezza
complessa k (6.232).
Rappresentiamo il vettore d’onda k nella forma
k = k'-\-ik"=> | i
dove, per semplicità, abbiamo usato soltanto i segni superiori nella (6.243).
Si vede da queste equazioni che in un mezzo conduttore le onde dei campi
elettrico e magnetico sono spostate in fase di un angolo tp — arctg (k"lkf).
Quando non c’è conduttività k" — 0 e lo spostamento in fase scompare.
I campi fisici reali E ed H non possono essere grandezze complesse, perciò
il significato fisico va attribuito o alla parte reale o a quella immaginaria dei=
l ’ espressione (6.249). Prendendo, ad esempio, la parte reale, otteniamo
k = coye|i + I ~ ~ (6.252)
Se il valore assoluto del secondo termine del radicando è molto minore del
primo (bassa conduttività), vale quindi la seguente approssimazione:
In questo caso
237
Si vede da queste formule che nel caso di bassa conduttività, la distanza L
a cui l’onda (6.250) si smorza di e volte, è inversamente proporzionale alla con
duttività
L= (6.255)
k"
* = (1 + 0 (6.256)
In questo caso le parti reale e immaginaria del vettore d’onda k hanno lo stesso
modulo. La distanza L entro cui l’onda si attenua di e volte è uguale a
dOh x, 7 dOf
dxk ■UkUt •
c2 -o\.iUk®h = 0,
dxfr
che è la generalizzazione della condizione (6.210) al caso di un mezzo conduttore.
Quando in un mezzo le sorgenti sh sono assenti, otteniamo dalla (6.262)
il seguente sistema. di equazioni omogenee:
239
Questa equazione di dispersione segue dall1equazione differenziale precedente
se si tiene conto che l’operatore di gradiente = dldr applicato ad un’ onda
piana del tipo (6.216) equivale a moltiplicare per —ik, e l’ operatore di diffe
renziazione rispetto al tempo d/dt equivale a moltiplicare per 10. Quando la
conduttività del mezzo o si annulla, l ’ equazione (6.263) si trasforma nella
(6.218).
Dopo avere assegnato la frequenza o> e la direzione di propagazione del
l ’ onda, si può definire il modulo del vettore d’ onda k (e, quindi, la lunghezza
d’ onda X = 2n/k) dall’ equazione (6.263). Inversamente, assegnati il modulo e
la direzione del vettore d’ onda si può determinare la frequenza dell’ onda co.
Se si assume data una di queste grandezze, k o 0, l’ equazione (6.263) diventa
un’equazione quadratica rispetto all’ altra. Questa equazione ha coefficienti
complessi, e perciò le sue soluzioni saranno complesse. Dalla forma dell’onda
(6.216) segue che se; la sua frequenza è complessa, l’ onda non è più monocroma
tica e si amplifica o si smorza esponenzialmente nel tempo. In questo caso
l ’ indice di smorzamento (0 di amplificazione) è uguale alla parte immaginaria
della frequenza 0. Se la parte immaginaria ©" della frequenza co è positiva,
Fonda si smorza, e se è negativa, Fonda si amplifica nel tempo.
Se sono assegnate nell’ equazione (6.263) la frequenza 0 e la direzione di
propagazione dell’onda (l’ angolo 0 fra V e &), otteniamo un’equazione quadratica
per il valore assoluto di k. La soluzione di questa equazione dà, in generale,
valori dì k complessi. In questo caso le due radici complesse coniugate del
l ’equazione (6.263) corrispondono all’amplificazione 0 allo smorzamento espo
nenziale dell’ onda nello spazio. In seguito ci limiteremo al caso di un piccolo
smorzamento, quando la parte immaginaria della soluzione dell’ equazione
(6.263) per k si può considerare piccola rispetto a quella reale. In questo caso
particolare il segno della parte immaginaria di k non definisce se Fonda si
amplifica 0 si smorza nello spazio. Infatti, sia k! + ik ” una delle soluzioni delle
equazioni (6.263) Gon 0 e 0 assegnati, con k' reale e k" immaginaria. La direzione
del vettore d’ onda è definita dal vettore unitario n in modo tale che
k — kn = (k' + ik") n.
Dirigiamo l’ asse z del sistema di coordinate cartesiane lungo il vettore n.
Allora Fonda (6.216) si scrive
A= -* r ) . ei«*t - fe'z) a (6.264)
Per lo smorzamento piccolo (k" <c &')> Fespressione (6.264) si considera come
la definizione di un’onda che ha vettore d’onda k! e la frequenza 0, l ’ ampiezza
di quest’ onda cambia secondo la legge esponenziale ek"z. Supponiamo che k"
sia una grandezza positiva. Per giungere a qualche conclusione riguardo al
comportamento dell’ onda, bisogna conoscere la direzione di propagazione
dell’ onda, cioè il segno della sua velocità di fase. La velocità di fase dell’onda
è uguale al rapporto 0//F. Infatti, il piano di fase costante dell’ onda (6.264)
è definito dalla relazione^ 0* — k'z — costante, da cui z = %-t — coS^ ? -t- 6
“ k k
Si vede dall’ultima relazione che il piano di fase costante viaggia con velocità
<ù/k'. Se co/k' >* 0, l ’ onda (6.264) si propaga nella direzione positiva dell’asse
Allora per k" > 0, Fonda si amplifica, e per F < 0, si smorza. Se calk' C 0,
Fonda si propaga nella direzione negativa dell’ asse 2. Allora per k" > 0 Fonda
si smorza nella direzione della sua propagazione (sebbene la sua ampiezza
aumenti nella direzione positiva dell’ asse z). Perciò per determinare se Fonda
si smorza 0 si amplifica, non basta conoscere la legge di variazione spaziale
dell5ampiezza, bisogna conoscere anche la direzione delia sua propagazione.
G’è un metodo semplice che rende possibile trovare se Fonda si smorza o si
amplifica nella direzione della sua propagazione. Analizziamo l ’espressione
<ùk"lk’ . Se questo prodotto è positivo, Fonda si amplifica nella direzione della
sua propagazione; nel caso contrario l’ onda si smorza. Si vede facilmente che
l ’espressione <ùk7fc'_ è il prodotto della velocità di fase dell’ onda per il decre
mento di smorzamento dell’ onda nello spazio.
240
Consideriamo ora la soluzione' deli’equazione di dispersione '(6.263:). Sia:Ji
ll modulo del vettore d’onda e la sua direzione formi un angolo 0^con vettore,
velocità V del mezzo. In questo caso kV — k V cos 0. L’equazione di dispersione'
(6.263) è un’ equazione quadratica rispetto alla frequenza©. Risolvendola nel
caso di bassa conduttività o e omettendo tutte le potenze di cr superiori al primo
ordine, otteniamo
co,, 2« = ( i + x r 2)- ‘ j [ x r w cos /À J +
+ (6.265)
dove x = ^ 2 , B=
Questa equazione mostra che se. nel riferimento del mezzo stazionario ep >*
> e0p0, cioè Per « — (?i2 — 1)/c 3 > 0, la parte immaginaria della frequenza
© è sempre positiva per entrambe le soluzioni, qualsiasi sia la velocità V del
moto del mezzo. Questo significa che per un dato vettore d’onda k l ’onda (6.216)
si smorza sempre nel tempo. Il decremento di smorzamento è proporzionale alla
conduttività <7.
Consideriamo ora il caso in cui le grandezze date dell’ onda (6.216) siano
la frequenza © e la direzione di propagazione, definita dall’ angolo 0. Allora,
dall’ equazione di dispersione (6.263) si può determinare il modulo del vettore'
d’onda k che corrisponde ai valori dati di © e 6. Le soluzioni di questa equazione:
hanno la forma klì2 ~ K,z + ^ ' 1,2- Per cr piccoli otteniamo dopo piccole tra
sformazioni
c /c '= G > (i+ x r 2) (xBr® COS0+ / À ) " 1,
2c r = — ca|xr(l— B2cos 20) ( l + B c o s e / a ) -1; (6.266)
e/c'= — co (xB r 2cos 0 + / À ) (1 — xB 2r 2cos29)-1,
2 ck'i= cojir (1 + B cos 0
Qui la grandezza A è sempre positiva per le assunzioni fatte in precedenza.
Usando la (6.266) si possono ottenere le espressioni per i prodotti (àk"lì2lk'lì2a
Esse hanno la forma seguente:
© __ gpc2P (1 — B2cos 20) (xBL 2c o s Q -f]/A )
1_ ~ 2 (1+ xr2) (l + B cos 0 / A) ’’
© __ ______o\ic2T (l-f-B cos 0 y A)
K2_ 2 (x B r 2c o s e + )/" A ) / A '
Si vede immediatamente da ciò che se x > 0, i prodotti ©AJ J k f 2sono sempre
negativi, qualsiasi sia la velocità del moto del mezzo. Questo significa che in
un mezzo conduttore in moto Fonda (6.216) si smorza sempre nella direzione
della sua propagazione. L’unica peculiarità del mezzo in moto consiste nel fatto
che per la velocità del moto del mezzo, soddisfacente la condizione
1 — xB 2F2 cos2 0 = 0 o B = 1/(1 + x cos2 0), le parti reale ed immaginaria
della seconda soluzione cambiano simultaneamente segno.
I potenziali ottenuti risolvendo le equazioni (6.211) e (6.262) si usano con
successo per risolvere altri problemi (vedi la bibliografia alla fine del libro),
molti dei quali però, non rientrano nello scopo del libro.
241
VII. FENOMENI OTTICI E TEORIA DELLA RELATIVITÀ
RISTRÉTTA
242
zioni della (7.1) conduce alle onde piane:
E = E 0e ^ ~ h>'\ (7.2)
dove co è la frequenza circolare (si assume che i vettori campo dipen
dano in modo armonico dal tempo, il vettore d ’ onda k sia diretto
lungo la normale alla superficie di uguali fasi (fronte d’ onda)).
Segue dalla (7.1) che il valore assoluto del vettore d ’ onda k è uguale
a (o/i? se le onde si propagano in un mezzo e ad co/c se si propagano
nel vuoto. Poiché n — Y sfx/e0Po> si può scrivere nel caso generale
k~ ~ ~ ns, (7.3)
dove s è un vettore unitario orientato lungo la direzione di propaga
zione. Nel caso del vuoto, n ■= 1. La fase dell’ onda (7.2) è uguale
a iùt — kr e perciò la superficie di uguali fasi è definita dall’ equazio
ne (ùt — kr — costante. Ad un dato istante essa rappresenta il
piano kr = costante, con il vettore della normale orientato lungo k
(r è il solito raggio vettore tridimensionale). Al passare del tempo
questo piano si sposta nello spazio parallelo a se stesso secondo l ’ equa
zione kr = costante - 4- gjt.
Le onde piane (7.2) devono soddisfare non solo le equazioni
d ’ onda (7.1), ma anche le equazioni di Maxwell (6.56) e (6.57) in
assenza di cariche (p = 0) e correnti (j = 0); sostituendo la (7.2)
nelle equazioni di Maxwell, otteniamo i risultati seguenti. In un’ on
da piana che si propaga in un mezzo uniforme i vettori E, H e k
formano una terna destrorsa, cioè sono mutuamente perpendicolari
e il prodotto vettoriale di ogni coppia, presa nell’ ordine indicato,
definisce la relazione del terzo vettore.
Per la relazione tra le ampiezze, vale la seguente equazione:
V yJI
mo E = cB.
La direzione del vettore di Poynting S coincide con quella del
vettore k , mentre il suo valore assoluto è uguale al prodotto della den
sità d ’ energia dell’ onda piana per la velocità di propagazione dell’ on
da v, cioè S = wv, o S = wv (k/k), dove w è la. densità d’ energia
dell’ onda elettromagnetica. Il risultato ha un chiaro significato
fisico: il vettore di Poynting determina il flusso di energia per unità
di tempo attraverso un’ area unitaria normale all’ onda incidente.
Ma l ’ energia che attraversa per unità di tempo l ’ area unitaria è con
tenuta dentro un cilindro, la cui direttrice è formata dal contorno
di quell’ area unitaria e le generatrici da rette parallele alla direzione
di propagazione dell’ onda. L ’ altezza del cilindro deve essere presa
uguale a v. In questo caso la grandezza v definisce il volume del cilin
dro costruito, ed il prodotto vw, l ’ energia del campo elettromagnetico
contenuta nel cilindro. Tutto ciò risulta in S — viv, È da notare
anche che per un’ onda piana
+p#2
~2
mentre nel vuoto w = SqE2.
243
L ’ impulso dell1unità di volume g (densità d'im pulso);del campo
elettromagnetico nel vuoto è uguale a &'le2 . Nel caso di onda piana
nel vuoto, quando S — cw, otteniamo g — (wlc) (klk)A da cui
g — wlc. (7.4)
La densità d’ impulso del campo in un mezzo verrà esaminata nel
§ 7 del presente capitolo. Ricordando gli invarianti I x è 12 del cam
po elettromagnetico (§ 6.5), troviamo che, nel caso di onda piana
nel vuoto, entrambi gli invarianti si annullano. Questo ^gnifica
che in qualsiasi riferimento i vettori E ed H dell’ onda piana sono
ortogonali, ed il rapporto tra le loro ampiezze è sempre lo stesso- Nel
riferimento 1C un’ onda piana deve prendere la forma
■E' = E\e^ (7.5)
La fase dell’ onda nel punto d ’universo R (r, ict) non può dipen
dere dalla scelta del sistema di riferimento, perciò la fase (ùt — kr
deve essere un invariante delle trasformazioni di Lorentzo Di com
seguenza, : ;
coi — kxx — k yy — k xz = o o t' — k'xx f — k'yy r — k'zzr. (7.6)
Sostituendo dalla (2.37) le formule di trasformazione per x ,.z/', z\ tf
nel secondo membro della (7.6), otteniamo
244
re d ’ onda conviene1soprattutto perché si ottiene Immediatamente la
regola per la trasformazione delle sue componenti nel passaggio da
un SRI ad un altro. Se un’ onda luminosa piana si propaga nel
riferimento K ' la sua direzione e la frequenza, osservata cambiano
passando al riferimento K. Vedremo che anche l ’ ampiezza dell’ onda
piana varia. Le equazioni di trasformazione delle grandezze che carat
terizzano l ’ onda luminosa nei riferimenti K e K ' si ottengono facil
mente se si tiene presente che in un’ onda luminosa piana il vettore
d’ onda Jc\ convenzionale e i ((o/c) formano il quadrivettore k.
i—
c =F \
( t ^c + 1 iB —
c c o s # 's)ì
o
1 + B cos U'
CO - co' coT (1 + B cos # '). (7.10)
] A — B2
Di conseguenza, se nel riferimento K ' la frequenza della luce è co',
nel riferimento K sarà differente, secondo la (7.10). (cfr. le (7.7)).
Segue dalla prima formula (7.9) che
— c o s d - P f— c o s r - 7 B i — )
c Ve c )
o, se viene considerata la (7.10),
cos + B
cos $ — (cos #' + B) = 1+ B cos {B (7.11)
La seconda formula (7.9) insieme con la (7.10), dà
/ 1 - B2 sin il'
sin ft = — s i n#' : r sin f t ' = (7.12)
0) 1-j-B cos 1 r ( l + B co sft') •
Usando le (7.11) e (7.12) si può facilmente trovare l ’ espressione di
sin ft' mediante ft:
sin d
sin ft' (7.12')
r (1 — B costì) ‘
T ~ T‘ V S -
Un osservatore che riceve la luce dalla sorgente che si allontana
da lui trova che la frequenza diminuisce.
246
Al contrario, quando il riferimento K r è alla sinistra di K
(fig 7.1, b) cos'd = 1 e la sorgente si avvicina all’ osservatore:
/■ 1 + B . T “1/ __ 2_
co = co,- o j /
1— B ,ioK 1t B
La frequenza della luce ricevuta dall’ osservatore aumenta rispetto
all’ autofrequenza naturale co0. A meno di termini in B2 le ultime
K K
Osservatore Sorgente
a)
Luce xx
K K
Sorgente 3=0 Osservatore
b)
V Luce
Osservatore
Fig. 7.1. Effetto Doppler longitudinale: a) l ’ osservatore e la sorgente si allonta.
nano; b) l ’ osservatore e la sorgente si avvicinano; c) effetto Doppler trasversale-
due formule si possono riscrivere come segue (il modo più semplice
è di moltiplicare sia il numeratore che il denominatore del radicando
per il numeratore):
co = coq ( 1 — B ), co =:==coq (1 B ).
Entrambe le formule si possono riunire.
co— co0 Ao) , ,,
----------= ------— -f- -D.
co0 co0
247
e dipende già da BN Se lé velocità del moto della sorgente sono non
relativistiche, lo sviluppo binomiale fornisce :
co = co0 (1 “ ” B1
2/2>.
Questo è un effetto del secondo ordine, e la sua osservazione è più
difficile delPosservazione dell’ effetto trasversale. Non bisogna mera
vigliarsi-se l ’ effetto Doppler trasversale è stato osservato, solo nel
1938 (Ives), e la formula relativistica è stata confermata in pieno h
Ci piace puntualizzare ancora una volta che nella teoria classica non
dovrebbe esistere nessun effetto Doppler trasversale (cfr. § 3.3).
L ’ effetto Doppler trasversale si manifesta soltanto a causa della
relatività degli intervalli di tempo fra gli eventi.
Riscriviamo la formula (7.13) nella forma usata nel § 6.15.
Raggruppiamo tutte le grandezze che riguardano il riferimento
K nella parte destra: ; .
<B0 = r w ( i —X cos ft) = r ( © — -j- v cos ft) = r ( o — . . 14)
248
§ 7.3. Onda piana limitata nello»
spazio. Trasformazione dell’ energia
e dell9ampiezza di un’ onda piana
( — w9 00 —ìw f
0 0 Q 0
(7J7>
0 0 0 0
Avremo bisogno anche delle componenti del tensore T'ik nel caso-
— iw' 0 0 ip'
di un’ onda piana che si propaga nel piano (x*, y f) ad un angolo d '
rispetto all’ asse x . Tale passaggio si effettua mediante una semplice
rotazione del sistema di coordinate; la matrice dr questa trasforma
zione di coordinate prende la forma
249n
colare di un teorema più generale 1). Per dimostrarlo dobbiamo
conoscere la formula che definisce il cambiamento di volume occu
pato dal treno d ’ onde nel passaggio da un riferimento inerziale ad
un altro. Le difficoltà che si incontrano derivano dal fatto che il
treno d ’ onde si muove alla velocità della luce c e ciò significa che
il volume del treno non può essere misurato nel proprio sistema di
riferimento (è impossibile introdurre un riferimento che si muove
alla velocità della luce!). Comunque, si può tralasciare d’ introdurre
un volume proprio, facendo un passaggio limite alla velocità della
luce. In questo caso, secondo la (3.28),
r = n / i (7.21)
— B2
Y1
r = r „ | / i — J ■ = r0 T r-
B cos d ' 1 + — B cos •&'
c
da seconda uguaglianza deriva dalla (3.41). Qui v' è la velocità del
moto nel riferimento K '. Ora, passando al limite z/-*- c, otteniamo
la formula richiesta
Y 1— B2
T = T r 1-| B c o s ù ' ’ (7.22)
250
<c per il tensore (7.19) le componenti
Tu = - i W (B + cos d ') (1 + B cos d ' ) ,
T 42 = — iTw' sin d ' ( 1 + B cos d ' ) , (7.25)
r 43 = o , r 44= r 2 w '( i + B c o s # ') 2-
Naturalmente, quando 0 ' = 0, le formule (7.25) si trasformano nel
le (7.24). Mostriamo ora che le componenti (7.25) e, quindi, nel caso
particolare, anche le (7.24), m oltiplicate per il volume o p erl’ ele-
mento di volume, si trasformano come vettori nell’opportuno sistema
•di riferimento. Infatti, ad esempio,
Ttld T — T ( — iw'cos d ' — ì B m;') = T (T'^dT' —
Ti3d r = T'ì3d T ' = 0, (7.26)
Tkkd T = T (w'+ Bin' cos d) d T ' = T (T'u d T ' +
Confrontando le formule ottenute (7.26) con le formule di tra
sformazione dei vettori, si conclude che le grandezze Tkl, 7’42, r 43, r 44,
•cioè le componenti della quarta riga del tensore (7.17) o (7.19)m olti-
plicate per l ’ elemento di volume corrispondente, formano un qua-
drivettore.
Naturalmente questo risultato si mantiene dopo l ’ integrazione
sul volume o la moltiplicazione per il volume totale, se le componenti
Tjf, del tensore non dipendono dalle coordinate come per il caso
d ell’ onda piana.
Troviamo l ’ energia totale del treno d ’ onde nel riferimento
•(vedi la (7.19))
U ' = \ f ' lidT'=\w'dT'.(7.27)
G’x =-Vf'^dT' = - f
4~ V
G'y = ~C J V ^ ' = 4 s C
i n d ', G’z = 0 .
c <7'28>
Calcoli simili si possono fare anche nel riferimento K\ le (7.25) per
mettono di compiere direttamente la trasformazione dell’ energia
totale:
252'
definibile; nel caso della radiazione d z — c d P , dove d P è la frazio
ne dell’ impulso che sfugge con la radiazione in una data direzione,
essendo noto che dz — cdP\
Secondo le trasformazioni di
Lorentz
dz' — Y (de - VdP) = r (de —-
— VdP cos ft) = Yds (1 — B cos ftj,
dt' — -^rdt
{ dt è il tempo proprio). D ivi
dendo termine a termine bugiia-r
glianza superiore per quella
inferiore, otteniamo
^T de ds>* 1 __
a i ~ ~1T = — (1 — Bcos ft) ~
— dr
f 2(1— B cos ft) *
Quindi otteniamo immediata Fig. 7.2. La variazione della distri
buzione angolare della . radiazione di
mente il risultato cercato: un oscillatore di dipolo nel passaggio
sin2 ft'^Q' da un riferimento K' in cui l ’ oscil
d i — costante « latore è a riposo (B — 0) 'ad! un rife
F2(i — B cos ft)
rimento K , rispetto al quale si muove
sin 2ft'dQ (B = 1/2). Si vede come il massimo
= costante « della radiazione si inclina verso la
F4 (1 —B cos ft)3
direzione di moto, dell’oscillatore.
L’asse dell’ oscillatore è orientato nella
( i — ‘— } sin2^ direzione del moto dell’ oscillatore.
= costante - ~7 y ~ dQ,
1 1—— cos ft
)
dove abbiamo usato le formule (7.16) e (7,12'). Si vede dalla formula
ottenuta che la dipendenza angolare della radiazione nel riferimen
to K, rispetto al quale l ’ oscillatore si muove, è essenzialmente diver
sa dalla dipendenza angolare nel riferimento K \ specialmente nel
caso in cui V ^ c. In questo caso il massimo della radiazione si
osserva in una direzione che forma un angolo acuto con l ’ asse dell’ o-
scillatore (fig. 7.2).
Vale la pena di considerare come si comporta nel riferimento
K una radiazione isotropa nel riferimento K ' . Abbiamo a disposizio
ne tutte le formule necessarie. In questo caso di' ($', < p ')= costan
t e \dQ' e
d i' costante
dl = dQ* =
F2(1 — B cos ft) F2(1— B cos ft)
costante °dQ r
r* (1 —Bcos d)2 ~ costante dQ.
(, V 3
1--------cos
c
253
D all’ultima formula si può vedere in K « Veffetto di un riflet
tore ». La radiazione si concentra attorno alla direzione = 0, ini
quanto il valore del denominatore è minimo per C os'O c 1 (con il
rapporto Vie fissato).
255
inflesso. Vogliamo trovare la frequenza e la direzione di propagazio
ne del raggio riflesso in termini del riferimento K.
E conveniente introdurre il riferimento K ' solidale con lo spec
chio. In questo caso il problema si risolve come segue. Nel riferi
mento K il quadrivettore del raggio luminoso è specificato, cioè
sono note la frequenza e la direzione di propagazione della luce. La
frequenza della luce e la direzione del raggio nel riferimento K f sono
'facili da trovare usando le formule di trasformazione di Lorentz.
Nel riferimento K ' in cui lo specchio è fermo è valida P usuale legge
di riflessione: l ’ angolo di incidenza è uguale all7angolo di riflessione.
Questo implica che il quadrivettore del raggio riflesso differisce da
quello incidente soltanto per il segno della componente lungo l ’ asse x
del vettore d’ onda. Per ottenere il quadrivettore del raggio riflesso
nel riferimento K , bisogna applicare ancora una volta le trasformazio
ni di Lorentz.
Ora nel riferimento K la luce si propaghi con frequenza o)0 sotto
un angolo u 0 all’ asse x nel piano (x, y ). Le componenti del quadrivet
tore k0 nel riferimento K saranno
= k\ = ^ -sin d 0i ks = = 0, (7.37)
256
Poiché k3 — k\ ~ 0, dopo la riflessione la luce rimane nel piano di
propagazione (x, y). Assumendo che
03 a
k. — —
c cos i h* = ~ sin d‘
2 c
(7.39)
34
/c3 = 0,
II
otteniamo dalla (7.38)
co _(1-f-B2)—2Bcos d0 (7.40)
iZrjp
Dì conseguenza5la frequenza co della luce riflessa osservata nel riferi
mento K non è uguale alla frequenza co0 della luce incidente.
Nel riferimento A la tangente
dell’ angolo di riflessione si ottie
ne nella forma seguente:
ta A — A — — sin (1 — B2)
' k± (1 + B2) cos ru0— 2B “
(7.41)
Si vede dalla (7.41) che di +=
=+ d 0; perciò V angolo di incidenza
e l ’ angolo di riflessione sono
diversi nel riferimento K
(fig. 7.4, a).
È interessante scrivere le for
mule che riguardano il caso di
incidenza normale della luce sullo
specchio. Sia d 0 = 0 l ’ angolo di
incidenza nel riferimento K.
Allora otteniamo
1— B q f
CO = C0Q -y j p -g - , COS U = — 1,
sm d = 08 (7.42) b)
Dalla (7.42) segue che anche la Fég. 7A « Riflessione della luce da
luce riflessa si propaga lungo la uno specchio in movimento, a). Lo
specchio si muove lungo la normale
normale allo specchio, sebbene al suo piano. Nella riflessione, la
in direzione opposta a quella frequenza cambia e l ’ angolo di inci
iniziale. Il riferimento K f in cui denza non è uguale all’angolo di ri
lo specchio è in quiete si muove flessione. b) Lo specchio si muove
parallelamente al suo piano. Nella
nella stessa direzione in cui si riflessione la frequenza rimane inva
propaga la luce. La frequenza riata; l ’ angolo di incidenza è uguale
della luce diminuisce nella ri a quello di riflessione.
flessione.
Se lo specchio si muove verso il raggio, la grandezza B cambia
segno, e quindi otteniamo
1+ B
03 = co0 c o s d ^ — l, s ind^O*
1— B *
La frequenza della luce aumenta nella riflessione.
2§7
Facendo uso di quest’ effetto, si può determinare la velocità di
un oggetto in moto, per esempio un’ automobile. Quando un’ auto
si muove verso un osservatore, la variazione di frequenza nella
riflessione si può determinare dalla (7.40) a meno di termini in
~ B2 (Aco = o) — o)0):
Aco 2B
2B . (7.43)
co0 ~ 1— B
Se, per esempio, la velocità di quest’ automobile è di 72 km/h =
20
= 20 m/s, allora B = -g-jog ~ 0 ,6 -IO-7. Questa variazione relativa
di frequenza può essere facilmente osservata con strumenti ordinari.
Abbiamo considerato il caso in cui lo specchio si muove lungo la
sua normale. ■Comunque lo .specchio si può muovere parallela
mente al proprio piano (fig. 7.4, b). In questo caso dobbiamo modi
ficare qualche cosa nelle formule usate. Le formule (7.33) e (7.34)
rimangono invariate. Comunque, il segno di k 2 si modifica nella
riflessione; perciò
k{ = r {k{ + iBk\), k; = - k°2ì k"3= k°3ì k\ = r (k\ - iBft°). (7.44)
Siccome k3 = k°3 = 0, il raggio riflesso rimane nel piano (x, y) come
prima. Ritornando al riferimento K , otteniamo
k t = T ( k { - iBkl) = A®, (7.45)
* 2 = -* a
°, (7.46)
A3 = 0, (7.47)
K = r (k'I + iBkl) = K- (7.4S)
Dalla (7.48) otteniamo immediatamente che co = co0 e scrivendo
t g $ = k j k ly troviamo che tg d = — t g d 0, cioè $ = — d 0. Quindi,
quando lo specchio si muove parallelamente a se stesso, la frequenza
della luce incidente è uguale a quella della luce riflessa, e l ’ angolo di
incidenza è uguale all’ angolo di riflessione (nel riferimento K ).
In conclusione, scriviamo le formule corrispondenti alla rifles
sione da uno specchio che si muove lungo la normale al suo piano
nell’ approssimazione non relativistica, cioè nel caso in cui la velo
cità dello specchio è piccola: B = Vlc<C 1. Trascurando tutti
i termini dell’ ordine di B2, otteniamo
co = (D0 (1 — 2B cos do),
cos d = — cos d 0+ '2B sin2 d 0,
sin d = sin d 0+ 2B sin d 0 cos d 0.
Nel caso di incidenza normale- sullo specchio (d0 = 0) il raggio
è riflesso in direzione opposta a queila iniziale mentre la frequenza
varia secondo la legge
258
se lo specchio si muove nella stessa direzione del raggio luminoso.
Se lo specchio si muove verso la luce, allora
(7.50)
259
sim ili a palle da biliardo. Questo concetto delle « particelle di luce »
è utilizzabile in pieno per descrivere lo scambio di energia e di im
pulso tra il campo e le microparticelle. Ricordando ciò, il concetto
di particelle di luce (chiamate quanti di luce o fotoni) non dà luogo
ad incomprensioni.
Quali proprietà bisogna attribuire al fotone per trattarlo come
una particella relativistica? Una delle proprietà del fotone da indaga
re, la relazione tra energia ed impulso, si può ottenere dall1elettro-
dinamica macroscopica. Infatti, la pressione P della luce che cade su
una parete nel vuoto è data dalla relazione (7.32)
P = g/c, (7.51)
dove % denota l ’ energia guadagnata dall’ area unitaria delia parete
per unità di tempo. Ora immaginiamo che i fotoni cadano sulla pare
te (nel seguito si vedrà che il fatto essenziale è che l 1energia e l ’ im
pulso si trasmettono per quantità discrete). Immaginiamo la luce
come un’ onda piana in modo che tutti i fotoni si muovono nella
stessa direzione. Supponiamo che ciascun fotone porti una energia s
ed un impulso p. Se l ’ unità di area della parete assorbe N fotoni
per unità di tempo, essa guadagna l ’energia Ne e l ’ impulso Np.
Ma l ’ impulso guadagnato dall’unità di area della parete per unità
di tempo è proprio la pressione della luce P 1 in modo che P = Np
ed % — Ne. Perciò] dalla (7.51) segue la relazione fra energia ed
impulso del fotone:
p = eie. (7.52)
Ma nel caso di particelle relativistiche la relazione fra l ’ energia,
Timpulso e la velocità del moto è stabilita dall1espressione p =
= (e/c2)v, da cui è chiaro che la relazione (7.52) è valida solo se
v = c. Allora, il fotone si può interpretare come particella relativi
stica se la sua velocità è c.
Come per ogni particella relativistica, si può costruire nel vuoto
—>
il quadrivettore energia-impulso P Qd, ie/c) di un fotone. Usando le
formule generali per il calcolo del quadrato del quadrivettore e tenen
do conto della (7.52), otteniamo P 2 =; 0. D ’ altra parte, per parti-
celle convenzionali P 2 = — m2c2 (vedi la (5.47)). Questo significa
che la massa a riposo del fotone è uguale a zero. Per permettere
alla particella (immaginaria) di raggiungere la velocità relativistica
lim ite, dobbiamo scartare la massa a riposo finita.
La massa a riposo del fotone si è dimostrata uguale a zero, e a
prima vista questo fatto sembra piuttosto inquietante. Siamo abi
tuati che ogni corpo e particella in natura possiede una massa fini
ta. Fino a tempi recentissimi la massa era considerata un attributo
261
da uno specchio in moto. In termini della teoria fotonica della luce
si può derivare facilmente la formula per la pressione della luce.
Infatti, supponiamo che un fotone cada sulla superficie di un corpo
con un angolo d. La componente normale del suo impulso è uguale
a frcocosd/c (fig. 7.5). Nell’ as
sorbire il fotone la parete gua
dagna proprio quest’ impulso
lungo la direzione normale. Se
il fotone è riflesso, il modulo
dell’ impulso trasmesso dipende
dal coefficiente di riflessione
(dalla probabilità di riflessione
del fotone), indicato con R.
Allora, la componente dell’ im
jFig. 7.5. Per il calcolo della pressione
pulso trasmessa perpendicolar
della luce. L’ area di base del cilindro mente alla parete per la riflessione
obliquo è uguale a S — i. del fotone sarà uguale a (1 + i?) X
X (.hcùìc) cosd, dove R ^ ì . Se n in
dica il numero dei fotoni in 1 cm3,
tutti i fotoni in un cilindro obliquo con la generatrice, uguale a c,
cadranno in 1 cm2 di area della parete in 1 s. Il volume di questo
cilindro con la base di 1 cm2 è uguale a c cos d. Di conseguenza,
nc cosd fotoni cadranno al secondo in un 1 cm2 di parete, e trasmet
teranno alla parete l ’ energia Kaone cosd (se tutti i fotoni sono assorbi
ti) e la componente normale dell’ impulso
L ’ impulso trasmesso all’ area unitaria della parete per unità di tem
po è proprio la pressione sulla parete; perciò p — w (1 + 7 ? ) cos2 d,
dove w = nhco è la densità d ’energia del fascio. Questo risultato
coincide con quello ricavato nel § 7.4.
Sfortunatamente, finora si introduce la « massa del fotone »,
definendola dalla formula presa dalla meccanica relativistica delle
particelle con massa a riposo finita, cioè mi = &/c2 (e = Koù). Prima
di tutto, la formula e = me2 vale esplicitamente per il caso in =+ 0
(vedi capitolo V) ed è abbastanza irrilevante per ni = 0. Inoltre, la
massa mt non ha nessun significato fisico. È anche privo di senso
parlare di proprietà inerziali del fotone: in tutti i riferimenti esso
si muove con velocità c, cioè un fotone nel vuoto non può essere
accelerato o rallentato (può essere solo distrutto). Nella statistica
quantistica i fotoni sono trattati come particelle identiche, il che
fornisce i risultati corretti. Comunque, se la « massa del fotone »
avesse qualche significato, il fotone « blu » dovrebbe essere « più
pesante » del « rosso », il che violerebbe l ’ identità delle particelle.
Al contrario, la sola proprietà comune dei fotoni è la loro massa
a riposo nulla. Qualche volta la massa del fotone mi si usa per spie
gare la deviazione di un raggio luminoso in un campo gravitazionale.
262
È più che incoerente, trattare un oggetto relativistico, come la
luce, in termini della meccanica classica. Nella teoria della relati
vità la deviazione della luce in un campo gravitazionale si ottiene,
certamente, senza introdurre una qualche massa del fotone. Infine
c ’ è qualcuno che vuole avere la « legge di conservazione della massa »
anche in fisica relativistica. Siccome la massa a riposo non è additi
v i (§ 5.6), nuove « masse» sono introdotte sulla base della relazione
m — g-le2. Questo è, comunque, piuttosto privo di senso in quanto
la conservazione di tale « massa » è proprio una conseguenza della
legge di conservazione dell’ energia che è sempre valida. Per riassu
mere, si può dire che l ’ introduzione della massa del fotone non dà
alcun vantaggio, complicando senza nessun bisogno il concetto di
massa (vedi §§ 5.6, 5.7).
Ritornando alla massa a riposo nulla del fotone, facciamo alcuni
commenti. Non c ’ è un SRI reale in cui il fotone è a riposo, e quindi
la massa a riposo del fotone non è una grandezza osservabile. (Altret
tanto privo di significato è parlare del passare del tempo nel riferi
mento solidale con il fotone). La massa nulla del fotone non significa
affatto assenza-, di massa. Per esempio, la temperatura di 0° C non
significa che il corpo è privo di un’ energia interna. Bisogna ricordare
che nella TRBBci sono lo linee d’universo di lunghezza nulla che
non sono meno significative delle altre. Certamente ciò è dovuto
alla velocità della luce che si distingue dalle altre velocità. Oltre
ai fotoni, nel vuoto ci sono altre particelle « reali », i neutrini, che
si muovono aneli’ essi alla velocità c. Anche la loro massa a riposo
è uguale a zero ed è una grandezza non osservabile. Dopo tutto, il
problema se il fotone ha massa nulla o no si può risolvere sperimen
talmente. Ci sono metodi in grado di evidenziare Pinfluenza della
massa a riposo del fotone se è diversa da zero. A mano a mano che.
questi esperimenti vengono condotti, il limite inferiore della « massa
a riposo » del fotone scende gradualmente più in basso. Alla fine del
1975 questo limite era arrivato al valore m <C 10“ 63 kg.
263
radiazione, cioè le condizioni imposto alla frequenza ed alla direzio
ne della radiazione. Queste condizioni sono definite dalle leggi di
conservazione dell’ energia e dell’ impulso. Comincerexno con ima
derivazione elementare della condizione per la radiazione di Vavilov-
Cerenkov.
In questo caso la radiazione è emessa da una particella che non
ha gradi di libertà interni. Scriveremo le leggi di conservazione per
il sistema elettrone-radiazione. Naturalmente, le leggi di conserva
zione di per sé non rispondono al problema di come si manifesta la
radiazione. Questo problema si risolve con calcoli basati sulle equa
zioni dell’ elettrodinamica. Comunque, se le leggi di conservazione
non valgono, la radiazione è assente a fortiori.
Supponiamo di aver emesso un quanto di luce. Se l ’ energia e l ’ im
pulso dell’ elettrone prima della radiazione erano g 0, p 0 e dopo di
ventano g 1? p ± le leggi di conservazione hanno la forma
= (7.53)
&P = Po— Pi= •
(7.57>
jPo — p n
o, in componenti,
Poi = Pz•
265.
Uguagliando queste due espressioni e tenendo presente che v0s =
— cosd, dove # ò l ’ angolo tra la luce emessa e la direzione del
moto dell’ elettrone, otteniamo
(7.59)
k'^-^-rccos tì', -y - ns
in tì', 0, (7.60)
.266
ed invece delle (7.11) e (7.12)
n cos ft' + B
n cos ft (7.62)
1+ Bn cos ft' 1
267
— B n cos# > 0 è valida fuori dal cono di Cerenkov (fig. 7.6), dove
si osserva l ’ effetto Doppler normale per cui (day/d'ù) > 0, come
K,
_
/ z
1
1
1
1
1 1
Vf= V
-1
x}x r
Fig. 8.1. Due particelle che si muovono Tuna verso l ’ altra si possono « avvici
nare » a velocità maggiore di c.
27©
Per determinare la possibile velocità di trasmissione del segnale
dobbiamo fare nel modo seguente. Un osservatore posto sulla parti-
cella 1 vuole trasmettere un segnale (informazione) mediante la
particella 2. A ll’ istante in cui le particelle viaggiano affiancate Puna
all’ altra egli invia un « pacchetto d’informazione» alla particella 2.
Ma la velocità con cui l ’ informazione lascia la particella 1 non è
affatto la velocità con cui varia in K la distanza fra le particelle*
ma è la velocità della particella 2 rispetto a quella 1. In altre parole*
la velocità di trasmissione di un’ informazione (segnale) e la distanza
percorsa dal portatore dell’ informazione per unità di tempo. La
distanza di per sé non può essere un portatore d’ informazione.
Dunque, per calcolare la velocità di trasmissione di un segnale*
bisogna calcolare la velocità della particella 1 rispetto alla 2 (o vice
versa). Allo scopo fissiamo un riferimento K° alla particella !..
Assumendo V — v, otteniamo i\ — 0 dalla formula generale
v— V
V ~~ 1 — vV■
Questo è un risultato ovvio, naturalmente: K r coincide con la parti-
cella 1. La velocità z;', si calcola come segue:
, — v— v 2v __ 2vie
v2~ iq -^ /c2 “ “ l + ua/ca “ i + i;2/c2
Questa è la velocità relativa delle particelle considerate. L ’ ultimo'
passaggio dell’ uguaglianza è stato scritto per dimostrare che v'2 C c.
La dimostrazione per il caso generale è fornita più avanti.
Siano vx = cqc, z;2 = a 2c le velocità delle particelle che si
avvicinano Luna all’ altra nel riferimento K; la teoria della relati
vità richiede solo che siano soddisfatte le condizioni a±<C. 1 e a 2 <7 1.
11 caso in cui a x <i 0,5 ed oc2 *< 0,5 non è dì grande interesse in quanto
in K non c ’ è alcuna velocità superiore a c. Supponiamo che a± + oc2 >
> 1;
Introduciamo un riferimento K' in cui v[ — 0; abbiamo già visto
che in quésto caso V = zq. Quindi
,_ v2— V _ — cuc — a xc a 1~j~a2
1 — v.2V/c* l-j-a-|Oc2 l - h a 1a 2 Co
Dimostriamo che ax + a 2 < 1 + a1a 2. Riscriviamo questa disu
guaglianza trasferendo tutti i termini del secondo membro: arla 2 —
ai — a 2 + 1 > 0. Raggruppando i termini, otteniamo
(oq — 1) (a 2 — 1) > 0,
che è corretta in quanto sono soddisfatte le condizioni imposte ad ax
ed a 2. Il caso considerato in precedenza corrisponde ad ax = a 2.
Quindi, in un dato. SRI una particella convenzionale (m ^ 0) non
può essere accelerata alla velocità c, né questa velocità hi può raggiun
gere come risultato di un passaggio da un SRI ad un, altro. Ma è an
cora possibile trovare in natura velocità che superano quella della
luce? "
271
Il primo esempio lo suggerisce immediatamente. Prendiamo un
.solido, una sbarra assolutamente rigida (corpo) e spingiamola.
Entrambe le estremità cominceranno a muoversi contemporaneamente
ed un segnale sarà trasmesso istantaneamente. Comunque, in questo
caso è erronea l ’ assunzione iniziale. Non ci sono corpi assolutamente
rigidi in natura. Tutti i corpi sono simili ad una molla di differente
rigidità. La trasmissione dell’ impulso (colpo o spinta) da un’ estremi
tà del corpo all’ altra si effettua sotto forma di moto di onde elastiche.
E la velocità delle onde elastiche nei solidi è molto minore di quella
della luce. Così, la TRR sottolinea ancora una volta che non esistono
corpi assolutamente rigidi in natura. Comunque, un cambiamento
d ’ impulso istantaneo richiede una forza infinita, anche nel contesto
della meccanica di Newton.
Benché la TRR limiti esplicitamente la velocità di trasmissione
del segnale, non ci sono restrizioni sulle velocità che non sono legate
alla trasmissione dei segnali e quindi possono superare c. Di solito
^ B
un paradosso consiste nei fatto che si rivela una certa velocità superio
re a c e si afferma che questa velocità è quella di trasmissione di un
segnale. N ell’ analisi finale, si può sempre mostrare che la velocità
considerata non ha relazione con la trasmissione del segnale. Consi
deriamo ora qualche esempio.
La retta AB si muove parallelamente a se stessa alla velocità Vx
(perpendicolare ad AB) ed anche la retta CD si muove parallelamen
te a se stessa a velocità V 2 (perpendicolare a CD). L ’ angolo fra le rette
è uguale a d. Qual è la velocità di spostamento del punto d ’ intersezio
ne M di queste rette (fig. 8.2)?
La velocità relativa dei punto M lungo la retta A B causata dal
moto della retta CD è uguale ad u2 = F 2/sin {h La velocità del moto
del punto M lungo la retta CD a causa del moto della retta A B
è uguale ad ux = Fj/sinft. La somma geometrica delle velocità ux ed u2
dà (fig. 8.2)
V m = i1T^
272
non si può utilizzare per trasmettere un segnale (informazione) in
quanto in ogni istante dato deve essere formato da nuovi punti delle
due rette (il punto d ’intersezione non può essere « segnato »).
È eli un grande interesse il caso di un’ incidenza obliqua di un’ on
da luminosa piana su un piano (fig. 8.3). Consideriamo il punto
d ’ intersezione del fronte d’ onda col piano x = 0 (il punto A nella
fig. 8.3). . Al passare del tempo questo punto si muove verso destra.
E facile trovare la velocità dello
spostamento: avendo scelto il seg
mento BD uguale a c, otteniamo
AD — c/sin'd. Ma AD è proprio
il cammino percorso dal punto A
per un’ unità di tempo, cioè la
velocità del punto A . P oich é.
sin'9*^1, questa velocità può facil
mente essere maggiore di c. Per
rendere più drammatica la situa
zione, immaginiamo che il piano
x = 0 sia coperto da uno strato Fig. SS, II punto di contatto di
luminescente. Quindi un punto un’ onda elettromagnetica incidente
luminoso viaggerà lungo Passe con |una superficie piana si può muo
più velocemente della luce. Sicu vere con velocità maggiore di c.
ramente, un punto luminoso, la
cui velocità è v >> c, si può realizzare in modo più semplice, per così
dire « manualmente ». Sistemiamo delle lampadine elettriche lungo
Passe x ed accendiamole una dopo l ’ altra (indipendentemente) da sini
stra a destra con un certo intervallo di tempo. Naturalmente si può otte
nere una macchia luminosa che si muove a qualsiasi velocità. Da
questo secondo esempio si vede che in questo processo non si trasmet
te e non si può trasmettere alcuna informazione, in quanto ciascuna
sorgente irradia indipendentemente. Ma è possibile ottenere velocità
maggiori di quella della luce mediante una rotazione relativamente
lenta di un corpo solido di raggio considerevole? Per esempio, un
disco di raggiro r — c che ruota con velocità angolare co ~ 1 avrebbe
alle sue estremità una velocità lineare y ^ c e superiore. Comunque,
una tale velocità non può mai essere raggiunta a causa delle proprie
tà relativistiche dell’ equazione del moto. Non appena la velocità
lineare di alcune parti del corpo aumenta, le forze richieste per
accelerare queste parti diventano sempre] maggiori, e di conseguen
za la velocità lineare delle parti più lontane del corpo non può supera
re in ogni caso e.
Se è impossibile ruotare un corpo solido, proviamo a ruotare un
raggio di luce.. Poniamo nell’ origine delle coordinate un riflettore
e facciamolo ruotare con velocità angolare Q. Circoscriviamo una
sfera stazionaria di raggio c attorno all’ origine. Quindi il riflesso
viaggerà lungo la superficie di questa sfera alla velocità lineare
V — QCe
273
Questa velocità può superare la velocità della luce. Un esempio di
tale raggio lo può fornire « un punto luminoso » da una pulsar ruotan
te. Il « punto luminoso » della pulsar della Nebulosa del Granchio*
viaggia sulla superficie della Terra alla velocità di circa IO24 cm/s.
Ma come nel caso precedente non viene trasmesso alcun segnale
a questa velocità. Infatti, ogni punto dello schermo (la Terra) riceve
mia nuova porzione d’ energia luminosa dal riflettore (pulsar), ma
non dai punti vicini dello schermo. Perciò, è impossibile trasmettere
un’ informazione da un punto all’ altro dello schermo.
Infatti, la stessa idea si può realizzare come segue. Uri raggio
luminoso dalla sorgente I cade su uno specchio formato da varie facce
che ruota con frequenza angolare
or. A seconda della frequenza o>
e della distanza dallo schermo,
si può ottenere un moto del raggio
luminoso (Timmagine della sor
gente) con una velocità lineare
superiore a c. Costruiamo uno
specchio riflettente a forma di un
elissoide e poniamo uno specchio
rotante in uno dei suoi punti
Fig. 8.4. Un « riflesso » da uno spec focali (fig. 8.4). Quindi iTraggio-
chio ruotante e che corre lungo lo
schermo lontano può muoversi con riflesso dallo specchio passerà
velocità maggiore di quella della attraverso il secondo punto focale
luce c. secondo la ben nota proprietà di
una superficie ellittica. In questo
secondo punto focale si può sistemare un ricevitore-analizzatore.
Il riflesso che si muove lungo lo specchio rappresenta l ’ immagine
della sorgente indipendentemente dalla velocità del punto.
La velocità di fase delle onde elettromagnetiche in un mezzo può
essere maggiore della velocità c. La velocità di fase delle onde in un
mezzo v è definita dalla formula v = chi, dove n è l ’indice di rifra
zione. Ci sono casi in cui l ’ indice di rifrazione n < 1 e, quindi,
v > c. Tutti questi casi sono connessi ad un mezzo ed a certe frequen
ze delle onde elettromagnetiche. Per esempio, molte sostanze hanno
un indice di rifrazione n <i i nel campo dei raggi X duri. La stessa
disuguaglianza vale per il plasma. Ma anche in questo caso non c ’ è
contraddizione con la TRR. Il fatto è che la velocità di trasmissione
del segnale non è definita dalla velocità di fase. In un mezzo disper
sivo, cioè in un mezzo il cui indice di rifrazione dipende dalla fre
quenza della luce che lo attraversa, un segnale si può trasmettere
mediante onde elettromagnetiche il cui spettro di frequenze è suf
ficientemente stretto (gruppo d’ onde). La velocità del segnale è la
velocità dell’ energia trasmessa da questo gruppo; come mostra un’ a
nalisi più dettagliata (vedi [36]), la velocità di trasmissione dell’ e-
nergia (dell’ « ampiezza del gruppo ») è definita dalla velocità di
gruppo. Ma la velocità di gruppo risulta sempre minore di c con
l ’ eccezione della regione di dispersione anomala, dove la velocità di
2 74
gruppo supera formalmente c . In questa regione, però, il concetto di
velocità di gruppo, e quindi di velocità di trasmissione del segnale,
perde senso. Perciò con processi ondulatori, un segnale si trasmette,
sempre a velocità minore di c.
x0
a) b) c)
Fig. 8.5. Un telaio rettangolare sulla cui diagonale è sospeso un filo elastico che
tende una sfera m. a) L ’ aspetto dell’esperienza nel sistema di riferimento pro
prio K°; b) lo stesso osservato nel riferimento K; c) seia sfera è rimpiazzata da
un manubrio, esso subisce l ’azione di una coppia di forze nel riferimento K.
275'
Si vede da ciò che l ’ uguaglianza (8.1) non vale più; nel rifer-
mento A F angolo che definisce la direzione del filo e quello che defini
sce la direzione delle forze non sono affatto uguali:
tg a ' = b!a = (&a/a0) (1 — B2)1/ 2= F-1 b0/a0= tg a 0/F,
tg a"= F J F ly=
276
componenti deli’ accelerazione si possono scrivere nel modo seguente:
m d v jd t = [Fix - {Vìe*)= (8 . 6)
m dvy/dt = F iy/T; (8.7)
abbiamo tenuto conto che la velocità della sfera coincide con la
velocità del riferimento K , cioè è uguale a F e ha componenti (F, 0,
0); Flx e F ly sono le componenti della forza nel riferimento K 1. Per
trovare la direzione dell’ accelerazione in K, dividiamo termine a ter
mine l ’ (8.6) per P(8.7):
dvJdvy — ( FiJ F iy)lY2‘ = V tg a 0IT2 = tg a 0/T — tga% (8,8)
dove nel terzo passaggio della catena di equazioni si è utilizzata la
formula (8.5) e nell’ ultimo l ’ (8.4). Ma si vede dall’ (8.8) che l ’ acce
lerazione in K all’ istante iniziale è anch’ essa diretta lungo il filo,
e non c ’ ò alcun paradosso.
Immaginiamo, comunque, che invece della sfera pensata come
puntiforme, i fili tendano un solido, ad esempio unjmanubrio.
Quindi nel riferimento K sulle sfere del manubrio agirebbe una cop
pia di forze (fig. 8.5, c) ed il manubrio si sposterebbe rispetto alla
diagonale del telaio.
È ovvio, comunque, che nel riferimento proprio l ’ asse del manu
brio coincide con la diagonale del telaio. Certamente, si cade in un
paradosso. Questo paradosso rappresenta un caso del ben noto parados
so della leva, che ora discuteremo. Supponiamo che una leva sia
a riposo nel riferimento K° (fig. 8.6). Esso è in equilibrio malgrado
che su di esso agiscano due forze, F°x ed Fy, ciascuna delle quali
1 È facile convincersi che le (8.6) ed (8.7) corrispondono a due casi eccezio
nali deir equazione relativistica in cui forza ed accelerazione sono parallele;
in un primo tempo le masse corrispondenti furono dette in questo caso « trasver
sale » e «longitudinale». Ora queste definizioni alquanto incongruenti sono
state tralasciate sebbene rendano bene il carattere tensoriale della relazione tra
la forza e l ’ accelerazione in meccanica relativistica.
277
è diretta lungo i rispettivi assi coordinati. L ’equilibrio è assicurato
dall’uguaglianza dei momenti delle forze in i l 0:
F h l = 'l(F8,9)
questi momenti sono orientati in direzione opposta.
La stessa leva si può considerare in termini del riferimento K
rispetto al quale la leva si muove rigidamente con velocità V. Scri
vendo l ’ espressione per i momenti delle forze F x ed F y in K , si nota
che esse non sono più uguali, e, di conseguenza, appare un momento
risultante delle forze agenti sulla leva. Infatti, secondo le (5.34)
e (3.5) abbiamo
f x= f I
ix = i x0 y i - B \
La differenza dei momenti delle forze F x ed F y produce un mo
mento di rotazione in K
L = F xlv- F ylx = F l l l - { i - W ) Fyfx = B*zFylx— (8.10)
dove viene usata l ’ (8.9). Il paradosso consiste in ciò: sebbene sia
ben noto che la leva è in quiete, nel riferimento K sulla leva agisce
il momento di forze e, quindi, la leva dovrebbe essere in rotazione.
La brillante soluzione di questo paradosso fu opera di Lane. Ci siamo
■abituati al fatto che un momento della forza induce una rotazione;
in altre parole, causa la comparsa di un momento dell’ impulso del
sistema. Nel riferimento K il momento della forza definisce infatti
la velocità con cui aumenta il momento dell’ impulso, ma quest’ au
mento non è associato alla rotazione della leva. Allora da dove pro
viene Lincremento del momento dell’ impulso? Consideriamo il
lavoro compiuto dalle forze F x ed F y nel riferimento K. In questo
riferimento la leva si muove, e la forza F x compie il lavoro —FXV
per unità di tempo. La forza F y non fa lavoro in quanto è diretta
perpendicolarmente alla direzione della velocità della leva. Di con
seguenza, all’ estremità della leva, nel punto di applicazione della
forza F x, si compie un lavoro, e l ’ energia delia leva in quel punto
aumenta della quantità —F XV per unità di tempo. Questo significa
che la massa della leva nel punto di applicazione della forza aumen
ta di —FxV!c2 per unità di tempo. Moltiplicando questa grandezza
per la velocità V della leva, otteniamo l ’ incremento dell’ impulso
—F xB2. Quindi il momento dell’ impulso aumenta di —F xl yB2 per
unità di tempo. Questo è proprio il momento addizionale (8.10).
Quindi il momento addizionale non descrive una rotazione, ma defini
sce la velocità con cui varia il momento dell’ impulso del sistema.
Questa spiegazione ha alcuni punti deboli. Nella TR.R non esistono
corpi assolutamente rigidi, e dobbiamo ammettere la deformazione
della leva; nel ragionamento precedente si è assunto implicitamente
che la leva mantenesse la sua forma. Nel riferimento K° dobbiamo
considerare i bracci della leva piegati sotto l ’ azione delle forze
Fi ed F I
278
Considerando la leva, ricadiamo in un altro risultato paradossale.
Supponiamo che non agisca nessuna forza fino all’ istante £ = 0 in cui
F[ ed « sono accese » istantaneamente nel riferimento K°. In ogni
istante viene mantenuto l ’equilibrio nel riferimento K°. Nel riferi
mento K le forze non si accendono contemporaneamente e c’ è un in
tervallo di tempo in cui la forza F1 è già in azione mentre la forza F 2
non è ancora « accesa ». Di conseguenza, compare un momento della
forza. Infatti, il seguente esempio mostra che sono qui essenziali
proprio le forze applicate in punti diversi del corpo (il paradosso
appare, ovviamente, nel considerare dei solidi). Nel riferimento
K° poniamo un solido di lunghezza 1° lungo l ’ asse x°. Fino all’ istante
t — 0 non agisce su di esso nessuna forza, e all’istante t = 0 da ambo
i lati vengono accese forze uguali, dirette in versi opposti. Nel riferi-
menio K° viene mantenuto sempre l ’ equilibrio, mentre nel riferi
mento K c ’ è un intervallo di tempo in cui le forze non sono bilanciate
e quindi il corpo deve cominciare a muoversi. Lasciamo questo para
dosso all’ analisi del lettore.
§ 8.3. Tachioni
Questo nome viene attribuito alle particelle la cui velocità supera
quella della luce nel vuoto. Fin dall’ inizio bisogna chiarire che si
sta parlando di particelle ipotetiche: finora i tentativi di osservare
sperimentalmente queste particelle sono falliti. Ma la stessa idea
della loro esistenza sembra paradossale: la velocità finita della tra
smissione dei segnali è fondamentale nella T R R , e la velocità limite
è proprio la velocità c. Sicuramente, la velocità di per sé non ha
restrizioni (vedi § 8.1), ma la propagazione dell’ impulso e dell’ ener
gia è trasmissione di un segnale. Il moto delle particelle cui si è fatto
riferimento può servire da segnale. Inoltre, le particelle ordinarie,
aventi una massa a riposo finita, Desistenza delle quali è ormai fami
liare, non possono raggiungere la velocità della luce. Dall’ equazione
relativistica del moto di tali particelle segue che la velocità della luce
si può raggiungere solo dopo un tempo infinito (per non accennare
al fatto che l ’ energia necessaria sarebbe infinita). Allora il problema
dell’ esistenza nel nostro universo convenzionale di particelle più
veloci della luce non si pone nemmeno.
Si può, comunque, assumere che esiste uno speciale gruppo di
particelle la cui conversione in particelle ordinarie e viceversa
è impossibile. Queste particelle potrebbero essere generate in certe
trasformazioni nucleari con velocità maggiori di quella della luce
dall’ inizio della loro esistenza. L ’ assunzione riguardo la generazione
dei tachioni è la stessa della descrizione della generazione dei fotoni:
dall’ inizio i fotoni si generano con la velocità della luce, e non com
paiono « dinamicamente » come risultato dell’ accelerazione di parti-
celle convenzionali.
Come nel § 3.5 si può mostrare che se la velocità di una particel
la v supera la velocità della luce c in un SRI, ciò accade in ogni
279
altro SRL Di conseguenza, le particelle convenzionali (fotoni)
e i tachioni formano gruppi separati; è impossibile un passaggio da
un gruppo all’ altro mediante accelerazione; il passaggio da un SRI
ad un altro lascia la particella nello stesso gruppo a cui apparteneva
nel SRI iniziale,,
Assumendo l ’ esistenza di queste particelle, consideriamo le im
plicazioni cinematiche di tale assunzione.
Dunque, assumiamo che la velocità v del tachione (determinata
con mezzi convenzionali) sia maggiore di c, cioè p = (vie) > 1.
Perciò per l ’intervallo fra due eventi, le posizioni di un tachione
in due punti dello spazio in due istanti di tempo, otteniamo come al
solito (il moto unidimensionale lungo l ’ asse x')
ds2 = c2dt2 — dx2 = c2 (1 — p2) dt2.
280
il sistema di riferimento, si può ottenere il moto del tachione nella
direzione opposta dello spazio e scoprire in un sistema di riferimento
F assorbimento di un tachione invece della sua emissione.
281
Ora torniamo all’inversione temporale della sequenza degli
eventi e, in particolare, allo scambio tra « emissione » ed« assorbi
mento». À prima vista, questa situazione contraddice la nota
relazione causa-effetto. Infatti, supponiamo di sapere che la sor
gente dei tachioni è posta nel punto 0. La sorgente è la « causa »
della generazione dei tachioni. Il moto di un tachione verso P
è r « effetto » della generazione del tachione. L ’ osservazione nel
riferimento K' mostra, però, che il tachione lascia il punto P e viene
assorbito nel punto 0. Non L iporta quanto possa sembrar strano,
bisogna ammettere che la sequenza osservata non contraddice le
relazioni causa-effetto, chiarendo bene cosa intendiamo. Per esem
pio, si può ragionare come segue.
Supponiamo che A sia la causa e B l ’ effetto, se una ripetizione
dell’ evento A agli istanti Zx, Z2, . . . scelti in modo arbitrario
produce senza dubbio il verificarsi dell’ evento B agli istanti t± -f-
+ T, Z2 + T, • • •In questo caso sono essenziali le ripetizioni control
late dell’evento A e la loro correlazione con Pevento B. In questo
senso le relazioni causa-effetto non dipendono da quale evento avvie
ne « prima » e quale « dopo ». La sequenza temporale degli eventi
non è coinvolta nella definizione della relazione causa-effetto e non
si può usare per stabilire la differenza tra la causa e l ’ effetto.
Nel nostro esempio l ’ evento da controllare nel riferimento K'
è l ’ assorbimento di un tachione. Questo assorbimento controllato
sarà sempre, preceduto dal moto del tachione da P a 0. Dobbiamo
considerare l ’ assorbimento del tachione come causa ed il suo moto
come effetto. La definizione di causa-effetto citata è in conflitto
con l ’ affermazione usuale secondo cui « il senso assoluto della nozio
ne di « prim a» e « dopo »... è un requisito essenziale perché abbia
senso il concetto di « causa » ed « effetto »». Naturalmente, se la
« causa » e « l ’ effetto » avvengono nello stesso punto dello spazio
{in un dato SRI), la causa deve precedere l ’effetto. Ma allora l ’ inter
vallo fra gli eventi è del genere tempo a fortiori, ed in ogni SRI l ’ effet
to avviene « dopo » la causa. I tachioni si comportano invece in
modo differente. Tutti gli « eventi » che coinvolgono i tachioni
avvengono, dal nostro punto di vista, in punti diversi. La sequenza
inversa di eventi non è di alcun significato.
Quindi, la sequenza temporale inversa degli eventi non contrad
dice le nozioni convenzionali di causa-tempo. Comunque, bisogna
soddisfare a tutti i costi una condizione. È impossibile influenzare
il passato dal presente. Un segnale inviato da un dato punto dello
spazio non può raggiungerlo prima di essere stato inviato.
Se i tachioni fossero usati come segnali, sarebbe possibile, come
si vede dalla fig. 8.9, inviare un segnale in modo che un altro segnale,
causato dal primo, raggiunga il punto iniziale (ciclo causa-effetto)
prima che venga emesso il primo segnale. La fig. 8.9 mostra le linee
d ’universo di due corpi, I e / / , che erano inizialmente in quiete, in
seguito si sono mossi di moto rettilineo ed uniforme con uguali
velocità ed infine sono tornati di nuovo in quiete. I punti d ’universo
282
A e A ' giacciono sulla linea di simultaneità die coincide per entram
bi i corpi in moto. I punti d ’universo C e C giacciono sulla linea
di simultaneità che coincide con entrambi i corpi in quiete. La
figura illustra anche le linee d ’universo dei due segnali più veloci del
la luce A B e CD. Avendo inviato il segnale A B e poi (dopo la ricezio
ne del segnale AB) l ’ altro segnale CD, si riceverà il segnale CD nel
punto D prima che sia inviato il segnale da A .
Perciò, abbiamo ottenuto l ’esempio di un ciclo chiuso causa-
effetto che indica esplicitamente la possibilità di esercitare un’ influ
enza sul passato. Certo, questo risultato riguarda tutti i segnali che
si muovono più veloci della luce, ma se è applicato ai tachioni, ciò
significa che i tachioni stessi (a differenza delle particelle convenzio
nali) non possono servire come segnali.
Se si assume che i tachioni esistono e sono soddisfatte le richieste
■del ciclo causa-effetto, la possibilità di invertire la sequenza tempo
rale degli eventi per i tachioni permette di sfuggire a un’ obiezione
legata alle proprietà « dinamiche » di queste particelle. Se si assume
che le relazioni fondamentali della TRR valgono per i tachioni,
dalle formule di trasformazione per la velocità e l ’ energia della
particella (vedi capitoli III e V)
r = rg(i-pB)
•segue che l ’energia del tachione diventa negativa in quei riferi
menti in cui è scambiata la frequenza degli eventi (e dove la velocità
cambia di segno in quanto Ai e Al' sono di segno opposto). L ’energia
2 83
negativa di un tachione è inammissibile in quanto essa implica la
possibilità di ottenere energia illimitata. Infatti, la generazione di
una coppia di tachioni, uno con energia positiva e V altro con ener
gia negativa, non richiederebbe energia, e il tachione con energia
positiva potrebbe compieife lavoro utile.
Abbiamo visto, comunque (vedi fig. 8.8), che se nel riferimen
to K si osserva l ’ emissione e l ’ assorbimento di un tachione, nel
riferimento K ' dove la velocità del tachione soddisfa la condizione
v > c3/F, lo stesso processo si può descrivere come l ’ assorbimento
di un tachione in moto opposto e possedente energia positiva. Questo-
fatto permette di evitare le difficoltà associate con l ’ energia negativa..
Infine, alcune notazioni suLTimpulso e l ’ energia dei tachioni.
Nel caso unidimensionale (px = p) la TRR (vedi capitolo V) fornisce
la seguente equazione:
§2 __ p *c* _ m2c\ (8.11)
v - d%ldp. (8 . 12)
284
intervalli di tempo mediante il tempo proprio. Naturalmente,
possiamo facilmente rifiutare le grandezze « proprie » consideran
dole inosservabili»
Consigliando al lettore altri testi per i dettagli, riassumiamo.
Negli ultimi anni sono stati compiuti diversi tentativi per analizzare
le proprietà delle particelle, la cui velocità supera in termini
285
Si abbia nel riferimento K' un corpo in quiete e supponiamo che
vengano registrati due eventi nel punto x agli istanti t[ e £' secondo
un orologio in moto insieme con il corpo ed il riferimento K ' . L ’ in
tervallo t'2 — 1[ è l ’ intervallo di tempo proprio indicato con à t .
Gli stessi due eventi saranno registrati dagli osservatori di K in due
punti del riferimento K agli istanti tx e t2 mediante due orologi.
L ’ intervallo di tempo fra gli stessi due eventi sarà uguale a At —
= t2 —' t1. Sappiamo che
A t - 1 / T h ^A^, (8.13>
cioè l ’ intervallo di tempo proprio tra gli eventi è minore dell’inter
vallo tra gli stessi eventi registrato dagli orologi del riferimento
rispetto al quale il corpo si muove (cfr. § 3.3).
La formula (8.13) mostra chiaramente un’ asimmetria nello
scorrere del tempo. Si può argomentare come segue. Poiché tutti
gli orologi di K sono sincronizzati, l ’ intervallo At misurato da
orologi diversi di K può considerarsi come un intervallo misurato-
dallo stesso orologio di K. Allora risulta che le indicazioni dei duo
orologi identici in due SRI, K e K r, sono diverse. Ma la TRR è basata
sulla completa simmetria dei sistemi inerziali! E questa simmetria
esiste! Abbiamo dimenticato un punto importante nel nostro ragio
namento. Visto che la simultaneità è relativa, gli orologi sincronizza
ti in un sistema di riferimento non lo sono in mi altro. La sincroniz
zazione degli orologi è relativa! La grandezza At non è affatto l ’ in
tervallo di tempo proprio dell’ orologio del riferimento K. Facciamo
il calcolo richiesto.
Supponiamo che l ’ orologio I I I sia in quiete all’ origine del
riferimento K' che si muove con velocità V rispetto a K. L ’ orologio I
sincronizzato nel riferimento K e in riposo in esso si trova nel punto-
xx = a e l ’ orologio IT nel punto x 2 = b.
La coordinata variabile dell’ orologio I I I nel riferimento A
è uguale a x 3 = Vt. Di conseguenza, le coordinate degli orologi I +
I I e I I I nel riferimento K saranno le seguenti:
x1 = a (per l ’ orologio / ) , (8.14)
x 2 z=- b (per l ’ orologio II), (8.15)
x 3 = Vt (per l ’ orologio II I). (8.16)
Dalla formula di trasformazioni di Lorentz (2.11) x = F (x +
+ Vt') si può ottenere la dipendenza dal tempo tr della coordinata x r
nel riferimento K ' e della coordinata x in K nella forma seguente:
* '= ~ V t ' + -
In questo modo troveremo x'v x'2; per quanto riguarda x'3, è ovvio
che ^g — 0. Di conseguenza,
x[ = —Vt' + a/T (per l ’ orologio /) , (8.17)
x'2 = —Vt' + bIT (per l ’ orologio II), (8.18)
x'3 — 0 (per l ’ orologio III). (8.19)
286
Come al solito, si assume che le indicazioni degli orologi eli due
riferimenti siano confrontabili, quando gli orologi sono posti nello
stesso punto. Quindi si possono fare i confronti seguenti. Primo,
le indicazioni dell’ orologio I I I si possono confrontare con quelle
dell’ orologio I quando gli orologi sono vicini; denoteremo le rispet
tive letture con t[ e tx\ secondo, si possono confrontare le letture
degli orologi I I I e / / , quando, l ’ orologio I I I si trova vicino a I I ;
Fig. 8.11. Spiegazione della totale simmetria di due sistemi di riferimento iner
ziali rispetto al « rallentarsi » temporale. In ogni sistema di riferimento l ’ inter
vallo di tempo proprio tra due eventi risulterà minore dell’intervallo tra gli
stessi eventi misurato da due orologi di un qualsiasi altro SRI.
= = (8.20)
287
segna l ’ orologio I I quando dì fronte all’ orologio I I I si trova Toro
logio / . Analizziamo la situazione in termini del riferimento K ' .
Quando Porologio I I I si trova di fronte all’ orologio I, esso segna
il tempo t[ = alVY. L ’ orologio I I si trova alla distanza x 2 — —
= (b — a)/T dalLoroìogio I (vedi le (8/17) e (8.18)). Ma quando
l ’ orologio I si trova di fronte all’ orologio I I I , le loro coordinate
sono x[ = xz — 0. Perciò, x'2 = (b — a)/T è la coordinata dell’ oro
logio I I nell’istante in cui gli orologi I I I e I coincidono. Ora è facile
trovare la lettura dell’ orologio I I in quell’istante. Introduciamo
x ' = (b — a)/T e t[ = a /FT nella formula
i= r ( r .
t= PQ + F —f — = z h Jr ’-^r (8.21)
6 = 7F (b — a),
che aumenta quando gli orologi si allontanano uno dal alPtro. Abbia
mo già ottenuto questo risultato nel § 2.4. Poiché nel riferimento K
la distanza b — a = V (t2 — £*), la lettura dell’ orologio I I sarà
t = tx + (F/c2) (t2 — lx). Mettendo insieme la differenza del tempo
segnato e di quello calcolato £, otteniamo
Ì2— Ì = (É2— t i ) ~
o 9 secondo F(8.20),
* * -* = (? ;-* * ) f • .
288
Questa è soltanto la spiegazione introduttiva. Il paradosso degli
orologi è, ovviamente, diverso. Supponiamo di confrontare la lettura
di due orologi: uno dal riferimento K e uno da K ' . Naturalmente,
immediatamente dopo il confronto gli orologi divergeranno e si
allontaneranno sempre di più. Ma se noi portiamo indietro in qual
che modo uno di questi orologi al punto in cui è posto l ’ altro orolo
gio e confrontiamo di nuovo le due letture, che cosa dobbiamo aspet
tarci? È la risposta a questa domanda che costituisce il paradosso
dell’ orologio. La risposta non è affatto semplice, e invitiamo il
lettore ad armarsi di pazienza.
Prima di tutto, notiamo che tutte le formule della TRR sono
grandezze misurate in termini di sistemi di riferimento inerziale.
Tutte le misure di tempo condotte nella TRR sono compiute me
diante orologi in quiete in uno o nell’ altro SRI. Dopo aver confron
tato una volta due orologi, non siamo più in grado di metterli insieme
nello stesso punto dello spazio senza portarli fuori del sistema di
riferimento in cui sono in quiete durante il confronto iniziale.
289
logio / posto nell1origino di K (la linea 61D), l ’ orologio I I a riposo*
nell1origine di K ’ (la linea OT) ed infine, l ’ orologio I I I fermo in
K " (la linea TD). Troviamo gli intervalli di tempo misurati diret
tamente. A ll’ istante t — t' = 0, (quando coincidono le origini Q
ed O') avviene lo scambio iniziale di segnali luminosi che è istan
taneo, in quanto gli orologi di K e K ' sono posti nello stesso punto.
Gli orologi I I e I I I si incontrano nel punto d’ universo T; in quel
l ’ istante un segnale luminoso è inviato dal punto T verso l ’ orologio / .
Supponiamo che l ’ orologio I I registri l ’ intervallo di tempo proprio»
à t 2 tra i suoi incontri con gli orologi I e I I E Quindi, come sappia
290
Vale la pena di insistere su questo suggerimento. Anche se misuriamo
l ’ intervallo di tempo fra gli eventi O e D con due orologi (1 e / / ) ,
questi orologi non sono affatto equivalenti nel caso considerato.
Quando l ’ orologio I I è spostato da K ' a K", esso subisce un’ accelera
zione e si porta in un sistema non inerziale. La sua linea d’ universo
è già una curva (vedi l ’ incastratura della fig. 8.12). Ma il moto
inerziale non è affatto equivalente a quello non inerziale. È possibile
che un orologio che si muove per inerzia registri un intervallo più
lungo rispetto ad un orologio in moto non inerziale. Non c ’ è in
questo caso alcuna contraddizione; la stessa conclusione si ottiene
con la teoria della gravitazione di Einstein.
Abbiamo già detto (vedi § 3.3) che un’ accelerazione, in via di
principio, influenza il ritmo di un orologio. Un orologio « corretto »
si trova di solito nel sistema di riferimento inerziale. Supponiamo
che la linea d’ universo di una particella sia incurvata (ciò significa
che la particella subisce un’ accelerazione). Ad ogni istante del
moto accelerato possiamo trovare un osservatore inerziale che si
muove lungo la tangente alla traiettoria del moto autentico con la
velocità istantanea del moto effettivo. L ’ orologio che si muove con
un’ accelerazione va « correttamente » se la sua marcia coincide con
quella dell’ orologio costruito in modo identico, ma che si muove
insieme all’ osservatore inerziale nel modo indicato.
In quale punto della linea d’ universo appare la differenza fra
le letture degli orologi « inerziale » e « non inerziale »? Dal principio
di relatività segue che i ritmi degli orologi identici sono gli stessi
in tutti i SRI. Quindi è chiaro che la differenza di letture dei due
orologi, portati nello stesso punto dello spazio, è causata dall’ accele
razione dell’ orologio, cioè dalla parte incurvata della linea d’ uni
verso. Spesso si sente obiettare che la parte incurvata si può rendere
piccola a piacere, cioè assicurare l ’ accelerazione per tempi molto
brevi. La differenza di letture può essere molto grande. Bisogna
tener in mente, comunque, che un’ accelerazione che agisce per un
tempo breve implica la comparsa di forze immense, e l ’ inversione
di una velocità relativistica è associata ad un’ accelerazione consi
derevole. Inoltre, la differenza di lunghezza fra le linee d’ universo
incurvata e retta che collegano gli stessi punti è determinata non
dalla lunghezza della sua parte incurvata, ma dalla curvatura comples
siva della linea d ’universo. Questo fatto è illustrato molto bene
nella fig. 8.13: sebbene il cammino I I dalla città A a quella B sia
« praticamente una linea retta per quasi tutto il tempo », esso è,
senza dubbio, più lungo del cammino da A a B lungo la retta con
giunta / . Se un’ accelerazione non influenza il ritmo dell’ orologio,
la lunghezza della linea d ’ universo della particella determina l ’ in
tervallo di tempo proprio.
Finora si è parlato di intervalli di tempo registrati da uno o due
orologi. Ritornando al problema iniziale, ci si può chiedere cosa
segnano gli orologi / e I I I nell’ istante in cui si incontrano nel
punto D? Ricordiamo che gli insiemi degli orologi in A , K r e K "
291
sono si nero ruzzati in modo che, all’ istante in cui le origini (9, Or
ed 0" coincidono, i tre orologi dai tre sistemi segnino t = t' = t” —
= 0. Ora prestiamo attenzione al diagramma nella fig. 8.14. In esso
le linee d’ universo degli orologi / , I I e I I I sono completate dalle
lì
Fig. 8.13. Il cammino I tra le città A e B è più breve del cammino / / , sebbene
il cammino I I sia diverso da quello rettilineo soltanto in un breve tratto. La
differente lunghezza non è causata tanto dalla parte curvilinea quanto dal fatto
che il cammino I I non è una retta nel suo insieme.
F ig. 8.14. Il passaggio dal riferimento K' ai riferimento K" significa un cambia
mento della linea di simultaneità. Da A T si passa a TB.
292
§ 8.5, « Equivalenza » fra massa
ed energia. Massa a riposo nulla
4% + V Co V l - B '2
(8.23)
,;x, 0V . , ^ 4 V
i+
(8.24)
.,
^ ( 1-
)■
=r 2 + r -J- 2 .+ r = rJ f
293
Si può vedere facilmente che
p y = /><« = 0 e P z = P <0) - 0.
E in accordo con essa, l ’ energia del sistema è
2 m » w Ts*) 2
dove iij è la velocità del corpo singolo che si forma dopo la colli
sione. Le prime tre equazioni dell’ (8.26) per i — 1, 2, 3 permettono
di trovare le tre componenti della velocità del corpo singolo. La quar
ta equazione (i — 4) si scriverà nella forma
m(0l)y {U + fr?.Q2)y(2> == M 0y.
294
Si vede dall’ (8.27) che la massa a riposo M 0 del nuovo sistema
contiene la somma delle masse a riposo delle particelle iniziali
m*lj + m(02) ed una certa massa in più associata al fatto che l ’ energia
cinetica relativistica delle due particelle (l’ espressione in parentesi
quadra) è slata trasformata in qualche altro tipo di energia (ad
esempio, calore). Dunque, in meccanica relativistica la legge di
conservazione dell’ energia include tutti i tipi di energia, e non
sol tanto quelli che si considerano in meccanica.
Infine, bisogna sottolineare ancora una volta che le relazioni
ottenute indicano la proporzionalità della massa a riposo e dell’ ener
gia a riposo; è molto importante che ciò sia valido soltanto nel
sistema di riferimento proprio. Generalmente, l ’ energia e la massa
a riposo, in termini quadridimensionali, hanno proprietà diverse
nel caso delle trasformazioni di Lorentz (§ 5.7), e parlare di conver
sione di « massa » in energia, come si fa qualche volta, è privo di
significato.
Torniamo alla massa a riposo nulla. Naturalmente, dal punto
di vista classico una massa a riposo nulla è piuttosto strana. Abbiamo
■visto (§ 7.6) che bisogna attribuire una massa a riposo nulla alle
particelle che si muovono alla velocità c (secondo le idee-contempo
ranee tali particelle sono i quanti di luce (fotoni) ed i neutrini).
Come si sa, la velocità c occupa una posizione privilegiata nella
TRR: in tutti i SRI sperimentalmente realizzabili questa velocità
si mantiene invariata. Si potrebbe terminare qui, ma vogliamo fare
qualche ulteriore commento.
Ovviamente, senza cadere in contraddizione, si deve ritenere
*che la materia (nel senso filosofico), dotata di massa a riposo finita,
è equivalente alla materia la cui massa a riposo è nulla. Vedremo
che l ’ ultimo caso si realizza piuttosto raramente in natura, ma in
linea di principio è realizzabile. Queste due forme di materia si
mutano l ’ uria nell’ altra e soffermiamoci ora su un esempio di tale
conversione. Si tratta della creazione di coppie elettrone-positrone
da parte di quanti gamma (fotoni ad alta energia) e della reazione
inversa cjii collisione fra un elettrone ed un positrone (questa reazione
è conosciuta sotto il nome ormai obsoleto di « annichilazione » di
particelle). Questa reazione comporta la fine dell’ esistenza di parti-
celle dotate di massa a riposo finita (un elettrone ed un positrone),
■e porta alla comparsa di due fotoni. Ciò che è essenziale è che questa
reazione soddisfa lo leggi di conservazione dell’ energia e dell’ impulso.
Sia i fotoni (con massa a riposo nulla) che gli elettroni e i positroni
■(che hanno una massa a riposo) sono caratterizzati da energia ed
impulsi definiti. Le quantità corrispondenti che risultano da queste
reazioni rimangono le stesse; un fotone, come oggetto reale, è defini
to dal suo impulso e dalla sua energia. La massa a riposo del fotone,
uguale a zero, caratterizza un fotone non meno della massa finita
di un elettrone e di un positrone.
Se. si considera la collisione elettrone-positrone in un riferimento
del centro d’ inerzia (in questo riferimento le particelle vanno incontro
una all’ altra con velocità vx e v2 uguali ma dirette in verso opposto)
la legge di conservazione dell’ energia prende la forma
tìiqc2 , m0c2
— 2h\. (8.28)
296
Dunque, una nube di radiazione elettromagnetica, costituita da
fotoni, aventi ciascuno massa a riposo nulla, possiede una massa
a riposo positiva, e quindi, induce un campo gravitazionale.
Partendo dal fatto che anche due fotoni nel caso generale hanno
una massa a riposo, si può tentare di evitare la discussione sulla
massa a riposo nulla di un fotone. Ma un singolo fotone si può osser
vare 1 in via di principio, e, perciò, bisogna dare un’ interpretazione
ad una massa a riposo nulla.
Per chiarire la causa che ha condotto alla comparsa della « massa
a riposo nulla » è meglio usare i concetti quadridimensionali. Consi
deriamo il quadrimpulso di una particella di massa a riposo finita m::
P , % = t n c 2y . .
297'
preoccuparsi: la massa non è una grandezza additiva! Quando il
"fotone è assorbito all’ altra estremità del carrello l’ energia del carrello
è ancora g 0, ma da un’ estremità del carrello all’ altra è stata già
trasferita l ’ energia hv e la distribuzione di massa lungo il carrello
è già diversa da quella iniziale.
Infine, si osservi die le conclusioni della TRE. permettono di
precisare in concetto di sistema « chiuso ». In meccanica un sistema
è detto chiuso se i corpi costituenti non interagiscono con i corpi
esterni ». Un’ interazione è descritta per mezzo di forze. In chimica
Radiazione
Me2 M e2
Carrello
che subLsce\
un rinculo
ÌFig. 8.15. Un fotcne trasferisce massa anche se la sua massa è uguale a zero
Prima dell’emissione del fotone l ’ energia del carrello è uguale ad fè0. In un
sistema chiuso il quadrimpulso si conserva, perciò l ’ impulso tridimensionale del
carrello e del fotone è uguale a zero come prima e l ’energia totale del. carrello
e del fotone <£0. La massa del sistema rimane costante, sebbene la massa del
carrello sia diminuita e quella del fotone sia nulla (la massa non è additiva!).
Quando il fotone è assorbito all’altra estremità del carrello, la sua energia
diventa uguale ancora ad <$„, ma l ’ energia hv è già stata trasferita da un’e
stremità all’altra del carrello e la distribuzione della massa lungo il carrello
è diversa da quella iniziale.
.298
SUPPLEMENTI
299
metodologia della scienza. Infine, il terzo lavoro (1905) fu scritto da
uno sconosciuto impiegato dell’ Ufficio Brevetti Federale Svizzero,
Albert Einstein (1879-1955).
È noto che i nuovi lavori di scrittori e poeti famosi e popolari
attraggono immediatamente 1’ attenzione di tutti, mentre quelli di
scrittori emergenti devono combattere contro la diffidenza. Nella
scienza questa tendenza, quando Uè, è più pronunciata. Come mai,
nel caso della TR R , è avvenuto il contrario: è stato il lavoro di
Einstein ad essere acclamato e riconosciuto?. Una risposta chiara
a questa domanda è stata data da VV. Pauli nel suo noto articolo
Teoria della relatività pubblicato per la prima volta nel 1921 nel-
VEnciclopedia matematica. Il libro di Pauli fu ristampato e tradotto
in altre lingue (l’ edizione in russo apparve nel 1947). Pauli conclude
il suo saggio sulla storia della teoria della relatività ristretta con le
parole: « È stato Einstein, infine, che completò la formulazione
basilare di questa nuova disciplina. Il suo lavoro del 1905 fu dato
alle stampe circa nello stesso momento dell’ articolo di Poincaré
e fu scritto senza che l ’ autore fosse a conoscenza del precedente
lavoro di Lorentz del 1904. Esso conteneva non solo tutti i risultati
essenziali contenuti negli altri due articoli, ma mostrava una com
prensione interamente nuova e molto profonda dell’ intero problema ».
Un altro eminente fisico, M. Born, ricorda le sue impressioni dopo
la lettura del lavoro di Einstein: « Sebbene mi fosse piuttosto fam i
liare l ’ idea relativistica e le trasformazioni di Lorentz, i ragiona
menti di Einstein furono per me una rivelazione».
È questa chiarezza profonda ed interamente nuova, quasi una
rivelazione,, che assicurò il successo al lavoro di Einstein, che lo rese
fondamentale per E enunciazione della teoria della relatività ristretta.
Alla storia delia scienza interessano più di tutto due questioni.
La prima è « come »: come sono apparse e si sono evolute le idee,
come è stata preparata e come si è giunti alla scoperta? La seconda
domanda è « chi »: chi ha fatto la scoperta, ha dato corpo all’ idea,
l ’ha trasformata in «carne ed ossa», l ’ ha elaborata e le ha dato>
un posto nella comunità scientifica? La domanda « come? » sembra
quella fondamentale, principale: è connessa al contenuto stesso
della scienza ed al metodo delia ricerca scientifica. La domanda
« chi? » può sembrare secondaria; infatti, non ha alcun peso sull’ es
senza del problema, se si considera la fisica e non, diciamo, la psi
cologia della creatività scientifica o la sociologia o la vita di questa
o quella persona. Attualmente è difficile, se non impossibile, trac
ciare una linea fra il « come? » ed il « chi? ». La scienza è portata
avanti da persone e se il prodotto finale — la totalità di certe affer
mazioni, equazioni, relazioni, ecc. — è spersonalizzato o, più
precisamente, quasi spersonalizzato, il processo iniziale di scoperta
o deduzione e dello sviluppo delle equazioni e delle relazioni riflette
le caratteristiche ed i tratti tipici degli scopritori. Perciò, per quanto
riguarda la storia della scienza, alle domande « come? » e « chi? »
bisogna rispondere contemporaneamente.
300
Vogliamo premettere alcune osservazioni con due parole sulla
teoria della relatività ristretta (questo libro tratta i punti fonda
mentali con maggiori dettagli, ma è utile riassumere a questo punto
la situazione).
Uno dei concetti fondamentali della fisica è quello di sistema
di riferimento inerziale. Un sistema di riferimento usato per definire
le coordinate ed i tempi degli eventi è inerziale se in esso vale la legge di
inerzia, cioè se un corpo isolato (non soggetto a forze) si muove di
moto rettilineo ed uniforme. Per essere precisi, questa definizione
non è priva di obiezioni e merita di essere chiarita, in quanto rimane
poco chiaro quale corpo si può considerare isolato. Grossolanamente
parlando, un isolamento è garantito, se tutti gli altri corpi sono
sufficientemente lontani. Un esempio di un « buon » sistema iner
ziale è un sistema di coordinate, la cui origine coincide col Sole
e gli assi diretti verso le stelle lontane. La legge d’ inerzia vale un
po’ meno, ma ancora con precisione sufficiente, sulla Terra (trascu
rando la gravità). Un sistema di riferimento, ruotante rispetto ad
un sistema inerziale, non lo sarà, la differenza tra i due sistemi
è tanto più grande quanto maggiore è la velocità angolare.
Se un dato sistema è inerziale, ogni altro sistema in moto unifor
me e rettilineo rispetto ad esso è aneli’ esso inerziale. La generalizza
zione di questa conclusione a tutti i fenomeni meccanici — l ’ affer
mazione che i fenomeni meccanici avvengono nello stesso modo in
tutti i sistemi inerziali — è proprio il contenuto del principio clas
sico, o galileiano, di relatività. Più precisamente, la definizione
e Papplicazione del principio comprende una determinata assunzione
prerelativistica che riguarda la connessione fra coordinate e tempo
degli eventi nei diversi sistemi inerziali, tPerciò, se un tale sistema
IC (coordinate x\ y ', z' e tempo t') si muove rispetto ad un dato
sistema inerziale K (coordinate x, y, z e tempo t) con velocità V
dirette lungo gli assi positivi x, x (che coincidono), allora, come
si è considerato prima della nascita di TRR,
x = x — Vt, y' = y, z' = 2, t' = .£
(trasformazioni di Galileo).
La natura assoluta del tempo — la sua indipendenza dal moto
del sistema di riferimento (da cui L’uguaglianza t' = t) — era assun
ta, in generale, in tutti i sistemi di riferimento.
Nel moto uniforme l ’ accelerazione del corpo è, ovviamente,
nulla. Quindi nelle trasformazioni di Galileo, cioè in ogni sistema
inerziale, l ’ accelerazione è la stessa. Perciò, in queste trasforma
zioni, la legge della dinamica, la seconda legge di Newton (massa X
X accelerazione — forza), rimane invariata se ia massa, la forza
•e l ’ accelerazione rimangono le stesse nei sistemi K e K f. Quest’ ulti
ma affermazione è assunta (e sperimentalmente dimostrata) e si
giunge alla conclusione che il principio classico di relatività vale
nella meccanica di Newton. In generale, Pinvarianza nelle trasfor
mazioni di Galileo delle equazioni che esprimono le leggi fisiche
fondamentali garantisce la validità del principio classico di relati
vità.
Tempo fa, fino alla metà e anche alia fine del X IX secolo si
credeva che la fisica si potesse costruire completamente sulla base*
delle equazioni del moto di Newton. Perciò si pensava che il prin
cipio classico di relatività fosse sempre valido. Comunque lo sviluppo-
deli’ elettro dinamica gettò delle ombre sul principio classico di
relatività. Le equazioni delTelettrodinamica (equazioni di Maxwell)-
non mantengono la loro forma nelle trasformazioni di Galileo,,
perciò la loro applicazione porta alla seguente conclusione: in elet
trodinamica il principio di relatività fallisce e, in particolare, lai
luce e le altre onde elettromagnetiche si propagano in modo diffe
rente nei diversi sistemi inerziali, anche nel vuoto. Se il mezzo-
portatore di luce allora introdotto — l ’ etere — è in quiete in un
sistema di riferimento inerziale (K ), la velocità della luce in esso,,
indipendentemente dalla direzione, ò c = 3 -IO10 crn/s. In un altro»
sistema di riferimento K ' , che si muove con velocità V rispetto-
ali’ etere (lungo gli assi x e x'), la velocità della luce è, come risulta:
ovvio dalle trasformazioni di Galileo, c — c — V lungo gli assi
x e x ed c = c -(- V nella direzione opposta, ecc.
Ma gli esperimenti smentiscono una conclusione apparentemente
ovvia; tutti gli esperimenti, a partire da quello famoso di Michelson
condotto nel 1881 e ripetuto diverse volte, confermano la validità
del principio di relatività in elettrodinamica, come in tutta la
fisica. Ma, secondo il principio di relatività, come può la velocità
della luce essere la stessa in diversi sistemi di riferimento, quando»
le trasformazioni di Galileo conducono a conclusioni opposte?
C’ è voluto quasi un quarto di secolo di domande inquietanti
per giungere alla conclusione che costituisce il cuore e la base della
TRR: le trasformazioni di Galileo devono essere sbagliate. Più
precisamente, come accade in questi casi, non sono proprio sbagliate,,
ma approssimate. Le equazioni esatte, che legano le coordinate ed
il tempo nei riferimenti K e K \ sono
V
x — vt
303
•a rigore, cioè senza trascurare i termini di grado superiore, non
dipendono dai moto del sistema ». Allo scopo Lorentz dovette
mostrare che per un corpo in moto uniforme ed rettilineo (rispetto
all’ etere) le equazioni dell’ eie Uro dinamica ammettono soluzioni che
corrispondono in un certo modo alle soluzioni per un corpo in quiete.
La corrispondenza è assicurata passando alle nuove variabili
x\ ij\ z\ t\ mediante le trasformazioni di Lorentz ed introducendo
nuovi (con l’ apice) vettori campo elettromagnetico. In seguito
a queste trasformazioni la forma delle equazioni del campo non
cambia, cioè esse hanno la stessa forma per le vecchie (senz’ apice)
e le nuove (con apice) grandezze. Questa proprietà è conosciuta
come invarianza; nel caso in questione, invarianza delle equazioni
del campo elettromagnetico rispetto alle trasformazioni di Lorentz.
Oggi, dopo lo sviluppo della TR R , ciò è proprio la conferma della
validità del principio eli relatività in elettrodinamica, ma Lorentz
non considerava il tempo t' come il tempo del riferimento in moto;
egli lo chiamò tempo locale e pensò che aveva a che fare « semplice
mente con grandezze ausiliari introdotte con l ’ aiuto di espedienti
matematici. In particolare, la variabile t' non poteva chiamarsi
« tempo » nello stesso senso delia variabile £ ». Nel 1915 Lorentz
rafforzò questa opinione: « La regione principale del mio errore era
stata di considerare sempre soltanto la variabile t come tempo vero,
mentre il mio tempo locale t' doveva essere considerato come una
grandezza matematica ausiliare. Nella teoria di Einstein, d’ altra
parte, t' gioca lo stesso ruolo di £ ». Nel 1927, un anno prima della
sua morte, Lorentz chiarì ciò ancora più precisamente: « Per me
c’ era soltanto un tempo vero, lo consideravo la mia trasformazione
temporale come una semplice ipotesi euristica di lavoro. Dunque,
la teoria della relatività praticamente è lavoro esclusivo di Einstein ».
Posso aggiungere che dopo aver riletto i lavori di Lorentz e Poincaré
(70 anni dopo la loro pubblicazione), conoscendo già il risultato (il
che, ovviamente, facilita la comprensione), ho avuto difficoltà
a comprendere perché Pinvarianza delle equazioni dell’ elettrodinami
ca rispetto alle trasformazioni di Lorentz, dimostrata in questi
lavori, si può considerare al tempo, stesso la prova della validità del
principio di relatività.
Inoltre, Lorentz e Poincaré consideravano questo principio sempli
cemente come un’ asserzione sull’ impossibilità di osservare il moto
uniforme di un corpo rispetto all’ etere. Non si richiedono particolari
sforzi per procedere da questo a considerare equivalenti tutti i rife
rimenti inerziali (che è la formulazione contemporanea del principio
di relatività), purché le trasformazioni di Lorentz siano considerate
come il passaggio ad un sistema di riferimento in moto.
Come abbiamo visto, è proprio quello che Lorentz non con
siderò in modo definitivo. Poincaré fu meno chiaro. Nei suoi articoli
del 1905-1906 egli affermò semplicemente che le equazioni della
elettrodinamica « possono essere soggette all’ importante trasforma
zione scoperta da Lorentz, che spiega perché non è possibile alcuna
304
dimostrazione sperimentale del moto assoluto della Terra » L Secondo
il mio punto di vista questa « spiegazione » non va oltre quella di
Lorentz. In generale Poincaré scrive: « I risultati che ho ottenuto
sono in accordo con quelli di Lorentz nei punti principali. Io cercai
soltanto di completarli e modificarli in certi dettagli. Alcune dif£e=
renze, come vedremo in seguito sono di minor importanza » 1 2.
D ’ altra parte alcuni commenti di Poincaré nei primi lavori, articoli
e pubblicazioni suonano quasi profetici. Vi si tratta della necessità
di definire il concetto di simultaneità e della possibilità di usare
allo scopo segnali luminosi, del principio di relatività. Comunque,
egli non sviluppò queste considerazioni e nei suoi lavori del 1905
e 1906 seguì Lorentz. Come è stato sottolineato in precedenza, essi
si sforzarono di dimostrare e dimostrarono per quali ipotesi il moto
rettilineo di un corpo rispetto all5etere non è misurabile. Ma Einstein
nel suo lavoro del 1905 rovesciò, potremmo dire, Finterà questione
mostrando che, una volta accettato il principio di relatività e sin
cronizzati gli orologi con l ’ aiuto della luce (ed