Sei sulla pagina 1di 415

CAMPI ELETTROMAGNETICI

Kurt Lechner
Prefazione

Le conoscenze sperimentali e teoriche acquisite finora sul comportamento della materia


a livello microscopico, portano a concludere che l’interezza dei fenomeni fisici microscopici
può essere interpretata assumendo che tutta la materia sia costituita da particelle elemen-
tari puntiformi, soggette a solo quattro tipi di interazioni fondamentali: gravitazionale,
elettromagnetica, debole e forte. Tra queste l’interazione gravitazionale è quella nota da
più tempo, mentre quella elettromagnetica è la più studiata avendo trovato una sua solida
formulazione teorica nell’Elettrodinamica Quantistica, a metà del secolo scorso. La quasi
totalità dei fenomeni fisici quotidiani – dalla stabilità della materia alla propagazione della
luce – è infatti riconducibile a questa teoria. Le interazioni deboli e forti, che a differenza
di quelle elettromagnetica e gravitazionale si manifestano solo a distanze microscopiche,
hanno trovato una formulazione analoga nell’ambito del Modello Standard delle particelle
elementari – che include la stessa Elettrodinamica Quantistica – mentre l’interazione gra-
vitazionale risulta tuttora in conflitto con le leggi della Meccanica Quantistica, nonostante
i progressi maturati nell’ambito della Teoria delle Superstringhe.
Nonostante il comune ruolo di mediatrici dell’azione reciproca tra i costituenti ele-
mentari della natura, ciascuna delle quattro interazioni fondamentali è contrassegnata da
proprietà esclusive tali da comportare fenomeni fisici peculiari. Cosı̀ le interazioni forti
sono le sole a dar luogo al fenomeno del confinamento, che confina i quark e i gluoni
all’interno dei nucleoni, mentre le interazioni deboli sono le uniche ad essere mediate da
particelle massive, le W ± e la Z 0 . Analogamente l’interazione elettromagnetica è l’unica
a essere mediata da particelle – i fotoni – le quali, non essendo dotate di carica elettrica
non sono soggette a loro volta a un’interazione elettromagnetica reciproca. E infine, l’in-
terazione gravitazionale è l’unica che si esercita tra tutte le particelle elementari, compresi
i mediatori delle interazioni stesse.
Di fronte a queste distinzioni importanti appare alquanto sorprendente come le quattro
interazioni fondamentali siano rette da un’impalcatura teorica comune, che ne determina
fortemente la struttura generale; impalcatura elegante nella sua forma e matematicamen-
te solida, le cui profonde origini fisiche sono in parte ancora da scoprire. Tra i pilastri
principali di questa impalcatura unificante ricordiamo i seguenti: tutte le interazioni fon-
damentali soddisfano il principio di relatività einsteiniana e ammettono una formulazione
covariante a vista, con conseguente conservazione del quadrimomento e del momento an-
golare quadridimensionale. Ciascunca delle interazioni è mediata da una o più particelle
bosoniche, rappresentate a livello classico da un insieme di campi vettoriali {Aµ }, la cui
dinamica è controllata da un’invarianza di gauge locale. Il teorema di Noether associa
poi a ciascun bosone vettore una grandezza conservata. Infine, il pilastro forse più miste-
rioso ma non per questo meno fondante è rappresentato dal fatto che l’intera dinamica
riguardante l’insieme delle interazioni fondamentali può essere dedotta da un principio
variazionale.
Il presente testo costituisce un trattato sull’Elettrodinamica classica di particelle pun-
tiformi, ed è stato costruito attorno agli argomenti svolti nel corso “Campi Elettroma-
gnetici” che ho tenuto negli anni accademici 2004/05–2008/09 per la Laurea Magistrale
in Fisica presso l’Università di Padova. Nella sua stesura mi sono fatto guidare in prima
linea dall’intento di enucleare gli aspetti che accomunano l’Elettrodinamica alle altre inte-
razioni fondamentali – vale a dire i pilastri sopra nominati – mettendo anche in evidenza,
ove possibile, analogie e differenze. La rinuncia più pesante che questa impostazione ha
comportato consiste nell’aver trascurato quasi completamente l’argomento importante dei
campi elettromagnetici nei materiali.
Le altre linee guida che ho seguito si riassumono come segue. Ho cercato di formulare
l’Elettrodinamica classica come una teoria basata su un sistema di postulati – essenzial-
mente il principio di relatività einsteininana e le equazioni di Maxwell e di Lorentz – da
cui l’intera e ricca fenomenologia delle interazioni elettromagnetiche tra particelle cariche
può essere dedotta in modo stringente. Per poter impostare queste equazioni in modo
matematicamente rigoroso è indispensabile ambientarle nello spazio delle distribuzioni.
Particolare attenzione è poi stata dedicata alle proprietà di consistenza interna e fisica
dell’Elettrodinamica. In questo contesto viene svolta un’analisi accurata delle divergenze
ultraviolette che accompagnano la reazione di radiazione, e che rendono l’Elettrodinami-
ca classica – in ultima analisi – una teoria internamente inconsistente. Ogni argomento
teorico è illustrato con una serie di esempi fisicamente rilevanti che vengono svolti in
dettaglio, cosı̀ come l’introduzione di ogni nuovo strumento matematico viene motivata
e accompagnata da esemplificazioni pratiche. Infine, la soluzione dei problemi proposti a
conclusione dei capitoli comporta una migliore comprensione di alcuni argomenti trattati
nel testo, pur non condizionando la comprensione dei capitoli successivi.
Organizzazione del materiale. A grandi linee gli argomenti del testo sono suddivisi in
tre parti. La prima parte (capitoli 1–4) espone le basi concettuali e matematiche su cui si
fonda la costruzione dell’Elettrodinamica di un sistema di particelle cariche puntiformi.
Questa parte iniziale presenta in particolare gli strumenti matematici necessari per una
formulazione precisa della teoria, vale a dire il formalismo covariante come sede naturale
di una qualsiasi teoria relativistica, e la teoria delle distribuzioni, strumento indispensa-
bile per una trattazione corretta delle singolarità implicate dalla natura puntiforme delle
particelle cariche. Dopo l’introduzione delle equazioni fondamentali dell’Elettrodinamica
– le equazioni di Maxwell e di Lorentz – e una loro analisi strutturale preliminare, si ana-
lizzano le leggi di conservazione da esse implicate. Conclude la prima parte l’introduzione
del metodo variazionale. Questo metodo viene presentato come approccio alternativo per
la formulazione di una generica teoria di campo che ne codifica la dinamica in modo con-
ciso ed elegante, e come ingrediente fondamentale per la validità del teorema di Noether.
Lo stretto nesso esistente in generale tra questo teorema e il principio variazionale viene
poi esemplificato in dettaglio nel caso dell’Elettrodinamica di particelle puntiformi.
La seconda parte (capitoli 5–11) – la più estesa – verte maggiormente sulle applica-
zioni dell’Elettrodinamica e comprende in particolare una trattazione sistematica della
generazione di campi elettromagnetici da parte di particelle cariche in moto arbitrario,
e un’analisi approfondita del fenomeno dell’irraggiamento, sia nel limite non relativistico
che in quello ultrarelativistico. Cosı̀ si svolge un’analisi sistematica delle distribuzioni an-
golare e spettrale della radiazione emessa in diverse situazioni fisicamente rilevanti, come
ad esempio quelle riguardanti le antenne, gli acceleratori ultrarelativistici, le collisioni tra
particelle cariche e la diffusione della radiazione da parte di particelle cariche. In questa
parte vengono inoltre trattati in dettaglio alcuni argomenti che nei libri di testo raramente
vengono presentati in modo sistematico. Cosı̀ si risolve, ad esempio, il problema del cam-
po elettromagnetico creato da una particella carica priva di massa, si esegue un confronto
dettagliato tra la radiazione elettromagnetica e quella gravitazionale, e si presenta una
trattazione teorica sistematica dell’effetto Cerenkov.
La terza parte (capitoli 12–13) verte su argomenti più speculativi, e delicati, che nei
testi spesso vengono trattati con superficialità. Il capitolo 12 è dedicato alla reazione
di radiazione e affronta con cura il problema delle divergenze ultraviolette da cui essa
è inevitabilmente affetta. Lo scopo di questo capitolo è doppio: da un lato si vogliono
enucleare le motivazioni teoriche che ci costringono a sostituire l’equazione di Lorentz
(divergente) – un dogma dell’Elettrodinamica classica – con l’equazione di Lorentz–Dirac.
Dall’altro si vuole illustrare come l’Elettrodinamica che emerge da questa sostituzione è
affetta da un’inconsistenza interna incurabile, che muta solo di aspetto a seconda del
punto di vista pragmatico che si assume. La seconda parte di questo capitolo è dedicata
all’altro “problema antico” dell’Elettrodinamica, rappresentato dall’energia infinita del
campo elettromagnetico creato da una particella puntiforme, che mina la stessa legge
di conservazione dell’energia. Sorprendentemente, questo problema ha trovato una sua
soluzione solo una trentina di anni fa, e noi ne presenteremo una versione alternativa in
una veste più moderna, nell’ambito della teoria delle distribuzioni. Infine, il capitolo 13 è
dedicato ai monopoli magnetici e ha lo scopo di illustrare come l’Elettrodinamica – pur
essendo basata su un sistema di postulati molto rigidi – è perfettamente compatibile con
l’esistenza in natura di questo nuovo tipo di particelle cariche.
Prerequisiti. Si suppone che il lettore di questo testo possegga conoscenze di base
di Elettromagnetismo classico e abbia familiarità con le equazioni di Maxwell e Lorentz
scritte in forma covariante a vista, e in generale con l’uso dei tensori quadridimensionali.
L’origine fisica e gli elementi fondamentali del calcolo tensoriale vengono comunque richia-
mati con un certo grado di completezza e rigore logico nel capitolo 1. È anche richiesto un
minimo di familiarità con la teoria delle distribuzioni, in particolare con la distribuzione
δ di Dirac. Tuttavia, gli elementi essenziali riguardanti le distribuzioni e necessari per la
comprensione del testo sono presentati in modo succinto nel capitolo 2. Infine è utile, ma
non indispensabile, conoscere il metodo variazionale relativo a un sistema lagrangiano con
un numero finito di gradi di libertà.

Padova, dicembre 2008 Kurt Lechner


Indice

1 I fondamenti della Relatività Ristretta 1


1.1 I postulati della Relatività . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Trasformazioni di Lorentz e di Poincaré . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Linearità delle trasformazioni . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Invarianza dell’intervallo . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Leggi fisiche covarianti a vista . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1 Calcolo tensoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Struttura del gruppo di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Trasformazioni infinitesime e trasformazioni finite . . . . . . . . . . 12
1.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Le equazioni dell’Elettrodinamica 16
2.1 Cinematica di una particella relativistica . . . . . . . . . . . . . . . . . . . 16
2.2 L’Elettrodinamica di particelle puntiformi . . . . . . . . . . . . . . . . . . 19
2.2.1 Equazione di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Identità di Bianchi . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.3 Equazione di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 La natura distribuzionale del campo elettromagnetico . . . . . . . . . . . . 30
2.3.1 Lo spazio delle distribuzioni . . . . . . . . . . . . . . . . . . . . . . 31
2.3.2 Operazioni sulle distribuzioni . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Identità di Bianchi e forme differenziali . . . . . . . . . . . . . . . . 37
2.3.4 Il campo elettromagnetico della particella statica . . . . . . . . . . 40
2.4 Le costanti del moto dell’Elettrodinamica . . . . . . . . . . . . . . . . . . . 44
2.4.1 Conservazione e invarianza della carica elettrica . . . . . . . . . . . 44
2.4.2 Tensore energia–impulso e conservazione del quadrimomento . . . . 47
2.4.3 Il tensore energia–impulso dell’Elettrodinamica . . . . . . . . . . . 49
2.4.4 Conservazione del momento angolare . . . . . . . . . . . . . . . . . 55
2.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3 Metodi variazionali in teoria di campo 64


3.1 Principio di minima azione in meccanica classica . . . . . . . . . . . . . . . 67
3.2 Principio di minima azione in teoria di campo . . . . . . . . . . . . . . . . 69
3.2.1 Ipersuperfici nello spazio di Minkowski . . . . . . . . . . . . . . . . 72
3.2.2 Invarianza relativistica . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.3 La lagrangiana per l’equazione di Maxwell . . . . . . . . . . . . . . 79
3.3 Il Teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.3.1 Trasformazioni di Poincaré infinitesime . . . . . . . . . . . . . . . . 85
3.3.2 Teorema di Noether per il gruppo di Poincaré . . . . . . . . . . . . 87
3.3.3 Tensore energia–impulso canonico per il campo di Maxwell . . . . . 92
3.4 Costruzione di un tensore energia–impulso simmetrico . . . . . . . . . . . . 93
3.4.1 Tensore energia–impulso simmetrico per il campo di Maxwell . . . . 96
3.5 Densità di momento angolare “standard” . . . . . . . . . . . . . . . . . . . 97
3.6 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4 Il metodo variazionale per l’Elettrodinamica di particelle puntiformi 101


4.1 Principio variazionale per una particella libera . . . . . . . . . . . . . . . . 101
4.2 L’azione per l’Elettrodinamica . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.3 Il teorema di Noether in Elettrodinamica . . . . . . . . . . . . . . . . . . . 107
4.4 Invarianza di gauge e conservazione della carica elettrica . . . . . . . . . . 112
4.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5 Onde elettromagnetiche 115


5.1 I gradi di libertà del campo elettromagnetico . . . . . . . . . . . . . . . . . 116
5.1.1 I gradi di libertà in meccanica newtoniana . . . . . . . . . . . . . . 116
5.1.2 I gradi di libertà in teoria di campo . . . . . . . . . . . . . . . . . . 117
5.1.3 Il problema di Cauchy per l’equazione di Maxwell . . . . . . . . . . 118
5.2 L’equazione delle onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.2.1 Il problema alle condizioni iniziali . . . . . . . . . . . . . . . . . . . 129
5.3 Soluzioni dell’equazione di Maxwell nel vuoto . . . . . . . . . . . . . . . . 131
5.3.1 Proprietà delle onde elettromagnetiche elementari . . . . . . . . . . 134
5.3.2 Onde piane ed elicità . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.3.3 Onde elettromagnetiche e invarianza di gauge manifesta . . . . . . . 145
5.4 Effetto Doppler relativistico . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6 Generazione di campi elettromagnetici 157


6.1 Il metodo della funzione di Green: equazione di Poisson . . . . . . . . . . . 158
6.1.1 Una soluzione particolare . . . . . . . . . . . . . . . . . . . . . . . . 159
6.1.2 Validità della soluzione e soluzione generale . . . . . . . . . . . . . 163
6.2 Il campo generato da una corrente generica . . . . . . . . . . . . . . . . . . 166
6.2.1 La funzione di Green ritardata . . . . . . . . . . . . . . . . . . . . . 169
6.2.2 Il potenziale vettore ritardato . . . . . . . . . . . . . . . . . . . . . 174
6.2.3 Validità della soluzione e trasformata di Fourier . . . . . . . . . . . 176
6.3 Campo di una particella in moto rettilineo uniforme . . . . . . . . . . . . . 178
6.3.1 Campo di una particella massiva . . . . . . . . . . . . . . . . . . . 179
6.3.2 Campo di una particella di massa nulla . . . . . . . . . . . . . . . . 183
6.4 Campo di una particella in moto arbitrario . . . . . . . . . . . . . . . . . . 187
6.4.1 Condizioni asintotiche. . . . . . . . . . . . . . . . . . . . . . . . . . 188
6.4.2 I campi di Lienard–Wiechert . . . . . . . . . . . . . . . . . . . . . . 190
6.4.3 Emissione di radiazione da cariche accelerate . . . . . . . . . . . . . 198
6.4.4 Limite non relativistico e formula di Larmor . . . . . . . . . . . . . 201
6.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

7 Irraggiamento 206
7.1 Il campo elettromagnetico nella zona delle onde . . . . . . . . . . . . . . . 208
7.1.1 Emissione di quadrimomento . . . . . . . . . . . . . . . . . . . . . . 211
7.1.2 Sorgenti monocromatiche e onde piane . . . . . . . . . . . . . . . . 212
7.2 La radiazione dell’antenna lineare . . . . . . . . . . . . . . . . . . . . . . . 214
7.3 Sviluppi non relativistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
7.3.1 Sviluppo in multipoli . . . . . . . . . . . . . . . . . . . . . . . . . . 218
7.3.2 La radiazione di dipolo . . . . . . . . . . . . . . . . . . . . . . . . . 220
7.3.3 Potenza emessa da un’antenna lineare corta . . . . . . . . . . . . . 226
7.3.4 Diffusione Thomson della radiazione . . . . . . . . . . . . . . . . . 228
7.3.5 Bremsstrahlung dall’interazione coulombiana . . . . . . . . . . . . . 234
7.3.6 La radiazione dell’atomo d’idrogeno classico . . . . . . . . . . . . . 240
7.4 Radiazione di quadrupolo elettrico e di dipolo magnetico . . . . . . . . . . 242
7.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

8 La radiazione gravitazionale 252


8.1 Onde gravitazionali e onde elettromagnetiche . . . . . . . . . . . . . . . . . 252
8.2 Le equazioni per un campo gravitazionale debole. . . . . . . . . . . . . . . 253
8.2.1 La relazione con le equazioni di Einstein . . . . . . . . . . . . . . . 255
8.3 Irraggiamento gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . 258
8.3.1 Un argomento euristico per la formula di quadrupolo . . . . . . . . 259
8.4 La potenza della radiazione di quadrupolo . . . . . . . . . . . . . . . . . . 261
8.5 La pulsar binaria PSR 1913+16 . . . . . . . . . . . . . . . . . . . . . . . . 264
8.6 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

9 Irraggiamento ultrarelativistico 269


9.1 Generalizzazione relativistica della formula di Larmor . . . . . . . . . . . . 270
9.1.1 Un argomento di covarianza . . . . . . . . . . . . . . . . . . . . . . 271
9.1.2 Deduzione della formula di Larmor relativistica . . . . . . . . . . . 273
9.2 Perdita di energia negli acceleratori . . . . . . . . . . . . . . . . . . . . . . 276
9.2.1 Acceleratori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
9.2.2 Acceleratori circolari . . . . . . . . . . . . . . . . . . . . . . . . . . 279
9.3 Distribuzione angolare nel limite ultrarelativistico . . . . . . . . . . . . . . 281
9.4 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

10 Analisi spettrale 286


10.1 Analisi di Fourier e risultati generali . . . . . . . . . . . . . . . . . . . . . 286
10.2 Analisi spettrale nel limite non relativistico . . . . . . . . . . . . . . . . . . 289
10.2.1 Bremsstrahlung a spettro continuo e catastrofe infrarossa . . . . . . 291
10.2.2 Bremsstrahlung a spettro discreto . . . . . . . . . . . . . . . . . . . 294
10.3 Analisi spettrale relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . 296
10.3.1 Spettro di emissione di una particella singola . . . . . . . . . . . . . 297
10.3.2 Frequenze caratteristiche nel limite ultrarelativistico . . . . . . . . . 300
10.4 La radiazione del ciclotrone . . . . . . . . . . . . . . . . . . . . . . . . . . 303
10.4.1 Analisi spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
10.4.2 Lo spettro nel limite ultrarelativistico . . . . . . . . . . . . . . . . . 305
10.4.3 Distribuzione angolare . . . . . . . . . . . . . . . . . . . . . . . . . 307
10.4.4 Luce di sincrotrone . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
10.5 Spettro di emissione di una corrente generica . . . . . . . . . . . . . . . . . 310
10.5.1 Corrente periodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
10.5.2 Corrente aperiodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

11 L’effetto Cerenkov 315


11.1 Campo di una particella in moto rettilineo uniforme in un mezzo . . . . . . 316
c
11.2 Il campo per v < . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
n
11.2.1 Analisi in frequenza . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
c
11.3 Il campo per v > . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
n
11.3.1 Il campo nella zona delle onde e l’angolo di Cerenkov . . . . . . . . 325
11.4 Mezzi dispersivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
11.5 Perdita di energia ed emissione di fotoni . . . . . . . . . . . . . . . . . . . 331
11.5.1 Un argomento euristico . . . . . . . . . . . . . . . . . . . . . . . . . 331
11.5.2 La formula di Frank e Tamm . . . . . . . . . . . . . . . . . . . . . 333
11.6 Rivelatori Cerenkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

12 La reazione di radiazione 338


12.1 Forze di frenamento: analisi preliminare . . . . . . . . . . . . . . . . . . . 341
12.1.1 Un argomento euristico per l’equazione di Lorentz–Dirac . . . . . . 343
12.2 L’equazione di Lorentz–Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 344
12.2.1 Derivazione dell’equazione . . . . . . . . . . . . . . . . . . . . . . . 346
12.2.2 Determinazione dell’autocampo regolarizzato . . . . . . . . . . . . . 350
12.2.3 Caratteristiche dell’equazione di Lorentz–Dirac . . . . . . . . . . . . 351
12.2.4 La particella carica libera: soluzione esatta . . . . . . . . . . . . . . 355
12.2.5 Moto in campo costante: preaccelerazione . . . . . . . . . . . . . . 358
12.3 L’equazione integro–differenziale di Rohrlich . . . . . . . . . . . . . . . . . 361
12.3.1 Preaccelerazione e violazione della causalità . . . . . . . . . . . . . 363
12.4 Il problema relativistico a due corpi . . . . . . . . . . . . . . . . . . . . . . 366
12.4.1 Espansione non relativistica . . . . . . . . . . . . . . . . . . . . . . 368
12.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374

13 Un tensore energia–impulso privo di singolarità 375


13.1 Linee guida della costruzione . . . . . . . . . . . . . . . . . . . . . . . . . . 377
13.2 Costruzione di Θµν
em per la particella libera . . . . . . . . . . . . . . . . . . 380

13.2.1 Esistenza di Θµν


em . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381

13.2.2 Conservazione di Θµν


em . . . . . . . . . . . . . . . . . . . . . . . . . . 384

13.2.3 Una definizione operativa dell’energia elettromagnetica . . . . . . . 386


13.3 Costruzione generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387

14 Monopoli magnetici 390


14.1 La dualità elettromagnetica . . . . . . . . . . . . . . . . . . . . . . . . . . 391
14.2 L’Elettrodinamica classica in presenza di dioni . . . . . . . . . . . . . . . . 393
14.2.1 Leggi di conservazione . . . . . . . . . . . . . . . . . . . . . . . . . 395
14.3 La condizione di quantizzazione di Dirac . . . . . . . . . . . . . . . . . . . 397
14.3.1 Una carica e un monopolo . . . . . . . . . . . . . . . . . . . . . . . 397
14.3.2 Il momento angolare del sistema . . . . . . . . . . . . . . . . . . . . 399
14.3.3 Consistenza quantistica e condizione di quantizzazione di Dirac . . 401
1 I fondamenti della Relatività Ristretta

L’Elettrodinamica classica costituisce il prototipo per eccellenza di una teoria relativistica,


avendo contribuito in modo determinante alla nascita della Relatività stessa. Il principio
guida della relatività einsteiniana, che afferma che tutte le leggi della Fisica devono avere
la stessa forma in tutti i sistemi di riferimento inerziali, è emerso con forza da questa
teoria ed è andato consolidandosi sempre di più man mano che le nostre conscenze del
mondo microscopico si sono ampliate e approfondite. L’implementazione più naturale
ed elegante di questo principio, di fatto l’unica di una vera utilità, avviene attraverso il
paradigma della “covarianza a vista” realizzato nell’ambito del calcolo tensoriale. Questo
paradigma ha mostrato possedere carattere universale essendo stato applicato con successo
a qualsiasi teoria di tipo fondamentale, come le teorie che descrivono le quattro interazioni
fondamentali o la più speculativa Teoria delle superstringhe, e mantiene per di più la sua
piena validità anche a livello quantistico. La presentazione dell’Elettrodinamica fornita
in questo testo si baserà cosı̀ con forza, e diremo a ragione, su questo paradigma.
In questo capitolo introduttivo ripercorreremo innanzitutto i tratti essenziali del per-
corso logico che ha portato dai postulati della Relatività alla formulazione del paradigma
della covarianza a vista. È infatti importante tenere presente quali sono le assunzioni
apriorstiche fatte nella costruzione di una teoria, e distinguere le conseguenze inevitabili
di tali assunzioni dalle conseguenze di eventuali ipotesi aggiuntive formulate strada fa-
cendo. Riassumeremo poi in particolare gli elementi fondamentali del calcolo tensoriale
di cui faremo ampio uso in questo testo. Nella parte finale del capitolo anlizzeremo in
dettaglio la struttura del gruppo di Poincaré per via della sua connessione intima con le
leggi di conservazione, connessione che verrà sviscerata più avanti.

1.1 I postulati della Relatività

La Meccanica Newtoniana e la teoria della Relatività Ristretta si basano su alcune as-


sunzioni aprioristiche comuni sulle proprietà dello spazio vuoto e del tempo, mentre si
distinguono in modo fondamentale attraverso i “principi di relatività” su cui ciascuna
delle due teorie è basata.

1
Le assunzioni in comune sono costituite dalle proprietà dello spazio vuoto di essere
omogeneo e isotropo, e dall’omogeneità del tempo. Inoltre le leggi fisiche di entrambe le
teorie sono formulate rispetto a una classe particolare di sistemi di riferimento, i riferi-
menti inerziali, ed entrambe implementano l’equivalenza fisica di tutti questi riferimenti
attraverso un principio di relatività. Il principio di relatività galileiana della Meccanica
Newtoniana prevede che le leggi della meccanica mantengano la stessa forma sotto trasfor-
mazioni di Galileo da un sistema di riferimento a un altro, mentre il principio di relatività
einsteiniana richiede che tutte le leggi della fisica abbiano la stessa forma in tutti i sistemi
riferimenti, non facendo – a priori – nessuna ipotesi sul modo in cui trasformano lo spazio
e il tempo.
D’altra parte rispetto alla Meccanica Newtoniana la teoria della Relatività Ristretta
rinuncia al paradigma dell’assolutezza degli intervalli spaziali e temporali, sostituendolo
con il postulato della costanza della velocità della luce. In definitiva i postulati della fisica
relativistica risultano i seguenti:

I) Lo spazio è isotropo e omogeneo, e il tempo è omogeneo.

II) La velocità della luce è la stessa in tutti i sistemi di riferimento inerziali.

III) Le leggi della fisica hanno la stessa forma in tutti i sistemi di riferimento inerziali.

Per rendere operativi questi postulati, in particolare il postulato III) che pone forti
restrizioni sulla forme delle leggi fisiche ammesse, è necessario determinare innanzitutto
la forma delle trasformazioni delle coordinate spazio–temporali da un sistema di riferi-
mento a un altro. Prima di derivare la forma di queste trasformazioni dai postulati stessi
specifichiamo le notazioni che adottiamo in questo testo.
Indichiamo le coordinate spazio–temporali “controvarianti” di un evento con indici
greci, µ, ν, · · · = (0, 1, 2, 3),

xµ = (x0 , x1 , x2 , x3 ), x0 = ct,

dove d’ora in poi la velocità della luce c verrà posta uguale all’unità. Indichiamo le
componenti puramente spaziali dell’evento con indici latini, i = (1, 2, 3, ),

xi = (x1 , x2 , x3 ),

2
e scriveremo anche xµ = (x0 , xi ). Denotiamo inoltre la metrica di Minkowski, e la sua
inversa, con,
η µν = diag(1, −1, −1, −1) = ηµν , η µν ηνρ = δρµ .

Adottiamo poi la convenzione di Einstein della “somma sugli indici muti”, che sottintende
il simbolo di sommatoria su un indice che compare due volte nella stessa espressione. La
metrica di Minkowski permette di introdurre coordinate spazio–temporali “covarianti”
secondo,
xµ ≡ ηµν xν = (x0 , −x1 , −x2 − x3 ), xµ = η µν xν .

Scrivendo xµ = (x0 , xi ) avremo quindi x0 = x0 , xi = −xi . Si dice che la metrica di


Minkowski permette di abbassare e alzare gli indici.

1.2 Trasformazioni di Lorentz e di Poincaré

Come notato sopra, al contrario dei postulati della Meccanica Newtoniana i postulati
della Relatività non specificano a priori la forma delle trasformazioni delle coordinate
spazio–temporali nel passaggio da un sistema di riferimento a un altro; sono piuttosto i
postulati stessi che determinano in modo univoco la forma delle trasformazioni permesse,
che risulteranno essere le trasformazioni di Poincaré. In questa sezione ripercorriamo
brevemente la deduzione della forma di queste trasformazioni dai postulati, illustrando
cosı̀ l’estrema economia dei postulati stessi e sottolineando la solidità delle proprietà
formali che attraverso essi la Relatività Ristretta impone a tutte le leggi della fisica.

1.2.1 Linearità delle trasformazioni

Consideriamo un sistema di riferimento inerziali K, e in esso due eventi infinitesimamente


vicini, con coordinate xµ e xµ + dxµ . Le coordinate in un altro sistema di riferimento
K 0 saranno legate alle coordinate in K da una generica trasformazione x0µ = f µ (x). Se
le funzioni f µ sono sufficientemente regolari le coordinate degli stessi due eventi in K 0
differiranno allora di,
∂f µ (x) ν
dx0µ = dx ≡ Λµ ν (x) dxν .
∂xν

3
Tuttavia, per l’omogeneità dello spazio e del tempo, postulato I), la matrice Λµ ν (x) deve
essere indipendente da x, e integrando si perciò una relazione lineare tra le coordinate in
K e K 0,
x0µ = Λµ ν xν + aµ . (1.1)

Per le coordinate covarianti si ottiene allora,

e µ ν xν + a µ ,
x0µ = Λ e µ ν ≡ ηµα η νβ Λα β .
Λ (1.2)

I quattro parametri aµ corrispondono ad arbitrarie traslazioni dello spazio e del tempo, che
rappresentano in effetti una classe di trasformazioni permesse tra due sistemi di riferimento
inerziali. D’altra parte ci si convince facilmente che per una scelta arbitraria dei 16
parametri Λµ ν la (1.1) in generale non corrisponde a una trasformazione da un sistema
di riferimento inerziale a un altro. Per vederlo è sufficiente considerare la scelta Λµ ν =
k δ µ ν , corrispondente a una trasformazione di scala, che per k 6= 1 in generale non lascia
invarianti le leggi della fisica.

1.2.2 Invarianza dell’intervallo

Per determinare la classe delle matrici Λ che corrispondono a trasformazioni tra sistemi di
riferimento fisicamente permesse è necessario ricorrere anche al postulato II), dimostrando
“l’invarianza dell’intervallo”. Si definisce intervallo tra due eventi xµ e xµ + dxµ , con dxµ
differenze infinitesime o anche finite, la quantità,

ds2 ≡ dxµ dxν ηµν = dt2 − |d~x|2 ,

che si dimostra essere indipendente dal sistema di riferimento. Consideriamo, infatti,


l’intervallo tra gli stessi due eventi in un altro sistema di riferimento K 0 . Per (1.1) si ha,

ds02 = dx0µ dx0ν ηµν = dt02 − |d~x 0 |2 = Gµν dxµ dxν , (1.3)

dove la matrice simmetrica Gµν è definita da,

Gµν ≡ Λα µ Λβ ν ηαβ ,

e risulta indipendente dagli eventi considerati. Se i due eventi corrispondono al passaggio


di un raggio di luce si ha evidentemente ds2 = 0, e vale anche il viceversa. Dal postulato

4
II) segue allora che,

ds02 = 0 ⇔ ds2 = 0 ⇔ dt = ±|d~x|.

Concludiamo che la quantità ds02 , vista come polinomio del secondo ordine in dt, ha gli
zeri in dt = ±|d~x|. La (1.3) permette allora di scrivere,

ds02 = G00 (dt − |d~x|) (dt + |d~x|) = G00 ds2 , (1.4)

dove la quantità G00 può dipendere solo dal moto relativo dei due riferimenti. In parti-
colare, per l’invarianza per rotazioni – postulato I) – G00 può dipendere solo dal modulo
della velocità relativa, G00 (|~v |). Ma invertendo nella (1.4) i ruoli di K e K 0 avremmo
~v → −~v e quindi otterremmo G00 (|~v |) = 1/G00 (|~v |), e dunque G00 = 1. L’intervallo tra
due eventi qualsiasi è quindi lo stesso in tutti i sistemi di riferimento,

ds2 = ds02 ,

e la (1.3) pone dunque,


Gµν = ηµν .

Concludiamo che le matrici Λ che compaiono nelle trasformazioni (1.1) tra due sistemi di
riferimento sono soggette ai vincoli,

Λα µ Λβ ν ηαβ = ηµν ⇔ ΛT η Λ = η. (1.5)

L’insieme di queste matrici forma un gruppo di Lie, chiamato gruppo di Lorentz, che
viene anche indicato con,

O(1, 3) ≡ {Λ, matrici reali 4 × 4 /ΛT η Λ = η}.

Due generici sistemi di riferimento sono pertanto collegati da una trasformazione li-
neare non omogenea del tipo (1.1), dove Λ è un elemento del gruppo di Lorentz. L’insieme
di queste trasformazioni forma a sua volta un gruppo di Lie che viene chiamato gruppo
di Poincaré, P. Gli elementi di questo gruppo sono identificati univocamente dalle coppie
(Λα β , aµ ),
P ≡ {(Λ, a) /Λ ∈ O(1, 3), a ∈ R4 }.

5
Il gruppo O(1, 3) è omeomorfo al sottogruppo di P corrispondente ad a = 0, mentre
gli elementi di P corrispondenti a Λµ ν = δ µ ν formano il sottogruppo delle traslazioni.
Le trasformazioni delle coordinate (1.1) indotte dagli elementi del gruppo di Poincaré
vengono chiamate trasformazioni di Poincaré, mentre le trasformazioni corrispondenti ad
aµ = 0 vengono chiamate trasformazioni di Lorentz.
Strettamente parlando quello che abbiamo dimostrato finora è che una trasformazione
che collega due sistemi di riferimento inerziali è necessariamente una trasformazione di
Poincaré. A rigore dovremmo ancora convincerci che ogni trasformazione di Poincaré
corrisponde realmente al passaggio da un riferimento inerziale a un altro; è ovvio che
questo problema riguarda solo le trasformazioni di Lorentz in quanto le traslazioni hanno
un significato fisico immediato. Affronteremo questa questione nella sezione 1.4.

1.3 Leggi fisiche covarianti a vista

Una volta determinata la forma delle trasformazioni delle coordinate da un sistema di


riferimento a un altro possiamo procedere all’implementazione del postulato III), ovverosia
allo sviluppo di una strategia che permetta di derivare leggi fisiche che soddisfano il
principio di relatività einsteiniana. Prima di poter fare questo dobbiamo determinare
il modo in cui si trasformano in generale le grandezze fisiche quando si passa da un
riferimento a un altro.
Cominciamo notando che il gruppo di Lorentz possiede come sottogruppo il gruppo
delle rotazioni spaziali, vedi sezione 1.4, rappresentato dalle matrici 3 × 3 ortogonali Ri j ,

O(3) ≡ {R matrici reali 3 × 3 /RT R = I}.

Questo gruppo costituisce un gruppo di invarianza “a vista” per le equazioni della Mec-
canica Newtoniana, in quanto queste genericamente sono scritte in forma tri–vettoriale.
Esempi ne sono l’equazione di Newton stessa, F~ = m~a, oppure la formula per il momento
angolare di un corpo rigido, Li = I ij ω j , dove I ij è il tensore d’inerzia,
X
I ij = mn (xin xjn − rn2 δ ij ),
n
j
e ω è lo pseudo–vettore velocità angolare. Notiamo comunque che le grandezze fi-
siche coinvolte sono raggruppate in vettori o tensori tridimensionali, che trasformano

6
linearmente sotto O(3). Abbiamo per esempio,

F 0i = Ri j F j , I 0ij = Ri m Rj n I mn .

Essendo O(3) sottogruppo di O(1, 3) possiamo allora assumere che le grandezze fisiche
che compaiono nelle leggi della fisica relativistica siano raggruppate in multipletti che tra-
sformano linearmente sotto il gruppo di Lorentz. Nel linguaggio della teoria dei gruppi si
dice che ciascuno di questi multipletti deve essere sede di una rappresentazione, riducibi-
le o irriducibile, del gruppo di Lorentz. Da un risultato fondamentale della teoria delle
rappresentazioni dei gruppi segue allora che questi multipletti devono formare “tensori
quadridimensionali di rango (m, n)” sotto l’azione del gruppo di Lorentz.
Per definizione un tensore quadridimensionale di rango (m, n) porta m indici contro-
varianti e n indici covarianti,
TNM ≡ Tνµ11···ν
···µm
n
,

ed è caratterizzato dalla specifica legge di trasformazione sotto una generica trasformazio-


ne di Poincaré (1.1), che specificheremo tra un momento. Tensori di rango (0,0) vengono
chiamati scalari, e tensori di rango (1,0) e (0,1) vengono chiamati vettori, rispettivamente
controvarianti e covarianti.
Più in generale considereremo campi tensoriali di rango (m, n), che rispetto ai ten-
sori esibiscono anche una dipendenza dalla coordinata quadridimensionale x, Tνµ11···ν
···µm
n
(x).
Per definizione la sua legge di trasformazione sotto una trasformazione di Poincaré delle
coordinate, x0 = Λx + a, è data da,

Tν0µ1 ···ν
1 ···µm e ν1 β1 · · · Λ
(x0 ) = Λµ1 α1 · · · Λµm αm Λ e νn βn T α1 ···αm (x). (1.6)
n β1 ···νn

In particolare un campo tensoriale è invariante per traslazioni. La legge di trasformazione


di un tensore di rango (m, n) si ottiene semplicemente dalla (1.6) omettendo la dipendenza
dalle coordinate spazio–temporali. In seguito per semplicità useremo la dicitura generica
“tensore” sia per un campo tensoriale che per un tensore, in quanto sarà chiaro dal contesto
di che tipo di oggetto si sta trattando.
Una volta accettato che le osservabili fisiche in una teoria relativistica si devono rag-
gruppare in tensori quadridimensionali, l’implementazione del postulato III) – la relati-
vità einsteiniana – avviene in analogia con la Meccanica Newtoniana. Cosı̀ come le leggi

7
di quest’ultima eguagliando vettori tridimensionali a vettori tridimensionali rispettano
automaticamente la richiesta di invarianza sotto rotazioni spaziali, le leggi della fisica
relativistica avranno automaticamente la stessa forma in tutti i sistemi di riferimento
inerziali, se sono scritte nel linguaggio quadritensoriale, cioè, eguagliano quadritensori a
N
quadritensori. Se SM e TNM sono due tensori dello stesso rango schematicamente avremo
infatti,
M
SN (x) = TNM (x) in K ⇒ 0M
SN (x0 ) = TN0M (x0 ) in K 0 , (1.7)

come si vede moltiplicando la prima equazione con un’opportuna serie di matrici Λ. Un’e-
quazione scritta in forma quadritensoriale come la (1.7) si dice essere “covariante a vista”,
in quanto soddisfa automaticamente il principio di relatività einsteiniana.
In conclusione, il paradigma della covarianza a vista costituisce il metodo più diretto
ed efficace per implementare il postulato III) in una qualsiasi teoria relativistica: in ultima
analisi questo pardigma risulta equivalente al postulato stesso in quanto non sono note
leggi fisiche che hanno la stessa forma in tutti i riferimenti inerziali, ma non possono essere
poste in forma covariante a vista.
Di seguito riassumiamo gli elementi fondamentali del calcolo tensoriale in quanto
strumento essenziale per la costruzione di equazioni covarianti a vista.

1.3.1 Calcolo tensoriale

Di seguito elenchiamo le operazioni principali che si possono eseguire sui tensori, lasciando
eventuali dimostrazioni per lo più come esercizio.
Indici covarianti e controvarianti. Un tensore di rango (m, n) può essere trasformato
in un tensore di rango (m − k, n + k), alzando o abbassando k indici con la metrica di
Minkowski. In generale il tensore ottenuto viene indicato ancora con lo stesso simbolo.
Per esempio, per m = 2, n = 1 e k = 2 si scrive,

Tαβρ = ηαµ ηβν T µν ρ .

Di conseguenza un tensore di rango (m, n) è equivalente a tutti gli effetti a un tensore di


rango (m − k, n + k), motivo per cui come rango di un tensore si definisce spesso l’intero
m + n.

8
Prodotti tra tensori. Il “prodotto” tra due tensori di rango (m, n) e (k, l) è un tensore
di rango (m + k, n + l).
Contrazione degli indici e prodotti scalari. A partire da un tensore di rango (m, n) si
possono costruire tensori di rango (m − k, n − k), contraendo k indici covarianti con k
indici controvarianti. Per esempio, a partire da un tensore T µν ρ di rango (2, 1) contraendo
un indice si ottiene il vettore controvariante,

T µν ν = T µν ρ δνρ . (1.8)

In particolare la contrazione degli indici del prodotto di due vettori, T µ Uν , dà lo scalare,

T µ Uν δµν = T µ Uµ = T µ U ν ηµν .

Indicheremo il “quadrato” di un vettore con V 2 ≡ V µ Vµ .


Gradiente di un campo tensoriale. Il gradiente quadri–dimensionale, o più semplice-
mente la “derivata”, di un campo tensoriale di rango (m, n) costituisce un campo tensoriale
di rango (m, n + 1). Indicheremo il gradiente rispetto alle coordinate spazio–temporali
controvarianti con il simbolo,

∂µ ≡ .
∂xµ
Si noti che l’operatore ∂µ porta l’indice in basso in quanto corrisponde a un vettore
covariante. Cosı̀ la derivata di un campo scalare ϕ(x) è il campo vettoriale covariante
∂µ ϕ(x).
Simmetrie. Un tensore di rango (2, 0) si dice simmetrico se S µν = S νµ , e antisimmetrico
se Aµν = −Aνµ , proprietà che vengono preservate dalle trasformazioni di Poincaré. La
contrazione doppia del prodotto tra un tensore simmetrico e uno antisimmetrico è zero,

Aµν Sµν = 0.

Si definiscono parte simmetrica e parte antisimmetrica di un generico tensore di rango


(2, 0) T µν i tensori,
1 µν 1 µν
T (µν) ≡ (T + T νµ ), T [µν] ≡ (T − T νµ ),
2 2
il primo essendo un tensore simmetrico e il secondo un tensore antisimmetrico. Si ha la
decomposizione,
T µν = T (µν) + T [µν] .

9
Per la contrazione doppia del prodotto di un generico tensore T µν con un tensore simme-
trico, rispettivamente antisimmetrico, valgono le identità,

T µν Sµν = T νµ Sµν = T (µν) Sµν , T µν Aµν = −T νµ Aµν = T [µν] Aµν . (1.9)

Un tensore di rango (n, 0) si dice completamente (anti)simmetrico se è (anti)simmetrico


nello scambio di qualsiasi coppia di indici, proprietà preservata dall’azione del gruppo di
Poincaré. Si definisce parte completamente antisimmetrica di un tensore T µ1 ···µn di rango
(n, 0), il tensore dello stesso rango,
1
T [µ1 ···µn ] ≡ (T µ1 µ2 ···µn − T µ2 µ1 ···µn + · · ·),
n!
dove nella somma compaiono tutte le n! permutazioni degli indici, ciascuna con il segno
(−)p dove p è l’ordine della permutazione. Il tensore T [µ1 ···µn ] è completamente antisim-
metrico, ed esso è nullo se T µ1 ···µn è simmetrico anche in una sola coppia di indici. Inoltre
la contrazione doppia del prodotto di T [µ1 ···µn ] con un tensore di rango (0, 2) simmetrico
è nulla.
Proprietà speculari valgono per la parte completamente simmetrica di un tensore di
rango (n, 0),
1
T (µ1 ···µn ) ≡ (T µ1 µ2 ···µn + T µ2 µ1 ···µn + · · ·).
n!
Tensori invarianti. Un tensore TNM si dice invariante sotto il gruppo di Lorentz O(1, 3)
se per ogni Λ ∈ O(1, 3) si ha
TN0M = TNM .

Osserviamo che da (1.5) segue che le matrici Λ ∈ O(1, 3) soddisfano |detΛ| = 1. Se


ci limitiamo alla richiesta di invarianza sotto trasformazioni di Lorentz corrispondenti
a detΛ = +1, usando la teoria dei gruppi si può dimostrare che un generico tensore
invariante è necessariamente un polinomio nei due tensori invarianti fondamentali,

η αβ e εαβγδ ,

dove εαβγδ è il tensore (di Levi–Civita) completamente antisimmetrico, determinato in


modo univoco dalla condizione ε0123 = 1. La restrizione alle sole matrici con detΛ = +1
deriva dal fatto che per una generica matrice Λ 4 × 4 si ha l’identità del determinante,

Λα µ Λβ ν Λγ ρ Λδ σ εµνρσ = detΛ · εαβγδ ,

10
proprietà che identifica il tensore di Levi–Civita come uno “pseudotensore” invariante.
Questo tensore gode delle proprietà,

µ ν ρ σ µ ν ρ
εµνρσ εαβγδ = −4! δ[α δβ δγ δδ] , εµνρσ εαβγσ = −3! δ[α δβ δγ] ,

µ ν
εµνρσ εαβρσ = −2!2! δ[α δβ] , εµνρσ εανρσ = −3! δαµ , εµνρσ εµνρσ = −4!

Il fatto che la metrica di Minkowski sia un tensore invariante segue invece direttamente
dalla (1.5).

1.4 Struttura del gruppo di Lorentz

In questa sezione vogliamo analizzare brevemente la struttura del gruppo di Lorentz alla
luce del fatto che le matrici Λ che rappresentano trasformazioni ammesse di coordinate da
un sistema inerziale a un altro, sono vincolate dalla (1.5). In particolare vogliamo trovare
una parametrizzazione esplicita per la generica matrice Λ che soddisfa questo vincolo per
individuare le corrispondenti operazioni fisiche che connettono due sistemi di riferimento,
questione lasciata aperta nella sezione 1.2.2. Come vedremo a questo scopo sarà utile
eseguire un’analisi dettagliata delle trasformazioni di Lorentz prossime all’identità.
Cominciamo con il notare che i vincoli (1.5) comportano le condizioni |detΛ| = 1 e
|Λ0 0 | ≥ 1. Il gruppo di Lorentz risulta quindi scisso in quattro sottoinsiemi disgiunti,
a seconda del valore di detΛ e del segno di Λ0 0 . Si chiama gruppo di Lorentz proprio il
sottogruppo di O(1, 3) definito da,

SO(1, 3)c ≡ {Λ ∈ O(1, 3)/detΛ = 1, Λ0 0 ≥ 1}.

Il simbolo “S” indica comunemente il fatto che il determinante delle matrici vale +1, e il
pedice “c” si riferisce al fatto che il gruppo di Lorentz proprio risulta connesso all’unità,
al contrario di O(1, 3). Siccome gli altri tre sottoinsiemi di O(1, 3) si possono ottenere
da SO(1, 3)c attraverso trasformazioni discrete è sufficiente occuparsi di questo ultimo
gruppo.
Conosciamo già due classi importanti di elementi di SO(1, 3)c . La prima classe è
costituita dalle rotazioni spaziali definite da,

Λi j = Ri j , Λ0 0 = 1, Λ0 i = 0 = Λi 0 ,

11
dove R ∈ SO(3) ≡ {R ∈ O(3)/detR = 1}. Si verifica infatti immediatamente che la
matrice Λ cosı̀ definita soddisfa la (1.5).
La seconda classe importante è costituita dalle trasformazioni di Lorentz speciali. Per
un sistema di riferimento che si muove con velocità v lungo l’asse x abbiamo per esempio,
 
γ −βγ 0 0
 −βγ γ 0 0 
Λµ ν = 
 0
, (1.10)
0 1 0 
0 0 0 1

dove β = v e γ = 1/ 1 − v 2 . In generale possiamo eseguire trasformazioni di Lorentz
speciali con velocità ~v arbitraria, purché in modulo minore di uno, e le matrici Λ corrispon-
denti dipenderanno quindi da tre parametri indipendenti, vale a dire dalle tre componenti
della velocità. Le rotazioni spaziali dipendono a loro volta da tre parametri indipendenti,
per esempio i tre angoli di Eulero, e ci aspettiamo quindi che i 16 elementi della generica
matrice Λ ∈ SO(1, 3)c possano esprimersi in termini di 6 variabili indipendenti. In altre
parole, il gruppo di Lie SO(1, 3)c dovrebbe avere dimensione 6.
Per dimostrare la correttezza di questa conlusione riscriviamo la (1.5) come,

H ≡ ΛT ηΛ − η = 0, (1.11)

che corrisponde a un sistema di 16 equazioni nelle 16 incognite Λµ ν , vale a dire H µν = 0.


Tuttavia, siccome per costruzione H è una matrice 4 × 4 simmetrica, solo 10 di queste
equazioni sono linearmente indipendenti, e la generica soluzione Λ potrà quindi esprimersi
effettivamente in termini di 16 − 10 = 6 parametri indipendenti.

1.4.1 Trasformazioni infinitesime e trasformazioni finite

Per individuare una possibile scelta di questi 6 parametri consideriamo una generica
trasformazione di Lorentz prossima all’identità,

Λ µ ν = δ µ ν + Ωµ ν , |Ωµ ν | ¿ 1.

Imponendo la (1.11) e tenendo solo i termini lineari in Ωµ ν otteniamo,

(δ α µ + Ωα µ ) ηαβ (δ β ν + Ωβ ν ) − ηµν = 0 ⇒ ηνα Ωα µ = −Ωβ ν ηβµ . (1.12)

12
Definendo la matrice,
ωµν ≡ ηµβ Ωβ ν ,

risulta anche,
Ωµ ν = η µα ωαν , (1.13)

e la relazione in (1.12) diventa allora,

ωµν = −ωνµ . (1.14)

ω è quindi una matrice antisimmetrica e come tale ha sei elementi indipendenti. Con-
cludiamo che la generica trasformazione di Lorentz infinitesima dipende da sei parametri
liberi, potendo essere scritta come,

Λµ ν = δ µ ν + η µα ωαν . (1.15)

A questo punto siamo anche in grado di dare un’espressione esplicita per il generico
elemento finito di SO(1, 3)c . In forma matriciale risulta semplicemente,

Λ = e Ω, (1.16)

purché Ω soddisfi la relazione (1.12) oppure, equivalentemente, ω soddisfi la (1.14). Per


dimostrare che le matrici Λ date in (1.16) soddisfano effettivamente la condizione (1.11)
notiamo intanto che la (1.12) in forma matriciale si scrive,

η Ω = −ΩT η ⇔ ΩT = −η Ω η.

Risulta allora,

T
ΛT η Λ = e Ω η e Ω = e−η Ω η η e Ω = η e− Ω η η e Ω = η, c.v.d.

Notiamo infine che le matrici Λ date da (1.16), pur dipendendo da sei parametri indipen-
denti, parametrizzano solo SO(1, 3)c e non l’intero gruppo di Lorentz. Infatti, siccome
l’esponenziale di una matrice è una funzione continua dei suoi elementi, l’insieme delle
matrici e Ω è connesso con continuità alla matrice identità.
Per concludere chiariamo il significato fisico dei sei parametri ωµν analizzando di nuovo
una generica trasformazione infinitesima. In notazione tridimensionale, data la (1.14), in

13
tutta generalità possiamo porre,

ω00 = 0, (1.17)

ωi0 = v i = −ω0i (1.18)

ωij = ϕ εijk uk , (1.19)

dove il vettore ~v corrisponderà alla velocità infinitesima di un sistema di riferimeno ri-


spetto all’altro, mentre ϕ sarà l’angolo di rotazione infinitesimo attorno alla direzione
individuata dal versore ~u. Che queste interpretazioni sono in effetti corrette si vede
scrivendo esplicitamente le trasformazioni infinitesime delle coordinate, usando la (1.15),

x0µ = Λµ ν xν = xµ + η µα ωαν xν .

Otteniamo,

t0 = t + η 00 ω0i xi = t − ~v · ~x, (1.20)

x0i = xi + η ij (ωj 0 t + ωj k xk ) = xi − v i t + ϕ( ~u × ~x)i . (1.21)

Per ~v = 0 si ottiene in effetti una rotazione spaziale infinitesima di un angolo ϕ intorno


ad ~u, mentre per ϕ = 0 si riconosce una trasformazione di Lorentz speciale infinitesima

con velocità relativa ~v . Si noti che nelle (1.20), (1.21) sono assenti i fattori 1/ 1 − v 2 in
quanto essi introdurrebbero correzioni quadratiche in ωµν , mentre nella presente analisi
ci siamo limitati ai termini lineari in ωµν .
Infine, a titolo di esempio facciamo vedere in che modo possiamo riottenere la tra-
sformazione di Lorentz speciale finita data in (1.10), a partire dalla formula generale
(1.16). A questo scopo nella parametrizzazione generale (1.17)–(1.19) poniamo ϕ = 0 e
v i = (e
v , 0, 0), con,
ve = v + o(v 2 ).

In questo caso le componenti non nulle di ωµν sono,

ω10 = ve = −ω01 .

Dalla (1.13) segue allora che gli elementi non nulli della matrice Ωµ ν sono dati da,

Ω0 1 = −e
v = Ω1 0 . (1.22)

14
A questo punto il calcolo di e Ω può essere eseguito agevolmente sviluppando l’esponenziale
in serie di Taylor, ed è facile vedere che il risultato coincide con la (1.10), per un’opportuna
scelta di ve, vedi problema 1.7.

1.5 Problemi

1.1 Usando le tecniche della sezione 1.4 si trovi una parametrizzazione esplicita per la
generica matrice R appartenente a O(3).

1.2 Si dimostri che il tensore dato in (1.8) corrisponde a un vettore controvariante.

1.3 Si dimostri che l’operatore ∂µ corrisponde a un vettore covariante.

1.4 Si dimostrino le relazioni (1.9).

1.5 Si dimostri che la matrice Λµ ν data in (1.10) soddisfa il vincolo (1.5).

1.6 Dato un generico tensore T µνρ di rango (3, 0) si dimostri che si ha,

T [µνρ] = 0 ⇔ εµνρσ T µνρ = 0.

1.7 Si consideri la matrice,


 
0 −ev 0 0
 −ev 0 0 0 
Ωµ ν =
 0
,
0 0 0 
0 0 0 0
corrispondente a una trasformazione di Lorentz speciale infinitesima lungo l’asse x, vedi
(1.22). Si dimostri che l’esponenziale e Ω coincide con la trasformazione di Lorentz speciale
finita data in (1.10), per un’opportuna scelta di ve. [Sugg.: si sviluppi l’esponenziale in
serie di Taylor e si noti che la matrice,
µ ¶
0 1
M≡ ,
1 0

gode delle identità algebriche,


µ ¶
2n 1 0
M = , M 2n+1 = M,
0 1

per ogni intero positivo n.]

15
2 Le equazioni dell’Elettrodinamica

In questo capitolo presenteremo le equazioni che governano la dinamica di un sistema di


particelle cariche puntiformi in interazione con il campo elettromagnetico, ne illustreremo
ruolo e significato e analizzeremo le loro caratteristiche generali. Una parte sostanziale
del corso sarà poi dedicata ad un’analisi approfondita delle soluzioni e delle conseguenze
fisiche di queste equazioni.
Cominciamo con l’introdurre le grandezze fisiche che caratterizzano dal punto di vista
cinematico il moto di una singola particella relativistica.

2.1 Cinematica di una particella relativistica

Linee di universo causali. In Meccanica Newtoniana le legge oraria di una particella cor-
risponde alla curva tridimensionale ~y (t) ≡ (x(t), y(t), z(t)) 1 . In ambito relativistico per
motivi di covarianza si introduce la traiettoria quadridimensionale γ della particella –
detta anche linea di universo – che è descritta da quattro funzioni di un parametro reale
λ,
y µ (λ) = (y 0 (λ), ~y (λ)),

che in generale supporremo essere di classe C 2 . Perchè una linea di universo sia fisicamente
accettabile è necessario che essa sia causale e diretta nel futuro. Diremo che una linea di
universo è causale e diretta nel futuro quando, definito il vettore tangente,

µ dy µ
V = ,

risultano soddisfatte le condizioni,


a) V 2 ≥ 0, ∀λ,
b) V 0 > 0, ∀λ.
Se la condizione b) è sostituita con la richiesta V 0 < 0, ∀λ la linea di universo si dice
invece causale e diretta nel passato. La condizione a) segue dal fatto che in una teoria
relativistica una particella non può superare la velocità della luce, mentre la condizione b)
1
Di solito la legge oraria di una particella viene indicata con ~x(t). Noi preferiamo la notazione
~y (t) al posto di ~x(t), per evitare la confusione con il generico evento (t, ~x) in cui si valuta il campo
elettromagnetico.

16
assicura che il parametro λ è una funzione monotona crescente del tempo, proprietà il cui
significato verrà chiarito tra un momento. Da un punto di vista geometrico la condizione
a) definisce l’interno del cono luce, mentre l’aggiunta della condizione b) ne delimita la
metà “in avanti”, ovvero, il “cono luce futuro”. D’ora in poi supporremo, dunque, che
la linea di universo percorsa da una qualsiasi particella sia causale e diretta nel futuro,
ovvero, che il suo vettore tangente V µ appartenga all’interno del cono luce futuro, per
ogni λ.
Per la condizione b), ovvero dy 0 /dλ > 0, la funzione y 0 (λ) può essere invertita per
determinare in modo univoco il parametro in funzione del tempo,

y 0 (λ) = t ⇒ λ(t).

Le componenti spaziali ~y (λ) descrivono invece la traiettoria tridimensionale della particel-


la. La legge oraria tridimensionale si ottiene, infine, eliminando dalla traiettoria spaziale
il parametro λ in favore del tempo, e per semplicità la scriveremo come,

~y (λ(t)) ≡ ~y (t).

In seguito indicheremo velocità e accelerazione tridimensionali con,


d~y d~v
~v = , ~a = .
dt dt
Invarianza per riparametrizzazione. Rispetto alla Meccanica Newtoniana sembrerebbe
che la linea di universo relativistica introduce un quarto grado di libertà nella dinamica
della particella – la funzione y 0 (λ). Tuttavia, questo grado di libertà risulta “spurio”,
ovvero inosservabile, in quanto riflette l’arbitrarietà della scelta del parametro. Due linee
di universo y1µ (λ) e y2µ (λ) risultano, infatti, fisicamente equivalenti se sono collegabili da
una ridefinizione del parametro, vale a dire se esiste una funzione f da R in R, invertibile
e di classe C 2 insieme alla sua inversa, tale che,

y1µ (f (λ)) = y2µ (λ).

Si dice che le due linee di universo sono collegate da una riparametrizzazione. È evidente
che le leggi orarie associate a due linee di universo collegate da una riparametrizzazione
sono identiche,
~y1 (t) = ~y2 (t).

17
Saremo quindi autorizzati a usare le linee di universo per descrivere il moto di una par-
ticella, al posto delle leggi orarie, purché le equazioni del moto che postuleremo risultino
invarianti per riparametrizzazione. Si noti che la stessa legge oraria ~y (t) è una funzione in-
variante per riparametrizzazione e risulta una “grandezza osservabile”, mentre le funzioni
~y (λ) e y 0 (λ) non lo sono.
Se tutte le equazioni che scriveremo risulteranno invarianti per riparametrizzazione
è lecito scegliere un parametro arbitrario. Una scelta che adotteremo di frequente è la
componente µ = 0 della traiettoria stessa, vale a dire il tempo, λ = y 0 ≡ t. In questo caso
la linea di universo sarà parametrizzata da,

y µ (t) = (t, ~y (t)).

Un’altra scelta di estrema utilità è il cosiddetto tempo proprio s, che ha il pregio di


essere invariante simultaneamente per trasformazioni di Lorentz e per riparametrizzazione.
Formalmente esso è definito da,
p
ds = dy µ dyµ , (2.1)

che costituisce una notazione abbreviata per l’espressione,


Z λr µ
dy dyµ
s(λ) = 0 dλ0
dλ0 + s(0), (2.2)
0 dλ
dove s(0) è una costante arbitraria. Mentre l’invarianza di Lorentz di s è manifesta, la
sua invarianza per riparametrizzazione è conseguenza del fatto che nella formula appena
scritta i fattori dλ0 formalmente si cancellano. Si noti inoltre che grazie alla causalità
della linea di universo – condizione a) di cui sopra – il radicando in (2.2) è mai negativo,
µ ¶2
dy µ dyµ dt
= (1 − v 2 ) ≥ 0.
dλ dλ dλ
Il concetto di tempo proprio permette poi di definire la derivata invariante,
d 1 d
≡q . (2.3)
ds dy µ dyµ dλ
dλ dλ

Grazie all’invarianza per riparametrizzazione di s, nelle (2.2) e (2.3) possiamo usare come
parametro il tempo, ottenendo cosı̀,
Z tp
d 1 d
s(t) = 1 − v 2 (t0 ) dt0 + s(0), =p . (2.4)
0 ds 1 − v 2 (t) dt

18
Quadrivelocità, quadriaccelerazione e quadrimomento sono definiti da,
µ ¶
µ dy µ 1 ~v duµ
u = = √ ,√ , wµ = , pµ = muµ ,
ds 1−v 2 1−v 2 ds
e soddisfano identicamente le relazioni,

uµ uµ = 1, uµ wµ = 0, p2 ≡ pµ pµ = m2 , (2.5)

dove m è la massa della particella. Per l’energia e la quantità di moto della particella si
ottengono allora le note espressioni,
m m~v
ε ≡ p0 = √ , p~ = √ .
1 − v2 1 − v2
Notiamo ancora che per ogni fissato istante t0 esiste sempre un sistema di riferimento
inerziale K – chiamato “sistema a riposo istantaneo” – in cui la particella all’istante t0 è
a riposo. Si verifica facilmente che in K in questo istante si ha,

uµ = (1, ~0), wµ = (0, ~a).

2.2 L’Elettrodinamica di particelle puntiformi

Introduciamo ora il sistema fisico la cui dinamica è l’oggetto di studio primario di questo
testo: un sistema di N particelle cariche puntiformi interagenti con il campo elettroma-
gnetico. Le variabili cinematiche indipendenti che lo descrivono sono le 4N funzioni yrµ (λr )
con r = 1, . . . , N , che parametrizzano le linee di universo γr percorse dalle particelle, e il
campo tensoriale di Maxwell F µν (x) antisimmetrico,

F µν = −F νµ .

Per ciascuna delle particelle possiamo definire le quantità cinematiche introdotte nella
sezione precedente: il tempo proprio sr , la quadrivelocità uµr , la quadriaccelerazione wrµ , e
il quadrimomento pµr = mr uµr , dove mr è la massa della particella r–esima. Per il momento
parametrizziamo ogni linea di universo γr con un parametro λr arbitrario.
Se indichiamo con er la carica della particella r–esima, al sistema di cariche resta
associata la (densità di) quadricorrente elettrica,
X Z X Z dy µ
µ µ 4 r 4
j (x) = er dyr δ (x − yr ) ≡ er δ (x − yr (λr )) dλr . (2.6)
r γr r
dλ r

19
Questa espressione risulta manifestamente Lorentz–covariante e – come conviene a qual-
siasi grandezza osservabile – essa è anche invariante per riparametrizzazione in quanto
i fattori dλr formalmente si cancellano. Ricordiamo inoltre che questa corrente risulta
conservata identicamente,
∂µ j µ = 0. (2.7)

Le proprietà di una generica quadricorrente elettrica conservata verranno analizzate in


dettaglio nel paragrafo 2.4.1. Quı̀ ci limitiamo a osservare che la corrente di un sistema di
particelle puntiformi strettamente parlando non può essere considerata come un “campo
vettoriale”, in quanto le sue quattro componenti, coinvolgendo la funzione–δ di Dirac,
non sono “funzioni di x” ma elementi di S 0 (R4 ), vale a dire distribuzioni temperate. La
corrente data in (2.6) va quindi considerata piuttosto come un “campo vettoriale a valori
nelle distribuzioni”. Le conseguenze di questa circostanza verranno discusse in dettaglio
nella prossima sezione, dove analizzeremo a fondo la natura distribuzionale delle equazioni
di Maxwell.
~ B)
Ricordiamo che il tensore di Maxwell è legato ai campi elettrico e magnetico (E, ~

dalle note relazioni,

F 00 = 0 (2.8)

F i0 = Ei (2.9)
1
F ij = − εijk B k ↔ B i = − εijk F jk , (2.10)
2

e che gli invarianti di Lorentz indipendenti che si possono formare con le componenti di
F µν sono dati da,

~ · B,
εµνρσ Fµν Fρσ = −8 E ~ F µν Fµν = 2 (B 2 − E 2 ). (2.11)

Presentiamo ora le tre equazioni fondamentali che governano la dinamica del nostro
sistema,

dpµr
= er F µν (yr ) urν , (2.12)
dsr
εµνρσ ∂ν Fρσ = 0, (2.13)

∂µ F µν = j ν , (2.14)

20
che chiamiamo rispettivamente Equazioni di Lorentz, Identità di Bianchi ed Equazione di
Maxwell. Scopo di queste equazioni è di determinare univocamente i campi F µν (x) e le
linee di universo yrµ (λr ) – modulo riparametrizzazioni – date certe condizioni iniziali, vale
a dire, di dare luogo a un ben definito problema di Cauchy in accordo con il determinismo
newtoniano. Per le coordinate yrµ il problema di Cauchy verrà specificato nel prossimo
paragrafo mentre per il tensore di Maxwell lo affronteremo più avanti.
Di seguito analizzeremo brevemente la struttura e il significato delle singole equazioni.

2.2.1 Equazione di Lorentz

Per non appesantire la notazione consideriamo una singola particella di carica e e linea di
unverso y µ (λ), che deve dunque soddisfare l’equazione di Lorentz,

dpµ
= eF µν (y) uν . (2.15)
ds

Prima di tutto facciamo notare che in questa equazione il campo elettromagnetico ri-
sulta valutato sulla traiettoria della particella in quanto con F µν (y) si intendono le sei
funzioni di una variabile F µν (y(λ)). Assunto noto il campo elettromagnetico F µν (x) le
(2.15) cositituiscono allora formalmente quattro equazioni differenziali del secondo ordine
nelle quattro funzioni incognite y µ (λ). D’altra parte queste equazioni risultano invarianti
per riparametrizzazione perché l’unica variabile che vi compare esplicitamente è il tempo
proprio s, e ciò comporta che esse determinano le y µ (λ) solo modulo una riparametriz-
zazione in accordo con quanto richiesto nella sezione 2.1. In particolare queste equazioni
dovrebbero allora determinare univocamente la legge oraria ~y (t) note le condizioni iniziali,

~y (0) e ~v (0). (2.16)

Vediamo allora due approcci diversi – ma matematicamente e fisicamente equivalenti – di


formulare il problema alle condizioni iniziali.
Approccio covariante. In questo approccio si considera s come una variabile indipen-
dente, vale a dire non legata alla traiettoria dalla (2.2), e si parametrizza la linea di
universo con s. Corrispondentemente le (2.15) sono considerate come quattro equazioni
differenziali del secondo ordine nelle quattro funzioni incognite y µ (s), che ora però sono

21
legate dal vincolo supplementare, vedi (2.1),

dy µ dyµ
u2 = = 1. (2.17)
ds ds

Tuttavia, il contenuto di questo vincolo risulta meno restrittivo di quanto non potrebbe
sembrare a prima vista. Le (2.15) assicurano infatti che esso è automaticamente soddi-
sfatto per ogni valore s, una volta che è soddisfatto all’istante iniziale, diciamo per s = 0.
Per vederlo è sufficiente moltiplicare le (2.15) con uµ . Il membro di destra si annulla al-
lora identicamente, perché F µν uµ uν = 0 grazie all’antisimmetria del tensore di Maxwell.
Quindi deve annullarsi anche il membro di sinistra,

dpµ m d 2
0 = uµ = u.
ds 2 ds

u2 è quindi indipendente da s, e se vale 1 per s = 0 vale 1 per ogni s.


Analizziamo ora le condizioni iniziali. Essendo le (2.15) del secondo ordine esse hanno
soluzione unica note le condizioni iniziali,

dy µ
y µ (0), (0) ≡ uµ (0).
ds

Per quanto riguarda y µ (0) osserviamo che, traslando il tempo iniziale, senza perdita di
generalità possiamo porre y 0 (0) = 0, mentre ~y (0) fa parte dei dati iniziali “fisici”, vedi
(2.16). Per quanto riguarda invece uµ (0), una volta assegnata la velocità iniziale ~v (0)
poniamo prima,
~v (0)
~u(0) = p ,
1 − v 2 (0)
e imponiamo poi il vincolo (2.17) all’istante s = 0,
p 1
u0 (0) = 1 + |~u(0)|2 = p .
1 − v 2 (0)

A questo punto le (2.15) determinano le y µ (s) in modo univoco, e il vincolo (2.17) è


automaticamente soddisfatto per ogni s. La legge oraria ~y (t) si ottiene infine usando
l’equazione y 0 (s) = t per determinare s come funzione di t, e sostituendo la funzione
risultante s(t) in ~y (s).
L’approccio covariante è molto conveniente quando il campo elettromagnetico ha una
forma analitica semplice, vedi per esempio il problema 2.7.

22
Approccio non covariante. In questo approccio si affronta la soluzione delle (2.15)
parametrizzando la linea di universo con il tempo,

y µ (t) = (t, ~y (t)),

con il vantaggio palese che non sono presenti gradi di libertà spuri. In questo caso abbiamo
ancora quattro equazioni differenziali del secondo ordine, ma le incognite sono solo le tre
funzioni ~y (t). Tuttavia, possiamo fare vedere che solo tre delle quattro equazioni (2.15)
sono funzionalmente indipendenti. Per fare questo definiamo il quadrivettore,

dpµ
Hµ ≡ − eF µν uν ,
ds

e scriviamo l’equazione di Lorentz nella forma,

H µ = 0.

Dalle (2.8)–(2.10) si ricavano facilmente le componenti spaziali e temporale di H µ ,


µ ³ ´¶
~ 1 d~p ~ ~
H = √ − e E + ~v × B ,
1 − v 2 dt

µ ¶
0 1 dε ~
H = √ − e ~v · E .
1 − v2 dt

A questo punto osserviamo che vale identicamente – anche senza usare la (2.15) –

~ = 0.
uµ H µ = u0 H 0 − ~u · H (2.18)

Infatti, in contrasto con l’approccio precedente, in questo caso la relazione uµ wµ = 0 è


un’identità, e vale ancora uµ uν F µν = 0. Ne discende che H 0 dipende funzionalmente da
~ essendo,
H
~
~u · H
H0 = ~
= ~v · H.
u0
La componente temporale dell’equazione di Lorentz, H 0 = 0, è allora automaticamente
~ = 0. È allora sufficiente
soddisfatta se sono soddisfatte le sue componenti spaziali, H
risolvere queste ultime che, essendo del secondo ordine nelle derivate temporali, assumono
a tutti gli effetti il ruolo di “equazione di Newton” per la particella,

d~p ³ ´
~ ~
= e E + ~v × B . (2.19)
dt
23
Dato F µν (x) e note le condizioni iniziali ~y (0), ~v (0), essa ammette soluzione unica per la
legge oraria ~y (t). La componente temporale dell’equazione di Lorentz corrisponde invece
alla legge della potenza,
dε ~
= e ~v · E, (2.20)
dt
ed è quindi conseguenza dell’equazione di Newton, esattamente come in fisica non relati-
vistica. Infine, nota ~y (t) la (2.4) fornisce s(t) e permette quindi di ricostruire y µ (s).
Concludiamo questo paragrafo insistendo sul significato preciso della (2.19), come
spiegato all’inizio di questo paragrafo,
à !
d m ~v (t) h i
p ~ ~y (t)) + ~v (t) × B(t,
= e E(t, ~ ~y (t)) . (2.21)
dt 1 − v(t)2

2.2.2 Identità di Bianchi

L’“identità” (2.13) nella nomenclatura comune costituisce “metà” delle equazioni di Max-
well, più precisamente quella metà che non lega il campo elettromagnetico alla corrente
ma ne vincola la forma. In effetti è facile trovare soluzioni semplici di questa equazione
in termini di un potenziale vettore Aµ , detto anche campo di Maxwell o campo di gauge,
ponendo,
Fµν = ∂µ Aν − ∂ν Aµ . (2.22)

Sostituendo in (2.13) si trova infatti,

εµνρσ ∂ν Fρσ = εµνρσ (∂ν ∂ρ Aσ − ∂ν ∂σ Aρ ) = 0, (2.23)

in quanto in entrambi i termini si contrae una coppia di indici simmetrici – quelli delle
derivate – con una coppia di indici antisimmetrici – quelli del tensore di Levi–Civita. Ma
usando i metodi della Geometria Differenziale si può dimostrare un risultato più forte: per
ogni campo tensoriale antisimmetrico Fµν soddisfacente l’equazione (2.13) esiste un campo
vettoriale Aµ , tale che Fµν possa essere scritto come in (2.22) 2 . La conclusione, forse
sorprendente, è che la (2.22) rappresenta la soluzione generale dell’identità di Bianchi.
2
Questo risultato è valido purché lo spazio–tempo considerato sia topologicamente banale, come per
esempio R4 .

24
Tuttavia, potenziali vettori diversi possono dare luogo allo stesso F µν . Infatti, dato
un campo scalare Λ qualsiasi si può definire un nuovo potenziale vettore,

A0µ = Aµ + ∂µ Λ, (2.24)

e si verifica immediatamente che vale,

0
Fµν = ∂µ A0ν − ∂ν A0µ = Fµν + ∂µ ∂ν Λ − ∂ν ∂µ Λ = Fµν ,

grazie alla commutatività delle derivate parziali. Le trasformazioni (2.24), che vengono
chiamate trasformazioni di gauge, lasciano quindi il tensore di Maxwell invariante.
In definitiva possiamo affermare che “l’identità” di Bianchi può essere risolta identica-
mente in termini di un potenziale vettore, ma che il potenziale vettore stesso è determinato
solo modulo una trasformazione di gauge. Schematicamente abbiamo,

εµνρσ ∂ν Fρσ = 0 ⇐⇒ Fµν = ∂µ Aν − ∂ν Aµ , con Aµ ≈ Aµ + ∂µ Λ. (2.25)

La nostra strategia per affrontare il sistema (2.12)–(2.14) sarà – nella maggior parte dei
casi – di considerare risolta l’identità di Bianchi in termini di Aµ , rimanendo quindi con
le equazioni (2.12) e (2.14) nelle incognite yrµ e Aµ .
~ in notazione tridimensionale le (2.22) corri-
Ricordiamo che, ponendo Aµ = (A0 , A),
spondono alle relazioni note,
~
E ~ 0 − ∂A ,
~ = −∇A ~ =∇
B ~ × A.
~ (2.26)
∂t

2.2.3 Equazione di Maxwell

L’equazione (2.14) è da considerarsi come la vera e propria equazione del moto per il campo
elettromagnetico, in quanto lega F µν alla quadricorrente elettrica. Questa equazione
quantifica quindi il modo in cui la corrente genera il campo. Ricordiamo che l’equazione è
consistente con l’equazione di continuità della corrente, ∂ν j ν = 0, grazie all’antisimmetria
del tensore di Maxwell, che implica l’identità,

∂ν ∂µ F µν = 0.

Come abbiamo appena osservato, una volta risolta l’identità di Bianchi secondo la
(2.22), l’equazione di Maxwell diventa in realtà un’equazione per il potenziale vettore.

25
Avremmo quindi quattro equazioni differenziali alle derivate parziali del secondo ordine,
nelle quattro incognite Aµ . Tuttavia, questo conteggio è solo parzialmente significativo,
per due motivi: primo, le componenti del potenziale vettore non sono tutte “fisiche” in
quanto soggette alle trasformazioni di gauge; infatti, potenziali vettori diversi possono cor-
rispondere agli stessi campi elettrici e magnetici, ma sono solo questi ultimi a poter essere
osservati sperimentalmente. Secondo, le quattro componenti dell’equazione di Maxwell
non sono funzionalmente indipendenti. Per vederlo definiamo,

Gν ≡ ∂µ F µν − j ν ,

e scriviamo le equazione di Maxwell nella forma Gν = 0. Grazie alle identità ricordate


poc’anzi è poi immediato vedere che le Gν soddisfano identicamente il vincolo,

∂ν Gν = 0 ⇒ ~ · G.
∂0 G0 = −∇ ~ (2.27)

La derivata della componente temporale dell’equazione di Maxwell è quindi legata alle


sue componenti spaziali. Tuttavia, questo vincolo non è di tipo algebrico – non coinvolge
direttamente le equazioni del moto ma le loro derivate – e quindi non è immediato indi-
viduare le equazioni indipendenti. Risolveremo questo problema più avanti, nell’ambito
della formulazione del problema di Cauchy per il campo elettromagnetico, quando avremo
a disposizione i mezzi per affrontarlo. Concludiamo questa sezione con qualche ulteriore
commento sul sistema (2.12)–(2.14).
Sui gradi di libertà del campo elettromagnetico. Daremo una definizione precisa di ciò
che intendiamo con i “gradi di libertà” associati a un generico campo ϕ(x) in sezione 5.1,
dove analizzeremo anche a fondo i gradi di libertà del campo elettromagnetico. Quali-
tativamente possiamo dire che con i gradi di libertà di un sistema fisico si intendono le
variabili indipendenti necessarie per descriverne la dinamica. In particolare si richiede
che le equazioni del moto siano in grado di determinare il loro valore a un istante ge-
nerico, assegnati certi dati iniziali. Possiamo svolgere un’analisi preliminare dei gradi di
libertà contenuti nel campo elettromagnetico, se partiamo dalle (2.13), (2.14) riscritte nel
consueto formalismo tridimensionale,
~
∂E
− ~ ×B
+∇ ~ = ~j, (2.28)
∂t
26
~
∂B ~ ×E
+∇ ~ = 0, (2.29)
∂t
~ ·E
∇ ~ = j 0, (2.30)
~ ·B
∇ ~ = 0. (2.31)

~ ~x) e B(t,
Le (2.28), (2.29) costituiscono sei equazioni nelle sei funzioni incognite E(t, ~ ~x),
~ eB
che coinvolgono le derivate prime di E ~ rispetto al tempo: esse vanno quindi considerate

come equazioni dinamiche. Queste equazioni ammettono infatti soluzione unica, note le
~ ~x), B(0,
sei condizioni iniziali E(0, ~ ~x). Al contrario, le due equazioni scalari (2.30) e (2.31)

non contengono derivate temporali e vanno quindi considerate come vincoli, piuttosto che
come equazioni dinamiche. In particolare, le sei condizioni iniziali non possono essere
assegnate arbitrarimente, perché esse sono soggette ai vincoli (2.30), (2.31),

~ · E(0,
∇ ~ ~x) = j 0 (0, ~x),

~ · B(0,
∇ ~ ~x) = 0.

All’istante t = 0 è quindi sufficiente assegnare 6 − 2 = 4 componenti del campo elet-


tromagnetico, in quanto a quello stesso istante le rimanenti due componenti risultano
determinate in termini delle altre quattro. A questo punto non è difficile dimostrare
che, se le equazioni (2.28), (2.29) sono soddisfatte per qualsiasi t, e le (2.30), (2.31) so-
no soddisfatte all’istante t = 0, allora queste ultime sono automaticamente soddisfatte
per qualsiasi t, vedi problema 2.11. Ci aspettiamo quindi che il campo elettromagnetico
corrisponda non a sei, ma solo a quattro “gradi di libertà fisici del primo ordine”.
Sulle soluzioni del sistema (2.12)–(2.14) . L’insieme di queste equazioni costituisce un
sistema di equazioni differenziali non lineari fortemente accoppiate che, eccetti casi raris-
simi, non è risolubile esattamente: la forma dei campi determina il moto delle particelle
secondo le (2.12), e i campi a loro volta sono determinati dal moto delle particelle secondo
le (2.14), e dalle (2.13). Tuttavia, in molte situazioni fisiche il problema può essere ridotto
difatti a considerare una delle due seguenti situazioni, in cui le equazioni si disaccoppiano:
I) É dato un campo elettromagnetico “esterno” nel vuoto, soddisfacente, cioè, le (2.13)
e (2.14) con j µ = 0. Esempi sono un campo elettromagnetico costante e uniforme in
una certa regione dello spazio, come quello tra le due paratie di un condensatore, oppure

27
un’onda elettromagnetica piana di frequenza e ampiezza data. In molti casi si chiede di
determinare il moto di una particella carica sottoposta a un tale campo. Questo problema
si riconduce allora alla soluzione delle sole equazioni (2.12) nelle incognite yrµ .
II) È assegnato il moto di una particella carica, oppure di più particelle cariche, e si chie-
de di determinare il campo elettromagnetico creato da questo sistema di cariche in moto.
Questo problema riguarda solamente le equazioni (2.13) e (2.14) che, come vedremo,
possono essere risolte esattamente, in termini dei celebri potenziali di Lienard–Wiechert.
In entrambi i casi, però, bisogna tenere presente che la dinamica vera del sistema è
governata dall’intero set di equazioni (2.12)–(2.14), e che si sta considerando soltanto una
schematizzazione della situazione fisica reale, la cui validità deve essere valutata caso per
caso.
In astratto la strategia da seguire per risolvere il sistema delle equazioni fondamentali
dell’Elettrodinamica, e che in linea di principio seguiremo anche noi in questo testo, è la
seguente. Risolta l’identità di Bianchi in termini di un potenziale vettore Aµ , si trova la
soluzione esatta dell’equazione di Maxwell per Aµ – e quindi per F µν – in termini delle
traiettorie generiche yrµ . Dopodichè si sostituisce il campo F µν cosı̀ trovato nelle equazioni
di Lorentz, che diventano quindi delle equazioni non locali, ma chiuse, nelle sole incognite
yrµ . Risolte queste equazioni si possono sostituire le yrµ risultanti in F µν , per ottenere
infine il campo elettromagnetico come funzione delle sole x.
Come menzionato sopra questo programma raramente può essere portato a termine in
modo esplicito, per via delle difficoltà tecniche coinvolte. Ma vedremo, per di più, che nel
corso della sua attuazione emergeranno anche difficoltà concettuali – causati dalla natura
puntiforme delle particelle cariche – che minano irrimediabilmente la consistenza interna
dell’Elettrodinamica classica. In altre parole, vedremo l’Elettrodinamica classica entrare
in contraddizione con se stessa. D’altra parte da un punto di vista sperimentale questa
teoria descrive tutti i fenomeni elettromagnetici classici con estrema precisione: teoria ed
esperimento sono in perfetto accordo. Resterà quindi da spiegare come mai le inconsi-
stenze interne della teoria non si manifestano anche a livello sperimentale. Vedremo, per
l’appunto, che è facile predisporre esperimenti in cui queste inconsistenze si tradurreb-
bero in fenomeni fisicamente osservabili. Tuttavia, vedremo anche che questi fenomeni

28
occorrerebbero su scale spazio–temporali alle quali gli effetti quantistici non possono più
essere trascurati. A queste scale l’Elettrodinamica classica perde quindi la sua validità
fenomenologica, ed essa deve essere sostituita dalla Teoria Quantistica di Campo. In
altri termini: sono proprio gli effetti quantistici a mascherare le inconsistenze interne
dell’Elettrodinamica classica – rendendole inosservabili.
Sulle cariche elettriche. Per il momento abbiamo tacitamente assunto che le cariche
elettriche delle particelle costituiscano un arbitrario insieme di costanti {er }. Siamo con-
fortati in questa ipotesi dal fatto che – per quanto riguarda le analisi svolte finora sul
sistema (2.12)–(2.14) – non abbiamo incontrato nessuna inconsistenza: questo sistema di
equazioni sembra consistente qualsiasi siano i valori delle er . A questo proposito possia-
mo, però, anche notare che le cariche elettriche entrano nelle equazioni fondamentali in
due modi diversi: nelle equazioni di Lorentz, e nell’equazione di Maxwell attraverso la
corrente. È evidente che a priori non c’è nessun motivo per cui i due insiemi di cariche
siano identici. Potremmo, cioè, usare nelle equazioni di Lorentz le cariche {er }, e nella
definizione della corrente (2.6) un insieme diverso {e∗r }, e le equazioni fondamentali man-
terrebbero tutte le buone proprietà discusse finora. Rimane allora da capire cosa ci ha
spinto a identificare questi due insiemi di cariche fin dall’inizio. Un’indicazione cruciale
che ci aiuta a rispondere a questa domanda viene dal limite non relativistico. Consideria-
mo in questo limite due particelle con cariche (e1 , e∗1 ) e (e2 , e∗2 ), e chiamiamo ~r il raggio
vettore che congiunge la particella 1 alla particella 2. Allora dall’equazione di Maxwell
(2.30) ci possiamo calcolare il campo elettrico quasi–statico creato dalla particella 1 nel
punto in cui si trova la particella 2, e viceversa,
∗ ∗
~ 2 = e1 ~r ,
E ~ 1 = − e2 ~r ,
E
4π r3 4π r3

mentre nel limite non relativistico i campi magnetici possono essere trascurati. In questo
limite le equazioni di Lorentz (2.19) ci danno allora per la forza F~12 esercitata dalla
particella 1 sulla particella 2, e viceversa,
∗ ∗
~ 2 = e2 e1 ~r ,
F~12 = e2 E ~ 1 = − e1 e2 ~r .
F~21 = e1 E
4π r3 4π r3

Si vede quindi che la terza legge di Newton, ovverosia il principio di azione e reazione

29
F~12 = −F~21 , che è un postulato fondamentale della Meccanica Newtoniana, vale solo se,

e1 e2

= ∗.
e1 e2

Ripetendo questo ragionamento per un’arbitraria coppia di particelle si conclude che la


validità della terza legge di Newton richiede che il rapporto er /e∗r sia una costante uni-
versale, che può essere posta uguale all’unità riscalando il campo elettromagnetico e le
cariche. Si ottiene cosı̀,
er = e∗r .

A livello non relativistico l’origine di questa identificazione risiede dunque nel principio
di azione e reazione. D’altra parte, sempre a livello non relativistico questo principio è
equivalente alla conservazione della quantità di moto totale di un sistema isolato,

d
(~p1 + p~2 ) = F~21 + F~12 = 0.
dt

A livello relativistico dobbiamo allora aspettarci che l’identificazione dei due tipi di carica
venga imposta dalla richiesta di conservazione del quadrimomento totale, in particolare
dell’energia. Nella sezione 2.4 vedremo in effetti che questo è ciò che succede.

2.3 La natura distribuzionale del campo elettromagnetico

Abbiamo già fatto notare che le componenti della quadricorrente j µ non sono funzioni,
bensı̀ distribuzioni, supportate sulle linee di universo delle particelle. Dall’equazione di
Maxwell (2.14) si deduce allora che le componenti di F µν non possono essere “funzioni
derivabili” lungo le linee di universo, perché altrimenti anche le componenti del quadri-
vettore ∂µ F µν sarebbero funzioni. Traiamo allora le seguente conclusioni: I) il tensore
F µν è necessariamente singolare lungo le linee di universo, e vedremo che la singolarità
in questione è del tipo 1/r2 , se r indica la distanza spaziale dalla linea di universo; II)
l’equazione di Maxwell (2.14) non ha senso come equazione differenziale nello spazio delle
funzioni, mentre essa sarà perfettamente ben definita se la consideriamo come equazione
differenziale nello spazio delle distribuzioni temperate S 0 (R4 ) 3 .
3
In ultima analisi il ruolo della (2.14) è unicamente quello di qualificare le singolarità di F µν lungo
le linee di universo, visto che nel loro complemento la corrente si annulla, e quindi ivi vale banalmente
∂µ F µν = 0.

30
In questa nuova ottica le componenti di F µν andranno dunque considerate come ele-
menti di S 0 (R4 ), e le derivate che compaiono nella (2.14) andranno considerate come
derivate nel senso delle distribuzioni. Per consistenza allora anche l’identità di Bianchi
(2.13) deve essere riguardata come equazione differenziale in S 0 (R4 ). Si noti che questa
reinterpretazione delle due equazioni di Maxwell come equazioni differenziali nello spazio
delle distribuzioni è consistente, perché esse sono lineari in F µν .
Una volta che abbiamo dato un significato matematico preciso alle equazioni di Max-
well e Bianchi possiamo chiederci se ora anche l’equazione di Lorentz risulta ben definita.
È immediato vedere che la risposta a questa domanda è negativa. Infatti, nelle (2.12)
compare F µν (yr ), cioè il campo elettromagnetico valutato proprio sulla traiettoria del-
la particella, luogo dove esso è singolare: le quantità F µν (yr ) sono quindi divergenti e
l’equazione di Lorentz è mal definita. L’interpretazione fisica di questa patologia è che
l’interazione della particella con il campo elettromagnetico da essa stessa creata – l’au-
tointerazione – è di intensità infinita. Si intuisce facilmente che la causa prima di questa
divergenza “ultravioletta”, dovuta cioè alle leggi che determinano la fisica a piccole distan-
ze, è proprio la natura puntiforme delle particelle cariche, come anticipato nel paragrafo
precedente.
Nel capitolo 12 discuteremo possibili soluzioni pragmatiche al problema dell’autointe-
razione infinita, ma nessuna di queste risulterà soddisfacente dal punto di vista teorico,
se ci si confina all’ambito dell’Elettrodinamica classica.

2.3.1 Lo spazio delle distribuzioni

Prima di illustrare con qualche esempio il significato – e la necessità – di questa nuova


interpretazione delle leggi dell’Elettrodinamica, ricordiamo qualche elemento operativo
della teoria delle distribuzioni (temperate) in uno spazio di dimensione arbitraria.
Distribuzioni e funzioni di test. In D dimensioni lo spazio delle funzioni di test S ≡
S(RD ) è lo spazio vettoriale delle funzioni complesse ϕ(x) di classe C ∞ , che all’infinito de-
crescono insieme a tutte le loro derivate più rapidamente dell’inverso di qualsiasi potenza.
Devono, cioè, essere finite tutte le “seminorme”,

||ϕ||P,Q ≡ sup x∈RD |P(x)Q(∂)ϕ(x)| , (2.32)

31
dove con P intendiamo un generico monomio nelle xµ e con Q un generico monomio nelle
derivate parziali ∂µ . Per quanto riguarda la topologia di cui si dota S si rimanda a un
testo di Metodi Matematici. Lo spazio delle distribuzioni S 0 ≡ S 0 (RD ) è allora definito
come l’insieme dei funzionali F che sono lineari e continui su S,

F : S → C,

ϕ → F (ϕ). (2.33)

Una generica distribuzione F ∈ S 0 è completamente determinata dai valori F (ϕ) che essa
assume quando viene applicata a una generica funzione di test ϕ ∈ S. Ricordiamo ora un
teorema che è di grande utilità pratica quando si tratta di stabilire se un dato funzionale
lineare su S risulta continuo.
Teorema: un funzionale lineare F su S è continuo, cioè, appartiene ad S 0 , se e solo se esso
può essere maggiorato da una somma finita di seminorme di ϕ, vale a dire,
X
|F (ϕ)| ≤ CP,Q ||ϕ||P,Q , ∀ ϕ ∈ S, (2.34)

per opportune costanti positive CP,Q indipendenti da ϕ.


Un’importante classe di distribuzioni è quella costituita dalle distribuzioni regolari,
ovvero dalle distribuzioni che sono rappresentate da funzioni. Si dice che una distribuzione
F è rappresentata dalla funzione f (x) da RD in C quando si ha,
Z
F (ϕ) = f (x) ϕ(x) dD x.

Sfruttando il teorema di cui sopra è allora facile dimostrare che rappresentano distribu-
zioni regolari in particolare tutte le funzioni limitate, e tutte le funzioni con singolarità
integrabili, che divergono all’infinito al massimo come qualche potenza, vedi problema 2.4.
Ricordiamo inoltre che in generale le distribuzioni non si possono moltiplicare o divi-
dere tra di loro, e che il valore di una distribuzione F in un punto x in generale non è una
quantità ben definita. Tuttavia, certe proprietà delle distribuzioni risultano di “accesso
immediato” se si ricorre alla notazione “simbolica”, vale a dire se si introduce formalmente
la quantità F (x). In notazione simbolica scriveremo per esempio,
Z
F (ϕ) = F (x) ϕ(x) dD x.

32
2.3.2 Operazioni sulle distribuzioni

Le operazioni che presentiamo di seguito si riferiscono a distribuzioni F che operano su


funzioni di test ϕ appartenenti ad S, ma in molti casi queste operazioni mantengono
la loro validità anche quando le distribuzioni vengono applicate a funzioni molto meno
regolari di quelle appartenenti a S.
Derivate di distribuzioni. Ogni elemento F ∈ S 0 ammette derivate parziali ∂µ F ∈ S 0 ,
definite da,
(∂µ F )(ϕ) = −F (∂µ ϕ). (2.35)

Dalla definizione segue immediatamente che le derivate parziali nel senso delle distribu-
zioni commutano sempre,
∂µ ∂ν F = ∂ν ∂µ F.

La valutazione esplicita della derivata di una distribuzione F è facilitata se in un sottoin-


sieme B di RD essa può essere rappresentata da una funzione di classe C ∞ . In questa
regione la derivata può essere calcolata semplicemente nel senso delle funzioni, e il calcolo
della derivata di F è ridotto essenzialmente alla determinazione di ∂µ F nel complemento
di B, che è il luogo dove F è singolare. Siccome le singolarità delle distribuzioni con cui
avremo a che fare costituiscono sempre insiemi di misura nulla, questa strategia si rivelerà
molto efficace.
Convoluzione. La convoluzione F ∗ ϕ tra una distribuzione F e una funzione di test ϕ
è una distribuzione che in notazione simbolica è data da,
Z
(F ∗ ϕ)(x) = F (x − y) ϕ(y) dD y.

Per le sue derivata si ha,

∂µ (F ∗ ϕ) = ∂µ F ∗ ϕ = F ∗ ∂µ ϕ.

Se anche F ∈ S si ha inoltre F ∗ ϕ = ϕ ∗ F .
Funzione–δ di Dirac unidimensionale. La distribuzione di Dirac unidimensionale δa
supportata in x = a, con a ∈ R, è l’elemento di S 0 (R) definito da δa (ϕ) = ϕ(a), per
ogni ϕ ∈ S(R). Essa al solito viene rappresentata dalla funzione simbolica δ(x − a) che

33
soddisfa,
Z
δ(x − a) ϕ(x) dx = ϕ(a).

La δ di Dirac gode di alcune importanti proprietà che ora elencheremo usando la notazione
simbolica. Per la sua derivata n–esima si ha,
Z n n
d nd ϕ
δ(x − a) ϕ(x) dx = (−) (a).
dxn dxn

Per ogni f ∈ OM (R) – l’insieme delle funzioni C ∞ su R polinomialmente limitate insieme


a tutte le loro derivate – si ha poi,

f (x) δ(x − a) = f (a) δ(x − a). (2.36)

Questa relazione comporta alcune semplici identità, come per esempio,

d d
x δ(x) = 0, x2 δ(x) = 0, x δ(x) = −δ(x), etc.
dx dx

Queste identità si dimostrano facilmente usando la regola di Leibnitz, valida per prodotti
del tipo f F , con f ∈ OM (R) e F ∈ S 0 (R). Se c è un numero reale diverso da zero vale
anche,
δ(x − a)
δ(c (x − a)) = .
| c|
Data una funzione reale f (x), in certe condizioni resta definita anche l’espressione δ(f (x)).
Puı̀ precisamente, se f è derivabile e ha un numero finito di zeri {xn } tali che le derivate
prime f 0 (xn ) sono tutte diverse da zero, si definisce,
X δ(x − xn )
δ(f (x)) = . (2.37)
n
|f 0 (xn )|

L’origine di questa definizione diventa evidente se si applicano entrambi i membri a una


funzione di test, e se nell’integrale risultante a primo membro si esegue formalmente
il cambiamento di variabile x → y = f (x). Un caso che incontreremo di frequente
corrisponde alla funzione f (x) = x2 − a2 , a 6= 0, per cui la (2.37) dà,

1
δ(x2 − a2 ) = (δ(x − a) + δ(x + a)) . (2.38)
2|a|

Dalla definizione della convoluzione data sopra segue inoltre che si ha,

δ ∗ ϕ = ϕ,

34
per ogni ϕ ∈ S.
Funzione–δ di Dirac quadridimensionale. La distribuzione di Dirac si generalizza im-
mediatamente a uno spazio di dimensione arbitraria. Per definitezza, e in vista dell’uso
che ne faremo in seguito, quı̀ presentiamo il caso quadridimensionale.
Dato un quadrivettore aµ la distribuzione di Dirac δa , supportata in xµ = aµ , è l’ele-
mento di S 0 (R4 ) definito da δa (ϕ) = ϕ(a), per ogni ϕ ∈ S(R4 ). Essa viene rappresentata
dall’espressione simbolica,

δ 4 (x − a) = δ(x0 − a0 ) δ 3 (~x − ~a) = δ(x0 − a0 )δ(x1 − a1 )δ(x2 − a2 )δ(x3 − a3 ), (2.39)

e si scrive,
Z
δa (ϕ) = δ 4 (x − a) ϕ(x) d4 x = ϕ(a).

Per le sue derivate si ottiene,

(∂µ δa )(ϕ) = −δa (∂µ ϕ) = −∂µ ϕ(a),

che in notazione simbolica si scrive come,


Z
∂µ δ 4 (x − a) ϕ(x) d4 x = −∂µ ϕ(a).

Per ogni f ∈ OM (R4 ) si ha poi,

f (x) δ 4 (x − a) = f (a) δ 4 (x − a).

In questo caso da questa relazione seguono le identità,

xµ δ 4 (x) = 0, xµ xν ∂ρ δ 4 (x) = 0, xµ ∂ν δ 4 (x) = −δνµ δ 4 (x), etc.

Se Cµ ν è una qualsiasi matrice 4 × 4 invertibile si ha inoltre,

δ 4 (x − a)
δ 4 (C(x − a)) = .
| det C|

La quadricorrente in notazione tridimensionale. Per illustrare l’uso della δ di Dirac


come funzione simbolica deriviamo la forma tridimensionale della quadricorrente j µ di un
sistema di particelle, vedi (2.6). A questo scopo esplicitiamo l’integrale r–esimo in (2.6),

35
scegliendo come variabile di integrazione la coordinata temporale della particella r–esima,
cioè, λr = yr0 . Usando la (2.39) si ottiene,
X Z X Z
µ dyrµ (yr0 ) 4 0 0 dyrµ (yr0 )
j (x) = er δ (x−yr (yr )) dyr = er δ(t−yr0 ) δ 3 (~x−~yr (yr0 )) dyr0 .
r γr dyr0 r γr dyr0

A questo punto si può eseguire l’integrale della δ(t − yr0 ) in dyr0 , considerando il resto
dell’integrando come una “funzione di test”, la quale va quindi valutata in yr0 = t. Si
ottiene,
X dyrµ (t) 3
j µ (t, ~x) = er δ (~x − ~yr (t)),
r
dt
dove è sottinteso che yr0 (t) = t. Scrivendo separatamente parte temporale e parte spaziale
si ottengono rispettivamente la densità di carica e la densità di corrente spaziale,
X
j 0 (t, ~x) = er δ 3 (~x − ~yr (t)), (2.40)
r
X
~j(t, ~x) = er ~vr (t) δ 3 (~x − ~yr (t)). (2.41)
r

Distribuzioni con supporto in un punto. Completiamo l’elenco delle proprietà della δ


di Dirac enunciando un teorema che vincola fortemente la forma di una distribuzione che
è “diversa da zero” solo in un insieme finito di punti, vale a dire il cui supporto è costituito
da un insieme finito di punti.
Teorema: Una distribuzione F ∈ S 0 (RD ) il cui supporto è costituito dal punto xµ = aµ ,
è necessariamente una combinazione lineare finita della δ D (x − a) e delle sue derivate.
Avremo, cioè,

F = c δ D (x − a) + cµ ∂µ δ D (x − a) + · · · + cµ1 ···µn ∂µ1 · · · ∂µn δ D (x − a), (2.42)

dove i cµ1 ···µk sono coefficienti costanti. Se il supporto di una distribuzione è invece co-
stituito da un insieme finito di punti, essa è data da una somma di espressioni del tipo
(2.42). Come vedremo questo teorema risulterà molto utile nella soluzione di equazioni
algebriche per distribuzioni.
Trasformata di Fourier di una distribuzione. La trasformata di Fourier costituisce una
biiezione di S in se stesso ed, opportunamente estesa, di S 0 in se stesso. Indicheremo la
trasformata di Fourier di un generico elemento ϕ ∈ S con ϕ,
b e analogamente quella di un

36
generico elemento F ∈ S 0 con Fb. Nello spazio–tempo di Minkowski quadridimensionale
per una generica funzione di test si ha,
Z Z
1 4 −ik·x 1
ϕ(k)
b = d xe ϕ(x), ϕ(x) = d4 k eik·x ϕ(k),
b
(2π)2 (2π)2

dove abbiamo introdotto le quattro variabili duali k ≡ k µ e definito k · x ≡ k µ xν ηµν . Si


noti che, strettamente parlando, per quanto riguarda la variabile ~x la nostra definizione
corrisponde in realtà all’antitrasformata di Fourier. La trasformata di Fourier di una
distribuzione è allora definita da,

Fb(ϕ) = F (ϕ),
b ∀ ϕ ∈ S.

Da questa definizione segue facilmente che in notazione simbolica si ha,


Z Z
1 1
Fb(k) = 4
d xe −ik·x
F (x), F (x) = d4 k eik·x Fb(k),
(2π)2 (2π)2

ma insistiamo sul fatto che questi integrali sono da intendersi come tali solo se la distri-
buzione F è sufficientemente regolare.
Per le derivate e la moltiplicazione per una coordinata si ha,

∂ b
∂d b
µ F (k) = i kµ F (k), xd
µ F (k) = i F (k),
∂kµ

con ovvie estensioni alla trasformata di Fourier di un generico polinomio in xµ e ∂ν ,


applicato a F . Ricordiamo in particolare le trasformate della δ 4 e delle sue derivate,

1 ikµ
δ[
4 (x)(k) = , ∂\ 4
µ δ (x)(k) = .
(2π)2 (2π)2

Per concludere riportiamo la formula per la trasformata di Fourier della convoluzione


tra un elemento F di S 0 e un elemento ϕ di S. In uno spazio a dimensione D in notazione
simbolica si ha,
\
F ∗ ϕ (k) = (2π)D/2 Fb(k) ϕ(k).
b

2.3.3 Identità di Bianchi e forme differenziali

Una volta assodato che le equazioni per il campo elettromagnetico devono essere formulate
nello spazio delle distribuzioni è opportuno riesaminarle in questo nuovo ambito. In questo

37
paragrafo rianalizzeremo l’identità di Bianchi (2.13) e la sua soluzione generale (2.22),
mentre nel prossimo paragrafo ci dedicheremo all’equazione di Maxwell.
Come ora sappiamo le componenti di F µν non sono derivabili ovunque – come funzioni
– e le derivate ∂ν Fρσ che compaiono nella (2.13) vanno eseguite nel senso delle distribuzioni.
Si ripresenta allora la domanda se l’espressione Fµν = ∂µ Aν − ∂ν Aµ è ancora soluzione
dell’identità di Bianchi, ovverosia, se il calcolo formale eseguito in (2.23) è ancora valido.
Se vogliamo dare senso a questa domanda, come prima cosa dobbiamo considerare anche
le componenti di Aµ come distribuzioni. A questo punto la correttezza del risultato (2.23)
– indipendentemente dalla presenza o meno di singolarità in Aµ , purché di carattere
distribuzionale – segue semplicemente dal fatto che le derivate nel senso delle distribuzioni
commutano.
Per dimostrare il viceversa, cioè, che in S 0 (R4 ) ogni soluzione di (2.13) può essere
scritta nella forma (2.22), conviene fare uso di un formalismo che viene introdotto in
Geometria Differenziale 4 , più precisamente il formalismo delle “p–forme differenziali a
valori nello spazio delle distribuzioni”. Questi oggetti geometrici – che vengono chiamati
anche più semplicemente “p–forme” – sono essenzialmente tensori di rango (0, p) comple-
tamente antisimmetrici a valori in S 0 (R4 ). L’analisi che segue, non essendo indispensabile
per la comprensione del resto del testo, è rivolta a coloro che sono familiari con questo
formalismo.
Nel linguaggio delle forme al tensore antisimmetrico F µν resta associata la due–forma,

1 ν
F = dx ∧ dxµ Fµν . (2.43)
2

Ricordiamo poi che sull’algebra delle forme è definito l’operatore “differenziale esterno”
d, che associa a una p–forma una (p + 1)–forma, e risulta nihilpotente, cioè soddisfa,

d2 = 0.

Nell’ambito delle forme a valori nelle distribuzioni questa proprietà è conseguenza diretta
del fatto che le derivate parziali nel senso delle distribuzioni commutano sempre. Per
4
Un testo che presenta la Geometria Differenziale con particolare riferimento alle sue applicazioni in
fisica, compreso il linguaggio delle forme differenziali, è “Analysis, Manifolds and Physics”, di Yvonne
Choquet–Bruhat, Cecile DeWitt–Morette e Margaret Dillard–Bleick, ed. North–Holland, Amsterdam,
1982.

38
definizione il differenziale esterno di F è la tre–forma,

1 ν
dF = dx ∧ dxµ ∧ dxρ ∂[ρ Fµν] .
2

L’identità di Bianchi è allora equivalente alla richiesta che F sia una forma chiusa, cioè,
che valga dF = 0. Infatti, vedi problema 2.2,

dF = 0 ⇔ ∂[ρ Fµν] = 0.

Siccome F è una forma chiusa, secondo il Lemma di Poincaré nello spazio delle forme a
valori nelle distribuzioni, essa è anche esatta 5 . Esiste, cioè, una uno–forma A = dxν Aν a
valori nelle distribuzioni tale che,
F = dA. (2.44)

Esplicitando il differenziale si ottiene,

1 ν
F = dx ∧ dxµ Fµν = d(dxν Aν ) = dxν ∧ dxµ ∂[µ Aν] ,
2

e quindi,
Fµν = 2∂[µ Aν] = ∂µ Aν − ∂ν Aµ ,

che corrisponde alla (2.22). D’altra parte, dato che l’operatore d è nihilpotente la uno–
forma A data in (2.44) è a sua volta definita modulo uno–forme esatte,

A ≈ A + dΛ, (2.45)

dove Λ è una zero–forma, ovverosia un campo scalare. Siccome dΛ = dxµ ∂µ Λ la (2.45) si


traduce in,
Aµ ≈ Aµ + ∂µ Λ,

cosicchè ritroviamo che il potenziale vettore è definito modulo una trasformazione di


gauge. In conclusione, nel linguaggio delle forme differenziali le relazioni (2.25) si scrivono
semplicemente,
dF = 0 ⇐⇒ F = dA, con A ≈ A + dΛ.
5
Nello spazio delle forme differenziali a valori in S 0 (RD ) il lemma di Poincaré asserisce che ogni forma
chiusa è anche esatta. Questo è essenzialmente dovuto al fatto che lo spazio RD è topologicamente banale.

39
Si vede che da un lato il formalismo delle forme differenziali è utile perché fornisce
una notazione compatta che evita di indicare esplicitamente gli indici; dall’altro lato
nell’ambito della teoria delle distribuzioni esso permette di definire le componenti delle p–
forme “globalmente” – vale a dire in tutto R4 – anche in presenza di singolarità. Notiamo,
tuttavia, che questo formalismo non si applica a tensori che non sono completamente
antisimmetrici.

2.3.4 Il campo elettromagnetico della particella statica

La necessità di considerare le equazioni che governano la dinamica del campo elettroma-


gnetico nello spazio delle distribuzioni, emerge molto chiaramente dal semplice esempio
di una particella statica. Per questo motivo analizzeremo ora in dettaglio questo caso.
Ad una particella statica nell’origine corrisponde la linea di universo, y 0 (t) = t, ~y (t) =
0, e quindi ~v (t) = 0. Secondo le (2.40) e (2.41) ad essa corrisponde la quadricorrente,

j 0 (t, ~x) = e δ 3 (~x), ~j(t, ~x) = 0.

In questo caso sappiamo che il campo magnetico è nullo,

~ = 0,
B

e che il campo elettrico è statico. L’equazione di Maxwell e l’identità di Bianchi si riducono


allora rispettivamente a,

~ ·E
∇ ~ = e δ 3 (~x), ~ ×E
∇ ~ = 0, (2.46)

vedi (2.28)–(2.31). Come è noto la soluzione di questo sistema di equazioni dovrebbe


essere data dal campo coulombiano,

~ ~x) = e ~x ,
E(t, r = |~x|, (2.47)
4π r3

affermazione che ora rianalizzeremo criticamente.


~ nel senso delle funzioni. Dato
Come analisi preliminare ci calcoliamo le derivate di E
che ∂i r = xi /r, per ~x 6= 0 si ottiene facilmente,
µ ¶
j e ij xi xj
∂i E = δ −3 2 . (2.48)
4πr3 r

40
L’identità di Bianchi sarebbe quindi soddisfatta in quanto ∂i E j − ∂j E i = 0, mentre
l’equazione di Maxwell sarebbe violata, perché si otterrebbe ∂i E i = 0 ! L’errore sta
~ che l’operator ∂i nello spazio delle funzioni.
evidentemente nell’avere considerato sia E
Rianalizziamo dunque il problema nello spazio di distribuzioni S 0 ≡ S 0 (R3 ), appro-
priato per il caso statico. Come prima cosa dobbiamo domandarci se le componenti E i
del campo elettrico (2.47) appartengono effettivamente ad S 0 . La risposta è affermativa
~ ha solo una singolarità integrabile in ~x = 0, e all’infinito è limitato da una
in quanto E
costante, vedi problema 2.4. Le derivate ∂i E j sono allora ben definite in S 0 , ma esse vanno
– per l’appunto – calcolate nel senso delle distribuzioni, vale a dire applicando la (2.35).
Presentiamo prima i calcoli spiegando i passaggi intermedi di seguito,
Z Z
j j e 3xj e xj
(∂i E )(ϕ) = −E (∂i ϕ) = − d x 3 ∂i ϕ = − lim d3 x ∂i ϕ
4π r 4π ε→0 r> ε r3

Z · µ j ¶ µ j¶ ¸
e 3 x x
= − lim d x ∂i 3
ϕ − ∂i ϕ
4π ε→0 r> ε r r3

·Z Z µ ¶ ¸
e i j 1 3 ij xi xj
= lim dΩ n n ϕ + dx 3 δ −3 2 ϕ
4π ε→0 r=ε r>ε r r

Z µ ¶
e ij e 1
3 ij xi xj
= δ ϕ(0) + dx 3 δ −3 2 ϕ. (2.49)
3 4π r r

Spieghiamo ora i passaggi. L’integrando della prima riga appartiene a L1 (R3 ), e cosı̀
possiamo eseguire l’integrale introducendo una successione invadente qualsiasi. Abbiamo
usato la successione invadente Vε = R3 \Sε , dove Sε è la palla di raggio ε centrata nel-
l’origine. Siccome in Vε l’integrando è di classe C ∞ abbiamo poi potuto usare il calcolo
differenziale standard. Nella seconda riga abbiamo cosı̀ usato la regola di Leibnitz e nella
terza il teorema di Gauss. Il bordo di Vε è costituito dalla sfera all’infinito, che non dà
contributo al flusso perché ϕ svanisce all’infinito più rapidamente dell’inverso di qualsiasi
potenza, e dalla sfera di raggio ε centrata nell’origine. Per valutare l’integrale su questa
sfera abbiamo usato coordinate polari ~x ↔ (r, Ω), con Ω = (φ, ϑ) e dΩ ≡ senϑ dϑ dφ,
e introdotto il versore radiale uscente ni = xi /ε. L’elemento di superficie diventa allora

41
dΣi = ni ε2 dΩ. Infine abbiamo ultilizzato l’integrale sugli angoli, vedi problema 2.6,
Z
4π ij
dΩ ni nj = δ .
3
~
Riscrivendo la (2.49) in notazione simbolica otteniamo in definitiva per le derivate di E
nel senso delle distribuzioni,
µ ¶
e e xi xj
∂i E = δ ij δ 3 (~x) +
j ij
δ −3 2 . (2.50)
3 4πr3 r

Confrontando con la (2.48) si vede che il calcolo “naiv” è valido per ~x 6= 0, ma non è
capace di rivelare la presenza del termine supportato in ~x = 0, dove il campo elettrico è
infatti singolare 6 .
Come si vede l’espressione (2.50) soddisfa ora entrambe le equazioni di (2.46), la prima
in particolare essendo equivalente all’identità in S 0 ,

~ · ~x = 4π δ 3 (~x).
∇ (2.51)
r3

Infine possiamo rileggere i nostri risultati in termini del potenziale coulombiano A0 . La


~ ×E
soluzione generale dell’identità di Bianchi ∇ ~ = 0 è infatti data da,

~ = −∇A
E ~ 0.

Data la (2.47) si verifica facilmente (esercizio) che questa relazione è soddisfatta – anche
nel senso delle distribuzioni – se si sceglie il potenziale,

e
A0 = , (2.52)
4πr

appartenente anch’esso S 0 . L’analisi svolta sopra implica allora la validità dell’equazione


di Poisson −∇2 A0 = e δ 3 (~x), dalla quale segue la nota identità,

1
∇2 = −4π δ 3 (~x). (2.53)
r

L’equazione di Lorentz. Una volta risolte l’equazione di Maxwell e l’identità di Bianchi


possiamo considerare l’equazione di Lorentz, le cui componenti indipendenti sono date
6
Si noti che il secondo e il terzo termine in (2.50), che per r → 0 si comportano entrambi come 1/r3 ,
presi separatamente non costituiscono affatto distribuzioni. È solo la particolare combinazione lineare
che compare in (2.50), con coefficiente relativo −3, ad essere un elemento di S 0 .

42
in (2.21). Siccome abbiamo ~v = p~ = 0, il membro di sinistra di questa equazione è
identicamente nullo. D’altra parte, dato che ~y (t) = 0 il membro di destra della (2.21) si
~ ~0), espressione che – data la (2.47) – diverge! Ritroviamo cosı̀ che la
ridurrebbe a e E(t,
forza esercitata dal campo elettromagnetico generato da una particella puntiforme sulla
particella stessa è divergente, e che l’equazione di Lorentz è inconsistente. A dire il vero
nel caso statico quı̀ considerato conosciamo una soluzione pragmatica del problema: in
~ ~0) uguale a zero,
accordo con l’esperienza dobbiamo porre la quantità mal definita E(t,
perché sperimentalmente si osserva che una particella statica non subisce nessuna forza.
Vedremo, tuttavia, che nel caso generale di una particella in moto vario questa semplice
ricetta non risulta implementabile, perché entrerebbe in conflitto con la conservazione del
quadrimomento totale.
L’energia infinita del campo elettromagnetico. Concludiamo l’analisi della particella
statica con un ulteriore commento, anticipando l’espressione per la densità di energia
del campo elettromagnetico, vedi paragrafo 2.4.3,
1 2
ρem = (E + B 2 ).
2
~ = 0, l’energia totale del campo elettromagnetico di una
Vista la (2.47) e dato che B
particella statica risulterebbe quindi,
Z ³ e ´2 Z d3 x
3
εem = ρem d x = ,
4π r4
che corrisponde a una “costante” divergente, per via del comportamento singolare del-
l’integrando in r → 0. D’altra parte, nel caso sotto esame l’energia della particella è
m
conservata banalmente, essendo ε = √ = m, e allora – se si deve conservare l’ener-
1 − v2
gia totale – anche l’energia εem del campo elettromagnetico dovrebbe essere una costante
(finita). Nel capitolo 13 vedremo che nel caso statico l’unico valore di εem compatibile
con l’invarianza relativistica, in realtà è εem = 0. Ma vedremo anche che nel caso di
una particella in moto arbitrario, questa semplice scelta “fatta a mano” violerebbe sia la
conservazione del quadrimomento totale, sia l’invarianza relativistica.
È abbastanza evidente che il problema dell’energia infinita del campo elettromagnetico
– cosı̀ come quello dell’autointerazione infinita di una particella carica – è conseguenza
della natura puntiforme delle particelle elementari: mentre il secondo in ultima analisi è

43
tuttora irrisolto, vedi capitolo 12, il primo ha trovato una soluzione – anche se solo di
recente – nell’ambito della teoria delle distribuzioni 7 . Noi la presenteremo in una forma
alternativa nel capitolo 13.

2.4 Le costanti del moto dell’Elettrodinamica

In Fisica un ruolo fondamentale viene giocato dalle costanti del moto associate alla di-
namica di un sistema, ovverosia dalle grandezze fisiche che si conservano durante la sua
evoluzione temporale. D’altra parte, come è noto esiste un legame molto stretto tra leggi
di conservazione e simmetrie continue di una teoria, legame che viene concretizzato dal
teorema di Noether. L’importanza concettuale di questo teorema che, oltre a stabilire
l’esistenza di costanti del moto ne fornisce anche la forma esplicita, risiede nella sua ge-
neralità: è valido in qualsiasi teoria le cui equazioni del moto possano essere dedotte da
un principio variazionale. Per l’Elettrodinamica di particelle puntiformi, le cui equazioni
del moto sono relativamente semplici, deriveremo ora la forma delle principali costanti del
moto in modo euristico – senza ricorrere a questo teorema – utilizzando invece nozioni di
elettromagnetismo di base. La verifica che le costanti del moto cosı̀ ottenute combaciano
perfettamente con quelle previste dal teorema di Noether verrà poi fatta nel capitolo 4.

2.4.1 Conservazione e invarianza della carica elettrica

Come prototipo di una legge di conservazione locale, che sia cioè basata su un’equazione di
continuità per un’opportuna quadricorrente j µ , consideriamo la conservazione della carica
elettrica. Se la materia carica è costituita da particelle puntiformi la corrente è data dalla
(2.6); se la carica è invece distribuita con continuità la corrente ha una forma generica. Per
quello che segue la forma particolare della corrente sarà irrilevante, in quanto assumeremo
soltanto che essa goda delle seguenti proprietà:
I) j µ è un campo vettoriale,
II) j µ soddisfa l’equazione di continuità, ∂µ j µ = 0,
III) lim|~x|→∞ |~x|3 j µ (t, ~x) = 0, richiediamo cioè che per ogni t fissato la corrente decada
7
E.G.P. Rowe, Phys. Rev. D 18 3639 (1978).

44
all’infinito spaziale più rapidamente di 1/|~x|3 , proprietà certamente posseduta da (2.40)
e (2.41).
Sotto queste ipotesi vogliamo ora dimostrare che esiste una carica totale Q conservata,
e che essa è uno scalare sotto trasformazioni di Lorentz.
La costruzione della carica segue una procedura standard, che consiste nell’integrare
l’equazione di continuità su un volume V ,
Z Z
∂0 0 3
j d x=− ~ · ~j d3 x.

V V

Applicando il teorema di Gauss e definendo la carica contenuta in un volume V come


R
QV = V j 0 d3 x, si ottiene poi l’equazione di conservazione locale,
Z
dQV ~
~j · dΣ.
=− (2.54)
dt ∂V

La derivata della carica contenuta nel volume V eguaglia dunque l’opposto del flusso della
corrente spaziale attraverso il bordo di V . Se estendiamo ora il volume a tutto R3 , per la
proprietà III) converge l’integrale della densità j 0 su tutto lo spazio, mentre va a zero il
flusso della corrente spaziale all’infinito 8 . Si ottiene quindi la carica conservata,
Z
dQ
Q= j 0 d3 x, = 0. (2.55)
dt

Che la carica totale sia un invariante di Lorentz – proprietà certamente non posseduta
dalla carica in un volume finito QV – è un po’ meno ovvio. Per dimostrarlo valutiamo la
carica, che è indipendente dal tempo, all’istante t = 0 e la riscriviamo come segue,
Z Z Z Z
0 3 0 4 0 4
Q= j (0, ~x) d x = j (x) δ(t) d x = j (x)∂0 H(t) d x = j µ (x) ∂µ H(t) d4 x.

Abbiamo introdotto la funzione di Heaviside H(t), nulla per t < 0 e uguale a 1 per t ≥ 0,
legata alla δ di Dirac dalla nota relazione,

dH(t)
= δ(t).
dt
8
Se V si estende a tutto lo spazio possiamo scegliere per ∂V una sfera di raggio R e mandare R
all’infinito. Conviene passare a coordinate ~ = ~n R2 dΩ, dove ~n é il versore normale
R polari. Ponendo
R dΣ
~
alla sfera e Ω l’angolo solido, otteniamo ∂V j · dΣ = dΩ ~n · (limR→∞ R2 ~j). Ma per la proprietà III) il
~
limite tra parentesi è zero.

45
Consideriamo ora la carica totale Q0 in un altro sistema di riferimento, legato al primo da
una trasformazione di Lorentz propria x0µ = Λµ ν xν , Λ0 0 ≥ 1. Con lo stesso procedimento
di cui sopra troviamo,
Z
0
Q = j 0µ (x0 ) ∂µ0 H(t0 ) d4 x0 .

Sfruttando le trasformazioni di Lorentz,

j 0µ (x0 ) = Λµ ν j ν (x),
e µ ρ ∂ρ ,
∂µ0 = Λ

d4 x0 = |detΛ| d4 x = d4 x,

si ottiene poi,
Z
0
Q = j µ (x)∂µ H(t0 ) d4 x,

dove,
t 0 = Λ 0 0 t + Λ 0 i xi . (2.56)

Possiamo infine valutare la differenza,


Z Z
Q − Q = j (x) ∂µ (H(t ) − H(t)) d x = ∂µ [j µ (x) (H(t0 ) − H(t))] d4 x,
0 µ 0 4
(2.57)

dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuità. Dividiamo ora la


quadridivergenza in parte spaziale e parte temporale, applicando alla prima il teorema di
Gauss in d = 3, e alla seconda il teorema fondamentale del calcolo in t. Supponendo di
poter scambiare gli ordini di integrazione si ottiene,
Z Z Z
0
Q − Q = dt 0 ~ + d3 x j 0 (x)(H(t0 ) − H(t))|t=+∞ .
(H(t ) − H(t))~j(x) · dΣ t=−∞
Γ∞

Nel primo termine Γ∞ è una superficie sferica posta all’infinito spaziale, dove ~j si annulla
più rapidamente di 1/|~x|3 ; l’integrale del flusso è quindi zero. Nel secondo termine dob-
biamo valutare la differenza H(t0 ) − H(t) nei limiti t → ±∞, per ~x fissato. Grazie al
fatto che Λ0 0 ≥ 1, dalla (2.56) si vede che per t → +∞ anche t0 → +∞, ed entrambe
le funzioni di Heaviside vanno a 1, mentre per t → −∞ anche t0 → −∞ ed entrambe le
funzioni di Heaviside vanno a zero. Anche il secondo integrale è quindi zero e abbiamo,

Q0 = Q.

46
2.4.2 Tensore energia–impulso e conservazione del quadrimomento

In questo paragrafo – e nel successivo – illustreremo come il principio di conservazione


dell’energia e della quantità di moto – cardine di qualsiasi teoria fisica fondamentale – vie-
ne realizzato nell’ambito dell’Elettrodinamica, come conseguenza delle equazioni (2.12)–
(2.14). Ma prima di considerare il caso particolare dell’Elettrodinamica, imposteremo ora
il problema in una generica teoria relativistica.
In una teoria relativistica l’energia costituisce la quarta componente di un quadri-
vettore, appunto del quadrimomento. Siccome una trasformazione di Lorentz mescola
energia e quantità di moto ci aspettiamo quindi che la conservazione della prima non
possa avvenire senza la contemporanea conservazione della seconda. In realtà stiamo
quindi cercando quattro costanti del moto raggruppate nel quadrimomento P ν , la cui
componente temporale P 0 = ε rappresenta l’energia totale del sistema.
In analogia con la carica elettrica ci aspettiamo anche per il quadrimomento leggi di
conservazione locali, ovverosia ci aspettiamo che ad ogni componente del quadrimomento
P ν sia associata una corrente conservata. Indichiamo le quattro correnti risultanti con,

j µ(ν) (x) ≡ T µν (x), (2.58)

grandezza che viene chiamata “tensore energia–impulso”.


In base a quanto abbiamo appena detto postuliamo che in una teoria relativistica la
conservazione del quadrimomento sia conseguenza dell’esistenza di un tensore energia–
impulso, che gode delle seguenti proprietà:
I) T µν è un campo tensoriale,
II) T µν soddisfa l’equazione di continuità, ∂µ T µν = 0,
III) lim|~x|→∞ |~x|3 T µν (t, ~x) = 0.
La proprietà I) assicura in particolare la covarianza dell’equazione di continuità II), cioè,
se essa vale in un sistema di riferimento vale in tutti i sistemi di riferimento.
Procediamo ora come nel caso della corrente elettrica per dedurre l’esistenza di quan-
tità conservate. Integrando l’equazione di continuità su un volume finito otteniamo,
Z Z
0ν 3
∂0 T d x=− ∂i T iν d3 x. (2.59)
V V

47
In base all’identificazione (2.58) le componenti T 0ν corrispondono alla densità di quadri-
momento, e il quadrimomento contenuto in un volume V è dunque dato da,
Z
ν
PV = T 0ν d3 x. (2.60)
V

La (2.59) ci dice allora che le quantità T iν sono da interpretarsi come “densità di corrente
di quadrimomento”. Infatti, applicando il teorema di Gauss si ottiene l’equazione del
flusso,
Z
dPVν
=− T iν dΣi . (2.61)
dt ∂V

Scriviamo in particolare le componenti ν = 0 delle (2.60), (2.61), che riguardano l’energia


εV ≡ PV0 contenuta nel volume V ,
Z Z
dεV
εV = T 00 d3 x, =− T i0 dΣi .
V dt ∂V

Si vede che mentre T 00 rappresenta la densità di energia, il vettore tridimensionale T i0


rappresenta il flusso di energia, entrambe quantità che in seguito giocheranno un ruolo
importante. Interpretazioni analoghe valgono per le componenti T µi , che riguardano la
quantità di moto.
Se infine nella (2.61) estendiamo il volume a tutto lo spazio, grazie alla proprietà III)
deduciamo che il quadrimomento totale è conservato,
Z
dP ν
P = T 0ν d3 x,
ν
= 0. (2.62)
dt
A questo punto facciamo notare che il quadrimomento PVν contenuto in un volume finito
– che in generale dipende dal tempo – non ha proprietà ben definite sotto trasformazioni
di Lorentz, mentre, se vogliamo che la conservazione del quadrimomento totale sia una
proprietà preservata nel passaggio da un sistema di riferimento a un altro, dobbiamo
dimostrare che P ν costituisce effettivamente un quadrivettore. La dimostrazione di questo
fatto si basa sulle proprietà I)–III), e segue da vicino quella dell’invarianza della carica
elettrica del paragrafo precedente. Eseguendo gli stessi passaggi si ottiene facilmente,
Z Z
ν µν 4
P = T (x) ∂µ H(t) d x, P = T 0µν (x0 ) ∂µ0 H(t0 ) d4 x0 .

Considerando che i tensori energia–impulso nei due riferimenti sono legati dalla relazione,

T 0µν (x0 ) = Λµ α Λν β T αβ (x),

48
si ottiene,
Z
0ν ν
P =Λ β T µβ (x) ∂µ H(t0 ) d4 x.

Calcoliamo allora la differenza,


Z Z
£ ¤
P −Λ β P = Λ β T (x)∂µ (H(t )−H(t)) d x = Λ β ∂µ T µβ (x)(H(t0 ) − H(t)) d4 x,
0ν ν β ν µβ 0 4 ν

dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuità. L’integrale otte-


nuto è della stessa forma dell’integrale (nullo) in (2.57), e quindi anch’esso è zero. Vale
dunque,
P 0ν = Λν β P β ,

come volevamo dimostrare.

2.4.3 Il tensore energia–impulso dell’Elettrodinamica

In questo paragrafo diamo una dimostrazione costruttiva dell’esistenza di un tensore


energia–impulso per l’Elettrodinamica classica, che goda delle proprietà postulate nel
paragrafo precedente. Deriveremo prima, in modo euristico, la forma della densità di
energia T 00 , dopodichè useremo l’invarianza di Lorentz per ricostruire l’intero tensore.
Per cominciare ricordiamo la nota formula per la densità di energia del campo elet-
tromagnetico,
00 1 2
Tem = (E + B 2 ). (2.63)
2
00
Chiaramente l’energia totale conservata non potrà essere data solo dall’integrale di Tem ,
perché sappiamo che il campo elettromagnetico scambia energia con le particelle cariche.
00
Per quantificare questo scambio ci calcoliamo la derivata temporale di Tem , usando le
equazioni di Maxwell nella forma (2.28)–(2.31),
00
∂Tem ~ ~
~ · ∂E + B
= E ~ · ∂B
∂t ³∂t ∂t´
~· ∇
= E ~ ×B~ − ~j − B
~ ·∇
~ ×E
~
³ ´
~ −∇
= −~j · E ~ · E ~ ×B
~ .

Integriamo ora questa relazione su tutto lo spazio. Applicando all’ultimo termine il teo-
~ eB
rema di Gauss e assumendo che E ~ decrescano all’infinito spaziale abbastanza rapida-

mente, vediamo che esso non dà contributo. Ricordando la forma della corrente spaziale

49
(2.41) possiamo allora scrivere,
Z Z X Z
d 00 3 ~ ~ 3 ~ ~x) δ 3 (~x − ~yr (t)) d3 x (2.64)
Tem d x = − E · j d x = − er ~vr · E(t,
dt r
à !
X d X
= − ~ ~yr (t)) = −
er ~vr · E(t, εr , (2.65)
r
dt r
p
dove abbiamo usato la legge della potenza (2.20), con εr = mr / 1 − vr2 . La relazione che
abbiamo ottenuto ci dice che si conserva l’energia totale del sistema, nella forma,
Z X Z Ã X
!
00 3 1
ε = Tem d x+ εr = (E 2 + B 2 ) + εr δ 3 (~x − ~yr (t)) d3 x.
r
2 r

Da questa formula possiamo dedurre l’espressione della densità di energia,


1 2 X
T 00 = (E + B 2 ) + εr δ 3 (~x − ~yr (t)).
2 r

Viene allora naturale assumere che il tensore energia–impulso totale possa essere scritto
come somma di due contributi, uno che rappresenta solo i campi e l’altro che rappresenta
solo le particelle,
T µν = Tem
µν
+ Tpµν , (2.66)

con le condizioni,
1 2 X
00
Tem = (E + B 2 ), Tp00 = εr δ 3 (~x − ~yr (t)). (2.67)
2 r

Con queste posizioni cerchiamo ora di determinare i due tensori separatamente, sfrut-
tando il fatto che sotto trasformazioni di Lorentz entrambi si devono trasformare in modo
covariante.
00
Cominciamo con il contributo del campo elettromagnetico. Siccome Tem è bilineare in
~ eB
E ~ – che sono le componenti del tensore F µν – e siccome le trasformazioni di Lorentz
µν
sono lineari, possiamo concludere che tutte le componenti di Tem devono essere bilineari
in F µν . La covarianza di Lorentz impone allora la seguente struttura generale, dove a, b
e c sono per il momento costanti arbitrarie 9 ,

µν
Tem = a F µ α F αν + b η µν F αβ Fαβ + c F µν F α α . (2.68)
9
A priori potrebbero essere presenti anche contributi che coinvolgono il tensore di Levi–Civita εµνρσ ,
ma questi renderebbero Temµν
uno pseudotensore. Per parità, ovverosia per ~x → −~x, E ~ → −E,~ B~ → B,~
00
la componente Tem dovrebbe allora cambiare di segno, in contraddizione con la (2.63) che resta invece
invariante.

50
L’ultimo termine è identicamente nullo grazie all’antisimmetria di F αβ . Per determinare
00
le costanti a e b calcoliamo Tem dalla (2.68) e confrontiamo il risultato con la (2.67),

00
Tem = aF 0 α F α0 + b η 00 · 2(B 2 − E 2 )

= aF 0 i F i0 + 2b (B 2 − E 2 ) = (a − 2b)E 2 + 2bB 2 .

Il confronto dà a = 1, b = 1/4, e quindi,

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ . (2.69)
4

Per determinare Tpµν riscriviamo la componente Tp00 in (2.67) nel modo seguente,
XZ XZ X Z
00 4 0 0 4
Tp = εr δ (x − yr ) dyr = εr ur δ (x − yr ) dsr = mr u0r u0r δ 4 (x − yr ) dsr .
r r r

Questa forma suggerisce di porre,


X Z
Tpµν = mr uµr uνr δ 4 (x − yr ) dsr , (2.70)
r

che è un tensore per trasformazioni di Lorentz e riproduce la componente 00 corretta. È


sottinteso che l’integrale curvilineo è esteso all’intera linea di universo di ciascuna parti-
cella, come nella definizione della quadricorrente. Integrando nuovamente la δ temporale
possiamo riscrivere questo tensore in modo non manifestamente covariante, in una forma
che sarà utile nel prossimo paragrafo,
X pµ pν
r r
Tpµν = δ 3 (~x − ~yr (t)). (2.71)
r
εr

Facciamo notare che i tensori dati in (2.69) e (2.70) sono simmetrici in µ e ν, e quindi lo
è anche il tensore energia–impulso totale,

T µν = T νµ .

Per il momento questa proprietà sembra accidentale, ma essa giocherà un ruolo rilevante
in seguito.
µν
L’equazione di continuità per T µν . Le formula per Tpµν e Tem appena trovate sono state
dedotto in modo euristico, ma la loro giustificazione definitiva discende dal fatto che si
può dimostrare che il tensore energia–impulso totale T µν è conservato se,

51
a) F µν soddisfa l’identità di Bianchi e l’equazione di Maxwell,
b) le coordinate delle particelle soddisfano l’equazione di Lorentz.
Per dimostrarlo calcoliamo la quadridivergenza dei due tensori separatamente, comincian-
do dal tensore elettromagnetico,

µν 1
∂µ Tem = ∂µ F µα Fα ν + F µα ∂µ Fα ν + Fαβ ∂ ν F αβ
2
1 ¡ ¢ 1
= −F να jα + Fαβ ∂ α F βν − ∂ β F αν + Fαβ ∂ ν F αβ
2 2
1 ¡ ¢
= −F να jα + Fαβ ∂ α F βν + ∂ β F να + ∂ ν F αβ
2
X Z
= − er F να (yr )urα δ 4 (x − yr ) dsr . (2.72)
r

Abbiamo usato l’equazione di Maxwell, l’identità di Bianchi nella forma (2.89), e la


definizione della quadricorrente.
Per calcolare la quadridivergenza del tensore energia–impulso delle particelle si ese-
10
guono gli stessi passaggi del calcolo della quadridivergenza della corrente elettrica ,
XZ XZ
d 4
∂µ Tpµν = pνr uµr 4
∂µ δ (x − yr ) dsr = − pνr
δ (x − yr ) dsr
r r
dsr
X Z dpν X ¯sr =+∞
= r 4
δ (x − yr ) dsr − pνr δ 4 (x − yr )¯sr =−∞
r
dsr r
Z
X dpν
r 4
= δ (x − yr ) dsr . (2.73)
r
dsr

Sommando questo risultato alla (2.72) si ottiene,


X Z µ dpν ¶
µν r
∂µ T = − er F (yr )urα δ 4 (x − yr ) dsr = 0,
να
(2.74)
r
dsr

in virtù dell’equazione di Lorentz.


Concludiamo che le formule (2.66), (2.69) e (2.70) individuano un tensore energia–
impulso che soddisfa le proprietà I) e II) del paragrafo precedente. Sotto ipotesi molto
generali si può inoltre fare vedere che esso soddisfa anche la proprietà III) sul suo anda-
mento asintotico. Il contributo Tpµν soddisfa questa proprietà in modo ovvio. Per quanto
µν
riguarda invece il tensore Tem vedremo che esso la soddisfa, per esempio, se l’accelerazione
10
Per non appesantire la notazione in questo calcolo usiamo per le distribuzioni la notazione simbolica.
Per rendersi conto che i passaggi eseguiti sono corretti è sufficiente applicare i risultati intermedi a una
funzione di test ϕ.

52
delle particelle cariche svanisce per t → −∞ con sufficiente rapidità (in particolare se le
particelle sono accelerate solo per un intervallo temporale finito). Nel capitolo 6 faremo,
infatti, vedere che in questo caso il campo elettromagnetico ha l’andamento asintotico
tipico di un campo coulombiano,
1
F µν ∼ , per r = |~x| → ∞.
r2
µν
Siccome Tem è quadratico in F µν ne segue che asintoticamente,

µν 1
Tem ∼ ,
r4
e quindi r3 Tem
µν
→ 0.
Prima di procedere osserviamo che nella dimostrazione dell’equazione di continuità
appena svolta abbiamo evidentemente sottointeso l’identificazione dei due tipi di carica
discussi alla fine del paragrafo 2.2.3, vale a dire abbiamo posto er = e∗r . Ricordiamo che le
{e∗r } sono le cariche che compaiono – a priori – nella corrente, e che le {er } sono quelle che
compaiono nelle equazioni di Lorentz. Ma è facile ripetere gli stessi passaggi di cui sopra
senza usare questa identificazione, e si vede immediatamente che al posto di ∂µ T µν = 0 si
otterrebbe, vedi (2.74),
X Z
µν
∂µ T = (er − e∗r ) F να (yr ) δ 4 (x − yr ) dyrα . (2.75)
r

L’equazione di continuità è quindi violata, a meno che non si abbia er = e∗r . L’identificazio-
ne dei due tipi di carica è quindi effettivamente necessaria per assicurare la conservazione
del quadrimomento totale del sistema, come anticipato nel paragrafo 2.2.3.
Il significato delle componenti di T µν . Analizziamo ora brevemente il significato del-
le singole componenti di T µν , cominciando di nuovo con il contributo elettromagnetico.
Calcoli elementari danno,

00 1 2
Tem = (E + B 2 ), (2.76)
2
i0
Tem 0i
= Tem ~ × B)
= (E ~ i, (2.77)
ij 1 2
Tem = (E + B 2 ) δ ij − E i E j − B i B j . (2.78)
2
00
Riotteniamo ovviamente la densità di energia Tem dalla quale eravamo partiti. Nelle com-
ponenti miste riconosciamo poi il vettore di Poynting S i che, come sappiamo, rappresenta

53
effettivamente il flusso di energia del campo elettromagnetico,

i0
Tem = S i, ~=E
S ~ × B.
~ (2.79)

Vediamo inoltre che il vettore di Poynting eguaglia anche la densità di quantità di moto
0i
Tem . Le componenti spazio–spazio invece formano un tensore simmetrico che viene chia-
mato “tensore degli sforzi di Maxwell”; esso rappresenta il flusso della quantità di moto.
Infine osserviamo che il tensore energia–impulso elettromagnetico è a traccia nulla,

µ µν
Tem µ = Tem ηµν = 0.

Per quanto riguarda il tensore energia–impulso delle particelle, dalla (2.71) si vede che
la densità di quadrimomento ha la forma aspettata,
X
Tp0µ = pµr δ 3 (~x − ~yr (t)). (2.80)
r

Infatti, il quadrimomento totale delle particelle che a un istante considerato si trovano


all’interno di un volume V è dato da,
Z X Z X
0µ 3
Tp d x = pµr δ 3 (~x − ~yr (t)) d3 x = pµr ,
V r V r∈V

dove la somma si estende a tutte le particelle contenute in V .


Concludiamo questo paragrafo riprendendo il bilancio del quadrimomento riferito a
un volume V . Secondo la (2.61) il quadrimomento che abbandona nell’unità di tempo il
volume V é dato da,
Z
dPVµ
=− T iµ dΣi .
dt ∂V

L’intgrale a secondo membro è un integrale di superficie e riceve – a priori – contributi



sia da Tem che da Tpiµ . Ma siccome le particelle all’istante considerato stanno o all’interno
o all’esterno della superficie, il termine Tpiµ non contribuisce e si ottiene,
Z
dPVµ iµ
=− Tem dΣi . (2.81)
dt ∂V

In altre parole, la variazione del quadrimomento totale contenuto in V , che risulta dalla
somma del quadrimomento delle particelle e di quello del campo elettromagnetico, è cau-
sata dal solo flusso elettromagnetico. In particolare per “l’energia irradiata” nell’unità di

54
tempo dal volume V otteniamo,
Z Z
dεV i0 i ~ · dΣ.
~
=− Tem dΣ = − S (2.82)
dt ∂V ∂V

Questa importante relazione sarà la formula cardine per l’analisi energetica di tutti i
fenomeni di irraggiamento.

2.4.4 Conservazione del momento angolare

In questo paragrafo stabiliremo la legge di conservazione locale del momento angolare qua-
dridimensionale, in una generica teoria relativistica. Applicheremo poi la ricetta ottenuta
all’Elettrodinamica.
Sappiamo che in un sistema isolato di particelle non relativistiche, oltre all’energia e
alla quantità di moto si conserva anche il momento angolare tridimensionale, nella forma,
X X
Li = (~yr × p~r )i = εijk yrj pkr ,
r r

dove p~r = mr~vr è la quantità di moto non relativistica della particella r–esima. In una
teoria relativistica questa legge di conservazione vettoriale, opportunamente generalizzata
dovrebbe acquisire carattere covariante quadridimensionale. Ma il tentativo più naturale
di estendere il momento angolare a un quadrivettore fallisce, in quanto il prodotto esterno
tridimensionale non ammette nessuna estensione quadrivettoriale. Tuttavia, possiamo
sfruttare il fatto che in tre dimensioni ogni vettore è equivalente a un tensore doppio
antisimmetrico,
X
Lij ≡ εijk Lk = (yri pjr − yrj pir ). (2.83)
r
In quanto tensore antisimmetrico questa espressione ammette ora un’estensione naturale
a un quadritensore antisimmetrico di rango due,
X
Lαβ
p = (yrα pβr − yrβ pαr ), Lαβ βα
p = −Lp , (2.84)
r

purché identifichiamo pαr con il quadrimomento relativistico della particella. Un tensore


di questo tipo corrisponderebbe quindi a sei quantità conservate. In realtà dovevamo
aspettarci che il momento angolare relativistico fosse costituito da più di tre componenti.
Sappiamo, infatti, che in fisica Newtoniana la conservazione del momento angolare discen-
de dall’invarianza per rotazioni spaziali, le quali costituiscono un gruppo a tre parametri.

55
A livello relativistico questo gruppo si allarga al gruppo di Lorentz che costituisce invece
un gruppo a sei parametri, e quindi risulta naturale la comparsa di altrettante quantità
conservate.
Come per la carica elettrica e il quadrimomento assumiamo anche in questo caso leggi
di conservazione locali. Ipotizziamo quindi l’esistenza di un tensore “densità di corrente
di momento angolare” di rango tre M µαβ , con le proprietà,
I) M µαβ = −M µβα ,
II) ∂µ M µαβ = 0.
Alla luce della (2.84), vedi sotto, postuliamo la seguente definizione,

M µαβ = xα T µβ − xβ T µα . (2.85)

La proprietà I) è allora valida per costruzione. Per quanto riguarda la II) calcoliamo,

∂µ M µαβ = δµα T µβ + xα ∂µ T µβ − δµβ T µα − xβ ∂µ T µα = T αβ − T βα ,

dove abbiamo sfruttato la conservazione del tensore energia–impulso. Vediamo ora che se
quest’ultimo è anche simmetrico – come nel caso dell’Elettrodinamica – allora risulta in
effetti l’equazione di continuità,
∂µ M µαβ = 0.

Seguendo il procedimento standard e assumendo opportuni andamenti asintotici dei campi


all’infinito, segue allora che esistono sei quantità conservate date da,
Z Z
αβ 0αβ 3
L = M d x = (xα T 0β − xβ T 0α ) d3 x, Lαβ = −Lβα . (2.86)

Con il consueto procedimento si dimostra poi anche che le quantità Lαβ costituiscono
un tensore di rango due sotto trasformazioni di Lorentz. Inoltre, in assenza di campo
elettromagnetico, cioè per un sistema di particelle neutre, usando la (2.80) si vede im-
mediatamente che la (2.86) si riduce alla (2.84). Giustifichiamo cosı̀ – a posteriori – la
definizione del momento angolare relativistico data in (2.85).
In realtà i campi M µαβ si comportano come campi “tensoriali” solo sotto trasformazioni
di Lorentz, mentre sotto traslazioni, xµ → x0µ = xµ + aµ , essi trasformano in modo
“anomalo”,
M 0µαβ (x0 ) = M µαβ (x) + aα T µβ (x) − aβ T µα (x).

56
Ricordiamo, appunto, che sotto traslazioni un tensore non dovrebbe cambiare. In modo
simile le quantità conservate (2.86) trasformano secondo, vedi (2.62),

L0αβ = Lαβ + aα P β − aβ P α . (2.87)

Questa anomalia si spiega facilmente osservando che la densità di momento angolare


(2.85) è stata calcolata considerando implicitamente come polo l’origine O, con coordinate
xµO = 0. Per un polo generico la (2.85) si generalizza invece come,

MOµαβ = (xα − xαO )T µβ − (xβ − xβO )T µα ,

espressione che risulta ora invariante per traslazioni e preserva, per di più, le proprietà I) e
II) di cui sopra. La (2.87) può allora essere interpretata come la versione relativistica della
nota regola di cambiamento del momento angolare non relativistico per un cambiamento
del polo, xµO → x0µ µ µ
O = xO − a .

Esplicitiamo ora la forma delle costanti del moto Lαβ nel caso dell’Elettrodinamica.
1
Analizziamo separatamente le componenti Lij , ovverosia il vettore Li = 2
εijk Ljk che
corrisponde al momento angolare spaziale, e le tre nuove costanti del moto K i ≡ L0i , che
vengono chiamate boost. Per il momento angolare spaziale la (2.79) e la (2.80) danno,
Z Z Ã !
1 X
Li = εijk Ljk = εijk xj T 0k d3 x = εijk xj S k + pkr δ 3 (~x − ~yr ) d3 x,
2 r

e quindi,
Z X
~ =
L ~ d3 x +
(~x × S) ~ p,
~yr × p~r ≡ Lem + L (2.88)
r
risultato non sorprendente, dato che il vettore di Poynting rappresenta la densità di
quantità di moto del campo elettromagnetico.
Il significato dei boost. Analizziamo ora le componenti (0 i) di Lαβ , in una teoria
relativistica generica. Dalla (2.86) otteniamo le costanti del moto,
Z Z
K = L = t T d x − xi T 00 d3 x,
i 0i 0i 3

R
dove nelle quantità P i = T 0i d3 x riconosciamo la quantità di moto totale conservata del
sistema. Per dare un’interpretazione al secondo termine di K i definiamo la posizione del
“centro di massa” di un sistema relativistico come,
R
~x T 00 d3 x
~xcm (t) ≡ R 00 3 ,
T dx

57
R
dove ε = T 00 d3 x è l’energia totale conservata del sistema. Si noti che questa formula si
ottiene dalla corrispondente espressione non relativistica sostituendo la densità di massa
con la densità di energia. La costanza del vettore di boost,

~ = t P~ − ε ~xcm (t),
K

è allora equivalente all’affermazione che il centro di massa del sistema si muove di moto
rettilineo uniforme, con velocità data da,
P~
~vcm = .
ε
Resta, tuttavia, da notare che il concetto di centro di massa di un sistema, per come
l’abbiamo introdotto non è un concetto relativisticamente invariante, nel senso che le sue
coordinate (t, ~xcm ) non costituiscono un quadrivettore: il centro di massa di un sistema è
rappresentato da punti diversi in sistemi di riferimento diversi.
In definitiva, dalle equazioni del moto dell’Elettrodinamica siamo riusciti a dedurre
l’esistenza delle dieci quantità conservate P ν e Lαβ – tante quanti sono i parametri con-
tinui che parametrizzano il gruppo di Poincaré. Abbiamo già anticipato che alla base di
questa “coincidenza” numerica c’è un legame profondo esistente in natura tra principi di
simmetria e leggi di conservazione, legame che a livello matematico viene decodificato dal
teorema di Noether.

2.5 Problemi

2.1 Si dimostri che il quadrato della quadriaccelerazione w2 ≡ wµ wµ soddisfa,

w2 ≤ 0.

[Sugg.: si sfrutti l’identità wµ uµ = 0.] Si dimostri che in termini di velocità e accelerazione


tridimensionali si ha,
a2 − (~a × ~v )2
w2 = − .
(1 − v 2 )3

2.2 Si dimostri che le seguenti tre versioni dell’identità di Bianchi sono equivalenti tra
di loro:

∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = 0, (2.89)

58
∂[µ Fνρ] = 0,

εµνρσ ∂ν Fρσ = 0.

2.3 Si trovino tutte le soluzioni per F ∈ S 0 (R) dell’equazione in una dimensione,

(x2 − a2 )F (x) = 0, a > 0.

Si dimostri che ogni soluzione può essere posta nella forma F (x) = f (x)δ(x2 − a2 ), per
un’opportuna funzione continua f .

2.4 Si dimostri che una funzione f (x) : RD → C definisce un elemento F ∈ S 0 (RD ),


dato da,
Z
F (ϕ) = f (x) ϕ(x) dD x, (2.90)

se 1) f è integrabile in modulo su una qualsiasi palla di RD – in particolare se possiede un


numero finito di singolarità integrabili – e 2) se essa è asintoticamente polinomialmente
limitata. Una funzione f si dice asintoticamente polinomialmente limitata se esistono una
distanza d, un intero positivo N e una costante positiva C, tali che per ogni x per cui
r ≥ d si abbia,
|f (x)| ≤ C r2N ,
p
dove r ≡ (x1 )2 + · · · + (xD )2 . [Sugg.: È necessario e sufficiente dimostrare che vale la
(2.34) per opportuni monomi P e Q. A questo scopo è utile suddividere il dominio di
integrazione nella (2.90) in una palla sufficientemente grande e nel suo complemento in
RD , e sfruttare le proprietà asintotiche (2.32) della ϕ.]

2.5 Si dimostri il “Teorema di Birkhoff”, enunciato come segue. Sia data una
quadricorrente a simmetria sferica, ma in generale non statica,

j 0 (~x, t) = ρ(r, t),


xi
j i (~x, t) = j(r, t),
r

a supporto spaziale compatto, cioè,

j µ (~x, t) = 0 per r > r0 , ∀ t.

59
Allora il campo elettromagnetico generato dalla quadricorrente nel vuoto, vale a dire nella
regione r > r0 , è statico, essendo dato da,
Z
~ = Q ~x ,
E ~ = 0,
B Q= ρ(r, t) d3 x.
4π r3 r<r0

~ = ~x f (r, t), B
[Sugg.: si usi l’Ansatz E ~ = ~x g(r, t), implicato dalla simmetria sferica.] Se

ne conclude in particolare che una distribuzione di corrente a simmetria sferica – seppure


costituita da cariche accelerate – non può irradiare onde elettromagnetiche, perché il
campo da essa generato è statico.

2.6 Integrali invarianti in 3 dimensioni. Si definisca il tensore doppio tridimensio-


nale,
Z
ij
H = dΩ ni nj , (2.91)
R
dove dΩ = senϑ dϑ dϕ è la misura dell’angolo solido in 3 dimensioni, con dΩ = 4π, e
ni = xi /r, r = |~x|. L’integrando nella (2.91) dipende quindi solo dagli angoli.
R
a) Si dimostri che si può scrivere H ij = d3 x δ(r − 1) xi xj .
b) Si dimostri che H ij è un tensore invariante per SO(3), cioè,

Ri m Rj n H mn = H ij , ∀ R ∈ SO(3).

[Sugg.: si esegua il cambiamento di variabili xi = Ri k y k nell’integrando del punto a)].


c) Sapendo che gli unici tensori invarianti indipendenti per SO(3) sono δ ij e εijk , si
concluda che H ij = C δ ij per qualche costante C. Si determini C contraendo la (2.91)
con δ ij .
d) Secondo questa linea di argomenti si stabilisca la seguente tabella di integrali invarianti:
Z
dΩ = 4π,
Z
dΩ ni = 0,
Z
4π ij
dΩ ni nj = δ ,
3
Z
dΩ ni nj nk = 0,
Z
4π ij kl
dΩ ni nj nk nl = (δ δ + δ ik δ jl + δ il δ jk ).
15

60
2.7 Una particella di carica e e massa m si trova in presenza di un campo elettroma-
gnetico costante e uniforme F µν . La quadrivelocità iniziale della particella per s = 0 sia
uµ (0), con u2 (0) = 1. Seguendo l’approccio covariante del paragrafo 2.2.1,
a) si dimostri che in questo caso l’equazione di Lorentz è equivalente all’equazione del
primo ordine,
dy µ £ ¤µ
= uµ (s) = esA ν uν (0),
ds
per un’opportuna matrice costante Aµ ν , determinandola esplicitamente.
b) Si verifichi esplicitamente che u2 (s) = 1 ∀ s. [Sugg.: si noti che esA ∈ SO(1, 3)c ∀ s.]
c) Si dimostri che la quantità w2 = wµ (s)wµ (s) è indipendente da s, esprimendola in
termini di F µν e uµ (0).
~ = |B|
d) Escluso il caso in cui |E| ~ e simultaneamente E
~ ⊥B
~ = 0, esiste sempre un sistema
~ e B
di riferimento in cui E ~ sono paralleli e diretti lungo l’asse delle x: E
~ = (E, 0, 0),
~ = (B, 0, 0). Si dimostri che in questo riferimento la matrice A è diagonale a blocchi
B
2 × 2.
e) Sfruttando questa struttura di A si determini esA sviluppando l’esponenziale in serie,
e risommandolo in termini delle funzioni sen, cos, cosh e senh.
f) Ponendo come velocità iniziale ~v0 = (0, v0 , 0), cioè,
1
uµ (0) = p (1, 0, v0 , 0),
1 − v02
si determinino uµ (s) e y µ (s), e quindi la legge oraria ~y (t). In questo quesito per semplicità
si ponga B = 0.

2.8 Si consideri un sistema di N particelle cariche nel limite non relativistico, vr ¿ 1,


che creano quindi un campo elettromagnetico dato da,
N
X
~ = −∇A
~ 0, 0 er ~ = 0.
E A (t, ~x) = , B
r=1
4π|~x − ~yr (t)|

a) Utilizzando l’equazione di Coulomb −∇2 A0 = j 0 , si dimostri che l’energia del campo


R
elettromagnetico εem = 21 d3 x (E 2 + B 2 ) può essere riscritta “formalmente” come somma
delle energie potenziali relative di tutte le cariche,
Z N
1 3 0 0 1 X er es
εem = d xA j = . (2.92)
2 2 r,s=1 4π|~yr (t) − ~ys (t)|

61
b) Si sottragga da questa espressione la parte divergente dovuta all’autointerazione, e si
scriva l’energia totale del sistema campo elettromagnetico + particelle cariche, aggiungen-
do l’energia cinetica non relativistica di queste ultime. Si dimostri che l’energia totale cosı̀
ottenuta risulta conservata nel limite non relativistico. Si noti che mentre l’espressione
originale per εem è sempre positiva – qualsiasi siano i segni delle cariche – ciò non è più
vero per l’espressione (2.92), dopo la sottrazione della parte divergente (esempio: N = 2,
e1 = −e2 ).

2.9 Si trovi la soluzione generale y µ (λ) dell’equazione del moto per la particella libera,

d2 y µ
= 0,
ds2

parametrizzando la linea di universo con un parametro λ generico, vedi (2.3). Si verifichi


che la soluzione generale è determinata solo modulo una riparametrizzazione.

2.10 Si dimostri che “l’equazione di Newton” (2.21) può essere posta nella forma,

m ~a = F~ (~y , ~v ),

per un’opportuna forza F~ .

2.11 Si dimostri che se un campo elettromagnetico F µν (x) soddisfa le equazioni di Max-


well (2.28), (2.29) per ogni t, e le equazioni (2.30), (2.31) a t = 0, allora esso soddisfa
automaticamente le (2.30), (2.31) per ogni t. [Sugg.: si valuti la divergenza spaziale delle
(2.28), (2.29).]

2.12 Si verifichi esplicitamente che il tensore tridimensionale,


µ ¶
1 ij xi xj
δ −3 2 ,
r3 r

che compare al membro di destra della (2.50), appartiene a S 0 (R3 ).

Soluzione Problema 2.3 L’equazione,

(x2 − a2 )F (x) = 0, a > 0, (2.93)

62
implica che F può essere “diversa da zero” solo per x = ±a, ovverosia che il supporto di F
è {−a, a}, che è un insieme di punti. Il teorema enunciato nel paragrafo 2.3.2, vedi (2.42),
implica allora che F è una combinazione lineare finita di δ(x ± a) e delle loro derivate.
Evidentemente,
F0 ≡ c1 δ(x − a) + c2 δ(x + a),

è soluzione dell’equazione (2.93), con c1 e c2 costanti aribitrarie, come si verifica subito


usando la (2.36). Per quanto riguarda invece le derivate prime notiamo che, derivando
l’identità (x2 − a2 ) δ(x ± a) = 0, si ottiene,

(x2 − a2 )δ 0 (x ± a) = −2xδ(x ± a) = ±2a δ(x ± a) 6= 0.

Quindi le derivate prime non sono soluzioni di (2.93), e allo stesso modo si dimostra che
nemmeno le derivate successive lo sono. F0 è quindi la soluzione generale della (2.93).
Per porre F0 nella forma richiesta nel problema è sufficiente ricordare la (2.38), e
moltiplicarla per una generica funzione continua f ,

1
F1 ≡ f (x)δ(x2 − a2 ) = (f (a)δ(x − a) + f (−a)δ(x + a)).
2a

Siccome f (a) e f (−a) possono assumere qualsiasi valore F0 può quindi sempre essere
posta nella forma F1 .

~ eB
Soluzione Problema 2.5 Inserendo gli Ansatz dati per E ~ nelle equazioni di Max-
~ ·E
well nel vuoto, ∇ ~ = 0, ∇
~ ·B
~ = 0, si trovano equazioni differenziali che determinano

completamente la dipendenza di f e g da r,

F (t) G(t)
f (r, t) = , g(r, t) = .
r3 r3
~ e B,
Inserendo queste formule di nuovo negli Ansatz per E ~ si trova che vale identicamente
~ ×E
∇ ~ =0=∇
~ × B.
~ Usando questi risultati nelle rimanenti due equazioni di Maxwell

nel vuoto, si trova che F (t) e G(t) sono funzioni costanti. Queste costanti si determinano,
~ ·E
infine, applicando il teorema di Gauss alle equazioni di Maxwell complete, ∇ ~ = ρ,
~ ·B
∇ ~ = 0.

63
3 Metodi variazionali in teoria di campo

Nel capitolo precedente abbiamo illustrato le equazioni fondamentali dell’Elettrodinami-


ca evidenziando le loro proprietà più salienti, tra cui l’invarianza sotto trasformazioni
del gruppo di Poincaré. Abbiamo poi scoperto che queste equazioni godono di un’altra
importante proprietà, cioè, quella di garantire la conservazione del quadrimomento e del
momento angolare quadridimensionale. A prima vista questi due aspetti – l’invarianza
relativistica e la presenza di leggi di conservazione – non sembrano avere niente a che
fare l’uno con l’altro. Ma in realtà le equazioni dell’Elettrodinamica posseggono un’al-
tra caratteristica fondamentale, che a questo punto appare ancora completamente velata:
esse discendono da un principio variazionale. Come vedremo è proprio questa proprietà
aggiuntiva ad assicurare la validità delle leggi di conservazione – stabilite “a mano” nel ca-
pitolo precedente – e a qualificare definitivamente l’Elettrodinamica come un’interazione
fondamentale.
In questo capitolo rideriveremo dunque le equazioni del moto e le leggi di conservazio-
ne dell’Elettrodinamica usando il metodo variazionale – metodo che in generale fornisce
una descrizione alternativa, compatta e elegante, della dinamica di un generico sistema
fisico. L’importanza che questo metodo riveste in Fisica si desume dal fatto che tutte
le teorie fondamentali, dal Modello Standard delle particelle elementari fino alla Relati-
vità Generale e alla più speculativa Teoria delle Stringhe, sono deducibili da un principio
variazionale: senza un tale principio la consistenza interna di queste teorie sarebbe difficil-
mente controllabile, e non sarebbero garantite le principali leggi di conservazione. Infatti,
come anticipato nella sezione 2.4, la validità del teorema di Noether, che rivela la pro-
fonda connessione esistente in natura tra principi di simmetria e leggi di conservazione,
necessita di un principio variazionale.
Lo strumento fondamentale del metodo variazionale è il principio di minima azione.
Questo principio si basa sulla conoscenza di un’unica funzione delle variabili dinamiche del
sistema – la lagrangiana L – dalla quale per integrazione discende un funzionale, l’azione
I. Il pregio tecnico del metodo consiste nell’estrema economia impiegata nella derivazione
di una teoria fisica: assegnata la sola funzione L il principio di minima determina univo-

64
camente la dinamica del sistema, e il teorema di Noether fornisce poi la forma esplicita
delle leggi di conservazione.
Quantizzazione e invarianza relativistica. C’è un’ulteriore circostanza che conferisce al
metodo variazionale un ruolo fondamentale: è il fatto che esso costituisce il punto di par-
tenza indispensabile per la quantizzazione canonica di una qualsiasi teoria. Ricordiamo,
infatti, che è la lagrangiana a determinare la forma dei momenti coniugati e, attraverso
la trasformata di Legendre, l’hamiltoniana – oggetto su cui si fonda la quantizzazione
canonica di una qualsiasi teoria. Notiamo, tuttavia, che in una teoria relativistica la
quantizzazione canonica non costituisce una procedura covariante a vista, semplicemen-
te perché l’hamiltoniana, essendo la quarta componente di un quadrivettore, non è un
invariante relativistico. D’altra parte per le teorie relativistiche esiste una procedura di
quantizzazione alternativa, quella dell’integrale funzionale di Feynman, che si basa diret-
tamente sull’azione – e quindi non sull’hamiltoniana, ma sulla lagrangiana – e che ha il
pregio di mantenere la teoria quantistica covariante a vista.
Nelle teorie relativistiche il metodo variazionale è soggetto, infatti, a un ulterio-
re vincolo: l’azione deve essere un’invariante per trasformazioni di Poincaré, cioè, un
quadriscalare,
I = I 0.

Sotta questa ipotesi le equazioni del moto che ne derivano soddisfano automaticamente
il principio di relatività einsteiniana. Infatti, secondo il principio di minima azione le
configurazioni che soddisfano le equazioni del moto sono quelle che rendono stazionaria
l’azione – δI = 0 – sotto opportune variazioni delle variabili dinamiche. Schematicamente
abbiamo allora,

Equazioni del moto in K ↔ δI = 0 ↔ δI 0 = 0 ↔ Equazioni del moto in K0 .

Le equazioni del moto hanno quindi automaticamente la stessa forma in tutti i sistemi di
riferimento.
Località. Concludiamo questa nota introduttiva soffermandoci su un aspetto peculiare
della dinamica delle particelle relativistiche, la località dell’interazione. Ricordiamo prima
di tutto che in fisica newtoniana le particelle interagiscono attraverso forze che esercitano

65
un’azione a distanza. Per esempio, una particella di carica e2 esercita su una particella
di carica e1 la forza,
e1 e2 ~y1 − ~y2
F~ = ,
4π |~y1 − ~y2 |3
la quale viene trasmessa istantaneamente: se a un dato istante la seconda particella si
sposta, la prima ne subisce l’effetto allo stesso istante. Un’interazione – non locale – di
questo tipo corrisponde a un segnale che si propaga con velocità infinita, ed è quindi in
conflitto con i principi della Relatività Ristretta. In una teoria relativistica, invece, le
particelle non interagiscono tra di loro direttamente ma attraverso i campi, e l’interazione
tra campi e particelle è un’azione a contatto, ovverosia, locale. Cosı̀ la forza di Lorentz
subita da una particella carica relativistica,

e F µν (y)uν ,

dipende solo dal valore del campo nel punto y µ dello spazio–tempo dove essa si trova, e
non dalle posizioni delle altre particelle o dai valori del campo in altri punti. L’interazione
elettromagnetica tra particelle cariche si propaga quindi con la velocità di propagazione
del campo elettromagnetico, cioè, con la velocità della luce. Per confronto osserviamo
che a livello quantistico la richiesta di località si traduce nel fatto che l’interazione tra
particelle cariche è mediata dai quanti del campo elettromagnetico, ovverosia dai fotoni,
che viaggiano a loro volta con la velocità della luce. L’interazione tra questi ultimi e le
particelle cariche, nella schematizzazione dei grafici di Feynman avviene di nuovo in un
punto, e risulta quindi a sua volta “locale”.
In una teoria relativistica sono quindi i campi a implementare la località dell’inte-
razione, e cosı̀ essi vanno considerati a tutti gli effetti come gradi di libertà dinamici
indipendenti, alla stessa stregua delle coordinate delle particelle: mentre in fisica non
relativistica il concetto di campo è utile, in una teoria relativistica esso è indispensabile.
In conlusione, la formulazione di una teoria fisica attraverso il metodo variazionale
avviene secondo il seguente schema:

I) Individuare l’espressione dell’azione.

II) Derivare le equazioni del moto attraverso il principio di minima azione.

66
III) Usare il teorema di Noether per derivare le leggi di conservazione.

Per quanto detto sopra, in fisica relativistica genericamente avremo a che fare con
un sistema di particelle puntiformi in interazione con un sistema di campi. Un sistema
fisico i cui gradi di libertà consistono di soli campi viene chiamato “teoria di campo”. In
generale dovremo quindi implementare il metodo variazionale per un sistema di particelle
in interazione con una teoria di campo. In questo capitolo svilupperemo dunque prima
il metodo variazionale per una generica teoria di campo che, come vedremo, può essere
considerata come un sistema lagrangiano con un numero infinito di gradi di libertà. Per
questo motivo nel paragrafo che segue ricorderemo brevemente in che cosa consiste il
metodo per un sistema lagrangiano con un numero finito di gradi di libertà, ovverosia, in
meccanica classica.
Nel prossimo capitolo estenderemo infine il principio variazionale a un sistema di
particelle cariche interagenti con il campo elettromagnetico.

3.1 Principio di minima azione in meccanica classica

Consideriamo un sistema meccanico non relativistico, conservativo e olonomo, a N gradi


di libertà, descritto dalle coordinate lagrangiane qn (t), n = 1, · · · , N. Indicheremo le coor-
dinate collettivamente con q = (q1 , · · · , qN ), e le loro derivate prime con q̇ = (q̇1 , · · · , q̇N ),
dove,
dqn
q̇n = .
dt
Sappiamo allora che esiste una funzione di 2N variabili, la lagrangiana L(q, q̇), tale che le
equazioni del moto del sistema meccanico sottostante siano equivalenti alle equazioni di
Lagrange,
d ∂L ∂L
− = 0, n = (1, · · · , N ). (3.1)
dt ∂ q̇n ∂qn
Ricordiamo l’esempio prototipico di un sistema di M particelle non vincolate, con
coordinate cartesiane ~yi (t), i = 1, · · · , M , nel qual caso le coordinate lagrangiane sono date
da q = (~y1 , · · · , ~yM ), e N = 3M . Se indichiamo il potenziale di interazione reciproca con
P
V (q), e l’energia cinetica totale delle particelle con T (q̇) = 21 i mi vi2 , allora la lagrangiana

67
di questo sistema è data da,
L(q, q̇) = T − V.

Fissiamo ora due estremi temporali t1 < t2 , e associamo alla generica lagrangiana L il
seguente funzionale I delle leggi orarie q(t), chiamato azione,
Z t2
I[q] = L(q(t), q̇(t)) dt. (3.2)
t1

Possiamo allora dimostrare il principio di minima azione, detto anche principio di Hamil-
ton.
Principio di minima azione: le leggi orarie q(t) soddisfano le equazioni di Lagrange
(3.1) nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[q] stazionaria per variazioni
δq = (δq1 , · · · , δqN ) arbitrarie purché nulle agli estremi, vale a dire,

δqn (t1 ) = 0 = δqn (t2 ).

Prima di dimostrare il principio spieghiamo la terminologia usata nell’enunciato. In-


nanzitutto specifichiamo che le δqn (t) indicano N funzioni reali del tempo con le stesse
proprietà di regolarità delle qn (t). Introduciamo poi il concetto di “variazione dell’azione”
11
δI attorno a una configurazione q, per delle variazioni δq assegnate. Poniamo ,
¯
d ¯
δI ≡ I[q + α δq]¯¯ , (3.3)
dα α=0

dove α è un parametro reale. Siccome l’azione (3.2) è data dall’integrale di una funzione
delle q e q̇ che supponiamo essere sufficientemente regolare, la (3.3) equivale a,

I[q + α δq] − I[q] ³ ´


δI = lim = I[q + δq] − I[q] . (3.4)
α→0 α lin

Con l’ultima espressione intendiamo la quantità I[q + δq] − I[q] sviluppata in serie di
Taylor attorno a q, e arrestata al termine lineare in δq. Per calcolare δI userermo in
pratica sempre la (3.4), tralasciando il pedice “lin”.
Si dice, infine, che la configurazione q rende l’azione I stazionaria per delle variazioni
δq date, se risulta δI = 0.
11
Si tenga presente che δI è in realtà un funzionale delle 2N funzioni q e δq, e andrebbe quindi
propriamente indicato con δI[q, δq].

68
Passiamo ora a dimostrare il principio di minima azione calcolando la variazione δI
usando la (3.4),
Z
t2 ³ ´
δI = I[q + δq] − I[q] = L(q + δq, q̇ + δ q̇) − L(q, q̇) dt
t
Z t2 Z t2 X1µ ¶
∂L ∂L d δqn
= δL dt = δqn + dt
t1 t1 n
∂qn ∂ q̇n dt
Z t2 X µ µ ¶ ¶
∂L d ∂L d ∂L
= δqn + δqn − δqn dt
t1 n
∂q n dt ∂ q̇ n dt ∂ q̇ n
Z t2 X µ ¶ ¯t2
∂L d ∂L X ∂L ¯
= − δqn dt + δqn ¯¯ .
t1 n
∂qn dt ∂ q̇n n
∂ q̇n t1

Se vale δqn (t1 ) = 0 = δqn (t2 ) l’ultima sommatoria è nulla. Si conclude allora che δI = 0
per variazioni δqn arbitrarie nell’intervallo aperto (t1 , t2 ), se e solo se le qn (t) soddisfano
le equazioni di Lagrange (3.1) nell’intervallo [t1 , t2 ].

3.2 Principio di minima azione in teoria di campo

Una teoria classica di campo è descritta da un certo numero di funzioni dello spazio–tempo,
ϕr (t, ~x) ≡ ϕr (x), r = 1, · · · , N , i – campi lagrangiani – che indicheremo collettivamente
con ϕ = (ϕ1 , · · · , ϕN ). Questi campi descrivono completamente il sistema nel senso che
ogni grandezza fisica osservabile potrà esprimersi in funzione di essi, ma in generale essi
stessi non sono necessariamente osservabili. Nel caso dell’Elettrodinamica, per esempio,
i campi lagrangiani non saranno i campi elettrico e magnetico bensı̀ le componenti del
quadripotenziale, ϕ = (A0 , A1 , A2 , A3 ), legate ai primi dalla relazione (2.22). In questo
caso i campi lagrangiani non sono osservabili perché sono definiti modulo trasformazioni
di gauge, mentre le componenti del tensore F µν sono gauge invarianti e costituiscono
grandezze osservabili.
Scrivendo ϕr (t, ~x) ≡ qr,~x (t) e identificando la coppia (r, ~x) con “l’indice” n del caso
finito dimensionale, possiamo pensare l’insieme dei campi come un sistema lagrangiano
con un numero infinito di gradi di libertà. Anche in una teoria di campo cercheremo
quindi di derivare la dinamica del sistema da un principio di minima azione, a partire
da un’azione I[ϕ] che sarà ora un funzionale dei campi. In questo caso partiremo da
una densità lagrangiana L, in seguito chiamata ancora semplicemente lagrangiana, che in

69
analogia con il caso finito dimensionale sarà funzione dei campi ϕ e delle loro derivate
ϕ̇ = ∂0 ϕ. Tuttavia, se vogliamo che l’azione sia un’invariante relativistico, allora la
lagrangiana dovrà dipendere necessariamente da tutte le derivate parziali ∂µ ϕ,

L(ϕ(x), ∂ϕ(x)).

La lagrangiana L, propriamente detta, sarà allora ottenuta sommando su tutti i gradi di


libertà, ovverosia integrando la densità lagrangiana sulla coordinata spaziale ~x,
Z
L(t) = L(ϕ(x), ∂ϕ(x)) d3 x.

Definiamo, infine, l’azione della teoria di campo come,


Z t2 Z t2
I[ϕ] = L(t) dt = L(ϕ(x), ∂ϕ(x)) d4 x. (3.5)
t1 t1

Per questa azione vogliamo ora formulare un principio variazionale, analogo al principio
di minima azione per un sistema a finiti gradi di libertà. Come in quel caso supponiamo
che le funzioni ϕ(x) e L(ϕ, ∂ϕ) siano sufficientemente regolari in modo tale che la (3.4),
opportunamente generalizzata, sia ancora valida, ma oltre a questo imponiamo opportune
condizioni asintotiche su queste funzioni. Più precisamente richiediamo che all’infinito
spaziale i campi e le loro derivate si annullino con sufficiente rapidità. In particolare
avremo,
lim ϕr (t, ~x) = 0. (3.6)
|~
x|→∞

Supponiamo inoltre che la lagrangiana si annulli con sufficiente rapidità per ϕ → 0, di


modo tale che nella (3.5) l’integrale nella variabile ~x su tutto R3 esista finito.
Le equazioni analoghe alle (3.1) per la lagrangiana L sono allora le equazioni di Eulero–
Lagrange,
∂L ∂L
∂µ − = 0, (3.7)
∂(∂µ ϕr ) ∂ϕr
equazioni che vanno riguardate come le equazioni del moto dei campi. Possiamo allora
enunciare il principio variazionale per una teoria classica di campo.
Principio di minima azione in teoria di campo: le leggi orarie ϕr (t, ~x) soddisfano le
equazioni di Eulero–Lagrange nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[ϕ]

70
stazionaria per variazioni δϕr arbitrarie purché nulle agli estremi, vala a dire δϕr (t1 , ~x) =
0 = δϕr (t2 , ~x), per ogni ~x.
La stazionarietà del funzionale I[ϕ] rispetto a variazioni δϕr è definita in modo comple-
tamente analogo alla stazionarietà del funzionale I[q] rispetto a variazioni δqn , vedi (3.3)
e la discussione susseguente. È inoltre sottinteso che le variazioni δϕr che prendiamo in
considerazione hanno le stesse proprietà di regolarità e le stesse proprietà asintotiche dei
campi ϕr .
Per dimostrare il principio calcoliamo dapprima la variazione di (3.5) per variazioni
δϕr arbitrarie dei campi,
¯
d ¯
δI = I[ϕ + α δϕ]¯¯ = I[ϕ + δϕ] − I[ϕ]
dα α=0
Z t2 ³ ´
= L(ϕ + δϕ, ∂ϕ + δ∂ϕ) − L(ϕ, ∂ϕ) d4 x
t
Z 1t2 Z t2 X µ ¶
4 ∂L ∂L
= δL d x = δϕr + δ ∂µ ϕr d4 x.
t1 t1 r
∂ϕ r ∂(∂ ϕ
µ r )

Siccome per definizione abbiamo,

δ ∂µ ϕr = ∂µ (ϕr + δϕr ) − ∂µ ϕr = ∂µ δϕr ,

usando la regola di Leibnitz si ottiene,


Z t2 X µ ¶ Z t2 X µ ¶
∂L ∂L 4 ∂L
δI = − ∂µ δϕr d x + ∂µ δϕr d4 x. (3.8)
t1 r
∂ϕ r ∂(∂ ϕ
µ r ) t1 r
∂(∂ ϕ
µ r )

Il secondo integrale, il cui integrando è una quadridivergenza, è nullo. Per dimostrarlo


usiamo il teorema fondamentale del calcolo nella variabile temporale, e il teorema di Gauss
tridimensionale con una superficie chiusa Γ∞ posta all’infinito spaziale,
Z t2 X µ ¶ ¯t2 Z µZ ¶
∂L XZ ∂L ¯ X t2 ∂L
∂µ 4
δϕr d x = 3
dx ¯
δϕr ¯ + i
δϕr dΣ dt.
t1 r
∂(∂ µ ϕ r ) r
∂ ϕ̇r t 1 r t 1 Γ ∞
∂(∂ i ϕ r )

Il primo termine a secondo membro è nullo se le variazioni δϕr si annullano sugli iperpiani
t = t1 e t = t2 , mentre il secondo termine è nullo perché all’infinito spaziale i campi
svaniscono. La (3.8) si riduce allora al primo integrale, e vediamo che δI si annulla per
qualsiasi scelta delle δϕr se e solo se i campi soddisfano le equazioni di Eulero–Lagrange.

71
3.2.1 Ipersuperfici nello spazio di Minkowski

In questo paragrafo introduciamo alcune nozioni riguardanti le ipersuperfici in quattro


dimensioni, di cui ci serviremo in seguito.
Per definizione un’ipersuperficie Γ nello spazio quadridimensionale di Minkowski è un
sottoinsieme – per essere più precisi, una sottovarietà – di R4 di dimensione tre. In forma
parametrica un’ipersuperficie è descritta da quattro funzioni di tre parametri,

xµ (λ), (3.9)

dove con λ indichiamo la terna {λa }, con a = 1, 2, 3. Alternativamente essa può essere
rappresentata in forma implicita in termini di un’unica funzione scalare f (x) attraverso,

xµ ∈ Γ ⇔ f (x) = 0.

Si passa da una rappresentazione all’altra, per esempio, invertendo le funzioni spaziali


~x(λ) nella (3.9) per determinare i parametri λ(~x) come funzioni di ~x, e definendo poi,

f (x) ≡ x0 − x0 (λ(~x)).

Useremo una rappresentazione o l’altra a seconda della convenienza. Si noti comunque


che vale identicamente,
f (x(λ)) = 0. (3.10)

Una classe importante di ipersuperfici è costituita dagli iperpiani, che in forma impli-
cita sono descritti da una funzione del tipo,

f (x) = Mµ (xµ − xµ0 ) = 0, (3.11)

dove Mµ e xµ0 sono vettori costanti. L’iperpiano corrispondente a (3.11) passa per il punto
xµ0 ed è ortogonale al vettore Mµ .
Vettori tangenti e normali. In un generico punto P ≡ xµ (λ) ∈ Γ i tre vettori,
∂xµ (λ)
Vaµ ≡ , (3.12)
∂λa
costituiscono una base per lo “spazio tangente”, sicché un generico vettore tangente a Γ
in P può essere scritto come combinazione lineare di questi,
3
X
µ
V = ca Vaµ ,
a=1

72
per certi coefficienti ca . Sempre in P possiamo anche definire il “vettore normale” a Γ,
come il vettore Nµ (λ) ortogonale a tutti i vettori tangenti,

Nµ Vaµ = 0, ∀ a. (3.13)

Per come l’abbiamo definito Nµ è determinato a meno di un fattore di normalizzazione.


Differenziando l’identità (3.10) rispetto a λa si ottiene,
∂f ∂xµ ∂f µ
0= = V ,
µ
∂x ∂λ a ∂xµ a
sicchè otteniamo per Nµ la semplice espressione,
∂f
Nµ = .
∂xµ
A questo punto siamo in grado di definire i tre tipi di ipersuperficie che ci interesseranno
in seguito.
Definizione. Un’ipersuperficie Γ si dice di tipo spazio, tempo o nullo, se in ogni punto
di Γ vale rispettivamente,

N 2 > 0, N 2 < 0, N 2 = 0,

caratteristiche che sono evidentemente invarianti sotto trasformazioni di Lorentz.


Ipersuperfici di tipo spazio. Per un’ipersuperficie di tipo spazio abbiamo N 2 > 0, e di
conseguenza i vettori tangenti sono tutti di tipo spazio. Per vederlo è sufficiente sfruttare
il fatto che se N 2 > 0, allora per ogni punto P ∈ Γ esiste un sistema di riferimento in
cui il vettore normale ha la forma Nµ = (N0 , 0, 0, 0). La condizione Nµ V µ = 0 comporta
allora che in questo sistema di riferimento si ha V 0 = 0, e quindi,

V 2 < 0.

Si può inoltre far vedere che un’ipersuperficie Γ è di tipo spazio, se e solo se per ogni
coppia di punti (x, y) appartenenti a Γ vale,

(x − y)2 < 0.

Questa caratterizzazione alternativa è immediata nel caso degli iperpiani (3.11), per cui
si ha,
∂f
Nµ = = Mµ .
∂xµ
73
Infatti, se x e y appartengono a Γ e M 2 > 0, allora la (3.11) implica che,

(xµ − y µ )Mµ = 0 ⇒ (x − y)2 < 0,

ed è facile convincersi che vale anche il viceversa. Nel caso particolare in cui M µ =
(1, 0, 0, 0) otteniamo gli iperpiani a tempo costante,

f (x) = Mµ (xµ − xµ0 ) = t − t0 = 0,

che sono le particolari ipersuperfici di tipo spazio che abbiamo usato per definire l’azione
(3.5). In forma parametrica, vedi (3.9), questi iperpiani si scrivono,

x0 (λ) = t0 , xi (λ) = λi . (3.14)

Ipersuperfici di tipo tempo. Per un’ipersuperficie di tipo tempo abbiamo N 2 < 0,


ma in questo caso i vettori tangenti possono essere di tipo spazio, tempo o nullo. Se
consideriamo, per esempio, l’iperpiano con M µ = (0, 0, 0, 1) la condizione V µ Mµ = 0
dà V µ = (V 0 , V x , V y , 0), e V 2 può quindi essere positivo, negativo o nullo. Un’altra
ipersuperficie di tipo tempo è rappresentata dalla funzione,

1 2
f (x) = (~x − R2 ) = 0, Nµ = (0, ~x), N 2 = −|~x|2 < 0,
2

che corrisponde alla sfera di raggio R al variare del tempo. Per R → ∞ questa ipersu-
perficie corrisponde a una “ipersuperficie di tipo tempo all’infinito spaziale”, un tipo di
ipersuperficie che incontreremo tra poco.
L’elemento di ipersuperficie. In seguito faremo uso del teorema di Gauss in quattro
dimensioni, e quindi ci servirà l’elemento di ipersuperficie tridimensionale. Consideriamo
dunque l’integrale della quadridivergenza di un vettore W µ su un volume quadridimen-
sionale V , con bordo l’ipersuperficie Γ ≡ ∂V . Se parametrizziamo Γ come in (3.9) allora
il teorema di Gauss – che riportiamo senza dimostrazione – asserisce che,
Z Z
∂µ W d x = W µ dΣµ ,
µ 4
(3.15)
V Γ

dove l’elemento di ipersuperficie tridimensionale è dato da, vedi (3.12),

dΣµ = εµαβγ V1γ V2β V3α d3 λ.

74
Siccome vale identicamente,
³ ´
Vaµ εµαβγ V1γ V2β V3α = 0, ∀ a,

concludiamo che,
εµαβγ V1γ V2β V3α = Nµ ,

dove un’eventuale costante di normalizzazione è stata assorbita nel vettore normale Nµ .


Abbiamo quindi,
dΣµ = Nµ d3 λ.

~ = ~n dΣ.
Si noti l’analogia con la forma dell’elemento di superficie bidimensionale, dΣ
Se una falda di Γ è costituita da un’iperpiano a tempo costante, vedi (3.14), allora è
immediato vedere che su questa falda dΣµ si riduce a,

dΣ0 = d3 λ ≡ d3 x, dΣi = 0,

come c’era da aspettarsi. Il corrispondente contributo all’integrale (3.15) diventa allora,


Z ¯
0 3 ¯
¯
W d x¯ .
t=t0

3.2.2 Invarianza relativistica

Fino a questo punto non abbiamo fatto nessuna ipotesi sulle proprietà di invarianza della
teoria di campo in considerazione. In questo paragrafo analizzeremo alcune caratteristiche
importanti del principio di minima azione, nel caso particolare di una teoria di campo
relativistica.
Principio di minima azione covariante a vista. Nel caso di una teoria di campo re-
lativistica ci aspettiamo che le equazioni del moto siano covarianti a vista. A questo
proposito notiamo che se i campi sono suddivisi in multipletti tensoriali e se L è un inva-
riante relativistico, cioè, un campo scalare, allora le equazioni di Eulero–Lagrange (3.7)
sono effettivamente covarianti a vista. In una teoria relativistica richiederemo dunque che
la lagrangiana sia uno scalare sotto trasformazioni di Poincaré, vale a dire,

L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 )) = L(ϕ(x), ∂ϕ(x)), x0 = Λx + a. (3.16)

75
Possiamo allora domandarci se anche l’azione sia uno scalare – come richiesto nell’intro-
duzione a questo capitolo. In realtà dalla scrittura (3.5) emerge un’ostruzione immediata
all’invarianza di I: mentre la misura dell’integrale è invariante,

d4 x0 = |detΛ| d4 x = d4 x,

la regione d’integrazione non lo è affatto, in quanto la variabile temporale è integrata


su un intervallo finito. Tuttavia, non è difficile ovviare a questo problema. È sufficiente
sostituire nella (3.5) gli iperpiani t = t1 e t = t2 , che delimitano la regione d’integrazione
quadridimensionale, con due generiche ipersuperfici di tipo spazio Γ1 e Γ2 che non si
intersecano. Un iperpiano a tempo costante è in effetti una particolare ipersuperficie di
tipo spazio, che in seguito a una trasformazione di Poincaré non sarà più un iperpiano
a tempo costante, ma resterà pur sempre un’ipersuperficie di tipo spazio. Consideriamo
allora l’azione generalizzata,
Z Γ2
I[ϕ] = L(ϕ(x), ∂ϕ(x)) d4 x, (3.17)
Γ1

che grazie a (3.16) è ora un invariante relativistico,


Z Γ02 Z Γ2
0 0 0 0 0 0 4 0
I = L(ϕ (x ), ∂ ϕ (x )) d x = L(ϕ(x), ∂ϕ(x)) d4 x = I.
Γ01 Γ1

Possiamo allora formulare un principio di minima azione covariante a vista, richiedendo


che l’azione (3.17) sia stazionaria per variazioni δϕr arbitrarie, purché nulle su Γ1 e Γ2 .
La versione relativisticamente invariante della condizione asintotica (3.6) è invece,

lim ϕr (x) = 0. (3.18)


x2 →− ∞

È poi evidente che il principio di minima azione basato sulla (3.17) fornisce come equazioni
del moto ancora le equazioni di Eulero–Lagrange (3.7).
Quadridivergenze. Aggiungiamo ora un commento riguardo all’esistenza e all’unicità
della lagrangiana. Data L, le equazioni del moto (3.7) sono ovviamente univocamente
determinate, ma spesso si deve affrontare il problema inverso: dato un insieme di equazioni
del moto per i campi, si cerca una lagrangiana da cui esse discendano. È chiaro che per
un insieme arbitrario di equazioni del moto – seppure relativistiche – questo problema

76
in generale non ammette nessuna soluzione, nel senso che non esiste nessuna lagrangiana
per cui queste equazioni possano essere poste nella forma (3.7). D’altra parte, se una tale
lagrangiana esiste – come per tutte le teorie fisiche fondamentali – è facile vedere che in
generale essa non è unica. In particolare, se a e b sono costanti reali è immediato verificare
che le lagrangiane L e,
Lb = a L + b,

danno luogo alle stesse equazioni di Eulero–Lagrange.


Un’ambiguità un po’ meno ovvia è costituita, invece, dall’aggiunta di una quadridi-
vergenza,
Lb = L + ∂µ C µ (ϕ),

dove le C µ (ϕ) sono quattro funzioni arbitrarie dei campi, con le stesse proprietà di rego-
larità di L. Possiamo, infatti, fare vedere che Lb e L danno luogo alle stesse equazioni di
Eulero–Lagrange. A questo scopo calcoliamo la differenza tra le azioni associate alle due
lagrangiane, e applichiamo il teorema di Gauss quadridimensionale,
Z Γ2 Z Γ2 Z Γ2 Z
Ib − I = Lb d4 x − 4
Ld x = µ 4
∂µ C d x = C µ dΣµ .
Γ1 Γ1 Γ1 ∂V4

V4 indica il volume di integrazione quadridimensionale il cui bordo è composto da Γ1 e Γ2 ,


e da un’ipersuperficie di tipo tempo posta all’infinito spaziale, Γ∞ , si veda il paragrafo
precedente. Si ha allora,
Z Z Z
Ib − I = µ
C dΣµ − µ
C dΣµ + C µ dΣµ .
Γ2 Γ1 Γ∞

L’integrale su Γ∞ è nullo per via della condizione asintotica (3.18). Viceversa, i primi due
integrali sono diversi da zero, ma coinvolgono solo i valori dei campi sulle ipersuperfici Γ1
e Γ2 , che nel principio di minima azione sono tenuti fissi. Abbiamo quindi δ(Ib − I) = 0,
cioè,
δ Ib = δI,

e le due azioni danno quindi luogo alle medesime equazioni di Eulero–Lagrange. In con-
clusione possiamo affermare che tutte le lagrangiane che differiscono per una quadridiver-
genza sono fisicamente equivalenti.

77
Località. Concludiamo questo paragrafo con un’ulteriore restrizione sul tipo di lagran-
giane che ammetteremo in una teoria relativistica di campo. Alla richesta di invarianza
relativistica aggiungeremo, infatti, quella di località, analoga alla richiesta di “azione a con-
tatto” tra particelle e campi, discussa nell’introduzione a questo capitolo. Nel caso di una
teoria di campo la località richiede che la lagrangiana sia data da una somma di prodotti
dei campi e delle loro derivate prime, valutati nello stesso punto dello spazio–tempo.
Illustriamo questa richiesta nel caso di una teoria di campo con due campi scala-
ri, ϕ1 (x) ≡ A(x), e ϕ2 (x) ≡ B(x). In questo caso ammetteremo, per esempio, una
lagrangiana del tipo,

1 1
L1 = ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − g A2 (x) B 2 (x), (3.19)
2 2

mentre non accetteremo la lagrangiana,


Z
1 1
L2 = ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − gN A2 (x) [(x − y)2 ]N B 2 (y) d4 y,
2 2
(3.20)

dove gN è una “costante di accoppiamento” reale, e N è un intero positivo. Infatti, mentre


in L1 il campo A(x) è “in contatto” con il campo B valutato nello stesso punto x, in L2
il campo A(x) è in contatto con B(y) per un qualsiasi valore di y. Dal punto di vista
delle equazioni di Eulero–Lagrange questo vorrebbe dire che la dinamica di A nel punto
x è influenzata dai valori di B in tutti i punti dello spazio, in contrasto con la “località”
dell’interazione.
Ribadiamo, comunque, che la lagrangiana L2 è uno scalare sotto trasformazioni di
Poincaré, e che darebbe dunque luogo a equazioni del moto relativistiche ben definite.
Sussiste, tuttavia, un ulteriore motivo che ci porta a rigettare lagrangiane come queste. Il
fatto è che lagrangiane come (3.20) non hanno carattere “fondamentale”: l’intero N che
ivi compare è completamente arbitrario, anzi, potremmo sostituire il fattore gN [(x − y)2 ]N
con una qualsiasi funzione f (x, y) invariante sotto il gruppo di Poincaré. Sviluppata in
serie di Taylor una tale funzione ha la forma generale,

X
f (x, y) = gN [(x − y)2 ]N ,
N =0

78
ed essa introdurrebbe quindi un numero infinito di costanti di accoppiamento gN inde-
terminate. Per mantenere il carattere predittivo della teoria la forma della f , ovvero il
valore delle costanti gN , dovrebbe allora essere dedotta da una teoria “più fondamentale”.
Lagrangiane del tipo L2 rappresentano infatti tipicamente teorie effettive, vale a dire teo-
rie approssimate che riproducono correttamente i risultati sperimentali solo in particolari
regimi fisici, per esempio a basse o ad alte energie.
Consistenza quantistica. Le restrizioni più forti sulla scelta delle lagrangiane relativi-
stiche permesse provengono, tuttavia, dall’approccio della teoria quantistica relativistica
di campo. Nell’ambito di questo approccio si dimostra, infatti, che le lagrangiane classiche
che a livello quantistico danno luogo a teorie consistenti devono essere:
a) invarianti sotto trasformazioni di Poincaré,
b) locali,
c) polinomi nei campi e nelle loro derivate, di ordine massimo quattro.
Queste restrizioni limitano di molto la forma delle lagrangiane permesse, e insieme ad
altre richeste di invarianza spesso permettono di determinarle univocamente. Esempi ne
sono le lagrangiane “fondamentali” che descrivono le interazioni elettrodeboli e quelle forti.
Al contrario, la lagrangiana che nell’ambito della Relatività Generale descrive l’interazione
gravitazionale soddisfa le richiesta a) e b) ma non la c) – la causa essendo la complicata
autointerazione del campo gravitazionale. È questo il motivo per cui, con le conoscenze
che abbiamo acquisito fino ad oggi, questa interazione appare tuttora in conflitto con le
leggi della Meccanica Quantistica.

3.2.3 La lagrangiana per l’equazione di Maxwell

In questo paragrafo illustriamo il metodo variazionale derivando le equazioni che gover-


nano la dinamica del campo elettromagnetico da un principio di minima azione. In linea
di principio si tratta quindi di ottenere le equazioni (2.13) e (2.14) come equazioni di
Eulero–Lagrange relative ad un’opportuna lagrangiana. La prima questione da affrontare
riguarda allora la scelta dei campi lagrangiani ϕr . Siccome le (2.13), (2.14) corrispon-
dono a otto equazioni dovremmo avere altrettanti campi lagrangiani. La scelta naturale
ϕr ≡ F µν – che tra l’altro avrebbe il pregio di introdurre solo campi osservabili – è dunque

79
esclusa, perché il tensore di Maxwell corrisponde non a otto ma solo a sei campi indipen-
~ e B.
denti, vale a dire E ~ Questa strada risulta quindi impraticabile, si veda in particolare

il problema 3.9, e dobbiamo cercarne un’altra.


Una strategia alternativa consiste nel procedere come anticipato nei paragrafi 2.2.2 e
2.2.3. Risolviamo, cioè, l’identità di Bianchi attraverso,

Fµν ≡ ∂µ Aν − ∂ν Aµ ,

e consideriamo come campi lagrangiani le componenti del quadripotenziale,

ϕr = Aµ , (3.21)

r = µ = (0, 1, 2, 3). Secondo questa strategia il principio di minima azione dovrebbe allora
dare luogo alle equazioni di Maxwell,

∂µ F µν − j ν = 0, (3.22)

come equazioni di Eulero–Lagrange associate a un’opportuna lagrangiana L. Si noti che


la scelta dei campi lagrangiani (3.21) è ora consistente con il fatto che le equazioni (3.22)
sono quattro in numero.
Il problema si riduce allora a trovare una lagrangiana L(A, ∂A), polinomiale in A e
∂A, tale che le equazioni di Eulero–Lagrange ad essa associate,

∂L ∂L
∂µ − = 0, (3.23)
∂(∂µ Aν ) ∂Aν

equivalgano alle (3.22). La lagrangiana che cerchiamo dovrà essere certamente un in-
variante relativistico, ma dato che abbiamo risolto l’identità di Bianchi introducendo il
potenziale vettore, essa dovrà essere altresı̀ invariante per trasformazioni di gauge,

A0µ = Aµ + ∂µ Λ,

modulo quadridivergenze. Per quanto riguarda, invece, la corrente assumeremo solo che
essa sia conservata, ∂µ j µ = 0, e che non dipenda da Aµ . Per individuare lo scalare L pro-
cediamo in modo euristico, sfruttando la struttura della (3.22). Il primo termine di questa
equazione è lineare in Aµ , mentre il secondo ne è indipendente. Corrispondentemente la

80
lagrangiana dovrà contenere un termine quadratico in Aµ , L1 , e uno lineare in Aµ , L2 .
Considerata poi la forma particolare dei due termini nella (3.22) L1 dovrà contenere due
derivate, mentre L2 dovrà esserne privo.
Cerchiamo ora di determinare L1 . Questo termine deve contenere le derivate del
quadripotenziale. L’invarianza di gauge impone allora che esso dipende da Aµ solo attra-
verso il campo gauge–invariante F µν , e in definitiva L1 deve allora essere quadratico in
quest’ultimo. In effetti abbiamo due invarianti quadratici a disposizione,

F µν Fµν e εµνρσ Fµν Fρσ .

Tuttavia, grazie all’identità di Bianchi il secondo invariante corrisponde a una quadridi-


vergenza,

εµνρσ Fµν Fρσ = 2 εµνρσ ∂µ Aν Fρσ = 2∂µ ( εµνρσ Aν Fρσ ) − 2Aν ( εµνρσ ∂µ Fρσ )

= 2∂µ ( εµνρσ Aν Fρσ ) . (3.24)

12
Esso dà quindi un contributo irrilevante alla lagrangiana . Possiamo quindi concludere
che L1 è proporzionale a F µν Fµν .
Consideriamo ora L2 . Questo termine deve essere lineare in Aµ e coinvolgere la corrente
jµ . L’unico scalare che possiamo formare con queste quantità è L2 ∝ Aµ j µ . Verifichiamone
l’invarianza di gauge,

A0µ j µ = Aµ j µ + ∂µ Λj µ = Aµ j µ + ∂µ (Λj µ ) − Λ ∂µ j µ .

Siccome la corrente è conservata vediamo che L2 è in effetti gauge invariante – modulo


una quadridivergenza.
Per ottenere l’equazione di Maxwell con i coefficienti corretti poniamo,
1
L = L1 + L2 = − F µν Fµν − j ν Aν . (3.25)
4
Verifichiamo ora che con questa scelta per L le equazioni (3.23) corrispondono proprio
∂L
all’equazione di Maxwell. Al termine ∂Aν
contribuisce solo L2 ,
∂L
= −j ν ,
∂Aν
12
Il termine εµνρσ Fµν Fρσ in realtà è uno pseudoscalare e, anche se non fosse una quadridivergenza,
contribuirebbe all’equazione del moto con un termine pseudovettoriale, mentre l’equazione di Maxwell è
vettoriale.

81
∂L
mentre alla derivata ∂(∂µ Aν )
contribuisce solo L1 . Per determinarla è conveniente calcolare
la variazione di L1 per una variazione infinitesima di ∂A,
1 1
δL1 = − F µν δFµν = − F µν (δ∂µ Aν − δ∂ν Aµ ) = −F µν δ(∂µ Aν ),
2 2
e quindi,
∂L
= −F µν . (3.26)
∂(∂µ Aν )
In definitiva otteniamo,
∂L ∂L
∂µ − = −∂µ F µν + j ν = 0, (3.27)
∂(∂µ Aν ) ∂Aν
che è l’equazione di Maxwell.
Il ruolo del potenziale vettore. Concludiamo questa deduzione con un commento sul
ruolo del potenziale vettore in Elettrodinamica, classica e quantistica. Intanto insistiamo
sul fatto che a livello classico l’equazione di Maxwell e l’identità di Bianchi di per sé
possono essere formulate, e risolte, senza mai introdurre il potenziale vettore, in quanto
quest’ultimo costituisce solo un ausilio “utile”. Al contrario, se vogliamo far discende-
re queste equazioni da un principio variazionale allora – come abbiamo appena visto –
l’introduzione del potenziale vettore risulta indispensabile. Ma il principio variazionale
costituisce, a sua volta, il punto di partenza irrinunciabile per la quantizzazione di una
qualsiasi teoria: concludiamo cosı̀ che, mentre a livello classico l’uso del potenziale vetto-
re è un “optional”, a livello quantistico la sua introduzione è inevitabile. Considerazioni
completamente analoghe valgono per il ruolo dei potenziali vettore nelle altre interazioni
fondamentali.
Sui mediatori delle interazioni deboli e forti. Chiudiamo questo paragrafo con un com-
mento sulla struttura della lagrangiana (3.25) nel caso particolare di corrente nulla, j µ = 0.
In questo caso l’equazione (3.22) descrive il campo di Maxwell nel vuoto, disaccoppiato
da qualsiasi carica, ovvero un campo “libero”. La lagrangiana,
1
L1 = − F µν Fµν ,
4
descrive quindi un campo di gauge libero. Come abbiamo visto la struttura di questa
lagrangiana è essenzialmente determinata dai principi di invarianza relativistica e di inva-
rianza di gauge. Non stupisce allora che anche la propagazione libera dei mediatori delle

82
interazioni deboli e forti, che sono soggette agli stessi principi, sia descritta da lagrangiane
completamente analoghe. Ai mediatori delle interazioni deboli Z 0 e W ± sono associati ri-
spettivamente il campo di gauge reale Zµ0 , e i campi di gauge complessi Wµ± = (W1µ ±i W2µ ),
con i corrispondenti tensori di Maxwell,
0
Fµν = ∂µ Zν0 − ∂ν Zµ0 , ±
Fµν = ∂µ Wν± − ∂ν Wµ± ,

mentre agli otto mediatori delle interazioni forti sono associati i campi gluonici AIµ , I =
1, · · · , 8, con i relativi tensori di Maxwell,
I
Fµν = ∂µ AIν − ∂ν AIµ .

La lagrangiana totale che descrive la propagazione libera di tutti questi campi risulta
allora, Ã !
8
X
1
L0 = − F µν Fµν + F 0µν F 0 µν + F +µν F − µν + F Iµν F I µν .
4 I=1
La lagrangiana “libera” L1 dà luogo alle equazioni di Maxwell nel vuoto ∂µ F µν = 0, le
cui soluzioni sono onde (elettromagnetiche), che si propagano con la velocità della luce. Di
conseguenza i mediatori associati hanno massa nulla. Ma mentre i fotoni e i gluoni sono
effettivamente particelle prive di massa, i mediatori delle interazioni deboli sono in realtà
massivi. La lagrangiana L0 andrà allora completata con l’aggiunta di un termine Lm ,
dipendente solo da Wµ± e Zµ0 , che tenga conto delle masse mW e mZ di queste particelle.
Si può vedere che questo termine deve essere dato da, vedi anche il problema 3.1,
1 ¡ 2 ¢
Lm = 2
mW Wµ+ W −µ + m2Z Zµ0 Z 0µ , (3.28)
2~
dove la presenza della costante di Planck ~ è suggerita da motivi dimensionali. D’al-
tra parte si verifica immediatamente che l’espressione in (3.28) non è invariante sotto le
trasformazioni di gauge,

Wµ± → Wµ± + ∂µ Λ± , Zµ0 → Zµ0 + ∂µ Λ0 ,

e anche la lagrangiana totale L0 +Lm romperebbe quindi questa invarianza. Per quello che
concerne le interazioni deboli si può, tuttavia, vedere che questa rottura della simmetria
non inficia la consistenza della teoria, se essa avviene in modo “spontaneo”. Per maggiori
dettagli su questo argomento e per la giustificazione della (3.28) rimandiamo a un testo
di particelle elementari.

83
3.3 Il Teorema di Noether

Il Teorema di Noether asserisce in generale che a ogni gruppo a un parametro di simmetrie


di una teoria fisica, corrisponde una costante del moto, cioè, una quantità conservata.
A titolo di esempio ricordiamo che in una teoria invariante per traslazioni temporali si
conserva l’energia, mentre se essa è invariante per rotazioni spaziali si conserva il momento
angolare.
Prima di proseguire specifichiamo meglio cosa intendiamo con “invarianza di una
teoria”, nel contesto del teorema di Noether. In primo luogo si potrebbe intendere
l’invarianza delle equazioni del moto che governano la dinamica della teoria, sotto l’azio-
ne del gruppo di simmetria. Tuttavia vedremo che questa richiesta risulta genericamente
troppo debole, perché l’invarianza delle equazioni del moto in generale non è sufficiente
per garantire la presenza di costanti del moto. Il teorema di Noether si basa, infatti, sulle
ipotesi più restrittive che,
1) le equazioni del moto discendano da un principio variazionale,
2) l’azione associata sia invariante sotto il gruppo di simmetrie.
Come abbiamo visto in teoria di campo l’azione è data a sua volta in termini di una
lagrangiana,
Z
I= L d4 x.

Per le teorie di campo considerate da noi l’invarianza dell’azione sarà poi sempre conse-
13
guenza dell’invarianza della misura d’integrazione e, separatamente, della lagrangiana
– modulo quadridivergenze .
Un’altro aspetto importante, peculiare del teorema di Noether in teoria di campo, è
che esso assicura la conservazione locale della grandezza fisica in questione. Questo vuol
dire che si conserva non solo una “carica” totale, ma che la conservazione è conseguenza
di un’equazione di continuità. Per ogni gruppo di simmetrie a un parametro il teorema
implica, cioè, l’esistenza di una quadricorrente J µ a divergenza nulla,

∂µ J µ = 0.
13
Nel caso di “simmetrie interne” per definizione le coordinate non cambiano, x0µ = xµ ⇒ d4 x0 = d4 x.
Per trasformazioni di Poincaré, invece, abbiamo x0µ = Λµ ν xν + aµ ⇒ d4 x0 = d4 x |det Λ| = d4 x.

84
R
Come visto questo assicura che la variazione della carica QV = V
J 0 d3 x in un volume V ,
è necessariamente accompagnata da un flusso di carica attraverso il suo bordo,
Z
dQV
=− J~ · dΣ.
~
dt ∂V

Non è, cioè, possibile che la carica scompaia in un punto e compaia in un altro punto,
senza “fluire” da un punto all’altro.
In Teoria dei Campi esiste una dimostrazione generale e semplice del teorema di Noe-
ther per le cosiddette “simmetrie interne”, cioè, per simmetrie che non coinvolgono trasfor-
mazioni dello spazio–tempo, come per esempio le trasformazioni di gauge. Al contrario,
il gruppo di Poincaré origina proprio da trasformazioni dello spazio–tempo, e per questo
gruppo di simmetrie la dimostrazione del teorema è leggermente più complicata. Tuttavia,
date l’importanza concettuale e la rilevanza fenomenologica che esso ricopre, in questa
sezione dimostreremo il teorema di Noether per il gruppo di Poincaré in una generica teo-
ria di campo relativistica. Il sottogruppo delle traslazioni costituisce un gruppo a quattro
parametri a cui corrisponderanno quattro grandezze conservate, che identificheremo con
il quadrimomento totale, mentre il sottogruppo di Lorentz costituisce un gruppo a sei
parametri a cui corrisponderanno altrettante grandezze conservate, che identificheremo
con il momento angolare quadridimensionale totale del sistema.

3.3.1 Trasformazioni di Poincaré infinitesime

Per dimostrare il teorema di Noether sfrutteremo in particolare l’invarianza della lagran-


giana sotto trasformazioni di Poincaré infinitesime. In questo paragrafo determineremo
preliminarmente le variazioni dei campi sotto trasformazioni “infinitesime” – vale a dire
trasformazioni valutate al primo ordine nei parametri ω µν e aµ – la cui forma esplicita ci
servirà poi nella dimostrazione del teorema.
Finora abbiamo indicato l’insieme dei campi lagrangiani genericamente con ϕ =
(ϕ1 , · · · , ϕN ). In una teoria relativistica i singoli campi devono essere raggruppati in
“multipletti” che costituiscono tensori sotto trasformazioni di Poincaré, per esempio cam-
pi scalari Φ(x), campi vettoriali Aµ (x), campi tensoriali di rango due B µν (x), etc. È ovvio
che possiamo avere anche più campi dello stesso rango. L’indice r dell’insieme {ϕr }N
r=1

indica allora tutte le componenti di tutti i multipletti.

85
Incominciamo ricordando la forma di una generica trasformazione di Poincaré delle
coordinate,
x0µ = Λµ ν xν + aµ , (3.29)

dove la matrice di Lorentz è data da, vedi paragrafo 1.4.1,


µ
Λµ ν = eω ν , ω µν = −ω νµ . (3.30)

Sotto questa trasformazione i singoli campi trasformano a seconda del loro rango tenso-
riale,

Φ0 (x0 ) = Φ(x), A0µ (x0 ) = Λµ ν Aν (x), B 0µν (x0 ) = Λµ α Λν β B αβ (x), (3.31)

e cosı̀ via. Possiamo indicare queste trasformazioni complessivamente con,

ϕ0r (x0 ) = Mr s ϕs (x), (3.32)

per una qualche matrice N × N Mr s , indipendente da x. Si noti in particolare che queste


trasformazioni sono lineari nei campi ϕr .
Possiamo allora definire due tipi di variazioni – per il momento finite – dei campi: le
variazioni totali δϕr , e le variazioni in forma δϕr ,

δϕr ≡ ϕ0r (x0 ) − ϕr (x) (3.33)

δϕr ≡ ϕ0r (x) − ϕr (x). (3.34)

Passiamo ora alla valutazione di queste variazioni per trasformazioni di Poincaré infinite-
sime. Queste ultime corrispondono a trasformazioni di Lorentz infinitesime,

Λµ ν = δ µ ν + ω µ ν ,

e a traslazioni infinitesime. Per le coordinate otteniamo le trasformazioni infinitesime,

δxµ = x0µ − xµ = (δ µ ν + ω µ ν )xν + aµ − xµ = aµ + ω µ ν xν . (3.35)

Usando le (3.31) troviamo allora le seguenti trasformazioni totali infinitesime, intese al


primo ordine in ω αβ e aµ ,

δΦ = Φ0 (x0 ) − Φ(x) = 0,

δAµ = (δ µ ν + ω µ ν )Aν (x) − Aµ (x) = ω µ ν Aν (x),

δB µν = (δ µ α + ω µ α )(δ ν β + ω ν β )B αβ (x) − B µν (x) = ω µ α B αν (x) + ω ν β B µβ (x),

86
e cosı̀ via. Da questi esempi si capisce che le generiche variazioni δϕr sono lineari nei
parametri ω µν e nei campi stessi, si veda anche la (3.32). Possiamo allora scrivere la
formula generale,
1
δϕr = ωαβ Σαβ r s ϕs , (3.36)
2
dove le quantità Σαβ r s sono antisimmetriche in α e β 14
,

Σαβ r s = −Σβα r s ,

e la sommatoria su s è sottintesa. Le espressioni esplicite di queste quantità si leggono


facilmente dalle trasformazioni infinitesime totali dei campi calcolate sopra. Per esempio,
per il campo scalare Φ si ha semplicemente Σαβ 1 1 = 0, mentre per il campo vettoriale
Aµ ≡ ϕr si ha,
Σαβ r s = δrα η βs − δrβ η αs . (3.37)

Calcoliamo ora la versione infinitesima delle variazioni in forma. Aggiungendo e to-


gliendo nella (3.34) lo stesso termine e usando la (3.36), al primo ordine in ω αβ e aµ si
ottiene,

δϕr = ϕ0r (x) − ϕ0r (x0 ) + ϕ0r (x0 ) − ϕr (x)

= ϕ0r (x) − ϕ0r (x + δx) + δϕr

= −δxν ∂ν ϕ0r + δϕr = −δxν ∂ν ϕr + δϕr


1
= −δxν ∂ν ϕr + ωαβ Σαβ r s ϕs , (3.38)
2
dove nella penultima riga abbiamo tenuto conto che la differenza tra ϕr e ϕ0r è del primo
ordine in ω αβ e aµ .

3.3.2 Teorema di Noether per il gruppo di Poincaré

In una teoria di campo classica il teorema di Noether riferito al gruppo di Poincaré si


enuncia come segue.
Teorema di Noether. Si consideri una teoria di campo la cui dinamica discenda dall’a-
zione,
Z
I= d4 x L,

14
Nella (3.36) gli indici α e β di Σαβ r s sono contratti con la coppia antisimmetrica di ωαβ ; ciò implica
che comunque solo la parte antisimmetrica in α e β di Σαβ r s contribuisce a ωαβ Σαβ r s .

87
per un’opportuna lagrangiana L, ovvero, una teoria di campo le cui equazioni del moto
siano date dalla (3.7). Allora, se L è invariante per traslazioni si conserva localmente
il quadrimomento, il tensore energia–impulso essendo dato dalla (3.44), mentre se L è
invariante per trasformazioni di Lorentz, allora si conserva localmente il momento angolare
quadridimensionale, il tensore densità di momento angolare essendo dato dalla (3.45).
Queste leggi di conservazione sono valide purché i campi soddisfino le equazioni di Eulero–
Lagrange (3.7).
Per comprendere meglio il significato dell’invarianza per traslazioni di L consideriamo
una classe di lagrangiane leggermente più ampia di quella considerata finora, del tipo,

L(ϕ(x), ∂ϕ(x), x), (3.39)

dove ammettiamo, cioè, che L abbia anche una generica dipendenza esplicita da x. Per
una traslazione, x0 = x + a, abbiamo ϕ0r (x0 ) = ϕr (x), e per la lagrangiana traslata si
ottiene allora,
L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) = L(ϕ(x), ∂ϕ(x), x + a),

che uguaglia L(ϕ(x), ∂ϕ(x), x) solo se L non dipende esplicitamente da x. Possiamo quindi
affermare che una lagrangiana è invariante per traslazioni se e sole se essa non esibisce
dipendenza esplicita da x.
Dimostrazione. Il primo passo nella dimostrazione del teorema di Noether consiste nel
valutare la variazione della lagrangiana per un’arbitraria trasformazione finita di Poincaré
dei campi, vedi (3.29) e (3.31),

∆L ≡ L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ(x), ∂ϕ(x), x). (3.40)

Per ogni x fissato questa espressione è una funzione dei parametri ω αβ e aµ , e come tale
può essere sviluppata in serie di Taylor attorno ai valori ω αβ = 0 = aµ . Siccome ∆L si
annulla per valori nulli dei parametri, otteniamo uno sviluppo del tipo,

∆L = δL + o(ω αβ , aµ )2 ,

dove con δL, la “variazione infinitesima della lagrangiana”, abbiamo indicato i termi-
ni di ∆L lineari in ω αβ e aµ . Se L è invariante sotto l’azione del gruppo di Poincaré

88
avremo ∆L = 0 identicamente, ovvero ∀ ω αβ , ∀ aµ , e per il teorema sull’identità delle
serie di potenze ne seguirà che δL = 0, ∀ ω αβ , ∀ aµ . Sfruttando quest’ultima identità e
assumendo la validità delle equazioni di Eulero–Lagrange potremo poi concludere che le
quadridivergenze di certi tensori sono nulli.
Secondo questa strategia dobbiamo dunque trovare un’espressione esplicita per δL. A
questo scopo è conveniente aggiungere e togliere a ∆L lo stesso termine, e valutare poi
l’espressione risultante tenendo solo i termini lineari nei parametri,

δL = [L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ0 (x), ∂ϕ0 (x), x)]lin

+ [L(ϕ0 (x), ∂ϕ0 (x), x) − L(ϕ(x), ∂ϕ(x), x)]lin .

I due termini della prima parentesi quadra differiscono solo per la sostituzione x → x0 =
x + δx, mentre nella seconda parentesi quadra i campi differiscono per la variazione in
forma (3.34). Tenendo conto che ∂µ δxµ = ηµν ω µν = 0, vedi (3.35), e definendo i “momenti
coniugati”,
∂L
Πµr = , (3.41)
∂(∂µ ϕr )
si ottiene allora,

∂L
δL = δxµ ∂µ L + δϕr + ∂µ δϕr Πµr
∂ϕr
µ ¶
µ δL µr
= ∂µ (δx L) + δϕr − ∂µ Π + ∂µ (δϕr Πµr )
∂ϕr
µ ¶
µ µr δL µr
= ∂µ [δx L + δϕr Π ] + δϕr − ∂µ Π , (3.42)
∂ϕr

dove la sommatoria su r è sottintesa. Valutiamo ora il termine tra parentesi quadre in


(3.42), usando la formula (3.38) per la variazione infinitesima dei campi,

1 µr
δxµ L + δϕr Πµr = δxν (η µν L − Πµr ∂ ν ϕr ) + Π ωαβ Σαβ r s ϕs . (3.43)
2

Prima di procedere definiamo il tensore energia–impulso canonico,

Teµν = Πµr ∂ ν ϕr − η µν L, (3.44)

e il tensore densità di momento angolare canonico,

fµαβ = xα Teµβ − xβ Teµα + Πµr Σαβ r s ϕs ,


M fµαβ = −M
M fµβα . (3.45)

89
Usando queste definizioni e la (3.35), la (3.43) diventa,

1
δxµ L + δϕr Πµr = −(aν + ωνρ xρ )Teµν + Πµr ωαβ Σαβ r s ϕs
2
1
= −aν Te + ωαβ M
µν f .µαβ
(3.46)
2

Per la variazione di L sotto una generica trasformazione di Poincaré infinitesima otteniamo


cosı̀ il seguente risultato,
µ ¶
eµν 1 fµαβ + δϕr δL µr
δL = −aν ∂µ T + ωαβ ∂µ M − ∂µ Π . (3.47)
2 ∂ϕr

Supponiamo ora, per esempio, che la lagrangiana sia invariante per il sottogruppo a
un parametro del gruppo di Poincaré costituito dalle traslazioni nel tempo,

t0 = t + a0 , ~x 0 = ~x.

Come visto sopra questo equivale all’assunzione che in L sia assente la dipendenza esplicita
da t. Allora abbiamo,

δL = 0, per ai = 0 = ωαβ , a0 arbitrario.

Se in più imponiamo che i campi soddisfino le equazioni di Eulero–Lagrange,

δL
∂µ Πµr − = 0,
∂ϕr

si ricordi la definizione (3.41), allora dalla (3.47) si ricava,

0 = −a0 ∂µ Teµ0 = 0, ∀ a0 ⇒ ∂µ Teµ0 = 0.

Abbiamo cosı̀ ottenuto l’equazione di continuità per l’energia, che assicura che l’energia
è localmente conservata.
Allo stesso modo dalla (3.47) segue che a ciascuno dei dieci parametri (aµ , ωαβ ) cor-
risponde una corrente a quadridivergenza nulla e una grandezza localmente conservata,
se la lagrangiana è invariante sotto il corrispondente gruppo a un paramentro: ad a0
(traslazioni del tempo) corrisponde la conservazione locale dell’energia, ad a1 (traslazioni
lungo l’asse x) quella della componente x della quantità di moto, ad ω12 (rotazioni attor-
no all’asse z) quella della componente z del momento angolare, ad ω01 (trasformazioni di

90
Lorentz speciali lungo l’asse x) quella della componente x del boost, e via di seguito. In
partciolare se la lagrangiana è invariante sotto l’intero gruppo delle traslazioni si conserva
localmente il quadrimomento, mentre se essa è invariante sotto l’intero gruppo di Loren-
tz allora si conserva localmente il momento angolare quadridimensionale. Abbiamo cosı̀
concluso la dimostrazione del teorema.
In particolare se L è invariante sotto l’intero gruppo di Poincaré, dalla (3.47) ottenia-
mo,
1
−aν ∂µ Teµν + ωαβ ∂µ M
fµαβ = 0, ∀ aµ , ∀ ω αβ ,
2
e quindi,
∂µ Teµν = 0, fµαβ = 0.
∂µ M

In questo caso abbiamo dieci costanti del moto, raggruppate nel quadrimomento e nel
momento angolare quadridimensionale,
Z Z
P = Te0µ d3 x,
e µ eαβ =
L f0αβ d3 x.
M

Insistiamo sul fatto che queste leggi di conservazione sono valide purché i campi soddisfino
le equazioni del moto di Eulero–Lagrange.
Per illustrare la portata di questo teorema nominiamo il fatto che le teorie che descri-
vono le quattro interazioni fondamentali soddisfano il principio di relatività einsteiniana,
e che sono formulate in termini di un principio variazionale: in queste teorie il teorema di
Noether assicura allora che la conservazione del quadrimomento e del momento angolare
è automatica.
Sulle densità di corrente canoniche. Concludiamo questo paragrafo con qualche osser-
vazione sulla struttura delle correnti conservate trovate. Come prima cosa notiamo che
il tensore energia–impulso canonico (3.44) in generale non è simmetrico. In Relatività
Ristretta questa circostanza di per sé non costituisce nessun problema. Viceversa, si può
vedere che l’esistenza di un tensore energia–impulso simmetrico è una richiesta irrinun-
ciabile, se si vuole accoppiare una teoria di campo alla gravità secondo i postulati della
15
Relatività Generale . Come seconda cosa facciamo notare che l’espressione (3.45) per
15
Le equazioni di Einstein eguagliano, infatti, un opportuno tensore doppio simmetrico, formato
con la metrica gµν (x) e le sue derivate, al tensore energia–impulso; queste equazioni sarebbero quindi
inconsistenti se quest’ultimo non fosse simmetrico.

91
la densità di momento angolare canonico non è “standard”, nel senso che non è della
semplice forma standard xα Teµβ − xβ Teµα . In realtà queste due “anomalie” sono legate tra
di loro. Infatti, la divergenza della densità di momento angolare standard non si annulla,
uguagliando proprio la parte antisimmetrica del tensore energia–impulso canonico,
³ ´
∂µ xα Teµβ − xβ Teµα = Teαβ − Teβα .

fµαβ si riduce alla forma standard xα Teµβ −


D’altra parte dalla (3.45) si vede che il tensore M
xβ Teµα , solo se le quantità Σαβ r s svaniscono, ma questo succede solo se i campi della teoria
sono tutti campi scalari. In quest’ultimo caso, d’altro canto, non è difficile dimostrare che
Teµν è in effetti simmetrico, vedi problema 3.6.
Concludiamo che, per quanto riguarda la densità di momento angolare la “anomalia”
appena discussa non costituisce un problema di tipo concettuale, ma solo di naturalez-
za, mentre per quanto riguarda il tensore energia–impulso sorgerebbe un problema di
incompatibilità con l’interazione gravitazionale, se non fosse possibile trovare un tensore
energia–impulso simmetrico. Questo problema verrà affrontato e risolto in tutta generalità
nelle sezioni 3.4 e 3.5.

3.3.3 Tensore energia–impulso canonico per il campo di Maxwell

In questo paragrafo esemplifichiamo la costruzione generale del tensore energia–impulso


canonico (3.44), nel caso semplice di un campo di Maxwell libero, j µ = 0. La dinamica
di questo campo è governata dalla lagrangiana, vedi (3.25),

1
L1 = − F µν Fµν , (3.48)
4

con ϕr ≡ Aα . Ricordiamo la forma dei momenti coniugati, determinati in (3.26),

∂L1
Πµα = = −F µα . (3.49)
∂(∂µ Aα )

Il tensore energia–impulso canonico discende allora direttamente dalla (3.44),

1
Teem
µν
= −F µα ∂ ν Aα + η µν F αβ Fαβ . (3.50)
4

Notiamo che questo tensore soffre di due patologie: non é simmetrico, e non è nemmeno
gauge–invariante. Affronteremo questi problemi nel paragrafo 3.4.1.

92
3.4 Costruzione di un tensore energia–impulso simmetrico

In questa sezione faremo vedere che in una teoria di campo lagrangiana invariante sot-
to trasformazioni di Poincaré, è sempre possibile costruire un tensore energia–impulso
simmetrico, la costruzione essendo canonica.
A questo proposito notiamo che il tensore energia–impulso di una teoria in realtà non
è definito univocamente. Consideriamo, infatti, un generico tensore di rango tre φρµν che
sia antisimmetrico nei primi due indici,

φρµν = −φµρν .

Possiamo allora definire un tensore energia–impulso modificato attraverso,

T µν = Teµν + ∂ρ φρµν . (3.51)

Questo tensore gode, infatti, delle seguenti due proprietà:


1) ∂µ T µν = 0,
R
2) P ν ≡ T 0ν d3 x = Peν .
T µν è dunque conservato, come lo è Teµν , ed esso dà luogo allo stesso quadrimomento
totale di Teµν . La prima proprietà discende dal fatto che,

∂µ ∂ρ φρµν = 0,

in quanto una coppia di indici antisimmmetrici contrae una coppia di indici simmetrici.
La seconda segue invece da,
Z ³ ´ Z Z Z
ν e
P −P = ν 0ν
T −T e0ν 3 ρ0ν 3 i0ν 3
d x = ∂ρ φ d x = ∂i φ d x = φi0ν dΣi = 0, (3.52)
Γ∞

dove abbiamo usato che φ00ν = 0, come conseguenza dell’antisimmetria di φρµν nei primi
due indici. Nell’ultimo passaggio abbiamo applicato il teorema di Gauss, con Γ∞ su-
perficie all’infinito spaziale, e abbiamo inoltre supposto che φρµν decada all’infinito più
rapidamente di 1/r2 . La proprietà 2) assicura in particolare che l’hamiltoniana del siste-
ma, rappresentata dalla componente P 0 , non dipende dal tensore energia–impulso che si
considera. T µν può dunque essere riguardato come tensore energia–impulso della teoria –
alla stessa stregua di Teµν . Sfruttando questa libertà di scelta dimostreremo ora il seguente
teorema.

93
Teorema. Sia data una lagrangiana invariante sotto l’azione del gruppo di Poincaré.
Allora si può costruire un tensore φρµν antisimmetrico in ρ e µ, tale che il tensore energia–
impulso T µν dato in (3.51) risulti simmetrico, la costruzione essendo canonica.
Dimostrazione. Siccome per ipotesi la lagrangiana è invariante sotto trasformazioni
dell’intero gruppo di Poincaré, per la dimostrazione del teorema possiamo servirci del
teorema di Noether e ricorrere ai tensori Teµν e M
fµαβ a quadridivergenza nulla, definiti

in (3.44) e (3.45). Riprendiamo in particolare l’espressione per la densità di momento


angolare,
fµαβ = xα Teµβ − xβ Teµα + V µαβ ,
M V µαβ ≡ Πµr Σαβ r s ϕs , (3.53)

dove abbiamo introdotto il tensore V µαβ , antisimmetrico negli ultimi due indici,

V µαβ = −V µβα .

fµαβ che Teµν sono a quadridivergenza nulla, si ottiene,


Sfruttando il fatto che sia M

fµαβ = ∂µ xα Teµβ − ∂µ xβ Teµα + ∂µ V µαβ ,


0 = ∂µ M (3.54)

ovverosia, cambiando di nome agli indici,

∂ρ V ρµν = Teνµ − Teµν , (3.55)

che equivale proprio alla parte antisimmetrica di Teνµ . Tuttavia, non possiamo identificare
V ρµν direttamente con φρµν , perché il primo non è antisimmetrico in ρ e µ. Se poniamo
invece,
1 ρµν
φρµν = (V − V µρν − V νρµ ) , (3.56)
2
possiamo verificare che questo tensore gode delle seguenti proprietà:
a) φρµν = −φµρν ,
³ ´
b) ∂ρ φρµν = 12 Teνµ − Teµν − 12 ∂ρ (V µρν + V νρµ ).
La prima proprietà, che assicura che φρµν dà luogo a una modifica consistente di Teµν ,
discende dall’antisimmetria di V νρµ negli ultimi due indici; la seconda è conseguenza
diretta di (3.55) e (3.56). Infine possiamo determinare il nuovo tensore energia–impulso
usando la (3.51), e sfruttando la proprietà b),

µν eµν ρµν 1 ³ eνµ eµν ´ 1


T = T + ∂ρ φ = T +T − ∂ρ (V µρν + V νρµ ) ,
2 2
94
che è manifestamente simmetrico in µ e ν. Sfruttando l’antisimmetria di V µνρ negli ultimi
due indici e usando la nostra convenzione sulla simmetrizzazione dei tensori, possiamo
riscrivere questo risultato anche come,

T µν = Te(µν) + ∂ρ V (µν)ρ , ∂µ T µν = 0. (3.57)

Abbiamo quindi dato una dimostrazione costruttiva dell’esistenza di un tensore energia–


impulso a quadridivergenza nulla e simmetrico, che dà luogo allo stesso quadrimomento
totale conservato del tensore energia–impulso canonico. Facciamo, però, notare che il
quadrimomento PVµ contenuto in un volume finito dipende dal tensore energia–impulso
che si considera. Tuttavia, questo quadrimomento non ha carattere tensoriale, cioè PVµ
non è un quadrivettore.
Dalla dimostrazione appena svolta traiamo inoltre le seguenti conclusioni. L’esistenza
di un tensore energia–impulso conservato richiede soltanto l’invarianza per traslazioni
di una teoria, mentre l’esistenza di un tensore energia–impulso conservato e simmetrico
richiede in più che essa sia invariante sotto trasformazioni di Lorentz. Infatti, nella nostra
fµαβ = 0, vedi (3.54) e
costruzione di φρµν era essenziale l’equazione di continuità ∂µ M
(3.55), che a sua volta discende dall’invarianza di Lorentz via il teorema di Noether.
Il gruppo di Poincaré e la Relatività Generale. Concludiamo questa sezione con una
considerazione sul doppio ruolo dell’invarianza di Poincaré nell’interazione gravitazionale.
In primo luogo menzioniamo il fatto che in base al Principio di Equivalenza qualsiasi
teoria invariante sotto trasformazioni del gruppo di Poincaré, nell’ambito della Relatività
Generale ammette un cosiddetto “accoppiamento minimale” consistente con un campo
gravitazionale esterno. In secondo luogo ricordiamo che la consistenza delle equazioni
di Einstein, che governano la dinamica del campo gravitazionale, necessita del tensore
energia–impulso simmetrico (3.57) – la cui esistenza è assicurata, a sua volta, dall’inva-
rianza di Poincaré. Possiamo allora affermare che la consistenza dell’interazione gravi-
tazionale di un sistema fisico – benchè coinvolga un gruppo di simmetrie più ampio del
16
gruppo di Poincaré, cioè, il gruppo dei diffeomorfismi – è garantita in ultima analisi
16
Un diffeomorfismo è una generica trasformazione di coordinate xµ → x0µ (x), invertibile e di classe C ∞
insieme alla sua inversa. I diffeomorfismi costituiscono quindi una generalizzazione delle trasformazioni
di Poincaré, x0µ (x) = Λµ ν xν + aµ .

95
dall’invarianza di Poincaré del sistema in assenza di interazione gravitazionale. L’im-
portanza di questa invarianza sta anche in questo: oltre ad assicurare la covarianza delle
equazioni del moto e la conservazione delle grandezze fisiche fondamentali, essa garantisce
anche la consistenza interna della Relatività Generale.

3.4.1 Tensore energia–impulso simmetrico per il campo di Maxwell

A titolo di esempio determiniamo il tensore energia–impulso simmetrico per il campo


di Maxwell libero. La lagrangiana di questo sistema è data in (3.48), e l’equazione di
Eulero–Lagrange associata è l’equazione di Maxwell nel vuoto, vedi (3.27),

∂µ F µν = 0. (3.58)

Il tensore energia–impulso canonico associato a questa lagrangiana è stato determinato


nella (3.50),
1
Teem
µν
= −F µα ∂ ν Aα + η µν F αβ Fαβ .
4
Denotando i campi di gauge indistintamente con Ar o Aα , ricordiamo anche la forma dei
momenti coniugati (3.49), e delle matrici Σαβ r s per un campo vettoriale, vedi (3.37),

Πµr = −F µr , Σαβ r s = δrα η βs − δrβ η αs .

Calcoliamo dapprima il tensore V µαβ , antisimmetrico in α e β,

V µαβ ≡ Πµr Σαβ r s As = −F µα Aβ + F µβ Aα . (3.59)

Determiniamo poi il tensore φρµν definito in (3.56), vedi problema 3.7,

φρµν = −F ρµ Aν , (3.60)

antisimmetrico in ρ e µ. Per la sua divergenza si ottiene allora,

∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = F µα ∂α Aν ,

dove abbiamo utilizzato l’equazione di Eulero–Lagrange (3.58). Il nuovo tensore energia–


impulso risulta in definitiva,
1 1
µν
Tem = Teem
µν
+ ∂ρ φρµν = F µα (∂α Aν − ∂ ν Aα ) + η µν F αβ Fαβ = F µα Fα ν + η µν F αβ Fαβ ,
4 4
che è gauge invariante oltre che simmetrico, ed in perfetto accordo con la (2.69).

96
3.5 Densità di momento angolare “standard”

Concludiamo questo capitolo dimostrando che per una lagrangiana L invariante per il
gruppo di Poincaré esiste sempre una densità di momento angolare M µαβ “standard”,
legata al tensore energia–impulso simmetrico dalla relazione,

M µαβ = xα T µβ − xβ T µα . (3.61)

La dimostrazione di questa proprietà segue una strategia molto simile a quella usata per
dimostrare l’esistenza di un tensore energia–impulso simmetrico. Sfrutteremo, cioè, il fatto
che anche la densità di momento angolare è determinata a meno della quadridivergenza
di un tensore con opportune proprietà di antisimmetria. Dimostreremo, infatti, che esiste
un tensore Λµναβ di rango quattro, antisimmetrico nella prima coppia di indici oltre che
nella seconda, tale che,
fµαβ + ∂ρ Λρµαβ ,
M µαβ = M

con M µαβ definito in (3.61). Con un argomento standard, vedi (3.52), si verifica allora
facilmente che,
Z Z
Lαβ
≡ 3
d xM 0αβ
= f0αβ ≡ L
d3 x M eαβ ,

purché Λµναβ svanisca all’infinito spaziale più rapidamente di 1/r2 .


Incominciamo la dimostrazione ricordando la definizione della densità canonica di
momento angolare,

fµαβ = xα Teµβ − xβ Teµα + V µαβ ,


M V µαβ ≡ Πµr Σαβ r s ϕs ,

e la relazione tra il tensore energia–impulso canonico e quello simmetrico,

1 ρµν
T µν = Teµν + ∂ρ φρµν , φρµν ≡ (V − V µρν − V νρµ ) . (3.62)
2

Allora si può scrivere,

fµαβ = xα T µβ − xβ T µα − xα ∂ρ φρµβ + xβ ∂ρ φρµα + V µαβ


M
¡ ¢
= M µαβ − ∂ρ xα φρµβ − xβ φρµα + φαµβ − φβµα + V µαβ
¡ ¢
= M µαβ − ∂ρ xα φρµβ − xβ φρµα ,

97
dove nell’ultimo passaggio abbiamo usato la definizione di φρµν riportata in (3.62), che
comporta l’identità,
φαµβ − φβµα = −V µαβ .

Otteniamo quindi,

fµαβ + ∂ρ Λρµαβ ,
M µαβ = M con Λρµαβ ≡ xα φρµβ − xβ φρµα , (3.63)

dove Λρµαβ è antisimmetrico nella prima coppia di indici oltre che nella seconda, che è
quanto volevamo dimostrare.

3.6 Problemi

3.1 Si consideri un campo scalare reale ϕ (“particella neutra con spin 0 e massa m”)
con lagrangiana,
1¡ ¢ λ
L= ∂µ ϕ∂ µ ϕ − m2 ϕ2 − ϕ4 ,
2 4!
dove m e λ sono costanti reali.
a) Si scrivano le equazioni di Eulero–Lagrange associate a L.
b) Si verifichi esplicitamente che tali equazioni sono equivalenti alla richiesta di stazio-
Rt
narietà dell’azione I = t12 L d4 x, per variazioni generiche del campo ϕ, purché nulle in
t = t1 e t = t2 .

3.2 Si consideri un campo scalare complesso Φ = ϕ1 + iϕ2 (“particella carica con spin 0
e massa m”) con lagrangiana,
λ ∗ 2
L = ∂µ Φ∗ ∂ µ Φ − m2 Φ∗ Φ − (Φ Φ) ,
4
dove m e λ sono costanti reali.
a) Si scrivano le equazioni di Eulero–Lagrange associate a L. [Sugg.: si considerino come
campi indipendenti Φ e Φ∗ .]
b) Si dica per quali valori di λ e m le equazioni del moto per ϕ1 e ϕ2 risultano disaccoppiate
tra di loro.

3.3 Si consideri l’azione,


Z t2
I= L d4 x,
t1

98
con L data in (3.25).
a) Si determini la variazione di I per variazioni generiche di Aµ .
b) Si verifichi esplicitamente che la variazione di I è nulla per variazioni arbitrarie dei
campi, purché nulle in t = t1 e t = t2 , se e solo se il campo di gauge soddisfa l’equazione
di Maxwell.

3.4 Si consideri la lagrangiana per il campo reale scalare data nel problema 3.1.
a) Si derivi il tensore energia–impulso canonico, analizzandone le proprietà di simmetria.
b) Si scriva l’espressione esplicita per la densità di energia e per l’energia totale del sistema.
Si dica per quali valori di m e λ l’energia è definita positiva.

3.5 Si verifichi esplicitamente che il tensore energia–impulso canonico del campo di


Maxwell libero dato in (3.50) ha quadridivergenza nulla.

3.6 Si dimostri che per una teoria di campo di soli campi scalari il tensore energia–
impulso canonico è simmetrico. [Sugg.: per l’invarianza di Lorentz la lagrangiana può
dipendere da ∂µ ϕr solo attraverso la “matrice” Mrs = ∂µ ϕr ∂ µ ϕs , simmetrica in r e s.]

3.7 Si verifichi che per un campo di Maxwell libero il tensore φρµν ha la forma data in
(3.60).

fµαβ per un campo di Max-


3.8 Si determini la densità di momento angolare canonico M
well libero. Si verifichi che la corrispondente densità di momento angolare “standard”,
come definita in (3.63), risulta uguale a xα Tem
µβ
− xβ Tem
µα
.

~ B},
3.9 Si consideri una teoria di campo descritta dai sei campi lagrangiani ϕ ≡ {E, ~

con lagrangiana,
~ ³ ´
~ · ∂B + 1 E
L=E ~ ·∇
~ ×E
~ +B
~ ·∇
~ ×B
~ − ~j · B,
~
∂t 2

dove ~j è un campo esterno indipendente da ϕ. Si confrontino le equazioni del moto


associate a questa lagrangiana con le equazioni di Maxwell (2.28)–(2.31).

3.10 Si consideri la lagrangiana L del campo complesso del problema 3.2.


a) Si verifichi che L è invariante sotto il gruppo a un parametro di trasformazioni (gruppo

99
U (1) di “trasformazioni di gauge globali”),

Φ0 (x) = eiΛ Φ(x), Φ∗0 (x) = e−iΛ Φ∗ (x), Λ ∈ R,

con Λ indipendente da x.
b) Si dimostri che sotto una generica variazione infinitesima Φ → Φ + δΦ si ha,
µ ¶ µ ¶
∂L ∂L ∂L
δL = − ∂µ δΦ + c.c. + ∂µ δΦ + c.c.
∂Φ ∂(∂µ Φ) ∂(∂µ Φ)

c) Si dimostri il teorema di Noether relativo al gruppo di simmetria di cui al punto a),


determinando la forma esplicita della corrente j µ associata. [Sugg.: per una trasforma-
zione infinitesima si ha δΦ = Φ0 − Φ = iΛΦ.]
d) Si verifichi esplicitamente che la corrente j µ è conservata, se il campo Φ soddisfa le
equazioni di Eulero–Lagrange determinate nel punto a) del problema 3.2.

100
4 Il metodo variazionale per l’Elettrodinamica di par-
ticelle puntiformi

In questa sezione estenderemo il metodo variazionale a una teoria di campo accoppiata


ad un sistema di particelle puntiformi. Per concretezza ci limiteremo a considerare il
caso dell’Elettrodinamica, ovvero una teoria di campo con un unico campo vettoriale Aµ ,
interagente con un sistema di particelle cariche.

4.1 Principio variazionale per una particella libera

Prima di considerare il sistema accoppiato deduciamo la forma dell’azione per una par-
ticella relativistica libera. La richiesta di stazionarietà di questa azione deve allora dare
luogo alle equazioni del moto di una particella libera, cioè,

dpµ
= 0. (4.1)
ds

Si tratta in sostanza di trovare la generalizzazione relativistica dell’azione newtoniana per


la particella libera, con coordinate lagrangiane ~y (t),
Z tb µ ¶
1 2
I0 [~y ] = mv dt, (4.2)
ta 2

dove questa volta abbiamo indicato gli estremi temporali con ta e tb , al posto di t1 e
t2 . Come abbiamo visto il primo passo nella formulazione di un principio variazionale
consiste nella scelta delle variabili lagrangiane. In questo caso stiamo cercando un’azione
relativistica, e le coordinate lagrangiane appropriate non sono allora le ~y (t), ma le quattro
funzioni,
y µ (λ),

che parametrizzano una generica linea di universo. Conseguentemente l’azione I[y] che
stiamo cercando dovrà essere invariante non solo sotto trasformazioni di Poincaré, ma
anche sotto riparametrizzazione, perché tale è l’equazione (4.1).
Come primo passo nella covariantizzazione di I0 sostituiamo la misura dt con la misura
invariante, sia per Poincaré che per riparametrizzazione,
r
dy µ dyµ
ds = dλ,
dλ dλ

101
che nel limite non relativistico si riduce in effetti a dt. L’azione che stiamo cercando
dovrebbe quindi avere la forma,
Z b
I[y] = l(y, ẏ) ds,
a

per un’opportuna lagrangiana invariante l. In questa espressione a e b indicano gli estremi


del tratto di linea di universo considerato, e abbiamo definito,
dy µ
ẏ µ = .

A questo punto facciamo notara che, al contrario delle “velocità” ẏ µ , le coordinate y µ
in realtà non hanno carattere “tensoriale”, perché sotto traslazioni non sono invarianti.
Di conseguenza l non può dipendere dalle y µ , ma solo dalle ẏ µ . D’altra parte l’unico
quadriscalare indipendente che possiamo formare con le ẏ µ è la quantità,

ẏ µ ẏµ ,

ma questa non è invariante sotto riparametrizzazione. Concludiamo che l deve essere


indipendente anche dalle ẏ µ , e quindi necessariamente una costante. Poniamo allora per
l’azione relativistica,
Z b
I[y] = l ds,
a

che dal punto di vista geometrico corrisponde alla “lunghezza” dell’arco quadridimen-
sionale della linea di universo compreso tra a e b. Per determinare infine la costante l
richiediamo che nel limite non relativistico, v ¿ 1, questa azione si riduca a I0 . A questo
scopo ricordiamo la definizione di ds e ne eseguiamo lo sviluppo non relativistico,
µ ¶
√ v 2
4
ds = 1 − v 2 dt = 1 − + o(v ) dt.
2
Arrestandoci al termine quadratico ottieniamo allora,
Z tb µ ¶
l 2
I[y] = l(ta − tb ) − v dt.
ta 2
Il primo termine è indipendente dalle variabili dinamiche ed è irrilevante. Il secondo si
riduce in effetti a I0 se poniamo l = −m. Otteniamo quindi per l’azione relativistica di
una particella libera,
Z b Z br
dy µ dyµ
I[y] = −m ds = −m dλ. (4.3)
a a dλ dλ

102
Ci possiamo ora domandare quali sono le linee di universo che rendono stazionaria
17
questa azione per variazioni generiche delle coordinate ,

δy µ (λ) = y 0µ (λ) − y µ (λ),

purché nulle ai bordi,


δy µ (a) = 0 = δy µ (b). (4.4)

Faremo ora vedere che le linee di universo in questione sono esattamente quelle che soddi-
sfano le (4.1). Per farlo calcoliamo la variazione dell’azione (4.3) per variazioni generiche
delle coordinate,
Z b µ µ ¶ Z b µ µ ¶
1 dy dyµ 1 dy d δyµ
δI = −m q δ dλ = −m q dλ.
a 2 dy µ dyµ dλ dλ a dy µ dyµ dλ dλ
dλ dλ dλ dλ

Usando le relazioni, r
dy µ dyµ ds dy µ
= , pµ = m ,
dλ dλ dλ ds
otteniamo,
Z b
d δyµ
δI = − pµ ds,
a ds
e integrando per parti arriviamo poi a,
¯b Z b
dpµ
µ ¯
δI = −p δyµ ¯ + δyµ ds.
a a ds

Se imponiamo ora che l’azione sia stazionaria per variazioni δy µ arbitrarie purché soddi-
sfacenti le (4.4), il primo termine si annulla, e otteniamo la condizione di stazionarietà,

dpµ
= 0.
ds

4.2 L’azione per l’Elettrodinamica

In questa sezione consideriamo un generico sistema di particelle cariche in interazione con


il campo elettromagnetico. Se introduciamo come al solito un potenziale vettore Aµ e
17
In alternativa l’azione di una particella relativistica potrebbe essere considerata anche come funzionale
delle variabili lagrangiane ~y (t), al posto delle y µ (λ). In questo caso si otterrebbero equazioni del moto
completamente equivalenti, ma non in forma covariante a vista. È facile vedere che nel caso della particella
libera, per esempio, dalla (4.3) si otterrebbe l’equazione d~ p/dt = 0, al posto di dpµ /ds = 0. La scelta
µ
delle variabili y (λ) ha evidentemente il pregio di mantenere la covarianza a vista.

103
definiamo,
Fµν = ∂µ Aν − ∂ν Aµ ,

allora le equazione del moto di questo sistema sono l’equazione di Maxwell (2.14) per il
potenziale vettore, e le equazioni di Lorentz (2.12) per le particelle. In questa sezione
rideriveremo queste equazioni da un principio variazionale. Useremo poi il teorema di
Noether applicato al gruppo di Poincaré, per riottenere le noti leggi di conservazione.
Confermeremo in particolare le espressioni esplicite delle correnti (2.69), (2.70) e (2.85),
ottenute precedentemente in modo euristico.
Punto di partenza deve essere un’azione I[A, yr ] – funzionale del campo elettroma-
gnetico Aµ (x) e delle linee di universo yrµ (λr ) delle particelle – che sia invariante sotto
trasformazioni di Poincaré. Abbiamo già dedotte l’equazione di Maxwell da un prin-
cipio variazionale a partire dalla lagrangiana (3.25), e conosciamo inoltre l’azione (4.3)
corrispondente a una particella libera. Per l’azione del sistema interagente viene allora
naturale ipotizzare l’espressione,
Z Z Σb X Z br
1 Σb µν 4 µ 4
I[A, yr ] = − F Fµν d x − Aµ j d x − mr dsr = I1 + I2 + I3 . (4.5)
4 Σa Σa r ar

In questa espressione gli integrali quadridimensionali sono eseguiti tra due ipersuperfici
di tipo spazio Σa e Σb non intersecantesi, mentre ar e br sono rispettivamente i punti
18
d’intersezione della linea di universo r–esima con Σa e Σb . Interpretiamo I1 come la
parte dell’azione che descrive la propagazione libera di Aµ , I3 come la parte che descrive il
moto libero delle cariche, e I2 come la parte che descrive l’interazione tra particelle cariche
e campo elettromagnetico. La giustificazione ultima di questa azione deriva, ovviamente,
dal fatto che essa dà luogo alle equazioni del moto desiderate, come faremo vedere di
seguito.
Per impostare il problema variazionale è conveniente riscrivere l’azione in una forma
diversa. Sfruttando la definizione della corrente possiamo intanto riscrivere il termine di
interazione,
Z Σb X Z X Z br
4
I2 = − Aµ (x) er δ (x − yr ) dyrµ 4
d x=− er Aµ (yr ) dyrµ . (4.6)
Σa r r ar

18
Ogni linea di universo γr interseca le ipersuperfici Σa,b un’unica volta, perché la prima è di tipo
tempo, mentre le seconde sono di tipo spazio.

104
Come nella sezione precedente introduciamo per le derivate delle variabili lagrangiane
yrµ (λr ) la notazione abbreviata,
dyrµ
ẏrµ = .
dλr
Usando (4.3) e (4.6) è allora immediato ottenere,
X Z br
I2 + I3 = − (mr dsr + er Aµ (yr )dyrµ ) (4.7)
r ar
XZ br µ q ¶
µ µ
= − mr ẏr ẏrµ + er Aµ (yr )ẏr dλr (4.8)
r ar
XZ br
= Lr (yr , ẏr ) dλr , (4.9)
r ar

dove abbiamo definito le Lagrangiane “ordinarie”,


p
Lr (yr , ẏr ) = −mr ẏrν ẏrν − er Aν (yr ) ẏrν . (4.10)

Dalle formule scritte si vede anche che l’azione può essere posta nella forma,
Z Σb
I= L d4 x,
Σa

se definiamo la lagrangiana totale,


X Z
1 µν µ
L = L1 + L2 + L3 = − F Fµν − Aµ j − mr δ 4 (x − yr ) dsr (4.11)
4 r
XZ
= L1 + Lr δ 4 (x − yr ) dλr . (4.12)
r

Il problema variazionale. Secondo il principio variazionale cerchiamo ora le configu-


razioni di campi e particelle che rendono stazionaria l’azione – δI = 0 – per variazioni
arbitrarie δAµ e δyrµ , purché soddisfacenti,

δAµ |Σa = 0 = δAµ |Σb , δyrµ (ar ) = 0 = δyrµ (br ).

Consideriamo separatamente variazioni dei campi e variazioni delle linee di universo. Per
variazioni dei campi, siccome I3 è indipendente da Aµ , il problema si riduce a considerare
R
l’azione I1 +I2 = d4 x (L1 +L2 ). Ma sappiamo che le configurazioni dei campi che rendo-
no stazionaria questa azione sono quelle che soddisfano le equazioni di Eulero–Lagrange
associate alla lagrangiana L1 + L2 . Queste ultime, d’altro canto, sono state derivate nella
sezione 3.2.3 e viste coincidere con l’equazione di Maxwell (3.27).

105
Resta da imporre la stazionarietà dell’azione per variazioni delle coordinate. In questo
caso, siccome I1 è indipendente dalle yr , è sufficiente considerare l’azione I2 +I3 . Potremmo
calcolare la variazione di questa azione con le tecniche usate nella sezione precedente,
e troveremmo che le condizioni di stazionarietà coincidono proprio con le equazioni di
Lorentz, vedi problema 4.1.
Di seguito proponiamo una dimostrazione alternativa di questo risultato, basata di-
rettamente sul metodo lagrangiano per un sistema a finiti di gradi di libertà, vedi sezione
3.1. Riprendiamo a questo scopo l’azione I2 + I3 , scritta come in (4.9). Questa azione si
separa in una somma di termini,
X Z br
I2 + I3 = I[yr ], I[yr ] = Lr (yr , ẏr ) dλr ,
r ar

ciascuno dei quali dipende solo da una delle coordinate. L’azione I2 + I3 sarà quindi
stazionaria se ciascuna I[yr ] è stazionaria per variazioni generiche delle yrµ , con le solite
condizioni agli estremi. Ma I[yr ] è l’integrale della lagrangiana ordinaria Lr , corrisponden-
te a un sistema lagrangiano con quattro gradi di libertà. Come sappiamo dalla sezione 3.1,
il problema della stazionarietà di questa azione si riduce allora alle equazioni di Lagrange
associate, vale a dire,
d ∂Lr ∂Lr
− µ = 0.
dλr ∂ ẏrµ ∂yr
Valutiamo dunque i due termini di questa equazione, tralasciando per semplicità l’indice
r. Dalla (4.10) si ottiene immediatamente,
∂L
= −e ∂µ Aν ẏ ν .
∂y µ
Calcoliamo poi,
∂L mẏµ
µ
= − √ ν − eAµ (y) = −pµ − eAµ (y), (4.13)
∂ ẏ ẏ ẏν
dove abbiamo introdotto il quadrimomento pµ della particella, ed utilizzato la solita
√ ds
relazione ẏ ν ẏν = dλ . Infine dobbiamo valutare,
d ∂L dpµ
= − − e ẏ ν ∂ν Aµ .
dλ ∂ ẏ µ dλ
In definitiva otteniamo,
µ ¶
d ∂L ∂L dpµ ds dpµ
µ
− µ =− + e ẏ ν (∂µ Aν − ∂ν Aµ ) = − − eFµν uν = 0, (4.14)
dλ ∂ ẏ ∂y dλ dλ ds
che è l’equazione di Lorentz.

106
4.3 Il teorema di Noether in Elettrodinamica

Nella sezione precedente abbiamo stabilito un principio variazionale per l’Elettrodinamica


classica, compatibile con i postulati della Relatività Ristretta. Più precisamente, abbia-
mo individuato un’azione invariante sotto trasformazione del gruppo di Poincaré da cui
discendono le equazioni del moto per campi e particelle. Secondo il teorema di Noether
dovrebbe quindi essere possibile derivare la forma delle “correnti” conservate T µν e M µαβ ,
sfruttando l’invarianza dell’azione rispettivamente per traslazioni e per trasformazioni di
Lorentz. Anche in questo caso la dimostrazione del teorema può essere svolta secondo la
strategia adottata nel capitolo precedente per un sistema di soli campi, ma dal punto di
vista tecnico essa è leggermente più complicata per via della presenza delle particelle.
Seguendo il metodo della sezione 3.3 impostiamo la dimostrazione a partire non diret-
tamente dall’azione, ma dalla lagrangiana del sistema, vedi (4.11). Per brevità indichiamo
le dipendenze funzionali di questa lagrangiana con L(A(x), yr , x), omettendo di indicare
esplicitamente la dipendenza dalle derivate ∂A e ẏr . Notiamo, comunque, che formal-
mente questa lagrangiana esibisce anche una dipendenza esplicita dalla coordinata x –
indicata dal suo terzo argomento – attraverso le δ 4 (x − yr ) che compaiono in (4.11). Tut-
tavia, vedremo fra poco che in questo caso non sussiste nessuna rottura dell’invarianza
per traslazioni.
Per le trasformazioni di Poincaré adottiamo le notazioni del paragrafo 3.3.1. Per
trasformazioni finite abbiamo,

x0µ = Λµ ν xν + aµ , yr0µ = Λµ ν yrν + aµ , A0µ (x0 ) = Λµ ν Aν (x),

e per trasformazioni infinitesime, Λµ ν = δ µ ν + ω µ ν , ne segue,

δxµ = aµ + ω µ ν xν , δyrµ = aµ + ω µ ν yrν . (4.15)

Per le trasformazioni del campo vettoriale distinguiamo di nuovo trasformazioni totali e


trasformazioni in forma,

δAα ≡ A0α (x0 ) − Aα (x) = ωα β Aβ (x),

δAα ≡ A0α (x) − Aα (x) = −δxν ∂ν Aα + δAα = −δxν ∂ν Aα + ωα β Aβ (x). (4.16)

107
L’invarianza di L sotto trasformazioni di Poincaré è allora espressa dall’identità,

δL ≡ L(A0 (x0 ), yr0 , x0 ) − L(A(x), yr , x) = 0. (4.17)

Difatti l’unico elemento nella (4.11) la cui invarianza va controllata è la δ 4 di Dirac,


δ 4 (x − yr )
δ 4 (x0 − yr0 ) = δ 4 (Λx + a − (Λyr + a)) = δ 4 (Λ(x − yr )) = = δ 4 (x − yr ).
|detΛ|
Questo vuol dire che le trasformazioni delle δ 4 in seguito potranno essere semplicemente
ignorate.
Manipoliamo ora l’identità (4.17) in completa analogia con il caso di una teoria con
soli campi. Scriviamo,

δL = [L(A0 (x0 ), yr0 , x0 ) − L(A0 (x), yr , x)] + [L(A0 (x), yr , x) − L(A(x), yr , x)] .

I due termini della prima parentesi quadra differiscono solo per le variazioni (4.15) di x
e yr , mentre nella seconda parentesi quadra compare solo una trasformazione in forma
di Aµ . Nella prima parentesi quadra conviene usare l’espressione (4.12), mentre nella
seconda è più conveniente la (4.11). Si ottiene cosı̀,
" # · ¸
XZ ∂L
µ 4 µν
δL = δx ∂µ L1 + δLr δ (x − yr ) dλr + δAν + Π ∂µ δAν . (4.18)
r
∂A ν

Con δLr intendiamo quı̀ la variazione di Lr per le variazioni delle yr date in (4.15), e
∂L
abbiamo usato la definizione consueta per i momenti coniugati, Πµν ≡ ∂(∂µ Aν )
= −F µν .
Alla seconda parentesi quadra contribuiscono solo i termini L1 +L2 , e possiamo riscriverla
come,
· ¸
∂L µν µν ∂L µν
δAν + Π ∂µ δAν = ∂µ (Π δAν ) + − ∂µ Π δAν ,
∂Aν ∂Aν
= ∂µ (Πµν δAν ) + (∂µ F µν − j ν ) δAν ,

dove nell’ultimo termine riconosciamo l’equazione di Maxwell. In modo completamen-


te analogo possiamo manipolare la variazione di Lr , facendo comparire le equazioni di
Lorentz,
µ ¶ µ ¶
∂Lr ν ∂Lr d ν ∂Lr ∂Lr d ∂Lr
δLr = δyrν + δ ẏr = δyr ν + δyr ν

∂yrν ∂ ẏrν dλr ∂ ẏr ∂yrν dλr ∂ ẏrν
µ ¶ µ ¶
d ∂Lr dsr dprν
= δyrν ν + − Fνµ uµr δyrν ,
dλr ∂ ẏr dλr dsr

108
dove l’ultimo termine corrisponde alle equazioni di Lorentz, vedi (4.14). Il primo termine,
invece, inserito in (4.18), attraverso un’integrazione per parti dà luogo a,
Z µ ¶ Z
d ν ∂Lr ∂Lr d 4
δyr ν δ (x − yr ) dλr = − δyrν ν
4
δ (x − yr ) dλr
dλr ∂ ẏr ∂ ẏr dλr
µ ¶¯λr =+∞
ν ∂Lr 4
¯
+ δyr ν
δ (x − yr ) ¯¯ .
∂ ẏr λr =−∞

Per ogni x fissato, per λr → ±∞ la δ 4 (x − yr ) si annulla, quindi il secondo termine è


nullo. Per quanto riguarda il primo termine notiamo invece che,
d 4
δ (x − yr ) = −ẏrµ ∂µ δ 4 (x − yr ) = −∂µ (ẏrµ δ 4 (x − yr )),
dλr
e otteniamo una quadridivergenza,
Z µ ¶ µZ ¶
d ν ∂Lr 4 µ ν ∂Lr 4
δyr ν δ (x − yr ) dλr = ∂µ ẏr δyr δ (x − yr ) dλr .
dλr ∂ ẏr ∂ ẏrν
Inseriamo ora questi risultati nella (4.18),
" #
XZ ∂L r
δL = ∂µ δxµ L1 + Πµν δAν + ẏrµ δyrν ν δ 4 (x − yr ) dλr (4.19)
r
∂ ẏr
X Z µ ¶
µν ν dprν
+ (∂µ F − j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr .
µ

r
dsr

Questa formula ha ora la stuttura prevista dal teorema di Noether: eguaglia la va-
riazione della lagrangiana alla quadridivergenza di un certo quadrivettore – la parentesi
quadra – modulo termini proporzionali alle equazioni del moto. È ora un semplice eserci-
zio esplicitare la parentesi quadra e determinare i coefficienti di aν e di ω αβ , per ottenere
la forma esplicita delle correnti conservate. È sufficiente inserire le formule (4.13), (4.15)
e (4.16). Per i primi due termini della parentesi quadra in (4.19) otteniamo,

δxµ L1 + Πµν δAν = δxν (η µν L1 − Πµν ∂ ν Aν ) + Πµν δAν = −δxν Teem


µν
− F µν ωνρ Aρ , (4.20)

dove abbiamo ritrovato il tensore energia–impulso canonico per un campo di Maxwell


libero, (3.50). Per il terzo termine in (4.19) notiamo che per le proprietà della δ 4 possiamo
sostituire δyrν con δxν . Con l’aiuto di (4.13) e parametrizzando l’integrale con il tempo
proprio, questo termine può allora essere posto nella forma,
XZ XZ
µ ν ∂Lr 4
ẏr δyr ν
δ (x − yr ) dλr = −δxν uµr (pνr + er Aν (yr )) δ 4 (x − yr ) dsr
r
∂ ẏ r
¡ r µν ¢
= −δxν Tp + j µ Aν , (4.21)

109
dove abbiamo ritrovato il tensore energia–impulso delle particelle, (2.70). Sommando
(4.20) e (4.21) ed esplicitando δxν = aν + ωνβ xβ , la parentesi quadra in (4.19) può allora
essere scritta come,
³ ´ 1
−δxν Tpµν e
+ Tem + j A − F µν ωνρ Aρ = −aν Teµν + ωαβ M
µν µ ν fµαβ ,
2

dove abbiamo definito i tensori energia–impulso e densità di momento angolare canonici


dell’Elettrodinamica classica,

Teµν = Tpµν + Teem


µν
+ j µ Aν (4.22)
fµαβ = xα Teµβ − xβ Teµα − F µα Aβ + F µβ Aα .
M (4.23)

In definitiva possiamo riscrivere la (4.19) come,

1
δL = −aν ∂µ Teµν + fµαβ
ωαβ ∂µ M (4.24)
2
X Z µ dprν ¶
+ (∂µ F µν ν
− j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr ,
µ

r
dsr

da confrontare con l’analoga identità per una teoria di soli campi, vedi (3.47).
Dato che la lagrangiana è invariante per l’intero gruppo di Poincaré abbiamo che
δL = 0 identicamente. Concludiamo quindi che, se i campi e le particelle soddisfano le
rispettive equazioni del moto, allora i tensori Teµν e M
fµαβ risultano conservati,

∂µ Teµν = 0 = ∂µ M
fµαβ . (4.25)

Tensore energia–impulso simmetrico e densità di momento angolare standard. Di nuo-


vo vediamo che le correnti che abbiamo ottenuto non hanno la forma che abbiamo trovato
nei paragrafi 2.4.3 e 2.4.4 con metodi euristici; in particolare Teµν non è simmetrico e M
fµαβ

non ha la forma standard. Inoltre, nessuno dei due tensori è gauge invariante. Vediamo
comunque che in assenza di particelle Teµν si riduce a Teem
µν
, mentre in assenza di campo
elettromagnetico esso si riduce a Tpµν . Ma nella (4.22) c’è anche il termine di interferenza
j µ Aν , di interpretazione più difficile. Tuttavia, anche in questo caso possiamo adottare
la strategia generale per la simmetrizzazione del tensore energia–impulso, sviluppata in
sezione 3.4. Poniamo,

T µν = Teµν + ∂ρ φρµν , φρµν = −φµρν , (4.26)

110
dove il tensore φρµν è dato in termini del tensore V µαβ secondo la definizione (3.56). D’altra
parte quest’ultimo si può determinare confrontando la (4.23) con la (3.53). Risulta,

V µαβ = −F µα Aβ + F µβ Aα ,

come nel caso del campo di Maxwell libero, vedi (3.59). Anche il tensore φρµν è allora
quello corrispondente al campo di Maxwell libero,

φρµν = −F ρµ Aν .

Tuttavia, in presenza di particelle la divergenza di questo tensore contiene anche un


termine proporzionale alla corrente. Risulta infatti,

∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = −j µ Aν − F αµ ∂α Aν .

Aggiungendo questa espressione a (4.22) si vede che il termine di interferenza j µ Aν si


cancella, e che si ricombina il tensore energia–impulso simmetrico del campo elettroma-
gnetico,
T µν = Tem
µν
+ Tpµν , ∂µ T µν = 0,

a conferma dei risultati (2.69) e (2.70) del capitolo 2.


Analogamente, secondo la (3.63) si può modificare la densità di momento angolare
(4.23) ponendo,

fµαβ + ∂ρ Λρµαβ ,
M µαβ = M Λρµαβ = xα φρµβ − xβ φρµα .

Nel nostro caso risulta,

∂ρ Λρµαβ = φαµβ + xα ∂ρ φρµβ − (α ↔ β) = F µα Aβ + xα (T µβ − Teµβ ) − (α ↔ β).

Aggiungendo questo termine a (4.23) si vede immediatamente che risulta,

M µαβ = xα T µβ − xβ T µα ,

in accordo con il nostro risultato euristico (2.85).


Abbiamo cosı̀ riottenuto la forma dei tensori energia–impulso e densità di momento
angolare per l’Elettrodinamica. Più del risultato, già noto, è importante il metodo che

111
abbiamo utilizzato, cioè, il teorema di Noether. Nella sezione 3.3 abbiamo dato una
dimostrazione generale di questo teorema per una teoria di soli campi. In questa sezione
abbiamo dimostrato il teorema in una situazione fisica molto diversa, in cui alcuni gradi di
libertà non sono distribuiti con continuità nello spazio, come i campi, ma costituiscono dei
“difetti” puntiformi, appunto le particelle. In questo capitolo abbiamo difatti illustrato
una circostanza molto generale, e cioè che in Fisica il teorema di Noether vale a tutti i
livelli: vale per teorie contenenti campi, particelle, stringhe e – più in generale – membrane
di qualsiasi estensione spaziale; vale a livello newtoniano cosı̀ come vale in Relatività
Ristretta e in Relatività Generale, vale in Fisica Classica e in Meccanica Quantistica, in
Teoria Quantistica Relativistica dei Campi e, ancora, nelle Teorie di Superstringa.

4.4 Invarianza di gauge e conservazione della carica elettrica

Nella sezione precedente abbiamo discusso il teorema di Noether relativo al gruppo di


Poincaré, con conseguente conservazione del quadrimomento e del momento angolare
quadridimensionale. Ma in Elettrodinamica esiste un’altra grandezza conservata – non
associata al gruppo di Poincaré – che è la carica elettrica, e se vale il teorema di Noether,
allora anche ad essa dovrebbe essere associato un gruppo a un parametro di simmetrie.
In effetti l’Elettrodinamica è dotata di una simmetria fondamentale che abbiamo già am-
piamento esplorato – l’invarianza di gauge – che potrebbe essere legata alla conservazione
della carica via il teorema di Noether.
Per analizzare questo possibile nesso facciamo intanto notare che le trasformazioni di
gauge costituiscono effettivamente un gruppo (abeliano), con un solo parametro Λ. Posto

A01µ = Aµ + ∂µ Λ1 ,

abbiamo infatti,
A02µ = A01µ + ∂µ Λ2 = Aµ + ∂µ (Λ1 + Λ2 ).

Esploriamo allora la variazione della lagrangiana (4.11) sotto una generica trasformazione
di gauge δAµ = A0µ − Aµ = ∂µ Λ. Risulta,

δL = −∂µ Λj µ = −∂µ (Λj µ ) + Λ ∂µ j µ ∼


= Λ ∂µ j µ ,

112
dove abbiamo sfruttato il fatto che le lagrangiana sono definite modulo quadridivergenze.
Avremmo dunque trovato proprio il legame implicato dal teorema di Noether, ovvero che
l’invarianza della lagrangiana implica la conservazione locale della carica,

δL = 0 ⇒ ∂µ j µ = 0. (4.27)

Tuttavia, il nesso appena evidenziato non segue proprio le linee del teorema di Noether,
per come l’abbiamo illustrato nella sezione precedente. Il primo motivo è che il parametro
Λ(x) non è un parametro “globale”, ovvero costante, come invece previsto dal teorema
di Noether; d’altra parte se Λ è costante la trasformazione di gauge si riduce banalmente
alla trasformazione identica. Il secondo motivo è che nella derivazione della (4.27) le
equazioni del moto dell’Elettrodinamica non hanno giocato nessun ruolo, mentre il loro uso
era essenziale nella dimostrazione delle leggi di conservazione (4.25). Sappiamo, infatti,
che la corrente (2.6) è conservata identicamente, indipendentemente dalla validità delle
equazioni del moto.
Si intuisce che questa a–simmetria esistente in Elettrodinamica classica tra il gruppo
di Poincarè e il gruppo delle trasformazioni di gauge, è dovuta al fatto che le particelle
cariche in questo ambito vengono trattate come “difetti” puntiformi: conseguentemente
la conservazione della carica totale – in ultima analisi – corrisponde semplicemente al
“conteggio” delle particelle contenute in un dato volume. Infatti, integrando la (2.40) su
un volume finito V si ottiene per la carica QV (t) contenuta all’istante t in V ,
Z X Z X
0 3
QV (t) = j (t, ~x) d x = er δ 3 (~x − ~yr (t)) d3 x = er ,
V r V r∈ V

dove la somma si estende a tutte le particelle che all’istante t si trovano in V .


Si può, al contrario, vedere che quando anche le particelle cariche vengono rappresenta-
te da campi – alla stessa stregua del campo elettromagnetico – allora la conservazione della
carica elettrica segue esattamente lo schema “a la Noether”, illustrato sopra per la con-
servazione di quadrimomento e momento angolare quadridimensionale. Questo succede,
per esempio, nell’ambito della teoria quantistica relativistica di campo.

113
4.5 Problemi

4.1 Seguendo il procedimento della sezione 4.1 si deducano le equazioni di Lorentz (2.12),
imponendo la stazionarietà dell’azione (4.8) per variazioni generiche δyrµ delle coordinate,
purché nulle in ar e br .

4.2 Si deduca la forma della lagrangiana di un sistema di cariche non relativistiche


interagenti con un campo elettromagnetico esterno, eseguendo il limite non relativistico
dell’azione (4.7),

114
5 Onde elettromagnetiche

In questo capitolo avviamo la ricerca di soluzioni esatte dell’equazioni di Maxwell e l’analisi


delle loro proprietà. La prima classe di soluzioni che analizzeremo è costituita dalle onde
piane elettromagnetiche, le quali costituiscono un particolare insieme completo di soluzioni
dell’equazione di Maxwell nel vuoto, cioè, in assenza di sorgenti,

j µ = 0.

La rilevanza fenomenologica di queste soluzioni è evidente. Basta pensare che l’energia


fornita dal sole viaggia interamente a cavallo di onde elettromagnetiche, e che qualsiasi
tipo di segnale che si propaga sulla terra via “etere” è costituito da queste onde. Ricor-
diamo inoltre che la quasi totalità dell’informazione che acquisiamo sull’universo arriva
sulla terra tramite segnali luminosi emessi da oggetti stellari, segnali costituiti da onde
elettromagnetiche che si propagano nello spazio vuoto su distanze molto grandi.
L’universo stesso poi è pervaso dalla cosiddetta radiazione cosmica di fondo, con ottima
approssimazione isotropa ed omogenea, che è caratterizzata da uno spettro in frequenza
di corpo nero ad una temperatura di T = 2.73 o K. Questa radiazione è messaggera di
un’epoca primordiale in cui la materia era costituita prevalentemente da particelle cariche
dissociate, soggette in continuazione a urti di natura elettromagnetica. Dopo “l’ultimo
scattering” e la conseguente ricombinazione delle particelle cariche in molecole neutre, il
campo di radiazione prodotto in questi urti si è disaccoppiato dalle cariche e si manifesta
oggi come “radiazione” di fondo – apparentemente priva di sorgenti.
In questo capitolo studieremo le proprietà delle onde elettromagnetiche, in quanto
base completa di soluzioni dell’equazione di Maxwell nel vuoto. Nel prossimo capitolo ci
occuperemo invece delle soluzioni dell’equazione di Maxwell in presenza di sorgenti. In
particolare determineremo il campo elettromagnetico esatto creato da una quadricorrente
j µ arbitraria. Lontano dalle sorgenti questo campo soddisfa di nuovo l’equazione di Max-
well nel vuoto, ed in quella regione potrà quindi essere analizzato a sua volta in termini
di onde elettromagnetiche.
Tuttavia, prima di poter affrontare questi argomenti dobbiamo capire qual è il conte-
nuto cinematico del campo elettromagnetico, ovverosia, quali sono le variabili indipendenti

115
che descrivono il suo stato in ogni istante. Detto in altre parole, dobbiamo individuare i
gradi di libertà fisici coinvolti nell’evoluzione temporale del campo elettromagnetico. Solo
allora saremo in grado di impostare correttamente il problema di Cauchy, cioè, di assegna-
re un insieme completo di dati iniziali, che attraverso l’equazione di Maxwell determinano
il valore del campo in ogni istante.

5.1 I gradi di libertà del campo elettromagnetico

Innanzitutto dobbiamo spiegare cosa intendiamo con “grado di libertà” in una generica
teoria di campo. La definizione che ne daremo costituisce una generalizzazione del con-
cetto analogo in meccanica classica – prototipo di un sistema lagrangiano a finiti gradi
di libertà. Prima di passare alla teoria di campo è allora utile ricordare brevemente il
significato di questo importante concetto in meccanica.

5.1.1 I gradi di libertà in meccanica newtoniana

In meccanica newtoniana il concetto di grado di libertà si riferisce al numero di variabili


lagrangiane necessarie per descrivere cinematicamente un sistema fisico. Per esempio,
una particella che si muove nello spazio tridimensionale è caratterizzata da tre gradi di
libertà, in quanto la sua posizione è specificata in ogni istante t dalle tre coordinate ~y (t).
Ma possiamo analizzare lo stesso sistema fisico anche da un altro punto vista, ponendoci
la domanda: quanti dati iniziali, diciamo a t = 0, dobbiamo assegnare per poter predire
la posizione della particella in ogni istante? La risposta – sei e non tre – è strettamente
legata alla dinamica della particella, vale a dire all’equazione di Newton,

d2 ~y
m = F~ ,
dt2

quale equazione differenziale del secondo ordine nel tempo, che richiede di assegnare sia
~y (0) che ~v (0). Potremmo porre il problema dinamico equivalentemente nella forma,

d~v d~y
m = F~ , = ~v ,
dt dt

che rappresenterebbe in effetti un sistema a sei gradi di libertà. Ci rendiamo cosı̀ conto
che la convenzione comune “una particella corrisponde a tre gradi di libertà” sottintende

116
in realtà tre gradi di libertà del secondo ordine. Equivalentemente potremmo infatti dire
che una particella corrisponde a sei gradi di libertà del primo ordine. La preferenza
per la prima convenzione discende dal fatto che il determinismo newtoniano – confermato
sperimentalmente in modo universale – prevede in generale che una variabile fondamentale
è determinata in ogni istante, se a un dato istante si conoscono il suo valore e la sua
derivata prima.
D’ora in poi useremo il termine “grado di libertà” – sottintendendo “del secondo
ordine” – per una variabile la cui dinamica sia governata da un’equazione del moto che,
noti il suo valore e la sua derivata ad un dato istante, determina la variabile in ogni
istante.

5.1.2 I gradi di libertà in teoria di campo

In teoria di campo le variabili fondamentali sono i campi – che da un punto di vista


meccanico corrispondono a un sistema a infiniti gradi di libertà. Mantenendo l’analogia
con la meccanica, ma adattando la prospettiva, diamo allora la seguente definizione.
Definzione. Diremo che un campo ϕ(t, ~x) corrisponde a un grado di libertà (del secondo
ordine) se le equazioni del moto che governano la sua dinamica sono tali, che noti ϕ(0, ~x)
e ∂0 ϕ(0, ~x) in tutto lo spazio, esse determinano ϕ(t, ~x) per ogni t.
Come prototipo di un’equazione di questo tipo consideriamo l’equazione per un campo
scalare,
2 ϕ = P (ϕ), (5.1)

dove P (ϕ) è un polinomio in ϕ e,

2 ≡ ∂µ ∂ µ = ∂02 − ∇2 ,

è l’operatore d’Alembertiano, completamento relativistico dell’operatore Laplaciano tri-


dimensionale. Questa equazione è del secondo ordine nella derivata temporale e ci aspet-
tiamo quindi che essa assegni a ϕ un grado di libertà. Per convincerci che questo è
effettivamente il caso fissiamo i dati iniziali,

ϕ(0, ~x) e ∂0 ϕ(0, ~x),

117
e cerchiamo di determinare ϕ(t, ~x) imponendo la (5.1). Se assumiamo che la soluzione sia
una funzione analitica in t possiamo svilupparla in serie di Taylor,
X∞
∂0n ϕ(0, ~x) n
ϕ(t, ~x) = t , (5.2)
n=0
n!

e cercare di determinare i coefficienti usando la (5.1). I coefficienti con n = 0 e n = 1


sono fissati dai dati inizili. Il coefficiente con n = 2 si ottiene invece valutando la (5.1) in
t = 0,
∂02 ϕ(0, ~x) = ∇2 ϕ(0, ~x) + P (ϕ(0, ~x)).

Derivando poi la (5.1) una volta rispetto al tempo e valutandola in t = 0 si ottiene il


coefficiente con n = 3,

∂03 ϕ(0, ~x) = ∇2 ∂0 ϕ(0, ~x) + P 0 (ϕ(0, ~x)) ∂0 ϕ(0, ~x).

Derivando ripetutamente la (5.1) rispetto al tempo si ottengono cosı̀ tutte le derivate


∂0n ϕ(0, ~x) in termini delle derivate spaziali dei dati iniziali ϕ(0, ~x) e ∂0 ϕ(0, ~x), e la solu-
zione è quindi univocamente determinata. È poi facile vedere che si giunge alla stessa
conclusione se P è un arbitrario polinomio in ϕ e ∂µ ϕ, e anche se il membro di destra
della (5.1) contiene un termine aggiuntivo noto j(x), indipendente da ϕ.

5.1.3 Il problema di Cauchy per l’equazione di Maxwell

Siamo ora in grado di affrontare il problema di Cauchy, ovverosia il problema alle condi-
zioni inziali, per l’equazione di Maxwell. In particolare vogliamo stabilire quanti e quali
sono i gradi di libertà associati alla propagazione del campo elettromagnetico. Se secondo
la nostra consueta strategia risolviamo l’identità di Bianchi introducendo un potenziale
vettore Aµ , allora il sistema di equazioni da risolvere schematicamente si scrive,

∂µ F µν = j ν , F µν ≡ ∂ µ Aν − ∂ ν Aµ , Aµ ≈ Aµ + ∂ µ Λ.

Condizioni asintotiche. Prima di affrontare la soluzione di questo sistema specifichia-


mo la classe di configurazioni del potenziale vettore e della corrente che consideriamo
“fisicamente accettabili”. Assumeremo intanto che la corrente sia nota e – ovviamente – a

118
quadridivergenza nulla. Supporremo inoltre che per ogni t fissato essa sia a supporto spa-
ziale compatto, come succede per qualsiasi distribuzione di carica realizzabile in natura.
Richiederemo, cioè, che,
j µ (t, ~x) = 0, per |~x| > R, (5.3)

dove il raggio R in generale dipende da t. Corrispondentemente accetteremo come so-


luzioni “fisiche” dell’equazione di Maxwell solo quelle che per ogni t fissato all’infinito
spaziale si annullano,
lim Aµ (t, ~x) = 0. (5.4)
|~
x|→∞

Si può, infatti, vedere che questa condizione discende essenzialmente dall’assunzione che
non ci siano cariche all’infinito.
Nel caso particolare di un campo elettromagnetico nel vuoto, in realtà non sembra
esserci nessun legame tra la condizione (5.4) e la posizione delle cariche – semplicemente
perché le cariche sono assenti. Tuttavia, un “campo nel vuoto” costituisce la schema-
tizzazione matematica di una situazione realizzabile fisicamente, in cui il campo è stato
generato da delle cariche “lontane” in un “passato lontano”, e quindi anche in questo
caso all’infinito esso sarà zero. Facciamo comunque notare che la condizione (5.4) esclude
anche certe soluzioni idealizzate – di per sé non fisiche – che vengono però spesso uti-
lizzate in Elettrodinamica per semplificare le analisi svolte. Cosı̀ essa esclude il campo
elettromagnetico costante e uniforme f µν , con potenziale vettore,

1
Aµ (x) = xν f νµ , F µν (x) = f µν ,
2

i campi prodotti da fili e piani infiniti uniformemente carichi, e la stessa onda piana, in
quanto infinitamente estesa, vedi (5.61).
Esplicitiamo ora l’equazione di Maxwell in termini del potenziale vettore,

∂µ (∂ µ Aν − ∂ ν Aµ ) = 2Aν − ∂ ν (∂µ Aµ ) = j ν .

Per via della presenza delle derivate seconde rispetto al tempo ci si potrebbe aspettare
che questo sistema corrisponda a quattro gradi di libertà. Tuttavia, questa conclusione è
affrettata, per i seguenti due motivi.

119
Un vincolo. Il primo motivo è costituito dal fatto che – come già notato nel para-
grafo 2.2.3 – le quattro componenti dell’equazione di Maxwell non sono funzionalmente
indipendenti. Definito,

Gν ≡ ∂µ F µν − j ν = 2Aν − ∂ ν (∂µ Aµ ) − j ν , (5.5)

vale infatti identicamente,

∂ν Gν = 0 ⇒ ∂0 G0 = −∂i Gi . (5.6)

Ciò significa che le quattro equazioni di Maxwell,

Gµ = 0,

sono equivalenti al sistema,

Gi (t, ~x) = 0, ∀t (5.7)

G0 (0, ~x) = 0. (5.8)

Infatti, imposto Gi (t, ~x) = 0 ∀ t la (5.6) assicura che ∂0 G0 (t, ~x) = 0, e quindi la funzione
G0 (t, ~x) è indipendente dal tempo; è allora sufficiente imporre il suo annullamento all’i-
stante t = 0. La componento 0 dell’equazione di Maxwell si riduce quindi a un vincolo
sui dati iniziali, e non va considerata come una vera e propria equazione del moto.
Invarianza di gauge e gauge–fixing. Il secondo motivo per cui il conteggio dei gradi
di libertà di cui sopra è errato è costituito dal fatto che il potenziale vettore è definito
solo modulo una trasformazione di gauge: i potenziali Aµ e Aµ + ∂ µ Λ corrispondono allo
stesso campo elettromagnetico F µν , e sono quindi fisicamente equivalenti. Si rende allora
necessario selezionare tra tutti i potenziali vettore associati ad un dato F µν , un unico
rappresentante, ovverosia, come si suol dire, attuare un “gauge–fixing” su Aµ . Evidente-
mente ci sono infiniti modi diversi di fissare la gauge, tutti fisicamente equivalenti. Noi
optiamo per la cosiddetta “gauge di Lorentz”, rappresentata dal vincolo,

∂µ Aµ = 0, (5.9)

per il suo pregio di essere preservata sotto trasformazioni di Lorentz 19 . La consistenza di


questa scelta deriva dal fatto che a partire da un potenziale vettore arbitrario è sempre
19 ~ ·A
Gauge–fixing non covarianti usati talvolta sono la gauge di Coulomb ∇ ~ = 0, e la gauge assiale
A = 0, oppure, più in generale, nµ Aµ = 0, con nµ vettore costante.
0

120
possibile eseguire una trasformazione di gauge, tale che il nuovo potenziale vettore abbia
quadridivergenza nulla,
∂µ (Aµ + ∂ µ Λ) = 0.

È infatti sufficiente scegliere Λ tale che,

2Λ = −∂µ Aµ ,

equazione che, come visto nel paragrafo precedente, ammette in effetti infinite soluzioni.
Con il gauge–fixing (5.9) l’equazione di Maxwell (5.5) si semplifica e diventa,

Gµ = 2Aµ − j µ = 0.

Useremo questa forma per le componenti spaziali Gi dell’equazione mentre, per quello che
segue, per la componente G0 è più conveniente usare l’espressione originale (5.5),

G0 = 2A0 − ∂ 0 (∂0 A0 + ∂i Ai ) − j 0 = −∇2 A0 − ∂i (∂ 0 Ai ) − j 0 = 0. (5.10)

Si noti che questa equazione non contiene la derivata seconda rispetto al tempo: come an-
ticipato sopra, essa va infatti interpretata come un vincolo, piuttosto che come equazione
dinamica.
Invarianza di gauge residua. Resta a questo punto la domanda se la gauge di Lorentz
è completa, cioè, se essa fissa il potenziale vettore univocamente. La risposta è negativa
perché, assumendo che valga ∂µ Aµ = 0 e volendo restare nella classe di potenziali che
soddisfano questa condizione, possiamo ancora eseguire trasformazioni di gauge Aµ →
Aµ + ∂ µ Λ, a patto che,

∂µ (Aµ + ∂ µ Λ) = 0 ⇒ 2Λ = 0.

Sussiste, cioè, l’invarianza di gauge “residua”,

Aµ ≈ Aµ + ∂ µ Λ, 2Λ = 0. (5.11)

Anche il gauge–fixing dell’invarianza residua può essere eseguito in infiniti modi equiva-
lenti. Noi optiamo per le condizioni,

A3 (0, ~x) = 0 = ∂0 A3 (0, ~x), (5.12)

121
che si possono in effetti imporre eseguendo una trasformazione di gauge residua. Per
farlo vedere ricordiamo dal paragrafo precedente che la soluzione dell’equazione 2Λ = 0
è completamente determinata dalle “condizioni iniziali”,

Λ(0, ~x) ≡ Φ1 (~x), ∂0 Λ(0, ~x) ≡ Φ2 (~x).

Per una trasformazione di gauge abbiamo,

A03 = A3 + ∂ 3 Λ, (5.13)

ed è facile vedere che esistono dei campi Φ1 e Φ2 tali che,

A03 (0, ~x) = A3 (0, ~x) + ∂ 3 Λ(0, ~x) = A3 (0, ~x) + ∂ 3 Φ1 (~x) = 0, (5.14)

∂0 A03 (0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 ∂0 Λ(0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 Φ2 (~x) = 0. (5.15)

Infatti, è sufficiente scegliere per Φ1 e Φ2 delle primitive rispetto alla variabile x3 , rispet-
tivamente di −A3 (0, ~x) e −∂0 A3 (0, ~x). Per il potenziale trasformato le (5.14) e (5.15)
equivalgono allora effettivamente alle (5.12).
In conclusione, tenendo conto delle condizioni di gauge–fixing (5.9) e (5.12) ci siamo
ricondotti al seguente sistema di equazioni,

2Ai = j i , (5.16)

∇2 A0 = −∂i (∂ 0 Ai ) − j 0 , per t = 0, (5.17)

∂µ Aµ = 0, (5.18)

A3 (0, ~x) = 0 = ∂0 A3 (0, ~x). (5.19)

Facciamo ora vedere che questo sistema ammette in effetti soluzione unica per Aµ (t, ~x),
una volta assegnate le condizioni iniziali “fisiche”,

A1 (0, ~x), ∂0 A1 (0, ~x), A2 (0, ~x), ∂0 A2 (0, ~x). (5.20)

Intanto osserviamo che con queste condizioni iniziali e con le (5.19), le tre equazioni (5.16)
determinano Ai (t, ~x) per ogni t. Noti i campi Ai , la (5.17) determina allora univocamente
A0 (0, ~x), perché nello spazio delle funzioni che svaniscono all’infinito il Laplaciano tridi-
mensionale ammette inverso unico, vedi sezione 6.1. Noti A0 (0, ~x) e i campi Ai (t, ~x), la

122
(5.18) determina infine A0 (t, ~x) per ogni t,
Z t
0 0
A (t, ~x) = A (0, ~x) − ~ · A(t
∇ ~ 0 , ~x) dt0 .
0

In conclusione, una volta assegnate le quattro condizioni iniziali fisiche (5.20), l’equa-
zione di Maxwell determina i campi Aµ (t, ~x) in modo univoco. Con la procedura scelta
da noi i campi “fisici” sono risultati A1 e A2 , ma è chiaro che una scelta diversa del
gauge–fixing porterà ad assegnazioni diverse. Quello che resterà però invariato è il nu-
mero di condizioni iniziali – quattro – che si possono imporre arbitrariamente. Resta
poi il problema, solo tecnico, di come si deducono i dati (5.20) a partire dai dati iniziali
osservabili sperimentalmente, che sono i campi elettrico e magnetico all’istante iniziale.
~ ~x) e B(0,
Difatti, noti E(0, ~ ~x) e imposti i gauge–fixing (5.18) e (5.19), la determinazione

dei dati iniziali (5.20) è un semplice esercizio, lasciato al lettore.


I due gradi di libertà del campo elettromagnetico. Dai dati indipendenti (5.20) vedia-
mo infine che il campo elettromagnetico corrisponde a due gradi di libertà, come anticipato
nel paragrafo 2.2.3, e non a quattro. Dalla nostra trattazione si desume in particolare
che il meccanismo che elimina da Aµ due gradi di libertà è essenzialmente il seguente: un
grado di libertà viene assorbito dall’invarianza di gauge e l’altro dall’invarianza di gauge
residua, in concomitanza con il fatto che una delle quattro equazioni di Maxwell in realtà
è un vincolo. Aggiungiamo, tuttavia, che 1) quali siano le componenti di Aµ che appaiono
come fisiche, dipende dalla scelta del gauge–fixing, e che 2) sotto una trasformazione di
Lorentz queste componenti non restano invariate. Infatti, mentre la gauge di Lorentz
(5.9) è invariante sotto trasformazioni di Lorentz, le condizioni (5.12) non lo sono. È im-
portante notare che questa circostanza non viola affatto l’invarianza relativistica, perchè,
come abbiamo visto, in qualsiasi sistema di riferimento le condizioni (5.12) possono essere
ripristinate eseguendo un’opportuna trasformazione di gauge.
Il fatto che i gradi di libertà fisici del campo elettromagnetico sono due ha varie con-
seguenze importanti: a livello classico esso implica, come vedremo tra poco, che le onde
elettromagnetiche sono caratterizzate da due vettori di polarizzazione indipendenti, men-
tre a livello quantistico esso comporta che i fotoni esistono in due stati di polarizzazione
indipendenti, contrassegnati da “elicità” opposte.

123
5.2 L’equazione delle onde

Consideriamo un campo scalare reale con lagrangiana,

1
L= ∂µ ϕ∂ µ ϕ. (5.21)
2
L’equazione di Eulero–Lagrange associata a questa lagrangiana viene chiamata equazione
delle onde, o anche equazione di d’Alembert,

∂L ∂L
∂µ − = ∂µ ∂ µ ϕ = 2ϕ = 0. (5.22)
∂(∂µ ϕ) ∂ϕ
Essa riveste un ruolo importante in Fisica e in particolar modo in Elettrodinamica, motivo
per cui ora analizzeremo in dettaglio la sua soluzione generale. In particolare vedremo che
la ricerca delle soluzioni dell’equazione di Maxwell nel vuoto sarà molto facilitata dalla
conoscenza della soluzione generale della (5.22). In analogia con le condizioni asintotiche
(5.4) considereremo solo soluzioni che soddisfano,

lim ϕ(t, ~x) = 0. (5.23)


|~
x|→∞

Se assumiamo che eventuali singolarità di ϕ(x) siano di tipo distribuzionali, vale a dire
se assumiamo che ϕ sia un elemento di S 0 (R4 ), un metodo potente per risolvere l’equazione
delle onde è fornito dalla trasformata di Fourier, che costituisce appunto una biiezione di
S 0 in se stesso. Ricordiamo che in notazione simbolica questa trasformata è definita da,
Z Z
1 4 −ik·x 1
ϕ(k)
b = d xe ϕ(x), ϕ(x) = d4 k eik·x ϕ(k),
b (5.24)
(2π)2 (2π)2
dove abbiamo introdotto la variabile duale k ≡ k µ e definito k · x = k µ xµ ηµν . Tra le
proprietà della trasformata di Fourier ci serviranno le seguenti, vedi paragrafo 2.3.2.
1) Se il campo ϕ è reale, come da noi sottinteso, allora la trasformata soddisfa,

b ∗ (k) = ϕ(−k).
ϕ b (5.25)

Per vederlo è sufficiente prendere il complesso coniugato della prima relazione in (5.24),
e sfruttare il fatto che ϕ∗ (x) = ϕ(x).
2) Se ϕ(x) è un campo scalare sotto trasformazioni di Lorentz, e se assegniamo a k µ
carattere vettoriale,
k 0µ = Λµ ν k ν ,

124
allora anche la trasformata ϕ(k)
b è un campo scalare,

b0 (k 0 ) = ϕ(k).
ϕ b

Per la dimostrazione è sufficiente usare le relazioni k 0 · x0 = k · x, e d4 x0 = d4 x.


3) Per la trasformata delle derivate di ϕ abbiamo,

[P\
(∂µ )ϕ](k) = P (ikµ )ϕ(k),
b

dove P (∂µ ) è un qualsiasi polinomio nelle derivate parziali ∂µ .


Usando la proprietà 3) è immediato eseguire la trasformata di Fourier dell’equazione
delle onde, e si ottiene,
k 2 ϕ(k)
b = 0, (5.26)

dove,
k 2 = kµ k µ = (k 0 )2 − |~k|2 .

In seguito useremo anche,


ω ≡ |~k|,

per indicare la “frequenza”. Vediamo che la trasformata di Fourier ha mutato l’equazio-


ne differenziale (5.22) in un’equazione algebrica, facilmente risolubile nello spazio delle
distribuzioni. Dalla (5.26) si vede in particolare che ϕ(k)
b ha come supporto il cono luce,

k 0 = ±|~k|,

ed è quindi chiaro che essa non può essere una “funzione” ordinaria. In realtà le soluzioni
di questa equazione cadono in due categorie, che ora analizzeremo separatamente.
Soluzioni di tipo I. Analizziamo innanzitutto le soluzioni in una regione del cono luce
che non contenga l’origine, cioé, per ~k 6= 0. Per ~k fissato è allora conveniente considerare
le ϕ(k)
b come distribuzioni nella sola variabile k 0 , perché in questo modo le soluzioni della
(5.26) possono essere derivate direttamente dalla soluzione del problema 2.3. È infatti
sufficiente eseguire in questo problema le sostituzioni,

x → k0, a → ω, x2 − a2 → (k 0 )2 − ω 2 = k 2 , f (x) → f (k),

125
con f (k) generica funzione complessa di k µ , per ottenere le soluzioni della (5.26),

bI (k) = δ(k 2 )f (k).


ϕ (5.27)

Ricordando che ϕ(x) è reale la (5.25) impone poi,

f ∗ (k) = f (−k). (5.28)

Inoltre, dato che δ(k 2 ) è Lorentz–invariante e ϕ(k)


b è campo scalare, anche la funzione
f (k) è dunque uno scalare per trasformazioni di Lorentz. Usando le proprietà della δ di
Dirac possiamo allora esplicitare le soluzioni (5.27) come segue,

1 ¡ ¢
ϕ
bI (k) = δ(k 0 − ω) + δ(k 0 + ω) f (k 0 , ~k)

1 ³ ´
= 0 ~ 0
δ(k − ω)f (ω, k) + δ(k + ω)f (−ω, k) ~

1 ³ ´
= 0 ~ 0 ∗
δ(k − ω) ε(k) + δ(k + ω) ε (−k) , ~ (5.29)

dove nell’ultimo passaggio abbiamo definito la funzione complessa di tre variabili,

ε(~k) ≡ f (ω, ~k),

e sfruttato la (5.28).
Soluzioni di tipo II. Il problema 2.3 è ben posto solo se a 6= 0, ovvero ω 6= 0, che
esclude dal cono luce l’origine quadridimensionale k µ = 0. Potrebbero dunque esistere
ulteriori soluzioni della (5.26), supportate nel punto k µ = 0. Per il teorema sulle distribu-
zioni supportate in un punto, vedi paragrafo 2.3.2, sappiamo allora che queste soluzioni
sarebbero necessariamente combinazioni lineari finite della δ 4 (k) e delle sue derivate,
N
X
ϕ
bII (k) = C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k), (5.30)
n=1

dove i C µ1 ···µn sono arbitrari tensori costanti completamente simmetrici. Antitrasformando


questa espressione nello spazio delle configurazioni e tenendo conto che la trasformata della
δ 4 vale 1/(2π)4 si ottiene,
N
1 X
ϕII (x) = (−i)n C µ1 ···µn xµ1 · · · xµn . (5.31)
(2π)4 n=1

126
Inserendo questa espressione nella (5.22) è facile vedere che l’equazione di d’Alembert è
soddisfatta, se e solo se i tensori simmetrici C sono anche a traccia nulla,

Cν νµ3 ···µn = 0. (5.32)

Ed è altrettanto immediato vedere che queste condizioni ammettono infinite soluzioni. Per
esempio, nel caso n = 2, che corrisponde a un polinomio del secondo ordine, la soluzione
generale della (5.32) è data da,

1 µν ρ
C µν = H µν − η H ρ,
4

dove H µν è un’arbitraria matrice simmetrica costante. Concludiamo quindi che esiste una
seconda classe di soluzioni, rappresentate dalla (5.31), che sono polinomi in xµ . Tuttavia,
come tali non svaniscono all’infinito spaziale, e quindi non le ammettiamo come soluzioni
fisiche.
Ritorniamo allora alle soluzioni di tipo I (5.29), antitrasformandole nello spazio delle
coordinate secondo la (5.24). Integrando la δ di Dirac in k 0 e eseguendo nell’integrale
che coinvolge ε∗ (−~k) il cambiamento di variabili ~k → −~k, si ottiene la soluzione generale
dell’equazione delle onde,
Z 3 Z ³ ´
1 dk 0 i(k0 x0 −~k·~
x) 0 ~k) + δ(k 0 + ω) ε∗ (−~k) ,
ϕ(x) = dk e δ(k − ω) ε(
(2π)2 2ω
Z 3 ³ ´
1 d k ik·x ~
= e ε(k) + c.c. . (5.33)
(2π)2 2ω

Sottolineiamo il fatto che nell’espressione finale (5.33) la componente k 0 nell’esponenziale


è definita da k 0 = +ω, e che k 2 = 0. Vediamo quindi che la soluzione generale è identificata
da due funzioni reali di tre variabili,

ε(~k) = ε1 (~k) + i ε2 (~k),

in accordo con il fatto che un campo scalare che soddisfa l’equazione delle onde corrisponde
a un grado di libertà. Difatti non è difficile determinare ε1 (~k) e ε2 (~k) in termini dei dati
iniziali ϕ(~x, 0) e ∂0 ϕ(~x, 0), e viceversa, vedi il prossimo paragrafo.
Onde elementari. Vediamo che la soluzione generale (5.33) dell’equazione delle onde
può essere riguardata come una sovrapposizione di infinite “onde elementari” di vettore

127
d’onda ~k fissato,
ϕel (x) = ε(~k) eik·x + c.c., k 0 = ω. (5.34)

Esaminiamo ora le principali proprietà di queste onde.


a) Le ϕel sono onde piane, i cui piani delle fasi sono ortogonali a ~k. Per t fissato su un
piano delle fasi la funzione ϕel (x) assume lo stesso valore.
b) Le ϕel sono onde che si propagano con la velocità della luce nella direzione di ~k. Se
scegliamo ~x//~k abbiamo infatti: kµ xµ = ω t − ~k · ~x = ω(t − |~x|).
c) Le ϕel sono onde monocromatiche di frequenza ω, periodo T = 2π/ω e lunghezza d’onda
λ = 2πc/ω, fissati.
d) Le ϕel sono onde scalari nel senso che il “tensore di polarizzazione” ε, che ne identifica
l’intensità, è uno scalare sotto trasformazioni di Lorentz.
e) Contenuto in energia. Dalla lagrangiana (5.21) è immediato ottenere il tensore energia–
impulso del campo, vedi problema 3.4,

1 µν α
T µν = ∂ µ ϕ∂ ν ϕ − η ∂ ϕ∂α ϕ. (5.35)
2

Per valutarlo determiniamo le derivate dell’onda elementare,

∂µ ϕel (x) = i kµ ε(~k) eik·x + c.c.

e introduciamo il “vettore” di tipo nullo,

kµ ~k
nµ ≡ , n0 = 1, ~n = , n2 = nµ nµ = 0, (5.36)
ω ω

dove ~n è il versore tridimensionale che indica la direzione di propagazione dell’onda. Allora


possiamo scrivere in modo compatto,

∂µ ϕel = nµ ϕ̇el ,

e ne segue che ∂ α ϕel ∂α ϕel = 0. Usando queste relazioni nella (5.35) e inserendo la (5.34)
si ottiene,
¡ ¢
T µν = nµ nν ϕ̇2el = nµ nν ω 2 2|ε|2 − ε2 e2ik·x − ε∗2 e−i2k·x . (5.37)

Mediando il tensore energia–impulso su scale temporali grandi rispetto al periodo e su


scale spaziali grandi rispetto alla lunghezza d’onda, gli esponenziali si mediano a zero e

128
si ottiene,
hT µν i = 2 k µ k ν |ε|2 .

Vediamo che la densità di energia dell’onda vale in media hT 00 i = 2 ω 2 |ε|2 , mentre il


flusso di energia vale hT 0i i = 2 ω 2 |ε|2 ni ed è diretto lungo la direzione di propagazione
dell’onda. Considerando infine un volume V piccolo, ma grande rispetto alla lunghezza
d’onda, possiamo determinare il quadrimomento P µ ivi contenuto. Otteniamo,

P 0 = hT 00 i V = 2 ω 2 |ε|2 V, P i = hT 0i i V = 2 ω 2 |ε|2 V ni .

La massa della “particella” corrispondente a questo volume risulta allora essere uguale a
zero in quanto,
¡ ¢2 ¡ ¢
M 2 = P µ Pµ = 2 ω 2 |ε|2 V 1 − |~n|2 = 0.

Questo risultato è in accordo con il fatto che in teoria quantistica di campo la particella
associata a un campo scalare soddisfacente l’equazione delle onde (5.22), è in effetti una
particella (neutra e di spin zero) priva di massa.

5.2.1 Il problema alle condizioni iniziali

Affrontiamo infine il problema alle condizioni iniziali. Vogliamo, cioè, trovare la forma
esplicita della soluzione dell’equazione delle onde, fissati i dati iniziali,

ϕ(0, ~x) ≡ f (~x),

∂0 ϕ(0, ~x) ≡ g(~x).

Si tratta dunque di determinare la funzione complessa ε(~k) della (5.33), in termini del-
le due funzioni reali f e g. A questo scopo è conveniente sviluppare queste ultime in
trasformata di Fourier,
Z Z
1 ~ 1 ~
f (~x) = 3/2
d3 k e−ik·~x fb(~k), g(~x) = d3 k e−ik·~x gb(~k), (5.38)
(2π) (2π)3/2

e valutare la (5.33) e la sua derivata temporale a t = 0,


Z 3 ³ ´
1 d k −i~k·~x ~
f (~x) = ϕ(0, ~x) = e ε(k) + c.c. ,
(2π)2 2ω
Z 3 ³ ´
1 dk −i~k·~
x ~
g(~x) = ∂0 ϕ(0, ~x) = i ω e ε(k) + c.c. . (5.39)
(2π)2 2ω

129
Confrontando con le (5.38) e antitrasformando si trova,

1 1 ³ ~ ´
fb(~k) = √ ∗ ~
ε(k) + ε (−k) ,
2π 2ω
1 i ³ ~ ´
gb(~k) = √ ∗ ~
ε(k) − ε (−k) ,
2π 2

e quindi,
p ³ ´
ε(~k) = b ~ ~
(2π) ω f (k) − i gb(k) .

Sostituendo questa espressione nella (5.33) si ottiene,


Z
1 d3 k h ik·x ³ b ~ ~
´ i
ϕ(x) = e ω f (k) − ib
g (k) + c.c. . (5.40)
(2π)3/2 2ω

Infine possiamo invertire le trasformate (5.38) per riesprimere fb e gb in termini di f e g.


Sostituendo le espressioni che ne risultano nella (5.40) si trova infine la formula cercata,
vedi problema 5.1,
Z
ϕ(t, ~x) = d3 y [D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] , (5.41)

dove il “kernel antisimmetrico” D è dato da,


Z Z
1 d3 k ¡ ik·x ¢ 1 sen(ωt) i~k·~x
D(t, ~x) = e − e−ik·x = d3 k e . (5.42)
(2π)3 2ωi (2π)3 ω

La trasformata di Fourier tridimensionale che compare in questa espressione è da inten-


dersi nel senso delle distribuzioni. Eseguendola esplicitamente si trova, vedi problema
5.1,
1 1
D(t, ~x) = (δ(t − r) − δ(t + r)) = ε(t) δ(x2 ), (5.43)
4πr 2π
dove ε(·) indica la funzione “segno” e r = |~x|. Dalle espressioni scritte sopra si deduce
facilmente che questo kernel gode delle seguenti proprietà,

2D = 0, (5.44)

D(0, ~x) = 0, (5.45)

∂0 D(0, ~x) = δ 3 (~x). (5.46)

Usando queste proprietà è poi immediato verificare esplicitamente che la (5.41) soddisfa
l’equazione delle onde (5.22), con le corrette condizioni iniziali. Per quanto riguarda

130
ϕ(0, ~x) questo discende direttamente dalle (5.45), (5.46), mentre per quanto riguarda
∂0 ϕ(0, ~x), derivando la (5.41) rispetto al tempo e ponendo t = 0 si ottiene,
Z
£ ¤
∂0 ϕ(0, ~x) = d3 y ∂0 D(0, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂02 D(0, ~x − ~y ) ϕ(0, ~y ) .

Il primo integrale si riduce a ∂0 ϕ(0, ~x) grazie alla (5.46), mentre il secondo si annulla
perché la (5.44) valutata in t = 0 dà,

∂02 D(0, ~x) = ∇2 D(0, ~x) = 0,

grazie alla (5.45). Torneremo sul significato fisico del kernel D, e le conseguenti proprietà
della soluzione (5.41), nella prossima sezione.

5.3 Soluzioni dell’equazione di Maxwell nel vuoto

In questa sezione determineremo la soluzione generale dell’equazione di Maxwell in assenza


di sorgenti,

∂µ F µν = 0, F µν ≡ ∂ µ Aν − ∂ ν Aµ , Aµ ≈ Aµ + ∂ µ Λ. (5.47)

Un campo elettromagnetico che soddisfa questa equazione viene chiamato “campo libero”,
oppure “campo di radiazione”. Stiamo quindi cercando la forma di un generico campo
di radiazione. Siccome il sistema di equazioni in questione è lineare nei campi, la tecnica
di soluzione più appropriata è ancora quella della trasformata di Fourier. Ricordiamo
infatti che, in base all’analisi svolta nella sezione 2.3, consideriamo sia F µν che Aµ come
distribuzioni temperate.
Per affrontare la soluzione del sistema (5.47) dobbiamo innanzitutto decidere il tipo di
gauge–fixing che vogliamo adottare. Come esemplificato nel paragrafo 5.1.3, ci conviene
scegliere la gauge di Lorentz,
∂µ Aµ = 0,

per via della sua covarianza a vista, mentre ci riserviamo di fissare la gauge residua in
un secondo momento. Secondo l’analisi svolta nel paragrafo 5.1.3, particolarizzata al caso
j µ = 0, dobbiamo allora risolvere il seguente sistema,

2Aµ = 0, (5.48)

131
∂µ Aµ = 0, (5.49)

Aµ ≈ Aµ + ∂ µ Λ, 2Λ = 0. (5.50)

La trasformata di Fourier del potenziale vettore è definita in modo standard,


Z
bµ 1
A (k) = d4 x e−ik·x Aµ (x),
(2π)2
b
e analogamente quella Λ(k) bµ (k) e
del campo Λ(x). L’unica differenza sostanziale tra A
la trasformata di Fourier del campo scalare ϕ(k),
b è che sotto trasformazioni di Lorentz
bµ (k) trasforma come un campo vettoriale, vedi problema 5.2,
A

b0µ (k 0 ) = Λµ ν A
A bν (k).

Il sistema di equazioni differenziali (5.48)–(5.50) muta allora nuovamente in un sistema


algebrico,

bµ (k) = 0,
k2A (5.51)
bµ (k) = 0,
kµ A (5.52)
bµ (k) ≈ A
A bµ (k) + i k µ Λ(k),
b b
k 2 Λ(k) = 0. (5.53)

La soluzione generale della (5.51) si ottiene come nel caso delle onde scalari, vedi (5.27)
e (5.29), con l’unica differenza che la funzione “peso” ora è un quadrivettore f µ (k),
³ ´
bµ (k) = δ(k 2 )f µ (k) = 1 δ(k 0 − ω) εµ (~k) + δ(k 0 + ω) ε∗µ (−~k) ,
A (5.54)

dove abbiamo posto,


εµ (~k) ≡ f µ (ω, ~k), ω = |~k|.

Cosı̀ come nel caso delle onde scalari ε(~k) era un quadriscalare cosı̀ ora εµ (~k) è un quadri-
vettore, che viene chiamato “vettore di polarizzazione”. A questo punto la (5.52) impone
su questo vettore la condizione di “trasversalità”,

kµ εµ = 0, con k 0 = ω. (5.55)

b si ottiene,
Analogamente, risolvendo l’equazione (5.53) per Λ

b 1 ³ 0 ~ 0 ∗ ~
´
Λ(k) = δ(k − ω)λ(k) − δ(k + ω)λ (−k) .
2ωi
132
La (5.53) asserisce allora che i vettori di polarizzazione, oltre a essere soggetti al vincolo
(5.55), sono definiti modulo la trasformazione di gauge residua,

εµ (~k) ≈ εµ (~k) + k µ λ(~k). (5.56)

Si noti che questa trasformazione preserva la gauge di Lorentz (5.55), in quanto grazie a
k 2 = 0 si ha,
kµ (εµ + k µ λ) = 0.

Si evince cosı̀ che delle quattro componenti del vettore di polarizzazione solo due hanno
rilevanza fisica: una componente viene eliminata dalla condizione (5.55), e un’altra dalla
gauge residua (5.56). Scegliendo per esempio nella (5.56),

ε0
λ=− ,
ω

possiamo annullare ε0 , e la (5.55) si riduce allora a,

~k · ~ε = 0,

che impone l’annullamento della componente di ~ε lungo la direzione di ~k. Riconfermiamo


cosı̀ il fatto che il campo elettromagnetico propaga due gradi di libertà fisici.
Antitrasformando la (5.54) si trova infine il potenziale vettore nello spazio delle coor-
dinate,
Z
µ 1 d3 k ³ ik·x µ ~ ´
A (x) = e ε (k) + c.c. , (5.57)
(2π)2 2ω
e per il campo elettromagnetico si ottiene allora,
Z
µν µ ν 1 ν µ d3 k ¡ ik·x µ ν ¢
F =∂ A −∂ A = i e [k ε − k ν εµ ] + c.c. . (5.58)
(2π)2 2ω

Introducendo per la variabile di integrazione ~k coordinate polari, ~k ↔ (ω, ϕ, ϑ), d3 k =


ω 2 dω dΩ, si può anche scrivere,
Z ∞ Z ³ ´
µν i iωt −i~k·~
x µ ν ν µ
F (t, ~x) = dω e ω dΩ e [k ε − k ε ] + c.c. (5.59)
2(2π)2 0

Riconosciamo in particolare che questa espressione può essere posta nella forma,
Z ∞
µν 1
F (t, ~x) = √ dω eiωt F µν (ω, ~x), F ∗µν (ω, ~x) = F µν (−ω, ~x). (5.60)
2π −∞

133
Vediamo cosı̀ che la trasformata di Fourier di F µν nella sola variabile t, ovvero la quantità
F µν (ω, ~x), rappresenta il peso relativo con cui ogni frequenza ω compare nella sovrappo-
sizione di onde piane, di cui è composto il campo elettromagnetico nel vuoto. Questo
risultato verrà utilizzato quando analizzeremo il contenuto energetico della radiazione
“frequenza per frequenza”, cioè, quando eseguiremo la sua analisi spettrale, vedi capitolo
10.

5.3.1 Proprietà delle onde elettromagnetiche elementari

Dalla soluzione generale (5.57) dell’equazione di Maxwell nel vuoto vediamo che il generico
potenziale vettore risulta sovrapposizione di onde elementari, con vettore d’onda ~k fissato,

Aµel (x) = εµ eik·x + c.c., k 0 = ω, kµ εµ = 0, εµ ≈ εµ + k µ λ. (5.61)

Dalla sezione 5.2 sappiamo già che queste onde sono piane, moncocromatiche, e che viag-
giano con la velocità della luce. Ma queste onde non sono scalari, perché il tensore di
polarizzazione εµ è ora un vettore.
Le relazioni delle onde. Per derivare le caratteristiche addizionali derivanti dalla na-
turale tensoriale di queste onde, vedi le proprietà 1) – 4) elencate sotto, è conveniente
trovare un’opportuna forma per le derivate di Aµel . Per non appesantire la notazione d’ora
in poi indicheremo questo potenziale vettore semplicemente con Aµ . Derivando la (5.61)
risulta allora,
∂µ Aν = ikµ εν eik·x + c.c. (5.62)

Seguendo la notazione della sezione 5.2, vedi (5.36),

kµ ~k
nµ ≡ , n0 = 1, ~n = , n2 = nµ nµ = 0,
ω ω

dalle (5.61) e (5.62) seguono cosı́ facilmente le “relazioni delle onde”,

∂µ Aν = nµ Ȧν , nµ Ȧµ = 0, nµ nµ = 0. (5.63)

Queste relazioni investono un ruolo importante perché, come vedremo più avanti, non
valgono solo per le onde piane, ma anche per un generico campo elettromagnetico nella
cosiddetta “zona delle onde”, ovvero a grandi distanze dalle sorgenti. La dimostrazione

134
delle proprietà 1), 2) e 4) si baserà infatti su queste relazioni, e non sulle formule esplicite
(5.61): queste proprietà varranno quindi anche per un generico campo nella zona delle
onde – circostanza che sfrutteremo pesantemente quando studieremo il fenomeno dell’ir-
raggiamento da parte di cariche accelerate, vedi capitolo 7.
1) Onde trasverse. Le onde elettromagnetiche sono polarizzate trasversalmente, vale a
dire,
~ = 0 = ~n · B.
~n · E ~ (5.64)

I campi elettrico e campo magnetico sono quindi sempre ortogonali alla direzione di pro-
pagazione. Per far vedere questo determiniamo il campo elettromagnetico usando le
(5.63),
F µν = ∂ µ Aν − ∂ ν Aµ = nµ Ȧν − nν Ȧµ . (5.65)

Quindi,

E i = F i0 = ni Ȧ0 − Ȧi = ni (nk Ȧk ) − Ȧi (5.66)


1
B i = − εijk F jk = −εijk nj Ȧk , (5.67)
2

dove abbiamo usato che,


nµ Ȧµ = 0 ⇒ Ȧ0 = nk Ȧk . (5.68)

Le condizioni di trasversalità (5.64) seguono allora immediatamente dalle (5.66), (5.67).


~ e B.
2) Relazione tra E ~ Le onde elettromagnetiche sono tali che,

~ = |B|,
|E| ~ ~ ·B
E ~ = 0. (5.69)

Per fare vedere questo è sufficiente ricordare la forma degli invarianti quadratici,

~ · B,
εαβγδ Fαβ Fγδ = −8 E ~ F αβ Fαβ = 2 (B 2 − E 2 ).

Inserendo la (5.65) si trova che entrambi gli invarianti sono nulli – il primo per l’antisim-
metria del tensore di Levi–Civita, e il secondo per le (5.63) – e seguono le (5.69). Possiamo
riassumere le proprietà 1) e 2) nelle formule,

~ = ~n × E,
B ~ ~ = 0.
~n · E (5.70)

135
3) Due stati di polarizzazione fisici. Per ogni ~k fissato esistono due stati di polarizzazione
fisici indipendenti. Abbiamo già accennato a questo fatto nel paragrafo precedente, quı̀ lo
illustriamo da un altro punto di vista. Per concretezza scegliamo come asse z la direzione
di propagazione dell’onda, sicché,

k µ = (ω, 0, 0, ω).

La condizione kµ εµ = 0 pone allora εµ = (ε0 , ε1 , ε2 , ε0 ). Questo vettore di polarizzazione


può essere considerato come sovrapposizione dello stato “longitudinale” non fisico,

εµl = (ε0 , 0, 0, ε0 ),

e dei due stati di polarizzazione “trasversi” fisici,

εµt = (0, ε1 , ε2 , 0).

Questa terminologia è giustificata dal fatto che lo stato longitudinale può essere eliminato
con una trasformazione di gauge residua,

εµ → ε0µ = εµ + λ k µ = (ε0 + λω, ε1 , ε2 , ε0 + λω),

scegliendo λ = −ε0 /ω, mentre gli stati trasversi sono gauge invarianti e quindi osservabili.
Vedremo che in pratica non sarà quasi mai necessario usare l’invarianza di gauge residua
per eliminare lo stato longitudinale dal potenziale vettore – operazione che violerebbe
l’invarianza di Lorentz manifesta. Al contrario, la presenza formale dello stato longitudi-
nale può essere usata in molti casi per controllare la correttezza dei calcoli che si stanno
svolgendo: infatti, tutti le quantità osservabili non devono risentire della presenza dello
stato longitudinale. Dal punto di vista matematico questa richiesta si traduce nel fatto
che le grandezze osservabili devono essere invarianti sotto trasformazioni di gauge residue.
A titolo di esempio consideriamo i campi elettrico e magnetico dati in (5.66), (5.67),
che certamente costitituiscono delle grandezze osservabili. Dalle (5.61) vediamo che la
trasformazione di gauge residua per l’onda elementare assume la forma,

Aµ → Aµ + nµ ϕ, (5.71)

136
dove ϕ è un’arbitraria onda piana scalare di vettore d’onda ~k. È allora immediato verificare
che sotto queste trasformazioni le espressioni (5.66), (5.67) sono invarianti,

E i → E i + ni (nk nk ϕ̇) − ni ϕ̇ = E i

B i → B i − εijk nj nk ϕ̇ = B i .

La presenza di due soli gradi di libertà fisici nelle onde piane elettromagnetiche può essere
~ è
desunta anche direttamente dalle relazioni (5.70): queste implicano appunto che B
~ e che E
completamente determinato in termini di E, ~ è vincolato dall’equazione ~n · E
~ = 0.

Fissato ~k le uniche osservabili fisiche indipendenti dell’onda sono quindi le due componenti
~ ortogonali ad ~n.
di E
4) Contenuto in energia. Il contenuto in energia e quantità di moto di un generico campo
elettromagnetico è espresso dal tensore energia–impulso (2.69),

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ .
4

Valutiamolo per le onde elementari usando le (5.65). Sappiamo già che l’invariante F αβ Fαβ
si annulla, e resta da valutare,

µν
Tem = (nµ Ȧα − nα Ȧµ )(nα Ȧν − nν Ȧα ) = −nµ nν (Ȧα Ȧα ), (5.72)

da confrontare con la (5.37). Possiamo riscrivere questa formula in vari modi. Eliminando
Ȧ0 secondo la (5.68), otteniamo un’espressione che coinvolge solo il potenziale vettore
spaziale,
µν
Tem = nµ nν (Ȧi Ȧj ) Λij , Λij ≡ δ ij − ni nj . (5.73)

Da questa espressione si vede in particolare che il tensore energia–impulso – certamente


una grandezza osservabile – è invariante sotto le trasformazioni di gauge residue (5.71),
che equivalgono alla sostituzione,

Ai → Ai + ni ϕ. (5.74)

Per vederlo è sufficiente notare che vale identicamente,

Λij nj = 0.

137
In effetti la matrice 3 × 3 simmetrica Λij è un proiettore di rango due, che elimina da
µν
Tem la componente longitudinale di Ai – quella parallela a ni – la quale non può essere
trasportatrice di quadrimomento, in quanto non fisica. Quanto detto diventa molto tra-
sparente se scegliamo come asse z la direzione di propagazione dell’onda, ni = (0, 0, 1).
In questo caso la (5.73) si riduce a,
µ ³ ´2 ¶ h i
µν µ ν i i i i
Tem = n n Ȧ Ȧ − n Ȧ = nµ nν (Ȧ1 )2 + (Ȧ2 )2 , (5.75)

mentre la (5.74) equivale a,

A1 → A1 , A2 → A2 , A3 → A3 + ϕ.

L’invarianza del tensore energia–impulso sotto trasformazioni di gauge residue si riduce


allora semplicemente al fatto che esso non dipende dalla componente longitudinale A3 .
Confrontando la (5.75) con la (5.37) riscontriamo di nuovo il fatto che alle onde elettro-
magnetiche restano associati due gradi di libertà fisici – trasportatori di quadrimomento
– uno rappresentato da A1 e l’altro da A2 . Secondo l’analisi svolta dopo la formula (5.37)
ci aspettiamo inoltre che a livello quantistico a ciascuno dei due stati trasversi sia asso-
ciata una particella priva di massa, ovvero un fotone “trasverso”. Nel prossimo paragrafo
vedremo che quello che distingue questi due stati trasversi tra di loro è l’elicità.
Infine, usando la (5.66) è facile vedere che possiamo riscrivere la (5.73) anche come,

µν ~ 2= 1 µ ν³ ~ 2 ´
~ 2 ,
Tem = nµ nν |E| n n |E| + |B|
2

espressione che è in accordo con il fatto che per le onde piane il vettore di Poynting assume
la forma, vedi (5.70),
~=E
S ~ ×B
~ =E
~ × (~n × E)
~ = |E|
~ 2 ~n. (5.76)

00
Ritroviamo quindi le formule generali Tem = 12 (E 2 + B 2 ), e Tem
0i
= S i . In particolare il
flusso di energia in un’onda piana è diretto lungo la direzione di propagazione dell’onda,
come c’era da aspettarsi.
Concludiamo questo paragrafo con il caveat che le proprietà 1)–4) valgono per le onde
elettromagnetiche elementari (5.61), e non per un generico campo di radiazione (5.58),
sovrapposizione generica delle prime. Ma abbiamo anticipato che il potenziale vettore

138
lontano dalle sorgenti – nella zona (asintotica) delle onde – pur non essendo un’onda
piana elementare soddisferà ugualmente le relazioni delle onde (5.63). Come già osservato
le proprietà 1), 2) e 4) saranno quindi valide anche per un generico campo elettromagnetico
nella zona delle onde. Ci riferiamo in particolare alle formule (5.66), (5.70) e (5.73), che
danno il campo elettrico, il campo magnetico e il tensore energia–impulso in termini del
solo potenziale vettore spaziale,

~˙ + (~n · A
~ = −A
E ~˙ ) ~n = ~n × (~n × A
~˙ ), (5.77)
~ = ~n × E,
B ~ ~ = 0,
~n · E (5.78)
µν
Tem ~ 2,
= nµ nν (Ȧi Ȧj ) Λij = nµ nν |E| Λij ≡ δ ij − ni nj . (5.79)

Insistiamo su questo punto perché, come vedremo, l’analisi energetica di quasi tutti i fe-
nomeni di radiazione non richiede la conoscenza del potenziale vettore esatto, ma soltanto
la conoscenza della sua forma asintotica nella zona delle onde. Per quest’ultima potremo
allora usare le formule molto semplici scritte sopra, e l’analisi energetica risulterà cosı̀
notevolmente semplificata.

5.3.2 Onde piane ed elicità

In questo paragrafo analizzeremo una proprietà caratteristica delle onde piane, che viene
chiamata elicità. Questo concetto riveste un ruolo significativo per la sua connessione
con un’altra grandezza fisica, che gioca invece un ruolo fondamentale nella descrizione
20
quantistica di un’onda, ovvero lo spin . Più precisamente, si può far vedere che l’elicità
di un’onda piana corrisponde esattamente allo spin delle particelle che la rappresentano
a livello quantistico. Per chiarire meglio il significato di questo concetto metteremo a
confronto onde scalari, onde elettromagnetiche e onde gravitazionali.
Riportiamo dunque la forme delle onde piane rispettivamente nei tre casi,

ϕ(x) = ε(~k) eik·x + c.c., (5.80)

Aµ (x) = εµ (~k) eik·x + c.c., kµ εµ = 0, εµ ≈ εµ + λ k µ , (5.81)


1 ν µ
hµν (x) = εµν (~k) eik·x + c.c., kµ εµν = k ε µ, εµν ≈ εµν + λµ k ν + λν k µ . (5.82)
2
20
Il termine “elicità” viene talvolta usato anche a livello quantistico. In quel caso si intende la proiezione
dello spin di una particella priva di massa lungo la sua direzione di propagazione.

139
Onde gravitazionali. Per le onde gravitazionali abbiamo riportato le previsioni fatte
dalla Relatività Generale. In uno spazio–tempo curvo la forma dell’intervallo si generalizza
a,
ds2 = dxµ dxν ηµν → ds2 = dxµ dxν gµν (x),

dove il tensore simmetrico gµν (x) rappresenta la “metrica” del continuo spazio–temporale.
Se la si scrive come,
gµν (x) = ηµν + hµν (x),

allora il campo gravitazionale è rappresentato dal tensore doppio simmetrico hµν . Questo
campo descrive dunque lo scostamento della metrica di uno spazio–tempo curvo dalla
metrica “piatta” ηµν . Si può poi vedere che nell’approssimazione di campi gravitazionali
deboli, ovvero per,
|hµν | ¿ 1,

le equazioni di Einstein ammettono come soluzioni le onde piane date nella (5.82). In
questo caso il tensore di polarizzazione εµν è simmetrico, ed è soggetto alle condizioni di
gauge–fixing e di invarianza di gauge residua, riportate in formula. In questo caso si hanno
quattro parametri di gauge, λµ , ed è immediatamente verificare che le trasformazioni di
gauge residua preservano la condizione di gauge–fixing. Grazie a k 2 = 0, vale infatti,

1 ν µ
kµ (εµν + λµ k ν + λν k µ ) = k (ε µ + λµ kµ + λµ kµ ), ∀ λµ .
2

Anche le onde gravitazionali viaggiano con la velocità della luce. Per determinare il
numero di gradi di libertà associati a queste onde osserviamo innanzitutto che il tensore
εµν , essendo simmetrico, ha dieci componenti indipendenti. Abbiamo quattro condizioni
di gauge–fixing, e quattro trasformazioni di gauge residua, rappresentate dal vettore λµ .
Le onde gravitazionali sono quindi caratterizzate da 10 − 4 − 4 = 2 gradi di libertà –
esattamente come le onde elettromagnetiche. Dal punto di vista cinematico l’unica cosa
che le distingue dalle onde elettromagnetiche – in ultima analisi – è l’elicità.
Elicità. Il concetto di elicità è legato alle proprietà di trasformazione dei tensori di
polarizzazione ε(~k), εµ (~k), εµν (~k), sotto una certa classe di rotazioni tridimensionali. Ri-
cordiamo che sotto una generica trasformazione di Lorentz Λµ ν questi tensori sono soggetti

140
a leggi di trasformazione ben definite,

ε0 (~k 0 ) = ε(~k), ε0µ (~k 0 ) = Λµ ν εν (~k), ε0µν (~k 0 ) = Λµ α Λν β εαβ (~k), (5.83)

dove,
k 0µ = Λµ ν k ν .

Ricordiamo che k 0 = ω = |~k|, in quanto k 2 = 0. Consideriamo ora un generico vettore


d’onda ~k, che teniamo fisso in tutta l’analisi che segue. Una generica onda piana è allora
completamente caratterizzata dal suo tensore di polarizzazione, soggetto alla rispettiva
condizione di gauge–fixing. Chiamiamo Vi (i = 1, 2, 3) lo spazio vettoriale lineare comples-
so dei tensori di polarizzazione in ciascuno dei tre casi, vincolati dalle rispettive condizioni
di gauge–fixing. Le dimensioni di di questi spazi sono allora,

d1 = 1, d2 = 4 − 1 = 3, d3 = 10 − 4 = 6.

Definiamo ora il sottogruppo G del gruppo di Lorentz, costituito dalle rotazioni spaziali
di un generico angolo ϑ attorno alla direzione di ~k. G costituisce un sottogruppo di Lie
abeliano ad un solo parametro in quanto, se indichiamo il suo generico elemento con
Λµ ν (ϑ), abbiamo,
Λµ ν (ϑ1 )Λν ρ (ϑ2 ) = Λµ ρ (ϑ1 + ϑ2 ).

Per trasformazioni di questo tipo ~k resta ovviamente invariante,

k 0µ = Λµ ν (ϑ) k ν = k µ .

Nelle (5.83) trasformano allora solo i tensori di polarizzazione, ma non i loro argomenti. Di
conseguenza le polarizzazioni trasformate continuano a soddisfare le condizioni di gauge–
fixing indicate in (5.80)–(5.82), con lo stesso k µ . Concludiamo quindi che ciascuno spazio
vettoriale Vi è sede di una rappresentazione di G – in generale riducibile. Ma secondo
un noto teorema della teoria dei gruppi, le rappresentazioni complesse irriducibili del
gruppo G sono tutte unidimensionali, con sede i numeri complessi E ∈ C, e in ogni
rappresentazione irriducibile il gruppo agisce secondo,

E → E 0 = ei hϑ E, (5.84)

141
per un qualche numero reale h.
Deve allora essere possibile decomporre lo spazio vettoriale Vi delle polarizzazioni in di
sottospazi unidimensionali, sedi di rappresentazioni irriducibili di G del tipo (5.84). Ogni
sottospazio rappresenta cosı̀ un grado di libertà – fisico o non fisico – e la polarizzazione
E associata trasforma per una rotazione attorno a ~k secondo la (5.84). A ciascuno dei
gradi di libertà dell’onda piana, classificati in questo modo, resta quindi associato in modo
univoco un numero reale h – che viene chiamato elicità.
Il fatto importante è che si può dimostrare che a un grado di libertà con elicità h, a
livello quantistico corrisponde una particella di spin h.
Per eseguire esplicitamente la decomposizione in rappresentazioni irriducibili in ciascu-
no dei tre casi, è conveniente scegliere come asse z la direzione di ~k, sicché k µ = (ω, 0, 0, ω).
La matrice Λµ ν (ϑ) è allora la matrice di rotazione di un angolo ϑ attorno all’asse z,
 
1 0 0 0
 0 cos ϑ sen ϑ 0 
Λµ ν (ϑ) = 
 0 −sen ϑ cos ϑ 0  .
 (5.85)
0 0 0 1
Per ridurre le rappresentazioni di G date in (5.83) in rappresentazioni unidimensionali,
occorre trovare opportune combinazioni lineari E delle componenti dei tensori di pola-
rizzazione, tali che per esse le trasformazioni (5.83) assumano la forma diagonale (5.84).
Eseguiamo ora questa riduzione in ciascuno dei tre casi.
Onde scalari. Per le onde scalari abbiamo d1 = 1. Per qualsiasi trasformazione di Lo-
rentz, e quindi anche per la trasformazione Λµ ν (ϑ), abbiamo ε0 = ε. La rappresentazione
è già unidimensionale e vale la (5.84) con E = ε, e h = 0. Le onde scalari corrispondono
quindi a un solo grado di libertà fisico, di elicità zero.
Onde elettromagnetiche. Per queste onde abbiamo d2 = 3. Per via del gauge–fixing
kµ εµ = 0 il vettore εµ ha infatti tre componenti indipendenti: le due polarizzazioni fisiche
trasverse ε1 e ε2 , e la componente non fisica longitudinale ε3 = ε0 . Esplicitando la
trasformazione ε0µ = Λµ ν (ϑ) εν , si ottiene,

ε00 = ε0 ,

ε01 = cos ϑ ε1 + sen ϑ ε2 ,

ε02 = −sen ϑ ε1 + cos ϑ ε2 ,

142
ε03 = ε3 .

Riconosciamo quindi che la componente longitudinale porta elicità zero. Le combinazioni


lineari delle componenti trasverse che diagonalizzano la trasformazione, sono invece date
da,
E± = ε1 ∓ iε2 .

Infatti,

E−0 = ε01 + iε02 = cos ϑ ε1 + sen ϑ ε2 + i (−sen ϑ ε1 + cos ϑ ε2 ) = e−iϑ E− ,

e analogamente per E+ . Risulta quindi,

E±0 = e±i ϑ E± .

Concludiamo che un’onda elettromagnetica contiene uno stato di polarizzazione non fisico,
di elicità zero, e due stati di polarizzazione fisici, di elicità h = ±1. Si può poi vedere,
vedi problema 5.5, che questi due stati corrispondono a onde elettromagnetiche polarizzate
circolarmente – rispettivamente in senso orario e antiorario.
Onde gravitazionali. Nel caso dell’onda gravitazionale il tensore di polarizzazione εµν ,
per via del gauge–fixing,
1 ν µ
kµ εµν = k ε µ, (5.86)
2
ha d3 = 6 componenti indipendenti, di cui due fisici e quattro non fisici. Per brevità in
questo caso ci occupiamo solo delle due componenti fisiche. Per individuarle facciamo
notare che le componenti 0µ di εµν possono essere eliminate con una trasformazione di
gauge residua,
ε00µ = ε0µ + λ0 k µ + λµ ω = 0.

È sufficiente scegliere,
µ ¶
0 1 00 i 1 1 i 00 0i
λ =− ε , λ = nε −ε .
2ω ω 2

Una volta posto ε0µ = 0, le condizioni (5.86) per ν = 0 implicano,

εµ µ = −εii = 0, (5.87)

143
e per ν = i esse si riducono allora a,

kµ εµi = −k j εji = 0.

Dato che abbiamo scelto ~k = (0, 0, ω), si ottiene quindi che anche ε3µ = 0. La (5.87) dà
allora,
ε11 + ε22 = 0.

Concludiamo cosı̀ che possiamo annullare tutte le componenti di εµν , tranne,

ε12 = ε21 , e ε11 = −ε22 .

ε12 e ε11 rappresentano allora le due polarizzazioni fisiche indipendenti. Si noti in par-
ticolare che esse sono invarianti sotto le trasformazioni residue di (5.82), perché k µ non
ha componenti lungo le direzioni x e y. Per una rotazione attorno all’asse z queste
componenti si trasformano secondo,

ε0µν = Λµ α (ϑ)Λν β (ϑ) εαβ ,

ed esplicitando si trova,

ε011 = Λ1 1 (ϑ)Λ1 1 (ϑ)ε11 + 2Λ1 2 (ϑ)Λ1 1 (ϑ)ε12 + Λ1 2 (ϑ)Λ1 2 (ϑ)ε22

= cos2 ϑ ε11 + 2 sen ϑ cos ϑ ε12 − sen2 ϑ ε11

= cos 2ϑ ε11 + sen 2ϑ ε12 .

E analogamente,
ε012 = −sen 2ϑ ε11 + cos 2ϑ ε12 .

Come per le onde elettromagnetiche queste trasformazioni si diagonalizzano ponendo,

E± = ε11 ∓ iε12 .

Ma ora risulta,
E±0 = e±2i ϑ E± .

Le due polarizzazioni fisiche contenute in un’onda gravitazionale hanno quindi elicità


h = ±2. A livello classico le onde elettromagnetiche e le onde gravitazionali hanno dunque

144
in comune la velocità di propagazione e il numero di gradi di libertà, ma si distinguono
per l’elicità.
Possiamo quindi concludere che a livello quantistico un campo scalare, la cui dinamica
discenda dalla lagrangiana (5.21), corrisponderà a una particella priva di massa e di
spin, che il campo elettromagnetico sarà composto da particelle prive di massa di spin
±1, i fotoni, mentre il campo gravitazionale, supposto che esista una teoria quantistica
consistente dell’interazione gravitazionale, sarà composto da particelle prive di massa di
spin ±2, i gravitoni.
Basi diverse di soluzioni. In questa sezione abbiamo studiato una particolare base
completa di soluzioni dell’equazione di Maxwell nel vuoto, le onde piane, e ne abbiamo
analizzato le proprietà piú salienti. Ne menzioniamo ora un’altra, non meno significativa
e forse la più caratteristica: per trasformazioni di Lorentz ogni suo elemento va in un altro
elemento della stessa base. Detto in altre parole, sotto trasformazioni di Lorentz l’onda
piana (5.61) resta un’onda piana.
Tuttavia è chiaro che la base delle onde piane, pur essendo di particolare rilevanza,
non è l’unica base di interesse fisico. Un altro importante sistema completo di soluzioni
è costituito dalle cosiddette onde sferiche, sistema che risulta molto utile nello sviluppo
sistematico della radiazione in multipoli. Non ci occuperemo in dettaglio di questo si-
stema di soluzioni, perché avremo bisogno dello sviluppo in multipoli solo nel limite non
relativistico, dove sarà sufficiente tenere conto dei termini di dipolo e di quadrupolo. Si
21
vedano tuttavia i paragrafi 9.6 e 9.7 del testo di J.D. Jackson .

5.3.3 Onde elettromagnetiche e invarianza di gauge manifesta

Abbiamo visto che l’introduzione del potenziale vettore risulta inevitabile se si vuole
basare l’Elettrodinamica su un principio variazionale, il quale costituisce a sua volta il
punto di partenza indispensabile per la quantizzazione della teoria. D’altra parte il difetto
principale delle procedure che coinvolgono il campo di gauge – e non direttamente il campo
elettromagnetico – è la mancanza dell’invarianza di gauge manifesta, sicché l’assenza di
gradi di libertà non fisici in linea di principio deve essere controllata di volta in volta.
21
J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

145
In realtà nell’ambito dell’Elettrodinamica classica l’introduzione del potenziale vettore
costituisce solo un fatto di convenienza, in quanto può rendere più agevole lo studio di certi
fenomeni. Abbbiamo visto, per esempio, che l’introduzione del potenziale vettore, insieme
all’uso della trasformata di Fourier, ci ha permesso di risolvere agevolmente l’equazione di
Maxwell nel vuoto – salvo di controllare poi alla fine l’invarianza di gauge della procedura.
Rimarchiamo, tuttavia, che l’intera Elettrodinamica classica può essere analizzata an-
che senza mai nominare il potenziale vettore Aµ , ma usando solo il campo elettromagnetico
F µν , con i pregi evidenti che in questo modo non si introducono mai elementi non–fisici e
che l’invarianza di gauge è manifesta. Per illustrare le tecniche che si usano e le difficoltà
che si incontrano in questo framework alternativo, in questo paragrafo risolviamo di nuovo
le equazioni di Maxwell nel vuoto – utilizzando solo il campo elettromagnetico.
In questa ottica alternativa dobbiamo riconsiderare oltre all’equazione di Maxwell
anche l’identità di Bianchi, e il sistema da risolvere è allora,

∂µ F µν = 0, (5.88)
1
∂[µ Fνρ] = (∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν ) = 0. (5.89)
3

Come primo passo della soluzione dimostriamo che tutte le componenti del campo elettro-
magnetico devono soddisfare l’equazione delle onde. Per fare vedere questo è sufficiente
applicare all’identità di Bianchi l’operatore ∂ µ . Risulta,

2Fνρ + ∂ν ∂ µ Fρµ + ∂ρ ∂ µ Fµν = 0.

Grazie alla (5.88) il secondo e il terzo termine di questa equazione sono nulli, e si ottiene
effettivamente,
2F µν = 0. (5.90)

Facciamo però notare che questa equazione segue dalle (5.88), (5.89), ma non le implica.
Con l’esperienza accumulata finora è comunque immediato scrivere la soluzione generale
della (5.90),
Z
µν 1 d3 k ³ ik·x µν ~ ´
F = e f (k) + c.c. , (5.91)
(2π)2 2ω
dove f µν (~k) per il momento è un arbitrario tensore complesso antisimmetrico, e ricordiamo
che k 2 = 0. A questo punto cerchiamo di capire per quali f µν l’espressione appena scritta

146
soddisfa anche le (5.88), (5.89). Calcoliamo allora,
Z 3 ³ ´
µν i d k ik·x µν ~
∂ρ F = e kρ f (k) + c.c. ,
(2π)2 2ω
dove abbiamo portato la derivata sotto il segno di integrale e derivato l’esponenziale.
L’equazione di Maxwell e l’identitià di Bianchi equivalgono quindi rispettivamente alle
equazioni algebriche,

kµ f µν = 0, (5.92)

k[µ fνρ] = 0. (5.93)

Non è difficile convincersi che la soluzione generale della seconda è,

fµν = kµ βν − kν βµ , (5.94)

per qualche vettore complesso β µ , e che la prima allora implica che,

kµ β µ = 0. (5.95)

D’altra parte si vede anche subito che non tutti i vettori β µ danno luogo a soluzioni
diverse. Infatti, i vettori β µ e β µ + λ k µ soddisfano entrambi la (5.95), ma danno luogo
allo stesso f µν .
È allora immediato vedere che le soluzioni (5.91), con f µν dato dalle (5.94) e (5.95),
combaciano perfettamente con le soluzioni (5.58) trovate usando il potenziale vettore –
previa l’identificazione,
β µ = i εµ .

Problema di Cauchy. Analizziamo ora brevemente il problema alle condizioni iniziali


per il campo elettromagnetico. In realtà, data la (5.90) e visti gli sviluppi del paragrafo
5.2.1, sappiamo già come si scrive F µν in funzione dei valori del campo all’istante inziale,
vedi (5.41),
Z
µν
F (x) = d3 y [D(t, ~x − ~y ) ∂0 F µν (0, ~y ) + ∂0 D(t, ~x − ~y ) F µν (0, ~y )] . (5.96)

D’altra parte, le derivate temporali ∂0 F µν (0, ~y ) all’istante iniziale sono determinati dai
valori iniziali degli stessi campi F µν (0, ~y ), attraverso le (5.88) e (5.89). Risultano infatti
le solite relazioni,
~ =∇
∂0 E ~ × B,
~ ~ = −∇
∂0 B ~ × E.
~

147
Valutandole a t = 0 e inserendole nella (5.96) si ottiene allora,
Z h i
~
E(x) = ~ × B(0,
d3 y D(t, ~x − ~y ) ∇ ~ ~y ) + ∂0 D(t, ~x − ~y ) E(0,
~ ~y ) , (5.97)
Z h i
~
B(x) = 3 ~ ~ ~
d y −D(t, ~x − ~y ) ∇ × E(0, ~y ) + ∂0 D(t, ~x − ~y ) B(0, ~y ) . (5.98)

A questo punto è un semplice esercizio verificare che queste espressioni soddisfano in effetti
le (5.88) e (5.89) per ogni t, purché i dati iniziali soddisfino i vincoli di fisicità,

~ · E(0,
∇ ~ ~x) = 0 = ∇
~ · B(0,
~ ~x).

Vediamo di nuovo che solo quattro campi iniziali possono essere scelti in modo arbitrario,
per esempio,
E 1 (0, ~x), E 2 (0, ~x), B 1 (0, ~x), B 2 (0, ~x), (5.99)

a conferma del fatto che il campo elettromagnetico corrisponde a due gradi di libertà del
secondo ordine.
Covarianza. Concludiamo questo paragrafo con una breve analisi delle proprietà strut-
turali delle formule risolutive (5.96)–(5.98); in particolare vogliamo fare vedere come si
può rendere la (5.96) manifestamente Lorentz–covariante. Riprendiamo la forma esplicita
del kernel antisimmetrico (5.43),
1 1
D(x) = [δ(t − |~x|) − δ(t + |~x|)] = ε(t) δ(x2 ), (5.100)
4π|~x| 2π
e facciamo vedere che esso è invariante sotto trasformazioni di Lorentz proprie xµ →
Λµ ν xν ,
D(Λx) = D(x), Λ ∈ SO(1, 3)c . (5.101)

Dato che il fattore δ(x2 ) è manifestamente invariante, per dimostrare la (5.101) è sufficiente
fare vedere che ε(t) – il segno di t – è invariante sotto trasformazioni di Lorentz proprie,
se xµ è di tipo tempo o nullo,

x2 = t2 − |~x|2 ≥ 0, ovvero |t| > |~x|. (5.102)

Per fare vedere questo notiamo che per Λ ∈ SO(1, 3)c abbiamo Λ0 0 ≥ 1, e che la condizione
Λµ α Λν β η αβ = η µν , per µ = ν = 0, implica,

~ 2,
(Λ0 0 )2 = 1 + |L| L i ≡ Λ0 i . (5.103)

148
Per il tempo trasformato abbiamo allora,
à !
~ · ~x
L
~ · ~x = Λ0 0
t0 = Λ0 0 t + Λ0 i xi = Λ0 0 t + L t+ 0 .
Λ0

Siccome le (5.102), (5.103) implicano,


¯ ¯
¯L~ ¯ ~ · |~x|
¯ · ~x ¯ |L|
¯ 0 ¯≤ q ≤ |t|,
¯Λ0¯ ~ 2
1 + |L|
abbiamo dunque che il segno di t0 uguaglia quello di t.
Invarianza relativistica dei coni luce. Con l’analisi appena svolta abbiamo in partico-
lare dimostrato che il “cono luce futuro” e il “cono luce passato”, ovvero, gli insiemi di
quadrivettori,

L+ = {V µ ∈ R4 /V 2 ≥ 0, V 0 > 0}, L− = {V µ ∈ R4 /V 2 ≥ 0, V 0 < 0},

sono invarianti sotto trasformazioni di Lorentz proprie. Useremo queste proprietà nel
prossimo capitolo.
Data la (5.101) siamo ora in grado covariantizzare la (5.96), generalizzandola al caso
in cui i valori “iniziali” dei campi sono dati su un’arbitrario iperpiano di tipo spazio Γ,
vedi paragrafo 3.2.1. Questi iperpiani sono caratterizzati da un vettore normale di tipo
tempo costante Nµ , che possiamo normalizzare scegliendo Nµ N µ = 1. Ricordiamo che
l’equazione di Γ è,
Nµ (xµ − xµ0 ) = 0.

Se si assegnano i valori di F µν e della sua derivata normale Nρ ∂ ρ F µν su Γ, allora la


versione covariante della (5.96) si scrive,
Z
F (x) = dΣρ [D(x − y) ∂ ρ F µν (y) + ∂ ρ D(x − y) F µν (y)] ,
µν
(5.104)
Γ

dove la misura dΣρ = Nρ d3 λ è stata definita nel paragrafo 3.2.1. Per verificare che la
(5.104) soddisfa le condizioni al bordo corrette, nonché l’equazione 2F µν = 0, occorro
usare le seguenti versioni covarianti delle proprietà (5.44)–(5.46) del kernel,

2D = 0, (5.105)

D(x) = 0, per x2 < 0 (5.106)


Z ∞
∂µ D(x)|Nν xν =0 = Nµ δ 4 (x − N λ) dλ. (5.107)
−∞

149
Causalità. L’altra proprietà importante del kernel consiste nel fatto che esso è suppor-
tato sul (bordo del) cono luce, vale a dire è diverso da zero solo per t = ±|~x|. Questa
circostanza assicura che un generico campo elettromagnetico – e non solo le onde piane
– si propaga con la velocità della luce. Se supponiamo, per esempio, che i campi iniziali
(5.99) siano diversi da zero solo all’interno di una sfera di raggio L, allora nelle (5.97),
(5.98) l’integrale su ~y si restringe alla regione |~y | < L. Di conseguenza, in un generico
punto ~x all’esterno della sfera, a un istante t > 0 il campo sarà diverso da zero solo se per
qualche |~y | < L si ha,
|~x − ~y | = t.

In ~x il primo segnale giungerà quindi all’istante t = |~x| − L, mentre in tutti gli istanti
t < |~x| − L il campo elettromagnetico in ~x sarà nullo.
Essendo invariante per trasformazioni di Lorentz, il kernel è in particolare invariante
per rotazioni spaziali ~x → R ~x, con R ∈ SO(3),

D(t, R~x) = D(t, ~x).

Da questo segue che il campo elettromagnetico si propaga localmente in modo isotropo


in tutte le direzioni, a conferma del principio di Huygens.
Inversione temporale. L’ultima caratteristica del kernel che facciamo notare è che esso
cambia di segno per inversione temporale t → −t,

D(−t, ~x) = −D(t, ~x).

Vogliamo fare vedere che questa proprietà è intimamente legata con l’invarianza per
inversione temporale dell’equazione delle onde,
¡ ¢
2ϕ = ∂02 − ∇2 ϕ = 0,

la quale resta appunto invariata se si sostituisce ∂0 con −∂0 . Ciò comporta che se ϕ(t, ~x)
è soluzione, allora è soluzione anche la funzione,

ϕ(t,
e ~x) ≡ ϕ(−t, ~x).

In particolare la soluzione ϕ
e è univocamente determinata dalle condizioni iniziali,

ϕ(0,
e ~x) = ϕ(0, ~x), ∂0 ϕ(0,
e ~x) = −∂0 ϕ(0, ~x).

150
Scrivendo la (5.41) per ϕ
e si ottiene allora,
Z
ϕ(x)
e = d3 y [−D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] .

D’altra parte ϕ
e può essere anche ottenuta effettuando nella (5.41) la sostituzione t → −t,
Z
ϕ(x)
e = d3 y [D(−t, ~x − ~y ) ∂0 ϕ(0, ~y ) − ∂0 D(−t, ~x − ~y ) ϕ(0, ~y )] .

Si vede che affinché le due formule coincidano è necessario e sufficiente che D sia fun-
zione antisimmetrica di t. Vediamo quindi che l’antisimmetria del kernel (5.100) è – in
ultima analisi – una conseguenza dell’invarianza per inversione temporale delle equazio-
ni di Maxwell. Si può vedere che la trasformazione t → −t costituisce, in realtà, una
simmetria discreta esatta non solo dell’interazione elettromagnetica, ma anche di quelle
gravitazionale e forte, mentre è violata dalle interazioni deboli.
Infine facciamo notare che l’invarianza per inversione temporale è intrinseca anche alla
meccanica non relativistica, in quanto l’equazione di Newton,
d2~x
m = F~ = −∇V
~ (~x),
dt2
è invariante per t → −t, purché il potenziale non dipenda esplicitamente dal tempo. E
anche in questo caso ne consegue che se ~x(t) è soluzione, allora lo è anche ~x(−t).

5.4 Effetto Doppler relativistico

Nella sezione precedente abbiamo visto che nel passaggio da un sistema di riferimento a
un altro, un’onda piana elementare resta un’onda piana elementare, ma polarizzazione,
direzione di propagazione e frequenza cambiano. In questo paragrafo ci occuperemo in
particolare del cambiamento della frequenza. A questo scopo consideriamo una sorgente
che emette segnali luminosi monocromatici di frequenza “propria” – vale a dire quando

è a riposo – ω0 = λ0
, in tutte le direzioni. Vogliamo allora determinare la frequenza del
segnale, quando la sorgente si trova in moto rettilineo uniforme con velocità ~v .
Consideriamo allora il sistema di riferimento K ∗ in cui la sorgente è a riposo. In
K ∗ la quadrivelocità della sorgente e il vettore d’onda quadridimensionale sono dati
rispettivamente da,
u∗µ = (1, ~0), k ∗µ = (ω0 , ~k0 ).

151
Nel sistema di riferimento K del laboratorio le analoghe quantità sono date da,
µ ¶
1 ~v
µ
u = √ ,√ , k µ = (ω, ~k).
1−v 2 1−v 2

Se indichiamo l’angolo tra la direzione di propagazione dell’onda e la velocità della sorgente


– entrambe misurate in K – con α, possiamo sfruttare l’invarianza di Lorentz dello scalare
u · k per ottenere,

1
ω0 = u∗µ k ∗µ = uµ k µ = √ (ω − ω v cos α).
1 − v2

Per frequenza e lunghezza d’onda nel sistema del laboratorio si ottiene allora,

1 − v2 1 − v cos α
ω= ω0 , λ= √ λ0 . (5.108)
1 − v cos α 1 − v2

Queste formule descrivono l’effetto Doppler relativistico.


Nei casi particolari in cui la sorgente che si avvicina (allontana) frontalmente abbiamo
α = 0 (α = π), e ripristinando la velocità della luce otteniamo,

1 ∓ v/c
λ= p λ0 . (5.109)
1 − v 2 /c2

Questa formula può essere confrontata con la formula dell’effetto Doppler non relativistico,

λn.r. = (1 ∓ v/vp ) λ0 ,

dove vp rappresenta la velocità di propagazione del segnale. Si vede che se la sorgente si


muove con velocità v piccola rispetto alla velocità della luce, il risultato relativistico si
riduce formalmente a quello non relativistico, se si pone vp = c.
Redshift cosmologico. Concludiamo la sezione con un’applicazione importante dell’ef-
fetto Doppler relativistico, il cosiddetto redshift. Per sorgenti che si allontanano dall’osser-
vatore frontalmente, la (5.109) permette di ricavare la variazione relativa della lunghezza
d’onda, s
λ − λ0 1 + v/c
z≡ = − 1 > 0. (5.110)
λ0 1 − v/c
Le lunghezze d’onda aumentano dunque all’aumentare della velocità. Questo fenomeno
è noto come “redshift”, in quanto le frequenze si abbassano e le righe spettrali si sposta-
no verso il rosso, ed è di importanza fondamentale in cosmologia: attraverso un’analisi

152
sistematica del “redshift cosmologico” nella radiazione emessa dalle galassie, Hubble nel
1929 è stato in grado di scoprire l’espansione dell’universo. Le galassie osservate da lui
avevano velocità piccole rispetto alla velocità della luce, dell’ordine di v ≈ 3.000km/s,
per cui l’aumento relativo delle lunghezze d’onda era piccolo. Sviluppando la (5.110) si
ottiene infatti,
v
z≈ = 10−2 .
c
Ma oggi sono note anche galassie con valori di z molto elevati. Per esempio, per la galassia
8C1435+635 nel 1994 si è misurato il redshift z = 4.25, corrispondente a una velocità di
allontanamento pari a v = 0.93 c.
Per concludere notiamo che misure molto precise del redshift cosmologico nelle su-
pernovae di tipo Ia, effettuate di recente, hanno permesso di trarre conclusioni nuove e
rivoluzionarie sullo stato del nostro universo: da queste misure sappiamo, infatti, che
l’universo non solo è in espansione, ma che sta accelerando. D’altra parte secondo la Re-
latività Generale un universo che accelera esige necessariamente una costante cosmologica
diversa zero e positiva, circostanza che ha arricchito la cosmologia odierna di una serie di
problematiche nuove, tuttora irrisolte.

5.5 Problemi

5.1 In riferimento alla soluzione dell’equazione delle onde del paragrafo 5.2.1,
a) si dimostri che la (5.40) si può riscrivere come in (5.41);
b) si dimostri che il kernel antisimmetrico D dato in (5.42) può essere scritto come in
(5.43). [Sugg.: si passi dalla variabile d’integrazione ~k in coordinate polari, e si sfrutti
l’invarianza per rotazioni per porre ~x = (0, 0, |~x|). Infine si ricordi che la δ di Dirac
ammette la rappresentazione simbolica in trasformata di Fourier,
Z
1
δ(x − a) = eik(x−a) dk.]

5.2 Supponendo che Aµ (x) sia un campo vettoriale e che per una trasformazione di
Lorentz si abbia k 0µ = Λµ ν k ν , si dimostri che anche la trasformata di Fourier,
Z
b µ 1
A (k) = d4 x e−ik·x Aµ (x),
(2π)2

153
è un campo vettoriale nella variabile k.

5.3 Utilizzando il gauge–fixing,


A0 = 0,

si dimostri che l’equazione di Maxwell, ∂µ F µν = j ν , propaga due gradi di libertà fisici. Si


adotti la seguente strategia:
a) si impongano condizioni iniziali per A1 e A2 e le loro derivate temporali, a t = 0;
b) si determini la forma delle trasformazioni di gauge residue;
c) imponendo l’equazione G0 ≡ ∂µ F µ0 − j 0 = 0 a t = 0, e utilizzando le trasformazioni di
gauge residue, si fissino le condizioni iniziali per A3 e ∂0 A3 a t = 0.

5.4 Partendo dalla (5.58) si deducano le espressioni generali per i campi elettrico e
magnetico nel vuoto,
Z
1 ¡ ik·x ¢
~ ~x) =
E(t, d 3
k i e [(~n · ~
ε) ~
n − ~
ε] + c.c. ,
2(2π)2
Z
1 ¡ ¢
~
B(t, ~x) = d3 k i eik·x [~ε × ~n] + c.c. .
2(2π)2

a) Si verifichi che questi campi soddisfano le equazioni di Maxwell nel vuoto (2.28)–(2.31),
nonché le equazioni delle onde,
~ = 0 = 2B.
2E ~

~ ~x) e B(0,
b) Noti i campi iniziali E(0, ~ ~x), si determini il campo vettoriale tridimensionale,

V~ (~k) ≡ ~ε − (~n · ~ε) ~n,

~ eB
e quindi E ~ ad ogni t. [Sugg.: si veda il paragrafo 5.2.1.]

c) Il campo ~ε(~k) è univocamente determinato?

5.5 Si consideri un’onda piana elementare propagantesi lungo l’asse z, con vettore d’onda
k µ = (ω, 0, 0, ω), e polarizzazione εµ = (ε0 , ε1 , ε2 , ε0 ) generica,

Aµ (x) = εµ eik·x + c.c.

~ ~x) e B(t,
a) Si determinino esplicitamente i campi E(t, ~ ~x) e si verifichi che essi sono

gauge–invarianti, ovvero indipendenti da ε0 , e che soddisfano le condizioni di trasversalità

154
E 3 = 0 = B3.
b) Nel piano trasverso (x, y) si definisca il campo elettrico complesso E ≡ E 1 + iE 2 . Si
dimostri che risulta,
¡ ¢
E = −i ω E− eik·x − E+∗ e−ik·x , (5.111)

dove E± sono gli “autostati” di elicità: E± = ε1 ∓ iε2 .


c) Si verifichi che per E− = 0 (E+ = 0) la punta del campo elettrico descrive un’elica
percorsa in senso orario, di “elicità” positiva, (antiorario, di “elicità” negativa), corri-
spondente a polarizzazione circolare lungo la direzione del moto (in direzione opposta al
moto). La soluzione generale (5.111) corrisponde quindi a una generica sovrapposizione
dei due stati di polarizzazione circolare.
d) Se εµ è reale si ha E−∗ = E+ . Si verifichi che in questo caso l’onda risulta polarizzata
~ ha direzione costante.
linearmente, ovvero, che E

5.6 Si dimostri che il tensore energia impulso associato all’onda elettromagnetica ele-
mentare (5.61), mediato su scale temporali grandi rispetto al periodo è dato da,

µν
hTem i = −2 k µ k ν ε∗α εα .

00
Si dimostri che vale hTem i ≥ 0.

5.7 Si consideri l’onda scalare “sferica”,

1
ϕ(t, ~x) = G(t − r), r ≡ |~x|,
r

dove G è una funzione arbitraria.


a) Si dimostri che ϕ soddisfa l’equazione delle onde 2ϕ = 0, in ogni regione spaziale che
non contiene il punto ~x = 0. [Sugg.: può essere utile scrivere il Laplaciano in coordinate
polari, µ ¶2
2 1 ∂ 1 2
∇ = r+ L,
r ∂r r2
dove L2 è un operatore differenziale che coinvolge solo gli angoli.]
b) Si spieghi perché ϕ non è soluzione dell’equazione delle onde in tutto lo spazio, e se ne
dia un’interpretazione fisica.

155
5.8 Si consideri l’equazione delle onde in una dimensione spaziale,

¡ ¢
∂t2 − ∂x2 ϕ(x, t) = 0.

Utilizzando la tecnica della trasformata di Fourier si dimostri che la soluzione generale di


questa equazione si può scrivere come,

ϕ(t, x) = f (x − t) + g(x + t),

con f e g funzioni arbitrarie.

156
6 Generazione di campi elettromagnetici

Nel capitolo precedente abbiamo determinato la forma di un generico campo di radiazione,


ovverosia di un campo elettromagnetico che soddisfa l’equazione di Maxwell in assenza
di sorgenti. Abbiamo trovato che questo campo consiste di una sovrapposizione lineare
di onde piane, monocromatiche e trasverse, che si propagano con la velocità della luce,
le onde elettromagnetiche. In questo capitolo affronteremo un altro problema centrale
dell’Elettrodinamica classica: la determinazione del campo elettromagnetico generato da
un’arbitraria distribuzione di cariche in movimento. Risolveremo, infatti, l’equazione di
Maxwell in presenza di una generica quadricorrente j µ conservata. Scopo ultimo di questo
capitolo è la derivazione di formule esplicite per i campi elettrico e magnetico, creati da
una singola particella carica in moto arbitrario. Questi campi rivestono a loro volta un
ruolo cruciale in Elettrodinamica classica, e portano i nomi dei loro scopritori, Lienard
(1898), e Wiechert (1900).
In presenza di correnti il campo elettromagnetico deve soddisfare le equazioni,

∂µ F µν = j ν , F µν = ∂ µ Aν − ∂ ν Aµ ,

ovverosia, in gauge di Lorentz,

2Aµ = j µ , (6.1)

∂µ Aµ = 0. (6.2)

Queste equazioni sono lineari in Aµ , ma non omogenee. La soluzione generale si potrà


quindi scrivere come somma di una soluzione particolare Aµret , e della soluzione generale
Aµin del sistema omogeneo associato,

Aµ = Aµret + Aµin . (6.3)

Il potenziale Aµin è dunque la soluzione generale del sistema,

2Aµin = 0, ∂µ Aµin = 0,

che corrisponde a un campo di Maxwell libero. Dal capitolo precedente sappiamo allora
che Aµin è una generica sovrapposizione di onde elettromagnetiche piane – un generico
campo di radiazione – che gioca il ruolo di un campo esterno “entrante dall’infinito”.

157
Il “potenziale ritardato” Aµret rappresenta invece il campo generato causalmente dalla
corrente j µ , secondo le equazioni (6.1) e (6.2), della cui soluzione ci occuperemo nelle
prossime sezioni. Siccome nel resto di questo capitolo ignoreremo il campo di radiazione,
indicheremo Aµret semplicemente con Aµ .
I pedici in e ret significano rispettivamente incoming e retarded. Questa nomenclatura
deriva dal fatto che convenzionalmente la radiazione Aµin , che si sovrappone al potenziale
ritardato (fisico) Aµret , viene considerata entrante dall’infinito. Per completezza menzio-
niamo che la soluzione (6.3) può essere scritta formalmente anche in termini del cosiddetto
potenziale avanzato (non fisico) Aµadv , vedi sezione 6.2,

Aµ = Aµadv + Aµout .

La radiazione sovrapposta ad Aµadv viene considerata uscente verso l’infinito, outgoing, e


indicata con Aµout . I potenziali Aµadv e Aµout hanno una certa rilevanza nella teoria dello
scattering, ma noi non ce ne serviremo. Questa nomenclatura diventerà comunque più
trasparente, quando avremo risolto l’equazione di Maxwell.
Una tecnica efficace per risolvere equazioni differenziali alle derivate parziali del tipo
(6.1), è costituita dal cosiddetto “metodo della funzione di Green”. Prima di applicare
questo metodo alla soluzione della (6.1), nella prossima sezione lo illustriamo nel caso
di un’equazione più semplice, ma fisicamente rilevante, ovvero, quello dell’equazione di
Poisson.

6.1 Il metodo della funzione di Green: equazione di Poisson

Consideriamo l’equazione di Poisson in tre dimensioni spaziali,

−∇2 F (~x) = ϕ(~x), (6.4)

nell’incognita F . Per definitezza assumiamo che sia,

F ∈ S 0 (R3 ), ϕ ∈ S(R3 ),

ma vedremo che le soluzioni che troveremo saranno valide sotto ipotesi meno restrittive.
Se interpretiamo F come il potenziale elettrico A0 , e ϕ come la densità di carica j 0 , allora

158
la (6.4) si identifica con l’equazione fondamentale dell’Elettrostatica. Ispirati da questa
interpretazione aggiungiamo allora la richiesta ulteriore che ϕ sia a supporto compatto,

ϕ(~x) = 0, per |~x| > R.

Corrispondentemente imponiamo la condizione “fisica” che F si annulli all’infinito,

lim F (~x) = 0. (6.5)


|~
x|→∞

Vedremo, infatti, che con questa condizione asintotica l’equazione di Poisson ammetterà
soluzione unica. Per completezza ricordiamo che in generale non ha senso imporre una
condizione asintotica, come la (6.5), a una distribuzione. Tuttavia, vedremo che per
un’ampia classe di “funzioni” ϕ, non necessariamente appartenenti ad S, le soluzioni
della (6.4) sono rappresentate da funzioni, di classe C ∞ al di fuori di un compatto di R3 .
Per tali ϕ la (6.5) è quindi ben posta. Esempi ne sono le ϕ corrispondenti alla densità di
carica associata a un numero finito di cariche puntiformi statiche,
N
X
ϕ(~x) = er δ 3 (~x − ~yr ), (6.6)
r=1

che appartengono ad S 0 , ma non ad S.


Discuteremo comunque la soluzione generale dell’equazione di Poisson – indipenden-
temente dalla validità della (6.5) – alla fine di questa sezione.

6.1.1 Una soluzione particolare

Siccome l’equazione di Poisson è un’equazione lineare non omogenea, la sua soluzio-


ne generale è data da una soluzione particolare, sovrappposta alla soluzione generale
dell’equazione omogenea associata, ovvero, dell’equazione di Laplace,

∇2 F = 0.

Ovviamente la soluzione particolare non è unica, ma possiamo circoscriverla attraverso


qualche richiesta aggiuntiva. Osserviamo che la (6.4) è “congiuntamente lineare” in F e
ϕ, nel senso che una soluzione particolare relativa alla densità di carica ϕ1 +ϕ2 , può essere
ottenuta sommando le soluzioni individuali F1 e F2 . Lasciando per il momento da parte le

159
proprietà di regolarità delle grandezze coinvolte, possiamo allora avanzare l’ipotesi che il
valore di F in ~x dipende linearmente dai valori che ϕ assume in tutti i punti dello spazio,
ovvero, che per ogni ~x fissato il numero F (~x) definisca “un funzionale lineare e continuo”
f~x , sullo spazio delle ϕ,
F (~x) = f~x (ϕ).

In notazione simbolica avremo allora,


Z Z
F (~x) = d y f~x (~y ) ϕ(~y ) ≡ d3 y g(~x, ~y ) ϕ(~y ),
3
(6.7)

per qualche funzione incognita di due variabili g(~x, ~y ). Possiamo vincolare la forma di
questa funzione se adottiamo l’interpretazione elettrostatica della (6.4), e invochiamo il
gruppo di simmetria dello spazio tridimensionale vuoto, ovvero, le rototraslazioni,

~x → ~x 0 = R ~x + ~a, R ∈ SO(3), ~a ∈ R3 .

In un altro sistema di riferimento la (6.7) diventa infatti 22 ,


Z
F (~x ) = d3 y 0 g(~x 0 , ~y 0 ) ϕ0 (~y 0 ).
0 0

Sotto queste trasformazioni il potenziale elettrico e la densità di carica siano invarianti,

F 0 (~x 0 ) = F (~x), ϕ0 (~x 0 ) = ϕ(~x),

e dato che d3 y 0 = d3 y, ne segue che deve essere,

g(~x 0 , ~y 0 ) = g(~x, ~y ),

per una qualsiasi rototraslazione. Scegliendo R = 1 e ~a = −~y si ottiene allora,

g(~x, ~y ) = g(~x − ~y , 0) ≡ g(~x − ~y ),

mentre l’invarianza per rotazioni impone poi che g(~x) dipenda solo da |~x|. La (6.7) si
riduce allora a,
Z
F (~x) = d3 y g(~x − ~y ) ϕ(~y ), g(~x) = g(|~x|). (6.8)

22
Si noti che la funzione g deve essere indipendente dal sistema di riferimento, perché in caso contrario
un osservatore in un altro sistema di riferimento potrebbe accorgersi di essere stato rototraslato. In altre
parole, deve valere g(~x 0 , ~y 0 ) = g(~x, ~y ), e non g 0 (~x 0 , ~y 0 ) = g(~x, ~y ).

160
Ricordando la definizione della convoluzione, vedi paragrafo 2.3.2, si riconosce che questa
formula può essere riscritta in modo compatto come,

F = g ∗ ϕ. (6.9)

Posta in questa forma la soluzione F apparterrà effettivamente a S 0 , purché anche g


appartenga a S 0 . Ricordiamo, infatti, che la convoluzione tra una distribuzione e una
funzione di test definisce sempre una distribuzione.
La funzione di Green. Data la (6.8), l’equazione di Poisson si trasforma ora in un’e-
quazione per g,
Z
2
−∇ F (~x) = − d3 y ∇2 g(~x − ~y ) ϕ(~y ) = ϕ(~x).

Per l’arbitrarietà della ϕ dovrà dunque valere,

−∇2 g(~x − ~y ) = δ 3 (~x − ~y ),

ovvero, più semplicemente,


−∇2 g(~x) = δ 3 (~x). (6.10)

Questa equazione identifica g come la funzione di Green associata all’equazione (6.4),


chiamata talvolta anche “propagatore”, o “kernel integrale” dell’equazione. Il metodo
della funzione di Green consiste nel risolvere esplicitamente l’equazione per il kernel (6.10),
e di scrivere la soluzione dell’equazione di partenza nella forma integrale (6.8). L’efficacia
del metodo risiede nel fatto che esso riconduce la soluzione della (6.4), che a priori dovrebbe
essere risolta per ogni ϕ separatamente, alla soluzione di una sola equazione: l’equazione
del kernel (6.10).
L’inverso del Laplaciano. La particolare forma della soluzione (6.9), (6.10) permette
di dare un’interpretazione alternativa a g. Infatti, come qualsiasi kernel integrale anche
g induce un operatore lineare O nello spazio delle funzioni su R3 , definito da,

ϕ → O ϕ = g ∗ ϕ.

Alla luce dell’identità,

−∇2 O ϕ = −∇2 (g ∗ ϕ) = −(∇2 g) ∗ ϕ = δ 3 ∗ ϕ = ϕ,

161
l’operatore O costituisce un inverso dell’operatore −∇2 . Per questo motivo si dice anche
che il kernel g “inverte il Laplaciano”, e formalmente si scrive,
1
= g.
−∇2
Ci siamo dunque ricondotti alla soluzione del sistema,

−∇2 g(~x) = δ 3 (~x), g(~x) = g(|~x|), g ∈ S 0. (6.11)

In realtà conosciamo già una soluzione di questo sistema, vedi (2.53),


1
g(~x) = . (6.12)
4π|~x|
Ma essa è anche unica, modulo l’aggiunta di una costante additiva. Infatti, come faremo
vedere sotto, l’equazione omogenea associata alla (6.11),

∇2 g = 0,

ammette come unica soluzione invariante per rotazioni la costante. Ma è facile vedere che
l’addizione di una costante alla (6.12), porta a una F che non svanisce all’infinito.
Sostituendo la (6.12) nella (6.8) possiamo allora affermare che una soluzione particolare
dell’equazione di Poisson è data da,
Z
1 1
F (~x) = d3 y ϕ(~y ), (6.13)
4π |~x − ~y |
espressione che riproduce correttamente il potenziale elettrico creato da una densità di
carica statica. Resta da verificare la validità della condizione asintotica (6.5). Per fare
questo valutiamo il limite,
Z Z
1 3 |~x| 1 Q
lim |~x| F (~x) = lim dy ϕ(~y ) = d3 y ϕ(~y ) = ,
|~
x|→∞ 4π |~x|→∞ |~x − ~y | 4π 4π
dove Q è la “carica” totale, finita, perché ϕ è a supporto compatto. Asintoticamente F
va quindi a zero come,
Q
F (~x) ∼ . (6.14)
4π|~x|
Infine facciamo notare che la formula risolutiva (6.13), assieme all’andamento asintoti-
co (6.14), possono restare validi anche se ϕ non appartiene ad S, ma è, per esempio, della
forma più singolare (6.6). In questo caso la (6.13) si riduce infatti all’espressione nota,
X P
er er
F (~x) = ∼ r , per |~x| → ∞.
r
4π|~x − ~yr | 4π|~x|

162
6.1.2 Validità della soluzione e soluzione generale

Affrontiamo ora la questione della validità della soluzione (6.13), ovvero della (6.9),

F = g ∗ ϕ, (6.15)

in generale. Ricordiamo che avevamo richiesto F ∈ S 0 e ϕ ∈ S. Come osservato sopra,


la funzione di Green (6.12) appartiene ad S 0 , e di conseguenza la convoluzione in (6.15)
definisce effettivamente un elemento di S 0 , se ϕ appartiene ad S. Per di più in questo
caso la convoluzione equivale proprio all’integrale (6.13). Tuttavia, come abbiamo fatto
notare nel paragrafo precedente, in diversi casi di interesse fisico ϕ non appartiene a
S. In Elettrostatica esempi sono la (6.6), oppure certe densità di carica macroscopiche
“singolari”, come quelle corrispondenti a distribuzioni di carica superficiali, o filiformi. In
questi casi abbiamo,
ϕ ∈ S 0, ϕ∈
/ S,

e la (6.15) è a priori priva di senso, perché in generale la convoluzione tra due distribuzioni
non è definita.
Una convoluzione tra due distribuzioni. Per uscire dall’empasse manteniamo per il mo-
mento ϕ ∈ S, ed eseguiamo la trasformata di Fourier della (6.15), vedi paragrafo 2.3.2,

Fb(~k) = (2π)3/2 gb(~k) ϕ(


b ~k). (6.16)

Sappiamo che la trasformata gb sta in S 0 , ma possiamo anche valutarla esplicitamente.


Per determinarla in modo spedito procediamo formalmente, cioè, scrivendo l’integrale
corrispondente – di per sé divergente – e sfruttando l’invarianza per rotazioni per porre
~k = (0, 0, k), con k = |~k|. Valutiamo l’integrale passando in coordinate polari,
Z Z ∞ Z 2π Z 1
~ 1 3 −i~k·~
x 1 1 2 1
gb(k) = 3/2
d xe = 3/2
r dr dϕ d cos ϑ e−i cos ϑrk
(2π) 4π|~x| (2π) 4π 0 r
Z ∞ Z ∞0 −1
i ¡ ¢ i
= 3/2
dr e−ikr − eikr = 3/2
dx e−ikx ε(x)
2 (2π) k 0 2 (2π) k −∞
i
= εb (k), .
2 (2π) k
Nell’ultimo passaggio abbiamo introdotto la trasformata di Fourier della funzione segno,
ε(x) = H(x) − H(−x),
Z ∞
r µ ¶
1 −ikx 2 1
εb (k) = √ dx e ε(x) = −i P ,
2π −∞ π k

163
dove P indica la “parte principale”. Dato che k è positivo si ottiene in definitiva,

1
gb(~k) = ∈ S 0, (6.17)
(2π)3/2 |~k|2

e quindi,
1
Fb(~k) = b ~k).
ϕ( (6.18)
~
|k| 2

Si noti in particolare l’esatta corrispondenza tra le relazioni (6.17), (6.18), e le trasformate


di Fourier delle equazioni (6.10), (6.4).
A questo punto notiamo, però, che il membro di destra della (6.18) – e più in generale
della (6.16) – ha senso anche se gb ∈ S 0 e ϕ
b ∈ OM 23
, perché il prodotto di una generica
distribuzione con una funzione in OM definisce sempre una distribuzione, vedi paragrafo
24
2.3.2. D’altra parte, per il teorema di Paley–Wiener la trasformata di Fourier di una
generica distribuzione ϕ ∈ S 0 a supporto compatto, appartiene a OM . Di conseguenza, per
una tale ϕ il membro di destra della (6.18) costituisce una distribuzione in S 0 . In questo
caso possiamo allora definire F come l’antitrasformata di Fourier del membro di destra
della (6.18).
In conclusione, l’espressione formale (6.15), definita come l’antitrasformata di Fourier
del membro di destra della (6.16), costituisce una soluzione della (6.4) con F ∈ S 0 , purché
ϕ sia una distribuzione a supporto compatto. Tali sono in particolare tutte le distribuzioni
statiche di carica realizzate in natura.
Unicità della soluzione ed equazione di Laplace. Per concludere discutiamo brevemen-
te la soluzione generale della (6.4), indipendentemente dalla condizione asintotica (6.5).
Per ottenere la soluzione generale dell’equazione di Poisson è sufficiente aggiungere alla
soluzione particolare (6.13), la soluzione generale F0 dell’equazione omogenea associata,
ovvero dell’equazione di Laplace,
∇2 F0 (~x) = 0. (6.19)

Questa equazione ammette in effetti infinite soluzioni, ma nessuna di queste svanisce


all’infinito. Per provarlo troviamo la soluzione generale per F0 ∈ S 0 (R3 ). A questo scopo
23
Ricordiamo che con OM (RD ) si intende lo spazio delle funzioni C ∞ su RD , polinomialmente limitate
assieme a tutte le loro derivate parziali.
24
Vedi per esempio, M. Reed e B. Simon, Methods of Modern Mathematical Physics – I Functional
Analysis, Academic Press, New York, 1980.

164
è conveniente eseguire la trasformata di Fourier della (6.19),

|~k|2 Fb0 (~k) = 0, (6.20)

e sfruttare il teorema sulle distribuzioni con supporto in un punto, vedi paragrafo 2.3.2.
L’equazione appena scritta implica, infatti, che Fb0 (~k) ha come supporto l’origine ~k = 0.
Essa è dunque necessariamente una combinazione lineare finita della δ 3 (~k) e delle sue
derivate. Avremo cioè,
N
X
Fb0 (~k) = C i1 ···in ∂i1 · · · ∂in δ 3 (~k), (6.21)
n=1

dove i C i1 ···in sono tensori costanti completamente simmetrici. Inserendo questa espres-
sione nella (6.20) si trova che, affinché Fb0 (~k) sia soluzione, è necessario e sufficiente che i
coefficienti siano a traccia nulla, vedi il problema analogo per l’equazione di D’Alembert
in sezione 5.2,
δi1 i2 C i1 ···in = 0. (6.22)

Esistono quindi effettivamente infinite soluzioni. Tuttavia, eseguendo l’antitrasformata di


Fourier della (6.21), si ottiene semplicemente il polinomio,
N
1 X
F0 (~x) = 3/2
(−i)n C i1 ···in xi1 · · · xin , (6.23)
(2π) n=1

che all’infinito diverge. Concludiamo che l’equazione di Laplace non ammette soluzioni
che svaniscono all’infinito, esclusa la soluzione banale F0 = 0.
Infine, per dimostrare l’unicità della soluzione del sistema (6.11), facciamo vedere che
l’equazione di Laplace non ammette soluzioni invarianti per rotazioni, a parte la costante.
A questo scopo è conviente introdurre una base di soluzioni alternativa alle (6.23), che
si ottiene risolvendo la (6.19) in coordinate polari. Scrivendo il Laplaciano come nel
problema 5.7, è infatti immediato vedere che la base di soluzioni che ne risulta è data da,

F0lm (~x) = rl Ylm (ϕ, ϑ), (6.24)

dove le Ylm sono le armoniche sferiche, e r = |~x|. Contando le potenze di ~x nella (6.23),
si vede che l’indice l della base (6.24) si identifica direttamente con l’intero n della base
(6.23). Usando la base F0lm si vede poi che l’unica soluzione dell’equazione di Laplace
invariante per rotazioni, ovvero, indipendente dagli angoli, è F000 , che è una costante.

165
Metodo della funzione di Green in generale. Il metodo della funzione di Green si gene-
ralizza facilmente a un’equazione differenziale lineare in uno spazio D–dimensionale, che
coinvolge un arbitrario operatore polinomiale nelle derivate parziali P (∂),

P (∂) F = ϕ.

Secondo l’esempio appena svolto la funzione di Green g associata a questa equazione deve
soddisfare l’equazione del kernel,

P (∂) g(x) = δ D (x),

e la soluzione si scrive come,


F = g ∗ ϕ.

Infatti, ricordando le proprietà della convoluzione riportate nel paragrafo 2.3.2 si trova,

P (∂) F = P (∂) (g ∗ ϕ) = P (∂) g ∗ ϕ = δ D ∗ ϕ = ϕ.

6.2 Il campo generato da una corrente generica

Cerchiamo ora di applicare il metodo della funzione di Green per risolvere l’equazione di
Maxwell in presenza di una generica corrente conservata, in gauge di Lorentz,

2Aµ = j µ , (6.25)

∂µ Aµ = 0. (6.26)

Come anticipato cercheremo non la soluzione generale, ma il campo generato causalmente


dalla corrente j µ . Per il momento per definitezza assumeremo che sia,

Aµ ∈ S 0 ≡ S 0 (R4 ), j µ ∈ S ≡ S(R4 ). (6.27)

Ricordiamo tuttavia che – come nel caso dell’equazione di Poisson – la corrente di un siste-
ma di particelle puntiformi in realtà non sta in S, ma in S 0 . Anche nel caso dell’equazione
di Maxwell, alla fine dovremo allora affrontare il problema di come estendere la soluzione
al caso “fisico” – in cui j µ ∈ S 0 . La differenza principale tra la (6.25) e l’equazione di
Poisson è essenzialmente che la seconda vive in tre dimensioni spaziali, mentre la prima

166
è formulata nello spazio quadrimensionale di Minkowski: il suo gruppo di invarianza sarà
quindi il gruppo di Poincaré, in sostituzione del gruppo delle rototraslazioni.
Ci occuperemo prima della soluzione della (6.25), e imporremo poi la gauge di Lorentz
alle soluzioni trovate. Per la linearità congiunta in Aµ e j µ dell’equazione di Maxwell,
cerchiamo ora una soluzione della forma,
Z
µ
A (x) = d4 y G(x, y) j µ (y), (6.28)

dove la funzione di Green G(x, y) è una funzione incognita delle coordinate spazio–
temporali xµ e y µ . Come prima cosa vediamo allora quali sono i vincoli imposti a questa
funzione dalla richiesta di covarianza sotto trasformazioni di Poincaré. Cambiando sistema
di riferimento,
xµ → x0µ = Λµ ν xν + aµ ,

abbiamo,
Z
0µ 0
A (x ) = d4 y 0 G(x0 , y 0 )j 0µ (y 0 ),

e dato che si ha,

A0µ (x0 ) = Λµ ν Aν (x), j 0µ (y 0 ) = Λµ ν j ν (y), d4 y 0 = d4 y,

segue facilmente,
Z
ν
A (x) = d4 y G(x0 , y 0 )j ν (y).

Confrontando con la (6.28) concludiamo allora che G deve essere invariante per trasfor-
25
mazioni di Poincaré, cioè ,

G(Λx + a, Λy + a) = G(x, y), ∀ Λµ ν ∈ SO(1, 3)c , ∀ aµ ∈ R4 .

Scegliendo Λµ ν = δ µ ν , e aµ = −y µ si ottiene,

G(x, y) = G(x − y, 0) ≡ G(x − y).


25
Come nel caso dell’equazione di Poisson la quantità G(x, y) va considerata non come un campo
scalare in x e y, ma come una funzione invariante di x e y, con una dipendenza funzionale ben definita.
Questa funzione deve essere la stessa in ogni sistema di riferimento, altrimenti due correnti con la stessa
dipendenza funzionale in due diversi sistemi di riferimento, darebbero luogo a potenziali con dipendenze
funzionali diverse, in contrasto con il principio di relatività einsteiniana. In altre parole, deve valere
G(x0 , y 0 ) = G(x, y), e non G0 (x0 , y 0 ) = G(x, y).

167
Scegliendo poi aµ = 0 e Λµ ν generico, si trova che G(x) deve essere invariante per
26
trasformazioni di Lorentz proprie ,

G(Λx) = G(x), ∀ Λµ ν ∈ SO(1, 3)c . (6.29)

In particolare vediamo allora che la (6.28) può essere scritta nella forma prevista dal
metodo della funzione di Green,
Z
µ
A (x) = d4 y G(x − y) j µ (y), (6.30)

ovvero, in notazione compatta,


Aµ = G ∗ j µ . (6.31)

Sostituendo infine la (6.30) nella (6.25) si trova,


Z
2A (x) = d4 y 2G(x − y) j µ (y) = j µ (x),
µ

che comporta per la funzione di Green l’equazione,

2G(x) = δ 4 (x). (6.32)

La soluzione dell’equazione di Maxwell è quindi ricondotta alla soluzione di questa equa-


zione, compatibilmente con il vincolo (6.29).
Tuttavia, si può vedere che le condizioni (6.29) e (6.32) non determinano ancora la
funzione di Green univocamente. Aggiungiamo a questo punto una richiesta fisica, concer-
nente la propagazione causale del campo elettromagnetico: richiediamo che il potenziale
Aµ (x) nel punto x non possa dipendere dai valori della corrente j µ (y) in punti y che sono
temporalmente successivi a x, ovverosia, punti per cui x0 < y 0 . Questo vuol dire che deve
essere G(x − y) = 0 per x0 < y 0 , ovvero,

G(x) = 0, ∀ t < 0.

Vedremo che con questa richiesta aggiuntiva le (6.29) e (6.32) ammettono un’unica solu-
zione. La funzione di Green risultante viene chiamata “funzione di Green ritardata”, e
viene indicata con Gret .
26
Tra un attimo spiegheremo il motivo per cui G non può essere invariante sotto l’intero gruppo di
Lorentz.

168
Per spiegare la nomenclatura osserviamo che in certe analisi teoriche si introduce anche
la “funzione di Green avanzata”, definita da,

Gadv (x) = 0, ∀ t > 0, (6.33)

alla quale si può associare la soluzione formale,

Aµadv = Gadv ∗ j µ .

Tuttavia, non rispettando la causalità questa soluzione non giocherà nessun ruolo nella
nostra trattazione.

6.2.1 La funzione di Green ritardata

La funzione di Green ritardata è definita dalle condizioni,

2G(x) = δ 4 (x), (6.34)

G(Λx) = G(x), ∀ Λ ∈ SO(1, 3)c , (6.35)

G(x) = 0, ∀ t < 0. (6.36)

Prima di procedere alla soluzione di questo sistema di equazioni, dimostriamo che la


soluzione, se esiste è, unica.
Unicità della funzione di Green. Per dimostrare l’unicità della funzione di Green è
sufficiente dimostrare che non esistono soluzioni dell’equazione delle onde – l’equazione
omogenea associata –
2F = 0, (6.37)

soddisfacenti (6.35) e (6.36). Determineremo prima tutte le soluzioni della (6.37) soddi-
sfacenti la (6.35), ovvero F (Λx) = F (x), e alla fine imporremo la (6.36). Per eseguire
questa analisi è conveniente passare in trasformata di Fourier, F (x) → Fb(k). La Lorentz–
invarianza di F (x) si traduce allora semplicemente nella Lorentz–invarianza di Fb(k), come
funzione di k µ . Infatti, eseguendo il cambiamento di variabili x = Λy, d4 x = d4 y, si ha,
Z Z
1 1
Fb(Λk) = 4
d xe −i Λk·x
F (x) = d4 y e−i Λk·Λy F (Λy)
(2π)2 (2π)2
Z
1
= d4 y e−i k·y F (y) = Fb(k).
(2π)2

169
Dobbiamo dunque risolvere il sistema,

k 2 Fb(k) = 0, Fb(Λk) = Fb(k), ∀ Λ ∈ SO(1, 3)c .

In realtà l’equazione delle onde è stata risolta in tutta generalità in sezione 5.2, e possiamo
quindi ricorrere ai risultati di quella sezione. Avevamo trovato che le soluzioni cadono in
due classi, rispettivamente,

FbI = δ(k 2 )f (k) (6.38)


XN
b
FII = C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k), Cν νµ3 ···µn = 0, (6.39)
n=1

dove i tensori C µ1 ···µn sono completamente simmetrici. Si tratta allora di selezionare da


ciascuna di queste classi le soluzioni Lorentz–invarianti. Per quanto riguarda le soluzioni
di tipo I osserviamo che, per l’invarianza per rotazioni spaziali, f può dipendere solo da
k 0 = ±|~k|. Ma le uniche funzioni di k 0 Lorentz–invarianti sul cono luce, sono la costante
e la funzione segno ε(k 0 ). Tenendo conto della condizione di realtà Fb ∗ (k) = Fb(−k), si
ottengono cosı̀ le due soluzioni linearmente indipendenti,

Fb1 = δ(k 2 ), Fb2 = i ε(k 0 ) δ(k 2 ).

Per quanto riguarda invece le soluzioni di tipo II osserviamo che l’invarianza di Lorentz
impone che i tensori completamente simmetrici C µ1 ···µn devono essere tensori Lorentz–
invarianti. I tensori di rango dispari devono allora essere nulli, mentre quelli di rango
pari devono essere proporzionali al prodotto completamente simmetrizzato di metriche di
Minkowski. Deve essere, cioè,

C µ1 ···µn = an η (µ1 µ2 · · · η µn−1 µn ) ,

dove gli an sono costanti. Ma questi tensori devono essere anche a traccia nulla, vedi
(6.39),
(n + 2) an (µ3 µ4
Cν νµ3 ···µn = η · · · η µn−1 µn ) = 0.
n−1
Ne segue che deve essere an = 0 per n 6= 0. Per n = 0 otteniamo invece una terza soluzione
indipendente,
Fb3 = δ 4 (k).

170
Si noti che queste tre soluzioni si possono ottenere formalmente dalla (5.29), scegliendo
rispettivamente ε(~k) = 1, i, ω δ 3 (~k). Le antitrasformate delle Fbi possono essere valutate
analiticamente, e noi le riportiamo senza dimostrazione:
µ ¶
1 1
F1 = − P ,
π x2
F2 = −ε(t) δ(x2 ),
1
F3 = ,
(2π)2

dove “P ” indica la parte principale rispetto alla variabile x0 . Si vede che tutte e tre le
soluzioni sono invarianti per SO(1, 3)c , come da costruzione, ma nessuna di esse soddisfa
la condizione di causalità (6.36). La funzione di Green ritardata, se esiste, è quidi unica.
Determinazione della funzione di Green ritardata. Determiniamo ora la soluzione del
sistema (6.34)–(6.36). Notiamo innanzitutto che l’invarianza per rotazioni spaziali,

G(t, R ~x) = G(t, ~x), ∀ R ∈ SO(3),

implica che G può dipendere da ~x solo attraverso la variabile r = |~x|,

G = G(t, r).

Poniamoci ora nella regione ~x 6= 0, t arbitrario. In questa regione si deve avere 2G = 0.


Per ~x 6= 0 è lecito usare coordinate polari, e scrivere il Laplaciano come nel problema 5.7.
Sfruttando il fatto che G non dipende dagli angoli si ottiene allora,
µ ¶
2 1 2 1¡ 2 ¢
2G = ∂t − ∂r r G = ∂t − ∂r2 (rG) = 0, (6.40)
r r

che corrisponde all’equazione delle onde in una dimensione. Ricordando la forma della
sua soluzione generale, vedi problema 5.8, abbiamo dunque,

1
G(t, r) = (f (t − r) + g(t + r)) ,
r

dove f e g sono funzioni arbitrarie di una variabile. Ma siccome G deve annullarsi ∀ t < 0
dobbiamo scegliere g = 0, e restiamo con,

1
G= f (t − r).
r

171
Per determinare f imponiamo ora che G soddisfi l’equazione del kernel (6.34) “in tutto
lo spazio”, ovvero, nel senso delle distribuzioni,

∂t2 G − ∇2 G = δ 3 (~x) δ(t). (6.41)

Indicando la derivata della f rispetto al suo argomento con un “primo”, abbiamo intanto,

1 00
∂t2 G = f (t − r).
r

Per valutare invece il Laplaciano occorre procedere con un po’ di cautela, per via della
singolarità in r = 0 del fattore 1/r. Possiamo comunque applicare la regola di Leibnitz per
le derivate, se supponiamo che f (t − r) sia regolare in r = 0, proprietà che verificheremo
a posteriori,
µ ¶ µ ¶ ³ ´
2 21 1 2 ~ 1 ~
∇ G= ∇ f (t − r) + ∇ f (t − r) + 2 ∇ · ∇ f (t − r) .
r r r

Per funzioni invarianti per rotazioni e regolari in r = 0, possiamo usare la forma del
Laplaciano utilizzata in (6.40). Abbiamo quindi,

1 2 2
∇2 f (t − r) = ∂r (rf (t − r)) = f 00 (t − r) − f 0 (t − r).
r r

Ricordiamo poi che nel senso delle distribuzioni si ha,

~ 1 = − ~x ,
∇ ∇2
1
= −4π δ 3 (~x),
r r3 r

e che
~ (t − r) = − ~x f 0 (t − r).
∇f
r
Si vede allora che le derivate prime di f si cancellano e rimane,

1 00
∇2 G = −4π δ 3 (~x) f (t) + f (t − r).
r

La (6.41) si riduce allora a,

¡ ¢
∂t2 − ∇2 G = 4πδ 3 (~x)f (t) = δ 3 (x) δ(t),

e quindi deve essere,


1
f (t) = δ(t).

172
Concludiamo che la funzione di Green ritardata è data da,
1
Gret = δ(t − r). (6.42)
4πr
Questa espressione soddisfa la (6.36), ma non sembra soddisfare (6.35). In realtà, ricor-
dando l’identità,
1
δ(x2 ) = δ(t2 − r2 ) = [δ(t − r) + δ(t + r)] ,
2r
possiamo riscrivere la (6.42) nella forma manifestamente Lorentz–invariante,
1
Gret = H(x0 ) δ(x2 ). (6.43)

Analogamente per la funzione di Green avanzata (6.33) si otterrebbe,
1
Gadv = δ(t + r) (6.44)
4πr
1
= H(−x0 ) δ(x2 ). (6.45)

In definitiva abbiamo dunque ottenuto due funzioni di Green soddisfacenti (6.34) e (6.35),
entrambi appartenenti ad S 0 , vedi problema 6.1. In particolare vale quindi,

2Gret = δ 4 (x),

2Gadv = δ 4 (x).

A priori avremmo quindi potuto scegliere come funzione di Green qualsiasi combinazione
del tipo,
G = α Gret + (1 − α) Gadv , 2G = δ 4 (x),

con α numero reale arbitrario, ma la condizione di causalità (6.36) seleziona il valore


α = 1 ! D’ora in poi al posto di Gret scriveremo semplicemente G.
Osserviamo inoltre che c’è un semplice legame tra i kernel avanzati e ritardati, e il
kernel antisimmetrico D introdotto nel paragrafo 5.2.1, vedi (5.43). Vale infatti,

D = Gret − Gadv , (6.46)

da cui discende immediatamente l’equazione caratteristica del kernel antisimmetrico,

2D = 0,

che lo identifica come “propagatore” delle onde elettromagnetiche libere.

173
6.2.2 Il potenziale vettore ritardato

Inserendo la (6.43) nella (6.30) otteniamo cosı̀ il “potenziale ritardato” Aµ ≡ Aµret ,


Z
µ 1
A (x) = d4 y H(x0 − y 0 ) δ((x − y)2 )j µ (y), (6.47)

in forma covariante a vista. Usando invece la (6.42) possiamo integrare sulla coordinata
y 0 e riscriverlo come,
Z
µ 1 1
A (t, ~x) = d4 y δ(t − y 0 − |~x − ~y |) j µ (y 0 , ~y )
4π |~x − ~y |
Z
1 1
= d3 y j µ (t − |~x − ~y |, ~y ). (6.48)
4π |~x − ~y |

In seguito faremo uso sia della (6.47) che della (6.48); la prima scrittura ha il pregio di
essere manifestamente Lorentz–invariante, la seconda quello di contenere un’integrazione
in meno.
Resta allora da imporre la condizione di gauge–fixing (6.26), che abbiamo lasciato in
sospeso. La soluzione appena scritta, con i criteri imposti, ha il carattere di unicità. Per
consistenza la condizione di Lorentz dovrebbe allora essere soddisfatta automaticamente.
In realtà questo è quello che succede. Per farlo vedere è sufficiente ricorrere alla (6.31) e
usare le proprietà della convoluzone del paragrafo 2.3.2,

∂µ Aµ = ∂µ (G ∗ j µ ) = G ∗ ∂µ j µ = 0,

dove abbiamo sfruttato la conservazione della quadricorrente. Si noti che il potenziale


Aµ = G ∗ j µ soddisfa la gauge di Lorentz indipendentemente dalla forma di G.
Funzioni di Green e causalità. Analizziamo ora brevemente la struttura causale della
soluzione (6.47). Abbiamo derivato questa formula imponendo la “condizione minimale”
che la funzione di Green si annulli per tempi negativi, assicurando cosı̀ che eventi futuri
non possano influenzare eventi passati. D’altra parte una semplice richiesta di questo
tipo è in palese conflitto con la Relatività Ristretta, perché in generale l’ordinamento
temporale tra due eventi non viene preservato da una trasformazione di Lorentz. Per
preservare l’ordinamento temporale bisogna imporre una condizione ulteriore, cioè, che
due eventi possano influenzarsi solo se sono a distanza di tipo tempo o nullo. Infatti,

174
secondo la causalità relativistica un evento y può influenzare un evento x, solo se valgono
le due condizioni,
(x − y)2 ≥ 0, x0 ≥ y 0 ,

che definiscono il cone luce futuro di y – insieme che sappiamo essere invariante sotto
trasformazioni di Lorentz proprie, vedi paragrafo 5.3.3. L’evento y può quindi influenzare
l’evento x, solo se x appartiene al cono luce futuro di y. Corrispondentemente una generica
funzione di Green causale e relativistica deve godere delle proprietà minimali,

G(x) = 0, ∀ t < 0.

G(x) = 0, ∀ x2 < 0.

La funzione di Green (6.43) dell’equazione di Maxwell non solo possiede queste proprietà,
ma è anche supportata interamente sul bordo del cono luce. Come conseguenza nella
(6.47) il potenziale vettore in un punto x è causalmente connesso solo con punti y della
corrente che stanno a distanze di tipo luce da x, e che appartengono al passato di x.
Concludiamo che nel campo elettromagnetico l’informazione si propaga dalle particelle
cariche al punto di osservazione con la velocità della luce, e non viceversa. Vedremo
che sarà proprio questa asimmetria per inversione temporale, imposta dalla causalità, a
dar luogo – in ultima analisi – al fenomeno dell’irraggiamento, ovvero, dell’emissione di
radiazione da parte di particelle cariche accelerate. Nel paragrafo 6.4.3 vedremo, infatti,
che per via di questa asimmetria le particelle accelerate emettono energia – e non la
assorbono.
Il ritardo. Concludiamo questo paragrafo con un ulteriore commento sulla struttura
relativistica della (6.48), confrontandola con la soluzione (6.13) dell’equazione di Poisson.
Riportiamo la (6.13) nell’interpretazione dell’Elettrostatica, “accendendo” il tempo,
Z
0 1 1
A (t, ~x) = d3 y j 0 (t, ~y ). (6.49)
4π |~x − ~y |

Per confrontare questa espressione con la (6.48) riscriviamo anche quest’ultima, reinse-
rendo le potenze della velocità della luce. Risulta,
Z µ ¶
µ 1 3 1 µ |~x − ~y |
A (t, ~x) = dy j t− , ~y .
4π |~x − ~y | c

175
Vediamo che l’unica differenza tra le due formule è la comparsa del “ritardo” − |~x−~
c
y|
, nel-
l’argomento temporale della corrente. Questo termine corrisponde esattamente al tempo
che la luce impiega per passare dal punto ~y in cui è situata la carica, al punto di osser-
vazione ~x, dove si valuta il campo. Il campo all’istante t nel punto ~x dipende quindi dal
|~
x−~ y|
valore della corrente nel punto ~y , all’istante “ritardato” t0 = t − c
. Nel potenziale
elettrostatico (6.49) si suppone, invece, un’interazione non locale a distanza, e il ritardo
viene trascurato.

6.2.3 Validità della soluzione e trasformata di Fourier

In questo paragrafo discuteremo brevemente i limiti di validità della soluzione formale


(6.47), o alternativamente della (6.31), date le singolarità presenti necessariamente in una
corrente j µ di particelle puntiformi.
Dato che G ∈ S 0 , la soluzione (6.31),

Aµ = G ∗ j µ , (6.50)

è in effetti ben definita in S 0 , purché j µ stia in S, come supposto in (6.27). Ma in realtà


sappiamo che le correnti fisiche non stanno in S, ma in S 0 , e per di più questa volta esse
non sono nemmeno a supporto a compatto – come succedeva invece nel caso dell’equazione
di Poisson – semplicemente perché la corrente j µ in generale è diversa da zero per qualsiasi
−∞ < t < +∞ ! Non possiamo quindi più applicare il teorema di Paley–Wiener, come
in sezione 6.1. Ciononostante, come in quel caso possiamo cercare di dare un senso alla
(6.50), passando in trasformata di Fourier. Senza dimostrazione riportiamo le formule per
le trasformate di Fourier in S 0 dei kernel ritardati e avanzati,
µ µ ¶ ¶
bret (k) = − 1 1 0 2
G P + i π ε(k ) δ(k ) (6.51)
(2π)2 k2
µ µ ¶ ¶
badv (k) = − 1 1 0 2
G P − i π ε(k ) δ(k ) . (6.52)
(2π)2 k2

Si noti, comunque, la compatibilità di queste formule con la trasformata di Fourier


dell’equazione del kernel (6.32), e con le (5.42), (6.46).
A questo punto possiamo eseguire esplicitamente la trasformata di Fourier della (6.50),
µ µ ¶ ¶
b 2 b b 1
µ µ
A (k) = (2π) Gret (k) j (k) = − P + i π ε(k ) δ(k ) b
0 2
j µ (k). (6.53)
k2

176
Come anticipato sopra, la trasformata della corrente, b
j µ (k), in generale non appartiene
ad OM , e quindi non è garantito che il prodotto a secondo membro sia ben definito. Illu-
striamo la situazione, considerando la corrente di una particella carica in moto rettilineo
uniforme, y µ (λ) = uµ λ,
Z
µ µ
j (x) = e u dλ δ 4 (x − u λ).

La sua trasformata di Fourier è facile da valutare,


Z Z Z
b e uµ e uµ e uµ
j µ (k) = 4
d xe −ik·x 4
dλ δ (x − u λ) = dλ e−ik·u λ = δ(u · k),
(2π)2 (2π)2 2π

e come si vede, essa non appartiene a OM , bensı̀ a S 0 . Ciononostante, in certi casi il


prodotto formale (6.53), ovvero l’espressione,
µ µ ¶ ¶
b µ e uµ 1 0 2
A (k) = − P + i π ε(k ) δ(k ) δ(u · k), (6.54)
2π k2

possono essere comunque ben definiti in S 0 . Per vedere quando questo succede conside-
riamo separatamente i casi di particelle massive, e particelle prive di massa.
a) Traiettorie di tipo tempo. Per una particella massiva la traiettoria è di tempo, e
possiamo porci nel suo sistema di riferimento a riposo. In questo sistema abbiamo uµ =
(1, 0, 0, 0) e δ(u · k) = δ(k 0 ). Il secondo termine del prodotto (6.54) è allora nullo, in
quanto,
1 ³ 0 ~ ´
ε(k 0 ) δ(k 2 ) δ(u · k) = δ(k − |k|) − δ(k 0 + |~k|) δ(k 0 ) = 0. (6.55)
2|~k|
La (6.54) si riduce allora a,
µ ¶
bµ 1 e uµ e uµ
A (k) = −P δ(k 0 ) = δ(k 0 ),
k2 2π ~
2π|k| 2

che appartiene effettivamente a S 0 . In realtà in questo caso è anche immediato determinare


bµ (k) esplicitamente – si veda la (6.17) – per ottenere il
l’antitrasformata di Fourier di A
noto potenziale coulombiano,
e uµ
Aµ (x) = . (6.56)
4π|~x|
Similmente si può vedere che il prodotto (6.53) definisce una distribuzione temperata, se la
corrente j µ (x) corrisponde a un’arbitraria linea d’universo di tipo tempo. E in questi casi
vedremo esplicitamente che anche le rappresentazioni integrali (6.47) e (6.48) sono sempre

177
ben definite – motivo per cui d’ora in poi ci serviremo sempre di queste rappresentazioni
esplicite.
b) Traiettorie di tipo luce. Per una particella carica priva di massa la quadrivelocità
soddisfa u2 = 0, e possiamo metterci nel sistema di riferimento in cui uµ = (1, 0, 0, 1),
sicché δ(u · k) = δ(k 0 − k 3 ). In questo caso avremmo, al posto di (6.55),

ε(k 0 ) δ(k 2 ) δ(u · k) = ε(k 0 ) δ((k 1 )2 + (k 2 )2 ) δ(k 0 − k 3 ).

A questa espressione formale si può associare un elemento di S 0 , ponendo,

δ((k 1 )2 + (k 2 )2 ) = π δ(k 1 ) δ(k 2 ).

Questa identificazione emerge se si applica il primo membro a una funzione di test di


p
S(R2 ). Usando coordinate polari bidimensionali (ϑ, ρ = (k 1 )2 + (k 2 )2 ), si ottiene infatti,
Z Z 2π Z ∞
2 1 2 2 2 1 2
d k δ((k ) + (k ) ) ϕ(k , k ) = dϑ ρ dρ δ(ρ2 ) ϕ(ρ, ϑ)
0 0
Z Z ∞
1 2π
= dϑ dρ2 δ(ρ2 ) ϕ(ρ, ϑ) = π ϕ(0).
2 0 0

La (6.54) diventerebbe allora,


µ ¶
bµ e uµ 1
A (k) = − i π ε(k ) δ(k ) δ(k ) δ(k 0 − k 3 ),
2 3 1 2
(6.57)
2π (k 1 )2 + (k 2 )2
che non appartiene a S 0 . Infatti, mentre il secondo addendo sta in S 0 , la funzione,
1
,
(k 1 )2 + (k 2 )2
non è localmente integrabile in R4 , e non ammette nessuna regolarizzazione in S 0 . Per una
particella priva di massa il prodotto (6.53) non costituisce, dunque, una distribuzione. In
questo caso questa formula, e la (6.47), sono prive di senso e devono essere abbandonate
– insieme al metodo della funzione di Green. Nondimeno vedremo che le (6.25), (6.26)
ammettono soluzioni ben definite nel senso delle distribuzioni, anche per particelle prive di
massa, e le determineremo esplicitamente in sezione 6.3.2 seguendo una strada alternativa.

6.3 Campo di una particella in moto rettilineo uniforme

Come prima applicazione della formula (6.47), in questa sezione calcoleremo il campo
elettromagnetico creato da una particella carica in moto rettilineo uniforme. Tratteremo

178
separatamente i casi di particelle massive e particelle prive di massa. Nel primo caso
il campo potrebbe essere calcolato anche attraverso una trasformazione di Lorentz dal
sistema a riposo della particella, dove,

~ = e ~x ,
E ~ = 0,
B
4π r3

al sistema di riferimento del laboratorio, vedi problema 6.3. Tuttavia, questa procedura
romperebbe l’invarianza di Lorentz manifesta. Nel secondo caso – per di più – questa pro-
cedura non sarebbe nemmeno applicabile, perché non esiste nessun sistema di riferimento
in cui una particella di massa nulla è a riposo. Nel paragrafo 6.3.2 vedremo comunque
che il campo di una particella priva di massa può essere dedotto da quello di una parti-
cella massiva, attraverso un’opportuna procedura di limite nel senso delle distribuzioni,
superando cosı̀ le difficoltà menzionate alle fine della sezione precedente.

6.3.1 Campo di una particella massiva

Secondo la (6.47) come prima cosa dobbiamo esplicitare la forma della corrente j µ (y)
associata a una particella in moto rettilineo uniforme. La linea di universo di una particella
con quadrivelocità costante si scrive,

y µ (s) = y µ (0) + uµ s, u2 = 1,

e se scegliamo l’origine del sistema di riferimento in modo tale che a t = 0 la particella


passi per l’origine, abbiamo più semplicemente,

y µ (s) = uµ s.

Per la quadricorrente si ottiene allora,


Z Z
µ µ 4 µ
j (y) = e ds u δ (y − y(s)) = e u ds δ 4 (y − u s). (6.58)

Sostituendo nella (6.47) otteniamo allora,


Z Z
µ e µ
A (x) = u d y ds H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − us)
4

Z
e µ
= u ds H(x0 − su0 ) δ((x − us)2 )

Z
e µ
= u ds H(x0 − su0 ) δ(f (s)). (6.59)

179
Abbiamo definito la funzione di s,

f (s) ≡ (x − us)2 = x2 − 2 s (ux) + s2 , (u x) ≡ uµ xµ ,

sottintendendo la dipendenza da xµ e uµ . Per valutare l’integrale della (6.59) dobbiamo


esplicitare la distribuzione δ(f (s)) in base alla (2.37), e quindi dobbiamo preventivamente
individuare gli zeri della f . Essendo quadratica f (s) ha due zeri,
p
s± = (u x) ∓ (ux)2 − x2 , f (s± ) = 0, (6.60)

entrambi reali. La quantità scalare (ux)2 − x2 è, infatti, sempre maggiore o uguale a zero.
Per rendercene conto possiamo sfruttare l’invarianza di Lorentz e valutarla nel sistema di
riferimento in cui la particella è a riposo, dove si ha uµ = (1, ~0). Si ottiene allora,

(ux)2 − x2 = (x0 )2 − ((x0 )2 − |~x|2 ) = |~x|2 ≥ 0. (6.61)

Secondo la (2.37) abbiamo allora,


δ(s − s+ ) δ(s − s− )
δ(f (s)) = + . (6.62)
|f 0 (s+ )| |f 0 (s− )|
Essendo,
f 0 (s) = 2(s − ux),

abbiamo inoltre,
p
|f 0 (s± )| = 2 (ux)2 − x2 .

Inserendo questi elementi nella (6.59) si ottiene allora,


Z
µ e uµ ¡ ¢
A (x) = p ds H(x0 − s+ u0 ) δ(s − s+ ) + H(x0 − s− u0 ) δ(s − s− ) .
4π (ux)2 − x2

Per valutare l’integrale rimanente dobbiamo studiare i segni di x0 −s± u0 . Per farlo usiamo
argomenti di covarianza. Se definiamo i quadrivettori,

V±µ = xµ − s± uµ ,

per costruzione questi vettori appartengono al cono luce, V±2 = 0. Il segno delle componen-
ti temporali V±0 = x0 − s± u0 è allora un invariante di Lorentz, e possiamo determinarlo nel
riferimento a riposo della particella. In questo riferimento abbiamo, vedi (6.60) e (6.61),

s± = x0 ∓ |~x| ⇒ V±0 = x0 − s± u0 = ±|~x|.

180
Concludiamo che in qualsiasi riferimento vale,

x0 − s+ u0 > 0, x0 − s− u0 < 0.

Di conseguenza,
H(x0 − s+ u0 ) = 1, H(x0 − s− u0 ) = 0.

Si ottiene quindi,
e uµ
Aµ (x) = p , (6.63)
4π (ux)2 − x2
formula manifestamente Lorentz–invariante. Vediamo in particolare che per la particella
statica, uµ = (1, 0, 0, 0), riotteniamo il noto potenziale coulombiano, vedi anche (6.56),

e ~ = 0.
A0 = , A (6.64)
4π|~x|

Infine possiamo calcolare il campo elettromagnetico. Dato che si ha,

µ ν e xµ − uµ (ux) ν
∂ A = u , (6.65)
4π ((ux)2 − x2 )3/2

risulta,
e x µ uν − x ν uµ
F µν = ∂ µ Aν − ∂ ν Aµ = . (6.66)
4π ((ux)2 − x2 )3/2
Contraendo invece nella (6.65) µ con ν, si verifica che il potenziale soddisfa la gauge di
Lorentz ∂µ Aµ = 0, come da costruzione.
~ e B.
I campi E ~ Partendo dalla (6.66) analizzeremo ora le proprietà generali dei campi

elettrico e magnetico prodotti da una particella in moto rettilineo uniforme, confrontandoli


in particolare con i campi di una particella non relativistica, v ¿ 1. Analizzeremo poi
questi campi anche nel regime opposto, quello ultrarelativistico, corrispondente a una
particella che si muove con velocità prossima a quella della luce.
~ eB
Cominciamo con il calcolo di E ~ a partire dalla (6.66),

e x i u0 − x 0 ui e u0 xi − v i t
E i = F i0 = = .
4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2

1 1 e kij xi uj − xj ui e u0 kij v i xj
B k = − εkij F ij = − ε = ε
2 2 4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2
e u0 kij v i (xj − v j t)
= ε = εkij v i E j . (6.67)
4π ((ux)2 − x2 )3/2

181
Abbiamo, cioè, ripristinando la velocità della luce,

~ = ~v × E.
B ~ (6.68)
c

In ogni punto il campo magnetico è dunque una semplice funzione del campo elettrico, ed
è quindi sufficiente analizzare quest’ultimo. In particolare vediamo che rispetto al campo
elettrico il campo magnetico è soppresso di un fattore v/c, in accordo con il fatto che il
secondo rappresenta un effetto dinamico.
Per analizzare la forma del campo elettrico è conveniente introdurre il vettore,

~ = ~x − ~v t,
R

congiungente in ogni istante t il punto di osservazione ~x con la posizione ~y (t) = ~v t della


particella. Con semplice algebra si trova allora,
~ 2 − v 2 R2
R2 + (~v · R)
(ux)2 − x2 = ,
1 − v2

e quindi,
~
(1 − v 2 )R
~ = e
E . (6.69)
~ 2 − v 2 R2 )3/2
4π (R2 + (~v · R)
~ il campo elettrico si può scrivere come,
Se introduciamo infine l’angolo ϑ tra ~v e R,

~ = (1 − v 2 ) ~ nr ,
E E (6.70)
(1 − v 2 sen2 ϑ)3/2

dove abbiamo introdotto il campo coulombiano non relativistico,


~
~ nr = e R .
E
4π R3

Analizziamo ora le proprietà del campo elettrico ottenuto. Intanto vediamo che per
~ decade come 1/r2 , come il campo coulombiano non
ogni t fissato, a grandi distanze E
relativistico, e quindi abbiamo l’andamento asintotico,

1
F µν ∼ , per r → ∞. (6.71)
r2
~ è ancora un campo centrale, cioè, è diretto lungo la retta passante per la posizione
Inoltre E
della particella e il punto di osservazione. Tuttavia, questo campo non è più a simmetria
sferica come il campo coulombiano non relativistico, perché il suo modulo ora dipende

182
~ rispettivamente ortogonale (ϑ = π/2) e parallelo (ϑ = 0, π)
dalla direzione. Infatti, per R
a ~v , la (6.70) dà per i corrispondenti moduli del campo elettrico,

1
E⊥ = √ Enr > Enr , (6.72)
1 − v2
Ek = (1 − v 2 ) Enr < Enr . (6.73)

Lungo la direzione del moto il campo risulta quindi schiacciato, in entrambi i versi, mentre
lungo le direzioni ortogonali al moto il campo risulta potenziato. In particolare, per
velocità che si approssimano alla velocità della luce il primo svanisce, mentre il secondo
va a infinito. Difatti per velocità molto elevate il campo elettromagnetico è praticamente
nullo in tutte le direzioni, tranne per valori di ϑ molti vicini a π/2.
Vista la (6.68), risultati analoghi valgono per il modulo del campo magnetico. Dato
~ è radiale, questa formula ci dice inoltre che le linee di campo di B
che E ~ sono circonferenze

ortogonali alla traiettoria della particella, e concentriche con essa.

6.3.2 Campo di una particella di massa nulla

Abbiamo dedotto il campo (6.66) nell’ipotesi che la velocità della particella sia costante,
ma minore di quella della luce. In questo paragrafo affrontiamo il problema del campo
elettromagnetico generato da una particella carica di massa nulla, che viaggia dunque
con la velocità della luce. Per le peculiarità dei campi di una particella ultrarelativistica,
appena messe in evidenza, ci aspettiamo campi con singolarità molto pronunciate, ai quali
si potrà dare senso solo nello spazio delle distribuzioni.
Per una particella che viaggia con la velocità della luce il tempo proprio non è definito,
e dobbiamo parametrizzare la sua linea di universo con un parametro λ generico. Se
introduciamo il quadrimomento pµ della particella possiamo parametrizzarla secondo,

y µ (λ) = pµ λ, p2 = 0, p0 = |~p| > 0,

dove di nuovo abbiamo supposto che per t = 0 la particella passi per l’origine. La direzione
del moto è allora,
p~
~n = ,
|~p|

183
e la traiettoria tridimensionale è data da ~y (t) = ~n t. Per quello che segue è conveniente
definire anche il vettore nullo,


nµ = (1, ~n) = , n2 = 0.
p0

La quadricorrente della particella è comunque data da,


Z
µ µ
J (x) = e p δ 4 (x − λp) dλ = e nµ δ 3 (~x − ~n t),

e il sistema di equazioni da risolvere è,

∂µ F µν = J ν , ∂[µ Fνρ] = 0. (6.74)

Una procedura di limite. Vogliamo ora derivare la soluzione di questo sistema dai ri-
sultati del paragrafo precedente, con un’opportuna procedura di limite. Ponendo nella
(6.58) ~v = v ~n e ricordando le (2.40), (2.41) per una particella singola, si vede intanto che
abbiamo il limite in S 0 (R4 ),
S 0 − lim j µ = J µ .
v→1

Siccome il tensore F µν definito in (6.66) soddisfa per costruzione,

∂µ F µν = j ν , ∂[µ Fνρ] = 0,

e siccome le derivate costituiscono operazioni continue in S 0 , se esiste il limite di F µν per


v → 1 nel senso delle distribuzioni, allora il tensore,

F µν ≡ S 0 − lim F µν , (6.75)
v→1

soddisfa automaticamente le (6.74). Insistiamo sul fatto che questa strategia ha senso solo
se i limiti di cui sopra vengono eseguiti nel senso delle distribuzioni: si noti in particolare
che il limite puntuale di F µν è nullo quasi ovunque, vedi (6.69).
Affrontiamo ora la determinazione del limite (6.75), partendo non direttamente dal-
la (6.66) ma dall’espressione del potenziale (6.63), che appare più semplice. Se questo
potenziale ammettesse limite nel senso delle distribuzioni, potremmo infatti scrivere,
³ ´ ³ ´
S 0 − lim F µν = ∂ µ S 0 − lim Aν − ∂ ν S 0 − lim Aµ .
v→1 v→1 v→1

184
Ora, eseguendo il limite puntuale della (6.63) si ottiene in effetti il risultato finito,

e nµ
lim Aµ (x) = , (n x) = t − ~n · ~x,
v→1 4π |(n x)|

ma questa espressione non costituisce una distribuzione! Vedremo tra poco che in realtà
il limite di Aµ nel senso delle distribuzioni non esiste – in accordo con il fatto che l’espres-
sione (6.57) non costituisce una distribuzione. Sorge allora la domanda se F µν ammette
effettivamente limite in S 0 , oppure no. La risposta può essere ancora affermativa se la
parte di Aµ che “diverge” per v → 1 in S 0 , in qualche modo non contribuisce a F µν .
A questo proposito ricordiamo in effetti che il potenziale è definito solo modulo una
trasformazione di gauge. Affinché F µν ammetta un limite ben definito è allora sufficiente
che la parte divergente del potenziale possa essere eliminata con una trasformazione di
gauge. Consideriamo, per esempio, una trasformazione di gauge con parametro,

e ¯ p ¯
¯ 2 2 ¯
Λ= ln ¯(ux) − (ux) − x ¯ . (6.76)

Con un semplice calcolo si trova che il potenziale trasformato, del tutto equivalente a
(6.63) ma non più soddisfacente la gauge di Lorentz, è dato da,
à !
eµ = Aµ + ∂ µ Λ = e (ux) xµ eν − ∂ ν A
eµ ,
A 1+ p 2
, F µν = ∂ µ A (6.77)
4π 2
(ux) − x 2 x

dove con 1/x2 intendiamo la sua parte principale. Grazie al limite puntuale,

(ux)
lim p = ε(nx),
v→1 (ux)2 − x2
dove ε(·) indica la distribuzione segno, non è difficile vedere che il limite distribuzionale
del potenziale trasformato ora è ben definito, e che coincide semplicemente con il suo
limite puntuale,
eµ = e xµ
Aµ ≡ S 0 − lim A H(n x). (6.78)
v→1 2π x2
eµ ammette limite per v → 1, mentre nello stesso limite il parametro di gauge Λ
Dato che A
diverge, vedi (6.76), risulta ora anche chiaro perché (6.63) non poteva ammettere limite.
Usando le (6.77), (6.78), possiamo ora determinare il campo elettromagnetico creato
da una particella carica di massa nulla, in moto in direzione ~n,
µ ν ν µ
eµ ) = ∂ µ Aν − ∂ ν Aµ = e n x − n x δ(n x).
eν − ∂ ν A
F µν = S 0 − lim F µν = S 0 − lim (∂ µ A
v→1 v→1 2π x2

185
Per i campi elettrico e magnetico si ottiene allora facilmente,

e ~x − ~n t
E~ = − δ(n x), ~
B = ~n × E, ~n · E = 0. (6.79)
2π x2

In particolare per i “moduli” vale E = B.


Se vede che in ogni istante i campi sono diversi da zero solo sul piano passante per la
posizione della particella in quell’istante, e perpendicolare alla sua velocità. Per esempio,
se la particella si muove lungo l’asse z si ha,

e
E~ = (x, y, 0) δ(z − t), (6.80)
2π(x2
+ y2)
e
B~ = (−y, x, 0) δ(z − t), (6.81)
2π(x + y 2 )
2

e all’istante t i campi sono non nulli solo sul piano z = t, dove sono “molto intensi”, cioè,
proporzionali alla δ di Dirac. Ricordiamo poi che per costruzione questi campi soddisfano
le equazioni di Maxwell. Si verifica per esempio facilmente che vale, vedi problema 6.4,

~ · E~ = e δ(x) δ(y) δ(z − t) = j 0 (x),


∇ ~ · B~ = 0.
∇ (6.82)

Infine, se si vuole nuovamente ottenere un potenziale nella gauge di Lorentz, è suffi-


ciente eseguire un’altra trasformazione di gauge,
³ e ¯ 2 ¯´ e
Aeµ = Aµ − ∂ µ H(n x) ln ¯x ¯ = − ln |x2 | δ(n x) nµ , ∂µ Aeµ = 0.
4π 4π

Shock waves. Campi del tipo (6.79) vengono chiamati “shock waves”, perché in ogni
istante il campo è diverso da zero solo su un piano, che avanza con la velocità della luce.
Succede allora che una carica di prova avverte un effetto solo nell’istante in cui questo
piano la colpisce, subendo una variazione istantanea, ma finita, della propria quantità di
moto. Supponiamo, per esempio, che il piano d’onda della particella colpisca all’istante
t = 0 una particella di carica e∗ non relativistica, v ¿ 1, nella posizione (x, y, 0) ≡ ~b. In
questo caso nell’equazione di Lorentz,

d~p
= e∗ (E + ~v × B)
dt

il campo magnetico è trascurabile. Inserendo in questa formula la (6.80), e integrando


tra un instante precedente e uno successivo all’urto, si trova che alla particella viene

186
comunicata la quantità di moto,
Z Z Z
t
d~p t t
e ~b e∗ e ~b e∗ e ~b
∆~p = dt = e∗ E~ dt = e∗ δ(z(t) − t) dt = ' .
−t dt −t −t 2π b2 2π b2 (1 − vz ) 2π b2 c

Nel risultato finale abbiamo ripristinato la velocità della luce, per evidenziare il fatto che
si tratta di un effetto relativistico. L’urto provoca quindi un “kick” di allontanamento se
le cariche sono dello stesso segno, e un kick di avvicinamento se sono di segno opposto.
Osserviamo, comunque, che in Elettrodinamica il fenomeno delle shock waves costi-
tuisce solo un’estrapolazione matematica – e non una situazione fisicamente realizzabile –
perché in natura non esistono particelle cariche prive di massa. Al contrario, risolvendo le
equazione di Einstein si può vedere che il campo gravitazionale generato da una particella
27
che viaggia con la velocità della luce, è ancora di tipo shock wave . Ma questa volta le
soluzioni hanno valenza fisica, perché qualsiasi particella senza massa – come il fotone –
essendo dotata di energia è gravitazionalmente “carica”, e quindi crea un campo gravita-
zionale di questo tipo. In questo caso l’estrapolazione matematica descrive, dunque, una
situazione realizzata in natura.

6.4 Campo di una particella in moto arbitrario

Come seconda applicazione importante della (6.8), determiniamo il campo elettromagne-


tico creato da una particella che percorre un’arbitraria traiettoria di tipo tempo. Rispetto
al moto rettilineo uniforme la particella possiede dunque un’accelerazione generalmente
non nulla, e vedremo che il campo generato apparirà qualitativamente molto diverso. Le
peculiarità distintive che emergeranno rispetto al moto rettilineo uniforme si possono rias-
sumere come segue. Il campo di tipo coulombiano (6.66) verrà deformato, ma manterrà il
suo andamento a grandi distanze, ovvero 1/r2 . In aggiunta comparirà un campo nuovo,
dovuto all’accelerazione della particella, che a grandi distanze decadrà più debolmente,
ovvero come 1/r, e che sarà quindi dominante rispetto al primo. Vedremo poi che sarà
proprio questo andamento asintotico più intenso ad essere responsabile del fenomeno del-
l’irraggiamento, del quale ci occuperemo in dettaglio nel prossimo capitolo: gli artefici
dell’irraggiamento sono dunque le cariche accelerate.
27
P. Aichelburg e R. Sexl, Gen. Rel. Grav. 2 (1971) 303).

187
6.4.1 Condizioni asintotiche.

Cominciamo con qualche considerazione di carattere generale, sulle traiettorie delle par-
ticelle cariche che prenderemo in considerazione.
Riferendoci a una singola particella ricordiamo che possiamo parametrizzare la sua
linea di universo con il tempo proprio, y µ (s), ma anche con il tempo t,

t ≡ y 0 (s) −→ s(t) −→ y µ (s(t)).

Con un abuso di linguaggio, in questo secondo caso indicheremo la linea di universo,


per semplicità, di nuovo con y µ (t) ≡ (t, ~y (t)). Ricordiamo poi che, a parte una costante
additiva, la relazione esplicita tra i due parametri è,
Z tp
d~y
s(t) = 1 − v 2 (t0 ) dt0 , ~v (t) ≡ . (6.83)
0 dt

Dato che in natura non esistono particelle cariche di massa nulla, prenderemo in conside-
razione solo particelle massive, per cui ad ogni istante finito si ha v < 1. Per t → ±∞, in
linea di principio può succedere che v tende a 1, come per esempio nel caso di una par-
ticella in un campo elettrico costante e uniforme, vedi problema 2.7. Difatti imporremo
una condizione leggermente più forte, cioè, che esista una velocità vM tale che,

v(t) ≤ vM < 1, ∀ t. (6.84)

Sotto questa condizione si ha,


p q
2
1 − v 2 (t) ≥ 1 − vM ,

e la (6.83) implica allora che,


lim s(t) = ±∞, (6.85)
t→±∞

Ciò assicura che i parametri s e t possono essere usati equivalentemente, per tutta l’evo-
luzione temporale. Difatti, per i moti realizzati in natura la condizione (6.84) è sempre
soddisfatta, come ora illustreremo. Le traiettorie che si riscontrano sperimentalmente
sono essenzialmente di due tipi – moti limitati e moti illimitati – e analizzeremo ora
separatamente questi due casi.

188
Moti illimitati. Per questi moti per definizione la quadrivelocità della particella am-
mette limiti finiti per t → ±∞,
lim uµ = uµ± .
t→±∞

Questa ipotesi è equivalente ad assumere che le velocità ordinarie ammettano limiti ~v± , con
v± < 1. Fisicamente queste condizioni sono motivate dal fatto che non esistono campi di
forza con un’estensione spaziale illimitata. All’infinito l’accelerazione deve quindi essere
nulla, e la velocità tendere a un vettore costante. È allora ovvio che esiste un valore
vM , per cui vale la (6.84). Esempi tipici di moti illimitati sono le traiettorie aperte di
un esperimento di scattering. Si può comunque vedere che anche per campi (costanti e
uniformi) che si estendono fino all’infinito, per cui le velocità limite eguagliano la velocità
della luce, si hanno le relazioni asintotiche, vedi problema 2.7,

s(t) ∼ ± ln |t|.

Anche in questo caso valgono quindi le (6.85).


Moti limitati. Per questi moti sono soddisfatti i vincoli,

v(t) ≤ vM < 1, |~y (t)| ≤ L, ∀ t.

Questa categoria riguarda particelle confinate a una regione limitata dello spazio, come
per esempio un elettrone in un’antenna, oppure una particella carica in un ciclotrone. Nel
primo caso la particella è sottoposta a una forza “costante” oscillante, ma contempora-
neamente dissipa energia per effetto Joule e per irraggiamento. Il risultato è che la sua
energia resta limitata, e quindi la sua velocità strettamente minore di quella della luce.
Nel caso del ciclotrone, durante alcuni tratti del ciclo, oltre al campo magnetico sono
presenti anche campi elettrici acceleranti, che tendono a fare aumentare l’energia della
particella. Tuttavia, a regime questo aumento è completamente compensato dalla perdita
di energia per irraggiamento e, come vedremo, esiste una velocità massima minore della
velocità della luce – seppure spesso molto vicina ad essa.
Infine notiamo che, dato che in natura tutti i campi acceleranti F µν hanno intensità
limitata, la (6.84) assicura, per di più, che l’accelerazione ordinaria ~a resta limitata, vedi
problema 2.10. Ricordando la relazione tra ~a e wµ si vede allora che anche la quadriacce-
lerazione di una particella carica è sempre limitata, sia per i moti limitati che per quelli

189
illimitati. In seguito tutte le traiettorie considerate saranno supposte appartenere a una
di queste due categorie.

6.4.2 I campi di Lienard–Wiechert

Per determinare il campo elettromagnetico creato da una particella in moto arbitrario,


procediamo formalmente come nel caso di una particella in moto rettilineo uniforme.
Riprendiamo la forma generale della corrente,
Z
µ
j (y) = e ds uµ (s) δ 4 (y − y(s)),

e la inseriamo nella (6.30),


Z Z
µ e
A (x) = d y ds uµ (s) H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − y(s))
4

Z
e
= ds uµ (s) H(x0 − y 0 (s)) δ((x − y(s))2 )

Z
e
= ds uµ (s) H(x0 − y 0 (s)) δ(f (s)). (6.86)

Abbiamo definito la funzione,

f (s) = (x − y(s))2 = (x0 − y 0 (s))2 − |~x − ~y (s)|2 ,

in cui sottintendiamo la dipendenza dal punto di osservazione xµ = (x0 , ~x), che è fissato.
Come prima, per valutare δ(f (s)) dobbiamo individuare gli zeri della f . Dimostreremo
ora che questa funzione ha esattamente due zeri s± (x), soddisfacenti,

x0 − y 0 (s+ ) > 0, x0 − y 0 (s− ) < 0. (6.87)

Per fare questo sfrutteremo le proprietà generali delle traiettorie di tempo considerate,
discusse nel paragrafo precedente.
Determinazione degli zeri di f (s). Incominciamo con l’osservare che si hanno i limiti,

lim f (s) = +∞. (6.88)


s→±∞

Per i moti limitati questo è ovvio, perché per s → ±∞ si ha,

y 0 (s) = t(s) → ±∞,

190
mentre ~y (s) resta limitata. Per i moti illimitati, invece, per s → ±∞ le quadrivelocità
tendono a limiti uµ± ben definiti, e quindi,

y µ (s) → uµ± s ⇒ f (s) → x2 − 2 (xu± ) s + s2 → +∞.

Dai limiti (6.88) segue che f (s) ha almeno un estremale – in particolare almeno un minimo
– e quindi la sua derivata almeno uno zero. Scegliamo un estremale qualsiasi, s = a.
Calcolando la derivata,
f 0 (s) = −2(xµ − y µ (s)) uµ (s), (6.89)

si deduce che,
f 0 (a) = −2(xµ − y µ (a)) uµ (a) = 0.

28
Ne segue che ,
f (a) < 0.

Per provare questo sfruttiamo il fatto che le quantità f (s) e f 0 (s) sono scalari per trasfor-
mazioni di Lorentz, quindi possiamo calcolarle in un sistema di riferimento arbitrario. Sce-
gliamo il sistema di riferimento in cui per s = a la particella è a riposo, uµ (a) = (1, 0, 0, 0).
Allora abbiamo,

0 = f 0 (a) = −2(x0 − y 0 (a)) ⇒ f (a) = −|~x − ~y (a)|2 < 0.

Tutti i minimi e massimi di f (s) si trovano dunque nel semipiano inferiore. Questa
informazione, assieme al fatto che per s → ±∞ f va a +∞, implica che per ogni xµ
fissato f possiede esattamente due zeri s± ,

f (s± ) = 0, s+ < s− .

In s+ f passa da valori positivi a valori negativi, e in s− da valori negativi a valori positivi.


Di conseguenza abbiamo,
f 0 (s+ ) < 0, f 0 (s− ) > 0.

Valutando queste disuguaglianze tramite la (6.89) nei riferimenti in cui la particella è


a riposo, rispettivamente agli istanti s+ e s− , si ottengono le relazioni (6.87) in questi
28
In tutta questa analisi è sottointeso che x non appartenga alla linea di universo della particella, cioè,
x 6= y µ (s), ∀ s. Nei punti x appartenenti alla linea di universo il potenziale vettore diverge.
µ

191
µ
riferimenti. Ma dato che i vettori xµ − y± (s) appartengono al cono luce, il segno di
x0 − y ±
0
(s) è un invariante relativistico. Concludiamo quindi che le disuguaglianze (6.87)
valgono in qualsiasi sistema di riferimento, c.v.d.
Il quadripotenziale di Lienard–Wiechert. A questo punto possiamo valutare l’integran-
do della (6.86), usando la (2.37),
µ ¶
0 0 δ(s − s+ ) δ(s − s− )
0 0
H(x − y (s)) δ(f (s)) = H(x − y (s)) +
|f 0 (s+ )| |f 0 (s− )|
δ(s − s+ ) δ(s − s− )
= H(x0 − y 0 (s+ )) 0 + H(x0 − y 0 (s− )) 0
|f (s+ )| |f (s− )|
δ(s − s+ ) δ(s − s+ )
= 0
= .
|f (s+ )| 2(x − y(s+ ))u(s+ )

Sostituendo nella (6.86) si ottiene il quadripotenziale di Lienard–Wiechert,


¯
e uµ (s) ¯
µ
A (x) = ¯ , (6.90)
4π (x − y(s))u(s) ¯s=s+ (x)

dove la funzione s+ (x) è determinata in modo univoco dalle relazioni,

(x − y(s))2 = 0, x0 − y 0 (s) > 0, (6.91)

equivalenti a,
x0 − y 0 (s) = |~x − ~y (s)|. (6.92)

Il tempo ritardato. Per renderci conto del significato della posizione y µ (s+ ) della par-
ticella al tempo proprio s+ , è più conveniente parametrizzare la sua linea di universo con
il tempo,

d~y (t0 ) 1
t0 = y 0 (s), y µ (t0 ) = (t0 , ~y (t0 )), ~v (t0 ) = , uµ (t0 ) = p (1, ~v (t0 )).
dt0 1− v(t0 )2
Questo permette di riscrivere il potenziale di Lienard–Wiechert come,

e uµ (t0 )
Aµ (x) =
4π (x − y(t0 )) u(t0 )

e (1, ~v (t0 ))
=
4π t − t0 − (~x − ~y (t0 )) · ~v (t0 )
³ 0
´
e 1, ~v(tc )
= , (6.93)
4π |~x − ~y (t0 )| − (~x − ~y (t0 )) · ~v(t0 )
c

192
dove il “tempo ritardato” t0 (t, ~x) è determinato dalla (6.92),

1
t − t0 = |~x − ~y (t0 )|. (6.94)
c

Nelle formule finali abbiamo reinserito la velocità della luce, per evidenziare le correzioni
relativistiche; per il caso statico si veda la (6.64). Come si vede, il potenziale nel punto
xµ = (t, ~x) non dipende dalle variabili cinematiche della particella all’istante t, bensı̀ dai
valori di posizione e velocità all’istante ritardato t0 . Dalla (6.94) si vede che questo istante
è determinato in modo tale che l’evento (t0 , ~y (t0 )) sia connesso attraverso un segnale di tipo
luce “futuro”, al punto d’osservazione xµ . La presenza del ritardo comporta nella (6.93)
correzioni relativistiche implicite, in quanto t0 = t − o(1/c). Più precisamente, eseguendo
lo sviluppo non relativistico della (6.94) si ottiene,
µ ¶
0 |~x − ~y (t)| (~x − ~y (t)) · ~v (t) 1
t (t, ~x) = t − − +o . (6.95)
c c2 c3

Al denominatore della (6.93) compare poi una correzione relativistica esplicita, per la
presenza del termine proporzionale a v(t0 )/c.
I campi di Lienard–Wiechert. Passiamo ora al calcolo del campo elettromagnetico
F µν = ∂ µ Aν − ∂ ν Aµ . In seguito per semplicità con “s” indicheremo la funzione di x s+ (x).
Introduciamo oltre alla quadriaccelerazione wµ = duµ /ds, il quadrivettore dipendente da
x,
Lµ (x) ≡ xµ − y µ (s), (6.96)

dove bisogna tenere presente che la dipendenza da x avviene anche attraverso s. Allora il
sistema (6.91) può essere riscritto come,

Lα Lα = 0, L0 = |~x − ~y (s)|. (6.97)

Per il potenziale e il campo elettromagnetico si ottiene allora,


µ ¶
µ e uµ µν e 1 µ ν 1 µ ν
A = , F = ∂ u − ∂ (uL) u − (µ ↔ ν) . (6.98)
4π (uL) 4π (uL) (uL)2

Per determinare le derivate rimanenti dobbiamo valutare le derivate parziali di s ≡ s(x)


rispetto a xµ . A questo scopo è sufficiente derivare la (6.97) rispetto a xµ ,
µ ¶
α α α ∂s dyα ∂s
0 = L ∂µ Lα = L ∂µ (xα − yα (s)) = L ηαµ − µ = Lµ − (uL) µ ,
∂x ds ∂x

193
che dà,
∂s Lµ
µ
= .
∂x (uL)
Possiamo ora calcolare le derivate che compaiono in F µν ,
∂s duν Lµ wν
∂ µ uν = = ,
∂xµ ds (uL)
∂s dyν L µ uν
∂µ Lν = ηµν − µ = ηµν − ,
∂x ds (uL)
e quindi,

∂µ (uL) = (∂µ uν )Lν + uν ∂µ Lν


µ ¶
1 ν Lµ uν
= Lµ (wL) + u ηµν −
(uL) (uL)
1
= ((wL) − 1)Lµ + uµ .
(uL)
Sostituendo queste espressioni nella (6.98) si ottiene infine un’espressione covariante a
vista, per il campo elettromagnetico prodotto da una particella carica in moto arbitrario,
e ³ ´
F µν = Lµ ν
u + L µ
[(uL) w ν
− (wL) u ν
] − (µ ↔ ν) . (6.99)
4π(uL)3
Campi di velocità e campi di accelerazione. Come prima cosa vogliamo analizzare il
comportamento della (6.99) a grandi distanze dalla particella. A questo scopo è convenien-
te suddividere i termini che compaiono in F µν in due classi, in base alla loro dipendenza
dalla variabile,
R ≡ L0 = |~x − ~y (s)|,

vedi (6.97). È anche conveniente definire il versore nullo,



mµ ≡ , mµ mµ = 0,
R
con componenti,
~x − ~y (s)
m0 = 1, m
~ = , |m|
~ = 1.
|~x − ~y (s)|
Scrivendo Lµ = R mµ possiamo allora riscrivere il campo (6.99) come somma di due
contributi, il “campo di velocità” Fvµν , e il “campo di accelerazione” Faµν ,

F µν = Fvµν + Faµν , (6.100)


e
Fvµν = 3 2
(mµ uν − mν uµ ) , (6.101)
4π(um) R
e ³ ´
Faµν = m µ
[(um) w ν
− (wm) u ν
)] − (µ ↔ ν) . (6.102)
4π(um)3 R

194
In Faµν abbiamo incluso i termini proporzionali a 1/R, e in Fvµν i termini proporzionali
a 1/R2 . Come si vede il primo risulta proporzionale alla quadriaccelerazione, mentre il
secondo ne è indipendente.
Analizziamo ora gli andamenti di questi campi a grandi distanze dalla particella. Per
fare questo supponiamo che la particella si muova in una regione limitata dello spazio,

|~y | ≤ D,

e consideriamo il campo in un punto ~x lontano da questa regione,

r ≡ |~x| À D.

Allora abbiamo le identificazioni asintotiche,


~x − ~y ~x
R = |~x − ~y | ≈ r, m
~ = ≈ ≡ ~n. (6.103)
|~x − ~y | r
Siccome per qualsiasi valore di r i vettori uµ , wµ e mµ sono limitati, vediamo che a grandi
distanze dalla particella il campo di accelerazione decade come,
1
Faµν ∼ , (6.104)
r
mentre il campo di velocità decade come,
1
Fvµν ∼ . (6.105)
r2
In particolare vediamo che a grandi distanze il campo di accelerazione domina sul campo
di velocità, e quindi il campo totale decade come,
1
F µν ∼ ,
r
in contrapposizione con l’andamento del campo del moto rettilineo uniforme, vedi (6.71).
Consideriamo ora più da vicino il campo di velocità, riscrivendolo come,
e
Fvµν = (Lµ uν − Lν uµ ) . (6.106)
4π(uL)3
È facile vedere che per un moto rettilineo uniforme questo campo si riduce in realtà alla
(6.66). Infatti, se y µ (s) = uµ s, si ha Lµ = xµ − uµ s, e quindi,

Lµ uν − Lν uµ = xµ uν − xν uµ ,
p
(uL) = uµ (xµ − uµ s) = (ux) − s+ (x) = (ux)2 − x2 ,

195
vedi (6.60). Il campo Fvµν rappresenta quindi una deformazione del campo elettromagneti-
co di una particella in moto rettilineo uniforme, ed eredita in particolare il suo andamento
asintotico 1/r2 . Per questo motivo Fvµν viene anche chiamato “campo coulombiano”.
Un effetto genuinamente nuovo è invece rappresentato dalla comparsa del campo di
accelerazione Faµν – causato appunto dall’accelerazione della particella – che a grandi
distanze soppianta il campo di velocità. Nel prossimo paragrafo vedremo che è proprio
questo campo a causare il fenomeno dell’irraggiamento.
~ e B.
I campi E ~ Esplicitiamo ora i campi elettrico e magnetico corrispondenti alla

(6.99). Usando le (6.100)–(6.102), questi campi possono a loro volta essere suddivisi
in campi di velocità, indipendenti dall’accelerazione e proporzionali a 1/R2 , e in campi di
accelerazione, lineari nell’accelerazione e proporzionali a 1/R,

~ = E
E ~v + E
~ a,

~ = B
B ~v + B
~ a.

Esplicitiamo prima la quadriaccelerazione in termini dell’accelerazione spaziale ~a = d~v /dt0 ,

~a · ~v 1
wµ = 2 3/2
uµ + (0, ~a).
(1 − v ) (1 − v 2 )

Si vede allora che il termine proporzionale a uµ si cancella, quando wµ viene inserito in


[(um) wν − (wm) uν ]. Usando anche che,

1
(um) = √ (1 − ~v · m),
~
1 − v2

con calcoli elementari dalle (6.101), (6.102) si trova allora, ripristinando la velocità della
luce,
³ ´¡ ¢
v2 ~v
e 1 − c 2 m
~ − c
~v
E = ¡ ¢3 , ~v = m
B ~v,
~ ×E (6.107)
4πR 2 ~
v · m
~
1− c
£¡ ¢ ¤
~a e m ~ × m ~ − ~vc × ~a ~a = m ~ a,
E = ¡ ¢ , B ~ ×E (6.108)
4πc2 R ~ 3
1 − ~v·m c

che sono i campi di Lienard–Wiechert. Si badi che le quantità cinematiche ~y , ~v e ~a che


compaiono in queste formule sono valutate all’istante ritardato t0 (x), definito dalla (6.94).

196
Vediamo che in ogni punto i campi elettrico e magnetico sono ortogonali tra di loro, in
quanto si ha,
~ =m
B ~
~ × E.

~ v si vede poi che si può anche scrivere,


Data l’espressione particolare di E

~ v = ~v × E
B ~v.
c

Il campo magnetico di velocità è quindi soppresso di un fattore v/c rispetto al campo


elettrico di velocità, come nel caso del moto rettilineo uniforme, vedi (6.68). Viceversa,
i campi elettrico e magnetico di accelerazione sono invece uguali in modulo, in quanto si
ha,
m ~ a = 0,
~ ·E ~a = m
B ~ a,
~ ×E ~ a | = |E
|B ~ a |, (6.109)

relazioni che sfrutteremo nel prossimo paragrafo.


~ v , i campi E
Facciamo infine notare che rispetto al campo di velocità E ~a e B
~ a portano

un prefattore 1/c2 . I campi di accelerazione rappresentano quindi degli effetti prettamente


relativistici !
Andamenti asintotici in generale. Concludiamo questo paragrafo con una generaliz-
zazione importante. Grazie al fatto che la (6.47) è lineare nella corrente, gli andamenti
asintotici del campo (6.99) derivati sopra si estendono, infatti, automaticamente al campo
elettromagnetico generato da un arbitrario sistema di cariche puntiformi. In particolare
il campo si scriverà ancora come,

F µν = Fvµν + Faµν , (6.110)

dove a grandi distanze,


1 1
Fvµν ∼ , Faµν ∼ . (6.111)
r2 r
Per il campo totale si avrà quindi di nuovo,

1
F µν ∼ . (6.112)
r

A livello asintotico si possono generalizzare anche le (6.109), ricordando che per grandi r
si ha l’identificazione, vedi (6.103),
m
~ ≈ ~n,

197
dove il versore radiale ~n è indipendente dalle traiettorie delle particelle. Per un siste-
ma arbitrario di particelle dalle (6.109) – per linearità – si ottengono allora le relazioni
asintotiche,

~ a = 0,
~n · E ~ a = ~n × E
B ~ a, ~ a | = |E
|B ~ a |, per r → ∞. (6.113)

Ancora, siccome anche le correnti “macroscopiche” – come quelle corrispondenti agli elet-
troni in un’antenna o in un circuito elettrico – possono essere pensate come sovrapposizioni
delle correnti elementari delle cariche costituenti, gli andamenti asintotici (6.113) valgono
anche per i campi generati da tali correnti.

6.4.3 Emissione di radiazione da cariche accelerate

Ora che abbiamo un’espressione per il campo elettromagnetico prodotto da una particella
carica in moto arbitrario, possiamo chiederci sotto quali condizioni una particella cede o
assorbe energia o, più in generale, quadrimomento, attraverso questo campo. Non siamo
quindi interessati al quadrimomento che le particelle cedono al campo, ma piuttosto al
quadrimomento che il sistema campo + particelle cede all’“ambiente” – che è quello che
viene rivelato sperimentalmente. Con un abuso di linguaggio, che adotteremo anche noi,
si parla comunque di “quadrimomento emesso dalle particelle”.
Formula fondamentale per l’emissione di quadrimomento. Consideriamo dunque un ge-
nerico sistema di particelle cariche interagenti con il campo elettromagnetico. Come ab-
biamo visto, il trasporto di quadrimomento di un tale sistema è quantificato dal tensore
energia–impulso del solo campo elettromagnetico, vedi paragrafo 2.4.3,

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ .
4

In particolare, se consideriamo “positivo” il quadrimomento emesso – come d’ora in poi


faremo sempre – il quadrimomento emesso nell’unità di tempo da una superficie chiusa Γ
è dato da, vedi (2.81),
Z
dP µ µi
= Tem dΣi . (6.114)
dt Γ

Tuttavia, il quadrimomento che può essere considerato definitivamente ceduto dal sistema
all’ambiente, è solo quello che successivamente non viene riassorbito. Il quadrimomento

198
29
in questione è quindi quello che riesce a raggiungere l’infinito spaziale . Questo vuol
dire che nell’integrale in (6.114) dobbiamo scegliere per Γ una sfera di raggio r, e poi fare
~ = ~n r2 dΩ,
tendere r all’infinito. Scrivendo l’elemento di superficie della sfera come dΣ
dove dΩ è l’angolo solido, per il quadrimomento emesso nell’unità di tempo otteniamo
allora,
Z
dP µ
= r2 µi i
Tem n dΩ, r → ∞. (6.115)
dt
Da questa espressione possiamo infine selezionare il quadrimomento emesso nell’unità di
tempo e nell’unità di angolo solido, in direzione ~n,

d2 P µ ¡ µi i ¢
= r2 Tem n , r → ∞, (6.116)
dt dΩ

dove d’ora in poi il limite per r → ∞ sarà sempre sottinteso. La (6.116) costituisce la
formula fondamentale per l’analisi di tutti i fenomeni di irraggiamento. Si vede allora in
µi
particolare che, per valutare il quadrimomento emesso, è sufficiente selezionare da Tem i
contributi che vanno come 1/r2 ovverosia, dato che Tem
µν
è proporzionale a (F µν )2 , da F µν
quelli che vanno come 1/r. Ma visti gli andamenti asintotici (6.111), questo significa che
al membro di destra della (6.116) contribuisce solo il campo di accelerazione.
La doppia conclusione di questa analisi – completamente generale – è che al quadrimo-
mento emesso da un sistema di cariche contribuisce solo il campo di accelerazione, e che
per determinare il primo è sufficiente valutare il secondo a grandi distanze dalle cariche.
Emissione di energia. Consideriamo ora più in dettaglio l’emissione di energia. Per
l’energia P 0 ≡ ε emessa nell’unità di tempo e nell’unità di angolo solido, ovverosia, per la
potenza W = dε/dt emessa nell’unità di angolo solido, la componente zero della (6.116)
0i
fornisce, si ricordi che Tem = S i,

dW d2 ε ~ · ~n).
= = r2 (S (6.117)
dΩ dt dΩ

Ma per quanto concluso sopra, al vettore di Poynting contribuiscono solo i campi di


accelerazione,
~=E
S ~ ×B
~ → ~a × B
E ~ a,
29
A livello quantistico questo significa che consideriamo “emessi” solo quei fotoni che riescono a
raggiungere l’infinto, e non vengono successivamente risassorbiti dalle particelle.

199
e questi ultimi vanno inoltre valutati a grandi distanze. Possiamo allora usare le relazioni
asintotiche (6.113), per derivare la semplice formula,

~=E
S ~a × B
~a = E
~ a × (~n × E
~ a ) = ~n |E
~ a |2 . (6.118)

~ ha la stessa direzione e lo stesso verso di ~n, e ne segue che il flusso


Risulta, quindi, che S
di energia è sempre radiale uscente, verso l’infinito: l’energia viene quindi sempre emessa
dalle particelle, e mai assorbita ! Questa circostanza è una conseguenza diretta del fatto
che abbiamo utilizzato il kernel ritardato Gret ; se avessimo usato il kernel avanzato Gadv ,
il flusso di energia sarebbe stato invece sempre entrante dall’infinito.
Se inseriamo la (6.118) nella (6.117) vediamo che la potenza emessa dipende in modo
semplice dal modulo del campo elettrico di accelerazione, valutato a grandi distanze dalla
particella,
dW ~ a |2 ,
= c r 2 |E (6.119)
dΩ
~ a decade come 1/r,
dove abbiamo ripristinato la velocità della luce. Grazie al fatto che E
~ a | = |E
la potenza emessa sarà in particolare sempre finita. Inoltre, siccome |B ~ a | abbiamo,

W =0 ⇔ Faµν = 0.

La presenza o assenza di energia emessa costituisce quindi un fenomeno Lorentz invarian-


te, cioè, indipendente dal sistema di riferimento. In presenza di una singola particella
abbiamo inoltre, vedi la (6.102) e il problema 6.2,

Faµν = 0 ⇔ wµ = 0.

La presenza o assenza di energia emessa è quindi legata inscindibilmente all’accelerazione


della particella.
Il campo di accelerazione come campo di radiazione. Possiamo infine cercare di met-
tere in relazione il campo di accelerazione Faµν , con i “campi di radiazione” – le soluzioni
dell’equazione di Maxwell nel vuoto, che abbiamo studiato nel capitolo precedente. A
questo proposito notiamo che nel complemento della linea di universo, il campo totale
(6.100) soddisfa evidentemente le equazioni di un campo di radiazione,

∂µ F µν = 0 = ∂[µ Fνρ] .

200
Ma dato che F µν = Fvµν + Faµν , e che Fvµν decade come 1/r2 , ne segue che Faµν (che di per
sè decade solo come 1/r) soddisfa queste equazioni asintoticamente, vale a dire modulo
termini 1/r2 , µ ¶ µ ¶
1 1
∂µ Faµν =o , ∂[µ Fa νρ] = o .
r2 r2
Ci aspettiamo allora che a grandi distanze dalla particella il campo di accelerazione si
comporti come un campo di radiazione, e che risulti in particolare sovrapposizone di on-
de piane. Dalla formula del vettore di Poynting (6.118) – formalmente identico a quello
delle onde piane (5.76) – si desume allora che le onde che compongono Faµν si propagano
necessariamente lungo la direzione radiale uscente. Siamo quindi portati a concludere che
l’energia emessa (6.119) viaggia asintoticamente a cavallo di un campo di radiazione, che
è composto da onde elettromagnetiche che si propagano in direzione radiale. Nel prossi-
mo capitolo renderemo questa affermazione precisa, analizzando in dettaglio le proprietà
asintotiche di un generico campo di accelerazione Faµν . Per le caratteristiche appena de-
scritte, il campo di accelerazione viene spesso anche chiamato semplicemente “campo di
radiazione”.
In conclusione, una carica accelerata cede energia e quantità di moto attraverso il suo
campo di radiazione, liberando onde elettromagnetiche che le trasportano fino all’infinito.

6.4.4 Limite non relativistico e formula di Larmor

Per illustrare il significato delle formule del paragrafo precedente determiniamo la potenza
totale emessa da una particella carica accelerata in tutte le direzioni,
Z
dW
W= dΩ, (6.120)
dΩ

nel limite non relativistico. Per essere precisi, vogliamo valutare questa potenza all’ordine
più basso in 1/c che, come vedremo, corrisponde a W ∼ 1/c3 .
Data la (6.119) si tratta dunque di valutare il campo elettrico di accelerazione all’ordine
più basso in 1/c. Siccome questo campo porta un prefattore 1/c2 , nella (6.108) possiamo
allora trascurare i fattori v/c, ottenendo,

~a = e ~ a |2 = ~ × ~a|2
e2 | m
E m
~ × (m
~ × ~a), |E . (6.121)
4πR c2 16 π 2 R2 c4

201
La validità di questa approssimazione richiede dunque in particolare che la particella si
muova con velocità piccola rispetto alla velocità della luce,

v ¿ c,

come c’era da aspettarsi. Per determinare la distribuzione angolare della potenza emessa
~ a asintoticamente, a grandi distanze dalla particella,
(6.119) dobbiamo inoltre valutare E
per cui secondo le (6.103) si ha R → r e m
~ → ~n. La (6.119) diventa allora,
dW e2
= 2 3
|~n × ~a|2 . (6.122)
dΩ 16 π c
La potenza emessa nell’unità di angolo solido è quindi quadratica nell’accelerazione della
particella, ma esibisce anche una dipendenza esplicita dalla direzione ~n in cui si osserva
la radiazione.
Il ritardo asintotico. Prima di poter determinare la potenza totale integrando la (6.122)
sull’angolo solido, occorre fare una precisazione sull’interpretazione di questa formula in
relazione alla propagazione causale della radiazione. Questa formula dà, infatti, l’energia
emessa dalla particella nell’unità di tempo e nell’unità di angolo solido in direzione ~n
– rivelata all’istante t a una distanza r molto grande dalla particella, e il membro di
dW
sinstra della (6.122) andrebbe quindi scritto meglio come dΩ
(t, r, ~n). L’accelerazione che
compare al membro di destra della formula è, invece, valutata all’istante ritardato t0 (t, ~x),
determinato dalla relazione (6.94),
1
t − t0 = |~x − ~y (t0 )|. (6.123)
c
Anche questa relazione va valutata asintoticamente, per punti di osservazione ~x molto
lontani dalla traiettoria della particella. Supponiamo allora che la particella sia confinata
alla sfera SD , di raggio D e centro nell’origine: |~y (t)| < D, ∀ t, e scegliamo r = |~x| À D.
Ricordando che ~n = ~x/r abbiamo allora lo sviluppo,
¯ ¯ r
¯ ~
y (t0 ¯
) 0 2 0
|~x − ~y (t )| = r ¯¯~n −
0 ¯ = r 1 − 2 ~n · ~y (t ) + y (t )
r ¯ r r2
µ µ ¶¶ µ ¶
~n · ~y (t0 ) 1 0 1
= r 1− +o 2 = r − ~n · ~y (t ) + o , (6.124)
r r r
e si ottiene per la versione asintotica della (6.123),
r ~n · ~y (t0 ) ~n · ~y (t0 )
t0 = t − + ≡T+ . (6.125)
c c c
202
La (6.122) si scrive quindi più precisamente,

dW e2 2
(t, r, ~n) = 2 3
|~n × ~a(t0 )| , (6.126)
dΩ 16 π c

dove la funzione t0 = t0 (t, ~x) è definita dalla relazione implicita (6.125).


Vediamo che il tempo ritardato (6.125) è composto da un termine “macroscopico”,
T = t − rc , e da un contributo “microscopico”, ~n · ~y (t0 )/c. Il primo rappresenta l’istante
(ritardato) in cui la radiazione deve lasciare il centro di SD , per giungere all’istante t
nel punto di rivelazione ~x. Questo istante è indipendente dal moto della particella e
dalla direzione di osservazione ~n. Il termine microscopico rappresenta invece un ritardo
aggiuntivo causato dal moto ~y (t) della particella all’interno di SD , e dipende da ~n. Siccome
questo termine è inoltre soppresso di un fattore 1/c, nel limite non relativistico esso potrà
essere trascurato, vedi sotto.
Il membro di destra della (6.126) esibisce quindi una dipendenza esplicita da ~n, e una
implicita attraverso t0 . Di conseguenza l’integrale sugli angoli nella (6.120) in generale
non può essere eseguito analiticamente. Possiamo comunque risolvere iterativamente la
(6.125) attraverso uno sviluppo non relativistico in potenze di 1/c,
µ ¶
0 ~n · ~y (T ) (~n · ~y (T ))(~n · ~v (T )) 1
t =T+ + 2
+ 3 .
c c c

che porta a, µ ¶
0 ~n · ~y (T ) ˙ 1
~a(t ) = ~a(T ) + ~a(T ) + . (6.127)
c c2
Tuttavia, dato che la (6.126) è stata ottenuta trascurando nella (6.108) i fattori v/c,
per consistenza anche nella (6.127) dobbiamo omettere i termini di ordine 1/c, e tenere
quindi solo il contributo di ordine zero ~a(T ), che equivale a porre t0 = T . In questo limite
si trascura quindi, in particolare, il ritardo microscopico. In conclusione, nel limite non
relativistico la radiazione che viene rivelata a un istante t a una distanza r dalla particella,
viene considerata emessa dalla particella all’istante ritardato T = t − rc , e quindi l’energia
emessa corrisponente (6.126) deve dipendere dal valore dell’accelerazione ~a(T ) allo stesso
istante.
Nello sviluppo (6.127) i termini di ordine 1/c e successivi rappresentano, invece, corre-
zioni relativistiche di ordine superiore. Per una trattazione sistematica degli sviluppi non

203
relativistici rimandiamo alla sezione 7.3, dove faremo in particolare vedere che, affinchè il
ritardo microscopico possa essere trascurato, è necessario che le particelle si muovano con
velocità piccole rispetto alla velocità della luce.
Formula di Larmor. Nell’approssimazione non relativistica l’accelerazione ~a(T ) ≡ ~a
nella (6.126) risulta indipendente dagli angoli, e la potenza totale (6.120) può allora essere
valutata esplicitamente. Per fare questo è sufficiente scegliere come asse z la direzione di
~a, e usare le relazioni,

|~n × ~a|2 = | ~a |2 sen2 ϑ, dΩ = senϑ dϑ dϕ.

Risulta allora,
Z 2π Z π
e2 | ~a |2
W= dϕ sen3 ϑ dϑ.
16 π 2 c3 0 0

Svolgendo gli integrali si ottiene una formula semplice per la potenza totale emessa da
una particella non relativistica, con carica e e accelerazione ~a,
e2 | ~a |2
W= , (6.128)
6π c3
che è la nota formula di Larmor (1897). Insistiamo sul fatto che in questa formula la
potenza W(t, r) rivelata a un istante t a una distanza r dalla particella, coinvolge al
membro di destra l’accelerazione valutata all’istante t − rc . Proprio perché la radiazione
si propaga con velocità c, la formula può allora anche essere interpretata dicendo che, se
a un dato istante la particella possiede l’accelerazione ~a, in quell’istante essa emette la
potenza e2 |~a|2 /6πc3 . Torneremo su questo punto in sezione 9.1, dove discuteremo la gene-
ralizzazione relativistica della (6.128). Le conseguenze fenomenologiche della formula di
Larmor saranno invece analizzate nel prossimo capitolo, dove la rideriveremo nell’ambito
di un approccio più sistematico.

6.5 Problemi

6.1 Si dimostri che la funzione di Green ritardata (6.43) definisce una distribuzione in
S 0 (R4 ).

6.2 Si dimostri che il campo Faµν asintotico dato in (6.102) è nullo in ogni direzione ~n,
se e solo se wµ = 0. [Sugg.: può essere utile usare il sistema a riposo istantaneo.]

204
6.3 Si consideri una particella di carica e che si muove con velocità v costante lungo
l’asse z, nel sistema di riferimento del laboratorio K. Si consideri che nel sistema di
riferimento K 0 , dove la particella è a riposo in ~x 0 = 0, il quadripotenziale vale,

e
A0µ (x0 ) = (1, 0, 0, 0).
4π|~x 0 |

a) Si determini la trasformazione di Lorentz Λµ ν che connette un evento in K con l’evento


corrispondente in K 0 .
b) Si determini il potenziale Aµ (x) in K sfruttando il fatto che esso è un quadrivettore, e
si confronti il risultato con la (6.63).

6.4 Si verifichi che i campi elettrico e magnetico di una particella priva di massa soddi-
sfano le equazioni (6.82), dimostrando in particolare che in due dimensioni vale l’identità
distribuzionale,
~ · ~x = 2π δ 2 (~x),

r2
p
dove ~x ≡ (x, y) e r = x2 + y 2 .
Se ne deduca che la funzione di Green del laplaciano bidimensionale è data dal
logaritmo, µ ¶ µ ¶
1 1 p
2
∇ ln r = (∂x2 + ∂y2 ) ln x2 + y 2 = δ 2 (~x).
2π 2π

205
7 Irraggiamento

Con “irraggiamento” si intende genericamente il fenomeno dell’emissione di radiazione


da parte di un generico sistema carico. Nel capitolo precedente abbiamo derivato un’e-
spressione esatta per il campo elettromagnetico generato da una particella carica in moto
arbitrario. Abbiamo visto che se la particella è accelerata, allora essa genera un campo di
accelerazione che a grandi distanze decade come 1/r e che trasporta energia e quantità di
moto. Abbiamo anche constatato che l’analisi quantitativa della radiazione, e in partico-
lare la determinazione del quadrimomento emesso, in realtà non richiedono la conoscenza
dei campi di Lienard–Wiechert esatti, ma solo della loro forma asintotica.
Nel presente capitolo vogliamo eseguire un’analisi sistematica della radiazione emessa
da un arbitrario sistema carico, rappresentato da una quadricorrente j µ generica. Siccome
a livello microscopico qualsiasi sistema carico può essere pensato come composto da un
insieme di particelle cariche puntiformi, il suo campo a grandi distanze decade ancora
come 1/r, e per analizzare la radiazione emessa è di nuovo sufficiente determinare il suo
andamanto asintotico. Uno degli scopi principali di questo capitolo sarà in particolare la
determinazione del quadrimomento emesso dal sistema nell’unità di tempo, vedi (6.116),

d2 P µ ¡ µi i ¢
= r2 Tem n . (7.1)
dt dΩ

Siccome al membro di destra di questa formula contribuiscono solo i campi F µν che a


grandi distanze decadono come 1/r, per valutare il quadrimomento emesso è allora suffi-
ciente selezionare anche dal quadripotenziale Aµ di (6.48) i contributi che vanno come 1/r.
La prossima sezione sarà dunque dedicata a un’analisi sistematica del quadripotenziale a
grandi distanze dal sistema carico, ovvero nella “zona della onde”.
Decomposizione spettrale della corrente. Concludiamo questa premessa con una speci-
ficazione sulla natura delle correnti che considereremo. In primo luogo queste dovranno
certamente essere conservate, ∂µ j µ = 0. Le correnti che compaiono nella realtà fisica si
suddividono poi naturalmente in due categoria a seconda della loro dipendenza dal tem-
po, correnti aperiodiche e correnti periodiche. Nel primo caso la corrente ammette una
trasformata di Fourier nella sola variabile temporale, ovvero, ammette la “decomposizione

206
spettrale”,
Z ∞
µ 1
j (t, ~x) = √ dω eiωt j µ (ω, ~x), (7.2)
2π −∞

dove la trasformata j µ (ω, ~x) rappresenta il “peso continuo” con cui la frequenza ω compare
nella corrente. Siccome la corrente è reale questi pesi devono soddisfare la condizione di
realtà,
j µ∗ (ω, ~x) = j µ (−ω, ~x),

a causa della quale in seguito le frequenze saranno considerate sempre positive. Esempi
di processi che corrispondono a correnti aperiodiche sono gli urti elastici tra particelle
cariche, o il passaggio di una particella carica attraverso una zona limitata con un campo
elettromagnetico non nullo.
Se la corrente è invece periodica nel tempo con periodo T – come la corrente macro-
scopica in un’antenna, o quella dovuta a una particella carica in un ciclotrone – allora la
30
decomposizione (7.2) viene sostituita dalla serie di Fourier ,

X
µ µ µ∗ µ
j (t, ~x) = eiN ω0 t jN (~x), jN (~x) = j−N (~x), (7.3)
N =−∞

2π µ
dove ω0 = T
è la frequenza fondamentale. In questo caso jN (~x) rappresenta il “peso
discreto” con cui la frequenza,
ωN = N ω 0 ,

compare nella corrente.


In seguito considereremo anche “sorgenti monocromatiche” corrispondenti a correnti
con frequenza fissata, del tipo,

j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c. (7.4)

Qualsiasi sorgente potrà quindi essere pensata come sovrapposizione – discreta o continua
– di sorgenti monocromatiche. La denominazione “frequenza” per la variabile duale ω
30
In realtà la (7.3) può essere riguardata come un caso particolare della (7.2), se si pone,

X
µ
√ µ
j (ω, ~x) = 2π δ(ω − ωN )jN (~x).
N =−∞

207
deriva dal fatto che, come vedremo, una sorgente monocromatica genera un campo elet-
tromagnetico che nella zona delle onde assume la forma di un’onda piana monocromatica,
con la stessa frequenza ω della sorgente.

7.1 Il campo elettromagnetico nella zona delle onde

In questa sezione considereremo una generica corrente a supporto spaziale compatto. Sce-
gliendo opportunamente l’origine spaziale del sistema di riferimento, il suo supporto
spaziale sarà allora contenuto in una palla di raggio R e avremo,

j µ (t, ~x) = 0, per |~x| > R, ∀ t.

La limitazione a correnti siffatte trova la sua motivazione fisica nel fatto che le distribuzioni
di carica realizzabili in natura sono necessariamente confinate a una regione limitata.
Il potenziale nella zona delle onde. Definiamo come “zona delle onde” la regione lon-
31
tana dalle cariche, ovvero la regione spaziale ,

|~x| ≡ r À R. (7.6)

Per i motivi detti valutiamo ora il quadripotenziale esatto (6.48),


Z
µ 1 1
A (x) = d3 y j µ (t − |~x − ~y |, ~y ), (7.7)
4π |~x − ~y |

nella zona delle onde, arrestandoci ai termini di ordine 1/r. Siccome la corrente nell’in-
tegrando è nulla per |~y | > R, l’integrale in d3 y può essere ristretto ai valori di ~y per cui
|~y | ≤ R. In base alla (7.6) abbiamo allora,

|~x| À |~y |.
31
Come “zona delle onde” si definisce spesso la regione degli r che oltre alla (7.6) soddisfano anche,

R2
r À λ, rÀ , (7.5)
λ
dove λ = 2π/ω è la lunghezza d’onda, e ω indica la generica frequenza presente nella corrente (7.2). Se r
soddisfa queste relazioni ulteriori, allora le formule (7.9) e (7.10) mantengono la loro validità anche per
valori finiti di r, e non solo asintoticamente. Per esempio, per arrivare alla (7.9) nell’argomento temporale
della corrente in (7.7) abbiamo trascurato un termine o(y 2 /r), vedi (7.8), che nello sviluppo della corrente
darebbe luogo a un contributo del tipo (y 2 /r)∂0 j µ . Considerando la componente monocromatica (7.4)
schematicamente si ha ∂0 j µ ' iωj µ , e quindi questo termine è trascurabile se ωy 2 /r < ωR2 /r ¿ 1, che
equivale alla seconda condizione in (7.5).

208
Introducendo il versore radiale ~n = ~x/r abbiamo allora gli sviluppi, vedi (6.124),
r µ ¶
~n · ~y y 2 1
|~x − ~y | = r 1 − 2 + 2 = r − ~n · ~y + o , (7.8)
r r r
µ ¶
1 1 1
= +o 2 .
|~x − ~y | r r
Inserendo queste espansioni in (7.7) si ottiene il potenziale nella zona delle onde,
Z µ ¶
µ 1 3 µ 1
A (x) = d y j (t − r + ~n · ~y , ~y ) + o . (7.9)
4πr r2
In seguito trascureremo i termini di ordine 1/r2 , in quanto siamo interessati solo al termine
leading – che è di ordine 1/r come anticipato. Si noti in particolare che l’integrale che
moltiplica il fattore 1/4πr dipende, oltre che da ~x, anche dal tempo. Di conseguenza il
potenziale (7.9) darà luogo a un campo F µν che a grandi distanze decade ancora come 1/r,
vedi sotto, corrispondente appunto a un campo di accelerazione. Per confronto ricordiamo
che anche il potenziale coulombiano statico è proporzionale a 1/r, ma che in quel caso il
coefficiente di proporzionalità è indipendente dal tempo e il campo corrispondente decade
allora come 1/r2 , e non come 1/r.
Notiamo poi nella (7.9) la comparsa del tempo ritardato “macroscopico” T = t − r,
che tiene conto del tempo che il campo elettromagnetico impiega per raggiungere il punto
di osservazione, a partire dal centro della palla contenente le cariche. Il termine ~n · ~y
tiene invece conto del ritardo “microscopico” delle cariche individuali, a seconda della
loro posizione all’interno della palla.
Le relazioni delle onde. Le proprietà principali del campo elettromagnetico nella zona
della onde, derivato dal potenziale (7.9), seguono dalle relazioni delle onde (5.63),

∂µ Aν = nµ Ȧν , nµ Ȧµ = 0, nµ nµ = 0, (7.10)

relazioni che ora dimostreremo essere valide anche per il potenziale (7.9), modulo ter-
mini di ordine 1/r2 . Cominciamo definendo il “quadrivettore” nullo nµ = (n0 , ~n) con
componenti,
~x
n0 = 1, ~n = , n2 = 0.
r
Calcoliamo poi le derivate rispetto a t e xi dell’integrando della (7.9)
1 µ
j (t − r + ~n · ~y , ~y ),
r
209
tralasciando di scrivere esplicitamente gli argomenti,
µ ¶
1 ν 1
∂0 j = ∂0 j ν ,
r r
µ ¶ µ ¶
1 ν xi ν 1
∂i j = − 2 ∂0 j + o 2 .
r r r
Modulo termini di ordine 1/r2 queste relazioni equivalgono a,
µ ¶ µ ¶
1 ν 1 ν
∂µ j = n µ ∂0 j .
r r
Dalla (7.9) si ottiene allora,
Z µ ¶ Z µ ¶ Z
ν 1 3 1 ν 1 3 1 ν 1
∂µ A = d y ∂µ j = d y nµ ∂0 j = n µ ∂0 d3 y j ν = nµ ∂0 Aν ,
4π r 4π r 4πr
che è la prima relazione in (7.10). La seconda è conseguenza del fatto che il potenziale
per costruzione soddisfa la gauge di Lorentz, ∂µ Aµ = 0.
Una volta appurato che valgono le (7.10), concludiamo che il campo elettromagnetico
nella zona delle onde condivide con le onde piane le proprietà (5.77)–(5.79),
h i
E~ = −A ~˙ + (~n · A
~˙ ) ~n = ~n × ~n × A
~˙ , (7.11)
~ = ~n × E,
B ~ ~ = 0,
~n · E ~ = |B|,
|E| ~ (7.12)
¯ ¯2
µν ¯ ~˙ ¯¯ = nµ nν |E|
~ 2,
Tem = nµ nν (Ȧi Ȧj ) Λij = nµ nν ¯~n × A Λij ≡ δ ij − ni nj . (7.13)

In particolare i campi elettrico e magnetico sono ortogonali tra di loro, e la direzione di


propagazione del campo è la radiale uscente ~n. Infatti, dalle (7.12) segue che il vettore di
Poynting è parallelo e concorde a ~n,

~=E
S ~ ×B
~ = ~n |E|
~ 2. (7.14)

Le relazioni (7.12) e (7.14) generalizzano in particolare le formule asintotiche (6.113) e


(6.118) – valide per il campo asintotico di un sistema di particelle puntiformi – al caso di
una corrente generica. Dalla (7.9) segue inoltre l’andamento asintotico,
1
Ȧµ ∼ ,
r
e le (7.11), (7.12) comportano allora per il campo elettromagnetico l’andamento asintotico
previsto, F µν ∼ 1/r.
Notiamo infine che la valutazione esplicita delle formule (7.11)–(7.13) richiede solo la
~ del quadrivettore (7.9).
conoscenza della parte spaziale A

210
7.1.1 Emissione di quadrimomento

Inserendo la formula per il tensore energia–impulso asintotico (7.13) nella (7.1) otte-
niamo un’espressione compatta per la distribuzione angolare del quadrimomento emesso
nell’unità di tempo,
d2 P µ ~ 2.
= r2 nµ |E| (7.15)
dt dΩ
Per calcolare invece il quadrimomento emesso nell’unità di tempo in tutte le direzioni,
occorre integrare il membro di destra della (7.15) sull’angolo solido totale,
Z
dP µ ~ 2.
= r2 dΩ nµ |E| (7.16)
dt

Per processi di radiazione transitori, ovvero processi originati da cariche che sono accele-
rate solo per un intervallo finito di tempo, sarà finito anche il quadrimomento emesso in
direzione ~n nell’unità di angolo solido, durante l’intero processo,
Z ∞
dP µ ~ 2 dt.
= r 2 nµ |E|
dΩ −∞


Indicando come al solito la potenza emessa con = W, le componenti temporale e
dt
spaziali della (7.15) si scrivono, vedi (7.11),

d2 ε dW ~ 2 = r2 (Ȧi Ȧj Λij ),


= = r2 |E| Λij ≡ δ ij − ni nj , (7.17)
dt dΩ dΩ
d2 P~ dW
= ~n. (7.18)
dt dΩ dΩ

Si noti in particolare la compensazione delle potenze di r nella (7.17), una volta inserita
la (7.9). Si vede che per il campo elettromagnetico nella zona delle onde, 1) il flusso di
quantità di moto è determinato localmente dal flusso di energia e, 2) la quantità di moto
e l’energia soddisfano localmente le relazioni,

∆P~ = ~n ∆ε, (∆ε)2 − |∆P~ |2 = 0, (7.19)

come nel caso delle onde piane. Siccome a livello quantistico il fenomeno dell’irraggia-
mento corrisponde all’emissione di fotoni, le (7.19) indicano allora che queste particelle
sono prive di massa, e che si propagano in direzione radiale. Torneremo su alcuni aspetti
quantistici della radiazione nel capitolo 10.

211
Il risultato più importante di questo paragrafo è la relazione (7.17), in quanto punto
di partenza per l’analisi energetica di tutti i fenomeni di radiazione: essa permette di
determinare la distribuzione angolare e temporale della radiazione emessa da una generica
corrente j µ , una volta valutata la parte spaziale del potenziale vettore attraverso la (7.9).

7.1.2 Sorgenti monocromatiche e onde piane

Abbiamo appena constatato che il campo elettromagnetico nella zona delle onde possiede
molte delle proprietà delle onde piane. Questo fatto chiaramente non è casuale perché,
essendo j µ (t, ~x) = 0 per |~x| > R, al di fuori della palla di raggio R il campo è un campo
libero. Pur non essendo libero in tutto lo spazio, la sua forma si avvicinerà tanto più a
quella di un campo libero in tutto lo spazio, quanto più ci allontaniamo dalla sorgente.
C’è allora da aspettarsi che nella zona delle onde il campo elettromagnetico risulti con
buona approssimazione una sovrapposizione di onde piane, e non stupisce che esso erediti
le loro proprietà più salienti. Tuttavia, è altrettanto chiaro che in generale questo campo
non sarà costituito da una singola onda piana monocromatica.
Per decomporre il campo nella zona delle onde in onde elementari, sfruttiamo la li-
nearità in j µ del potenziale vettore (7.9), e utilizziamo le decomposizioni spettrali del-
la corrente (7.2) e (7.3). Considerando una singola frequenza ω inseriamo la sorgente
monocromatica (7.4) nella (7.9),
Z
µ 1
A (x) = d3 y eiω(t−r+~n·~y) j µ (ω, ~y ) + c.c.
4πr
Z
1 iω(t−r)
= e d3 y eiω(~n·~y) j µ (ω, ~y ) + c.c.
4πr
≡ εµ eik·x + c.c. (7.20)

Abbiamo definito il vettore d’onda k µ con componenti,

k 0 = ω, ~k = ω ~n,

soddisfacente,
k 2 = 0, k · x = k µ xµ = ω(t − r),

e il vettore di polarizzazione,
Z
µ 1
ε = d3 y eiω(~n·~y) j µ (ω, ~y ). (7.21)
4πr

212
Vediamo allora che una sorgente monocromatica genera un campo che nella zona delle
onde si riduce formalmente a un’onda piana, con i vettori d’onda e di polarizzazione
indicati. In particolare, una corrente di frequenza ω genera un’onda della stessa frequenza.
Onde piane e onde sferiche. Tuttavia, la (7.20) non costituisce un’onda piana vera
e propria, perché sia il vettore d’onda, sia il vettore di polarizzazione esibiscono una
dipendenza residua dalla posizione ~x = ~n r. In particolare il vettore di polarizzazione porta
il prefattore 1/r, la cui presenza è tra l’altro richiesta dalla conservazione dell’energia.
Infatti, scrivendo il vettore di Poynting mediato nel tempo associato all’onda (7.20) si ha,
vedi il problema 5.6,
~ = −2 ~n ω 2 ε∗µ εµ ,
S

~ è proporzionale a 1/r2 . Di conseguenza l’energia che attraversa la sezione


e si vede che S
di un cono di apertura angolare dΩ nell’unità di tempo,

~ · (~n r2 dΩ),
S

è indipendente da r. L’energia fluisce quindi verso l’infinito, conservandosi. La polariz-


zazione εµ dipende poi anche dalla direzione ~n, attraverso l’esponenziale nell’integrando
della (7.21). Per queste particolari dipendenze da r e ~n il potenziale (7.20) corrisponde,
propriamente parlando, a una sovrapposizione di “onde sferiche”, vedi il testo di J.D.
32
Jackson , piuttosto che a un’onda piana.
Tuttavia, in una regione con estensioni spaziali L piccole rispetto a r,

L ¿ r,

i vettori k µ e εµ risultano praticamente costanti, e localmente la (7.20) appare quindi


come un’onda piana. Infatti, all’interno di una regione di questo tipo le variazioni relative
di r e ~n sono limitate da,
∆r L L
< , |∆~n| < ,
r r r
e la variazione relativa di ~k equivale allora a,

|∆~k| L
= |∆~n| < ¿ 1.
ω r
32
J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

213
Per quanto riguarda invece la variazione del vettore di polarizzazione, dalla (7.21) si ricava,
Z µ ¶
µ 1 3 ∆r
∆ε = dy − + i ω (∆~n · ~y ) eiω(~n·~y) j µ (ω, ~y ).
4πr r
Considerando che |~y | < R abbiamo,
¯ ¯
¯ ∆r ¯ L L
¯− ¯
¯ r + i ω (∆~n · ~y )¯ < r + ωR |∆~n| < (1 + ωR) r .

Siccome per sistemi microscopici ωR corrisponde alla velocità delle cariche nella corrente,
vedi la prossima sezione, anche la variazione relativa di εµ è allora dell’ordine di L/r ¿ 1.
Se a titolo di esempio consideriamo la radiazione emessa dal sole e osservata sulla terra,
r corrisponde alla distanza terra–sole, r = 1.5 · 108 km, mentre L è il diametro della terra,
L = 1.2 · 104 km. Sulla superficie della terra il vettore d’onda e il vettore di polarizzazione
sono quindi soggetti a variazioni relative molto piccole, dell’ordine di L/r ∼ 10−4 , e la
radiazione osservata risulta in pratica composta da onde piane.
Sorgenti generiche. Data la linearità della (7.9), questi risultati si estendono diretta-
mente alle generiche quadricorrenti (7.2) e (7.3). Nel caso generale il campo elettroma-
gnetico nella zona delle onde risulta dunque – localmente – sovrapposizione di onde piane
monocromatiche, e le frequenze presenti nella radiazione sono un sottoinsieme di quelle
presenti nella corrente. Può, infatti, succedere che l’integrale nella (7.21) sia zero.
In particolare, a un arbitrario sistema di cariche che eseguono un moto periodico di
periodo T , corrisponde una corrente periodica del tipo (7.3), e sistemi siffatti emettono
quindi radiazione con frequenze appartenenti all’insieme,

ωN = N ω0 , N = 1, 2, 3 · · · .

Viceversa, a un sistema di particelle che seguono orbite aperte corrisponde una corrente
aperiodica del tipo (7.2), e un tale sistema di cariche emette quindi radiazione con uno
spettro continuo di frequenze.

7.2 La radiazione dell’antenna lineare

Dalle formule derivate nella sezione precedente si vede che il calcolo del quadrimomento
~ nella zona delle onde. Sfortu-
emesso richiede la valutazione del potenziale spaziale A
natamente l’integrale che compare nella (7.9) raramente può essere eseguito in modo

214
esatto, ed in generale è necessario ricorrere a un approccio perturbativo, come per esem-
pio lo sviluppo in multipoli che presenteremo nella prossima sezione. Uno dei rari casi
in cui l’integrale nella (7.9) può essere valutato esattamente è quello dell’antenna lineare,
alimentata al centro.
Senza entrare nei dettagli diamo la forma della densità di corrente spaziale in un’an-
tenna lineare di lunghezza L disposta lungo l’asse z, alimentata al centro da un generatore
di frequenza ω,

~j(t, ~y ) = I δ(y1 ) δ(y2 ) sen(ω(L/2 − |y3 |)) cos(ωt) ~u, (7.22)


I0
I ≡ . (7.23)
sen(ωL/2)

È sottinteso che ~j = 0 per |y 3 | ≥ L/2. Si vede che la corrente si annulla al bordo,


per y 3 = ±L/2, mentre per ogni t fissato essa è massima al “gap”, ovvero in y 3 = 0,
che è il punto in cui viene alimentata. I0 ha le dimensioni di una corrente, nel senso di
carica per unità di tempo, e corrisponde alla corrente al gap. ~u = (0, 0, 1) è il versore
lungo z. Confrontando con la (7.4) vediamo in particolare che la (7.22) è una corrente
monocromatica, e quindi essa emette radiazione monocromatica di frequenza ω e lunghezza
d’onda λ = 2π/ω.
Per determinare il potenziale nella zona delle onde inseriamo la (7.22) nella (7.9),
Z L/2 Z Z
~ ~x) = I~u
A(t, dy 3
dy 1
dy 2 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y 3 |)) cos(ω(t − r + ~n · ~y )).
4πr −L/2

Possiamo integrare le funzioni δ in y 1 e y 2 , sostituendo ~n · ~y = n1 y 1 + n2 y 2 + n3 y 3 con


n3 y 3 = cosϑ y 3 , dove ϑ è l’angolo tra ~n e l’asse z. Si ottiene cosı̀,
Z L/2
~ ~x) = I~u
A(t, dy 3 sen(ω(L/2 − |y 3 |)) cos(ω(t − r + cos ϑ y 3 )).
4πr −L/2

L’integrazione rimanente su y 3 è elementare e porta a,


µ µ ¶ ¶
~ I cos(ω(t − r)) ωL ωL
A(t, ~x) = cos cosϑ − cos ~u. (7.24)
2πr ω sen2 ϑ 2 2

~˙ Dalle
Il potenziale vettore è quindi in ogni punto parallelo all’asse z, cosı̀ come lo è A.
(7.11) vediamo allora che il campo elettrico giace sempre nel piano individuato dall’asse
z e da ~n, essendo ortogonale a ~n.

215
La distribuzione angolare della potenza emessa si ottiene invece derivando la (7.24)
rispetto al tempo, e inserendo l’espressione risultante nella (7.17). Sfruttando il fatto che
~˙ è diretto lungo l’asse z risulta,
A

dW ¯ ¯2
¯ ~˙ ¯
= r2 (Ȧi Ȧj Λij ) = r2 ¯A ¯ sen2 ϑ. (7.25)
dΩ

La derivata temporale della (7.24) equivale alla sostituzione,

cos(ω(t − r)) → −ω sen(ω(t − r)).

Eseguendo inoltre la media temporale della (7.25) dobbiamo effettuare la sostituzione,

sen2 (ω(t − r)) → 1/2.

In definitiva otteniamo per la distribuzione angolare della potenza media emessa dall’an-
33
tenna lineare l’espressione ,
¯ ¯
dW I2 ¯ cos ¡ ωL cosϑ¢ − cos ωL ¯2
¯ 2 ¯
= 02 ¯ 2
ωL ¯ . (7.26)
dΩ 8π ¯ sen( 2 ) senϑ ¯

Da questa formula si vede che l’esistenza di direzioni in cui dW/dΩ è massima o minima
dipende fortemente dai valori del rapporto,

ωL πL
= .
2 λ

Invece di eseguire un’analisi sistematica della distribuzione angolare (7.26), di seguito ci


limiteremo a considerare qualche caso particolare. Vediamo comumque che dW/dΩ è
sempre nulla per ϑ = 0, cioè, lungo la direzione dell’antenna, mentre ha un massimo per
ϑ = π/2, cioè nel piano ortogonale all’antenna, a patto che sia L/λ 6= 2 n con n intero.
Inoltre si può vedere facilmente che se L ≤ λ allora la potenza non ha altri estremali,
mentre se L > λ allora esistono ulteriori direzioni in cui essa è massima o nulla.
Qualitativamente possiamo dividere le antenne in due categorie, antenne “lunghe”
corrispondenti a L ' λ, e antenne “corte” corrispondenti a L ¿ λ. Tratteremo le
ultime in dettaglio nel paragrafo 7.3.3 nell’ambito dell’approssimazione di dipolo, mentre
di seguito consideriamo un tipico esempio di antenna lunga.
33
Si noti che per L = n λ, con n intero, la normalizzazione di I nella (7.23) deve essere cambiata.

216
Antenne lunghe. Casi particolarmente interessanti di antenne lunghe sono le antenne
a “mezz’onda” di lunghezza L = λ/2, e quelle a “onda intera” di lunghezza L = λ.
Consideriamo a titolo d’esempio un’antenna a mezz’onda, per cui ωL/2 = π/2. In questo
caso la (7.26) si riduce a, ¡ ¢
dW I02 cos2 π2 cosϑ
= 2 ,
dΩ 8π sen2 ϑ
che ha un unico massimo in ϑ = π/2 e un unico minimo in ϑ = 0, dove si annulla. Se
vogliamo invece analizzare “l’efficienza” dell’antenna a mezz’onda dobbiamo calcolare la
potenza totale,
Z Z 2π Z π ¡ ¢ Z ¡ ¢
dW I02 cos2 π2 cosϑ I02 π cos2 π2 cosϑ
W= dΩ = 2 dϕ dϑ = dϑ .
dΩ 8π 0 0 senϑ 4π 0 senϑ

L’ultimo integrale può esser valutato solo numericamente e vale 1.22. In definitiva otte-
niamo,
1 2 (1/2)
W = 0.097 I02 = I R . (7.27)
2 0 rad
Abbiamo introdotto la “resistenza di radiazione” dell’antenna a mezz’onda,

(1/2)
Rrad = 2 · 0.097,

da non confondere con la sua resistenza ohmica Rohm . Se torniamo alle unità di misura
del sistema MKS, il nostro valore adimensionale della resistenza deve essere moltiplicato
per la “resistenza del vuoto”,
r
µ0
R0 = ≈ 377 Ohm.
ε0

La resistenza di radiazione dell’antenna a mezz’onda diventa allora,

(1/2)
Rrad = 2 · 0.097 R0 ≈ 73 Ohm, (7.28)

mentre per un’antenna a onda intera si otterrebbe,

(1)
Rrad ≈ 201Ohm.

Si può vedere che questi valori della resistenza sono tipicamente molto maggiori della
resistenza ohmica dell’antenna,
Rohm ¿ Rrad .

217
Un’antenna lunga costituisce quindi un radiatore molto efficace, in quanto la maggior
parte dell’energia fornita dal generatore viene irradiata sotto forma di onde elettromagne-
tiche, mentre solo una piccola parte viene dissipata per effetto Joule. Nel paragrafo 7.3.3
vedremo, invece, che un’antenna corta costituisce al contrario un radiatore poco efficace,
in quanto in quel caso si ha Rohm À Rrad .

7.3 Sviluppi non relativistici

In sezione 7.1 abbiamo ricondotto il calcolo del quadrimomento emesso da una generica
distribuzione di carica, si vedano le (7.17) e (7.18), alla determinazione della parte spa-
ziale del quadripotenziale nella zona delle onde (7.9), che quı̀ riportiamo ripristinando la
velocità della luce,
Z µ ¶
µ 1 3 µ r ~n · ~y
A (x) = d yj t− + , ~y . (7.29)
4πr c c c

Insistiamo sul fatto che questo procedimento fornisce risultati esatti. Tuttavia, in pratica
non è quasi mai possibile valutare l’integrale tridimensionale nella (7.29) analiticamente,
ed è quindi necessario ricorrere a qualche approccio perturbativo. Se le cariche si muovono
con velocità piccole rispetto alla velocità della luce, allora risulta appropriato un metodo
perturbativo che viene chiamato “sviluppo in multipoli”. Vediamo in che cosa consiste.

7.3.1 Sviluppo in multipoli

Per definizione lo sviluppo in multipoli


µ del potenziale
¶ (7.29) equivale a uno sviluppo in se-
r ~
n · ~
y
rie di Taylor della corrente j µ t − + , ~y attorno al tempo ritardato macroscopico
c c
r ~n · ~y
T = t − , considerando come parametro di sviluppo il ritardo microscopico ,
c c
Z ³ ´
µ 1 ~n · ~y 1 (~n · ~y )2 2 µ
A (x) = d3 y j µ (T, ~y ) + ∂t j µ (T, ~y ) + ∂ t j (T, ~
y ) + · · · . (7.30)
4πr c c 2 c2

Come si vede questo sviluppo equivale a un’espansione in potenze di 1/c, e costitui-


sce quindi uno sviluppo non relativistico. Il primo termine nella (7.30) viene chiamato
“termine di dipolo”, il secondo “termine di quadrupolo”, e cosı̀ via.
Spieghiamo innanzitutto il motivo per cui questa espansione risulta appropriata, se le
velocità delle particelle cariche che compongono la corrente j µ sono piccole rispetto alla

218
velocità della luce. Supponiamo che queste particelle si muovano con velocità caratteristi-
ca v. Esse impiegano allora il tempo caratteristico R/v per attraversare la palla di raggio
R entro la quale sono confinate, e ne segue che la corrente varia sensibilmente su scale
temporali dell’ordine di t0 = R/v. Dato che |~y | < R, possiamo allora dare la seguente
stima del ritardo microscopico,
¯ ¯
¯ ~n · ~y ¯ R v
¯ ¯
¯ c ¯ < c = c t0 . (7.31)

Siccome la corrente
µ varia su ¶ scale temporali caratteristiche dell’ordine di t0 , concludiamo
~n · ~y
allora che j µ T + , ~y differisce poco da j µ (T, ~y ), a patto che il ritardo microscopico
c
sia molto minore di t0 , ¯ ¯
¯ ~n · ~y ¯
¯ ¯
¯ c ¯ ¿ t0 . (7.32)

Ma per la (7.31) ciò equivale a,

v
t0 ¿ t0 ⇒ v ¿ c.
c

Per velocità piccole rispetto a c la corrente potrà allora essere sviluppata in serie di potenze
~n · ~y
di .
c
Un modo alternativo per analizzare il significato dello sviluppo in multipoli consiste
nell’analizzare Aµ frequenza per frequenza, cioè, considerando la corrente monocromatica
(7.4),
j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c. (7.33)

con frequenza ω fissata. La velocità caratteristica delle cariche risulta allora essere v = ωR.
Siccome in questo caso schematicamente abbiamo,

∂tN jµ ' ω N jµ ,

dalla (7.31) segue che il termine N –esimo dello sviluppo in (7.30) ammonta a,

1 (~n · ~y )N N 1 (ωR)N 1 ³ v ´N
∂ t jµ (T, ~
y ) ' jµ (T, ~
y ) = jµ (T, ~y ),
N ! cN N ! cN N! c
v
che equivale quindi direttamente a uno sviluppo in serie di potenze di .
c

219
7.3.2 La radiazione di dipolo

Il resto di questa sezione sarà dedicato a un’analisi dettagliata dell’approssimazione di


ordine più basso – l’approssimazione di dipolo – che equivale a considerare nella (7.30)
solo il primo termine dello sviluppo,
Z ³
i 1 3 i r ´
A (x) = d yj t − , ~y . (7.34)
4πr c c

Ricordiamo che per l’analisi della radiazione emessa è sufficiente determinare Ai . Il campo
elettromagnetico risultante dalla (7.34) viene chiamato “campo di dipolo”, e la radiazione
ad esso associata “radiazione di dipolo”. Quando le velocità delle cariche in gioco sono
piccole rispetto alla velocità della luce, l’approssimazione di dipolo fornisce in generale
valori sufficientemente accurati per il campo asintotico e per il quadrimomento irradiato.
Se si richiede, invece, un grado di precisione più elevato, oppure se il campo di dipolo è
nullo, allora nella (7.30) bisogna tenere conto anche dell’ordine successivo, corrispondente
al “campo di quadrupolo”. Come vedremo in sezione 7.4, l’energia emessa trasportata
³ v ´2
dal campo di quadrupolo è soppressa di un fattore rispetto a quella trasportata dal
c
campo di dipolo.
Il momento di dipolo. La (7.34) può essere riscritta in modo più semplice, se si intro-
duce per una generica quadricorrente j µ il suo momento di dipolo (elettrico),
Z
i
D (t) ≡ d3 x xi ρ(t, ~x), j 0 = c ρ. (7.35)

Come conseguenza dell’equazione di continuità ∂µ j µ = 0, la sua derivata temporale


soddisfa,
Z
i
Ḋ (t) = d3 x j i (t, ~x). (7.36)

Infatti, dato che ρ̇ = ∂0 j 0 , si ha,


Z Z Z Z
i 3 i 0 3 i k 3
£ i k i
¤
Ḋ (t) = d x x ∂0 j = − d x x ∂k j = − d x ∂k (x j ) − j = d3 x j i ,

dove nell’ultimo passaggio la derivata totale non contribuisce, perché per |~x| > R la
corrente è zero. La (7.34) diventa allora semplicemente,

1
Ai = Ḋi , (7.37)
4πr c

220
dove è sottointeso che il momento di dipolo è valutato all’istante ritardato macroscopico
t − rc . La caratteristica principale di questa formula – peculiare per l’approssimazione
di dipolo – è che esprime Ai in termini della sola densità di carica, senza coinvolgere
esplicitamente la corrente spaziale.
Il potenziale scalare A0 . Per l’analisi della radiazione è sufficiente la conoscenza di Ai ,
ma per completezza facciamo notare che nello sviluppo (7.30) occorre fare una distinzione
tra Ai e A0 . Questa distinzione deriva dal fatto che la componente temporale della corrente
è legata alla densità di carica ρ dalla relazione j 0 = c ρ, mentre le sue componenti spaziali
sono indipendenti da c. Per una singola particella si ha, infatti, ~j = ~v ρ. Ne segue
che, se nello sviluppo in multipoli (7.30) per Ai ci si arresta all’ordine (~n · ~y )N /cN , per
consistenza nello sviluppo di A0 bisogna considerare anche il termine successivo di ordine
(~n ·~y )N +1 /cN +1 . In approssimazione di dipolo nel calcolo di A0 bisogna allora tenere conto
anche del termine lineare in ~n · ~y /c. La (7.30) dà allora,
µZ Z ¶ Ã !
1 1 1 ni Ḋi
A0 = d3 y c ρ + ~n · ∂t d3 y ~y c ρ = Q+ , (7.38)
4πr c c 4πr c
R
dove Q = d3 x ρ è la carica totale conservata del sistema. Si riconosce nel primo termine,
indipendente dal tempo, il potenziale coulombiano, mentre il secondo, dipendente dal
tempo, coinvolge a sua volta il momento di dipolo. Si noti come nell’approssimazione di
dipolo il potenziale vettore (7.37), (7.38) soddisfi la gauge di Lorentz ∂µ Aµ = 0, modulo
termini di ordine 1/r2 . D’ora in poi porremo di nuovo c = 1.
Emissione di quadrimomento. Dato il potenziale vettore (7.37) possiamo usare le (7.11)
e (7.12), valide nella zona delle onde, per ottenere espressioni semplici per i campi di
dipolo,
~ = − 1 [D
E ~¨ − (~n · D) ~ = − 1 ~n × D.
~¨ ~n],
B ~¨ (7.39)
4πr 4πr
~¨ e ~n. Inserendo infine la
Il campo elettrico giace quindi nel piano individuato da D
(7.37) nella (7.17) otteniamo la distribuzione angolare della potenza emessa da un generico
sistema di cariche non relativistiche,

dW 1 1 ¯ ¯2 1 ¯ ¯
i j ij i j ¯ ~¨ ¯ ¯ ¨ ¯2
~
= D̈ D̈ (δ − n n ) = ¯D¯ sen2 ϑ = ¯~n × D ¯ , (7.40)
dΩ 16 π 2 16 π 2 16 π 2

221
~¨ e ~n. Vediamo quindi che la radiazione di dipolo ha una distri-
dove ϑ è l’angolo tra D
~¨ mentre è massima
buzione angolare molto semplice: essa è nulla lungo la direzione di D,
nel piano ortogonale a D.~¨

La potenza totale si ottiene invece integrando dW/dΩ sugli angoli. Usando gli integrali
invarianti del problema 2.6 risulta,
Z Z
dW 1 i j
¡ ¢
W = dΩ = 2
D̈ D̈ dΩ δ ij − ni nj
dΩ 16π
µ ¶
1 i j ij 4π ij 1 ¯¯ ~¨ ¯¯2
= D̈ D̈ 4π δ − δ = ¯D¯ . (7.41)
16π 2 3 6π

Al contrario, la quantità di moto totale emessa in tutte le direzioni è nulla. Infatti, dalla
(7.18) segue,
Z Z
dP k dW
k 1
= n dΩ = D̈i D̈j dΩ nk (δ ij − ni nj ) = 0, (7.42)
dt dΩ 16π 2

dove di nuovo si sono usati gli integrali invarianti. L’annullamento della quantità di moto
totale emessa è dovuta al fatto che, come conseguenza dell’invarianza della (7.40) per
~n → −~n, le energie emesse in due direzioni opposte sono uguali; ne segue che le quantità
di moto emesse in direzioni opposte si cancellano.
Sistemi di particelle e Bremsstrahlung. Consideriamo ora come caso particolare un si-
stema di particelle cariche puntiformi non relativistiche. In questo caso la densità di carica

X
j 0 (t, ~x) = er δ 3 (~x − ~yr (t)),
r

e per il momento di dipolo la (7.35) dà,


Z X X X
~
D(t) = d3 x ~x er δ 3 (~x − ~yr (t)) = er ~yr (t) ⇒ ~¨ =
D er ~ar , (7.43)
r r r

dove ~ar è l’accelerazione della particella r–esima. Secondo la (7.41) un tale sistema emette
quindi radiazione di dipolo con potenza istantanea,
¯ ¯2
1 ¯¯X ¯
¯
W= ¯ er ~ar ¯ . (7.44)
6π ¯ ¯
r

Questa formula, che lega l’energia emessa direttamente alla causa della radiazione – l’ac-
celerazione delle particelle – generalizza la formula di Larmor (6.128) a un sistema di più

222
particelle. Si noti, in particolare, che la potenza emessa non è data dalla somma delle
P 2
potenze individuali, ovvero 6π 1
ar |2 , in quanto sono presenti anche dei termini di
r er |~

“interferenza” tra le varie particelle. La presenza di questi termini è conseguenza del


fatto che il campo elettromagnetico soddisfa il principio di sovrapposizione, e che obbe-
disce quindi alle leggi dell’interferenza. Se indichiamo il campo elettrico asintotico della
~ r , vedi (7.45), la (7.17) si scrive per l’appunto,
particella r–esima con E
¯ ¯
dW ¯X ¯2
¯ ~ r ¯¯ ,
= r2 ¯ E
dΩ ¯ r ¯

dW
P ~ 2
e non dΩ
= r2 r |E r | .

Il fenomeno della radiazione emessa da particelle cariche a causa di un’accelerazione


momentanea, o prolungata nel tempo, viene genericamente chiamato Bremsstrahlung,
ovvero, radiazione di frenamento. La formula (7.44) quantifica l’entità di questa radiazione
– sommata sugli angoli – per un arbitrario sistema di particelle non relativistiche. Nei
prossimi paragrafi analizzeremo in dettaglio vari casi di Bremsstrahlung non relativistica,
tra cui la diffusione Thomson, e la radiazione emessa a causa dell’interazione coulombiana
tra due particelle cariche.
Particella singola. Consideriamo più in dettaglio il caso di una particella singola, per
~¨ = e ~a. Per i campi a grandi distanze le (7.39) danno allora,
cui D

~ = − e [~a − (~n · ~a) ~n],


E ~ = − e ~n × ~a.
B (7.45)
4πr 4πr

Si noti come questi campi siano fondamentalmente diversi dai campi prodotti a grandi
distanze da una particella non relativistica in moto rettilineo uniforme, vedi (6.70) e
(6.68). Vediamo in particolare che in questo caso il campo elettrico non è più radiale –
essendo piuttosto ortogonale alla direzione radiale ~n – e che appartiene al piano formato
da ~n e ~a. Per la distribuzione angolare della radiazione la (7.40) dà invece,

dW e2 |~n × ~a|2
= . (7.46)
dΩ 16 π 2

Vediamo che la particella non emette radiazione lungo la direzione dell’accelerazione, men-
tre l’emissione è massima nel piano ortogonale ad essa. Anticipiamo che questa proprietà
della distribuzione angolare della radiazione è caratteristica per il limite non relativisti-

223
co. Vedremo, infatti, che per particelle ultrarelativistiche la distribuzione angolare della
radiazione sarà radicalmente diversa.
Infine, per la potenza totale emessa da una particella singola non relativistica con
carica e e accelerazione ~a, la (7.44) si riduce a,

e2 | ~a |2
W= ,

che è la formula di Larmor (6.128).


Si noti come le formule per una singola particella non relativistica appena derivate,
siano in perfetto accordo con i limiti non relativistici delle corrispondenti formule esatte
derivate nel paragrafo 6.4.4, a partire dai campi di Lienard–Wiechert.
Assenza della radiazione di dipolo. Menzioniamo ora alcuni casi importanti in cui la
radiazione di dipolo è assente. Oltre al caso ovvio di un sistema di cariche che si muovono
di moto rettilineo uniforme, quindi molto distanti tra di loro, la radiazione di dipolo è
assente per un sistema isolato di cariche con rapporto er /mr = γ indipendente da r. In
questo caso il momento di dipolo si può infatti scrivere come,
X X
~
D(t) = er ~yr (t) = γ mr ~yr (t),
r r

e quindi,
³X ´
~¨ = γ d
D mr ~vr = 0,
dt
in quanto la quantità di moto totale di un sistema isolato non relativistico è una costante
del moto. Concludiamo in particolare che in qualsiasi processo isolato che coinvolge solo
una specie di particelle, come per esempio lo scattering tra due particelle identiche, non
c’è emissione di radiazione di dipolo.
La radiazione di dipolo è pure assente per una distribuzione sferica di cariche. Ciò è
conseguenza del teorema di Birkhoff, vedi problema 2.5, che assicura che una distribuzione
sferica di carica nel vuoto dà luogo a un campo statico. E un campo statico non può
emettere radiazione. Per verificare che le nostre formule sono in accordo con questa
previsione, è sufficiente ricordare che per una distribuzione sferica la densità di carica
dipende solo da r e t,
j 0 (t, ~x) = j 0 (t, r).

224
Per il momento di dipolo si ottiene allora, usando coordinate polari e sfruttando gli
integrali invarianti,
Z µZ ¶ µZ ¶
i 3 i 0 3 0 i
D (t) = d x x j (t, r) = r drj (t, r) dΩ n = 0.

Nei casi in cui la radiazione di dipolo è assente diventa dunque rilevante il termine di ordine
successivo nello sviluppo (7.30), ovvero, quello corrispondente alla campo di quadrupolo.
Per sistemi a simmetria sferica la radiazione è evidentemente assente a tutti gli ordini.
Riepilogo. Concludiamo questo paragrafo riassumendo le varie formule per il potenziale
vettore, e la corrispondente distribuzione angolare della potenza emessa.
a) Potenziale esatto:
Z
µ 1 1
A (x) = d3 y j µ (t − |~x − ~y |, ~y ).
4π |~x − ~y |

b) Potenziale nella zona delle onde:


Z
µ 1
A (x) = d3 y j µ (t − r + ~n · ~y , ~y ).
4πr

c) Potenziale nella zona delle onde in approssimazione di dipolo:


Z
i 1 1
A (x) = d3 y j i (t − r, ~y ) = Ḋi .
4πr 4πr

a) Potenza locale esatta:


dW ~ × B)
~ · ~n.
= r2 (E
dΩ
b) Potenza “emessa” esatta:
dW
= r2 (Ȧi Ȧj Λij ).
dΩ
c) Potenza emessa in approssimazione di dipolo:

dW 1 ¯ ¯
¯ ¨ ¯2
~
= ¯~n × D ¯ .
dΩ 16π 2

Nell’approssimazione di dipolo si può anche determinare la potenza totale emessa in tutte


le direzioni,
1 ¯¯ ~¨ ¯¯2
W= ¯D¯ .

225
7.3.3 Potenza emessa da un’antenna lineare corta

Come prima applicazione dell’approssimazione di dipolo determiniamo la potenza emessa


da un’antenna lineare alimentata al centro, molto più corta della lunghezza d’onda su cui
emette,
L ¿ λ, ovvero ωL ¿ 1. (7.47)

Siccome la potenza emessa da un’antenna lineare di lunghezza arbitraria è già stata cal-
colata in modo esatto, vedi sezione 7.2, l’analisi che segue ci permetterà in particolare di
discutere i limiti di validità dell’approssimazione di dipolo in un esempio concreto.
Ripartiamo dalla corrente spaziale (7.22),
3
~j(t, ~y ) = I0 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y |)) cos(ωt) ~u. (7.48)
sen(ωL/2)
In questo caso l’approssimazione di dipolo è in effetti appropriata perché il tempo carat-
teristico con cui varia la corrente è t0 = 2π/ω, e la condizione (7.32) diventa allora,

|~n · ~y | ≤ L ¿ t0 = 2π/ω,

che è soddisfatta grazie alla (7.47). La potenza emessa dall’antenna può allora essere
calcolata usando la (7.40), che coinvolge solo il momento di dipolo. La determinazione di
quest’ultimo richiede in realtà la conoscenza della densità di carica, ma questa può essere
determinata a sua volta sfruttando la conservazione della quadricorrente,
∂ 3
∂0 j 0 = −∂i j i = − j .
∂y 3
Dalla (7.48) si ottiene allora facilmente,

0 1 cos(ω(L/2 − |y 3 |))
2
j (t, ~y ) = I0 δ(y ) δ(y ) sen(ωt) ε(y 3 ),
sen(ωL/2)
dove ε(·) è la funzione segno. Possiamo allora calcolare il momento di dipolo,
Z Z
~ 3 0 I 0 sen(ωt)
D(t) = d y ~y j (t, ~y ) = d3 y ~y δ(y 1 ) δ(y 2 ) cos(ω(L/2 − |y 3 |)) ε(y 3 )
sen(ωL/2)
Z
2I0 sen(ωt) ~u L/2 3 3 2I0 sen(ωt)(1 − cos(ωL/2))
= dy y cos(ω(L/2 − y 3 )) = ~u.
sen(ωL/2) 0 ω 2 sen(ωL/2)
Siccome per ipotesi abbiamo ωL ¿ 1, questa espressione si riduce a,

~ = I0 L sen(ωt) ~u,
D ~¨ = − 1 I0 ωL sen(ωt) ~u.
D
2ω 2
226
La potenza istantanea si ottiene allora dalla (7.40),

dW (I0 ωL)2 sen2 (ω(t − r))


= 2
sen2 ϑ,
dΩ 64 π

dove ϑ è l’angolo tra ~n e l’asse z. Eseguendo la media temporale su un periodo abbiamo


< sen2 (ω(t − r)) >= 1/2, e quindi,

dW (I0 ωL)2
= 2
sen2 ϑ, (7.49)
dΩ 128 π

da confrontare con il risultato esatto (7.26). In effetti si vede facilmente che nel limite
ωL ¿ 1 quest’ultimo si riduce alla (7.49). Per quanto riguarda la distribuzione angolare
notiamo che la potenza approssimata (7.49) ha una distribuzione molto semplice – tipica
per la radiazione di dipolo – con un massimo nel piano ortogonale all’antenna, e uno zero
nella direzione parallela ad essa. Da un confronto qualitativo tra la (7.49) e la (7.26)
emerge allora che fino a quando L ≤ λ quest’ultima ha in effetti una forma molto simile
alla prima: un unico massimo in ϑ = π/2 e uno zero in ϑ = 0.
La discrepanza maggiore tra il trattamento esatto e l’approssimazione di dipolo emer-
ge, invece, se si confrontano le intensità delle radiazioni. Per rendercene conto, per sem-
plicità consideriamo la potenza totale. Integrando la (7.49) sull’angolo solido si ottiene
infatti,
(ωL)2 2 1 2 (c)
W= I = I0 Rrad , (7.50)
48 π 0 2
dove la resistenza di radiazione è data da,
µ ¶2
(c) (ωL)2 π L
Rrad = = .
24 π 6 λ

Reinserendo la resistenza del vuoto, R0 ≈ 377 Ohm, risulta dunque,


µ ¶2 µ ¶2
(c) π L L
Rrad = R0 = 197 Ohm. (7.51)
6 λ λ

Se in accordo con l’ipotesi di lavoro (7.47) scegliamo, per esempio, L = λ/50 otteniamo,

(c)
Rrad = 0.08 Ohm,

(1/2)
che è molto minore della resistenza (7.28) dell’antenna a mezz’onda, Rrad = 73 Ohm.
Tuttavia, il dato più rilevante è che la resistenza ohmica di un’antenna corta può essere

227
(c)
dello stesso ordine di grandezza di Rrad , o anche sensibilmente maggiore: un’antenna corta
costituisce quindi in generale un radiatore poco efficace.
Infine possiamo chiederci quale risultato avremmo ottenuto se per l’antenna a mez-
z’onda – sbagliando – avessimo usato l’approssimazione di dipolo. Il risultato sarebbe
stata la (7.50) con L = π/ω, cioè,

π 2
W= I = 0.065 I02 ,
48 0

al posto della (7.27), W = 0.097 I02 . Avremmo quindi ottenuto il corretto ordine di
grandezza, ma un valore numerico sbagliato.

7.3.4 Diffusione Thomson della radiazione

Un fenomeno che ricopre un ruolo importante in Elettrodinamica è costituito dalla dif-


fusione di radiazione elettromagnetica da parte di una particella carica libera. Se questo
processo viene considerato a livello classico, esso è descritto da un’onda elettromagnetica
che investe una particella carica, e viene chiamato “diffusione Thomson”. A livello quan-
tistico lo stesso processo è invece descritto dall’urto tra un fotone e una particella carica,
e viene chiamato “effetto Compton”.
Vediamo in cosa consiste qualitativamente la diffusione Thomson. Se un’onda elet-
tromagnetica piana incide su una particella carica libera, la particella incomincerà ad
oscillare, principalmente lungo la direzione del campo elettrico. Essendo accelerata es-
sa emetterà a sua volta radiazione elettromagnetica. Questa radiazione “diffusa” viene
emessa in direzioni diverse da quella dell’onda incidente, ma vedremo che per velocità non
relativistiche della particella, essa ha la stessa frequenza dell’onda incidente.
Consideriamo dunque una generica onda piana “incidente” in direzione ~u, con campi
elettrico e magnetico dati da, vedi problema 5.5,

E~ = E~0 eik·x + c.c., B~ = ~u × E,


~

dove E~0 è un generico vettore complesso costante, ortogonale a ~u. In seguito assumeremo
che l’onda incidente sia polarizzata linearmente, vale a dire che E~ abbia direzione costante.
Avremo allora,
E~0∗ = E~0 .

228
L’intensità media dell’onda incidente, definita come l’energia che attraversa l’unità di
superficie nell’unità di tempo è allora data da,

~ >=< |E|
I0 =< |S| ~ 2 >= 2 E02 . (7.52)

In seguito supporremo che l’intensità dell’onda incidente sia sufficientemente bassa, in


modo tale che la velocità della particella si mantenga molto minore della velocità della
luce. Per l’analisi della radiazione emessa risulterà dunque appropriata l’approssimazione
di dipolo.
Vediamo ora qual è l’effetto di questa onda se investe una particella di massa m e
carica e. Per moti non relativistici dovremo risolvere l’equazione,
³ ´
m ~a = e E~ + ~v × B~ . (7.53)

~ = |E|,
Siccome abbiamo v ¿ 1 e |B| ~ il campo magnetico può essere trascurato. L’equa-

zione da risolvere si scrive allora più precisamente,

d2 ~y (t) ~
m 2
= e E~0 ei(ω t − k · ~y (t)) + c.c. = 2 e E~0 cos(ω t − ~k · ~y (t)).
dt
Se supponiamo che la direzione di incidenza sia z – nel qual caso ~k = (0, 0, ω) – e che E~0
sia diretto lungo x, si ottiene la soluzione stazionaria,

2 e E0
x(t) = − cos(ωt), y(t) = z(t) = 0. (7.54)
m ω2

La particella si mette quindi a oscillare attorno all’origine lungo la direzione del campo
elettrico incidente, con la sua stessa frequenza ω. Vediamo in particolare che la no-
stra approssimazione non relativistica è consistente, purché la velocità massima vM della
particella sia molto minore di 1,

2 e E0
vM = ¿ 1. (7.55)

L’onda diffusa. Dalle (7.54) si ottiene l’accelerazione,

2 e E~0
~a(t) = cos(ωt). (7.56)
m

229
A questo punto possiamo applicare le formule (7.45) e (7.46), per scrivere i campi di
radiazione e la potenza emessa,

~ e2 ³ ~ ~
´
~ = ~n × E,
~
E = − E0 − (~n · E0 ) ~n cos(ω(t − r)), B (7.57)
2πm r
dW e4 ³ 2 ´
~0 )2 cos2 (ω(t − r)),
= E 0 − (~
n · E (7.58)
dΩ 4π 2 m2
Il campo elettromagnetico di radiazione, che rappresenta l’onda diffusa, ha quindi la stessa
frequenza dell’onda incidente, ma si propaga radialmente in tutte le direzioni. Inoltre la
sua intensità è massima nel piano passante per la particella ed ortogonale a E~0 . Vediamo
poi che la sua polarizzazione appartiene sempre al piano formato da E~0 e ~n.
Onda incidente non polarizzata. Analizziamo ora più in dettaglio la distribuzione an-
golare (7.58) della potenza emessa. Possiamo intanto eseguire la media temporale, che
1
equivale alla sostituzione cos2 (ω(t − r)) → . Inoltre, nella maggior parte dei casi la
2
radiazione incidente non è polarizzata, ma ammonta a una sovrapposizione equiprobabile
di tutte le polarizzazioni E~0 ortogonali a ~k, come nel caso della luce naturale. In questo
caso dobbiamo mediare la distribuzione angolare della potenza emessa (7.58), su tutte
le polarizzazioni ortogonali a ~k. Per fare questo esplicitiamo i termini della (7.58) che
dipendendono dalle polarizzazioni,

E02 − (~n · E~0 )2 = E02 − (nx E0x + ny E0y )2 = E02 − n2x E0x
2
− n2y E0y
2
− 2 nx ny E0x E0y .

2
Prendendo la media di questa espressione si ha < E0x 2
>=< E0y >= 21 E02 , e < E0x E0y >= 0.
Inoltre, se chiamiamo ϑ l’angolo tra ~n e la direzione di inicidenza, nel presente caso l’asse
z, allora abbiamo nz = cosϑ, e quindi n2x + n2y = sen2 ϑ. Si ottiene cosı̀,
1 1
< E02 − (~n · E~0 )2 >= E02 − sen2 ϑ E02 = (1 + cos2 ϑ) E02 .
2 2
Per un’onda incidente non polarizzata dalla (7.58) si ottiene allora la potenza diffusa,
µ ¶
dW e4 E02
= (1 + cos2 ϑ). (7.59)
dΩ n.p. 16 π 2 m2
Si vede che questa potenza risulta massima lungo la direzione di propagazione dell’onda
incidente, in entrambi i versi ϑ = 0 e ϑ = π, in accordo con il fatto che per qualsiasi
polarizzazione dell’onda incidente, la particella oscilla nel piano ortogonale alla direzione
di incidenza.

230
Infine possiamo integrare la (7.59) sugli angoli per ottenere la potenza totale. Usando,
Z Z 2π Z π
2 16 π
dΩ (1 + cos ϑ) = dϕ senϑ dϑ (1 + cos2 ϑ) = , (7.60)
0 0 3

si ottiene,
Z µ ¶
dW e4 E02
W= dΩ = .
dΩ n.p. 3 πm2
Lo stesso risultato si può ovviamente anche ottenere inserendo la (7.56) nella formula di
Larmor (6.128) per la potenza totale, e mediando sul tempo. Il risultato cosı̀ ottenuto è
indipendente dalle polarizzazioni, e la media su queste è quindi banale.
Sezione d’urto. Dal punto di vista sperimentale le grandezze rilevanti in un processo

di diffusione sono la sezione d’urto differenziale , ed eventualmente la sezione d’urto
dΩ

totale σ. Nel caso in questione è definita come l’energia diffusa nell’unità di tempo
dΩ
in una data direzione nell’unità di angolo solido, divisa l’energia incidente per unità di
superficie nell’unità di tempo, ovvero, l’intensità incidente I0 , vedi (7.52). Analogamente,
σ è definita come l’energia diffusa nell’unità di tempo in tutte le direzioni, divisa l’intensità
incidente. Dalle formule scritte sopra risulta,
µ ¶
dσ 1 dW 1 + cos2 ϑ 2
= = r0 , (7.61)
dΩ I0 dΩ n.p. 2

dove abbiamo introdotto il raggio classico della particella r0 , che per l’elettrone vale,

e2
r0 = = 2.8 · 10−13 cm. (7.62)
4πm c2

Possiamo confrontare questo raggio con il raggio di Bohr rB , e la lunghezza d’onda


Compton λC dell’elettrone,

4π~2 ~
rB = = 5.3 · 10−9 cm, λC = = 3.8 · 10−11 cm. (7.63)
me2 mc

La sezione d’urto totale si ottiene integrando la (7.61) su tutti gli angoli. Usando di nuovo
la (7.60) ottiene,
Z
dσ W 8π 2
σ= dΩ = = r . (7.64)
dΩ I0 3 0
Questa sezione d’urto viene chiamata sezione d’urto di Thomson. Essa ha le dimensioni
di una superficie e – vista la definizione – può essere interpretata come la superficie che

231
l’elettrone “offre” come bersaglio all’onda incidente. È proprio questa circostanza che
permette di interpretare r0 come il raggio classico dell’elettrone.
Bilancio del quadrimomento e reazione di radiazione. Concludiamo l’analisi della dif-
fusione Thomson con un commento sulla conservazione del quadrimomento in questo
processo. Ricordiamo innanzitutto che in approssimazione di dipolo la radiazione emessa
complessivamente non trasporta quantità di moto, vedi (7.42). Di conseguenza alla radia-
zione diffusa, rappresentata dal campo (7.57), complessivamente non è associata nessuna
quantità di moto. Inoltre, vista la definizione di σ, il processo di diffusione in questione
può essere interpretato come segue: di tutta l’onda incidente, concettualmente infinita-
mente estesa, solo la parte che colpisce la superficie σ viene diffusa, mentre il resto passa
indisturbato e costituisce l’onda trasmessa.
Consideriamo ora il bilancio del quadrimomento separatamente per l’onda trasmessa,
l’onda diffusa e la particella. Per l’onda trasmessa il quadrimomento iniziale e finale
sono evidentemente uguali. Anche la particella conserva in media il suo quadrimomento,
perché essa si trova in moto stazionario. All’onda diffusa prima della diffusione è associato
il flusso di energia σI0 , mentre dopo la diffusione le è associato il flusso W; siccome si ha
W = σI0 la sua energia si conserva. Al contrario, il suo flusso di quantità di moto prima
della diffusione vale,
dPz
= σI0 ,
dt
mentre dopo la diffusione esso è nullo! Dato che la quantità di moto totale del sistema si
deve conservare, dobbiamo concludere che la quantità di moto mancante è stata trasferita
alla particella. Quest’ultima deve quindi subire una forza media in avanti pari a,

dPz 16 π 2 2
Fz = = r E , (7.65)
dt 3 0 0

forza che andrebbe ad aggiungersi al membro di destra della (7.53).


~ v ×B)
Emerge quindi il seguente quadro. La forza e(E+~ ~ costituisce la causa primaria che

imprime un’accelerazione alla particella. Di conseguenza la particella dà luogo a un campo


di radiazione emettendo onde elettromagnetiche le quali, a loro volta, provocano una
reazione di rinculo nella particella, rappresentata dalla forza Fz . Questa forza scaturisce
quindi dall’interazione tra la particella e il campo da essa stessa creata, e viena chiamata

232
alternativamente “reazione di radiazione”, “forza di autointerazione”, o anche “forza di
frenamento”. Si noti che mentre la forza di Lorentz e(E~ + ~v × B)
~ – la causa primaria – è

lineare in E0 , la reazione di radiazione Fz – un effetto secondario – è quadratica in E0 , e


corrisponde a una correzione relativistica. Stimando il rapporto tra le due forze si ottiene
infatti, vedi (7.55) e (7.62),

Fz 16 π r02 vM r0 vM
= E0 ∼ ω r 0 = 2π .
e E0 3e c λ c

Nel capitolo 12 vedremo che la validità dell’Elettrodinamica classica richiede comunque


che sia λ > r0 . La forza di reazione è quindi soppressa rispetto alla forza di Lorentz dal
fattore non relativistico vM /c.
Per completezza aggiungiamo che in realtà è possibile dedurre la presenza della rea-
zione di radiazione (7.65), direttamente dall’equazione di Lorentz “completa” (2.21),

d~p
= e(E~ + ~v × B)
~ + e(E
~ + ~v × B),
~ (7.66)
dt
~ e B
dove E ~ sono i campi di Lienard–Wiechert prodotti dalla particella stessa. Tutta-

via, in questo caso non è lecito usare le loro espressioni asintotiche (7.57), perché nella
(7.66) questi campi sono valutati nella posizione della particella – dove essi sono diver-
genti. Un’analisi dettagliata del membro di destra della (7.66) conferma sı̀ la presenza
del termine (7.65), ma rivela anche la presenza di termini infiniti: l’equazione di Lorentz,
nella sua forma originale (2.21), dovrà dunque essere abbondonata. Anticipiamo che una
trattazione sistematica della reazione di radiazione, che comporta in particolare la sostitu-
zione dell’equazione di Lorentz con l’equazione di Lorentz–Dirac, vede l’Elettrodinamica
classica entrare in contraddizione con se stessa, vedi capitolo 12.
Effetti quantistici. La diffusione Thomson come quı̀ analizzata non tiene conto di effetti
quantistici, in quanto trascura il fatto che le onde elettromagnetiche sono costituite da
particelle, i fotoni. A livello quantistico il processo di diffusione di radiazione di frequenza
ω da parte di elettroni si realizza, infatti, attraverso urti tra fotoni “incidenti” di energia
~ ω, ed elettroni, e viene chiamato effetto Compton. In questo caso “l’onda” uscente è
costituita da fotoni che si propagano in tutte le direzioni ϑ. Fino a quando le lunghezze
d’onda della radiazione incidente sono molto maggiori della lunghezza d’onda Compton,

233
2πc ~
λ= À λC = , e quindi ~ω ¿ mc2 , gli effetti quantistici possono essere trascurati,
ω mc
ed è valida l’analisi svolta sopra. Viceversa, per λ ≈ λC il fotone incidente cede parte
della sua energia all’elettrone, ed emerge quindi dall’urto con una frequenza più piccola,
ovvero, con una lunghezza d’onda λ0 maggiore di λ. Imponendo la conservazione del
quadrimomento risulta, infatti, la nota formula dell’effetto Compton,

λ0 = λ + 2π(1 − cosϑ)λC ,

dove ϑ è l’angolo tra il fotone entrante e quello uscente.


Le differenze principali rispetto all’analisi classica della diffusione sono quindi 1) che
l’energia non viene più irradiata con continuità, ma sotto forma di quanti di luce e 2) che
la frequenza della radiazione uscente è minore di quella della radiazione incidente. Inoltre
si può vedere 3) che la sezione d’urto di Thomson subisce una correzione quantistica che
al primo ordine in ~ risulta in,
µ ¶
8π 2 λC
σ= r 1 − 4π .
3 0 λ
Per λ À λC i fotoni entranti e uscenti hanno praticamente la stessa energia ~ω,
indipendentemente dall’angolo di diffusione ϑ, e in questo limite sono inoltre valide le
formule per le sezioni d’urto (7.61), (7.64). In questo limite l’energia delle radiazioni
incidente ed uscente è data semplicemente dal numero di fotoni moltiplicato per ~ω, e
quindi queste sezioni d’urto danno allora anche il numero di fotoni diffusi nell unità di
tempo, diviso il numero di fotoni incidenti per unità di superficie nell’unità di tempo,
ovvero il “flusso entrante”.

7.3.5 Bremsstrahlung dall’interazione coulombiana

In questo paragrafo consideriamo la radiazione generata dall’interazione elettromagnetica


tra due particelle cariche in moto non relativistico – prototipo di Bremsstrahlung non
relativistica. Di nuovo siamo interessati principalmente alla determinazione dell’energia
emessa sotto forma di radiazione. Dato che nel limite non relativistico l’interazione elet-
tromagnetica tra due particelle è governata dal potenziale coulombiano α/r, le orbite
relative sono coniche, ovvero ellissi, iperboli o parabole. La conoscenza della forma ana-
litica delle orbite faciliterà notevolmente l’analisi della potenza emessa e, come vedremo,

234
essa ci permetterà di determinare l’energia totale irraggiata durante il moto in modo
esatto.
Consideriamo dunque un sistema isolato formato da due particelle cariche, con masse
m1 e m2 e cariche e1 e e2 . Indichiamo i vettori posizione rispettivamente con ~r1 e ~r2 , la
posizione relativa con ~r = ~r1 − ~r2 , e quella del centro di massa con ~rCM . Allora abbiamo,

m2 m1
~r1 = ~rCM + ~r, ~r2 = ~rCM − ~r. (7.67)
m1 + m2 m1 + m2

Secondo la teoria dei moti relativi la dinamica del sistema è allora governata dalle equa-
zioni del moto,
~r
µ ~¨r = α , ~¨rCM = 0, (7.68)
r3
dove,
e1 e2 m1 m2
α= , µ= ,
4π (m1 + m2 )
essendo µ la massa ridotta.
Cinematica delle coniche. Siccome il potenziale coulombiano è centrale e a simmetria
sferica, il moto relativo è piano, e si conservano l’energia ε e il momento angolare L.
Introducendo le coordinate polari piane r e ϕ si ha,

1 α
ε= µ v2 + , L = µ r2 ϕ̇. (7.69)
2 r

Per il potenziale in questione le orbite del moto relativo sono coniche. Se l’energia è
negativa, e quindi necessariamente α < 0, l’orbita è un ellisse di equazione,

(1 − e2 ) a
r(ϕ) = , (7.70)
1 + e cosϕ

dove l’eccentricità e e il semiasse maggiore a sono dati da,


s
2 εL2 α
e= 1+ 2
, a=− . (7.71)
µα 2ε

Il periodo risulta essere, s


µ a3
T = 2π .
| α|
Si noti che il momento angolare può essere scritto anche come,
p √
L= µ a| α| 1 − e2 .

235
Se l’energia è invece positiva, le orbite sono iperboli di equazione,

(e2 − 1) a
r(ϕ) = , (7.72)
±1 + e cosϕ

dove il segno + corrisponde al caso attrattivo, α < 0, e il segno – al caso repulsivo, α > 0.
I parametri e ed a sono ancora dati dalle (7.71), ma ora le costanti del moto possono
essere espressi anche in termini del parametro d’impatto b e della velocità asintotica v0 ,

1
ε= µ v02 , L = µ b v0 . (7.73)
2

Ricordiamo poi che nel caso delle iperboli la variabile angolare è limitata da,

1
−ϕ0 < ϕ < ϕ0 , cos ϕ0 = ∓ . (7.74)
e

L’energia emessa. Torniamo ora al calcolo dell’energia emessa via Bremsstrahlung.


Secondo la (7.41) la potenza emessa istantanea è data in termini del momento di dipolo
del sistema, dalla formula,
1 ¯ ¯2
¯ ~¨ ¯
W= ¯D¯ . (7.75)

~ usando le (7.67),
Possiamo valutare D
µ ¶
~ = e1 ~r1 + e2 ~r2 = (e1 + e2 ) ~rCM + µ e1 e2
D − ~r.
m1 m2

Derivando due volte e usando le (7.68) si ottiene,


µ ¶ µ ¶
¨
~ e1 e2 ¨ e1 e2 ~r
D=µ − ~r = − α 3.
m1 m2 m1 m2 r

Per la potenza istantanea si ottiene allora 34 ,


µ ¶2
α 2 e1 e2 1
W= − . (7.76)
6π m1 m2 r4

Vediamo che la radiazione di dipolo è assente se le due particelle hanno lo stesso rapporto
e/m – in particolare se le particelle sono identiche – come dimostrato nel paragrafo 7.3.2.
Se siamo interessati all’energia emessa tra due istanti temporali t1 e t2 , dobbiamo inte-
grare la (7.76) tra questi istanti. L’integrale risultante può essere ricondotto a un integrale
34
Ricordiamo che questa formula rappresenta la potenza emessa W(t, r) all’istante t a una distanza r
molto grande dalla particella, se il raggio r che compare a secondo membro è valutato all’istante ritardato
t − r. Se valutiamo il raggio r invece in t, allora la formula fornisce l’energia che viene emessa all’istante
t e che raggiunge l’infinito. Torneremo su questo punto nel capitolo 9.

236
sugli angoli, valutabile esattamente, se sfruttiamo la costanza del momento angolare (7.69)
per scrivere,
µ r2
dt = dϕ.
L
Se indichiamo gli angoli corrispondenti ai due istanti temporali t1 e t2 con ϕ1 e ϕ2 , l’energia
emessa tra questi due istanti risulta allora,
Z t2 µ ¶2 Z ϕ2
µ α2 e1 e2 1
∆ε = W dt = − dϕ. (7.77)
t1 6πL m1 m2 ϕ1 r2

Inserendo in questa espressione le equazioni polari (7.70) e (7.72) si ottengono integrali


elementari che possono essere valutati esattamente. Consideriamo ora separatamente moti
ellittici e moti iperbolici.
Moti ellittici. Se il moto relativo è ellittico entrambe le particelle compiono moti pe-
riodici di periodo T . La corrente associata j µ è allora pure periodica, e il sistema emette
quindi radiazione sulle frequenze discrete ωN = 2πN/T , con N intero, vedi paragrafo
7.1.2. In questo caso l’energia totale emessa è evidentemente infinita, e ha senso solo la
potenza media, ottenuta mediando la (7.77) su un periodo,
Z µ ¶2 Z 2π
1 T µ α2 e1 e2 1
W = W dt = − dϕ
T 0 6πL T m1 m2 0 r2
µ ¶2 Z 2π
µ α2 e1 e2 1
= − (1 + e cosϕ)2 dϕ.
6πL T m1 m2 a2 (1 − e2 )2 0

Usando l’integrale, µ ¶
Z 2π
2 e2
(1 + e cosϕ) dϕ = 2π 1 + ,
0 2
e sostituendo i valori cinematici dati sopra si ottiene,
µ ¶2 2
α2 e1 e2 1 + e2
W= − . (7.78)
6πa4 m1 m2 (1 − e2 )5/2

L’energia che la Bremsstrahlung asporta invece durante un ciclo è data da,

∆εc = T W.

Una conseguenza importante della Bremsstrahlung è che l’energia totale del sistema “ca-
riche + campo”, che nel limite non relativistico quı̀ in esame è data dalla (7.69), non
può restare costante, perché durante ogni ciclo essa deve diminuire della quantità T W.

237
Di conseguenza le orbite ellittiche non possono restare stabili e si devono, in particolar
modo, “aprire”, entrando in un regime spiraleggiante. La causa diretta di questo feno-
meno è di nuovo la forza di frenamento, le cui conseguenze fisiche saranno analizzate in
modo sistematico più avanti, vedi capitolo 12. Nel prossimo paragrafo quantitificheremo
comunque la perdita di energia (7.78) in un caso importante dal punto di visto storico,
quello dell’atomo di idrogeno classico, e vedremo che la forza di frenamento lo farebbe
collassare in una frazione di secondo.
Moti iperbolici. Se il moto relativo è iperbolico, entrambe le particelle compiono moti
aperiodici. Anche la corrente associata è allora aperiodica, e il sistema emette dunque
radiazione con uno spettro continuo di frequenze. Questo processo corrisponde a un urto
tra due particelle cariche che arrivano dall’infinito, si deflettono a vicenda, e poi escono
di nuovo verso l’infinito. Negli istanti iniziale e finale l’accelerazione delle due particelle è
nulla, e l’energia totale irradiata durante l’intero processo, come vedremo, risulta finita.
Per calcolarla dobbiamo porre nella (7.77) t1 = −∞ e t2 = +∞, ovvero ϕ1 = −ϕ0 e
ϕ2 = ϕ0 , vedi (7.74). Inserendo la (7.72) nella (7.77) troviamo per l’energia irradiata
durante l’intero processo,
Z ∞ µ ¶2 Z ϕ0
µ α 2 e1 e2 1
∆ε = W dt = − 2 (e2 − 1)2
(±1 + e cosϕ)2 dϕ
−∞ 6πL m 1 m 2 a −ϕ0
µ ¶2 ³ ´
µα 2
e1 e2 1 2
p
= − 2
(2 + e ) ϕ0 ± 3 (e − 1) .
6πL m1 m2 a2 (e2 − 1)2
Usando le (7.73) possiamo esprimere questo risultato in termini della velocità asintotica
v0 e del parametro d’impatto b. Per fare questo è conveniente introdurre il parametro
adimensionale,
∓1 α π
γ=√ = , ϕ0 = − arctg γ.
2
e −1 µ v02 b 2
Si noti che nel caso attrattivo si ha γ < 0, mentre nel caso repulsivo risulta γ > 0. Dopo
semplici passaggi si ottiene allora,
µ ¶2 h ³π ´ i
µ3 v05 e1 e2 2
∆ε = − (3γ + 1) − arctg γ − 3γ γ 3 . (7.79)
6π α m1 m2 2
Notiamo che per parametri d’impatto grandi, corrispondenti a valori di γ piccoli, l’energia
irradiata va a zero, µ ¶2
α2 e1 e2 1
∆ε ≈ − , (7.80)
12 v0 m1 m2 b3

238
in accordo con il fatto che per b grandi le orbite si discostano poco da traiettorie rettilinee.
Parametri d’impatto piccoli. Se il parametro d’impatto va invece a zero, si ha un urto
frontale e,
|γ| → ∞.

In questo caso la (7.79) ha due andamenti diversi, a seconda che il potenziale sia attrat-
tivo o repulsivo. Nel caso attrattivo si ha γ → −∞, e entrambi i termini tra le parentesi
quadre in (7.79) vanno a più infinito. Anche l’energia irradiata tende quindi a più in-
finito, in accordo con il fatto che l’accelerazione diverge quando le particelle collidono.
Si noti, tuttavia, che in questo caso anche la velocità delle particelle va a più infinito, e
l’approssimazione non relativistica non è più valida.
Nel caso repulsivo le particelle si avvicinano invece solo fino alla distanza minima,


rm = ,
µ v02

e l’energia totale irradiata deve quindi essere finita. In questo caso il parametro γ tende
a +∞, ed eseguendo il limite nella (7.79) si trova,
µ ¶2
2 µ3 v05 e1 e2
∆ε0 ≡ lim ∆ε = − . (7.81)
γ→∞ 45 π α m1 m2

Per renderci conto dell’entità dell’energia irradiata assumiamo che una delle due particelle
sia molto più pesante dell’altra, m2 À m1 , e che le cariche siano uguali, come succede
per esempio nell’urto protone/positrone. In queste condizioni il processo equivale all’urto
della particella leggera contro la particella pesante, considerata praticamente a riposo. Si
ha allora µ ≈ m1 e α = e2 /4π, e otteniamo,

8 m1 v05
∆ε0 ≈ .
45
1
Infine, dato che ora ε ≈ 2
m1 v02 , per la diminuzione relativa dell’energia della particella
leggera durante l’urto otteniamo,

∆ε0 16 ³ v0 ´3
≈ .
ε 45 c

Siccome siamo nel limite non relativistico abbiamo v0 ¿ c, e quindi ∆ε0 /ε ¿ 1. Come nel
caso (7.80) la perdita di energia per irraggiamento è quindi completamente trascurabile.

239
Nel prossimo capitolo analizzeremo il fenomeno dell’irraggiamento nel limite ultrarela-
tivistico, ovvero per v ≈ c, e vedremo che le conseguenze saranno drasticamente diverse.
Vedremo, infatti, che per velocità prossime alla velocità della luce gli effetti radiativi
possono dare luogo a perdite di energia notevoli, anche negli urti dovuti all’interazione
coulombiana.

7.3.6 La radiazione dell’atomo d’idrogeno classico

In questo paragrafo illustriamo brevemente il quadro fenomenologico che emergerebbe


per l’atomo d’idrogeno, se la sua dinamica fosse governata dalle leggi della fisica classica.
Concentreremo la nostra analisi sullo stato fondamentale dell’atomo, che classicamente
corrisponde all’elettrone che compie un moto circolare uniforme attorno al protone, con
velocità v ¿ 1. Possiamo allora applicare le formule derivate nel paragrafo precedente
per il moto ellittico, nel caso particolare di eccentricità nulla.
Dato che il protone è molto più pesante dell’elettrone vale m2 À m1 ≡ m e µ ≈ m,
e2
e inoltre in questo caso abbiamo α = − e r = a. Siccome la forza centripeta vale

2 2
mv e
= , l’energia totale e la velocità angolare dell’elettrone diventano, vedi (7.69),
r 4πr2
r r
e2 1 2 v e2 r0 m e4
ε=− = − mv , ω= = = = , (7.82)
8πr 2 r 4π m r3 r3 (4π)2 ~ 3

dove abbiamo introdotto il raggio classico r0 dell’elettrone, e identificato r con il raggio


di Bohr, vedi (7.63).
Il moto dell’elettrone è periodico con periodo T = 2π/ω, e la sua accelerazione ~a(t) è
quindi una funzione periodica semplice. Secondo le (7.45) il campo di radiazione è allora
costituito da una singola onda monocromatica di frequenza ω. Concludiamo che l’atomo
d’idrogeno classico emetterebbe radiazione unicamente sulla frequenza fondamentale ω.
Come vedremo più avanti, vedi sezione 10.4, una particella relativistica in moto circolare
uniforme emette, invece, radiazione su tutte le frequenze ωN = N ω, con N intero. Queste
previsioni sono comunque in contrasto con la formula quantistica di Rydberg, che prevede
le frequenze di emissione,
µ ¶
1 1 1 m e4
ωM N = 2
− 2 ,
2 N M (4π)2 ~ 3

240
dove N e M sono interi.
Torniamo ora al calcolo della potenza emessa dall’atomo classico. Ponendo nella (7.78)
l’eccentricità uguale a zero si ottiene,
µ 2 ¶2
e e2 e2 r02 e2 4 2
W= = = ω r , (7.83)
4π 6π m2 r4 6π r4 6π

in accordo con la formula di Larmor (6.128). Siccome W = − abbiamo dunque quan-
dt
tificato la perdita di energia dell’atomo. Ma dato che ε ∝ −1/r questa perdita comporta
anche una diminuzione del raggio. Dalle (7.82), (7.83) si ottiene la variazione relativa,

1 dr 1 dε 4 r2
=− = − 03 ≈ −2 · 1010 /s,
r dt ε dt 3r

dove abbiamo sostituito i valori (7.62), (7.63). Si vede che il raggio dell’orbita dell’elet-
trone si ridurrebbe a metà in meno di 10−10 s, e l’atomo di idrogeno classico collasserebbe
nella frazione di un secondo ! Si noti in particolare che la velocità dell’elettrone andrebbe
allora a più infinito, vedi (7.82).
È comunque interessante calcolare la diminuzione relativa dell’energia dell’atomo du-
rante un ciclo,
∆ε TW 2πW 8π ³ r0 ´3/2
= = = ≈ 3 · 10−6 ,
ε ε ωε 3 r
che è in realtà una frazione molto piccola. Quello che in ultima analisi fa collassare l’atomo
di idrogeno classico in pochissimo tempo è la brevità di un ciclo,
r
2π r r
T = ≈ 1.4 · 10−16 s.
c r0

Per concludere aggiungiamo che la velocità dell’elettrone è data da,


r
v r0
= ωr = ≈ 0.7 · 10−2 ,
c r

ed era quindi corretto affrontare il problema nell’approssimazione non relativistica di


dipolo.
Conlcudiamo questo paragrafo con un caveat sui limiti di validità della nostra analisi.
Da un punto di vista quantitativo l’analisi quı̀ eseguita è infatti valida solo fino a quando
il raggio dell’orbita dell’elettrone non varia apprezzabilmente. Se il raggio non è costante
non è più costante nemmeno l’accelerazione da inserire nella formula di Larmor, e anche la

241
potenza emessa varierebbe nel tempo. L’equazione del moto dell’elettrone dovrebbe allora
essere risolta tenendo conto della perdita di energia attraverso la formula di Larmor, la
quale coinvolge a sua volta l’accelerazione incognita. Le equazioni differenziali risultanti
sarebbero non lineari, e non risolubili in modo analitico. Per di più, come notato sopra, la
diminuzione del raggio porta a un aumento della velocità, la quale per r → 0 tenderebbe
a più infinito. Riassumendo, per affrontare il problema dell’atomo di idrogeno classico
in modo corretto, in linea di principio bisognerebbe risolvere le equazioni di Maxwell e
di Lorentz complete, come sistema accoppiato. Inoltre da un certo istante in poi non
è più lecito affrontare il problema nell’approssimazione non relativistica. Tuttavia, le
conclusioni qualitative della nostra trattazione restano comunque valide.

7.4 Radiazione di quadrupolo elettrico e di dipolo magnetico

Nei casi in cui la radiazione di dipolo è assente, ovverosia, quando la derivata seconda del
momento di dipolo si annulla,
~¨ = 0,
D

nello sviluppo in multipoli (7.30) diventa rilevante il termine perturbativo successivo,


cioè, quello lineare in ~n · ~y /c. Questo termine dà luogo alle cosiddette radiazioni di
quadrupolo elettrico e di dipolo magnetico, soppresse rispetto a quella di dipolo elettrico
di un fattore non relativistico v/c. In questa sezione determiniamo l’apporto all’eneriga
irradiata, dovuto a queste radiazioni. Per via della formula generale (7.17) è di nuovo
sufficiente determinare la parte spaziale del quadripotenziale.
~ fino all’ordine 1/c2 . Riprendiamo lo sviluppo (7.30), considerando ora
Il potenziale A
anche il termine lineare in ~n · ~y /c. Sottintendendo che la quadricorrente j µ è valutata in
(t − r, ~y ), e ponendo c = 1, abbiamo allora,
Z ³ ´
i 1
A = j i + (nk y k ) ∂t j i d3 y,
4πr
· Z µ ¶ ¸
1 i k 1¡ k i i k
¢ 1¡ k i i k
¢ 3
= Ḋ + n ∂t y j −y j + y j +y j dy
4πr 2 2
µ Z ¶
1 i ik k 1 k ¡ k i i k
¢ 3
= Ḋ − Ṁ n + n ∂t y j +y j d y . (7.84)
4πr 2

242
Abbiamo definito il tensore tridimensionale antisimmetrico,
Z
ik 1 ¡ i k ¢
M ≡ x j − xk j i d3 x,
2
legato al momento di dipolo magnetico,
Z
~ ≡1
M d3 x ~x × ~j,
2
dalle relazioni,
1 ijk jk
Mi = ε M , M ij = εijk M k . (7.85)
2
Per un sistema di particelle, per cui,
X
~j(t, ~x) = er ~vr (t) δ 3 (~x − ~yr (t)),
r

si ha in particolare,
X
~ =1
M er ~yr × ~vr . (7.86)
2 r
L’ultimo termine in (7.84) può invece essere valutato introducendo il momento di quadru-
polo elettrico Dij della distribuzione di carica, e la sua versione “ridotta” Dij , a traccia
nulla,
Z
ij 1 ij kk
D = d3 x xi xj ρ, ρ = j 0, Dij = Dij − δ D , Dii = 0. (7.87)
3
L’ultimo termine nella (7.84) può infatti essere espresso in termini di Dij sfruttando
l’identità,
Z
ij
¡ ¢
Ḋ = xi j j + xj j i d3 x,

analoga alla (7.36). La si dimostra – come nel caso di quest’ultima – con un’integrazione
per parti, usando la conservazione della quadricorrente, e ricordando che j µ ha supporto
compatto,
Z Z Z
ij i j 0 3
¡ ¢
Ḋ = x x (∂k j )d x = ∂k xi xj j k d3 x
x x ∂0 j d x = − i j k 3

Z Z
¡ i j i j
¢ k 3 ¡ i j ¢
= δk x + x δk j d x = x j + xj j i d3 x.

Otteniamo quindi,
µ ¶
i 1 i 1 ij j ij j
A = Ḋ − Ṁ n + D̈ n
4πr 2
µ µ ¶ ¶
1 i ij j 1 ij 1 ij kk D̈kk i
= Ḋ − Ṁ n + D̈ − δ D̈ nj + n, (7.88)
4πr 2 3 24πr

243
dove abbiamo tolto e aggiunto lo stesso termine. Consideriamo ora l’ultimo termine di
questa espressione. Dalla definizione (7.87) risulta che Dkk è funzione solo di t − r, perché
nell’integrale la densità di carica ρ è valutata in (t − r, ~x). Questo ci permette di scrivere,
à ! µ ¶
D̈kk (t − r) i i Ḋkk (t − r) 1
n =∂ +o 2 . (7.89)
24πr 24πr r

Il termine o(1/r2 ) è ininfluente perché il potenziale è valutato nella zona delle onde. Inoltre
1
sappiamo che una funzione del tipo r
f (t − r) soddisfa l’equazione delle onde per r 6= 0,
vedi problema 5.7. Questo ci permette di concludere che l’ultimo termine nella (7.88)
può essere eliminato con una trasformazione di gauge residua, Ai → Ai + ∂ i Λ, 2Λ = 0,
scegliendo,
Ḋkk (t − r)
Λ=− .
24πr
Alla stessa conclusione si giunge osservando che un contributo ad Ai che è proporzionale a
ni , come quello in (7.89), comunque non contribuisce alla potenza (7.17), perché Λij nj = 0.
Ritroviamo il fatto che l’energia, essendo una quantità osservabile, è invariante sotto
trasformazioni di gauge.
In definitiva, a meno di una trasformazione di gauge, e ripristinando la velocità della
luce, otteniamo per il potenziale corretto fino all’ordine 1/c2 ,
µ ¶
i 1 i 1 ij j 1 ij j
A = Ḋ − Ṁ n + D̈ n . (7.90)
4πr c c 2c

In questa approssimazione il campo nella zona delle onde risulta quindi sovrapposizione
lineare di un campo di dipolo elettrico, un campo di dipolo magnetico e un campo di
quadrupolo elettrico. Gli ultimi due sono soppressi di un fattore 1/c rispetto al primo, e
costituiscono quindi correzioni relativistiche di ordine superiore. Confrontando la (7.43)
con la (7.86) si vede in particolare che, schematicamente, si ha,

M ij ∼ v Di .

La potenza totale. In presenza dei campi di dipolo magnetico e di quadrupolo elettrico


la distribuzione angolare della potenza emessa (7.17) esibisce ora una dipendenza dagli
angoli abbastanza complicata, perché ora ni compare non solo in Λij , ma anche in Ai .

244
Ciononostante è ancora possibile derivare un’espressione compatta per la potenza totale.
Integrando la (7.17) sull’angolo solido si ottiene infatti,
Z
r2
W = (Ȧi Ȧj Λij ) dΩ (7.91)
c
  
Z ik ˙ ik
jl ˙ jl
1 M̈ D̈ M̈ D̈ l  ij
= 2 3
dΩ D̈i − nk + nk  D̈j − nl + n (δ − ni nj ).
16π c c 2c c 2c

Gli integrali sugli angoli possono essere valutati come al solito, usando gli integrali inva-
˙ ij devono contrarsi tra di loro, e
rianti. Siccome alla fine tutti gli indici di D̈i , M̈ ij e D̈
siccome Dij è simmetrico e a traccia nulla ed M ij è antisimmetrico, i termini misti non
contribuiscono all’integrale. I termini diagonali, invece, possono esser valutati facilmente
usando gli integrali invarianti. Dalla relazione (7.85) si ricava in particolare,
¯ ¯2
¯ ¨~ ¯
M̈ ij M̈ ij = 2 ¯M ¯ .

Il risultato finale che cosı̀ si ottiene è,

1 ¯ ¯2 1 ¯¯ ¨~ ¯¯2 1 ˙ ij ˙ ij
¯ ~¨ ¯
W= ¯D ¯ + ¯M ¯ + D̈ D̈ . (7.92)
6πc3 6πc5 80πc5

I tre contributi alla potenza corrispondono rispettivamente alla radiazione di dipolo elet-
trico, di dipolo magnetico e di quadrupolo elettrico, gli ultimi due termini essendo sublea-
ding di un fattore 1/c2 rispetto al termine di dipolo elettrico. Come si vede, grazie alla
cancellazione dei termini misti non ci sono correzioni di ordine 1/c4 . Si noti, tuttavia, che
tali correzioni sono presenti nella distribuzione angolare dW/dΩ.
Facciamo infine un commento importante sull’utilizzo corretto della formula (7.92).
L’espansione non relativistica (7.30) del potenziale nella zona delle onde può essere scritta
come,
~= 1A
A ~1 + 1 A ~2 + 1 A~3 + · · · , (7.93)
c c 2 c3
~ N intendiamo il contributo di 2N –polo, includendo anche i corrispondenti con-
dove con A
tributi magnetici. La (7.90) rappresenta allora i primi due termini di questa espansione.
~ N contiene N − 1 fattori dei versori ~n. Se si
Notiamo in particolare che il termine A
inserisce lo sviluppo (7.93) nella (7.91) si ottiene una serie di potenze in 1/c, ma dato
che l’integrale sugli angoli di un numero dispari di fattori ~n è zero, sopravvivono solo i

245
prodotti del tipo ȦN ȦM con M + N pari. La (7.91) si scrive allora,
Z µ µ ¶¶
2 1 i j 1 ³ i j i j
´ 1
W=r 3
Ȧ1 Ȧ1 + 5 Ȧ2 Ȧ2 + 2 Ȧ1 Ȧ3 + o 7 Λij dΩ.
c c c

Si vede, dunque, che per calcolare correttamente la potenza emessa fino all’ordine 1/c5 ,
alla (7.92) andrebbe aggiunto il termine dovuto al prodotto misto Ȧi1 Ȧj3 , che coinvolge
~ 3 . Possiamo comunque concludere che la (7.92) dà la potenza
la radiazione di sestupolo A
corretta fino all’ordine 1/c5 , se la radiazione di dipolo è assente,

~˙ 1 = 0
A ↔ ~¨ = 0.
D

Solo in questo caso la (7.92) è allora di utilità concreta. In caso contrario in generale
bisogna tenere conto anche della radiazione di sestupolo.
Assenza delle radiazioni di quadrupolo e di dipolo magnetico. Vediamo ora qualche ca-
so in cui i contributi di ordine 1/c5 alla potenza emessa (7.92) si annullano. Il contributo
er
di dipolo magnetico è nullo per un sistema isolato di particelle, con rapporto = γ in-
mr
dipendente da r. Questo è una conseguenza della conservazione del momento angolare di
un sistema isolato. Per vederlo è sufficiente inserire la relazione er = γ mr nella definizione
(7.86) del momento di dipolo magnetico. Risulta,
X
~ =γ
M
γ~
~yr × mr ~vr = L,
2 r 2

~˙ = 0. Il contributo di
~ è il momento angolare totale conservato; ne segue che M
dove L
dipolo magnetico è assente anche per un sistema isolato composto da due sole particelle,
con cariche arbitrarie. In questo caso nel sistema di riferimento del centro di massa si ha
m1~r1 + m2~r2 = 0, p~1 = −~p2 , e risulta,
µ ¶
~ = 1 (e1 ~r1 × ~v1 + e2 ~r2 × ~v2 ) = 1
M
e1 e2
+ 2
m1 m2 ~
L,
2
2 2 m1 m2 m1 + m2

~ = ~r1 × p1 + ~r2 × p~2 è il momento angolare totale conservato del sistema. Di nuovo
dove L
abbiamo quindi che M ~˙ = 0.

Infine, come conseguenza del teorema di Birkhoff i contributi di ordine 1/c5 nella
(7.92) si devono annullare entrambi, se la corrente j µ è a simmetria sferica, ~j = ~x j(t, r),

246
~ è nullo, perché ~x × ~j = 0. Per quanto riguarda invece
j 0 = ρ(r, t). In effetti si vede che M
il momento di quadrupolo ridotto, usando coordinate polari si ha,
Z µ ¶ ·Z ∞ ¸ ·Z µ ¶¸
ij 3 i j 1 ij 2 4 i j 1 ij
D = d x xx − δ x ρ= r ρ dr dΩ n n − δ = 0, (7.94)
3 0 3

in quanto l’integrale sugli angoli è zero.

7.5 Problemi

7.1 Radiazione di ciclotrone nel limite non relativistico. Si consideri una parti-
cella di carica e che in presenza di un campo magnetico costante e uniforme compie un
moto circolare uniforme, con frequenza ω = eB/m e raggio R, tale che v = ωR ¿ 1.
a) Si determini il campo elettrico generato dalla particella nella zona delle onde.
b) Per ogni istante t fissato si determinino le direzioni in cui la potenza emessa è massima
e minima.
c) Mediando su tempi grandi rispetto al periodo si dimostri che la distribuzione angolare
della potenza media è data da,

dW e2 ω 4 R2
= (1 + cos2 ϑ),
dΩ 32π 2

dove ϑ è l’angolo tra la direzione di osservazione e l’asse della circonferenza.


d) Supponendo che la carica sia vincolata a un anello di raggio R, si determini la legge
oraria con cui la velocità della particella diminuisce. Si assuma che valga,

|v̇| ¿ ω 2 R,

in modo da poter considerare nella formula di Larmor solo l’accelerazione centripeta. Si


verifichi la validità di questa ipotesi a posteriori.

7.2 Si consideri una particella carica leggera che compie un moto circolare uniforme
attorno a una particella carica pesante, nelle stesse ipotesi del paragrafo 7.3.6.
a) Si determini la legge oraria con cui variano la velocità e il periodo della particella
leggera.
b) Si discutano i limiti di validità dell’analisi svolta.

247
7.3 Distribuzioni di carica a simmetria sferica. Si consideri la formula (7.9) per il
potenziale Aµ nella zona delle onde. Si supponga che la corrente j µ sia dotata di simmetria
sferica, come specificato nel problema 2.5. Si verifichi che una tale distribuzione di carica
non irradia in nessuna direzione, cioè,

dW
= 0, ∀ ~n,
dΩ

come implicato dal teorema di Birkhoff.


Traccia dello svolgimento. È sufficiente dimostrare Ai dato in (7.9) è della forma,

~ ~x, ) = ~n g(t, ~x),


A(t, (7.95)

per qualche funzione g. A questo scopo si può sfruttare il seguente teorema sugli integrali
invarianti tridimensionali.
Teorema: Sia data una funzione di due variabili tridimensionali f (~x, ~y ), invariante per
rotazioni, cioè,
f (R~x, R~y ) = f (~x, ~y ), ∀ R ∈ SO(3),

condizione che risulta essere equivalente ad assumere che f dipenda da ~x e ~y solo attraverso
gli invarianti |~x|, |~y | e ~x · ~y . Si definisca la funzione vettoriale,
Z
F~ (~x) = ~y f (~x, ~y ) d3 y.

Allora F~ è necessariamente della forma,

F~ (~x) = ~x F0 (|~x|). (7.96)

Dimostrazione: eseguendo nell’integrale che definisce F~ il cambiamento di variabili ~y →


R~y , si ricava che F~ è una “funzione covariante” per rotazioni, cioè,

F~ (R~x) = RF~ (~x), ∀ R ∈ SO(3).

La funzione F~ (~x) è allora necessariamente della forma (7.96).


Risulta che la funzione g(t, ~x) che compare nella (7.95), in generale è diversa da zero
e dipendente dal tempo. Ciò sembra in contraddizione con il teorema di Birkhoff, secondo
cui per distribuzioni sferiche di carica il campo elettromagnetico nel vuoto è statico. Il

248
paradosso si risolve facilemente se si ricorda che Aµ è definito modulo una trasformazione
di gauge. La funzione g che compare nella (7.95) è, infatti, della forma particolare g(t, ~x) =
1
r
f (t− r), e si può fare vedere allora che esiste una trasformazione di gauge che annulla
Q
Ai , e riporta allo stesso tempo il potenziale scalare nella forma standard A0 = .
4πr
7.4 A partire dai campi di Lienard–Wiechert (6.99) si verifichi che il tensore energia–
impulso del campo prodotto da una particella in moto arbitrario, nella zona delle onde si
riduce a,
µν
Tem ~ 2,
= nµ nν |E|

in accordo con la formula generale (7.13).


Traccia dello svolgimento. Nella zona delle onde il campo elettromagnetico (6.99) è
dominato dal campo di accelerazione (6.102), che riscriviamo come,

e
F µν → Faµν = (mµ ∆ν − mν ∆µ ) , ∆µ ≡ (um) wµ − (wm) uµ .
4π(um)3 R

Questa scrittura è conveniente in quanto si ha,

mµ mµ = 0 = mµ ∆µ , ∆2 = (um)2 w2 + (wm)2 .

Allora è immediato valutare il tensore energia–impulso nella zona delle onde,

µν 1 µν ρσ e2 ∆2
Tem = F µρ Fρ ν + η F Fρσ = − mµ mν . (7.97)
4 16π 2 (um)6 R2

~ → ~n, e segue in particolare che mµ → nν . La verifica


Per r grandi si ha R → r, m
~ a |2 , vedi (6.108), è lasciato come
che il coefficiente di nµ nν nella (7.97) eguaglia allora |E
esercizio.

7.5 Bremsstrahlung in campo coulombiano a grandi distanze. Si consideri un


elettrone non relativistico che passa accanto a un nucleo di carica Ze, considerato fisso,
a una distanza molto grande. In questo modo la sua traiettoria si discosta poco da una
retta. Indicando la sua velocità asintotica con v0 ¿ 1, e il parametro d’impatto con b, la
sua distanza dal nucleo come funzione del tempo può allora essere approssimata con,
q
r(t) = |~y (t)| ' b2 + v02 t2 .

249
a) Considerando che l’accelerazione dell’elettrone lungo la traiettoria è data da,

Ze2 ~y
~a = − ,
4πm r3

si dimostri che durante il passaggio vicino al nulceo esso irraggia l’energia,

e6 Z 2 1
∆ε(v0 , b) = .
192π m v0 b3
2 2

Si confronti questa espressione con il risultato esatto (7.79).


b) Si supponga ora di avere un fascio di elettroni incidenti a velocità v0 . Si dimostri che
“l’irraggiamento efficace”, definito come la potenza irraggiata Wrad divisa per il flusso j
di elettroni incidenti, è dato in generale da 35 ,
Z ∞
χ(v0 ) = 2π b db ∆ε(v0 , b), Wrad = χ(v0 ) j. (7.98)
0

Si noti che χ(v0 ) ha le dimensioni di [energia]·[area].


c) Per il caso in questione l’integrale in b diverge per b → 0. A questo proposito bisogna
tenere presente che il calcolo di ∆ε(v0 , b) eseguito sopra è valido per b grandi, e che a
distanze piccole non si possono trascurare gli effetti quantistici. In Meccanica Quantistica
un cut–off naturale è fornito dal principio di indeterminazione, che suggerisce di stimare la
distanza di minimo avvicinamento d attraverso d mv0 ≈ ~, ovvero d ≈ ~/mv0 . Si può allo-
ra dare una stima dell’irraggiamento efficace sostituendo l’estremo inferiore dell’integrale
in (7.98) con b ≈ d. Si ottiene,

e6 Z 2
χ(v0 ) ≈ , (7.99)
96 π m~ c3

formula che riproduce il corretto ordine di grandezza del risultato della Meccanica Quan-
tistica. In realtà si può vedere che per un fascio non relativistico di elettroni incidenti –
per esempio – su un solido, la perdita di energia per irraggiamento (7.99) è soppressa di
un fattore (v0 /c)2 , rispetto alla perdita di energia dovuta alle collisioni. In questo caso il
fenomeno dell’irraggiamento diventa quindi rilevante solo nel limite ultrarelativistico.

7.6 Si consideri una particella non relativistica in un ciclotrone come nel problema 7.1.
a) Si dimostri che la radiazione di dipolo magnetico è assente.
35
Con “flusso incidente” si intende in generale il numero di particelle incidenti che attraversano l’unità
di superficie nell’unità di tempo.

250
b) Si determini il contributo alla potenza emessa dovuto alla radiazione di quadrupolo,
confrontandolo con il contributo della radiazione di dipolo.
c) Si determinino le frequenze presenti nella radiazione di quadrupolo.

7.7 Si consideri un urto tra due particelle cariche identiche non relativistiche, nel sistema
di riferimento del centro di massa. Si stimi la potenza istantanea emessa durante l’urto,
confrontandola con la potenza istantanea emessa nell’urto tra due particelle della stessa
36
massa ma di carica opposta. Per la soluzione si veda il testo di L.D. Landau et. al. ,
paragrafo 71, problema 1.

36
L.D. Landau e E.M. Lifsits, Teoria dei Campi, Editori Riuniti, Roma, 1976.

251
8 La radiazione gravitazionale

Questo capitolo è dedicato a un confronto tra la radiazione elettromagnetica e quella gravi-


tazionale, ed è quindi di carattere più speculativo, visto che la seconda attende tuttora un
riscontro sperimentale diretto. Per concretezza considereremo queste radiazioni nel limite
non relativistico, ovvero quando vengono generate da corpi che si muovono con velocità
piccole rispetto alla velocità della luce. In questo modo risulta appropriato lo sviluppo in
multipoli, e cosı̀ avremo a disposizione formule sufficientemente esplicite da permettere un
confronto concreto. Riporteremo le previsioni fatte dalla Relatività Generale omettendo
evidentemente le deduzioni, ma forniremo, ove possibile, argomentazioni euristiche. No-
nostante le onde gravitazionali attendano a tuttoggi una conferma sperimentale diretta,
esistono pochi dubbi sul fatto che qualsiasi corpo accelerato ne debba emettere, non per
ultimo perché le equazioni di Einstein le predicono come soluzioni. Resta comunque il
fatto curioso che fino a pochissimo tempo fa, l’unica traccia indiretta della loro esisten-
za proveniva dalla pulsar binaria PSR 1913+16, scoperta nel 1974 da R.A. Hulse e J.H.
37
Taylor, che nel 1993 valse ai suoi scopritori il premio Nobel .

8.1 Onde gravitazionali e onde elettromagnetiche

Per quanto riguarda il confronto tra le onde elettromagnetiche e quelle gravitazionali i


risultati di questo capitolo possono essere riassunti come segue. 1) Mentre le onde elet-
tromagnetiche costituiscono soluzioni esatte delle equazioni di Maxwell, le equazioni di
Einstein ammettono come soluzioni onde gravitazionali solo nel limite di campo debole.
Questa approssimazione è più che giustificata, perché le onde gravitazionali, se esistono,
hanno sicuramente un’intensità bassissima, altrimenti sarebbero già state osservate. 2)
Cosı̀ come la sorgente del campo elettromagnetico è la quadricorrente j µ , cosı̀ la sorgente
del campo gravitazionale è il tensore energia–impulso T µν del sistema, e cosı̀ come una
carica elettrica accelerata emette onde elettromagnetiche, cosı̀ qualsiasi corpo accelerato
emette onde gravitazionali. 3) Un sistema a simmetria sferica emette nè onde elettroma-
gnetiche, nè onde gravitazionali. 4) Le onde gravitazionali trasportano quadrimomento
37
Per osservazioni più recenti si veda M. Kramer et. al, Tests of General Relativity from Timing the
Double Pulsar, Science 314, 97-102 (2006); astro–ph/0609417.

252
come quelle elettromagnetiche, ma rispetto alle ultime l’intensità delle prime è soppressa
³ v ´2
di un fattore relativistico . Questo segue dal fatto che le radiazioni di dipolo “elet-
c
trico” e “magnetico” nel caso gravitazionale sono assenti per qualsiasi sistema isolato, e
che il contributo dominante della radiazione gravitazionale è quindi costituito dalla ra-
diazione di quadrupolo. 5) Ricordiamo che entrambi i tipi di onda sono onde trasversali a
due gradi di libertà, che si propagano con la velocità della luce. Ma mentre le onde elet-
tromagnetiche hanno elicità ±1, quelle gravitazionali hanno elicità ±1. 6) Infine facciamo
notare, senza entrare nei dettagli, che il gruppo di simmetria di “gauge” dell’interazione
gravitazionale è rappresentato dai “diffeomorfismi”, ovverosia, da arbitrari cambiamenti
di coordinate,
xµ → x0µ (x),

che generalizzano le trasformazioni di Poincaré, xµ → Λµ ν xν + aµ .

8.2 Le equazioni per un campo gravitazionale debole.

In questa sezione useremo da una parte argomenti di invarianza relativistica, e dall’altra


la stretta analogia esistente tra le forze gravitazionale e elettromagnetica a livello non
relativistico, per dedurre le equazioni di propagazione per un campo gravitazionale di
bassa intensità in modo euristico. Le equazioni che otterremo, vedi (8.10), si identificano
con le equazioni di Einstein nel limite di campo debole. Come vedremo, queste equazioni
hanno una struttura analoga a quella delle equazioni di Maxwell in gauge di Lorentz,
e sfruttando l’esperienza accumulata con queste ultime non avremo nessuna difficoltà a
risolvere le prime.
Cominciamo con la semplice osservazione che a livello non relativistico le interazioni
gravitazionale e elettromagnetica hanno in realtà la stessa identica struttura. Le forze
quasi–statiche tra due corpi sono infatti date da,

e1 e2
F~em = ~r (8.1)
4πr3
m1 m2
F~gr = −G 3 ~r, (8.2)
r

essendo G la costante di Newton. Corrispondentemente i potenziali scalari elettrico e

253
gravitazionale soddisfano le equazioni di tipo Poisson,

−∇2 ϕem = ρe , (8.3)

∇2 ϕgr = 4πG ρm , (8.4)

dove ρe è la densità di carica elettrica e ρm la densità di massa. Queste equazioni eviden-


temente non sono covarianti per trasformazioni di Lorentz, ma nel caso elettromagnetico
sappiamo bene come modificare la (8.3) per renderla tale. Come primo passo dobbiamo
covariantizzare il Laplaciano sostituendolo con il d’Alembertiano, −∇2 → −∇2 + ∂02 = 2,
ottenendo cosı̀,
2ϕem = ρe . (8.5)

Come secondo passo dobbiamo assegnare un ben definito carattere tensoriale alle gran-
dezze coinvolte. A questo proposito ricordiamo che la densità di carica è la componente
0 della quadricorrente, ρe = j 0 , e cosı̀ possiamo concludere che anche il potenziale sca-
lare debba essere la componente 0 di un certo quadrivettore Aµ , ϕem = A0 . Imponendo
l’invarianza di Lorentz arriviamo cosı̀ a postulare l’equazione,

2Aµ = j µ . (8.6)

La conservazione della quadricorrente impone infine il vincolo,

∂µ Aµ = 0. (8.7)

Abbiamo effettivamente ottenuto le equazioni di Maxwell in gauge di Lorentz.


Cerchiamo ora di applicare la stessa strategia alla (8.4), per derivare un’equazione
relativistica per il campo gravitazionale. Di nuovo cominciamo sostituendo la (8.4) con,

2ϕgr = −4πGρm . (8.8)

Per individuare il multipletto tensoriale al quale appartiene il campo ϕgr , dobbiamo allora
trovare il multipletto tensoriale al quale appartiene la densità di massa. A questo proposito
ricordiamo che in Relatività Ristretta la massa è una forma di energia, e ci dobbiamo allora
aspettare che in una teoria relativistica della gravitazione il campo gravitazionale venga
generato non dalla massa, ma piuttosto dall’energia di un corpo. Sappiamo, infatti, che i

254
fotoni vengono deviati da un campo gravitazionale, pur non possedendo massa, ma “solo”
energia. Nella (8.8) dobbiamo quindi sostituire la densità di massa con la densità di
energia, che altro non è che la componente 00 del tensore energia–impulso,

ρm → T 00 .

Si noti che per un sistema di particelle non relativistiche T 00 si riduce di nuovo alla
densità di massa, vedi (2.71). Questa analisi ci induce dunque a considerare ϕgr co-
me la componente 00 di un tensore doppio simmetrico H µν , il “campo gravitazionale”.
Convenzionalmente si pone,
1 00
ϕgr = H .
4
La (8.8) si scrive allora,
2H 00 = −16πG T 00 , (8.9)

che si covariantizza naturalmente in,

2H µν = −16πG T µν . (8.10)

La legge di conservazione ∂µ T µν = 0, analoga a ∂µ j µ = 0, impone poi al campo gravita-


zionale il vincolo,
∂µ H µν = 0. (8.11)

Confrontando la (8.10) con la (8.6) si vede che la sorgente del campo gravitazionale è
il tensore energia–impulso, cosı̀ come la quadricorrente elettrica è la sorgente del campo
elettromagnetico. Ma a parte questo, la struttura delle (8.10), (8.11) è identica a quella
delle (8.6), (8.7), e la soluzione delle prime sarà quindi immediata.

8.2.1 La relazione con le equazioni di Einstein

Le equazioni per il campo gravitazionale (8.10) costituiscono una covariantizzazione “mi-


nimale” della (8.4), in quanto realizzano l’invarianza di Lorentz nel modo più semplice.
In realtà le equazioni di campo esatte, ovvero, le equazioni di Einstein, come postulate
dalla Relativià Generale, si riducono alle (8.10) solo nel limite di campo debole. È infatti
immediato rendersi conto le (8.10) non possono descrivere la dinamica del campo gravita-
zionale in modo esatto. Il motivo principale è che secondo la (8.10) il campo gravitazionale

255
sarebbe generato unicamente dal tensore energia–impulso T µν della materia, che per un
sistema di particelle cariche, per esempio, è dato dalla (2.66). Questa equazione non tiene
dunque conto dell’energia e della quantità di moto trasportate dal campo gravitazionale
stesso. Occorre quindi completare il membro di destra della (8.10), aggiungendo il ten-
µν µν
sore energia–impulso Tgr del campo gravitazionale. In analogia con il tensore Tem del
µν
campo elettromagnetico, Tgr dovrebbe essere costruito con termini quadratici in H µν , ma
secondo la Relatività Generale esso contiene tutte le potenze (Hµν )N , per N ≥ 2. Emerge
cosı̀ la differenza fondamentale tra le equazioni di Maxwell e quelle di Einstein: mentre le
prime sono lineari in Aµ in quanto il campo elettromagnetico non porta carica elettrica,
le seconde sono (altamente) non lineari in Hµν in quanto il campo gravitazionale porta
quadrimomento.
Facciamo tuttavia notare che, se il campo gravitazionale è di intensità cosı̀ bassa da
µν
non (auto)influenzare la sua propagazione, allora nella (8.10) il contributo Tgr potrà essere
trascurato.
Data la presenza di potenze di tutti gli ordini in Hµν , per ottenere il corretto com-
pletamento non lineare della (8.10), ovvero le equazioni di Einstein, è necessario ricorrere
al principio di equivalenza, che a sua volta si traduce nella richiesta di invarianza sotto
diffeomorfismi. Mentra questa costruzione esula dagli scopi di questo testo, spieghiamo
comunque in che modo il campo Hµν è legato alla “curvatura” dello spazio–tempo. Come
anticipato nel paragrafo 5.3.2, in presenza di un campo gravitazionale non nullo l’intervallo
tra due eventi si scrive,
ds2 = dxµ dxν gµν (x),

dove gµν rappresenta la “metrica” di uno spazio–tempo curvo. Se la scriviamo nella forma,

gµν (x) = ηµν + hµν (x),

allora il campo hµν quantifica lo scostamento della metrica, dalla metrica ηµν dello spazio–
tempo piatto. Dato che secondo Einstein è la materia a curvare lo spazio, in assenza di
materia (e di onde gravitazionali) si dovrà dunque avere hµν = 0. Si definisce poi il campo
Hµν a partire da hµν attraverso,
1
Hµν = hµν − ηµν hρ ρ , (8.12)
2
256
relazione che si inverte facilmente, dato che H ρ ρ = −hρ ρ ,

1
hµν = Hµν − ηµν H ρ ρ . (8.13)
2

Si dimostra allora che nel limite di campo debole, cioè, per |hµν | ¿ 1, ovvero |Hµν | ¿ 1,
le equazioni di Einstein per la metrica,

1
gµν = ηµν + Hµν − ηµν H ρ ρ , (8.14)
2

si riducono alle equazioni (8.10), (8.11), per un’opportuna scelta di gauge–fixing per i
diffeomorfismi. Risolte queste ultime per Hµν , la (8.14) permette di determinare la metrica
in ogni punto dello spazio–tempo.
Scelte alternative per il campo gravitazionale. A priori si offrono due alternative per il
tipo di tensore da scegliere per il campo gravitazionale. La prima – immediata – emerge
se si riguarda ρm come la componente 0 della “quadricorrente di massa”, la quale per un
sistema di particelle è data da,
X Z
µ
Jm = mr uµr δ 4 (x − yr ) dsr . (8.15)
r

Seguirebbe infatti,
X
0
Jm = mr δ 3 (~x − ~yr ) = ρm .
r

In base alla (8.8) il campo ϕgr sarebbe allora la componente 0 di un quadrivettore. Questa
scelta è, tuttavia, in conflitto con due fatti sperimentali fondamentali. In primo luogo in
questo modo costruiremmo una teoria relativistica della gravità, in completa analogia con
l’Elettrodinamica – procedura che è in palese contrasto con il fatto che la prima prevede
solo “cariche” positive, le masse, mentre la seconda prevede cariche di entrambi i segni.
In secondo luogo, data la (8.15) si conserverebbe la massa totale di un sistema – di nuovo
in contrasto con l’esperienza.
La seconda scelta alternativa consiste, invece, nel considerare ϕgr come un quadrisca-
lare. Nel limite non relativistico le componenti T 0i e T ij del tensore energia–impulso sono
trascurabili rispetto a T 00 , vedi (2.71), e di conseguenza T µ µ ≈ T 00 . Potremmo allora
identificare ρm con la traccia di T µν . Al posto di (8.10) otterremmo allora l’equazione,

2ϕgr = −4πG T µ µ .

257
Tuttavia, essendo che Tem µ µ = 0, qesta scelta implicherebbe che il campo elettromagnetico
non genera alcun campo gravitazionale, in contrasto con il fatto che i raggi luminosi in
un campo gravitazionale vengono deviati.

8.3 Irraggiamento gravitazionale

Nel limite di campo debole le equazioni del campo gravitazionale hanno dunque la stessa
struttura delle equazioni del campo elettromagnetico, di cui conosciamo tutte le soluzioni.
In questo limite, dunque, anche le equazioni del campo gravitazionale possono essere
risolte esattamente. In questa sezione riportiamo le soluzioni rilevanti e ne discutiamo le
conseguenze fisiche, specie in riferimento al fenomeno dell’irraggiamento gravitazionale.
Come prima cosa osserviamo che nel vuoto, dove T µν = 0, le (8.10) si riducono alle
equazioni delle onde,
2H µν = 0. (8.16)

Come sappiamo, queste equazioni ammettono come soluzioni delle onde piane “gravita-
zionali”, e viste le (8.11), (8.12) è immediato verificare che esse sono date proprio dalle
(5.82).
Viceversa, in presenza di un tensore energia–impulso diverso da zero la (8.10) ammette
la soluzione esatta, vedi (6.48),
Z
µν 1
H = −4 G d3 y T µν (t − |~x − ~y |, ~y ).
|~x − ~y |

A grandi distanze dalla sorgente – nella zona delle onde – possiamo ripetere l’analisi
asintotica svolta in sezione 7.1. Usando le stesse notazioni di quella sezione è allora
immediato vedere che il campo gravitazionale nella zona delle onde è dato da,
Z
µν 4G ~x
H =− d3 y T µν (t − r + ~n · ~y , ~y ), r = |~x|, ~n = . (8.17)
r r

A grandi distanze il campo gravitazionale decade quindi come 1/r, come si conviene a un
campo di accelerazione. Come in sezione 7.1 si dimostra inoltre che, modulo termini di
ordine 1/r2 , il campo (8.17) soddisfa le relazioni delle onde,

∂ρ H µν = nρ Ḣ µν , nµ Ḣ µν = 0, n2 = 0, nµ = (1, ~n). (8.18)

258
Con lo stesso argomento del pargrafo 7.1.2 si può poi vedere che asintoticamente il campo
1
hµν = Hµν − 2
ηµν H ρ ρ risulta sovrapposizione di onde piane del tipo (5.82), come si
conviene a un campo di radiazione.
Infine, nel limite non relativistico si può trascurare il termine ~n · ~y , e si ottiene la
semplice espressione,
Z
µν 4G
H =− d3 y T µν (t − r, ~y ). (8.19)
r
La potenza emessa. Passiamo ora all’analisi energetica della radiazione emessa. Per
eseguire questa analisi occorre conoscere l’espressione esplicita del tensore energia–impulso
µν
del campo gravitazionale Tgr , in termini di H µν . Noto questo tensore si possono deter-
minare la distribuzione angolare della potenza emessa dWgr /dΩ, e la potenza totale Wgr ,
in completa analogia con la componente µ = 0 della (6.116),
Z
dWgr ¡ 0i i ¢ dWgr
= r2 Tgr n , r → ∞, Wgr = dΩ. (8.20)
dΩ dΩ
µν
Tuttavia, per derivare la forma esplicita di Tgr è necessario ricorrere alle equazioni
di Einstein esatte. Per il momento ci è sufficiente sapere che nel limite di campo debole
esso risulta quadratico in H µν , di modo tale che per r → ∞ la (8.20) dà luogo a un
risultato finito. Nella prossima sezione valuteremo la (8.20) esplicitamente, e l’espressione
di Wgr risultante sarà in effetti molto semplice, vedi (8.25). In sezione 8.5 applicheremo
poi questa formula per valutare la perdita di energia della pulsar binaria PSR 1913+16,
causa emissione di onde gravitazionali, ne analizzeremo le conseguenze fenomenologiche
e le confronteremo con le osservazioni astronomiche di Hulse e Taylor.

8.3.1 Un argomento euristico per la formula di quadrupolo

Invece di passare direttamente al calcolo esplicito della (8.20), in questo paragrafo daremo
un argomento euristico – basato ancora sull’analogia con l’Elettrodinamica – per valutare
l’ordine di grandezza di Wgr . Questo argomento ci permetterà inoltre di comprendere
meglio il significato fisico del risultato. Prima di procedere ricordiamo che nella trattazione
svolta finora abbiamo supposto che ∂µ T µν = 0, cioè, che il sistema irradiante che stiamo
considerando sia isolato. Per valutare la potenza emessa è infatti sufficiente considerare
la dinamica del sistema nell’approssimazione di ordine zero, cioè, trascurando la “forza di
frenamento gravitazionale”.

259
Torniamo dunque all’espansione non relativistica (7.92) della potenza elettromagnetica
emessa da un sistema carico,

1 ¯¯ ~¨ ¯¯2 1 ¯¯ ¨~ ¯¯2 1 ˙ ij ˙ ij
Wem = ¯D ¯ + ¯ M ¯ + D̈ D̈ . (8.21)
6πc3 6πc5 80πc5

Supponiamo ora che il sistema in questione sia formato da un certo numero di particelle,
con cariche er e masse mr . Allora l’analogia fra la (8.1) e la (8.2) suggerisce di stimare la
potenza gravitazionale emessa dallo stesso sistema, operando nella (8.21) semplicemente
le sostituzioni,

er → 4πG mr . (8.22)

Dato che a livello non relativistico l’energia è dominata dalla massa, dovremo quindi
effettuare la sostituzione, vedi (2.80),

jµ → 4πG T µ0 .

Se si ricordano le definizioni dei vari momenti di multipolo che compaiono nella (8.21), si
vede che questa procedura porta alla stima,

2G ¯ ¯2 G ¯¯ ~¨ ¯¯2 G ˙ ij ˙ ij
¯ ~˙ ¯
Wgr ≈ 3 ¯P ¯ + 5 ¯L¯ + P̈ P̈ , (8.23)
3c 6c 20c5
P ~ = P ~yr × mr~vr è il suo
dove P~ = r mr~vr è la quantità di moto totale del sistema, L r

momento angolare totale, e P ij è il suo momento di quadrupolo gravitazionale ridotto,


Z
ij ij 1 ij kk
P =P − δ P , P = d3 x xi xj T 00 .
ij
(8.24)
3
˙ ~˙ ed entrambi i contributi di dipolo
Ma siccome il sistema è isolato abbiamo P~ = 0 = L,
nella (8.23) sono allora nulli! In ultima analisi l’assenza dei contributi di dipolo nella
radiazione gravitazionale è conseguenza del principio di equivalenza, che assicura che la
“carica gravitazionale” di un corpo coincide con la sua massa: dopo la sostituzione (8.22)
il rapporto “er /mr ” diventa allora indipendente da r per qualsiasi corpo, eguagliando la

costante γ = 4πG. E in questo caso sappiamo, infatti, che le radiazioni di dipolo sono
entrambe assenti, si vedano il paragrafo 7.3.2 e la sezione 7.4.
Resterebbe quindi solo il termine di quadrupolo. In realtà nel prossimo paragrafo
vedremo che la valutazione esplicita della (8.20) conferma il risultato (8.23) – a parte un

260
fattore moltiplicativo 4. Otterremo infatti,

G ˙ ij ˙ ij
Wgr = P̈ P̈ . (8.25)
5c5

Questa è la celebrata formula di quadrupolo per l’irraggiamento gravitazionale. Essa


costituisce a tutti gli effetti la controparte gravitazionale dell’analogo risultato (7.41)
dell’Elettrodinamica,
1 ¯ ¯2
¯ ~¨ ¯
Wem = ¯D¯ ,
6πc3
in quanto entrambe le formule danno il termine leading della potenza totale emessa in

approssimazione non relativistica. Previa l’identificazione e ↔ 4πG m si vede che l’in-
tensità della radiazione gravitazionale, essendo di quadrupolo, è soppressa di un fattore
(v/c)2 rispetto alla radiazione elettromagnetica, che è appunto di dipolo.
Teorema di Birkhoff. Facciamo, infine, notare che nella (8.25) la comparsa del momen-
to di quadrupolo ridotto (8.24) è dovuta al fatto che il teorema di Birkhoff, vedi problema
2.5, vale anche per il campo gravitazionale, per il quale, in realtà, originalmente è stato
dimostrato. In Relatività Generale questo teorema afferma che il campo gravitazionale
prodotto da un sistema sferico nel vuoto, è statico, e quindi un tale sistema non può
emettere onde gravitazionali, ovvero Wgr = 0. La formula (8.24) verifica in effetti questo
teorema, perchè per un sistema a simmetra sferica si ha T 00 = T 00 (t, r), e l’argomento
dato in (7.94) si estende allora immediatamente al momento di quadrupolo ridotto (8.24),
e ne segue che P ij = 0. Per un sistema sferico si ha quindi Wgr = 0.

8.4 La potenza della radiazione di quadrupolo

In questa sezione deriviamo la (8.25) a partire dalla (8.20).


Punto di partenza è l’espressione per il tensore energia–impulso del campo gravitazio-
nale, che viene fornita dalle equazioni di Einstein. Invece di riportare l’espressione esatta,
diamo la sua forma nella zona delle onde, che risulta particolarmente semplice,
µ ¶
µν nµ nν αβ 1 α 2
Tgr = Ḣ Ḣαβ − (Ḣ α ) . (8.26)
32π G 2

Scrivendo la (8.26) abbiamo omesso un termine proporzionale a una quadridivergenza,

261
del tipo,
∂W ρµν
∂ρ W ρµν = nρ , (8.27)
∂t
dove W ρµν è un tensore bilineare in H αβ e Ḣ αβ . Essendo una derivata totale rispetto al
tempo, questo termine non contribuisce quando si considera un sistema che compie un
moto periodico, e si media la potenza (8.20) nel tempo. In questo caso H αβ è, infatti,
periodico nel tempo, e tale sarà allora W ρµν . Se un sistema compie, invece, un moto
aperiodico, ed è accelerato per un intervallo temporale finito, allora il termine (8.27) non
contribuisce all’energia totale emessa, perchè in quel caso per t → ±∞ Ḣ αβ tende a zero,
e per t → ±∞ si annulla quindi anche W ρµν .
µν
Facciamo notare l’analogia formale tra la (8.26) e l’espressione corrispondente di Tem
per il campo elettromagnetico (5.72),

µν
Tem = −nµ nν (Ȧα Ȧα ).

Per la distribuzione angolare della potenza le (8.20), (8.26) danno allora,


µ ¶
dWgr r2 αβ 1 α 2
= Ḣ Ḣαβ − (Ḣ α ) . (8.28)
dΩ 32πG 2
Come nel caso elettromagnetico esprimiamo innanzitutto il membro destra di questa for-
mula in termini delle sole componenti spaziali H ij del campo gravitazionale. A questo sco-
po riprendiamo dalle (8.18) le identità algebriche nµ Ḣ µν = 0, che permettono di esprimere
tutte le componenti di Ḣ µν in termini delle sole Ḣ ij ,

Ḣ 00 = ni nj Ḣ ij

Ḣ 0i = nj Ḣ ij .

Inserendo queste espressioni nella (8.28) si ottiene facilmente,


dWgr r2
= Ḣ ij Ḣ lm Λijlm , (8.29)
dΩ 32πG
1 1
Λijlm ≡ δ il δ jm − δ ij δ lm − 2 δ il nj nm + δ ij nl nm + ni nj nl nm , (8.30)
2 2
analoga alla (7.17) dell’Elettrodinamica. Per procedere è più conveniente riesprimere il
membro di destra della (8.29) in termini della parte di traccia di H ij , cioè H ii , e della sua
parte a traccia nulla,
1 ij kk
Hij ≡ H ij − δ H , Hii = 0.
3
262
Inserendo nella (8.29) l’espressione,
1 ij kk
H ij = Hij + δ H ,
3
e svolgendo i calcoli si vede che la parte di traccia si cancella, e si ottiene,
dWgr r2
= Ḣij Ḣlm Σijlm , (8.31)
dΩ 32πG
1 i j l m
Σijlm ≡ δ il δ jm − 2 δ il nj nm + nn nn . (8.32)
2
I campi H ij , infine, sono dati dalle (8.19),
Z
ij 4G
H =− d3 y T ij . (8.33)
r
Come ultimo passo facciamo vedere che questi campi sono legati in modo molto semplice
ai momenti di quadrupolo (8.24). Si dimostra infatti che vale l’identità,
Z
1
d3 x T ij = P̈ ij .
2
La dimostrazione sfrutta la conservazione del tensore energia–impulso ∂µ T µν = 0, che
comporta,

Ṫ 00 = −∂k T k0 ,

Ṫ 0k = −∂m T mk ,

e quindi,
T̈ 00 = −∂k Ṫ k0 = ∂k ∂m T km .

Integrando due volte per parti si ottiene allora,


Z Z Z
ij
¡ ¢
P̈ = d x x x T̈ = d x x x ∂k ∂m T = d3 x ∂k ∂m xi xj T km
3 i j 00 3 i j km

Z Z
¡ i j j i
¢ km
= d x δk δm + δk δm T = 2 d3 x T ij .
3

Concludiamo che nel limite non relativistico il campo gravitazionale nella zona delle onde
38
è legato al momento di quadrupolo dalla semplice relazione ,
2G ij
H ij = − P̈ , (8.34)
r
38
Ripristinando la velocità della luce e identificando nella (8.24) T 00 con la densità di massa ρm , la
2G
(8.34) si scrive, H ij = − 4 P̈ ij . Rispetto alla (7.37) – che è una radiazione è di dipolo – ci si sarebbe
rc
aspettati una potenza di 1/c2 . L’ulteriore fattore 1/c2 è dovuto al fatto che hµν corrisponde al campo
gravitazionale, diviso c2 .

263
da confrontare con la (7.37). Per questo motivo la radiazione rappresentata da H ij
corrisponde a una “radiazione di quadrupolo”. Sottraendo dalla (8.34) la traccia si trova,
2G ij
Hij = − P̈ ,
r
e sostituendo in (8.31) si ottiene,
dWgr G ˙ ij ˙ lm ijlm
= P̈ P̈ Σ .
dΩ 8π
In generale la distribuzione angolare della potenza è quindi una funzione abbastanza
complicata degli angoli. Tuttavia, grazie agli integrali invarianti del problema 2.6 si
ottiene una formula molto semplice per la potenza totale,
Z
G ˙ ij ˙ lm
Wgr = P̈ P̈ Σijlm dΩ (8.35)

G ˙ ij ˙ lm 2π ¡ ij lm ¢
= P̈ P̈ δ δ + 11 δ il δ jm + δ im δ jl
8π 15
G ˙ ij ˙ ij
= P̈ P̈ , (8.36)
5
che è la formula di quadrupolo (8.25).

8.5 La pulsar binaria PSR 1913+16

La formula appena derivata fornisce l’energia emessa nell’unità di tempo da un sistema


non relativistico mediante onde gravitazionali, noto il momento di quadrupolo (8.24), e
quindi la sua densità di energia. Nel limite non relativistico la densità di energia è a sua
volta dominata dalla densità di massa. Se il sistema è composto da un certo numero di
particelle con massa Mr e traiettorie ~yr (t), o più in generale, da un certo numero di corpi
rigidi con moti rotazionali trascurabili, allora abbiamo dunque, vedi (2.80),
X
T 00 = Mr δ 3 (~x − ~yr ).
r

Di conseguenza otteniamo la semplice espressione,


Z X Z X
ij 3 i j 00
P = d xx x T = Mr d3 x xi xj δ 3 (~x − ~yr ) = Mr yri yrj . (8.37)
r r

Derivandola tre volte rispetto al tempo, sottraendo la traccia e inserendo l’espressione


risultante nella (8.25), si può quindi calcolare facilmente l’energia che viene emessa nel-
l’unità di tempo. Per i motivi spiegati sopra l’entità di questa energia è in generale

264
molto piccola, e quindi difficile da misurare. La verifica sperimentale della (8.25) necessi-
ta dunque dell’esistenza di particolari sistemi fisici, in cui la radiazione gravitazionale sia
cosı̀ intensa da poter essere rivelata sperimentalmente. In linea di principio ci sono due
possibilità diverse per stabilire la presenza di onde gravitazionali.
Osservazioni dirette. Siccome in Wgr compaiono le derivate delle coordinate, l’inten-
sità della radiazione sarà elevata se un sistema è costituito da corpi con accelerazioni
molto violente e masse molto grandi. In questo caso dovrebbe essere possibile osservare
direttamente gli effetti del campo (8.34), anche se la durata delle accelerazioni è molto
breve, come per esempio nelle supernovae. Le tecniche sperimentali per effettuare misure
di questo tipo impiegano antenne gravitazionali o dispositivi interferometrici.
Osservazioni indirette. Se un sistema fisico è soggetto ad accelerazioni troppo picco-
le, allora la radiazione gravitazionale emessa può essere troppo poco intensa per essere
osservata sperimentalmente. Tuttavia, per la conservazione dell’energia il fenomeno del-
l’irraggiamento gravitazionale comporta necessariamente una diminuzione dell’energia del
sistema irradiante. Anche se la potenza istantanea è molto piccola, se il sistema irradia
abbastanza a lungo, compiendo per esempio un moto periodico, allora può succedere che la
continua perdita di energia causa nel sistema effetti cumulativi cosı̀ grandi da poter essere
rivelati sperimentalmente. Effetti di questo tipo possono essere, per esempio, variazioni
molto leggere delle velocità o delle dimensioni delle orbite di un sistema – altrimenti sup-
posto periodico. Un sistema astronomico con queste caratteristiche è stato scoperto da
R.A. Hulse e J.H. Taylor nel 1974, la pulsar binaria PSR 1913+16, la quale è stata tenuta
sotto osservazione dagli scopritori per una decina di anni.
La pulsar PSR 1913+16 e la sua compagna ruotano una attorno all’altra su orbite
ellittiche pressochè newtoniane, di periodo T = 7.75h, a una distanza di 2 r ≈ 1.8 ·
106 km. Il diametro di entrambe le stelle si stima di una decina di km. La pulsar si
trova inoltre in rotazione rapida attorno a un suo asse con periodo di “spin” τ ≈ 59 ms,
ed in corrispondenza emette impulsi elettromagnetici intervallati dallo stesso periodo.
L’osserazione di questi impulsi, in particolare l’analisi delle oscillazioni del periodo di spin
dovute all’effetto Doppler, causato dal moto orbitale, ha permesso di effettuare una serie
di misure molto precise sulla dinamica del sistema. Una caratteristica delle pulsar isolate

265
è, infatti, costituita dal fatto che l’intervallo τ tra due impulsi successivi resta costante
nel tempo, con una precisione che rasenta spesso quella degli orologi atomici.
Cosı̀ è stato possibile, per esempio, determinare le masse delle due stelle e l’eccentricità
dell’orbita relativa, con precisione molto elevata. Se indichiamo con M0 la massa del sole,
la massa della pulsar e quella della sua compagna valgono rispettivamente,

M1 = 1.4414(2)M0 , M2 = 1.3867(2)M0 ,

mentre l’eccentricità dell’orbita è,

e = 0.617127(3).

Le misure effettuate su questo sistema hanno permesso, in particolare, di verificare diverse


previsioni della Relatività Generale in un regime di campi gravitazionali forti, ma il dato
sperimentale forse più rilevante è che il periodo orbitale T del sistema diminuisce nel
tempo, anche se molto lentamente. Le osservazioni effettuate da Hulse e Taylor nell’arco di
circa un decennio, tra il 1974 e il 1987, hanno infatti rivelato che sussiste una diminuzione
costante e sistematica del periodo data da,
µ ¶
dT
= −(2.4056 ± 0.0051) · 10−12 s/s. (8.38)
dt oss

Si noti che in un anno il periodo di 7.75 ore diminuisce di soli 7 · 10−5 s.


Valutazione della formula di quadrupolo. Analizzeremo ora gli effetti dell’emissione di
radiazione gravitazionale sul sistema stesso, in stretta analogia con l’analisi svolta per
l’atomo di idrogeno classico nel paragrafo 7.3.6. In questo caso svolgeremo l’analisi ap-
prossimando le traiettorie ellittiche con orbite circolari di raggio r, e assumendo che si
abbia M1 = M2 = M ; la correzione dovuta all’eccentricità non nulla sarà introdotta alla
fine. Dai dati riportati si vede che la velocità delle stelle vale v/c = 2πr/T ≈ 0.7 · 10−3 , e
quindi è giustificata l’approssimazione non relativistica.
Per valutare la potenza irradiata (8.25) dobbiamo partire dal momento di quadrupolo
(8.37). Dato che abbiamo ~y1 = −~y2 ≡ ~y , si ottiene semplicemente,

P ij = 2M y i y j .

266
Sfruttando la cinematica del moto circolare uniforme e ponendo v i = ẏ i si ottiene poi
facilmente,
ij 8M v 2 ¡ i j ¢
P̈˙ = − 2 y v + yj vi .
r
ii
˙
Dato che ~y · ~v = 0, segue che P̈ = 0, e quindi in questo caso abbiamo,
ij ij
P̈˙ = P̈˙ .

La (8.25) dà allora immediatamente,


128 G M 2 v 6
Wgr = . (8.39)
5r2 c5
Per quantificare gli effetti della potenza emessa (8.39) sul sistema, procediamo come
nel caso dell’atomo di idrogeno classico. Poniamo,

Wgr = − ,
dt
dove ε è l’energia totale non relativistica del sistema. Dall’equazione della forza centripeta,
v2 GM 2 MG
M = ⇒ v2 = ,
r (2r)2 4r
si ottiene, µ ¶
1 2 GM 2 GM 2
ε=2 Mv − =− .
2 2r 4r
D’altra parte, siccome,
T2 r2 4r3
= = ,
4π 2 v2 MG
risulta che ε è proporzionale a T −2/3 . Si conclude allora che il periodo diminuisce nel
tempo secondo la legge,
dT 3 T dε 12 T G3 M 3
=− =− ,
dt 2 ε dt 5 r4 c5

dove per − abbiamo sostituito la (8.39). Infine, si può vedere che la struttura el-
dt
littica delle orbite modifica questo risultato solo per un fattore correttivo dipendente
dall’eccentricità,
dT 12 T G3 M 3 1 + 73e2 /24 + 37e4 /96
=− .
dt 5 r4 c5 (1 − e2 )7/2
Inserendo in questa formula i dati di Hulse e Taylor si conclude che la Relatività Generale
prevede per la diminuzione del periodo orbitale nel tempo il valore,
µ ¶
dT
= −(2.40242 ± 0.00002) · 10−12 s/s.
dt RG

267
La diminuzione del periodo osservata (8.38) è quindi perfettamente consistente con l’e-
missione di onde gravitazionali, come prevista dalla Relatività Generale. Risulta infatti,
¡ dT ¢
dt oss
¡ dT ¢ = 1.0013 ± 0.0021.
dt RG

8.6 Problemi

8.1 Si dimostri che l’integrale sugli angoli nella (8.35) dà la (8.36).

8.2 Si consideri un sistema formato da due stelle identiche di massa M , che ruotano
una attorno all’altra su orbite circolari di raggio r, come in sezione 8.5.
a) Si dimostri che la potenza totale della radiazione gravitazionale emessa è data dalla
(8.39).
b) Si esegua l’analisi spettrale della radiazione emessa.

268
9 Irraggiamento ultrarelativistico

La fisica moderna ricorre frequentemente ad esperimenti che coinvolgono particelle cariche


con velocità molto elevate, spesso prossime alla velocità della luce. Per farle raggiungere
velocità cosı̀ grandi occorre fornire loro energia, e se inoltre le si vogliono confinare a zone
limitate le loro traiettorie devono essere necessariamente curvate. In entrambi i processi
le particelle sono sottoposte ad accelerazione ed emettono quindi radiazione elettroma-
gnetica, dissipando parte dell’energia accumulata. In questi casi per valutare la perdita
di energia non si può più ricorrere allo sviluppo in multipoli, valido nel limite non re-
lativistico, ma sono necessari strumenti di calcolo che forniscono risultati esatti, validi
per velocità arbitrarie. In questo capitolo svilupperemo gli strumenti utili a tal scopo,
e li useremo in particolare per analizzare il fenomeno della dissipazione di energia negli
acceleratori ad alte energie, a causa dell’irraggiamento.
Le basi per l’analisi relativistica della radiazione emessa da un generico sistema ca-
rico sono già state sviluppate nel capitolo precedente. Sappiamo in particolare che la
valutazione del quadrimomento emesso, che secondo le (7.13) e (7.15) è dato da,

d2 P µ ¡ µi i ¢
= r2 Tem ~ 2,
n = r2 nµ |E| (9.1)
dt dΩ

richiede solo la conoscenza del campo elettrico nella zona delle onde; e per una distribu-
zione di carica generica questo campo può essere calcolato agevolmente usando le (7.9) e
(7.11). Tuttavia, in seguito ci occuperemo principalmente della radiazione emessa da una
~ potremo usare alternativamente l’espressione di
singola particella, e in questo caso per E
Lienard–Wiechert. Eseguendo i limiti asintotici R → r e m
~ → ~n, dalla (6.108) si ottiene
infatti,
~ = e ~n × [(~n − ~v ) × ~a]
E . (9.2)
4π r (1 − ~v · ~n)3
Ricordiamo che le variabili cinematiche ~v e ~a che compaiono in questa espressione sono
valutate al tempo ritardato t0 (x), definito dalla relazione implicita,

t − t0 = |~x − ~y (t0 )|. (9.3)

Anche questa relazione deve allora essere specificata al caso di grandi r. Eseguendo

269
l’espansione di |~x − ~y (t0 )| per grandi r si ottiene, vedi sezione 7.1,
µ ¶
0 0 1
|~x − ~y (t )| = r − ~n · ~y (t ) + ,
r

da cui segue la relazione asintotica,

t = t0 + r − ~n · ~y (t0 ). (9.4)

Derivando quest’ultima rispetto a t0 , per ~x = ~n r fissato, si ottiene una relazione che


useremo più volte in seguito,
dt
= 1 − ~n · ~v (t0 ). (9.5)
dt0
Inserendo infine la (9.2) nella (9.1) si ottiene un’espressione, abbastanza complicata,
per la distribuzione angolare del quadrimomento emesso. Tuttavia, nella prossima sezione
faremo vedere che integrando la (9.1) sugli angoli è possibile derivare un’espressione molto
µ
dPrad
semplice per il quadrimomento totale , irradiato dalla particella nell’unità di tempo
dt
in tutte le direzioni. Dato che per una particella singola possiamo sempre scrivere,

d d
= u0 ,
ds dt

questo risultato fornirà poi anche il quadrimomento totale irradiato per unità di tempo
proprio,
µ
dPrad dP µ
= u0 rad ,
ds dt
che è una quantità Lorentz–covariante. La formula risultante costituisce una generalizza-
zione relativistica della formula di Larmor, valida per velocità arbitrarie.
Un’analisi qualitativa della distribuzione angolare della radiazione emessa da particelle
ultrarelativistiche verrà invece svolta in sezione 9.3.

9.1 Generalizzazione relativistica della formula di Larmor

Consideriamo una particella carica che compie un moto arbitrario. In quanto segue, per
semplicità supporremo che la particella sia accelerata solo durante un intervallo temporale
limitato, oppure che l’accelerazione vada a zero con sufficiente rapidità per |t| → ∞. In
questo modo la particella emetterà radiazione solo per un intervallo temporale finito, e an-
che il quadrimomento totale emesso sarà allora finito. In questa sezione vogliamo, infatti,

270
calcolare il quadrimomento totale emesso in tutte le direzioni lungo l’intera traiettoria, e
µ
dPrad
successivamente il quadrimomento emesso in tutte le direzioni per unità di tempo
ds
proprio. Per fare questo dovremmo inserire la (9.2) nella (9.1), e integrare l’espressione
risultante su tutti gli angoli e su tutti i tempi. Questo calcolo è istruttivo e lo eseguiremo
esplicitamente nel paragrafo 9.1.2, ma esso risulta anche un po’ lungo. Per questo motivo
µ
dPrad
nel paragrafo che segue daremo una deduzione alternativa e più rapida di , sfrut-
ds
tando il semplice fatto che sotto trasformazioni di Lorentz il quadrimomento si comporta
come un quadrivettore.

9.1.1 Un argomento di covarianza

Riprendiamo i risultati per l’energia e la quantità di moto irradiate nell’unità di tempo


da una particella non relativistica, vedi paragrafo 7.3.2,
dε e2 dP~
= |~a(t − r)|2 , = 0.
dt 6π dt
Ricordiamo che questo quadrimomento viene rivelato a un istante t a una distanza r dalla
particella, motivo per cui l’accelerazione è valutata all’istante ritardato t − r. Proprio
questa circostanza ci permette di interpretare l’espressione,
µ
dPrad e2
= |~a(t)|2 (1, 0, 0, 0), (9.6)
dt 6π
come quella frazione di quadrimomento emessa da una particella non relativistica all’i-
stante t, che raggiunge l’infinito.
Ciò premesso consideriamo ora una particella che compie un moto arbitrario. Dato che
siamo in presenza di un’unica particella, al posto del tempo possiamo equivalentemente
dP µ
considerare il suo tempo proprio, e chiederci quanto vale il quadrimomento rad , irradiato
ds
dalla particella nell’unità di tempo proprio. In seguito assumeremo che questa quantità sia
39
un quadrivettore . Per riallacciarci alla (9.6) consideriamo per ogni s fissato il sistema
di riferimento K ∗ , in cui la particella in quell’istante è a riposo. Secondo quanto stabilito
sopra, in questo sistema di riferimento vale allora,
∗µ
dPrad e2 ∗ 2 ∗µ
= |~a | u , u∗µ ≡ (1, 0, 0, 0), (9.7)
ds 6π
39 µ
Se la quantità dPrad /ds uguagliasse la perdita di quadrimomento della particella in quell’istante,
questa ipotesi sarebbe soddisfatta banalmente. Ma in realtà più avanti vedremo che la particella perde
localmente un’ulteriore porzione di quadrimomento, il termine di Schott, che risulta covariante anch’esso.
La nostra ipotesi si giustifica quindi a posteriori.

271
dove u∗µ è la quadrivelocità della particella in K ∗ . Abbiamo posto dt∗ = ds, in quanto
~v ∗ = 0. Notiamo poi che in K ∗ la quadriaccelerazione vale w∗µ = (0, ~a ∗ ), e quindi
possiamo scrivere,
w∗2 = w∗µ wµ∗ = −|~a ∗ |2 .

La (9.7) si scrive allora,


∗µ
dPrad e2
= − w∗2 u∗µ .
ds 6π
Dato che questa relazione eguaglia un quadrivettore a un quadrivettore, concludiamo che
essa vale in qualsiasi riferimento, e otteniamo dunque,
µ
dPrad e2
= − w 2 uµ , (9.8)
ds 6π

che costituisce la generalizzazione relativistica della formula di Larmor. Rimarchiamo il


fatto che questa formula non esprime il quadrimomento “totale” emesso dalla particella
all’istante s, ma solo quella parte che raggiunge l’infinito.
Dalla (9.8) si vede che a livello relativistico la radiazione trasporta ora anche quantità
d d
di moto. Ricordando che = u0 , la componente spaziale di questa formula corrisponde
ds dt
appunto a,
dP~rad e2
= − w2 ~v ,
dt 6π
che risulta trascurabile se v ¿ 1. Considerando invece la componente temporale della
(9.8) si ottiene la potenza totale emessa da una particella in moto arbitrario,

e2 2
W=− w . (9.9)

Facciamo notare che questa espressione è Lorentz invariante, nonostante la potenza in


generale non sia una quantità scalare, ma dipenda dal sistema di riferimento. Nel caso in
µ
dPrad
questione la Lorentz–invarianza di W è una conseguenza del fatto che ∝ uµ .
ds
~a ⊥ ~v e ~a k ~v . Per confrontare la (9.9) con la formula di Larmor non relativistica
(6.128), esprimiamo la prima in termini dell’accelerazione spaziale ~a, vedi problema 2.1,

e2 a2 − (~a × ~v )2
W= .
6π (1 − v 2 )3

Per velocità piccole riotteniamo ovviamente la potenza di Larmor, ma per particelle ul-
1
trarelativistiche i fattori – a parità di accelerazione – danno luogo a una potenza
1 − v2

272
irradiata molto più elevata, rispetto al caso non relativistico. In particolare possiamo
analizzare separatamente i moti per cui ~a k ~v e quelli per cui ~a ⊥ ~v ,
e2 a2 1 e2 a2 1
Wk = , W⊥ = . (9.10)
6π (1 − v 2 )3 6π (1 − v 2 )2
Si vede che a parità di accelerazione per particelle ultrarelativistiche si avrebbe Wk À W⊥ ,
e quindi in un moto rettilineo verrebbe emessa molta più radiazione che non in un moto con
pura accelerazione centripeta. Tuttavia, questa analisi non tiene conto delle accelerazioni
che si possono raggiungere sperimentalmente in un caso e nell’altro, e inoltre non rapporta
l’energia irradiata all’energia posseduta dalla particella. Vedremo, per esempio, che nel
caso degli acceleratori ad alte energie la situazione è difatti rovesciata.

9.1.2 Deduzione della formula di Larmor relativistica

Deriveremo ora la formula di Larmor relativistica (9.8), a partire dalla formula base (9.1).
La procedura che seguiremo ci permetterà in particolare di confermare la correttezza
dell’interpretazione fisica datane sopra.
Invece di inserire la (9.2) direttamente nella (9.1), è più conveniente usare per il tensore
energia–impulso dei campi asintotici di Lienard–Wiechert l’espressione equivalente (7.97),
vedi problema 7.4. La riportiamo quı̀ con le identificazioni asintotiche R → r, mµ → nµ ,
e2 [(u n)2 w2 + (wn)2 ] µ ν
T µν = − n n . (9.11)
16π 2 (u n)6 r2
Inserendo questa formula in (9.1) risulta,
d2 P µ e2 [(u n)2 w2 + (wn)2 ] µ
=− n . (9.12)
dt dΩ 16π 2 (u n)6
È un semplice esercizio fare vedere che si ottiene lo stesso risultato se si inserisce la (9.2)
nella (9.1).
L’espressione (9.12) fornisce la distribuzione angolare del quadrimomento emesso nel-
l’unità di tempo. Per determinare il quadrimomento totale ∆P µ emesso lungo tutta la
traiettoria, la integriamo su tutti gli angoli e su tutti i tempi,
Z ∞ Z µ 2 ¶
µ e2 µ w (wn)2
∆P = − dt dΩ n + . (9.13)
16π 2 −∞ (u n)4 (u n)6
L’integrando in questa espressione dipende in modo complicato da t e ~n, per via del fatto
che u e w sono valutati al tempo ritardato t0 (t, ~x). Per valutare l’integrale è allora più

273
conveniente passare dalla variabile d’integrazione t al tempo proprio s della particella. Per
ogni ~x fissato esiste, infatti, una relazione biunivoca tra t e t0 , vedi (9.4), e una relazione
biunivoca tra t0 e s, vedi (6.83). Usando la (9.5) si trova in particolare,

dt0 dt
dt = ds = u0 (1 − ~n · ~y ) ds = (u n) ds,
ds dt0

e la (9.13) diventa in definitiva,


Z ∞ Z µ ¶
µ e2 µ w2 (wn)2
∆P = − ds dΩ n + . (9.14)
16π 2 −∞ (u n)3 (u n)5

Ora s è una variabile di integrazione indipendente, e l’integrazione sugli angoli è elemen-


tare. La eseguiamo esplicitamente, per illustrare alcune tecniche che vengono usate di
frequente in fisica teorica.
Cominciamo notando che la funzione integranda in (9.14) dipende dai “parametri”
u e w, che sono soggetti ai vincoli u2 = 1 e u w = 0. La tecnica che useremo prevede,
invece, di valutare l’integrale per vettori u e w generici, cioè, non soggetti a tali vincoli.
L’integrale che ci interessa sarà poi ottenuto imponendo questi vincoli nel risultato finale.
Considerando dunque uµ come una variabile libera, possiamo riscrivere l’integrando di
(9.14) come un gradiente rispetto a uµ ,
µ 2 ¶ µ 2 ¶
µ w (wn)2 1 ∂ w 1 (wn)2
n + =− + .
(u n)3 (u n)5 2 ∂uµ (u n)2 2 (u n)4

Portando la derivata rispetto a uµ fuori dall’integrale sugli angoli otteniamo,


Z ∞ Z µ 2 ¶
µ e2 ∂ w 1 (wn)2
∆P = ds dΩ + .
32π 2 −∞ ∂uµ (u n)2 2 (u n)4

Ci siamo dunque ricondotti al calcolo di un unico integrale. Possiamo semplificare ulte-


riormente l’integrando se notiamo l’identità,

(wn)2 nα nβ 1 ∂2 1
= wα wβ = w α w β ,
(u n)4 (u n)4 6 ∂uα ∂uβ (u n)2

e portiamo le derivate rispetto a uµ di nuovo fuori dal segno di integrale,


Z ∞ ·µ ¶Z ¸
µ e2 ∂ 2 1 ∂2 1
∆P = ds w + wα wβ dΩ .
32π 2 −∞ ∂uµ 12 ∂uα ∂uβ (u n)2

274
Abbiamo quindi ricondotto l’integrale al calcolo di qualche derivata e alla valutazione di
40
un unico integrale elementare ,
Z
1 4π
dΩ 2
= 2. (9.15)
(u n) u
Si ottiene, ·µ ¶ ¸
Z ∞
e2
µ ∂ 2 1 ∂2 1
∆P = ds w + wα wβ . (9.16)
8π −∞ ∂uµ 12 ∂uα ∂uβ u2
Il calcolo delle derivate è elementare e dà,
·µ ¶ ¸ µ ¶ 2 µ µ ¶
∂ 2 1 ∂2 1 2 2 w u 4 2 µ µ uw
w + wα wβ 2
= − 2u 2 3
+ u w − 4(uw)u
∂uµ 12 ∂uα ∂uβ u 3 (u ) 3 (u2 )4
4
= − w 2 uµ ,
3
dove nell’espressione finale, valida per qualsiasi u e w, abbiamo imposto i vincoli fisici
u2 = 1, u w = 0. La (9.16) si riduce quindi a,
Z
µ e2 ∞ 2 µ
∆P = − w u ds. (9.17)
6π −∞
Questo risultato quantifica il quadrimomento totale irradiato dalla particella lungo tutta
la traiettoria. Vediamo che esso risulta da una somma di contributi individuali, ciascuno
associato ad un istante d’emissione fissato s, dati da,

µ e2 2
∆Prad (s) = − w (s) uµ (s)∆s, (9.18)

che equivale in effetti alla (9.8).
Dopo questa deduzione possiamo affermare, con più precisione, che la generalizzazione
relativistica della formula di Larmor (9.8) rappresenta il quadrimomento che la particel-
la emette all’istante s e che raggiunge l’infinito. In effetti non possiamo affermare che
la (9.18) rappresenta tutto il quadrimomento emesso all’istante s, perché la particella
potrebbe emettere in quell’istante un quadrimomento addizionale,

µ
∆Padd = Gµ (s)∆s,
40
Questo integrale è a priori una funzione generica di u0 e di ~u. Tuttavia, per l’invarianza per rotazioni
tridimensionali esso può dipendere solo da u0 e |~u|, ma non dalla direzione di ~u, perché una rotazione
spaziale di ~u può essere compensata da un cambiamento delle variabili d’integrazione angolari nella (9.15).
È allora sufficiente calcolare l’integrale, per esempio, per uµ = (u0 , 0, 0, u3 ). Si ottiene,
Z Z π
1 senϑ dϑ 4π 4π
dΩ = 2π = 0 2 = 2.
(u n)2 0 (u0 − u3 cosϑ)2 (u ) − (u 3 )2 u

275
e riassorbirlo successivamente. Questi termini non darebbero, infatti, nessun contributo
al quadrimomento totale ∆P µ , se vale,
Z ∞
Gµ (s) ds = 0. (9.19)
−∞

In questo caso dovremmo allora concludere che la variazione istantanea del quadrimomen-
µ
dPrad
to della particella, dovuta all’emissione di radiazione, non eguaglia − ds
ma piuttosto,
µ
dPrad
− − Gµ .
ds

Nel capitolo 12 vedremo in effetti che il quadrivettore Gµ è diverso da zero.


Facciamo, infine, notare che l’interpretazione che abbiamo dato alla quantità (9.17) –
come la variazione del quadrimomento della particella tra lo stato iniziale e quello finale,
causata dell’irraggiamento – presuppone che il quadrimomento del campo elettromagne-
tico negli stati iniziale e finale sia lo stesso. Questa ipotesi verrà giustificata nel capitolo
13, dove faremo vedere che il quadrimomento (rinormalizzato) del campo elettromagne-
tico di una particella che si muove di moto rettilineo uniforme è in effetti nullo. Siccome
abbiamo supposto che la particella sia accelerata solo per un intervallo temporale finito,
il quadrimomento del campo negli stati iniziale e finale è quindi lo stesso, ovvero zero.

9.2 Perdita di energia negli acceleratori

In questa sezione applicheremo la formula (9.9) per valutare la perdita di energia negli
acceleratori ad alte energie. In questi casi le velocità delle particelle sfiorano quella della
luce, e l’approssimazione non relativistica non è più valida. Negli acceleratori il moto delle
particelle è determinato essenzialmente dai campi elettrici e magnetici presenti lungo la
traiettoria. Incominceremo quindi questa sezione derivando una formula per la potenza
emessa, nel caso in cui l’accelerazione della particella è dovuta a un generico campo elettro-
magnetico F µν esterno. Useremo poi questa formula per analizzare la portata degli effetti
radiativi negli acceleratori ultrarelativistici. Troveremo che mentre negli acceleratori li-
neari questi effetti sono completamente trascurabili, negli acceleratori circolari le perdite
di energia dovute all’irraggiamento possono diventare il fenomeno dinamico dominante –
a un punto tale da limitare in modo sostanziale le energie massime raggiungibili.

276
Supponiamo dunque di avere una particella carica che si muove sotto l’influenza
di un campo elettromagnetico F µν . Sappiamo allora che il suo moto è determinato
dall’equazione di Lorentz,
dpµ
= e F µν uν . (9.20)
ds
Questa equazione permette di esprimere la quadriaccelerazione,

1 dpµ
wµ = ,
m ds

in termini dei campi e della quadrivelocità, e possiamo usarla per esplicitare la formula
di Larmor relativistica (9.9). Otteniamo,
· ¯ ¯ 2 µ ¶2 ¸
e2 dpµ dpµ e2 1 ¯ d~p ¯
W=− = ¯ ¯ − dε .
6πm2 ds ds 6πm2 1 − v 2 ¯ dt ¯ dt

Usando l’equazione di Lorentz in notazione tridimensionale, vedi (2.19) e (2.20), si ottiene


in definitiva,
~ + ~v × B|
e 4 |E ~ 2 − (~v · E)
~ 2
W= . (9.21)
6πm2 1 − v2
Questa formula fornisce dunque la potenza istantanea, in termini dei campi esterni valuta-
ti lungo la traiettoria ~y (t) della particella, per determinare la quale bisognerebbe risolvere,
a sua volta, l’equazione di Lorentz. La (9.21) risulta quindi particolarmente utile quando
quest’ultima può essere risolta esattamente, come per esempio nel caso di campi costanti
e uniformi. Occorre, tuttavia, tenere presente che procedendo in questo modo si trascura
l’effetto della perdita di energia sulla forma della traiettoria, ovverosia la forza di frena-
mento. L’attendibilità del risultato deve quindi essere accertata a posteriori, verificando
che il valore di W fornito dalla (9.21) è piccolo, rispetto alla potenza Wex somministrata
alla particella dai campi esterni.
Concludiamo queste considerazioni introduttive con un’osservazione di carattere ge-
nerale, riguardante la fisica degli acceleratori. A questo scopo riscriviamo la (9.21) in
termini dell’energia ε della particella,

e 4 ε2 ³ ~ ~ 2 − (~v · E)
´
~ 2 .
W= | E + ~
v × B|
6πm4

Dalle potenze di m che compaiono a denominatore si vede allora che a parità di campi
acceleranti e di energia raggiunta, nel caso ultrarelativistico una particella leggera irradia

277
molto di più di una particella pesante. Questo segue essenzialmente dal fatto che a
parità di forza applicata, una particella leggera subisce un’accelerazione maggiore di una
particella pesante. Si conclude che dal punto di vista della dissipazione di energia per
irraggiamento, gli acceleratori di protoni, come LHC, sono molto più convenienti degli
acceleratori di elettroni e positroni, come LEP, in quanto mp ≈ 2000 me .

9.2.1 Acceleratori lineari

Applichiamo ora la (9.21) per analizzare la rilevanza della perdita di energia per irraggia-
mento negli acceleratori lineari. In questi acceleratori le particelle sono sottoposte ad un
~ parallelo al loro moto, diciamo lungo l’asse x, e l’equazione di Lorentz
campo elettrico E
dà allora,

Wex = = e v E.
dt
~ = 0, otteniamo,
D’altra parte, ponendo nella (9.21) B

e4
W= E 2. (9.22)
6πm2
Notiamo che questa formula sembra in conflitto con l’espressione di Wk calcolata nella
1
(9.10), in quanto sono scomparsi i fattori relativistici √ . Tuttavia, dall’equazione
1 − v2
di Lorentz per un moto unidimensionale,
µ ¶
d v
m √ = e E,
dt 1 − v2
è immediato dedurre che si ha, vedi problema 2.10,

dv ³√ ´3 eE
a= = 1 − v2 ,
dt m
e le due formule combaciano. Per valutare la rilevanza di (9.22) rapportiamo la potenza
emessa alla potenza fornita dal campo esterno,

W e3 E 2 r0 dε
= 2
= , (9.23)
Wex 6πm v 3 m v dx
dove,
dε 1 dε
= = eE,
dx v dt
rappresenta l’energia fornita dal campo esterno per unità di spazio percorso, ed r0 =
e2 /4πm è il raggio classico della particella. Per velocità elevate, v ≈ 1, avremmo quindi

278
che la perdita di energia per irraggiamento è rilevante solo in presenza di campi esterni
cosı̀ intensi, da fornire alla particella un’energia dell’ordine di grandezze della sua massa,
mentre essa percorre uno spazio dell’ordine di grandezza del suo raggio classico. Ma
in pratica i campi elettrici che si riescono a produrre sperimentalmente sono molto più
piccoli, e non superano il valore E ≈ 100 M V /m, per cui,


≈ 100 M eV /m.
dx

Il rapporto (9.23) è comunque massimo per la particella carica più leggera, ovvero l’elet-
trone, per cui m = 0.5 M eV e r0 = 3 · 10−13 cm, e si otterrebbe,

W
≈ 4 · 10−13 ,
Wex

mentre per il protone questo rapporto sarebbe ancora più piccolo, dell’ordine di 10−19 .
Concludiamo quindi che negli acceleratori lineari ad alta energia il fenomeno dell’irrag-
giamento è completamente trascurabile.

9.2.2 Acceleratori circolari

In un acceleratore circolare – o ciclotrone – una particella carica compie un moto circolare


uniforme sotto l’influenza di un campo magnetico B costante e uniforme. L’equazione di
Lorentz diventa allora,
d~u ³e √ ´
= ~u × ~ ,
1 − v2 B
dt m
da cui si ricava la frequenza relativistica di ciclotrone,

eB√ eB
ω0 = 1 − v2 = . (9.24)
m ε
~ = 0 e la (9.21) dà,
In questo caso abbiamo E

e4 v 2 B 2 e2 v 2 ω02
W= = , (9.25)
6πm2 1 − v 2 6π (1 − v 2 )2

da confrontare con la potenza non relativistica di Larmor,

e2 a2 veB
Wn.r. = , a= .
6π m

Per esaminare la rilevanza degli effetti dell’irraggiamento negli acceleratori circolari, cal-
coliamo l’energia ∆ε emessa durante un ciclo. Indicando il raggio dell’orbita con R e

279
usando ω0 = v/R si ha,

2πR e2 v3 e2 v 3 4
∆ε = W= = ε,
v 3R (1 − v 2 )2 3R m4

dove abbiamo introdotto l’energia ε della particella. Per particelle ultrarelativistiche


poniamo v ≈ 1 nel numeratore, e otteniamo cosı̀ l’importante formula per l’irraggiamento
nei ciclotroni ultrarelativistici,
e2 ³ ε ´4
∆ε = . (9.26)
3R m
Questa formula impone, infatti, forti restrizioni sulle caratteristiche tecniche degli acce-
leratori circolari realizzabili in pratica. Vediamo in particolare che a parità di energia
accumulata, l’effetto dell’irraggiamento è minore se si scelgono orbite grandi e particelle
pesanti.
Esempi di ciclotroni ad alta energia. Dato che in un acceleratore circolare la perdita
di energia (9.26) è inevitabile, se si vogliono mantere le particelle in orbita ad energia
costante, lungo l’anello di accumulazione devono essere disposti dei campi elettrici accele-
ranti – delle cosiddette cavità a radiofrequenza – che compensano questa perdita. A titolo
di esempio valutiamo l’energia dissipata nel sincrotrone di elettroni di Cornell, che era at-
tivo dal 1968 al 1979. Questo acceleratore raggiungeva energie dell’ordine di ε = 10 GeV ,
ed aveva un raggio R = 100 m. La (9.26) dà allora,

∆ε
∆ε = 8.9 · M eV, ≈ 10−3 ,
ε

mentre le cavità risonanti erano capaci di fornire un’energia di 10.5 M eV per ciclo. Ad
un’energia di 10 GeV l’acceleratore funzionava dunque al limite delle sue possibilità.
Come secondo esempio consideriamo l’acceleratore circolare LEP presso il CERN di
Ginevra, che accumulava elettroni e positroni. In questo caso il raggio è di circa R =
4.3 km, e l’energia massima raggiunta per elettrone era di circa 100 GeV . Si ottiene,

∆ε ≈ 2 GeV,

che significa una perdita di energia del 2% per ogni ciclo. Dato che in un secondo le
particelle compiono circa 11.000 cicli, in assenza di cavità a radiofrequenza tutta l’energia
accumulata si sarebbe quindi dispersa nella frazione di un secondo.

280
Infine consideriamo l’acceleratore LHC del CERN, che prevede la collisione tra due
fasci di protoni di energia ε = 7 T eV . Grazie al fatto che la massa di un protone è circa
duemila volte quella di un elettrone, la (9.26) dà per la perdita di energia in un ciclo il
valore molto piccolo,
∆ε ≈ 3 keV.

Ne segue che,
∆ε
≈ 0.5 · 10−9 ,
ε
ed è immediato vedere che nell’arco di un’ora l’energia dei protoni diminuisce solo del 2%.

9.3 Distribuzione angolare nel limite ultrarelativistico

In questo paragrafo effettuiamo un’analisi qualitativa della distribuzione angolare della


radiazione emessa da una particella ultrarelativistica.
Prima di procedere ricordiamo le caratteristiche della distribuzione angolare della ra-
diazione di una particella non relativistica, v ¿ 1. In questo caso avevamo ottenuto, vedi
(7.46),
dW e2 |~n × ~a|2 e2
= 2
= 2
|~a|2 sen2 ϑ, (9.27)
dΩ 16 π 16 π
dove ϑ è l’angolo tra ~a e ~n. In questo limite la potenza emessa ha quindi una distribu-
zione angolare “continua”, con un massimo nel piano ortogonale all’accelerazione, ed uno
zero lungo la direzione dell’accelerazione. In particolare essa risulta indipendente dalla
direzione della velocità della particella. Vedremo ora che nel limite ultrarelativistico la
natura della distribuzione angolare cambia drasticamente.
Riprendiamo dunque la formula generale per la distribuzione angolare (7.17),

dW ~ 2,
= r2 |E|
dΩ

e inseriamo il campo elettrico asintotico (9.2). Risulta l’espressione,

dW e2 |~n × [(~n − ~v ) × ~a]|2


= , (9.28)
dΩ 16 π 2 (1 − ~v · ~n)6

che è valida per velocità arbitrarie. Per v → 0 essa si riduce evidentemente alla (9.27),
ma per v ∼ 1 il suo andamento è determinato dalla presenza delle potenze del fattore

281
1
. Per velocità non relativistiche questo fattore è prossimo all’unità, in qualsiasi
1 − ~v · ~n
direzione, ma per velocità elevate esso diventa molto grande lungo la direzione di volo
della particella. Per ~n = ~v /v si ha infatti,

1 1
= .
1 − ~v · ~n 1−v

Per analizzare l’effetto di questi termini più in dettaglio riscriviamo la (9.28) come pro-
dotto di due fattori,
¯ ¯2
dW e2 ¯¯ ~n × [(~n − ~v ) × ~a] ¯¯ 1
= 2 ¯ ¯ · , (9.29)
dΩ 16 π (1 − ~v · ~n) (1 − ~v · ~n)4

e distinguiamo i seguenti due casi.


Velocità e accelerazione generiche. Consideriamo un istante in cui la velocità e l’acce-
lerazione formano un generico angolo diverso da zero. Per ~n = ~v /v abbiamo,

~n − ~v
= ~n, (9.30)
1 − ~v · ~n
41
e quindi lungo la direzione di volo il primo fattore della (9.29) si riduce a ,
¯ ¯
¯ ~n × [(~n − ~v ) × ~a] ¯2
¯ ¯ = |~n × ~a|2 ,
¯ (1 − ~v · ~n) ¯

che è indipendente dalla velocità. D’altra parte, il secondo fattore della (9.29) lungo la
direzione di volo diventa 1/(1 − v)4 , che per v ∼ 1 è molto grande. Concludiamo quindi
che una particella ultrarelativistica in moto generico emette radiazione principalmente “in
avanti”, lungo la direzione del moto.
Possiamo stimare l’apertura angolare α del cono centrato in ~v , all’interno del qua-
le viene emessa la maggior parte della radiazione. Le direzioni ~n in questione devono
soddisfare,
1 − ~v · ~n ∼ 1 − v, (9.31)
41
Un’analisi più accurata mostra che per qualsiasi ~n vale,
¯ ¯
¯ ~n − ~v ¯
1≤¯ ¯ ¯≤ √ 1 ,
1 − ~v · ~n ¯ 1 − v2
dove, se α è l’angolo tra ~v e ~n, l’estremo
√ inferiore viene raggiunto per α = 0 e α = π, mentre l’estremo
superiore si raggiunge per sen α = 1 − v 2√ . In realtà, quindi, per v ∼ 1 anche il vettore (~n −~v )/(1 −~v ·~n)
diventa molto grande, nella direzione α ≈ 1 − v 2 , sicché la (9.30) equivale a una stima per difetto.

282
1
di modo tale che il valore del fattore della (9.29) si mantenga vicino al suo
(1 − ~v · ~n)4
1
massimo . Indicando l’angolo tra ~n e ~v con α, e sfruttando il fatto che questo
(1 − v)4
angolo è piccolo, abbiamo,
µ ¶
α2 α2
1 − ~v · ~n = 1 − v cosα ∼ 1 − v 1 − ∼1−v+ .
2 2

Se vogliamo che valga la (9.31) dobbiamo dunque avere α ∼ 1 − v, oppure, che è lo
stesso,

α∼ 1 − v2. (9.32)

In conclusione, una particella ultrarelativistica in moto generico, irradia principalmente


lungo la direzione di volo, e la maggior parte della radiazione è contenuta nel cono centrato

in ~v di apertura angolare α ∼ 1 − v 2 .
Velocità parallela all’accelerazione. Un caso speciale è rappresentato dalle orbite ret-
tilinee, vedi paragrafo 9.2.1, per cui ~a k ~v . Per tali orbite la (9.29) si riduce a,

dW e2 |~n × ~a|2 e2 a2 sen2 α


= = ,
dΩ 16 π 2 (1 − ~v · ~n)6 16 π 2 (1 − v cosα)6

dove α è di nuovo l’angolo tra ~n e ~v . In questo caso si vede che la particella non emette
dW
radiazione lungo la direzione di volo, perché si annulla in α = 0. Tuttavia, dalla
dΩ
dW
formula appena scritta è facile vedere che nel limite ultrarelativistico, ha un massimo
√ dΩ
molto pronunciato per α ∼ 1 − v 2 , vedi problema 9.2. Anche in questo caso la maggior
parte della radiazione viene quindi emessa all’interno del cono centrato in ~v e di apertura

∼ 1 − v2.
Da queste considerazioni di carattere generale segue, per esempio, che un elettrone
ultrarelativistico in un ciclotrone emette radiazione principalmente nel piano dell’orbita,
attraverso un lampo spiraleggiante di tipo “pulsar”. Si noti che questa distribuzione
angolare della radiazione è radicalmente diversa da quella emessa da un ciclotrone non
relativistico, vedi problema 7.1.
Energia osservata ed energia emessa. Concludiamo questa sezione con un commen-
to sull’interpretazione della formula generale (9.28). Come osservato varie volte questa
espressione fornisce la distribuzione angolare dell’energia della radiazione che a un istante

283
fissato t attraversa la sfera di raggio r nell’unità di tempo. Sappiamo poi che questa
radiazione proviene dalla posizione della particella all’istante ritardato t0 dato dalla (9.4),

t = t0 + r − ~n · ~y (t0 ).

Se si vuole invece determinare la distribuzione angolare dell’energia emessa dalla particella


tra gli istanti τ1 e τ2 bisogna considerare l’espressione,
Z τ2 +r−~n·~y(τ2 ) Z τ2
dε dW dW
= dt = (1 − ~n · ~v ) dt0 ,
dΩ τ1 +r−~ y (τ1 ) dΩ
n·~ τ1 dΩ

dove abbiamo usato la (9.5). La potenza emessa dalla particella nell’unità dt0 del suo
tempo di accelerazione è allora data da,
dW 0 dt dW dW
= 0 = (1 − ~n · ~v ) . (9.33)
dΩ dt dΩ dΩ
dW dW 0
rappresenta l’energia osservata da un osservatore lontano, mentre rappresenta
dΩ dΩ
l’energia emessa dalla particella. Per capire meglio il significato fisico della relazione
(9.33) tra queste due grandezze, conviene considerare l’energia W 0 emessa dalla particella
nell’unità di tempo proprio ds,
dW 0 dt0 dW 0 1 dW 0 1 − ~n · ~v dW
= =√ = √ ,
dΩ ds dΩ 1 − v 2 dΩ 1 − v 2 dΩ
ovvero, √
dW 1 − v 2 dW 0
= .
dΩ 1 − ~n · ~v dΩ
In questa formula riconosciamo il fattore di proporzionalità dell’effetto Doppler, vedi
sezione 5.4, che connette giustappunto la frequenza – e quindi l’energia – della radiazione
emessa da una sorgente in moto, alla frequenza della radiazione rivelata da un osservatore
statico.
È comunque immediato riconoscere che la presenza del fattore (1 − ~n · ~v ) nella (9.33),
non cambia i risultati dell’analisi qualitativa della distribuzione angolare ultrarelativistica
di cui sopra.

9.4 Problemi

9.1 Si dimostri che l’energia totale irradiata da una particella ultrarelativistica con carica
e, massa m e velocità v0 , che passa con parametro d’impatto b grande accanto a un nucleo

284
di carica Ze, considerato fisso, vale,

e6 Z 2 1 − v02 /4
∆ε(v0 , b) = .
192π 2 m2 b3 v0 1 − v02

Si confronti il risultato con quello del problema 7.5. [Sugg.: Dato che v0 ≈ 1 e b è
grande, la particella praticamente non viene deviata e si può assumere che la traiettoria
sia pressochè rettilinea, ovvero ~y (t) = (v0 t, b, 0).]

9.2 Un’onda piana polarizzata circolarmente, con campo elettrico dato da,

~ ~x) = (E0 cos(ω(t − z)), E0 sen(ω(t − z)), 0),


E(t,

investe una particella carica relativistica.


a) Si dimostri che i moti stazionari della particella sono moti circolari uniformi, determi-
nandone velocità e raggio.
b) Per questi moti si determini la potenza totale irradiata dalla particella.

9.3 Si analizzi la distribuzione angolare della radiazione emessa da una particella ultrare-
lativistica in moto rettilineo, individuando in particolare le direzioni di emissione massima
e minima, e la si confronti con la distribuzione angolare del limite non relativistico.

285
10 Analisi spettrale

Nei capitoli precedenti abbiamo fornito gli strumenti principali per un’analisi sistematica
del contenuto energetico della radiazione emessa da un generico sistema carico. Abbiamo
in particolare derivato formule esplicite per l’energia emessa nell’unità di tempo, e per la
distribuzione angolare della radiazione. Per alcuni sistemi siamo anche stati in grado di
determinare le frequenze su cui essi emettono. Abbiamo visto, per esempio, che l’antenna
lineare emette tutta la radiazione sulla frequenza fondamentale, mentre nel moto circolare
uniforme la radiazione di dipolo contiene la frequenza fondamentale, e la radiazione di
quadrupolo la prima armonica superiore, vedi problema 7.6. In generale la radiazione
emessa da sistemi relativistici è distribuita su un’ampia banda di frequenze, e molti sistemi
fisici – da un semplice atomo a una pulsar – sono difatti identificabili attraverso il loro
spettro di emissione.
La grandezza osservabile rilevante è la quantità di energia che viene emessa tra le
frequenze ω e ω + ∆ω, osservabile che quantifica il peso con cui le varie frequenze sono
presenti nella radiazione emessa dal sistema. Lo studio di questa grandezza viene chiamato
“analisi spettrale”, o anche “analisi in frequenza”. In questo capitolo presenteremo un
approccio sistematico all’analisi spettrale, valido per la radiazione di un sistema carico
arbitrario. Nella prima sezione presenteremo gli strumenti fondamentali dell’approccio,
in sezione 10.2 applicheremo questi strumenti a sistemi non relativistici, e in sezione 10.3
li applicheremo a sistemi relativistici.

10.1 Analisi di Fourier e risultati generali

Abbiamo visto che la soluzione generale delle equazioni di Maxwell nel vuoto corrisponde
a una sovrapposizione di onde piane monocromatiche, e che l’analisi temporale di Fourier
del campo elettromagnetico risultante equivale a un’analisi in frequenza, vedi (5.60).
Corrispondentemente nel paragrafo 7.1.2 abbiamo visto che anche il campo elettro-
magnetico prodotto da una generica corrente nella zona delle onde è sovrapposizione di
onde elementari, e che il campo risultante ammette un’analisi di Fourier temporale, che
equivale ancora a un’analisi in frequenza. È possibile esprimere la trasformata di Fourier
del campo elettrico nella zona delle onde, direttamente in termini della generica sorgente

286
j µ data in (7.2). Per fare questo è sufficiente inserire la (7.2) nella (7.9), e usare la (7.11).
Si trova,
Z ∞
~ ~x) = √1
E(t, ~
dω eiωt E(ω, ~x),
2π −∞

dove,
−i ωr Z h i
~ iωe
E(ω, ~x) ≡ − d3 y ei ω ~n· ~y ~j(ω, ~y ) − (~n · ~j(ω, ~y )) ~n . (10.1)
4πr
Come visto nel paragrafo 7.1.2, se la corrente è periodica nel tempo anche il campo
elettrico è periodico, e la trasformata di Fourier può allora essere sostituita da una serie
di Fourier, ed è immediato adattare le relazioni appena scritte a questo caso particolare.
Per una corrente generica j µ l’analisi spettrale potrebbe essere basata sulla formula
generale (10.1), ma siccome in questo capitolo siamo interessati principalmente alla ra-
diazione emessa da una singola particella, preferiamo procedere in altro modo. L’analisi
spettrale per una corrente generica verrà sviluppata nella sezione 10.5.
Dalle considerazioni appena svolte concludiamo comunque che per correnti aperiodiche
possiamo porre,
Z ∞
~ 1 ~
E(t) = √ dω eiωt E(ω), (10.2)
2π −∞
Z ∞
~ 1 ~
E(ω) = √ dt e−iωt E(t), (10.3)

Z ∞ Z ∞ −∞ Z ∞
~ 2
|E(t)| dt = ~ 2
|E(ω)| dω = 2 ~
|E(ω)| 2
dω, (10.4)
−∞ −∞ 0

dove l’ultima riga rappresenta l’identità di Parseval. Se la corrente è invece periodica, con
periodo T e frequenza fondamentale ω0 = 2π/T , il campo elettrico può essere sviluppato
in serie di Fourier,

X
~
E(t) = ~N ,
eiN ω0 t E (10.5)
N =−∞
Z T
~N = 1 ~ dt,
E e−iN ω0 t E(t) (10.6)
T 0
Z T X∞ X∞
1 ~ 2 ~ N |2 = 2 ~ N |2 .
|E(t)| dt = |E |E (10.7)
T 0 N =−∞ N =1

Per scrivere l’ultima espressione in ciascun caso abbiamo sfruttato il fatto che il campo
elettrico è reale, quindi,

~ ∗ (ω) = E(−ω),
E ~ ~N
E ∗ ~ −N ,
=E

287
e che le frequenze vengono considerate positive. Inoltre, nella serie di Fourier abbiamo
omesso il termine con N = 0. Il campo elettrico è, infatti, proporzionale alla derivata
temporale del potenziale vettore, vedi (7.11),

~ ∂ ³ ´
~ ,
E(t) = ~n × (~n × A)
∂t
~ è periodico, la (10.6) dà,
e siccome anche A
Z T
~0 = 1
E ~ dt = 0.
E(t)
T 0

~
Facciamo notare che tutte le quantità indicate con E(·) andrebbero scritte più corretta-
~ ~x), ma per non appesantire la notazione omettiamo di indicare esplici-
mente come E(·,
tamente la dipendenza da ~x. Dalla (10.1) vediamo, comunque, che E(ω, ~ ~x) dipende da r
−i ωr
e ~
semplicemente attraverso il fattore . La grandezza E(ω, ~x) è quindi essenzialmente
r
una funzione di ω e della direzione ~n. Ricordiamo ancora che quı̀ non stiamo considerando
il campo elettrico esatto, ma il campo nella zona delle onde.
Riprendiamo dunque la formula generale per la distribuzione angolare della potenza
emessa,
dW d 2ε ~
= = r2 |E(t)| 2
.
dΩ dt dΩ
Sistemi aperiodici. Per una corrente aperiodica la grandezza fisica rilevante è l’energia
totale emessa nell’unità di angolo solido tra t = −∞ e t = ∞. Se le particelle sono
sottoposte a forze per un tempo limitato, l’accelerazione ha una durata finita, e anche
l’energia totale emessa sarà, quindi, finita. Utilizzando la (10.4) si ottiene allora,
Z ∞ Z ∞ Z ∞
dε dW ~ ~
= dt = r2 |E(t)| 2
dt = 2r 2
|E(ω)| 2
dω.
dΩ −∞ dΩ −∞ 0

L’energia emessa nell’intervallo unitario di frequenze e nell’unità di angolo solido è quindi


data da,
d 2ε ~
= 2r2 |E(ω)| 2
, (10.8)
dω dΩ
e lo spettro di frequenze presenti è in generale un sottoinsieme “continuo” di R+ .
Sistemi periodici. Per una corrente periodica l’energia totale emessa è infinita, e la
grandezza di rilievo è allora la potenza media, ovvero, l’energia emessa durante un periodo

288
divisa il periodo. In questo caso utilizziamo la (10.7) e otteniamo,
Z T Z T ∞
X
dW 1 dW 1 ~ ~ N |2 .
= dt = r2 |E(t)| 2
dt = 2r2 |E (10.9)
dΩ T 0 dΩ T 0 N =1

La potenza della radiazione emessa con la frequenza ωN = N ω0 nell’unità di angolo solido,


è quindi data da,
dWN ~ N |2 .
= 2r2 |E (10.10)
dΩ
Le formule (10.8) e (10.10) costituiscono il punto di partenza per l’analisi spettrale di un
generico fenomeno radiativo. Si noti che esse richiedono solo la conoscenza del campo
elettrico – nella zona delle onde.

10.2 Analisi spettrale nel limite non relativistico

Nel limite non relativistico le (10.8) e (10.10) possono essere valutate immediatamente,
perché in questo caso il campo elettrico è dato semplicemente in termini del momento di
dipolo del sistema, vedi (7.39),

1 ³ ´
~
E(t) = ~¨ − r) .
~n × ~n × D(t (10.11)
4πr

Trattiamo separatamente i due tipi di corrente.


~
Corrente aperiodica. Definendo la trasformata di Fourier di D(t) in modo standard,
Z ∞
~ 1 ~
D(ω) =√ dt e−iωt D(t), (10.12)
2π −∞

dalla (10.11) segue facilmente, si confronti con (10.1),

ω 2 e−i ω r ³ ´
~
E(ω) =− ~
~n × ~n × D(ω) .
4πr

La (10.8) dà quindi,


d 2ε ω 4 ¯¯ ~
¯2
¯
= 2 ¯~n × D(ω)¯ . (10.13)
dω dΩ 8π
Integrando sugli angoli risulta poi,

dε ω4 ~
= |D(ω)|2 . (10.14)
dω 3π
R∞ dε
Infine l’integrale 0 dω
dω fornisce l’energia totale emessa.

289
Frequenze caratteristiche: analisi qualitativa. Consideriamo ora come caso particolare
una particella non relativistica che esegue un moto aperiodico. Dato che il suo momento
~
di dipolo è D(t) ~¨
= e ~y (t), abbiamo D(t) = e ~a(t), e la trasformata di Fourier di questa
~
relazione dà −ω 2 D(ω) = e ~a(ω), dove ~a(ω) indica la trasformata di Fourier di ~a(t). La
(10.14) fornisce allora la distribuzione in frequenza,
dε e2
= |~a(ω)|2 . (10.15)
dω 3π
Supponiamo ora che la forza F~ (t) agente sulla particella sia caratterizzata da un tempo
F~(t)
caratteristico T . Dato che ~a(t) = , per le proprietà della trasformata di Fourier
m
possiamo allora concludere che |~a(ω)| è una funzione apprezzabilmente non nulla solo per
1
valori di ω che si estendono circa fino a . Vale allora il seguente risultato generale circa
T
la distribuzione spettrale della radiazione emessa da una particella non relativistica in
moto aperiodico: se la forza alla quale è sottoposta la particella varia su scale temporali
dell’ordine di T , allora la radiazione emessa è concentrata principalmente in un intervallo
di frequenze limitato superiormente da,
1
ω∼ . (10.16)
T
Corrente periodica. Per una corrente periodica definiamo i coefficienti di Fourier,
Z T
~N = 1 ~ dt,
D e−iN ω0 t D(t) (10.17)
T 0
e dalla (10.11) segue allora,
2 −i N ω0 r ³ ´
~ N = − (N ω0 ) e
E ~N .
~n × ~n × D
4πr
La (10.10) dà quindi,
dWN (N ω0 )4 ¯¯ ~
¯2
¯
= 2
¯~n × DN ¯ . (10.18)
dΩ 8π
Integrando sugli angoli risulta poi,
(N ω0 )4 ~ 2
WN = |D N | . (10.19)

P∞
Infine la somma N =1 WN uguaglia la potenza totale media W.
Per quanto riguarda le frequenze dominanti, per i moti periodici vale un risultato simile
a quello visto per i moti aperiodici. Se la scala temporale su cui varia la forza esterna

290
è dell’ordine del periodo, allora il sistema emette principalmente sulle prime armoniche
superiori, cioè, sulle frequenze,
ωN = N ω 0 ,

con N dell’ordine dell’unità. Questo risultato è illustrato nell’esempio del paragrafo 10.2.2.
Moti armonici semplici. Consideriamo un sistema di particelle che compiono moti
armonici semplici, µ ¶ µ ¶
2π 2π
~yr (t) = ~br sen t + ~cr cos t ,
T T
con lo stesso periodo T . Esempi di moti di questo tipo sono i moti circolari uniformi,
e i moti di oscillazione sinusoidale in una direzione. Un tale sistema emette radiazione

sclusivamente sulla frequenza fondamentale ω0 = . Infatti, in questo caso la relazione
P T

D(t) = r er ~ar (t) dà,
X
2 ~
−ωN DN = er ~arN ,
r

dove ~arN indica il coefficiente di Fourier N –esimo di ~ar (t). Ma siccome per un moto
armonico semplice si ha ~arN = 0 per N 6= 1, nella (10.19) solo il termine W1 è allora
diverso da zero.
Insistiamo sul fatto che i risultati qualitativi di questo paragrafo valgono nel limite
non relativistico.

10.2.1 Bremsstrahlung a spettro continuo e catastrofe infrarossa

In questo paragrafo vogliamo illustrare i risultati del paragrafo precedente, nel caso di
una particella non relativistica che viene accelerata da un campo elettrico esterno.
Per essere precisi consideriamo una particella carica che attraversa una regione limitata
in cui esiste un campo elettrico costante e uniforme. L’accelerazione è allora diversa
da zero solo per un periodo limitato, e la particella compie un moto aperiodico. Di
conseguenza essa emette radiazione – Bremsstrahlung – a spettro continuo. Vogliamo
determinare la forma dello spettro di emissione, e individuare in particolare le frequenze
su cui la particella emette maggiormente. Confronteremo poi i risultati ottenuti con la
previsione fatta nella (10.16).
Senza perdita di generalità possiamo supporre che la particella entri nella zona del
campo elettrico all’istante t = −T , e che esca da questa zona all’istante t = T . In questo

291
intervallo temporale la sua accelerazione vale allora,
~
eE
~a = ,
m

mentre fuori dall’intervallo essa è zero. La (10.15) richiede allora di valutare la trasformata
di Fourier,
Z ∞ ~ 1 Z T ~ sen(ωT )
1 −iωt eE 2eE
~a (ω) = √ dt e ~a(t) = √ dt e−iωt = √ .
2π −∞ m 2π −T 2π m ω

La (10.15) dà allora,


dε 2 e2 a2 sen2 (ωT )
= . (10.20)
dω 3π 2 ω2
π
Questa funzione ha un massimo per ω = 0, e si annulla la prima volta per ω = . Oltre
T
questo valore essa va rapidamente a zero, in accordo con il risultato generale (10.16).
Possiamo anche valutare l’energia totale emessa durante l’intera fase di accelerazione.
Per fare questo possiamo integrare la (10.20) su tutte le frequenze, usando l’integrale,
Z ∞ ³ sen x ´2 π
dx = ,
0 x 2

oppure possiamo applicare la formula di Larmor W = e2 a2 /6π. Si ottiene,


Z ∞ Z T
dε e2 a2 T e2 |∆~v |2
∆ε = dω = W dt = = , (10.21)
0 dω −T 3π 12 π T

dove abbiamo introdotto la differenza tra le velocità iniziale e finale,

∆~v ≡ ~vf − ~vi = 2 T~a.

Abbiamo quindi trovato un legame diretto tra l’energia irradiata, e la variazione della
velocità della particella – causa della radiazione. Vediamo ora come si comporta la di-
stribuzione spettrale nel limite in cui la durata del processo va a zero, T → 0, a parità di
∆~v . Dalla (10.20) segue,

dε e2 |∆~v |2 sen2 (ωT ) e2 |∆~v |2


= → ,
dω 6π 2 ω2T 2 6π 2

e si otterrebbe quindi uno spettro “piatto”, in cui tutte le frequenze sono equiprobabili,
ancora in accordo con la (10.16). D’altra parte in questo limite l’energia totale (10.21)
divergerebbe. Da ciò si desume che la schematizzazione dell’urto di una particella carica

292
come un processo istantaneo – usata spesso negli studi teorici, per via della sua semplicità
– è fisicamente inconsistente, perché l’energia emessa sarebbe infinita.
Catastrofe infrarossa. Concludiamo la discussione di questo esempio con un commento
su un fenomeno quantistico che viene chiamato “catastrofe infrarossa”. Abbiamo appena
visto che l’energia totale emessa durante il processo è finita. Teniamo ora in conto che
l’emissione di radiazione elettromagnetica di frequenza ω a livello quantistico corrisponde
42
all’emissione di fotoni con energia individuale ~ω . Possiamo allora chiederci quanti
fotoni vengono emessi nell’intervallo di frequenza ω e ω + dω, e la risposta è,
dN 1 dε 2 e2 a2 sen2 (ωT )
= = .
dω ~ω dω 3π 2 ~ ω3
Il numero di fotoni emessi tra le frequenze ω1 e ω2 è allora dato da,
Z ω2 Z
dN 2 e2 a2 ω2 sen2 (ωT )
N (ω1 , ω2 ) = dω = dω.
ω1 dω 3π 2 ~ ω1 ω3
Come si vede il numero di fotoni “duri”, cioè, di frequenza elevata, risulta finito in quanto
l’integrale N (ω, ∞) è finito. D’altra parte il numero di fotoni “soffici”, cioè, di frequenza
bassa, diverge perché per ω → 0 si ha,
sen2 (ωT ) T2
≈ ,
ω3 ω
e N (0, ω) diverge. Questo vuol dire che nonostante l’energia totale irradiata sia finita,
il numero di fotoni soffici emessi durante il processo di accelerazione è infinito. Questo
fenomeno fisico porta il nome di “catastrofe infrarossa”, in quanto legato alla presenza di
infiniti fotoni con energie tendenti a zero. So noti, tuttavia, che solo un numero finito di
questi fotoni è osservabile sperimentalmente, perché qualsiasi apparato di misura ha una
“sensibilità” finita, potendo rivelare solo i fotoni che hanno un’energia al di sopra di una
certa soglia ∆ε.
Dall’analisi svolta è chiaro che la catastrofe infrarossa è dovuta semplicemente all’ac-
celerazione della particella, indipendentemente dalla forza che la causa, e in particolare
essa accompagna allora qualsiasi processo d’urto che coinvolge particelle cariche. D’al-
tro canto questo fenomeno è legato strettamente al fatto che il mediatore dell’interazione
42
La nostra analisi classica della radiazione resta valida per lunghezze d’onda molto superiori alla
lunghezza d’onda Compton, λ À λC = ~/mc, cioè per ω ¿ mc2 /~, che vuol dire T À ~/mc2 ≈ 10−21 s.
L’analisi della catastrofe infrarossa svolta nel testo riguarda il caso ω → 0, per cui la trattazione classica
è comunque valida.

293
elettromagnetica – il fotone – essendo privo di massa può raggiungere energie ~ω arbi-
trariamente piccole. Concludiamo quindi che la catastrofe infrarossa non avviene nelle
interazioni deboli, i cui mediatori sono massivi, mentre è presente sia nelle interazioni
gravitazionali che in quelle forti. Notiamo, tuttavia, che nelle interazioni forti, per via del
fenomeno del confinamento, i gluoni soffici non si presentano come particelle “asintotiche”
libere, perché adronizzano in pochissimo tempo formando particelle massive.
Infine osserviamo che, essendo un fenomeno di basse energie, la catastrofe infrarossa
considerata quı̀ a livello classico, si ripresenta in teoria quantistica di campo dove causa
una seria di problemi, sia di carattere tecnico che concettuale, che in parte aspettano
tuttora di essere risolti – come per esempio in Cromodinamica Quantistica.

10.2.2 Bremsstrahlung a spettro discreto

Consideriamo una particella non relativistica che compie un moto periodico di periodo T
lungo un arco di circonferenza di raggio R, con legge oraria,

~y (t) = (R cosϕ(t), R senϕ(t), 0), ϕ(t) = ϕ0 sen(ω0 t), 0 < ϕ0 < π/2,

dove ω0 = 2π/T è la frequenza fondamentale, e ϕ0 è l’elongazione. Sappiamo allora che


questa particella emette radiazione con frequenze ωN = N ω0 . Vogliamo eseguire l’analisi
spettrale di questo sistema, cercando in particolare di individuare le frequenze su cui la
particella emette la maggior parte della radiazione.
Per la potenza totale mediata su un ciclo possiamo usare la formula di Larmor,

e2 2
W= a,

e un semplice conto fornisce,


µ ¶
e2 R2 ω04 1 2 3 4
W= ϕ + ϕ .
6π 2 0 8 0

Per calcolare la potenza che la particella emette sulla frequenza ωN = N ω0 , occorre


~
valutare i coefficienti di Fourier del momento di dipolo D(t) = e ~y (t),
Z T Z T
~N = 1
D dt e −i N ω0 t ~
D(t) =
eR
dt e−i N ω0 t (cosϕ(t), senϕ(t), 0). (10.22)
T 0 T 0

294
Funzioni di Bessel. Gli integrali di cui sopra possono essere espressi in termini delle
funzioni di Bessel di ordine intero N ,
Z 2π Z π
1 i(N x−y senx) 1
JN (y) = e dx = cos(N x − y senx)d x, (10.23)
2π 0 π 0

di cui elenchiamo ora qualche proprietà. Esse soddisfano,

JN (−y) = J−N (y) = (−)N JN (y). (10.24)

Si ha inoltre,
Z 2π
1 N
ei(N x−y senx) cosx dx = JN (y), (10.25)
2π 0 y
Z 2π
1
ei(N x−y senx) senx dx = i JN0 (y). (10.26)
2π 0

La prima discende dall’identità,


Z 2π
d i(N x−y senx)
e dx = 0,
0 dx

mentre la seconda è immediata. Si hanno poi gli andamenti asintotici,


r ³ ´
2 π
JN (y) ∼ cos y − (2N + 1) , per y → ∞, N fissato, (10.27)
πy 4
³
1 y ´ N
JN (y) ∼ , per y → 0, N fissato, (10.28)
N! 2
³
1 y N´
JN (y) ∼ , per N → ∞, y fissato. (10.29)
N! 2

Il coincidere degli ultimi due andamenti deve considerarsi una casualità.


La valutazione degli integrali nella (10.22) è allora immediata,
µ ¶
~N = eR 1
D JN (ϕ0 ) + JN (−ϕ0 ), (JN (ϕ0 ) − JN (−ϕ0 )), 0 .
2 i

Per la potenza irradiata sulla frequenza N –esima risulta in definitiva,

(N ω0 )4 ~ 2 e2 R2 (N ω0 )4 2
WN = |D N | = JN (ϕ0 ),
3π 3π

e il teorema di Parseval assicura poi che,



X
W= WN .
N =1

295
Cerchiamo ora di capire quali sono i WN che contribuiscono maggiormente a questa som-
ma. Per fare questo sfruttiamo gli andamenti asintotici delle funzioni di Bessel di cui
sopra. Per N grandi abbiamo,

WN N 4 J 2 (ϕ0 ) 1
= 1 2 N 3 4 ≈ 2N , (10.30)
W ϕ + 16 ϕ0
4 0
N

che vuol dire che le armoniche superiori sono comunque fortemente soppresse.
Possiamo considerare inoltre il caso di elongazioni ϕ0 piccoli, e di elongazioni del-
l’ordine dell’unità. Per ϕ0 piccoli possiamo rapportare la potenza emessa sull’armonica
fondamentale, alla potenza totale,

W1 J12 (ϕ0 ) ¡ ¢
= 1 2 3 4
= 1 − ϕ20 + o ϕ40 ,
W ϕ + 16 ϕ0
4 0

dove abbiamo utilizzato lo sviluppo

x x3
J1 (x) = − + o(x5 ). (10.31)
2 16

Per ϕ0 piccoli quasi tutta la potenza viene quindi emessa sull’armonica fondamentale. Ma
anche scegliendo elongazioni ϕ0 dell’ordine dell’unità, la situazione resta qualitativamente
la stessa. Per ϕ0 = 1, che corrisponde a un’elongazione di circa 60o , la (10.30) dà,

WN 16 4 2
= N JN (1),
W 7

e usando per JN (1) i valori tabulati si ricava,

W1 W1 + W2 W1 + W2 + W3
= 0.43, = 0.91, = 0.98.
W W W

Si vede che praticamente tutta l’energia viene emessa sulle prime armoniche più basse.

10.3 Analisi spettrale relativistica

In questa sezione ci occupiamo dello spettro di emissione di un generico sistema relativi-


stico. Nel primo paragrafo deriveremo la formula fondamentale per lo spettro di emissione
di una particella singola in moto arbitrario, vedi (10.40), (10.42), e nel paragrafo succes-
sivo useremo questa formula per determinare le frequenze caratteristiche della radiazione
emessa da una generica particella ultrarelativistica. Nella sezione 10.4 la applicheremo,

296
invece, per eseguire l’analisi spettrale quantitativa della radiazione emessa da una parti-
cella in un ciclotrone relativistico. Nella sezione 10.5 deriveremo, infine, un’espressione
per lo spettro di emissione di una corrente generica.

10.3.1 Spettro di emissione di una particella singola

In questo paragrafo vogliamo dunque derivare una formula per la distribuzione in fre-
quenza della radiazione emessa da una particella carica in moto arbitrario. Il risultato
darà l’energia emessa per unità di frequenza, in termini di un integrale semplice lungo la
traiettoria della particella.
Riprendiamo il campo elettrico asintotico di Lienard–Wiechert (9.2),

~ ~x) = e ~n × [(~n − ~v ) × ~a] .


E(t, (10.32)
4πr (1 − ~v · ~n)3
Per determinare la distribuzione in frequenza della radiazione dobbiamo inserire que-
sta formula rispettivamente nelle (10.3) e (10.6), e usare le (10.8) e (10.10). Di nuovo
trattiamo separatamente moti periodici e aperiodici.
Moto periodico. Per un moto periodico si tratta di valutare, per ogni ~x fissato, il
~ N (~x) ≡ E
coefficiente di Fourier E ~N ,
Z T
~N = 1
E ~ ~x).
dt e−iN ω0 t E(t, (10.33)
T 0

Prima di procedere dobbiamo ricordarci che le variabili ~v e ~a che compaiono nella (10.32)
non sono valutate all’istante t, ma all’istante ritardato t0 (t, ~x), dato dalla (9.4),

t = t0 + r − ~n · ~y (t0 ). (10.34)

Nell’integrale (10.33) conviene allora passare dalla variabile d’integrazione t alla variabile
t0 . Siccome ~x è tenuto fisso, la misura di integrazione cambia secondo la (9.5),

dt = (1 − ~n · ~v ) dt0 . (10.35)

Usando queste relazioni la (10.33) si scrive allora come un integrale lungo la traiettoria,
Z
~ e −iN ω0 r 1 T −iN ω0 (t0 −~n·~y(t0 )) ~n × [(~n − ~v ) × ~a] 0
EN = e e · dt , (10.36)
4πr T 0 (1 − ~v · ~n)2
Si noti che la (10.34) assicura che, se t corre lungo un periodo, anche t0 corre lungo un
periodo, perché la legge oraria ~y (t0 ) è periodica. L’integrale nella (10.36) è quindi di

297
nuovo tra 0 e T . Inserendo questa espressione nella (10.10), e chiamando la variabile
d’integrazione di nuovo t, si ottiene per la distribuzione angolare della potenza emessa
sulla frequenza ωN = N ω0 ,
¯ Z T ¯2
dWN e2 ¯1 ~
n × [(~
n − ~
v ) × ~
a ] ¯
= 2 ¯ e−i N ω0 (t−~
n ·~
y )
· dt ¯ . (10.37)
dΩ 8π ¯T (1 − ~v · ~n)2 ¯
0

Questa formula può essere ulteriormente semplificata, se si usano le identità,


· ¸
~n × [(~n − ~v ) × ~a] d ~n × (~n × ~v )
= , (10.38)
(1 − ~v · ~n)2 dt (1 − ~v · ~n)

d −i N ω0 (t−~n·~y)
e = −i N ω0 (1 − ~v · ~n) e−i N ω0 (t−~n·~y) . (10.39)
dt
Con un’integrazione per parti la (10.37) si riduce allora a,
¯ Z ¯2
dWN e2 (N ω0 )2 ¯¯ 1 T −i N ω0 (t−~n·~y) ¯
¯ ,
= ¯ ~
n × e ~
v dt ¯ (10.40)
dΩ 8π 2 T 0

dove abbiamo usato che |~n × (~n × V~ )| = |~n × V~ |, per qualsiasi vettore V~ .
Limite non relativistico. La (10.40) fornisce la distribuzione in frequenza della radia-
zione emessa da una particella con velocità arbitraria, nota la sua legge oraria ~y (t). È
immediato verificare che nel limite non relativistico questa formule si riduce alla (10.18),
ricavata nel paragrafo 10.2. In questo limite il termine ~n · ~y nell’esponente della (10.40)
d~y
è, infatti, trascurabile, e scrivendo ~v = , un’integrazione per parti muta la (10.40) in,
dt
¯ Z ¯2
dWN e2 (N ω0 )4 ¯¯ 1 T −i N ω0 t ¯
¯ .
≈ ¯ ~
n × e ~
y dt ¯
dΩ 8π 2 T 0
Questa espressione coincide con la (10.18), in quanto per una particella singola si ha,
Z T Z T
~N = 1 −i N ω0 ~
t e
D e D(t) dt = e−iN ω0 t ~y dt.
T 0 T 0
Moto aperiodico. Per un moto aperiodico si procede in modo del tutto analogo, par-
tendo dalle (10.8), (10.3) e (10.32), e si trova facilmente che al posto di (10.37) ora si
ottiene per la distribuzione in frequenza,
¯ Z ∞ ¯2
d 2ε e2 ¯¯ 1 −iω(t−~
n·~
y) ~n × [(~n − ~v ) × ~a] ¯¯
= 2 ¯√ e · dt¯ . (10.41)
dω dΩ 8π 2π −∞ (1 − ~v · ~n)2
Tuttavia, l’integrazione per parti basata sulle (10.38), (10.39), con l’identificazione N ω0 ↔
ω, non può essere eseguita in modo naiv nell’integrale presente nella (10.41). Il motivo

298
è che il termine al bordo dell’integrazione per parti è situato ora all’infinito temporale,
e l’integrando non ammette limite per t → ±∞, per la presenza dei fattori oscillanti
e−iω(t − ~n · ~y ) . Per ovviare a questa difficoltà tecnica conviene regolarizzare l’integrale
nella (10.41) introducendo un cut-off temporale L,
Z ∞ Z L
dt → dt,
−∞ −L

ed eseguire l’integrazione per parti per L finito. Per L → ∞ il termine al bordo ancora
non ammette limite, ma esso va a zero se questo limite viene eseguito nel senso delle
distribuzioni nella variabile ω. Questa procedura è quindi perfettamente lecita, purché
anche l’integrale improprio risultante vada considerato come limite nel senso delle distri-
buzioni. Con questo caveat è allora immediato vedere che le (10.38), (10.39) mutano la
(10.41) nell’espressione più semplice,
¯ Z ∞ ¯2
d 2ε e2 ω 2 ¯¯ 1 −i ω(t−~
n·~
y)
¯
¯ ,
= ¯ ~
n × √ e ~
v dt ¯ (10.42)
dω dΩ 8 π2 2π −∞
analoga alla (10.40).
Per illustrare come la (10.42) sia ben definita solo nel senso delle distribuzioni, verifi-
d 2ε
chiamo che per una particella in moto rettilineo uniforme, ~y (t) = ~v t, si ottiene = 0,
dω dΩ
in accordo con il fatto che una particella non accelerata non emette radiazione. Si noti
che in questo caso la (10.41), che è comunque ben definita, dà il risultato corretto, perché
~a(t) = 0 identicamente. Volendo usare la (10.42) si tratta, invece, di valutare l’integrale,
Z ∞ Z L
−i ωt(1−~
n·~v ) 0
e ~v dt ≡ S − lim e−i ωt(1−~n·~v) ~v dt.
−∞ L→∞ −L

Ricordando la rappresentazione della δ di Dirac,


Z L
0
S − lim e−ik x dk = 2π δ(x),
L→∞ −L

risulta dunque l’espressione ben definita nello spazio delle distribuzioni,


Z ∞
2π ~v
e−i ωt(1−~n·~v) ~v dt = δ(ω).
−∞ 1 − ~n · ~v
Tuttavia, nella (10.42) questo integrale appare moltiplicato per ω, e siccome ω δ(ω) = 0,
d 2ε
risulta in effetti = 0.
dω dΩ
Usando la (10.41), infine, è immediato vedere che nel limite non relativistico si riottiene
la (10.13).

299
10.3.2 Frequenze caratteristiche nel limite ultrarelativistico

Vogliamo ora eseguire un’analisi qualitativa dello spettro emesso da una generica particella
ultrarelativistica, v ∼ 1, in moto aperiodico. Ci chiediamo in particolare quali sono le
frequenze su cui una particella ultrarelativistica emette in generale la maggior parte della
radiazione. Ricordiamo che nel caso non relativistico la risposta a questa domanda è data
dalla (10.16), ovverosia, la particella emette la maggior parte della radiazione entro le
frequenze,
1
ω∼ , (10.43)
T
se T è la scala temporale sulla quale la forza varia sensibilmente.
Per analizzare la distribuzione in frequenza della radiazione emessa da una particella
ultrarelativistica, possiamo sfruttare il fatto che una particella che viaggia con velocità
molto elevata, devia poco dalla traiettoria rettilinea. L’angolo di scattering χ, che è
l’angolo tra la direzione incidente e quella uscente, sarà quindi molto piccolo, cosı̀ come
è piccola l’apertura angolare α del cono, entro il quale viene emessa la maggior parte

della radiazione. Dalla sezione 9.3 sappiamo, infatti, che vale α ∼ 1 − v 2 . Eseguiremo
l’analisi spettrale ultrarelativistica distinguendo i casi χ ¿ α, e α ¿ χ.
L’angolo di scattering χ. Per dare una stima dell’angolo di scattering, supponiamo che
la particella sia soggetta alla forza di Lorentz,

d~p ~ + ~v × B),
~ dε ~
= e(E = e ~v · E,
dt dt

e che i campi esterni siano sensibilmente diversi da zero solo in una regione spaziale
limitata, di dimensioni lineari L. Siccome la particella è ultrarelativistica, essa percepirà
dunque questi campi per una durata caratteristica T ∼ L. Per le variazioni della quantità
di moto e dell’energia tra lo stato iniziale e quello finale, otteniamo allora,
¯Z ∞ ¯ Z ∞
¯ ¯
¯
|∆~p| = e ¯ ~ ~ ¯
(E + ~v × B) dt¯ ∼ e F T, ∆ε = e ~ dt ∼ e F T,
~v · E (10.44)
−∞ −∞

dove abbiamo posto v ∼ 1, e indicato con F un valore caratteristico dei campi elettrico
e magnetico. Dato che la particella viene deflessa poco, l’angolo di scattering è dato dal
modulo della differenza tra i versori finale e iniziale, χ ∼ |~nf − ~ni |. Siccome abbiamo

300
p~
~v = , si ottiene allora,
ε
¯ ¯ ¯ µ ¶¯ ¯ µ ¶¯
¯ ~vf ~vi ¯ ¯ ~v ¯¯ ¯¯ p~ ¯¯
χ = ¯ − ¯¯ = ¯¯∆
¯ = ∆ ,
vf vi v ¯ ¯ |~p| ¯

dove ~vi e ~vf sono le velocità iniziale e finale. Dato che |~p| = ε2 − m2 , e quindi ∆|~p| =
ε ∆ε
∼ ∆ε, si ottiene,
|~p|
µ ¶ √
p~ ∆~p p~ ∆ε 1 − v2
∆ = − ∼ (∆~p − ~v ∆ε) .
|~p| |~p| |~p| 2 m

Usando le (10.44) risulta quindi la stima,



1 − v2
χ∼ e F T. (10.45)
m

Si ottiene allora,
χ eF T
∼ , (10.46)
α m
rapporto che è indipendente dalla velocità della particella, ma dipende solo dalle carat-
teristiche del campo esterno. La (10.46) può essere scritta anche come il rapporto tra la
eF 1
“frequenza di ciclotrone” non relativistica , vedi (9.24), e la frequenza di un moto
m T
aperiodo non relativistico, vedi (10.16),
µ ¶
eF
χ m
∼ µ ¶ . (10.47)
α 1
T

Frequenze caratteristiche per χ ¿ α. Consideriamo ora il caso in cui χ ¿ α. In questa


situazione la maggior parte della radiazione viene emessa all’interno del cono centrato in ~v
di apertura α, il cui asse durante il moto praticamente non cambia. Pertanto è sufficiente
analizzare la radiazione emessa nell’immediata vicinanza della direzione di ~v , e porre
quindi nella formula generale (10.41),

~v
~n ≈ , ~n − ~v ≈ (1 − v) ~n, ~y (t) ≈ ~v t.
v

Si ottiene cosı̀,
¯ Z ∞ ¯2
d2ε e2 ¯ ~n 1 ¯ e2
≈ 2 ¯ × √ e −iω t(1−v)
~
a (t) dt¯ ≈ |~n × ~a(ω(1 − v))|2 ,
dω dΩ 8π ¯1 − v 2π −∞ ¯ 8π 2 (1 − v)2

301
dove ~a(ω(1 − v)) è la trasformata di Fourier di ~a(t), calcolata in ω(1 − v). Dato che la
particella percepisce la forza esterna per un tempo limitato T , la sua accelerazione varia
sensibilmente sulla stessa scala temporale T . Per le proprietà della trasformata di Fourier
la funzione ~a(ω(1 − v)) è allora apprezzabilmente diversa da zero per valori di ω per cui
1
ω(1 − v) ∼ ω(1 − v 2 ) < . In termini dell’energia della particella la maggior parte della
T
radiazione viene quindi emessa entro le frequenze caratteristiche,

1 1 1 ³ ε ´2
ω∼ = , (10.48)
T 1 − v2 T m

da confrontare con la (10.43).


Se χ ¿ α, lo spettro di radiazione di una particella ultrarelativistica è quindi spostato
molto verso le frequenze alte. Da un punto di vista quantistico questo vuol dire che la
particella emette principalmente fotoni “duri”, cioè, molto energetici, mentre nel caso non
relativistico la particella emette fotoni molto più “soffici”, cioè, poco energetici
Frequenze caratteristiche per α ¿ χ. Se l’angolo di scattering è grande rispetto ad α,
la direzione di emissione cambia sensibilmente durante il moto, e la radiazione emessa in
una data direzione ~n proviene solo da quel piccolo arco della traiettoria, lungo il quale

la velocità della particella forma con ~n un angolo inferiore a α ∼ 1 − v 2 . Chiamando
∆x la lunghezza di questo arco, e ricordando che durante l’intero percorso di lunghezza
T ∼ L, la direzione della traiettoria cambia di un angolo χ, avremo che lungo questo arco
la direzione della velocità cambia di un angolo,

∆x
χ.
T

Siccome questo angolo è uguale ad α, otteniamo per la lunghezza dell’arco in questione


la stima,
α
∆x ∼ T ¿ T.
χ
Dato che ∆x è, dunque, molto minore di T , lungo questo arco i campi possono essere
assunti costanti, e dato che inoltre l’arco è piccolo, esso potrà essere approssimato con
un arco di circonferenza. Siccome, per di più, abbiamo che v ∼ 1, su questo arco il
moto sarà pressoché circolare uniforme. Possiamo allora anticipare il risultato (10.65)
della sezione 10.4, in cui si esegue un’analisi dettagliata della radiazione emessa da una

302
particella ultrarelativistica in moto circolare uniforme – in quel caso in presenza di un
campo magnetico costante e uniforme B. Previa la sostituzione B → F , la (10.65) dà
allora le frequenze caratteristiche,
e F ³ ε ´2
ω∼ . (10.49)
m m
Come si vede, queste frequenze mostrano la stessa dipendenza dall’energia della (10.48),
ma il coefficiente di proporzionalità corrisponde ora alla “frequenza di ciclotrone” non
eF 1
relativistica , al posto di .
m T
Data la (10.47) possiamo riassumere i risultati di questo paragrafo, affermando che un
sistema carico ultrarelativistico emette radiazione con frequenze caratteristiche,
³ ε ´2
ω ∼ ω∗ , (10.50)
m
eF 1
dove ω∗ è la più grande tra le “frequenze fondamentali” e .
m T

10.4 La radiazione del ciclotrone

In questa sezione eseguiamo l’analisi spettrale e angolare della radiazione emessa da una
particella carica in un ciclotrone, dedicando particolare attenzione al caso ultrarelativistico
v ∼ 1.
Adottando la notazione del paragrafo 9.2.2, ricordiamo che la frequenza di ciclotrone
e la velocità della particella sono date rispettivamente da,
eB √ eB
ω0 = 1 − v2 = , v = ω0 R,
m ε
dove R è il raggio dell’orbita. Siccome la particella compie un moto periodico con periodo
T = 2π/ω0 , il sistema emette radiazione sulle frequenze,

ωN = N ω 0 .

Conosciamo anche la formula per la potenza totale media, vedi (9.25),


e2 v 2 ω02
W= . (10.51)
6π (1 − v 2 )2
Ciclotrone non relativistico. Prima di procedere ricordiamo le principali caratteristiche
della radiazione emessa da una particella non relativistica, v ¿ 1. In questo caso il sistema

303
emette solo sulla frequenza fondamentale (non relativistica) ω0 ≈ eB/m, con distribuzione
angolare,
dW dW1 e2 v 2 ω02
= = 2
(1 + cos2 ϑ), (10.52)
dΩ dΩ 32π
dove ϑ è l’angolo tra la direzione di emissione ~n, e l’asse del ciclotrone, vedi problema 7.1.
Il rapporto fra l’intensità della radiazione emessa lungo ϑ = π/2 (nel piano dell’orbita), e
l’intensità emessa lungo ϑ = 0 (ortogonalmente all’orbita) risulta allora,
dW ³ π ´
Wk 1
≡ dΩ 2 = . (10.53)
W⊥ dW 2
(0)
dΩ
Integrando la (10.52) sugli angoli si ottiene poi la potenza totale,
e2 2 2
W = W1 = v ω0 ,

da confrontare con la (10.51).

10.4.1 Analisi spettrale

D’ora in poi consideriamo una particella con velocità arbitraria. Cominciamo l’analisi
della radiazione, valutando esplicitamente i coefficienti spettrali, (10.40),
¯ Z ¯2
dWN e2 (N ω0 )2 ¯¯ 1 T −i N ω0 (t−~n·~y) ¯
¯ .
= ¯ ~
n × e ~
v dt ¯ (10.54)
dΩ 8π 2 T 0
Prendendo come asse z l’asse dell’orbita, traiettoria, velocità e accelerazione istantanea
della particella sono date da,

~y (t) = R (cosϕ, senϕ, 0) (10.55)

~v (t) = v (−senϕ, cosϕ, 0), (10.56)

~a(t) = −ω02 ~y (t), (10.57)

dove,
ϕ = ω0 t. (10.58)

Per via dell’invarianza per rotazioni attorno all’asse z, per quanto riguarda la valutazio-
ne della (10.54) non è restrittivo scegliere la direzione di emissione ~n nel piano (y, z).
Possiamo allora scrivere,
~n = (0, senϑ, cosϑ), (10.59)

304
dove ϑ è l’angolo tra ~n e l’asse z. Notando che,

ω0 ~n · ~y = v senϑ senϕ,

possiamo riscrivere l’integrale lungo l’orbita che compare nella (10.40) come,
Z T Z 2π
1 −i N ω0 (t−~
n·~
y) v
e ~v dt = e−i N (ϕ−v senϑ senϕ) (−senϕ, cosϕ, 0) dϕ, (10.60)
T 0 2π 0

dove dall’integrale in t siamo passati a un integrale in ϕ. Utilizzando le proprietà (10.25)


e (10.26) delle funzioni di Bessel, è allora immediato riconoscere che la (10.60) equivale a,
Z µ ¶
1 T −i N ω0 (t−~n·~y) 0 1
e ~v dt = v i jN (vN senϑ), jN (v N senϑ), 0 .
T 0 vsenϑ

Calcolando il prodotto esterno tra questo vettore e ~n, e inserendolo nella (10.54), ottenia-
mo cosı̀ le distribuzioni angolari spettrali cercate,

dWN e2 (N ω0 )2 ¡ 2 2 ¢
= 2
ctg ϑ jN (vN senϑ) + v 2 jN
02
(vN senϑ) . (10.61)
dΩ 8π

Come prima cosa analizziamo il loro comportamento nel limite non relativistico v ¿ 1.
Dalle formule asintotiche (10.28) vediamo che per v → 0 si hanno gli andamenti leading,

dWN
∼ e2 ω02 v 2N ,
dΩ

e quindi in questo limite le armoniche con N ≥ 2 sono fortemente soppresse rispetto


all’armonica fondamentale N = 1. D’altra parte, usando la (10.28) è immediato vedere
che il peso spettrale (10.61) per N = 1, nel limite non relativistico si riduce alla (10.52).

10.4.2 Lo spettro nel limite ultrarelativistico

Per eseguire un’analisi qualitativa dello spettro emesso da una particella ultrarelativistica,
conviene integrare la (10.61) sugli angoli, si veda per esempio J. Schwinger et. al. 43 ,
Z µ Z 2N v ¶
dWN e2 N ω02 2 0 2
WN = dΩ = 2v j2N (2N v) − (1 − v ) j2N (y) dy . (10.62)
dΩ 4πv 0

Un argomento qualitativo. Prima di procedere con l’analisi della (10.62) nel limite
v ∼ 1, diamo un argomento qualitativo per stabilire l’ordine di grandezza delle frequenze,
43
J. Schwinger, L.L. DeRaad, K.A. Milton e W. Tsai, Classical Electrodynamics, Perseus Books,
Reading (MA), 1998.

305
su cui la particella emette maggiormente. Ricordiamo dalla sezione 9.3 che, se v ∼ 1, allora
in un dato istante la particella emette principalmente in un cono attorno alla direzione

di volo, di apertura angolare α ∼ 1 − v 2 . Se la particella compie un moto circolare di
periodo T = 2π/ω0 , allora la radiazione in una data direzione di osservazione proviene solo
da una piccola porzione dell’orbita, ovvero da quella che viene percorsa dalla particella
nel tempo, √
0 α 1 − v2
∆t ∼ T ∼ .
2π ω0
Una tipica frequenza di emissione è allora data,

1 ω0
ω0 = 0
∼√ .
∆t 1 − v2
D’altra parte, al tempo di emissione ∆t0 corrisponde il tempo di osservazione, vedi (10.35),

∆t = (1 − ~n · ~v )∆t0 ∼ (1 − v)∆t0 ∼ (1 − v 2 )∆t0 ,

a cui corrisponde dunque la frequenza osservata,

1 ω0
ω= ∼ .
∆t 1 − v2

Concludiamo che le frequenze caratteristiche della radiazione del ciclotrone ultrarelativi-


stico sono date da,
ω0 ³ ε ´3
ω∼ = ω 0 , (10.63)
(1 − v 2 )3/2 m
che corrispondono dunque a armoniche di ordine molto elevato,
³ ε ´3
N∼ . (10.64)
m

In termini del campo esterno le frequenze caratteristiche della radiazione sono allora date
da,
eB ³ ε ´2
ω∼ . (10.65)
m m
Analisi quantitativa. Torniamo ora alle espressioni quantitative (10.62). Per quello
che abbiamo appena visto dobbiamo apsettarci che per velocità vicine alla velocità della
luce, sono dominanti i pesi spettrali WN con N molto grande. In realtà si può vedere
che l’andamento della successione (10.62) per grandi N , dipende sensibilmente dal valore,

grande anch’esso, di 1/ 1 − v 2 . Attraverso un’analisi asintotica delle funzioni di Bessel

306
che compaiono nella (10.62) si trova, infatti, che per v ∼ 1, a parte fattori numerici, si ha
44
,
 2 2 1/3
 e ω0 N , per 1 ¿ N ¿ (1−v12 )3/2 ,
WN ≈ (10.66)
 e2 ω 2 √N (1 − v 2 )1/4 e− 23 N (1−v2 )3/2 , per 1
¿ N.
0 (1−v 2 )3/2

Vediamo dunque che per valori di N grandi ma inferiori a 1/(1 − v 2 )3/2 , i pesi spettrali
crescono come N 1/3 , mentre per N molto maggiore di 1/(1 − v 2 )3/2 essi sono esponen-
zialmente soppressi. La particella emette dunque radiazione fino a frequenze dell’ordine
di,
ω0
ωN = N ω 0 ∼ ,
(1 − v 2 )3/2
a conferma della (10.63).
Dato che nel limite ultrarelativistico si ha ω0 = v/R ∼ 1/R, per le lunghezze d’onda
emesse si trova allora il valore caratteristico,

2π ³ m ´3
λ= ∼R .
ωN ε

In base a questa formula la radiazione emessa da LEP conteneva lunghezze d’onda mol-
to corte dell’ordine di λ ∼ 10−3 nm, corrispondenti a raggi γ, mentre la radiazione di
LHC sarà piccata su lunghezze d’onda molto più lunghe, dell’ordine di λ ∼ 10 nm,
corrispondenti a raggi X molli.

10.4.3 Distribuzione angolare

Invece di analizzare la distribuzione angolare delle singole frequenze, analizziamo la di-


stribuzione angolare totale. A questo scopo si dovrebbe risommare la serie,

XN
dW dWN
= ,
dΩ N =1
dΩ

cosa che risulta difficile da fare direttamente. In questo caso è più conveniente ricorrere
alla (10.9),
Z T
dW r2 ~ 2 dt.
= |E| (10.67)
dΩ T 0
44
Vedi per esempio J. Schwinger et. al., op. cit.

307
~ 2 , con E
Come prima cosa bisogna dunque valutare |E| ~ dato come al solito dalla (10.32).

Inserendo le (10.55)–(10.57) e la (10.59), con un semplice conto si ottiene,

~ 2= e2 v 2 ω02 (1 − v 2 ) cos2 ϑ + (v − senϑ cosϕ)2


|E| · , (10.68)
16π 2 r2 (1 − v senϑ cosϕ)6

dove ora ϕ = ω0 t0 = ω0 t0 (t, ~x). Di nuovo è conveniente cambiare variabile d’integrazione


e passare da t a ϕ, utilizzando le (10.34), (10.35). Siccome si ha,

1 − v senϑ cosϕ
dt = (1 − ~n · ~v (t0 )) dt0 = dϕ,
ω0

la (10.67) diventa,
Z 2π
dW r2 ~ 2 (1 − v senϑ cosϕ) dϕ.
= |E|
dΩ 2π 0

Inserendo in questa formula la (10.68) si trova un integrale che può essere valutato
esplicitamente, e il risultato è,
2
dW e2 v 2 ω02 1 + cos2 ϑ − v4 (1 + 3v 2 ) sen4 ϑ
= · . (10.69)
dΩ 32π 2 (1 − v 2 sen2 ϑ)7/2

Per velocità piccole riotteniamo la distribuzione “continua” (10.52), che ha un massimo


per ϑ = 0. Viceversa, per velocità elevate, v ∼ 1, dall’esame del denominatore della
dW π
(10.69) si vede che ha un massimo pronunciato nelle vicinancze di ϑ = , cioè, nel
dΩ 2
piano dell’orbita. Cerchiamo allora di individuare le direzioni vicine al piano dell’orbita,
entro le quali viene emessa la maggior parte della radiazione. Le direzioni in questione
sono quelle per cui il denominatore della (10.69) resta essenzialmente dello stesso ordine
di grandezza del suo valore massimo, ovvero, per angoli ϑ per cui,

1 − v 2 sen2 ϑ ∼ 1 − v 2 .

π
Ponendo α = − ϑ, ciò succede se,
2
µ ¶
2 2 α2 2 α2
1 − v cos α ∼ 1 − v 1 − ∼ 1 − v2 + ∼ 1 − v2,
2 2

ovvero, per direzioni ~n che formano con il piano dell’orbita angoli α minori o uguali a,

α∼ 1 − v2.

Si noti che questi risultati qualitativi sono in accordo con l’analisi generale della distribu-
zione angolare nel limite ultrarelatvistico, svolta in sezione 9.3.

308
π
Infine calcoliamo il rapporto tra l’intensità emessa nel piano dell’orbita, a ϑ = , e
2
quella emessa lungo il suo asse, a ϑ = 0. Dalla (10.69) si trova facilmente,
dW ³ π ´
Wk 1 4 + 3v 2
= dΩ 2 = .
W⊥ dW 8 (1 − v 2 )5/2
(0)
dΩ
Nel limite non relativistico si riottiene la (10.53), mentre per velocità ultrarelativistiche
si ottiene un rapporto molto grande.

10.4.4 Luce di sincrotrone

La radiazione emessa da un ciclotrone relativistico viene chiamata radiazione (o luce) di


sincrotrone, perchè fu osservata per la prima volta in un sincrotrone di elettroni, presso
la “General Electric Company” di Schenectady, a New York, nel 1947. Da allora le
previsioni quantitative (10.61) e (10.69) sono state verificate sperimentalmente in diversi
sincrotroni, e le distribuzioni angolari e in frequenza misurate sono in ottimo accordo con
queste formule. Mentre negli acceleratori ad alte energie questa radiazione rappresenta
un effetto dissipativo, nei sincrotroni dedicati essa viene prodotta ad arte, ed utilizzata
per le ricerche nei campi della materia condensata, della biologia e della medicina, che
necessitano di fotoni molto energetici. Uno dei pregi di questa radiazione consiste nel fatto
che lo spettro emesso è in generale molto ampio, vedi (10.65), potendo coprire le regioni
del visibile, dell’ultravioletto e dei raggi X. Attraverso particolari dispositivi sperimentali,
i “wigglers” o gli “ondulatori”, si possono infatti selezionare dallo spettro la particolare
banda di frequenze richiesta per le ricerche specifiche che si intendono svolgere.
Luce di sincrotrone viene prodotta anche in ambito astronomico, ad esempio dal pia-
neta Giove e dalla nebulosa Granchio. La radiazione proveniente da Giove, che è avvolto
da un campo magnetico intenso, con B ∼ 1gauss, viene emessa da elettroni con energie
comprese circa tra 3M eV < ε < 50M eV , che compiono quindi orbite di ciclotrone con
raggi che arrivano fino a qualche centinaio di metri. Per un valore tipico di ε ∼ 5M eV
la (10.65) dà la frequenza caratteristica ω ∼ 109 /s, corrispondente ad onde radio, e se-
condo la (10.64) la radiazione comprende armoniche fino all’ordine N ∼ 1.000, previsioni
che sono in buon accordo con l’osservazione. La radiazione proveniente dalla nebulosa
Granchio viene, invece, emessa da elettroni che raggiungono anche energie dell’ordine di

309
ε ∼ 104 GeV , in presenza di un campo magnetico B ∼ 10−4 gauss. Gli elettroni più ener-
getici emettono quindi radiazione con frequenze caratteristiche molto elevate, ω ∼ 1018 /s,
che corrispondono all’estremo ultravioletto, e sono presenti le armoniche fino all’ordine
³ ε ´3
N∼ ∼ (2 · 107 )3 ∼ 1022 .
m

10.5 Spettro di emissione di una corrente generica

In questa sezione vogliamo determinare la distribuzione spettrale della radiazione pro-


dotta da una corrente macroscopica j µ generica, non composta necessariamente da par-
ticelle puntiformi. Distingueremo di nuovo quadricorrenti periodiche, e quadricorrenti
aperiodiche.

10.5.1 Corrente periodica



Se la corrente è periodica, con periodo T = , essa ammette uno sviluppo in serie di
ω0
Fourier nella coordinata temporale, e una rappresentazione in trasformata di Fourier nelle
tre coordinate spaziali,

X Z
1
µ
j (x) = 3/2
d3 p ei(N ω0 t−~p·~x) JNµ (~p). (10.70)
(2π) N =−∞

Eseguendo le antitrasformate si ottengono i coefficiente di Fourier,


Z Z
µ 1 T 1
JN (~p) = dt 3/2
d3 x e−i(N ω0 t−~p·~x) j µ (x). (10.71)
T 0 (2π)

Possiamo utilizzare lo sviluppo (10.70) per valutare il potenziale e il campo elettrico nella
zona delle onde, secondo le (7.9), (7.11). I pesi spettrali possono poi essere determinati
usando le formule fondamentali dell’analisi spettrale (10.6), (10.10).
Come primo passo dobbiamo inserire la (10.70) nella (7.9),
X∞ Z Z
~ 1
A = d p d3 y ei N ω0 (t−r+~n·~y) e−i~p · ~y J~N (~p)
3
4πr (2π)3/2 N =−∞
X∞ Z Z
1
= d p d3 y ei N ω0 (t−r) e−i(~p−N ω0~n)·~y J~N (~p).
3
4πr (2π)3/2 N =−∞

L’integrale in d3 y dà luogo a una δ di Dirac tridimensionale,


Z
d3 y e−i(~p−N ω0~n)·~y = (2π)3 δ 3 (~p − N ω0~n),

310
la presenza della quale permette a sua volta di eseguire l’integrale in p~. Risulta,
√ ∞ Z
~ 2π X
A = d3 p ei N ω0 (t−r) δ 3 (~p − N ω0~n) J~N (~p)
2r N =−∞
√ ∞
2π X i N ω0 (t−r) ~
= e JN (N ω0~n).
2r N =−∞

Dalla (7.11) si ottiene allora per il campo elettrico,


√ Ã ∞
!
i 2π X
~
E(t) = n × ~n × N ω0 ei N ω0 (t−r) J~N (~k) ,
2r N =−∞

dove abbiamo posto ~k = N ω0~n. Confrontando questa espressione con la (10.5), si vede
che i coefficienti di Fourier del campo elettrico sono dati da,

i 2π
E~N = N ω0 e−iN ω0 r ~n × (~n × J~N (~k)).
2r

Inserendo questi coefficienti nella (10.10), si trova infine una semplice formula per i pesi
spettrali,
dWN ¯ ¯2
2¯ ~ ~ ¯
= π(N ω0 ) ¯~n × JN (k)¯ . (10.72)
dΩ
Questa formula viene presentata spesso in modo leggermente diverso, sfruttando la
conservazione della quadricorrente. Usando la rappresentazione (10.70) si ottiene infatti,

X Z ³ ´
µ i 3 0 ~
∂µ j (x) = 3/2
d p N ω J
0 N (~
p ) − p
~ · J N (~
p) ei(N ω0 t−~p·~x) = 0,
(2π) N =−∞

che comporta l’identità,


p~ · J~N (~p)
JN0 (~p) = .
N ω0
Ponendo p~ = ~k = N ω0~n, si ottiene allora,

JN0 (~k) = ~n · J~N (~k),

e quindi,
¯ ¯2
¯ ¯
¯~n × JN (k)¯ = |J~N (~k)|2 − |~n · J~N (~k)|2 = −JN (~k)JN µ (~k).
~ ~ ∗µ

La (10.72) può allora essere posta nella forma alternativa,

dWN
= −π(N ω0 )2 JN∗µ (~k)JN µ (~k). (10.73)
dΩ

311
L’antenna lineare. Esemplifichiamo l’uso della (10.72), riderivando la formula (7.26)
per la distribuzione angolare della radiazione emessa da un’antenna lineare. Riprendiamo
la corrente dell’antenna (7.22),
µ µ ¶¶
~j(t, ~x) = I δ(x) δ(y) sen ω L − |z| cos(ωt) ~u, I=
I0
¡ ¢, (10.74)
2 sen ωL2

dove ~u è il versore lungo l’asse z. Siccome questa corrente è una corrente monocromatica,

con frequenza ω e periodo T = , i coefficienti J~N (~p) nella (10.71) sono tutti nulli, tranne
ω
quello corrispondente ad N = 1. L’antenna emette quindi solo sull’armonica fondamentale
ω1 = ω, e si ha,
dW dW1 ¯ ¯2
¯ ¯
= = π ω 2 ¯~n × J~1 (~k)¯ . (10.75)
dΩ dΩ
Per valutare J~1 (~k) dobbiamo inserire la (10.74) nella (10.71), e porre p~ = ~k = ω ~n. Si
ottiene,
Z T Z µ µ ¶¶
I ~u L
J~1 (~k) = dt e −iωt
cos(ωt) d x e 3
δ(x) δ(y) sen ω iω~
n·~
x
− |z|
T (2π)3/2
0 2
Z L/2 µ µ ¶¶
I ~u i ω cosϑ z L
= dz e sen ω − |z|
2(2π)3/2 −L/2 2
Z L/2 µ µ ¶¶
I ~u L
= dz cos (ω cosϑ z) sen ω −z , (10.76)
(2π)3/2 0 2

dove ϑ è l’angolo tra l’asse z e ~n. L’integrale in z è elementare, e porta a,


µ µ ¶ ¶
~ ~ I ~u ωL ωL
J1 (k) = cos cosϑ − cos .
(2π)3/2 ω sen2 ϑ 2 2

Inserendo questa espressione nella (10.75) e notando che |~n × ~u| = senϑ, si riottiene la
(7.26).
Particella singola. Nel caso di una particella singola la (10.72) si deve ridurre alla
(10.40). Per verificare questo è sufficiente determinare i coefficienti di Fourier (10.71), per
le sole componenti spaziali della corrente, vedi (2.41),

~j(x) = e ~v (t) δ 3 (~x − ~y (t)). (10.77)

Inserendo questa espressione nella (10.71), ed eseguendo l’integrale su ~x, si ottiene,


Z T Z Z T
e 1 e 1
J~N (~p) = dt 3
d xe −i(N ω0 t−~
p·~
x) 3
~v δ (~x − ~y ) = dt e−i(N ω0 t−~p·~y) ~v .
T 0 (2π)3/2 T 0 (2π)3/2

312
Ponendo p~ = ~k = N ω0~n, risulta allora,
Z T
e
J~N (~k) = dt e−i N ω0 (t−~n·~y) ~v .
(2π)3/2 T 0

Inserendo questa formula nella (10.72) si riottiene la (10.40).

10.5.2 Corrente aperiodica

Nel caso di un sistema carico aperiodico la corrente ammette una rappresentazione in


trasformata di Fourier in tutte e quattro le variabili, e possiamo scrivere,
Z Z
µ 1
j (x) = dω d3 p ei(ω t−~p·~x) J µ (ω, p~), (10.78)
(2π)2

dove,
Z
µ 1
J (ω, p~) = d4 x e−i(ω t−~p·~x) j µ (x). (10.79)
(2π)2
Procediamo come sopra, inserendo la (10.78) nella (7.9). Come prima l’integrale su ~y dà
luogo a una δ 3 di Dirac, che permette poi di eseguire l’integrale su p~. Si ottiene,
Z Z Z
~ 1 ~ p~)
A = 2
d y dω d3 p ei ω(t−r+~n·~y) e−i~p · ~y J(ω,
3
4πr (2π)
Z
1 ~ ω~n).
= dω ei ω(t−r) J(ω,
2r

Dalla (7.11) si ottiene allora per il campo elettrico,


µ Z ¶
~ i i ω(t−r) ~
E(t) = n × ~n × dω ω e J(k) ,
2r

dove la variabile k µ di J~ è definita da, k 0 = ω, ~k = ω ~n. Confrontando questa formula


con la (10.2), si individua la trasformata di Fourier temporale del campo elettrico,

~ i 2π ~
E(ω) = ω e−iω r ~n × (~n × J(k)).
2r

Inserendo questa espressione nella (10.8), si trova per la distribuzione spettrale della
radiazione,
d 2ε ¯ ¯2
2¯ ~ ¯
= π ω ¯~n × J(k)¯ . (10.80)
dω dΩ
~ p~), che per p~ = ~k = ω~n
Sfruttando il fatto che ∂µ j µ = 0, la (10.78) dà ω J 0 (ω, p~) = p~ · J(ω,
dà,
~
J 0 (k) = ~n · J(k).

313
Di conseguenza la (10.80) può essere scritta anche come,

d 2ε
= −π ω 2 Jµ∗ (k)J µ (k). (10.81)
dω dΩ

Come prima è immediato fare vedere che nel caso di una particella singola, la (10.80)
si riduce alla (10.42). Inserendo la (10.77) nella (10.79), ed eseguendo gli stessi passaggi
di cui sopra si arriva infatti a,
Z ∞
~ e 1
J(k) = √ dt e−i ω(t−~n·~y) ~v . (10.82)
(2π)3/2 2π −∞

Sostituendo questa espressione nella (10.80), si riottiene in effetti la (10.42). Tuttavia,


come già notato nel paragrafo 10.3.1, l’integrale presente nella (10.82) in generale non
converge. Nella procedura quı̀ adottata l’origine di questa divergenza è evidente: la
(10.82) rappresenta la trasformata di Fourier della distribuzione ~j(x), e come tale deve
essere eseguita nel senso delle distribuzioni. Un modo per farlo consiste nell’introdurre
nella (10.82) un’opportuna regolarizzazione, per esempio restringendo l’integrale in t tra
−L ed L, come illustrato nel paragrafo 10.3.1, e nell’eseguire poi il limite per L → ∞, nel
senso delle distribuzioni.

314
11 L’effetto Cerenkov

Nel 1934 il fisico russo P.A. Cerenkov studiò il fenomeno della luminescenza emessa da
certe soluzioni liquide, se irradiate con raggi γ provenienti da sorgenti radioattive. Nel
corso degli esperimenti, durati fino al 1938, si accorse che i raggi γ causano una radia-
zione molto debole anche in solventi puri, come l’acqua e il benzolo, dando luogo a una
luce blu, vale a dire radiazione nello spettro visibile. Da un’analisi approfondita delle
caratteristiche della luce emessa si rese conto che questo effetto non poteva essere un fe-
nomeno di luminescenza, come assunto inizialmente. La radiazione osservata era infatti
caratterizzata da una polarizzazione lineare ben definita, e veniva emessa solo in avanti,
lungo un cono di direzioni che formavano un ben determinato angolo con la direzione dei
raggi γ, entrambe proprietà non possedute dalla luminescenza. La radiazione osservata
aveva inoltre carattere universale, nel senso che le sue caratteristiche erano indipendenti
dalle specifiche proprietà delle soluzioni usate, come la temperatura e la loro particolare
composizione. Ci si aspettava allora che anche la spiegazione teorica dell’effetto dovesse
avere carattere universale.
Questa spiegazione fu data dai fisici russi I.E. Frank e I.M. Tamm nel 1937, i quali
assumevano che la radiazione osservata da Cerenkov non fosse causata direttamente dai
raggi γ, ma da elettroni ad alta velocità, prodotti dai raggi γ attraverso l’effetto Compton.
Secondo la loro teoria questa radiazione viene generata da elettroni che si trovano in moto
rettilineo uniforme in un mezzo dielettrico, con una velocità superiore alla velocità della
luce nel mezzo. Ricordiamo che un mezzo con costante dielettrica reale ε ha indice di
√ c
rifrazione n = ε, e che la velocità della luce nel mezzo vale . Per n > 1 essa risulta
n
dunque minore di c.
In questa sezione analizzeremo in dettaglio i campi prodotti da una particella in moto
rettilineo uniforme in un mezzo, sia per velocità minori che per velocità maggiori della
velocità della luce nel mezzo, e spiegheremo cosı̀ l’origine e le proprietà della “radiazione
Cerenkov”.
Aspetti macroscopici e microscopici. La spiegazione dell’effetto Cerenkov data da Frank
e Tamm si basa sulle equazioni di Maxwell in un mezzo dielettrico, che forniscono una

315
descrizione macroscopica della dinamica del campo elettromagetico. Come è noto, queste
equazioni rappresentano un metodo semplice per tenere conto delle cariche di polarizza-
zione che si creano in un mezzo, a causa delle cariche “libere”. Il campo elettromagnetico
totale risulta, infatti, dalla sovrapposizione del campo prodotto dalla particella nel vuoto,
e da quello prodotto dalle cariche di polarizzazione. Siccome una particella in moto rettili-
neo uniforme “nel vuoto” non dà luogo a nessun campo di radiazione, a livello microscopico
la radiazione di Cerenkov deve dunque originare dalle cariche di polarizzazione. In effetti,
quello che succede a livello microscopico è che l’elettrone durante il suo passaggio nel mez-
zo deforma le molecole facendo loro acquistare un momento di dipolo elettrico, il quale
scompare immediatamente dopo il passaggio dell’elettrone. Le cariche che compongono i
momenti di dipolo sono cosı̀ sottoposti a un’accelerazione quasi–istantanea, e diventano
quindi sorgenti impulsive di onde elettromagnetiche elementari, che si manifestano come
radiazione Cerenkov.
Tuttavia, non è immediato determinare il campo macroscopico, valutando esplicita-
mente la sovrapposizione coerente di queste infinite onde elementari “microscopiche”.
Viceversa, le equazioni di Maxwell in un mezzo costituiscono uno strumento molto effica-
ce per valutare il campo elettromagnetico prodotto a livello macroscopico dalla particella,
e dalle cariche di polarizzazione da essa indotte. Per semplicità parleremo comunque di
“campo prodotto dalla particella” nel mezzo, e di “energia irradiata dalla particella”.

11.1 Campo di una particella in moto rettilineo uniforme in un


mezzo

Equazioni di Maxwell in un mezzo dielettrico. Consideriamo un mezzo isotropo e omoge-


neo, con permeabilità magnetica uguale a quella del vuoto, µ = 1, e con costante dielettrica
ε > 1 e reale. In questo modo trascuriamo l’assorbimento del mezzo, ipotesi giustificata
per frequenze lontane dalle frequenze di risonanza. Per il momento assumiamo anche
che non vi sia dispersione, ovvero, che ε sia indipendente dalla frequenza, rinviando la
trattazione del caso realistico di un mezzo dispersivo alla sezione 11.4. Anche l’indice di
rifrazione,

n= ε, (11.1)

316
risulta allora indipendente dalla frequenza.
In un mezzo dielettrico con queste caratteristiche le equazioni di Maxwell (2.28)–(2.31)
diventano,
n2 ~
∂E ~
− ~ ×B
+∇ ~ = j, (11.2)
c ∂t c
1 ~
∂B ~ ×E
+∇ ~ = 0, (11.3)
c ∂t
∇ ~ = ρ,
~ ·E (11.4)
n2
~ ·B
∇ ~ = 0, (11.5)

dove ρ indica la densità di carica, e abbiamo momentaneamente ripristinato la velocità


della luce. Si noti che queste equazioni si possono ottenere dalle (2.28)–(2.31) effettuando
le sostituzioni,
c ρ ~
~ → n E,
E ~ ~ →B
B ~ c→ , ρ→ , ~j → j . (11.6)
n n n
Le identità di Bianchi (11.3) e (11.5) sono rimaste immutate, e quindi possiamo risolverle
nel modo standard,
~
E ~ 0 − 1 ∂A ,
~ = −∇A (11.7)
c ∂t
~ ~ ~
B = ∇ × A, (11.8)

~ sono ancora definiti modulo le trasformazioni di gauge Aµ → Aµ +∂ µ Λ.


e i potenziali A0 e A
In questo caso è conveniente effettuare il gauge–fixing di Lorentz adattato,
n2 ∂A0 ~ ~
+ ∇ · A = 0.
c ∂t
È allora immediato vedere che le (11.2), (11.4) si riducono a,
µ 2 2 ¶ Ã !
n ∂ ρ ~
j
2n Aµ ≡ − ∇2 Aµ = , . (11.9)
c2 ∂t2 n2 c

In assenza di cariche libere, j µ = 0, nel mezzo il campo elettromagnetico si propaga quindi


c
con la velocità .
n
Consideriamo ora una particella che si muove di moto rettilineo uniforme, quindi con
p
velocità ~v e quadrivelocità uµ = (c, ~v )/ 1 − v 2 /c2 costanti. Allora da (6.58) segue,
Z
ρ = eu 0
δ 4 (x − u s) ds = e δ 3 (~x − ~v t), ~j = ρ ~v , (11.10)

317
ed è sufficiente risolvere le (11.9) per µ = 0,

ρ
2n A0 = . (11.11)
n2

La parte spaziale del quadripotenziale è, infatti, data semplicemente da,


2
~ = n ~v A0 .
A (11.12)
c

In seguito supporremo che la particella si muova lungo l’asse delle z, quindi con
traiettoria,
~y (t) = (0, 0, vt).

In questo caso è conveniente introdurre coordinate cilindriche, ~x ↔ (z, r, ϕ), dove r e ϕ


sono coordinate polari bidimensionali, nel piano ortogonale alla traiettoria della particella.
In particolare r indica allora la distanza di ~x dall’asse z. Corrispondentemente useremo i
versori ~uz , ~ur e ~uϕ .

c
11.2 Il campo per v <
n
Supponiamo ora che la velocità della particella sia minore della velocità della luce nel
c
mezzo, v < . In questo caso la (11.11) può essere risolta con lo stesso metodo usato nel
n
paragrafo 6.3.1 per risolvere l’analoga equazione nel vuoto,

2A0 = ρ. (11.13)

In quel caso si aveva n = 1 e v < c. Per ottenere la soluzione della (11.11) è sufficiente
e c
eseguire nella soluzione (6.63) della (11.13) le sostituzioni e → 2 , c → . La componente
n n
0 della (6.63) si scrive,

e u0 e 1
A0 = p = q ,
4π (ux) − x
2 2 4π (z − vt)2 + ¡1 − v2
¢
r2
c2

e la soluzione della (11.11) risulta allora,

e 1
A0 = 2
p , (11.14)
4πn (z − vt)2 + (1 − v 2 n2 )r2

318
dove abbiamo posto di nuovo c = 1. Per i campi elettrico e magnetico le (11.7), (11.8)
danno allora,

~ = e (1 − v 2 n2 )(~x − ~v t) ~ = e (1 − v 2 n2 ) v r ~uϕ
E , B ,
4πn2 ((z − vt)2 + (1 − v 2 n2 )r2 )3/2 4π ((z − vt)2 + (1 − v 2 n2 )r2 )3/2
(11.15)
e il vettore di Poynting diventa,
³ e ´2 (1 − v 2 n2 )2 v r [r ~u − (z − vt) ~u ]
~=E
S ~ ×B
~ = ·
z r
= Sz ~uz + Sr ~ur . (11.16)
4πn ((z − vt)2 + (1 − v 2 n2 )r2 )3

Vediamo ora quali sono le proprietà del campo ottenuto. Come nel vuoto, il campo
elettromagnetico non presenta singolarità al di fuori della traiettoria, perché per v < 1/n
il denominatore nelle (11.15) si annulla solo per ~x = ~v t. Inoltre, dalla (11.16) si vede che
non c’è flusso radiale netto di energia, perché “dietro” la particella – per z < vt – esiste
un flusso radiale uscente, Sr > 0, mentre “davanti” – per z > v t – esiste un flusso radiale
entrante, Sr < 0, e i due si compensano. In particolare, se calcoliamo il flusso di energia
totale attraverso un cilindro concentrico con la traiettoria, di raggio r e basi situate in z1
e z2 , troviamo,
Z z2 Z ∞ Z z2 Z ∞
2πr
∆ε = 2πr dz Sr dt = dz Sr dl = 0, (11.17)
z1 −∞ v z1 −∞

perché Sr è una funzione antisimmetrica della variabile l = z − vt.

11.2.1 Analisi in frequenza

In vista del confronto con il caso v > 1/n è utile eseguire anche una “analisi spettrale”
del campo. In realtà questa analisi ha senso se siamo in presenza di campi di radiazione,
mentre il campo di una particella con velocità costante minore di quella della luce, a
1
grandi distanze decade come , vedi (11.15), e non costituisce quindi un campo di
|~x|2
radiazione. Eseguiamo comunque la trasformata di Fourier temporale della (11.14),
Z ∞
0 e e−iωt
A (ω) = √ p dt. (11.18)
2π 4πn2 −∞ (z − vt)2 + (1 − v 2 n2 )r2

Con semplici passaggi si ottiene,


µ√ ¶
0 e −i ωz/v 1 − v 2 n2
A (ω) = e K ωr , (11.19)
(2π)3/2 n2 v v

319
dove K(x) è la funzione di Bessel modificata del secondo tipo di ordine 0, indicata
comunemente con K0 (x),
Z ∞ Z ∞
1 ei x s
K(x) = √ ds = cos(x senh β) dβ.
2 −∞ s2 + 1 0

La seconda rappresentazione si ottiene con il cambiamento di variabile, s = senh β.


La funzione K(x). Per quello che segue è utile dare un’altra rappresentazione ancora
di K, che si ottiene usando l’analisi complessa. Si noti che K(−x) = K(x), per cui di
seguito supporremo x > 0. Consideriamo la funzione di variabile complessa,
ei x z
f (z) = √ ,
z2 + 1
che è analitica nel semipiano superiore, esclusa la semiretta z = i u con u ∈ [1, ∞] dove
possiede un taglio. Allora si annulla l’integrale di linea,
I
f (z) dz = 0, (11.20)
γ

in cui γ è una curva chiusa composta 1) dall’asse reale, 2) da due quarti di circonferenza
giacenti nel semipiano superiore e centrati nell’origine, con raggio R e aperture angolari
rispettivamente 0 < ϕ < π/2 e π/2 < ϕ < π, 3) dalle due semirette z = ±ε + i u, con
u ∈ [1, ∞], e infine, 4) da una semicirconferenza centrata in z = i e di raggio ε, rivolta
verso il basso. Nel limite per R → ∞ e per ε → 0, gli integrali sui tre archi di circonferenza
vanno a zero se x > 0, e nella (11.20) sopravvivono allora solo gli integrali lungo l’asse
reale e lungo le due semirette. Risulta allora,
Z ∞ Z ∞
ei x s e−x u
√ ds − 2 √ du = 0.
−∞ s2 + 1 1 u2 − 1
Si conclude quindi che per x > 0 la funzione K può essere scritta anche come,
Z ∞ Z ∞
e−x u
K(x) = √ du = e−x cosh β dβ, (11.21)
2
u −1
1 0

dove abbiamo posto u = coshβ.


Andamenti asintotici di K(x). La rappresentazione (11.21) è in particolare convenien-
te per determinare gli andamenti asintotici di K, per x grandi e piccoli. Per grandi x
usiamo il metodo del punto sella. Per x → ∞, nell’integrando in (11.21) contano i valori
di β per cui cosh β è minimo, cioè, i valori di β vicino allo zero. Espandendo,
1 2
cosh β = 1 + β + o(β 4 ),
2
320
si trova allora,
Z ∞
x 2 +x o(β 4 )]
−x
K(x) = e e−[ 2 β dβ.
0

Riscalando β → β/ x, risulta cosı̀,
Z r µ µ ¶¶
e−x ∞ −[ 1 β 2 +o(β 4 )/x] π −x 1
K(x) = √ e 2 dβ = e 1+o . (11.22)
x 0 2x x

Per x → 0 la funzione K(x) diverge invece. Per determinare il tipo di divergenza, sepa-
riamo dall’integrale (11.21) la parte convergente. Per fare questo riscaliamo la variabile
d’integrazione, u → u/x, e riscriviamo l’integrale come,
Z ∞ Z 1 Z ∞
e−u e−u e−u
K(x) = √ du = √ du + √ du. (11.23)
x u2 − x 2 x u2 − x 2 1 u2 − x 2
L’ultimo integrale converge per x → 0, ed è sufficiente valutare il penultimo,
Z 1 Z 1 Z 1 −u
e−u 1 e −1
√ du = √ du + √ du.
x u2 − x 2 x u 2 − x2 x u2 − x 2
Di nuovo, per x → 0 l’ultimo integrale converge, perché la funzione (e−u − 1)/u è regolare
nell’intervallo [0, 1], ed è sufficiente calcolare,
Z 1 µ ¶ ³x´
1 1
√ du = arccosh = − ln + o(x).
x u2 − x 2 x 2

Per x che va a zero K diverge quindi logaritmicamente,

K(x) = − ln x + C + o(x), (11.24)

dove C è una costante.


Un’equazione differenziale per K(x). Le funzioni speciali vengono spesso anche definite
attraverso le equazioni differenziali che esse soddisfano. L’equazione definente per K è,
per x 6= 0,
1 0
K 00 + K − K = 0. (11.25)
x
Verifichiamo che essa è soddisfatta dalla (11.21),
Z ∞µ ¶
00 1 0 u2 1 u
K + K = √ − √ e−ux du
x 1 u2 − 1 x u2 − 1
Z ∞µ √ ¶
u2 1 d u2 − 1 −ux
= √ − e du.
1 u2 − 1 x du

Con un’integrazione per parti si ottiene allora di nuovo l’integrale (11.21).

321
In realtà l’equazione differenziale lineare (11.25), essendo del secondo ordine ha due
soluzioni indipendenti. Una è K(x), e l’altra è data dalla funzione,
Z 1 Z π
e exu
K(x) = √ du = ex cosϑ dϑ, (11.26)
−1 1 − u2 0

che è legata alla funzione di Bessel modificata del primo tipo di ordine 0, I0 (x), dalla
e
relazione K(x) e
= π I0 (x). Anch’essa è pari, K(−x) e
= K(x), e i suoi andamenti asintotici
per x > 0 sono,
r µ µ ¶¶
e π x 1 e
K(x) = e 1+o , K(x) = π + o(x), (11.27)
2x x

da confrontare con le (11.22), (11.24). Si noti in particolare che, al contrario di K(x), la


e
funzione K(x), divergendo esponenzialmente per |x| → ∞, non costituisce una distribu-
zione temperata.
Un’onda evanescente. Torniamo ora alla (11.19). Vediamo che A0 (ω) dipende da z
attraverso il termine di “onda piana” e−ikz z , con vettore d’onda,

ω
kz = .
v

Questo termine descrive quindi un’onda che si propaga in direzione z con la velocità della
ω
particella, in quanto vz ≡ = v. Tuttavia, a grandi distanze dalla traiettoria, ovvero
kz
per grandi r, a causa dell’andamento asintotico (11.22), A0 (ω) si comporta come,
ω√
C −ik z z − 1 − v 2 n2 r
A0 (ω) ∼ √ e v , (11.28)
r
1
dove C è una costante indipendente da ~x. Vediamo che A0 (ω) esibisce un fattore √ ,
r
tipico per un’onda cilindrica 45 , che in questo caso viene però soppiantato dal fattore di
¡ √ ¢
decrescita esponenziale exp − ωv 1 − v 2 n2 r , che rappresenta una “onda evanescente”.
Per rappresentare una vera “onda” questo esponenziale dovrebbe essere sostituito da un
fattore oscillante del tipo exp (ikr r). Ritroviamo cosı̀ che una particella in moto rettilineo
c
uniforme, con velocità costante minore di , non irradia onde elettromagnetiche.
n
45

Come spiegheremo in sezione 11.5, per le onde a simmetria cilindrica la presenza del fattore 1/ r
è richiesta dalla conservazione dell’energia. Per le onde sferiche l’andamento analogo, implicato sempre
dalla conservazione dell’energia, è invece 1/r.

322
c
11.3 Il campo per v >
n
c
Se v > , la soluzione della (11.11) non può essere ottenuta con semplici sostituzioni dalla
n
(6.63), ma possiamo comunque applicare il metodo usato nel paragrafo 6.3.1. In seguito
porremo di nuovo c = 1.
Introduciamo una funzione di Green adattata Gn soddisfacente,

2n Gn = δ 4 (x) = δ(t)δ 3 (x).

La soluzione di questa equazione può essere ottenuta dalla funzione di Green (6.43),
t ¡ ¢
soddisfacente 2G = δ 4 (x), attraverso la sostituzione t → . Ricordando che δ nt =
n
n δ(t), si ottiene cosı̀,

1 t2
Gn = H(t) δ(x2n ), x2n ≡ 2
− |~x|2 .
2πn n
In seguito useremo anche la notazione,

a0 b0
(a b)n ≡ − ~a · ~b.
n2
La soluzione della (11.11) è allora data da,
Z
1 1
A0 = 2 Gn ∗ ρ = 2 Gn (x − y)ρ(y) d4 y.
n n
Sostituendo la (11.10), con passaggi standard si ottiene,
Z µ ¶
0 e u0 0 e u0 H(t − u0 s+ ) H(t − u0 s− )
A = H(t − u s) δ(f (s)) ds = + , (11.29)
2πn3 2πn3 |f 0 (s+ )| |f 0 (s− )|
purchè la forma quadratica,

f (s) ≡ u2n s2 − 2s(ux)n + x2n ,

abbia due zeri reali s± . In caso contrario A0 è zero. Il valore dell’integrale nella (11.29)
dipende quindi 1) dalla presenza di zeri reali di f (s), e 2) dal segno di t − u0 s± . Gli zeri
sono dati da,
p
(ux)n ± (ux)2n − u2n x2n 1 − v 2 n2
s± = , u2n = < 0,
u2n (1 − v 2 )n2
e,
p u0 p
|f 0 (s± )| = 2 (ux)2n − u2n x2n = 2 (z − vt)2 − (v 2 n2 − 1)r2 .
n

323
Vediamo che esistono zeri reali solo nella regione,

r2 1
(z − vt)2 > (v 2 n2 − 1)r2 ↔ < , (11.30)
(z − vt)2 + r2 v 2 n2

che corrisponde a un cono doppio centrato nella posizione della particella, e con asse la
sua traiettoria, di apertura angolare,

1
sen α = . (11.31)
vn

Al di fuori di questo cono doppio il campo è quindi nullo. Stando all’interno del cono
studiamo ora il segno di t − u0 s± . Da un semplice calcolo risulta,

n ³ p ´
t − u0 s ± = − v n (z − vt) ∓ (z − vt)2 − (v 2 n2 − 1)r2 .
v 2 n2 − 1

Siccome il termine (v 2 n2 − 1) è positivo, per z − vt > 0 si ha t − u0 s± < 0, e il campo è


nullo, mentre per,
z − vt < 0, (11.32)

si ha t − u0 s± > 0, e nella (11.29) contribuiscono tutti e due i termini. Concludiamo


quindi che ad ogni istante il campo è diverso da zero solo all’interno del cono centrato
nella particella, coassiale conµla traiettoria
¶ e rivolto in direzione opposta al moto, di
1
apertura angolare α = arcsen .
vn
Singolarità del campo. Tenendo conto delle (11.30) e (11.32), dalla (11.29) risulta il
potenziale, £ √ ¤
2 H −(z − vt) − r v 2 n2 − 1
e
A0 = p . (11.33)
4πn2 (z − vt)2 − (v 2 n2 − 1)r2
c
Confrontando con il potenziale (11.14) del caso v < , si vede che le due espressioni
n
esibiscono formalmente le stesse dipendenze funzionali da ~x e t. Nella (11.33) compare in
più un fattore due, ma in compenso il campo è nullo all’esterno del cono “all’indietro” di
apertura α. Inoltre, sul bordo di questo cono, ovvero per,

z = vt − r v 2 n2 − 1, (11.34)

A0 diverge. Vedremo tra poco che questa singolarità non è fisica, in quanto dovuta alla
nostra schematizzazione di un mezzo non dispersivo. Siccome le (11.14) e (11.33) hanno la
~ eB
stessa dipendenza funzionale, a parte il fattore due i campi E ~ e il vettore di Poynting

324
~ è
sono ancora dati dalle (11.15) e (11.16). Ma questa volta la componente radiale di S
diversa da zero – e positiva – solo per z < vt (all’interno del cono), mentre è nulla per
z > vt. Ci aspettiamo dunque un flusso radiale uscente netto di energia elettromagnetica.
Si noti come la forma del potenziale (11.33) sia analoga al fronte d’onda sonoro conico,
che si crea quando un aereo viaggia con velocità supersonica, il cosiddetto “cono di Mach”.

11.3.1 Il campo nella zona delle onde e l’angolo di Cerenkov

Per indagare la presenza di radiazione elettromagnetica, eseguiamo di nuovo la trasformata


di Fourier temporale di A0 . Per via della presenza della funzione di Heaviside in (11.33),
ora abbiamo,
Z ∞
0 e e−iωt
A (ω) = √ √
p dt.
2π 2πn2 1
v (z+r v 2 n2 −1) (z − vt)2 − (v 2 n2 − 1)r2

Traslando e riscalando la variabile t si arriva a,


µ√ ¶
0 e −i ωz/v v 2 n2 − 1
A (ω) = e L ωr , (11.35)
(2π)3/2 n2 v v

dove la funzione complessa L(x) è data da,


Z ∞ −i x u Z ∞
e
L(x) = √ du = e−i x cosh β dβ, (11.36)
u 2−1
1 0

(2)
ed è legata alla funzione di Haenkel di ordine zero H0 (x), dalla relazione L(x) =
π (2)
H (x).
2i 0
La seconda espressione nella (11.36) è stata ottenuta attraverso il cambia-
mento di variabile, u = cosh β. Confrontando la (11.35) con la (11.19) vediamo che le due
espressioni di A0 (ω) costituiscono una la continuazione analitica dell’altra, dalla regione
1 1
v < , alla regione v > . Formalmente vale infatti, vedi (11.21),
n n

L(x) = K(i x).

Proprietà della funzione L(x). A partire dalla (11.36), con le stesse tecniche del pa-
ragrafo 11.2.1 si possono derivare le proprietà principali della funzione L(x). Notiamo
che vale L∗ (x) = L(−x), condizione imposta dalla realtà di A0 (t, ~x), sicché è sufficiente
limitarsi al semiasse x > 0. In questo caso si ottengono gli andamenti asintotici,
r µ µ ¶¶
π −i(x+π/4) 1
L(x) = e 1+o , L(x) = − ln x + C + o(x), (11.37)
2x x

325
da confrontare con le (11.22), (11.24). Separando L in parte reale e parte immaginaria,

L(x) = L1 (x) + iL2 (x), L1 (−x) = L1 (x), L2 (−x) = −L2 (x), (11.38)

si vede quindi che per x → ∞ entrambe queste funzioni hanno un andamento oscillatorio,
mentre per x → 0 solo L1 (x) esibisce una divergenza logaritmica, e L2 (x) è regolare.
L’equazione differenziale soddisfatta da L è, invece,

1 0
L00 + L + L = 0, (11.39)
x

da confrontare con la (11.25). Siccome anche questa equazione è reale, L1 ed L2 la


soddisfano separatamente, e costituiscono quindi un insieme completo di soluzioni. La
particolare combinazione delle due soluzioni che compare nella (11.35) rappresenta un’on-
da uscente in direzione radiale, vedi (11.40), la presenza della quale è dettata dalla
causalità. L’altra combinazione indipendente, la complessa coniugata L∗ = L1 − iL2 ,
corrisponderebbe invece a un’onda entrante.
L’angolo di Cerenkov. Con l’aiuto della (11.37), nella zona delle onde, ovvero, per
grandi r, la (11.35) assume la forma,
ω³ √ ´
e e −iπ/4 −i z + v 2 n2 − 1 r
A0 (ω) = 2
· 2 2 √ e v (11.40)
4πn (v n − 1)1/4 v ω r

C
= √ e−i (kz z + kr r) , (11.41)
r

dove C è una costante indipendente dalle coordinate, e abbiamo trascurato termini di ordi-
ne o(1/r3/2 ). Al contrario della (11.28) questa espressione rappresenta un’onda (cilindrica)
vera e propria, con vettore d’onda ~k dato da,

ω ω√ 2 2
kz = , kr = v n − 1, kϕ = 0.
v v

La sua velocità di propagazione è allora data da,

ω ω 1
=p = ,
|~k| kr2 + kz2 n

che è la velocità della luce nel mezzo. La direzione di propagazione dell’onda è invece
individuata dall’angolo ϑC che ~k forma con la direzione del moto della particella, l’angolo

326
di Cerenkov,
kz 1
cos ϑC = = . (11.42)
|~k| vn
Tale angolo è ben definito fino a quando risulta soddisfatta la condizione di Cerenkov
1
v > . Le direzioni di emissione giacciono quindi su un cono “in avanti”, coassiale con
n
la traiettoria della particella e di apertura ϑC , che viene chiamato cono di Cerenkov.
L’angolo di Cerenkov è legato all’angolo α di (11.31) dalla relazione di complementarià,

π
ϑC = − α.
2

La direzione della radiazione coincide, inoltre, con la direzione del vettore di Poynting sul
bordo del cono in cui il campo è diverso da zero. Valutando il numeratore della (11.16)

~ k ~k. In realtà, come anticipato
per z = vt − r v 2 n2 − 1, si vede infatti che risulta S
~ diverge, vedi sezione 11.4.
sopra, sul bordo di questo cono il modulo di S
Nell’acqua, che alle frequenze visibili ha un indice di rifrazione n = 34 , si ha emissione
di radiazione Cerenkov se v > 34 , e quando v varia tra 3
4
e 1, l’angolo di emissione varia
tra ϑC = 0 e ϑC = arccos 43 = 41.4o .

11.4 Mezzi dispersivi

Molti mezzi dielettrici hanno un indice di rifrazione che nello spettro visibile è pratica-
mente costante, ma nei mezzi reali esso è in generale una funzione della frequenza, n(ω).
Si dice che il mezzo è dispersivo. L’andamento della funzione n(ω) dipende molto dalle
proprietà atomiche del mezzo, in particolare dalla presenza di frequenze di risonanza. Le
sue caratteristiche generali sono comunque,

 n(ω) < 1, per ω > ωm ,
(11.43)

limω→∞ n(ω) = 1,

dove ωm è un valore limite, che è vicino alla frequenza di risonanza più elevata. Per grandi
ω si ha in particolare l’andamento asintotico n(ω) ≈ 1 − ωp2 /ω 2 , dove ωp è la “frequenza
di plasma” del mezzo. La banda di frequenze in cui n(ω) < 1 è quindi limitata.
Equazioni di Maxwell in un mezzo dispersivo. In un mezzo dispersivo la dinamica del
campo elettromagnetico non è più descritta dalle (11.2)–(11.5), ovvero, dalle (11.9), ma

327
dalle “trasformate di Fourier temporali” di queste ultime,
³ ´ µ ¶
2 2 2 µ ρ(ω) ~
− n (ω) ω + ∇ A (ω) = , j(ω) , (11.44)
n2 (ω)

dove ρ(ω) e ~j(ω) indicano rispettivamente le trasformate di Fourier temporali di ρ(x) e


~j(x). In caso di dispersione il potenziale vettore è allora definito come l’antitrasformata,
Z ∞
µ 1
A (x) ≡ √ eiωt Aµ (ω) dt, (11.45)
2π −∞

dove le Aµ (ω) risolvono, per definizione, le (11.47). In particolare Aµ (x) non soddisfa
quindi più un’equazione differenziale locale, come la (11.9).
Il campo per un moto rettilineo uniforme. Per il moto rettilineo uniforme è di nuovo
sufficiente determinare la componente µ = 0 del quadripotenziale, perché dalla (11.10)
segue che ~j(ω) = ρ(ω) ~v , e la (11.44) implica allora che,

~
A(ω) = n2 (ω)A0 (ω) ~v . (11.46)

Eseguendo la trasformata di Fourier della (11.10) si ottiene,


Z ∞
e e
ρ(ω) = √ e−iωt δ(z − vt) δ 2 (~r) dt = √ e−iωz/v δ 2 (~r),
2π −∞ 2π v

e la componente µ = 0 della (11.44) diventa allora,

¡ ¢ e
n2 (ω) ω 2 + ∇2 A0 (ω) = − √ e−iωz/v δ 2 (~r). (11.47)
2π v n2 (ω)

Ci siamo quindi ricondotti alla soluzione di questa equazione differenziale alle derivate
parziali. In realtà, ripercorrendo la procedura della sezione precedente, in particolare
considerando la trasformata di Fourier temporale della (11.11), non è difficile rendersi
conto che la (11.47) è risolta dalle (11.19), (11.35), rispettivamente per i valori di ω per
1
cui n(ω) < v
e n(ω) > v1 , purché si effettui nelle (11.19), (11.35) la sostituzione n → n(ω).
Per verificarlo esplicitamente ricordiamo che in coordinate cilindriche il laplaciano si scrive,

1 1
∇2 = ∂z2 + ∇2r , ∇2r ≡ ∂r2 + ∂r + 2 ∂ϕ2 ,
r r

e poniamo,
e
A0 (ω) = e−i ωz/v I(ω, r), (11.48)
(2π)3/2 v n2 (ω)

328
dove assumiamo che I(ω, r) non dipenda da z e ϕ. La (11.47) si riduce allora a,
µ ¶
1 ω2 ¡ 2 ¢
∂r + ∂r + 2 n (ω)v − 1 I(ω, r) = −2πδ 2 (~r).
2 2
(11.49)
r v

Notando che per x 6= 0 le funzioni K e L soddisfano le equazioni differenziali (11.25),


(11.39), vediamo che per r 6= 0 la (11.49) è soddisfatta se poniamo, rispettivamente per
1
n(ω) < v
e n(ω) > v1 ,
Ãp ! Ãp !
1 − v 2 n2 (ω) v 2 n2 (ω) − 1
I(ω, r) = K ωr , I(ω, r) = L ωr , (11.50)
v v

in accordo con le (11.19), (11.35). Per rivelare, invece, la presenza della δ 2 (~r) nella (11.49),
occorre ricordare che in x = 0 le funzioni L e K esibiscono le singolarità logaritmiche
(11.24) e (11.37), sicché nelle vicinanze di r = 0 I(ω, r) si comporta come,

I(ω, r) = − ln r + a + o(r),

dove a è una costante indipendente da r. Siccome la funzione di Green del laplaciano


bidimensionale è il logaritmo, vedi problema 6.4,

∇2r (ln r) = 2π δ 2 (~r),

la parte singolare in r = 0 di ∇2r I(ω, r) risulta proprio,

¡ ¢
∇2r I(ω, r) sing = ∇2r (− ln r) = −2π δ 2 (~r).

Si conclude quindi che la I(ω, r) data in (11.50) soddisfa la (11.49) nel senso delle
distribuzioni.
Unicità della soluzione. Discutiamo brevemente l’unicità della soluzione (11.50), fa-
cendo vedere che l’equazione omogenea associata alla (11.49) non ammette soluzioni “fisi-
1
che”. Per n(ω) < questa equazione coincide con la (11.25), che ha come unica soluzione
v
e
K, in quanto solo essa in x = 0 è regolare, vedi (11.27). 46 Tuttavia, questa funzione
diverge esponenzialmente per x → ∞, e quindi non è accettabile come soluzione fisica.
1 1
Per n(ω) < la soluzione è quindi unica. Per n(ω) > invece, l’equazione omogenea
v v
46 e non costituisce una “distribuzione temperata”, ovvero un elemento di S 0 , per
In realtà la funzione K
via della divergenza esponenziale per x → ∞. Essa rappresenta, tuttavia, una “distribuzione”, ovvero un
elemento di D0 , e come tale soddisfa la (11.25).

329
associata alla (11.49) è data dalla (11.39), e l’unica soluzione di questa equazione è la
funzione L2 , che è regolare in x = 0 e costituisce in effetti una distribuzione temperata,
vedi (11.37), (11.38). Dato che A0 (t, ~x) è reale, la (11.48) impone che I ∗ (ω, r) = I(−ω, r).
1
Siccome si ha L2 (−x) = −L2 (x), per n(ω) > la soluzione generale della (11.49) è allora
v
data da, tralasciando gli argomenti,
³ a´ a
I = L + a i L2 = 1 + L − L∗ ,
2 2

dove a è una costante reale arbitraria. Tuttavia, dall’andamento asintotico (11.37) si vede
che L rappresenta un’onda uscente radialmente, mentre L∗ rappresenta un’onda entrante
radialmente dall’infinito. La causalità impone allora la scelta a = 0, e la soluzione fisica
è di nuovo unica.
Dispersione, fronti d’onda e singolarità. Riassumendo possiamo dire che in presenza
di un mezzo dispersivo, il potenziale scalare di una particella in moto rettilineo uniforme
è dato da, vedi (11.45), (11.48) e (11.50),
Z ∞
ω
0 e −i (z − v t) I(ω, r)
A (t, ~x) = e v dω, (11.51)
(2π)2 v −∞ n2 (ω)

dove,  µ√ 2 2 ¶


1−v n (ω)
ω r , per n(ω) < v1 ,
K v
I(ω, r) = µ√ ¶ (11.52)

 v 2 n2 (ω)−1
L v
ω r , per n(ω) > v1 .

~ usando la (11.46),
In modo analogo si determina l’espressione per A,
Z ∞
ω
−i (z − v t)
~ ~x) = e ~uz
A(t, e v I(ω, r) dω.
(2π)2 −∞

1
Per velocità piccole, ovvero, per v < n(ω)
∀ ω, la (11.51) si riduce alla (11.14), che
costituisce un potenziale regolare per qualsiasi ~x 6= ~v t. Per un mezzo non dispersivo (n
1
costante), e v > , la (11.51) si riduce invece alla (11.33), e si crea un fronte d’onda
n √
singolare per z − vt = −r v 2 n2 − 1. Illustriamo brevemente come questa singolarità
emerge dalla rappresentazione integrale (11.51). In questo caso si ha I = L per ogni ω, e
per grandi valori di ω la (11.37) fornisce l’andamento asintotico oscillante,
ω r√ 2 2
1 −i v n −1
I(ω, r) ∼ p e v . (11.53)
|ω|

330

Si vede allora che per z − vt = −r v 2 n2 − 1, nella (11.51) per grandi ω i due fattori
oscillanti si compensano tra di loro, e l’integrale in ω diverge: sul fronte d’onda A0 (t, ~x)
è quindi infinito.
1
Viceversa, se v > solo per un insieme limitato di frequenze – come succede in un
n(ω)
qualsiasi mezzo reale, vedi le (11.43) – allora per ω sufficientemente grande si ha I = K.
In questo caso l’andamento asintotico (11.53) è sostituito da, vedi (11.22),

|ω| r √
1 − 1 − v 2 n2
I(ω, r) ∼ p e v ,
|ω|

e l’integrale nella (11.51) converge allora per ogni ~x 6= ~v t. In un mezzo reale A0 (t, ~x) è
dunque una funzione regolare in tutto lo spazio, qualsiasi sia la velocità della particella, e
~ ~x).
non compare nessun fronte d’onda singolare. Risultati identici si ottengono per A(t,
Per quello che segue sarà comunque sufficiente conoscere esplicitamente le funzioni
spettrali A0 (ω), date in (11.48).

11.5 Perdita di energia ed emissione di fotoni

Stabilita la presenza di radiazione, in questa sezione quantifichiamo l’energia irradiata dal-


la particella durante il suo passaggio nel mezzo. Per il carattere stazionario del fenomeno
cercheremo l’energia emessa per unità di frequenza e per unità di spazio percorso,

d 2ε
.
dz dω

Prima di passare alla valutazione esplicita di questa grandezza a partire dai campi derivati
nella sezione precedente, presentiamo una derivazione euristica.

11.5.1 Un argomento euristico

Partiamo dalla formula generale dell’analisi spettrale della radiazione emessa da una
particella in moto aperiodico (10.42),
¯ Z ¯2
d 2ε e2 ω 2 ¯ ∞ ¯
= ¯ ~n × −i ω(t−~
e n·~
y)
~v dt ¯¯ . (11.54)
dω dΩ 16 π 3 ¯
−∞

Ricordiamo che questa formula è valida nel vuoto, con indice di rifrazione uguale a 1, e
d 2ε
per v < 1. Se la particella non è accelerata risulta ovviamento dω dΩ
= 0.

331
L’espressione (11.54) si riferisce all’energia emessa nell’unità di frequenza, lungo tutta
la traiettoria. Se un moto è illimitato e l’accelerazione ha una durata infinita, allora questa
grandezza in generale è divergente. Per ottenere un valore finito – eventualmente nullo
– consideriamo l’energia emessa durante un tempo finito, diciamo tra gli istanti −T e T .
Per fare questo dobbiamo limitare l’integrale temporale che compare nella (11.54) tra gli
estremi −T e T . Per determinare l’energia media emessa nell’unità di tempo dobbiamo
successivamente dividere per 2T , e prendere il limite per T → ∞. Infine, dividendo il
risultato cosı̀ ottenuto per v, otteniamo un’espressione per l’energia emessa nell’unità di
spazio percorso,
¯ Z T ¯2
d 3ε e2 ω 2 1 ¯¯ −i ω(t−~
n·~
y)
¯
¯ .
= lim ¯ ~
n × e ~
v dt ¯ (11.55)
dz dω dΩ 16 π 3 v T →∞ 2T −T

Se ~v è costante abbiamo ~y = ~v t, e svolgendo i calcoli si ottiene,


¯ Z ¯2
1 ¯ T ¯ ¡ ¢ sen2 ((1 − ~n · ~v ) ω T )
¯ ~n × −i ω(t−~
e n·~
y)
~v dt ¯¯ = 2 v 2 − (~n · ~v )2 · . (11.56)
2T ¯ (1 − ~n · ~v )2 ω 2 T
−T

Per eseguire il limite per T → ∞ è sufficiente notare che si ha il limite in S 0 ,

sen2 (T x)
lim = π δ(x),
T →∞ T x2

limite che si verifica facilmente applicando ambo i membri a una funzione di test. Usando
questa relazione il limite della (11.56) diventa,
¯ Z ¯2
1 ¯ T ¯ ¡ ¢
lim ¯ ~n × e−i ω(t−~n·~y) ~v dt ¯¯ = 2π v 2 − (~n · ~v )2 δ((1 − ~n · ~v ) ω)
T →∞ 2T ¯
−T
2π ¡ 2 ¢
= v − 1 δ (1 − ~n · ~v ) . (11.57)
ω

Ripristinando la velocità della luce e introducendo l’angolo ϑ tra ~v e la direzione di


emissione ~n, la (11.55) diventa allora,
µ ¶ ³ ´
d 3ε e2 ω v2 v
= 2 − 1 δ 1 − cosϑ . (11.58)
dz dω dΩ 8π v c c2 c

Per v < c l’argomento della δ non si annulla per nessun valore di ϑ e quindi non si
ha emissione di energia, come conviene a una particella che si muove di moto rettilineo
uniforme nel vuoto.

332
Continuazione analitica. La formula appena scritta, valida nel vuoto, ammette una
continuazione analitica naturale quando si è in presenza di un mezzo. È, infatti, sufficiente
effettuare nella (11.58) le sostituzioni (11.6), per ottenere (n ≡ n(ω)) 47 ,
µ 2 2 ¶ ³ ´
d 3ε e2 ω v n vn
= 2 −1 δ 1− cosϑ . (11.59)
dz dω dΩ 8π v n c c2 c
c
Si vede che per v > esiste ora un cono di direzioni di emissione, formanti con la velocità
n
della particella un’angolo ϑ determinato da,
c
cosϑ = ,
vn
angolo che coincide in effetti con l’angolo di Cerenkov (11.42). Grazie alla presenza della
δ è immediato effettuare l’integrale sugli angoli della (11.59). Siccome abbiamo,
Z ³ ´ Z 1 ³ ´
vn vn 2π c
δ 1− cosϑ dΩ = 2π δ 1− cosϑ dcosϑ = H(v n − c),
c −1 c vn
si ottiene, µ ¶
d 2ε e2 ω c2 c
= 1− 2 2 , se v > , (11.60)
dz dω 4πc2 v n n
d 2ε c
e dz dω
= 0, se v <
. La formula (11.60) è stata derivata da Frank e Tamm nel 1937, in
n
spiegazione dell’effetto Cerenkov. Torneremo al suo significato nel prossimo paragrafo.

11.5.2 La formula di Frank e Tamm

L’argomento del paragrafo precedente ha evidentemente carattere euristico e può risultare


piú o meno convincente; esso è comunque interessante per via degli strumenti che abbiamo
utilizzato. In questo paragrafo daremo, invece, una derivazione della formula di Frank e
Tamm a partire dai “principi primi”, ovvero a partire dall’analisi asintotica dei campi,
svolta nella sezione precedente.
Consideriamo allora l’energia totale ∆ε che la particella emette attraverso un cilindro
coassiale con la traiettoria, di raggio r e lunghezza ∆z = z2 −z1 , durante l’intero percorso.
Dai risultati della sezione precedente sappiamo che i campi dipendono da t e z solo
attraverso la combinazione z − vt, vedi (11.51), e ∆ε è quindi indipendente da z1 e z2 , e
dipende solo da ∆z. Risulta allora,
Z ∞³ ´ Z ∞ ³ ´
∆ε = (2πr ∆z) ~ ~
E × B · ~ur dt = (2πr ∆z) ~ ∗ (ω) × B(ω)
E ~ · ~ur dω,
−∞ −∞
47
Non si confonda l’indice di rifrazione n con il modulo del versore ~n, che vale 1.

333
dove abbiamo usato il teorema di Parseval. Come vedremo tra poco, frequenze positive
e negative contribuiscono in ugual maniera, e quindi l’energia emessa per unità di spazio
percorso e per unità di frequenza è data da,
d 2ε ³ ´
= 4πr E ~ ∗ (ω) × B(ω)
~ · ~ur . (11.61)
dz dω
Per calcolare l’energia “emessa” dobbiamo prendere il limite per r → ∞. Vediamo quindi
che per avere emissione di radiazione in simmetria cilindrica, a frequenza fissata i campi
1
devono decrescere all’infinito come √ , come “onde cilindriche”.
r
La valutazione esplicita della (11.61) è facilitata dai risultati della sezione precedente.
1
Per v < i campi decadono esponenzialmente, vedi (11.28), e non c’è emissione di
n(ω)
1
energia. Per v > l’andamento del potenziale per grandi r è stato determinato in
n(ω)
(11.40),
ω³ √
2 n2 − 1 r
´
e e−iπ/4 −i z + v
A0 (ω) = 2
· 2 2 √ e v . (11.62)
4πn (v n − 1)1/4 v ω r
~
Il campi E(ω) ~
e B(ω) si determinano facilmente eseguendo la trasformata di Fourier delle
definizioni (11.7), (11.8), e ricordando la (11.46),
³ ´
~
E(ω) ~ 0 (ω) − i ω A(ω)
= −∇A ~ =− ∇~ + i ω n2 ~v A0 (ω),

~
B(ω) ~ × A(ω)
= ∇ ~ ~ 0 = n2 ~v × E(ω).
= −n2~v × ∇A ~

~ 1
È quindi sufficiente calcolare E(ω), limitandosi ai termini di ordine √ . Nella valutazione
r
~ 0 è sufficiente derivare l’esponenziale in (11.62), perché la derivata di √1 porta a
di ∇A
r
1
termini di ordine 3/2 . Si ottiene cosı̀,
r
³ √ ´
~ 0 (ω) = − i ω ~uz + v 2 n2 − 1 ~ur A0 (ω),
∇A
v

iω√ 2 2 ³ √ ´
~
E(ω) = v n − 1 ~ur − v 2 n2 − 1 ~uz A0 (ω), (11.63)
v


~
B(ω) = i ω n2 v 2 n2 − 1 A0 (ω) ~uϕ . (11.64)

~
Polarizzazione. Dalle espressioni di E(ω) ~
e B(ω) vediamo in particolare che i vettori di
polarizzazione sono reali, a parte una fase overall. Concludiamo quindi che la radiazione

334
~ appartiene al piano
Cerenkov è linearmente polarizzata, e che la polarizzazione di E
contenente la direzione della particella e la direzione di propagazione della radiazione –
in accordo con le osservazioni fatte da Cerenkov.
Infine, inserendo le (11.63), (11.64) nella (11.61) si ottiene,

d 2ε 4πr n2 ω 2 ¡ 2 2 ¢3/2 0
= n v −1 |A (ω)|2 .
dz dω v

Calcolando dalla (11.62),


³ e ´2 1
|A0 (ω)|2 = 2
√ ,
4πn v ω r v 2 n2 − 1
si ottiene il risultato di Frank e Tamm,
µ ¶
d 2ε e2 ω c2
= 1− , (11.65)
dz dω 4πc2 v 2 n2 (ω)

dove abbiamo ripristinato la velocità della luce e la dipendenza dell’indice di rifrazione da


ω. Per determinare l’energia totale emessa per unità di spazio percorso, occorre integrare
la (11.65) sulle frequenze,
Z µ ¶
dε e2 c2
= ω 1− 2 2 dω,
dz 4πc2 v n (ω)
c
dove per una velocità fissata l’integrale si estende su tutte le frequenze per cui v > .
n(ω)
Siccome l’insieme di queste frequenze è un insieme limitato, l’energia emessa è sempre
finita.
Numero di fotoni emessi. Ricordando che radiazione di frequenza ω è composta da
fotoni di energia ~ω, possiamo anche determinare il numero N di fotoni che viene emesso
per unità di spazio percorso, nell’intervallo unitario di frequenze. Dividendo la (11.65)
per l’energia di un fotone risulta,
µ ¶
d 2N e2 c2
= 1− 2 2 ,
dz dω 4πc2 ~ v n (ω)

mentre il numero totale di fotoni emessi per unità di spazio percorso è dato da,
Z µ ¶
dN α c2
= 1− 2 2 dω, (11.66)
dz c v n (ω)
e2 1
dove abbiamo introdotto la costante di struttura fine α = = . Anche questo
4π~c 137
numero è quindi finito.

335
A titolo di esempio stimiamo il numero di fotoni emessi nello spettro visibile, da una
particella che viaggia con velocità prossima a quella della luce in acqua pura. Siccome
4
nell’ottico l’acqua ha un indice di rifrazione praticamente costante, n(ω) = , in questo
3
caso abbiamo,
c2 9 7
1− 2 2 =1− = .
v n (ω) 16 16
Considerando λ1 = 400nm e λ2 = 800nm, e ω1,2 = 2πc/λ1,2 , la (11.66) dà allora,
Z µ ¶ µ ¶
dN α ω1 c2 7πα 1 1
= 1− 2 2 dω = − ≈ 250/cm. (11.67)
dz c ω2 v n (ω) 8 λ1 λ2
Mentre la particella percorre un centimetro in acqua, essa emette dunque circa 250 fotoni
con frequenze nello spettro visibile. Si noti che la (11.67) permette di dare la stima
qualitativa generale,
dN α 1
≈ = ,
dz λ 137λ
che indica che su una distanza di 137 volte la lunghezza d’onda, la particella emette circa
un fotone.

11.6 Rivelatori Cerenkov

Un dispositivo sperimentale che si avvale dell’effetto Cerenkov per rivelare particelle ele-
mentari, viene chiamato “rivelatore Cerenkov”. In genere è costituito da un contenitore
riempito da un mezzo trasparente – il cosiddetto radiatore – per esempio acqua purissima,
che funge da dielettrico polarizzabile. La luce provocata dal passaggio di una particella
carica con velocità elevata viene raccolta da fotorivelatori. Dall’angolo di emissione, e dal
numero di fotoni emessi in un intervallo di lunghezze d’onda, vedi (11.42) e (11.67), si
determina la velocità della particella. Siccome la radiazione viene emessa su coni concen-
trici, si può risalire inoltre alla direzione del moto della particella. Benché le potenzialità
dell’effetto Cerenkov come base per un rivelatore fossero chiare sin dai primordi, è solo
l’avvento dei fotomoltiplicatori, capaci di rivelare con un’alta efficienza ed una risposta
veloce anche piccole intensità di luce, che permise a John Valentine Jelley nel 1951 di
sviluppare il primo dispositivo impiegato in un esperimento.
Super–Kamionkande. In tempi recenti rivelatori Cerenkov sono stati impiegati nelle
ricerche sulla fisica dei neutrini, effettuate dagli esperimenti “Kamiokande” e “Super–

336
Kamiokande” nelle miniere di Kamioka in Giappone. I neutrini interagiscono debolmente
con la materia, ma è possibile che un neutrino molto energetico interagisca con un atomo,
e trasferisca buona parte della sua energia ad una particella carica, tipicamente un elet-
trone o un muone, che irradia a sua volta luce Cerenkov. Super–Kamiokande si avvale di
un recipiente cilindrico di 40m di altezza e di diametro, contenente come radiatore 50.000
tonnellate di acqua purissima, la cui superficie è disseminata di circa 11.000 fotomolti-
plicatori. Gli esperimenti di Kamioka hanno conseguito scoperte importanti nel campo
della fisica dei neutrini. Cosı̀ nel 1987 Kamiokande rivelò per la prima volta un flusso
di neutrini proveniente dall’esplosione di una supernova, nella Grande Nube di Magel-
lano, mentre nel 1988 osservò neutrini provenienti dal Sole. Nel 1998 gli esperimenti di
Super–Kamiokande hanno invece fornito la prima evidenza sperimentale dell’oscillazione
dei neutrini, fenomeno che è possibile solo se i neutrini hanno una massa diversa da zero.
I rivelatori Cerenkov hanno giocato un ruolo altrettanto essenziale nella scoperta del-
l’antiprotone con il Bevatrone di Berkeley nel 1955, e in quella del quark charm nei
laboratori di Brookhaven nel 1974.

337
12 La reazione di radiazione

Riprendiamo le equazioni dell’Elettrodinamica per una particella singola,

∂µ F µν = j ν , (12.1)
dpµ
= e F µν (y)uν , (12.2)
ds

con le definizioni consuete,


Z
µν µ ν ν µ µ
F =∂ A −∂ A , j =e uµ δ 4 (x − y) ds.

Dalle analisi svolte nei capitoli precedenti appare evidente che, escluso casi banali, questo
sistema di equazioni accoppiate non può essere risolto analiticamente, e difatti finora ab-
biamo affrontato la sua soluzione adottando implicitamente un approccio “riduzionistico”.
Riassumiamolo brevemente.
Come primo passo abbiamo determinato la soluzione esatta dell’equazione di Maxwell
(12.1), assumendo nota la traiettoria y µ (s) della particella. Abbiamo trovato che il campo
elettromagnetico risultante è dato dalla somma del campo di Lienard–Wiechert (6.99),
µν
che d’ora in poi indicheremo con F µν , e di un arbitrario campo esterno libero Fin ,

µν
F µν = F µν + Fin . (12.3)

Se la particella si trovava in presenza di campi esterni noti, come i campi elettromagne-


tici negli acceleratori di particelle, oppure quello dell’onda piana che incide sull’elettrone
nell’effetto Thomson, abbiamo determinato preliminarmente la traiettoria della particella
µν
risolvendo l’equazione di Lorentz (12.2), ponendo ivi F µν = Fin : cosı̀ facendo abbiamo,
dunque, trascurato l’azione del campo di Lienard–Wiechert sulla particella stessa, ovvero,
abbiamo trascurato “l’autocampo”.
Avendo determinato la traiettoria della particella in questo modo, abbiamo calcolato
il campo da essa creato risolvendo la (12.1), e lo abbiamo poi valutato a grandi distanze
dalla stessa, per analizzare il quadrimomento trasportato dalla radiazione emessa. In al-
cuni casi siamo inoltre stati in grado di quantificare l’effetto dell’emissione di radiazione
sul moto della particella, invocando la conservazione del quadrimomento. Abbiamo visto

338
che in generale questo effetto è costituito da una diminuzione dell’energia della particel-
la, e da una variazione della sua quantità di moto. Ricordiamo come esempi la forza di
reazione nella diffusione Thomson, la diminuzione della velocità di una particella carica
in un ciclotrone, e il collasso dell’atomo di idrogeno classico. Questo effetto secondario,
chiamato “reazione di radiazione”, “forza di frenamento” o anche “forza di autointera-
zione”, scaturisce dall’azione del campo elettromagnetico F µν (x) creato dalla particella,
sulla particella stessa. Per ragioni di località questa azione può avvenire solo nel punto
x = y(s) ≡ y dove la particella si trova, e quindi deve coinvolgere il valore del campo
F µν (y) in quel punto. Corrispondentemente, dalle (12.2) e (12.3) si vede che la forza di
frenamento è rappresentata proprio dal termine,

e F µν (y) uν . (12.4)

Tuttavia, come abbiamo anticipato varie volte, la grandezza F µν (y) – l’autocampo –


è sempre infinita! Più precisamente, per ~x → ~y (t) si ha che l’istante ritardato t0 si
48
approssima a t, vedi (6.94), e segue che ,

R = |~x − ~y (t0 )| ∼ |~x − ~y (t)| ≡ r.

Dalle (6.100)–(6.102) si vede allora che nelle vicinanze della traiettoria domina il campo
coulombiano, e che per ~x → ~y (t), ovvero, per xµ → y µ , il campo di Lienard–Wiechert
(6.99) diverge come,
1
F µν (x) ∼ . (12.5)
r2
Questa è la ragione per cui abbiamo rinviato la trattazione sistematica della reazione di
radiazione fino a questo capitolo.
48
In realtà, quando ~x → ~y (t), la distanza R = |~x − ~y (t0 )| si identificata con la “distanza fisica”
r = |~x − ~y (t)|, solo modulo una costante moltiplicativa. Risolvendo la condizione del ritardo (6.94) al
primo ordine in r, si trova infatti,
à p !
~
v · m
~ + 1 − v 2 + (~
v · m)
~ 2 ~x − ~y (t)
t0 (t, ~x) = t − r + o(r2 ), m
~ ≡ .
1 − v2 r

Dato che R = |~x − ~y (t0 )| = t − t0 (t, ~x), si ottiene allora,


à p !
~ + 1 − v 2 + (~v · m)
~v · m ~ 2
R= r + o(r2 ).
1 − v2

Vicino alla linea di universo R differisce quindi da r per una costante moltiplicativa, di origine relativistica,
che però non si annulla mai.

339
A parte la difficoltà concettuale appena menzionata, appare chiaro che l’approccio
riduzionistico adottato finora non può che avere validità limitata, perché il moto della
particella è determinato non solo dalle forze esterne, ma anche dalla forza di frenamento,
e in generale queste due forze devono essere prese in considerazione contemporaneamen-
te. Nelle prossime sezioni affronteremo il problema della reazione di radiazione in modo
sistematico, a partire dai principi primi, cioè, dalle equazioni (12.1) e (12.2).
Particelle puntiformi e divergenze ultraviolette. Le divergenze appena evidenziate si
riflettono anche nella definizione dell’energia totale del campo elettromagnetico, come
discusso nel caso della particella statica nel paragrafo 2.3.4. Nel caso generale, a causa
della (12.5), vicino alla particella il tensore energia–impulso del campo elettromagnetico
(2.69) diverge come,
µν 1
Tem ∼ ,
r4
che rappresenta una singolarità non integrabile in R3 . Per ogni t fissato gli integrali del
µ
R 0µ 3
quadrimomento totale, Pem = Tem d x, sono quindi divergenti. Questo problema verrà
affrontato e risolto nel capitolo 13, dove faremo vedere come si può costruire un nuovo
tensore energia–impulso, ben definito nello spazio delle distribuzioni, conservato e con
quadrimomento totale finito.
È chiaro che l’origine di entrambe le patologie quı̀ descritte – forza di frenamento
divergente, e energia del campo elettromagnetico infinita – risiede nella struttura punti-
forme della particella carica. È infatti proprio la distribuzione puntiforme della carica
a dare luogo a un campo, che nelle immediate vicinanze della particella diverge come
1/r2 . In teoria quantistica, a causa del principio di indeterminazione, l’analisi di regioni
molto piccole richiede energie molto elevate, ovvero, fotoni con frequenze molto grandi.
Per questo motivo divergenze che occorrono a piccole scale spaziali vengono comunemen-
te chiamate “divergenze ultraviolette“ – anche nell’ambito della fisica classica – mentre
divergenze che emergono a distanze grandi vengono chiamate “divergenze infrarosse”. Le
divergenze presenti nella forza di frenamento e nell’energia del campo elettromagnetico
corrispondono quindi a divergenze ultraviolette, perché si percepiscono a distanze molto
piccole dalla particella. D’altra parte una particella carica puntiforme non dà luogo a nes-
suna singolarità infrarossa, perchè all’infinito il campo decresce come 1/r2 , e l’integrale

340
R 0µ 3 49
del quadrimomento Tem d x converge quindi a grandi distanze .
Viceversa, una particella con una distribuzione più regolare di carica, per esempio
una distribuzione superficiale su una sfera rigida, creerebbe un campo elettromagnetico
ovunque privo di singolarità. Tuttavia, una tale distribuzione sarebbe in conflitto con i
principi della Relatività: il vincolo di rigidità richiederebbe forze interne a “distanza”,
che violerebbero la causalità, e la compensazione della repulsione elettrostatica della di-
stribuzione di carica, richiederebbe l’introduzione di nuove forze di legame, di origine non
elettromagnetica. Volendo preservare i postulati della Relatività e l’economia inerente alla
formulazione minimale dell’Elettrodinamica – che non prevede altre forze fuorché quelle
di origine elettromagnetica – preferiamo mantenere le particelle puntiformi, e modificare
invece l’equazione di Lorentz – sostituendola con l’equazione di Lorentz–Dirac (12.12).

12.1 Forze di frenamento: analisi preliminare

Prima di passare a un’analisi sistematica delle forze di frenamento facciamo qualche con-
siderazione di carattere generale. Ci sono, infatti, molti casi in cui localmente le forze di
frenamento possono essere trattate come una perturbazione, ed eventualmente trascura-
te. Con “localmente trascurabile” intendiamo il fatto che queste forze influenzano poco il
moto instantaneo della particella. Questo succede, per esempio, se le forze di frenamento
sono piccole rispetto alle forze esterne primarie, oppure se esse vengono compensate da
opportune forze esterne aggiuntive – come le cavità a radiofrequenza in un ciclotrone, o i
generatori di differenza di pontenziale che mantengono gli elettroni in un’antenna in stato
di oscillazione.
Forze di frenamento trascurabili. Analizziamo ora qualitativamente le condizioni fisi-
che in cui le forze di frenamento sono localmente trascurabili. Adottiamo il seguente
criterio: la reazione di radiazione può essere trascurata, se l’energia ∆ε persa dalla par-
ticella a causa dell’irraggiamento durante un intervallo temporale, è piccola rispetto al-
l’energia ∆ε0 fornita dalla forza esterna nello stesso intervallo temporale. Applichiamo
il criterio nel limite non relativistico. Indichiamo con T la scala temporale caratteristi-
49
Per ogni t fissato, a grandi distanze F µν decresce come 1/r2 , purchè la particella sia accelerata per
un intervallo temporale finito. In caso contrario domina il campo di accelerazione, e F µν decresce come
1/r.

341
ca della forza esterna, ovvero, il tempo durante il quale la velocità della particella varia
apprezzabilmente, ∆v ∼ v. Se a è l’accelerazione della particella abbiamo dunque,

∆v ∼ a T ∼ v.

Allora possiamo usare la formula di Larmor per stimare,

e2 a2
∆ε ∼ T,

mentre l’energia comunicata dalla forza esterna alla particella nel tempo T è,
µ ¶
1
∆ε0 = ∆ m v ∼ m v ∆v ∼ m a2 T 2 .
2
2

Si ottiene allora,
∆ε e2 1
∼ .
∆ε0 3πm T
La quantità,
e2
τ= , (12.6)
6πmc3
corrisponde a un tempo molto piccolo, che è legato al raggio classico della particella dalla
2r0
relazione τ = . Per l’elettrone si ha, per esempio,
3c

τ = 0.6 · 10−23 s.

Abbiamo quindi,
∆ε τ
∼ . (12.7)
∆ε0 T
Localmente la reazione di radiazione è quindi trascurabile, fino a quando la scala tempo-
rale T sulla quale la forza esterna varia sensibilmente è grande rispetto a τ . Al contrario,
la reazione di radiazione non può essere trascurata, se la forza varia molto violentemente,
ovvero, se durante l’intervallo temporale piccolo τ essa subisce una variazione relati-
va apprezzabile. Torneremo sull’effetto di forze di questo tipo nel paragrafo 12.2.5, in
connessione con il fenomeno della “preaccelerazione”.
L’analisi appena svolta ha validità locale. Anche se le forze variano su scale tempo-
rali T À τ , esse possono comunque dare luogo ad effetti cumulativi apprezzabili. Cosı̀
un elettrone in un ciclotrone non relativistico dopo un tempo sufficientemente grande si

342
arresta. D’altra parte, come abbiamo visto nel paragrafo 9.2.2, nel ciclotrone ultrarela-
tivistico l’irraggiamento ha effetti importanti anche localmente, e può portare all’arresto
della particella in una frazione piccolissima di secondo. In questi casi la reazione di radia-
zione certamente non può essere trascurata, e in certe situazioni essa può diventare anche
dominante rispetto alla stessa forza esterna.

12.1.1 Un argomento euristico per l’equazione di Lorentz–Dirac

Tornando all’equazione di Lorentz (12.2) e sostituendo la soluzione generale dell’equazione


di Maxwell (12.3), si arriva a,
dpµ µν
= e F µν (y) uν + e Fin (y) uν . (12.8)
ds
Per rendere operativa questa equazione dovremmo valutare esplicitamente la forza di fre-
namento (12.4) – divergente. La valutazione di questa forza è in realtà indispensabile, per
chiudere il sistema di equazioni che governano l’Elettrodinamica di una particella carica.
Sostituito al posto di F µν il campo di Lienard–Wiechert, la (12.8) corrisponderebbe ap-
punto a quattro equazioni del secondo ordine nelle incognite y µ (s), di cui tre indipendenti.
L’intero problema dinamico dell’Elettrodinamica sarebbe cosı̀ ricondotto alla soluzione di
queste tre equazioni del secondo ordine: per quanto complicate esse siano, la legge oraria
~y (t) della particella sarebbe completamente determinata dai dati iniziali ~y (0) e ~v (0). In
realtà vedremo che, una volta eliminate le divergenze attraverso un’opportuna procedu-
ra di “rinormalizzazione”, in ultima analisi questa strategia non potrà essere portata a
termine.
Prima di passare all’analisi esplicita della forza di frenamento (divergente), presentia-
mo un semplice argomento euristico per derivare una sua possibile espressione finita. A
questo scopo ricordiamo che il quadrimomento irradiato dalla particella al tempo proprio
s, e che raggiunge l’infinito, è dato dalla formula relativistica di Larmor (9.8),
µ
dPrad e2 2 µ
=− w u . (12.9)
ds 6π
Se il quadrimomento totale si deve conservare, allora ci dobbiamo aspettare che la parti-
cella ceda questa quantità di quadrimomento, subendo la forza di frenamento,
dpµ e2 2 µ µν
= w u + · · · + e Fin (y) uν , (12.10)
ds 6π

343
dove abbiamo indicato la presenza di eventuali termini addizionali. Infatti, indipenden-
temente dalla presenza o meno del campo esterno, il termine di Larmor non può essere
l’unico termine presente al membro di destra di questa equazione. Per convincersi di
questo è sufficiente contrarre l’equazione con uµ : il membro di sinistra si annulla allora,
perchè uµ wµ = 0, mentre quello di destra resta diverso da zero. In realtà abbiamo già
anticipato la possibilità della presenza di termini addizionali, quando nel paragrafo 9.1.2
abbiamo discusso il significato della (12.9). L’analisi appena svolta dimostra che questi
contributi addizionali sono necessariamente presenti, e non è difficile avanzare un’ipotesi
sulla loro forma. È sufficiente notare l’identità,
dwµ
uµ = −w2 , (12.11)
ds
che si ottiene derivando rispetto a s la relazione uµ wµ = 0,
dwµ
wµ wµ + uµ = 0.
ds
Allora è immediato vedere che un completamento dell’equazione (12.10) – consistente con
dpµ
il vincolo uµ = 0 – è costituito dall’equazione di Lorentz–Dirac 50 ,
ds
µ ¶
dpµ e2 dwµ 2 µ µν
= + w u + e Fin (y) uν . (12.12)
ds 6π ds
Insistiamo sul fatto che questa equazione non potrà essere dedotta dalla (12.8), perché
quest’ultima è divergente.
La conclusione dell’analisi preliminare di questa sezione è che non è possibile derivare
un’equazione chiusa per la dinamica di una particella carica, a partire dalle equazioni di
Maxwell e di Lorentz: la teoria deve quindi necessariamente essere modificata. Dall’analisi
svolta si capisce anche che, volendo mantenere le equazioni di Maxwell – nella cui soluzione
tra l’altro non abbiamo incontrato nessuna inconsistenza – dovremo modificare l’equazione
di Lorentz.

12.2 L’equazione di Lorentz–Dirac

In questa sezione presenteremo una deduzione dell’equazione di Lorentz–Dirac, a partire


da un’equazione di Lorentz modificata, in particolare “regolarizzata”, e analizzeremo le
50
Lorentz dedusse la versione non relativistica di questa equazione nel 1904, mentre Dirac ottenne la
versione covariante (12.12) nel 1938.

344
sue proprietà più salienti. Per semplicità considereremo prima una particella singola,
presentando la generalizzazione al caso di N particelle alla fine della sezione.
Per l’equazione del moto per una particella carica consistente – in sostituzione dell’e-
quazione di Lorentz – poniamo le seguenti richieste minimali, di ovvio significato:
1) Invarianza relativistica.
2) Assenza di termini divergenti nell’equazione.
dpµ
3) Consistenza dell’equazione con l’identità uµ = 0.
ds
4) Compatibilità con la conservazione del quadrimomento totale.
In seguito ci occuperemo delle richieste 1) – 3), mentre la richiesta 4), non meno
importante delle altre, verrà affrontata nel capitolo 13.
Incominciamo riprendendo l’espressione per il campo di Lienard–Wiechert (6.99),
e ³ ´
F µν (x) = Lµ ν
u + Lµ
[(uL) w ν
− (wL) u ν
] − (µ ↔ ν) . (12.13)
4π(uL)3
Ricordiamo che,
Lµ (x) = xµ − y µ (λ), (12.14)

e che le variabili cinematiche della particella, y(λ), u(λ), e w(λ), sono valutate al tempo
ritardato proprio λ(x), definito da,

(x − y(λ))2 = 0, x0 > y 0 (λ). (12.15)

Regolarizzazione e rinormalizzazione. La nostra strategia per ottenere un’equazione di


Lorentz “finita”, a partire dall’equazione di Lorentz singolare (12.8), segue una procedura
che viene applicata comunemente nelle teorie di campo quantistiche relativistiche, per
curare le divergenze ultraviolette. Questa procedura prevede due passaggi, il primo è
costituito da una “regolarizzazione”, e il secondo da una “rinormalizzazione”. Vediamo
come essa si attua in concreto.
Come primo passo si introduce un regolarizzatore ε > 0, che nel presente caso avrà le
dimensioni di una lunghezza. Si introduce poi un campo di Lienard–Wiechert regolariz-
zato,
F µν (x) → Fεµν (x), (12.16)

soggetto al limite puntuale,


lim Fεµν (x) = F µν (x),
ε→0

345
con la richiesta che esso sia regolare sulla traiettoria. Richiediamo, cioè, che la grandezza,

Fεµν (y(s)),

sia finita per ogni ε > 0, e per ogni s. Come secondo ingrediente della procedura sosti-
tuiamo la massa m della particella con il parametro mε , la cui forma verrà specificata in
51
seguito . Non necessariamente dovrà essere, e non sarà, limε→0 mε = m.
La nostra proposta per la nuova equazione di Lorentz, in sostituzione della (12.8), è
allora, · ¸
duµ µν µν
lim mε − e Fε (y) uν − e Fin (y) uν = 0, (12.17)
ε→0 ds
purché si riesca a trovare un parametro mε , che elimini dall’equazione eventuali termini
divergenti per ε → 0. Si noti che quest’ultima condizione è molto restrittiva, perché per
qualsiasi scelta di mε si riescono ad eliminare solo termini divergenti che sono proporzionali
duµ
a wµ = . Questo passaggio finale viene chiamato “rinormalizzazione”.
ds
Formulata in questo modo, se un tale mε esiste la nostra proposta soddisfa automatica-
mente le richieste 2) e 3). La richiesta 3) è soddisfatta semplicemente perché nella (12.17)
uν moltiplica sempre un tensore antisimmetrico. La richiesta 1) sarà, invece, soddisfatta
se la regolarizzazione (12.16) preserva l’invarianza di Lorentz. Con ciò intendiamo che
il campo Fεµν (x) si trasforma come un campo tensoriale sotto trasformazioni di Lorentz,
per ogni ε > 0.

12.2.1 Derivazione dell’equazione

Implementeremo ora questo programma, scegliendo una specifica regolarizzazione che


preserva l’invarianza di Lorentz.
Una regolarizzazione Lorentz–invariante. Introduciamo un campo di Lienard–Wiechert
regolarizzato mantenendo formalmente l’espressione (12.13), ma sostituendo la funzione
λ(x) di (12.15), con l’espressione regolarizzata λε (x), definita da,

(x − y(λε ))2 = ε2 , x0 > y 0 (λε ). (12.18)


51
A priori si potrebbe anche introdurre una carica regolarizzata eε , ma nel caso in questione non è
necessario.

346
52
Definiamo, cioè ,
¯
µν ¯
Fεµν =F ¯ . (12.19)
λ→λε

Questa regolarizzazione preserva l’invarianza di Lorentz, perché le condizioni (12.18) sono


Lorentz–invarianti. Si ricordi, in particolare, che il cono luce futuro è Lorentz–invariante.
È anche immediato vedere che Fεµν (y), dove sottintendiamo y µ ≡ y µ (s), è ben definito
per ogni ε > 0. Infatti, valutando la (12.18) per xµ = y µ (s) abbiamo,

(y(s) − y(λε ))2 = ε2 ,

che pone, al posto della soluzione λ = s del caso non regolarizzato,

λε = s − ε + o(ε2 ).

Si ottiene cosı̀,

Lµε (y(s)) = y µ (s) − y µ (λε ) = ε uµ (s) + o(ε2 ) ⇒ (uL)ε = ε + o(ε2 ) 6= 0.

1
Il prefattore della versione regolarizzata di (12.13) è quindi finito lungo tutta la
[(uL)ε ]3
traiettoria, e l’autocampo Fεµν (y) è allora ben definito per ogni ε > 0 e per ogni s.
La regolarizzazione (12.19) ha l’ulteriore pregio di preservare la struttura causale del
campo non regolarizzato. Dalla (12.18) si vede infatti che Fεµν (x) dipende dalle variabili
cinematiche y, u e w della particella nel punto y(λε ), che è connesso a x attraverso un
segnale causale futuro, segnale che per ε > 0 si propaga con velocità strettamente minore
della velocità della luce. Inoltre, non è difficile dimostrare che vale λε (x) < λ(x), per ogni
ε > 0. In questo modo il campo regolarizzato Fεµν (x) dipende dalle variabili cinematiche
della particella a un istante ritardato precedente all’istante ritardato fisico t0 (x), ma non
dalle variabili cinematiche ad istanti successivi a t0 (x).
52
Non è difficile convincersi che questa regolarizzazione equivale a tutti gli effetti a sostituire la funzione
di Green ritardata G, con la funzione di Green regolarizzata, ma ancora Lorentz invariante, Gε , data da,
1 1
G= H(x0 )δ(x2 ) ⇒ Gε = H(x0 )δ(x2 − ε2 ).
2π 2π
Definendo Aµε = Gε ∗ j µ , è infatti immediato dimostrare che vale,

Fεµν = ∂ µ Aνε − ∂ ν Aµε .

347
Il campo regolarizzato del moto rettilineo uniforeme. Prima di applicare questa rego-
larizzazione a un moto generico, la illustriamo nel caso di una particella in moto rettilineo
uniforme, con linea di universo,

y µ (s) = uµ s, wµ (s) = 0.

In questo caso possiamo determinare il campo di Lienard–Wiechert regolarizzato esatta-


mente. Come primo passo determiniamo λε (x), risolvendo il vincolo (12.18),
p
(x − uλ)2 = ε2 ⇒ λε (x) = (ux) − (ux)2 − x2 + ε2 .

Secondo la (12.19) dobbiamo allora valutare la (12.13), sostituendo λ(x) → λε (x). Ab-
biamo,
p
Lµε = xµ − uµ λε (x) ⇒ (uL)ε = (ux) − λε (x) = (ux)2 − x2 + ε2 .

Siccome wµ = 0, la (12.13) dà allora,

e x µ uν − x ν uµ
Fεµν (x) = , (12.20)
4π [(ux)2 − x2 + ε2 )]3/2

espressione manifestamente Lorentz–invariante. Per ε → 0 si riottiene evidentemente il


campo creato da una particella in moto rettilineo uniforme, vedi (6.66). Ma il campo
(12.20) è ora ben definito anche sulla traiettora della particella, cioè, per xµ = y µ (s) =
uµ s. Il denominatore si riduce infatti a 4πε3 , mentre il numeratore va a zero, e quindi,

Fεµν (y) = 0.

Anche il limite limε→0 Fεµν (y) è allora nullo. Questo significa che una particella che si
µν
muove di moto rettilineo uniforme, quindi con Fin = 0, non esercita nessuna autointe-
razione. Questo risultato è evidentemente in accordo con il fatto che una particella che
non è accelerata non emette radiazione. Dall’analisi appena svolta traiamo anche un’al-
tra conclusione importante: per un moto arbitrario il limite (divergente) limε→0 Fεµν (y)
deve necessariamente dipendere dalla quadriaccelerazione wµ e/o eventualmente dalle sue
derivate, perché per un moto rettilineo uniforme esso è zero.
Rinormalizzazione della massa. Torniamo ora al caso generale. Per analizzare il limite
in (12.17) dobbiamo determinare l’andamento dell’autocampo Fεµν (y), nel limite per ε →

348
0. Nel paragrafo 12.2.2 faremo vedere che per un moto generale questo limite non esiste,
e che Fεµν (y) ammette invece lo sviluppo in serie di Laurent attorno a ε = 0,
µ ν µ

µν e µ ν ν µ e µ dw ν dw
Fε (y) = (u w − u w ) − u −u + o(ε). (12.21)
8πε 6π ds ds

Utilizzando questo risultato è facile valutare la forza di frenamento regolarizzata, che


compare in (12.17). Usando l’identità (12.11) si ottiene,
µ ¶
µν e2 dwµ 2 µ e2 µ
e Fε (y) uν = +w u − w + o(ε).
6π ds 8πε

Come si vede, la forza di frenamento contiene un termine divergente per ε → 0, che è


duµ
però proporzionale a . Grazie a questa circostanza, a meno di termini di ordine ε la
ds
(12.17) si scrive dunque,
µ ¶ µ ¶
e2 duµ e2 dwµ 2 µ µν
mε + = + w u + e Fin uν . (12.22)
8πε ds 6π ds

Il termine divergente può allora essere eliminato se si sceglie per la massa regolarizzata il
valore, tendente a −∞,
e2
mε = m − ,
8πε
dove identifichiamo m con la massa fisica finita della particella. Questa ridefinizione
(infinita) della massa della particella rappresenta la “rinormalizzazione”. Dopo questa
operazione la (12.22) si riduce in effetti all’equazione di Dirac–Lorentz (12.12). Questa
equazione può essere scritta anche come,
µ µ ¶
µ dw 2 µ e µν
w =τ + w u + Fin uν , (12.23)
ds m

dove il parametro τ , con le dimensioni di un tempo, è lo stesso che compare nella (12.6),
e2
τ = . Si vede che questo tempo è massimo per la particella carica più leggera,
6πmc3
ovvero, per l’elettrone.
Equazioni di Lorentz–Dirac per un sistema di N particelle. È immediato generalizza-
re l’equazione (12.12) a un sistema di N particelle cariche. In questo caso nell’equazione
della particella r–esima bisogna tenere conto anche dei campi di Lienard–Wiechert Fsµν ,
creati dalle altre particelle. Si ottiene cosı̀,
µ ¶
dpµr e2r dwrµ
= + wr ur + er Frµν (yr ) urν ,
2 µ
(12.24)
dsr 6π dsr

349
dove il “campo esterno” agente sulla particella r–esima è dato da,

µν
X
Frµν = Fin + Fsµν . (12.25)
s6=r

È chiaro che il campo Frµν (x) non presenta nessuna singolarità in x = yr .


Analizzeremo le caratteristiche principali dell’equazione di Lorentz–Dirac nel paragrafo
12.2.3.

12.2.2 Determinazione dell’autocampo regolarizzato

In questo paragrafo dimostriamo la formula (12.21). La valutazione di Fεµν (y(s)) richiede


intanto di determinare per ogni s fissato il parametro λε , tale che, vedi (12.18),

(y(s) − y(λε ))2 = ε2 . (12.26)

Siccome per ε → 0 abbiamo che λε → s, è conveniente porre,

λε = s − ∆, (12.27)

dove ∆ è un parametro positivo che per ε → 0 va a zero. Più precisamente, inserendo la


(12.27) nella (12.26) e sviluppando in serie si ottiene,
· µ ¶ ¸2
1 2
y(s) − y(s) − ∆ u(s) + ∆ w(s) + o(∆ ) = ∆2 + o(∆4 ) = ε2 ,
3
2

e quindi,
∆ = ε + o(ε3 ). (12.28)

Invece di analizzare il limite di Fεµν (y(s)) per ε → 0, possiamo allora usare la (12.27) e
analizzarne il limite per ∆ → 0. Per quello che segue sarà sufficiente sapere che ∆ ugaglia
ε, modulo termini cubici.
In definitiva si tratta quindi di sviluppare l’espressione,
· ´¸
µν e 1 ³ µ ν µ γ ν γ ν
Fε (y(s)) = L u + L Lγ [u w − w u ] − (µ ↔ ν) , (12.29)
4π (uL)3 λ=s−∆

in serie di Laurant attorno a ∆ = 0, dove in questa formula è sottointeso che,

Lµ = y µ (s) − y µ (λ).

350
Siccome nella (12.29) a denominatore compare il termine (uL)3 , ed Lµ è di ordine ∆,
è necessario espandere il numeratore fino al terzo ordine in ∆. Definendo uµ ≡ uµ (s),
dwµ dwµ
wµ ≡ wµ (s) e ds
≡ ds
(s) otteniamo gli sviluppi,

1 2 µ 1 3 dwµ
Lµ = y µ (s) − y µ (λ) = ∆ uµ − ∆w + ∆ + o(∆4 ),
2 6 ds
1 2 dwµ
uµ (λ) = uµ − ∆wµ + ∆ + o(∆3 ),
2 ds
dwµ
wµ (λ) = wµ − ∆ + o(∆2 ),
ds

usando i quali è facile espandere i vari termini che compaiono nella (12.29) fino all’ordine
desiderato,

(uL) = uµ (λ)Lµ = ∆ + o(∆3 ),


µ ν µ

µ ν ν µ 1 2 µ ν ν µ 1 3 µ dw ν dw
L u (λ) − L u (λ) = − ∆ (u w − u w ) + ∆ u −u ,
2 3 ds ds
µ ν γ

γ ν γ ν γ ν ν γ γ dw ν dw
[u w − w u ] (λ) = u w − u w − ∆ u −u ,
ds ds
µ ν µ

µ γ ν γ ν 2 µ ν ν µ 3 µ dw ν dw
L Lγ [u w − w u ] (λ) − (µ ↔ ν) = ∆ (u w − u w ) − ∆ u −u .
ds ds

Inserendo queste espressioni nella (12.29) si ottiene in definitiva,


µ ν µ

µν e µ ν ν µ e µ dw ν dw
Fε (y(s)) = (u w − u w ) − u −u + o(∆), (12.30)
8π∆ 6π ds ds

dove, data la (12.28), ∆ può essere sostituito di nuovo con ε. Il risultato è quindi la
(12.21).

12.2.3 Caratteristiche dell’equazione di Lorentz–Dirac

Il ruolo dell’equazione. Insistiamo sul fatto che l’equazione di Lorentz–Dirac non è stata
“dedotta” dalle equazioni dell’Elettrodinamica, ma che ne abbiamo data una deduzione
euristica: in ultima analisi essa deve venire postulata. La sua giustificazione ultima di-
scende, invece, dal fatto che, come spiegheremo nel capitolo 13, essa viene imposta dalla
conservazione del quadrimomento totale del sistema particelle + campi. Non per niente
Dirac basò la sua deduzione dell’equazione su argomenti di conservazione.
Finora abbiamo determinato il moto di una particella carica, tenendo conto solo della
forza esterna e/o della forza di interazione con le altre particelle cariche, vedi il termine

351
Frµν (yr ) nella (12.24). In base al moto cosı̀ derivato abbiamo determinato la radiazione
emessa e, infine, tramite la formula di Larmor abbiamo analizzato gli effetti della forza
di frenamento, trattandola come una perturbazione. Questa procedura approssimata
deve essere ora sostituita, in linea di principio, dalla soluzione del sistema di equazioni
accoppiate dato in (12.24) – autointerazioni comprese.
Forza di frenamento e termine di Schott. Il vettore,
µ ¶
µ e2 dwµ 2 µ
Γ = +w u , (12.31)
6π ds

in (12.12) rappresenta la quadriforza di frenamento, ed è composto da due termini. Il


secondo termine è il termine di Larmor, la cui presenza è stata ipotizzata in sezione
12.1, sfruttando la conservazione del quadrimomento. Il primo termine, detto “termine
dell’energia di Schott”, è invece necessario per assicurare la consistenza della forza di
frenamento con l’identità uµ (dpµ /ds) = 0, cioè, la nostra richiesta 3). Ricordiamo, infatti,
che la (12.11) assicura che vale identicamente,

uµ Γµ = 0.

Bilancio del quadrimomento. Abbiamo appena visto che il termine di Schott non ori-
gina da una legge di conservazione, ma da una richiesta di consistenza algebrica. Cor-
rispondentemente facciamo notare che questo termine non contribuisce al bilancio del
quadrimomento totale, 1) in un processo di scattering, per cui wµ → 0 per s → ±∞ e, 2)
durante un moto quasi–periodico. In entrambi i casi si ha, infatti,
Z f
µ e2 dwµ e2 ¡ µ ¢
∆PSchott = ds = wf − wiµ = 0.
6π i ds 6π

La variazione totale del quadrimomento della particella è quindi dovuta soltanto al termine
di Larmor – come supposto in tutte le nostre analisi precedenti – e evidentemente al campo
µν
esterno Fin , ovverosia, in presenza di più particelle, a Frµν .
Conflitto con il determinismo e condizioni supplementari. Pur non contribuendo al bi-
lancio del quadrimomento totale, il termine di Schott ha effetti locali sul moto della parti-
cella, che in generale non possono essere trascurati. Per di più questo termine è in conflitto
con il determinismo newtoniano, perché contiene la derivata terza delle coordinate ~y (t)

352
rispetto al tempo: dunque il moto non è più univocamente determinato, note ~y (0) e ~v (0).
Date queste condizioni iniziali sarebbero, infatti, possibili infiniti moti diversi, a seconda
dell’accelerazione iniziale ~a(0). Questa circostanza, oltre a essere in contrasto con l’os-
servazione, svuoterebbe l’equazione del moto del suo potere predittivo. Concludiamo,
quindi, che non tutte le soluzioni dell’equazione di Lorentz–Dirac possono corrispondere a
moti realizzati in natura, ed occorre allora imporre opportune condizioni supplementari,
atte a selezionare i moti fisicamente ammessi, senza inficiare l’invarianza di Lorentz.
Se supponiamo che i campi esterni vanno a zero all’infinito spaziale con sufficiente
rapiditià, allora esistono delle condizioni supplementari che si offrono in modo naturale.
Se all’infinito i campi svaniscono è, infatti, naturale aspettarsi che per tempi grandi l’ac-
celerazione tenda a zero, e che la velocità tenda a un valore limite, diverso dalla velocità
53
della luce. Imponiamo dunque le seguenti condizioni supplementari ,

lim wµ (s) = 0, lim uµ (s) = uµ∞ . (12.32)


s→+∞ s→+∞

Non imponiamo condizioni analoghe per s → −∞, per un motivo che sarà chiaro tra
poco. Si noti che nel linguaggio tridimensionale queste condizioni equivalgono a,

lim ~a(t) = 0, lim ~v (t) = ~v∞ , |~v∞ | < 1. (12.33)


t→+∞ t→+∞

Sotto opportune condizioni di regolarità, la richiesta dell’annullamento asintotico del-


l’accelerazione implica la costanza asintotica della velocità, sicché la seconda condizione
in (12.32) risulta ridondante. Esploreremo le conseguenze fisiche di queste condizioni
supplementari nelle soluzioni esplicite dei prossimi paragrafi.
Un determinismo alternativo del terzo ordine? Una strategia alternativa all’imposizio-
ne delle (12.32) – più pragmatica e “sperimentale”, ma anche più rinunciataria – potrebbe
essere la seguente. Supponiamo di misurare all’istante iniziale non solo posizione e velo-
cità, ma anche l’accelerezione della particella. Con questi tre dati iniziali l’equazione di
Lorentz–Dirac determinerebbe il moto della particella allora univocamente, e si potrebbe
cosı̀ predire la sua posizione ad ogni istante successivo. Oltre a essere in conflitto con il
53
Difatti queste condizioni sono soddisfatte anche per i “moti limitati”. In un acceleratore, per esempio,
una particella non può essere alimentata da un campo elettrico per un tempo infinito, e irraggiando perde
quindi energia fino a quando non raggiunge una velocità nulla o costante.

353
determinismo newtoniano, questo determinismo “del terzo ordine” fallisce, tuttavia, per
motivi sperimentali. Illustriamolo nell’esempio della particella libera. Per accertare se
essa si muove di moto rettilineo unifome, l’osservatore misura la velocità della particella
in vari istanti, ma alla fine potrà solo fornire un valore massimo, seppur molto piccolo,
per l’accelerazione. Tuttavia, dalla soluzione generale dell’equazione di Lorentz–Dirac
per la particella libera, vedi (12.40), si vede che per una qualsiasi accelerazione iniziale
diversa da zero, la particella accelera violentemente, e la sua velocità tende a quella della
luce. L’osservatore concluderebbe, quindi, che teoria ed esperimento sono in disaccordo.
L’unico modo per verificare la teoria consisterebbe nell’eseguire misure con errori nulli,
ottenendo per l’accelerazione il valore zero, ma questo non è possibile.
L’equazione di Lorentz–Dirac e il principio variazionale. Una volta sostituita l’equa-
zione di Lorentz – che sappiamo discendere attraverso il principio variazionale dall’azione
(4.7) – con l’equazione di Lorentz–Dirac, resta la domanda se anche quest’ultima possa
essere dedotta da un’opportuna azione. La questione è rilevante in quanto l’esistenza di
un’azione assicurerebbe, grazie al teorema di Noether, l’esistenza di un tensore energia–
impulso conservato e simmetrico. Il fatto che non esiste nessuna azione canonica da cui
l’equazione di Lorentz–Dirac possa essere dedotta – il motivo essendo essenzialmente la
comparsa della derivata terza delle coordinate – mette cosı̀ in dubbio la conservazione del
quadrimomento e del momento angolare totali in Elettrodinamica classica. Per illustrare il
µν
problema consideriamo una particella singola in un campo esterno Fin = ∂ µ Aνin − ∂ ν Aνin ,
nel qual caso si tratterebbe di trovare un’azione che riproduce l’equazione (12.12). In
assenza della forza di frenamento l’azione sarebbe data dalla (4.7). D’altra parte, per
riprodurre la forza di frenamento (12.31), che contiene un termine lineare nella deri-
vata terza delle y µ , nell’azione devono comparire termini quadratici nelle y µ , con com-
plessivamente tre derivate. Imponendo anche l’invarianza relativistica e l’invarianza per
riparametrizzazione della linea d’universo, la forma più generale dell’azione sarebbe allora,
Z Z Z µ ¶
µ 2 dy µ d2 yµ 3
µ d yµ
I = −m ds − e Ain dyµ + e a + by ds, (12.34)
ds ds2 ds3

dove a e b sono costanti adimensionali. A questo punto notiamo, però, che il primo termine
nella parentesi uguaglia a uµ wµ , che è zero identicamente, mentre il secondo termine può

354
essere ricondotto al primo attraverso un’integrazione per parti,

d3 yµ d µ dy µ d2 yµ d µ
yµ 3
= (y wµ ) − 2
= (y wµ ) .
ds ds ds ds ds

Nell’azione questo termine dà quindi luogo a un termine al bordo, che non contribuisce
alle equazioni del moto. L’azione (12.34) fornisce dunque l’equazione del moto dpµ /ds =
µν
eFin uν , e non l’equazione di Lorentz–Dirac.
L’assenza di un’azione da cui l’equazione di Lorentz–Dirac possa essere dedotta com-
porta, in particolare, che un eventuale tensore energia–impulso conservato debba essere
costruito “a mano”, problema che verrà affrontato nel capitolo 13.

12.2.4 La particella carica libera: soluzione esatta

In alcuni casi semplici l’equazione di Lorentz–Dirac può essere risolta esattamente, un


esempio essendo quello della particella libera. In questo caso si tratta di risolvere la
µν
(12.23) con Fin = 0, µ ¶
µ dwµ 2 µ
w =τ +w u . (12.35)
ds
Limite non relativistico e soluzioni “runaway”. Prima di affrontare la soluzione ge-
nerale di questa equazione, la risolviamo nel limite non relativistico. Per fare questo
dobbiamo sviluppare la (12.35) in serie di potenze di 1/c, ed arrestarci all’ordine più bas-
so. È sufficiente considerare le tre equazioni funzionalmente indipendenti, ovvero, quelle
spaziali, che possono essere scritte come,
µ ¶
τ dw
~ 2
~=√
w + w ~v , (12.36)
1 − v2 dt

dove,

1 d ~v ~a ~v · ~a a2 − (~a × ~v )2
~=√
w √ = 2
+ ~v , w2 = − ,
1 − v 2 dt 1 − v 2 1−v (1 − v 2 )2 (1 − v 2 )3

vedi problema 2.1. Moltiplicando l’espressione di w


~ scalarmente per ~v si ottiene,

~v · ~a
~v · w
~= ,
(1 − v 2 )2

e cosı̀ possiamo esprimere ~a in termini di w,


~

~a = (1 − v 2 ) (w
~ − (~v · w)
~ ~v ) .

355
e2
Sostituendo per w
~ la (12.36), e ricordando che si ha τ = , si ottiene l’equazione di
6πmc3
Newton tridimensionale,
q
e2 1 − vc2 µ dw µ ¶ µ ¶ ¶
2
~ 1 dw~ 1 v2 2
m ~a = − 2 ~v · ~v + 2 1 − 2 w ~v , (12.37)
6πc3 dt c dt c c

dove abbiamo ripristinato la velocità della luce. Come si vede, nell’espansione non re-
lativistica il contributo dominante proviene dal termine di Schott, che è di ordine 1/c3 ,
mentre il termine di Larmor dà luogo a contributi di ordine 1/c5 . Tenendo nella (12.37)
solo il termine dominante, e ricordando che w ~ = ~a + o(1/c2 ), concludiamo che nel limite
e2 d~a
non relativistico la (12.35) si riduce semplicemente a m~a = , ovvero,
6πc3 dt
d~a
~a = τ . (12.38)
dt

La soluzione generale di questa equazione è,


¡ ¢
~ et/τ
~a(t) = C ⇒ ~ et/τ − 1 + ~v0 ,
~v (t) = τ C

~ è un arbitrario vettore costante. Si riscontra quindi un fenomeno anomalo: pur


dove C
trovandosi in assenza di forze esterne, la particella accelera, e per t → +∞ la sua velocità
tende a più infinito, mentre non si riscontra nessuna anomalia per t → −∞. Queste
soluzioni, chiamate “runaway solutions”, non sono quindi fisicamente accettabili e devono
essere scartate. Se si impongono le condizioni supplementari (12.33), si vede che le uniche
~ = 0. Otteniamo quindi,
soluzioni che le soddisfano sono quelle per cui C

~v (t) = ~v0 ,

corrispondente a un moto rettilineo uniforme – come si conviene a una particella libera.


La situazione appena vista è prototipica: il ruolo delle condizioni supplementari
sarà, infatti, sempre quello di eliminare le soluzioni che fisicamente non sono accetta-
bili. Nei prossimi paragrafi vedremo, tuttavia, che in presenza di interazione le soluzioni
dell’equazione di Lorentz–Dirac che soddisfano anche le (12.32), pur non esibendo un
comportamento anomalo di tipo runaway, sono in conflitto con la causalità.
Soluzione relativistica esatta. Abbiamo appena visto che in approssimazione non rela-
tivistica l’equazione di Lorentz–Dirac comporta moti per cui la velocità della particella

356
aumenta indefinitamente, comportamento che di per sè invalida l’approssimazione stessa.
Cerchiamo allora di risolvere l’equazione (12.35) esattamente. Per trovare la sua soluzione
generale è conveniente eseguire il cambiamento di variabile,
d λ d
s → λ(s) = e s/τ , = .
ds τ dλ
d
Indicando la derivata con un primo “ 0 ”, si ha,

λ dwµ 1 ¡ ¢
wµ = uµ0 , = 2 λ2 uµ00 + λ uµ0 ,
τ ds τ
e la (12.35) si riduce allora a,

u00µ + (u0 u0 ) uµ = 0, (u0 u0 ) ≡ u0ν uν 0 . (12.39)

Per risolvere questa equazione notiamo che l’identità u2 = 1, implica che (uu0 ) = 0.
Contraendo la (12.39) con uµ0 si ottiene allora,
1 0 0 0
0 = (u0 u00 ) = (u u ) ⇒ (u0 u0 ) = −K 2 ,
2
con K costante positiva. Risostituendo questo risultato nella (12.39) si ottiene l’equazione
del repulsore armonico, con soluzione generale,
λ K ¡ µ Kλ ¢
uµ = Aµ eKλ + B µ e−Kλ , wµ = A e − B µ e−Kλ , (12.40)
τ
dove Aµ e B µ sono vettori costanti. Infine, per soddisfare il vincolo u2 = 1, questi vettori
devono essere vincolati dalle relazioni,
1
A2 = 0 = B 2 , A µ Bµ = . (12.41)
2
Come si vede, le soluzioni (12.40) esibiscono di nuovo un comportamento di tipo runa-
way, in quanto per s → +∞, che corrisponde a λ → +∞, tutte le componenti della
quadrivelocità divergono. Per grandi s l’energia, per esempio, cresce come,
³ ³ s ´´
0 0
ε(s) = m u (s) ∼ m A exp K exp .
τ
Allo stesso modo divergono tutte le componenti di uµ e wµ . Corrispondentemente per
s → +∞ la velocità della particella tende alla velocità della luce, la velocità asintotica
essendo data da,
~u ~
A
~v∞ = lim ~v = lim = , |~v∞ | = 1.
s→+∞ s→+∞ u0 ~
|A|

357
Di nuovo vediamo che per s → −∞, che corrisponde a λ → 0, la quadrivelocità ammette
invece limite finito,
lim uµ (s) = Aµ + B µ ,
s→−∞

sicché per s → −∞ la velocità tende a un valore minore della velocità della luce. Si noti
~ = 0 e/o B
che le scelte A ~ = 0 sono proibite dalle (12.41).

Imponiamo allora di nuovo le condizioni supplementari (12.32). Dalle (12.40) si vede


che le uniche soluzioni per cui wµ (s) tende a zero per s → +∞, sono quelle corrispondenti
a,
K=0 ⇒ wµ (s) = 0, ∀ s,

che comporta uµ (s) = Aµ + B µ = costante.


Concludiamo che le uniche soluzioni dell’equazione di Lorentz–Dirac per la particella
libera, compatibili con le (12.32), corrispondono a moti rettilini uniformi, in accordo con
l’esperienza. Nel prossimo paragrafo vedremo, invece, che in presenza di forze esterne la
situazione sarà alquanto più problematica.

12.2.5 Moto in campo costante: preaccelerazione

Analizzeremo ora il moto di una particella soggetta a un campo elettrico indipendente


dal tempo e unidirezionale, esteso a una regione spaziale limitata. Considereremo soli
moti che avvengono lungo la stessa direzione del campo. Questo esempio, per quanto
semplice possa sembrare, esibisce tutti gli aspetti problematici inerenti all’equazione di
Lorentz–Dirac in presenza di una generica forza esterna.
µν
In questo caso il campo esterno Fin consiste di un campo elettrico, diciamo in direzione
~ = (0, 0, E), e di un campo magnetico nullo. Per il momento non facciamo nessuna
z, E
ipotesi sulla dipendenza di E da z, a parte la solita condizione asintotica,

lim E(z) = 0.
z→±∞

È allora consistente assumere che il moto avvenga lungo l’asse delle z. Definendo,

u ≡ u3 ,
d
e indicando la derivata con un primo “ 0 ”, abbiamo allora,
ds
uµ = (u0 , 0, 0, u), (u0 )2 − u2 = 1, wµ = (u00 , 0, 0, u0 ).

358
Riferendoci alla (12.23) la quadriforza esterna diventa allora,

µν
¡ ¢
e Fin uν = eEu, 0, 0, eEu0 .

Siccome la variabile u0 è una funzione di u – che diventa l’unica incognita del sistema – è
sufficiente scrivere la componente z dell’equazione di Lorentz–Dirac, come unica equazione
funzionalmente indipendente. Dato che si ha,

d√ uu0
u00 = 1 + u2 = √ ,
ds 1 + u2

segue,
u02
w2 = u002 − u02 = − ,
1 + u2
e la componente z della (12.23) si scrive allora,
µ ¶
0 00 u u02 F
u =τ u − 2
+ u0 , F ≡ e E, (12.42)
1+u m

dove F è la forza esterna. È conveniente cambiare incognita u(s) → γ(s), secondo,

u = sinh γ, u0 = cosh γ,

che dopo semplici passaggi riduce la (12.42) a,

F
γ 0 = τ γ 00 + . (12.43)
m

Per quello che segue è utile riscrivere γ 0 come,


du
1 du
γ 0 = ds = ,
du u0 ds

che equivale quindi a,
du w3
γ0 = = 0. (12.44)
dt u
Aanalizzamo ora le caratteristiche della soluzione generale della (12.43). Siccome
all’infinito spaziale il campo esterno va a zero, per s → +∞ l’equazione si riduce sempli-
cemente a,

γ 0 = τ γ 00 ⇒ γ 0 = Ces/τ ⇒ γ = Cτ es/τ + B. (12.45)

359
La quadrivelocità u(s) = sinh γ(s) diverge quindi di nuovo violentemente per s → +∞,
anche se la forza all’infinito va zero, e le (12.32) impongono di nuovo C = 0. Per
E(z) = 0 identicamente, riotteniamo in particolare le soluzioni della particella libera
(12.40). Tuttavia, per E 6= 0 non è più cosı̀ ovvio in che modo possiamo imporre le
condizioni supplementari (12.32), e che effetto tali condizioni avranno sulle soluzioni che
le soddisfano.
Campo esterno uniforme. Per fare un esempio concreto supponiamo che il campo elet-
trico sia diverso da zero solo in un intervallo dell’asse z, e che sia ivi costante. Sarà
allora,
F (s) = e E χ[a,b] (s),

dove abbiamo introdotto la funzione caratteristica dell’intervallo [a, b], ed E è costante.


Per una forza esterna siffatta è facile scrivere la soluzione generale (“integrale primo”)
della (12.43),
F eE ¡ ¢
γ0 = + H(a − s) e(s−a)/τ − H(b − s) e(s−b)/τ + C es/τ , (12.46)
m m
con C costante arbitraria. Per s → +∞ si conferma l’andamento asintotico (12.45), in
quanto per s > b le funzioni di Heaviside si annullano entrambe.
È ora facile imporre le (12.32), che in questo caso si riducono a,

lim w3 = 0, lim u0 = u0∞ .


s→+∞ s→+∞

Per via della (12.44) questo significa che deve essere,

lim γ 0 = 0,
s→+∞

e l’unico valore di C per cui ciò succede risulta essere ancora C = 0. Usando la (12.44) e
introducendo la quantità di moto p = mu, la (12.46) si riduce allora a,
dp
= F + Ff r , (12.47)
dt
dove,
¡ ¢
Ff r = eE H(a − s) e(s−a)/τ − H(b − s) e(s−b)/τ ,

rappresenta la forza di frenamento. La (12.47) è da interpretarsi a tutti gli effetti come


l’equazione di Newton della particella, che tiene conto anche della reazione di radiazione.

360
Si vede che la forza di frenamento è diversa da zero ∀ s < a, e la particella subisce quindi
una “preaccelerazione” lungo un intero tratto dell’asse z, in cui la forza esterna è nulla.
Questo fenomeno è chiaramente in conflitto con la causalità in quanto “l’effetto”, cioè,
l’accelerazione, precederebbe la “causa”, cioè, la forza esterna. D’altra parte la forza di
frenamento Ff r – responsabile della preaccelerazione – è sensibilmente diversa da zero
solo negli intervalli [a, a − τ ] e [b, b − τ ]. Questa forza distorce quindi apprezzabilmente la
forza esterna solo se b − a ∼ τ , cioè, se il campo esterno varia apprezzabilmente su scale
temporali piccolissime, dell’ordine di τ .
Da questa soluzione esatta dell’equazione di Lorentz–Dirac vediamo che (l’inevitabile)
riduzione dell’equazione dal terzo al secondo ordine, comporta una violazione della cau-
salità – sotto forma di una preaccelerazione – su una scala temporale dell’ordine di τ .
Nella prossima sezione faremo vedere che questa conclusione ha carattere completamente
generale, e discuteremo in particolare la possibilità di osservare questa rottura di causalità
sperimentalmente.

12.3 L’equazione integro–differenziale di Rohrlich

In questa sezione vogliamo analizzare le proprietà generali del sottoinsieme di soluzioni


dell’equazione di Lorentz–Dirac, che soddisfano anche le condizioni supplementari (12.32).
Abbiamo visto che queste ultime sono necessarie per eliminare le soluzioni runaway, e
per rendere l’equazione di Lorentz–Dirac nuovamente compatibile con il determinismo
54
newtoniano. Con le condizioni “iniziali” ,

y µ (0) = y0µ , uµ (0) = uµ0 , lim wµ (s) = 0, (12.48)


s→+∞

l’equazione (12.23) ammette, infatti, un’unica soluzione.


Vediamo allora quali sono le caratteristiche delle soluzioni che soddisfano questi dati
iniziali, in particolare la condizione asintotica sull’accelerazione. Un metodo standard per
imporre concretamente una condizione iniziale su un’equazione differenziale di ordine n,
consiste nel trasformare l’equazione differenziale in un’equazione integro–differenziale di
54
L’unicità della soluzione è garantita sotto opportune ipotesi di regolarità della forza esterna. In
particolare in (12.48) abbiamo omesso la condizione dell’esistenza della velocità asintotica – vedi (12.32)
– in quanto implicata, sotto opportune condizioni, dall’annullamento della quadriaccelerazione asintotica.

361
ordine n − 1, che ingloba automaticamente la condizione iniziale. In generale ci sono vari
55
modi per operare questa riduzione; noi seguiremo quı̀ il metodo di F. Rohrlich , che ha
il particolare pregio di preservare l’invarianza di Lorentz a vista.
Riprendiamo dunque l’equazione di Lorentz–Dirac (12.23), riscrivendola nella forma,
µ ¶
µ dwµ e2 2 µ µν
m w −τ = w u + e Fin uν ≡ F µ . (12.49)
ds 6π
µν e2
Siccome e Fin uν è la forza esterna, e il termine di Larmor 6π
w2 uµ è responsabile dell’e-
missione del quadrimomento totale, interpretiamo F µ come la quadriforza totale effettiva.
Un argomento qualitativo. Prima di procedere diamo un argomento qualitativo – ma
generale – per la presenza inevitabile di un effetto di preaccelerazione, in una generica
soluzione dell’equazione di Lorentz–Dirac. Siccome τ è piccolo possiamo, infatti, riscrivere
la (12.49) come,
m wµ (s − τ ) ≈ F µ (s),

oppure,
m wµ (s) ≈ F µ (s + τ ). (12.50)

L’accelerazione all’istante s sarebbe quindi determinata dalla forza effettiva all’istante


avanzato s0 ∼ s + τ , di nuovo in conflitto con la causalità.
Riduciamo ora l’equazione differenziale del terzo ordine (12.49), a un’equazione integro–
differenziale del secondo ordine, imponendo la condizione asintotica su wµ in (12.48). A
questo scopo moltiplichiamo l’equazione per e−s/τ e la riscriviamo nella forma,

d ¡ −s/τ µ ¢
−m τ e w (s) = e−s/τ F µ (s).
ds

Integrando tra un generico istante s e un istante finale b otteniamo,


Z b
¡ −s/τ µ −b/τ µ
¢ 1
m e w (s) − e w (b) = e−λ/τ F µ (λ) dλ. (12.51)
τ s

Per imporre la condizione,


lim wµ (b) = 0,
b→+∞

55
F. Rohrlich, Classical charged particles, Addison–Wesley, Massachusetts, 1965.

362
eseguiamo nella (12.51) il limite per b → +∞, ottenendo 56 ,
Z
−s/τ µ 1 ∞ −λ/τ µ
me w (s) = e F (λ) dλ.
τ s
Dopo il cambiamento di variabile λ = ατ + s, si ottiene l’equazione integro–differenziale
di Rohrlich,
Z ∞
µ
m w (s) = e−α F µ (s + τ α) dα. (12.52)
0

Questa equazione è ora del secondo ordine nelle derivate di y µ (s) – altamente non lineare
in quanto F in generale è una funzione complicata di y, u e della stessa w – che ammette,
tuttavia, soluzione unica, note le condizioni iniziali y0 e u0 . L’equazione presuppone
implicitamente l’esistenza dell’integrale a secondo membro nella (12.52).
Abbiamo già anticipato che il pregio principale di questa equazione è la sua Lorentz–
invarianza manifesta. Uno dei suoi difetti, invece, sta nel fatto che difficilmente essa
può essere usata per analizzare in concreto l’effetto della forza di frenamento sul moto
della particella. Per esempio, nel caso della particella libera la forza effettiva si riduce
e2
a Fµ = 6π
w2 uµ , ma non è immediato risolvere la (12.52) esplicitamente – nemmeno in
questo caso semplice. Si può, tuttavia, verificare che tra le soluzioni generali (12.40), le
µν
uniche che soddisfano la (12.52) con Fin = 0, sono quelle per cui K = 0.

12.3.1 Preaccelerazione e violazione della causalità

Eseguiamo ora un’analisi qualitativa delle soluzioni dell’equazione di Rohrlich. Come


prima cosa osserviamo che l’accelerazione nel punto s non dipende solo dal valore della
forza effettiva F µ in s, ma anche dai suoi valori in tutti gli istanti successivi s0 = s + τ α.
Di nuovo riscontriamo, quindi, una violazione della causalità sotto forma di una preac-
celerazione. Tuttavia, grazie alla presenza del fattore di damping e−α , che nell’integrale
sopprime i contributi provenienti dai valori di α À 1, gli istanti che contribuiscono mag-
giormente all’accelerazione in s, sono quelli dell’ordine di s0 ∼ s + τ , in accordo con la
(12.50).
56
Si noti che per una soluzione generica il termine e−b/τ wµ (b) diverge per b → +∞, nonostante la
presenza del termine di smorzamento e−b/τ , perché wµ (b) diverge più fortemente dell’esponenziale. Si
veda in proposito la soluzione per la particella libera (12.40), nel qual caso,
wµ (b) ∼ K · exp(b/τ ) · exp[K(exp(b/τ ))].

363
Per quantificare l’effetto della violazione della causalità riscriviamo la (12.52) nel modo
seguente,

m wµ (s) = F µ (s) + ∆F µ (s), (12.53)


Z ∞
µ
∆F (s) ≡ e−α [F µ (s + τ α) − F µ (s)] dα. (12.54)
0

Abbiamo cosı̀ diviso la forza risultante in due contributi: il primo, F µ (s), rappresenta la
forza “nominale” e dipende solo da s. Il secondo invece, ∆F µ (s), codifica la violazione
della causalità. In particolare, confrontando la (12.53) con la (12.49) vediamo che questo
ultimo eguaglia proprio il termine di Schott,
dwµ
∆F µ (s) = m τ .
ds
La violazione della causalità sarà quindi riscontrabile sperimentalmente, se ∆F µ è ap-
prezzabile rispetto a F µ . Per stimare ∆F µ notiamo che, come visto sopra, nell’inte-
grale (12.54) i valori di α rilevanti sono dell’ordine dell’unità. Possiamo quindi porre
F µ (s + τ α) ∼ F µ (s + τ ), e dare la stima,
Z ∞
µ
∆F (s) ≈ e−α [F µ (s + τ ) − F µ (s)] dα = F µ (s + τ ) − F µ (s). (12.55)
0

∆F µ eguaglia, quindi, la variazione di F µ su una scala temporale dell’ordine di τ . Se


questa variazione è piccola rispetto a F µ , allora la violazione della causalità sarà inosser-
vabile. Di nuovo vediamo che il fenomeno della preaccelerazione risulta osservabile solo se
i campi esterni variano in modo apprezzabile durante il tempo τ = 0.6 · 10−23 s. Si noti che
in questo tempo la luce percorre lo spazio c τ ∼ r0 , pari al raggio classico della particella.
Violazione della causalità e Meccanica Quantistica. Analizziamo ora l’effetto di campi
57
variabili cosı̀ rapidamente a livello quantistico . Per campi che variano su una scala
temporale generica ∆T , il principio di Heisenberg predice un’indeterminazione in energia
~
dell’ordine di ∆ε ∼ . D’altra parte, la scala energetica alla quale si innesca la pro-
∆T
duzione di coppie virtuali particella/antiparticella è data da ∆ε ∼ 2m. Per raggiungere
questa soglia è allora necessario che i campi varino su una scala temporale dell’ordine di,
~ 4π~ e2
∆T ∼ ∼ 2 ∼ 137 τ.
2m e 6πm
57
L’analisi quantistica che segue va pensata svolta nel sistema di riferimento in cui la particella è istan-
taneamente a riposo, dove valgono le leggi della Meccanica Quantistica non relativistica. In particolare,
il tempo proprio s si identifica allora con il tempo t.

364
Per poter osservare una violazione della causalità in Elettrodinamica classica servireb-
bero, invece, campi che variano su una scala temporale τ , scala che è di un fattore 137
più piccola di ∆T ! Campi siffatti danno dunque luogo alla produzione di coppie, e si
trovano quindi già in forte regime quantistico. Concludiamo che la rottura classica della
causalità è schermata da effetti quantistici: nel regime in cui la violazione della causalità
si manifesterebbe, l’Elettrodinamica classica non è più valida, e la rottura della causalità
quindi inosservabile.
A una conclusione analoga si arriva considerando una particella che si muove sotto
l’effetto di una forza esterna, che le imprime una frequenza ω. In questo caso si ha, da
(12.55),
dF µ (s)
∆F µ (s) ∼ τ ∼ τ ω F µ (s).
ds
∆F µ (s) è quindi apprezzabile rispetto a F µ (s) solo se la frequenza è molto grande, del-
1 2π
l’ordine di ω ∼ , ovverosia, dato che λ = , se la lunghezza d’onda della radiazione
τ ω
emessa è molto piccola, dell’ordine di λ ∼ r0 . D’altra parte, l’ordine di grandezza del-
le lunghezze d’onda alle quali l’Elettrodinamica classica cessa di valere, è rappresentato
dalla lunghezza d’onda Compton,

~
λC = ∼ 137 r0 .
m

Per lunghezze d’onda di questo ordine di grandezza incomincia a manifestarsi la natura


quantistica del campo elettromagnetico, cioè, la sua composizione in termini di fotoni.
Per poter osservare la violazione della causalità servirebbero, invece, lunghezze d’onda
dell’ordine di λ ∼ r0 , che sono di un fattore 137 più piccole di λC . Per lunghezze d’onda
cosı̀ corte il campo elettromagnetico si trova già in pieno regime quantistico, ed eventuali
effetti acausali sono di nuovo inosservabili.
Riassumendo possiamo quindi affermare che l’equazione di Lorentz–Dirac, ovverosia,
la sua versione integro–differenziale di Rohrlich, dà luogo a una violazione della causa-
lità, che rende l’Elettrodinamica classica inconsistente. Tuttavia, da un punto di vista
fenomenologico questa violazione avviene su scale di distanze, energie e tempi per cui l’E-
lettrodinamica classica non è più valida, e deve essere sostituita dalla teoria quantistica
relativistica dei campi.

365
12.4 Il problema relativistico a due corpi

In questa sezione analizziamo il bilancio del quadrimomento nel problema a due corpi
relativistico. Ci limiteremo a considerare due particelle cariche che percorrono orbite
aperte, essendo sottoposte alla sola interazione elettromagnetica reciproca. Nel limite
non relativistico queste orbite sono iperboli.
Limite non relativistico. Riassumiamo prima la descrizione della dinamica di questo
sistema nel limite non relativistico, v1,2 ¿ 1. Indicando le leggi orarie con ~y1,2 ≡ ~y1,2 (t),
in questo caso le particelle obbediscono alle equazioni del moto e leggi della potenza,

d~p1 ~ 2 (~y1 ), dε1 ~ 2 (~y1 ),


= e1 E = e1 ~v1 · E (12.56)
dt dt
d~p2 ~ 1 (~y2 ), dε2 ~ 1 (~y2 ),
= e2 E = e2 ~v2 · E (12.57)
dt dt

dove i campi elettrici (di Lienard–Wiechert) non relativistici sono dati da,

~ 1 (~x) = e1 ~x − ~y1 ,
E ~ 2 (~x) = e2 ~x − ~y2 .
E
4π |~x − ~y1 |3 4π |~x − ~y2 |3
~ 2 (~y1 ) + e2 E
Vale il principio di azione e reazione e1 E ~ 1 (~y2 ) = 0, e quindi si conserva la

quantità di moto totale p~1 + p~2 . Per quanto riguarda l’energia risulta invece,
µ ¶
d(ε1 + ε2 ) d e1 e2 dεp
=− ≡− , (12.58)
dt dt 4π|~y1 − ~y2 | dt

e si conserva l’energia “meccanica” ε1 + ε2 + εp . Siccome l’energia potenziale εp a t = ±∞


si annulla, si conserva pure l’energia cinetica totale ε1 + ε2 , tra t = −∞ e t = +∞.
Indicando con “∆” la variazione tra questi due istanti asintotici abbiamo quindi,

∆pµ ≡ ∆(pµ1 + pµ2 ) = 0. (12.59)

Diffusione relativistica. Consideriamo ora lo stesso processo a livello relativistico. In


questo caso le (12.56), (12.57) devono essere sostituite dalle equazioni, vedi (12.24),
µ ¶
dpµ1 e21 dw1µ
= 2 µ
+ w1 u1 + e1 F2µν (y1 ) u1ν , (12.60)
ds1 6π ds1
µ ¶
dpµ2 e22 dw2µ
= 2 µ
+ w2 u2 + e2 F1µν (y2 ) u2ν , (12.61)
ds2 6π ds2
µν
dove F1,2 (x) sono i campi di Lienard–Wiechert prodotti dalle due particelle. In questo caso
non vale più il principio di azione e reazione, e di conseguenza la (12.59) risulta violata.

366
Come sappiamo, il quadrimomento totale delle due particelle non si conserva durante il
processo di diffusione a causa dell’emissione di radiazione – che nel limite non relativistico
viene trascurata. In quanto segue vogliamo trovare la generalizzazione relativistica della
(12.59).
Per velocità arbitrarie le orbite delle particelle non sono più iperboli, ma asintotica-
mente l’accelerazione è ancora nulla, perché a grandi distanze la forza di mutua interazione
58
svanisce . Avremo quindi,

lim wµ (s) = 0, lim uµ (s) = uµ± , (12.62)


s→±∞ s→±∞

per entrambe le particelle. Integrando le (12.60), (12.61) tra s = −∞ e s = +∞, il


termine di Schott allora non contribuisce, e risulta,
Z Z
µ e21
∆p1 = w1 u1 ds1 + e1 F2µν (y1 ) u1ν ds1 ,
2 µ
(12.63)

Z Z
µ e22
∆p2 = w2 u2 ds2 + e2 F1µν (y2 ) u2ν ds2 .
2 µ
(12.64)

Occupiamoci ora degli integrali che coinvolgono la forza di interazione reciproca. Espri-
mendo il tensore di Maxwell in termini del potenziale vettore abbiamo,
Z Z
e1 F2 (y1 ) u1ν ds1 = e1 [∂ µ Aν2 (y1 ) − ∂ ν Aµ2 (y1 )] u1ν ds1
µν

Z Z
µ ν dAµ (y1 )
= e1 ∂ A2 (y1 )u1ν ds1 − e1 ds1
ds1
Z
= e1 ∂ µ Aν2 (y1 )u1ν ds1 − e1 (Aµ (∞) − Aµ (−∞))
Z
= e1 ∂ µ Aν2 (y1 )u1ν ds1 , (12.65)

dove abbiamo sfruttato il fatto che il potenziale vettore all’infinito spaziale si annulla.
Per valutare il termine rimasto conviene usare l’espressione per il potenziale di Lienard–
Wiechert data in (6.86),
Z
e2
Aν2 (x) = uν2 H(x0 − y20 ) δ((x − y2 )2 ) ds2 .

Si ottiene,
Z
e2
∂ µ
Aν2 (x) = (xµ − y2µ ) uν2 H(x0 − y20 ) δ 0 ((x − y2 )2 ) ds2 ,
π
58
È sottinteso che selezioniamo le soluzioni “fische” delle (12.60), (12.61), che soddisfano le condizioni
supplementari (12.32).

367
in quanto la derivata della funzione di Heaviside non contribuisce, e quindi,
Z Z Z
e1 e2
µ ν
e1 ∂ A2 (y1 )u1ν ds1 = ds1 ds2 (y1µ − y2µ ) (u2 u1 ) H(y10 − y20 ) δ 0 ((y1 − y2 )2 ).
π

Sommando le (12.63) e (12.64), per la variazione del quadrimomento totale delle due
particelle tra t = −∞ e t = +∞ si ottiene allora,
Z Z
e21 2 µ e22
∆p =µ
w1 u1 ds1 + w22 uµ2 ds2 + (12.66)
6π 6π
Z Z
e1 e2 ¡ ¢
ds1 ds2 (y1µ − y2µ ) (u2 u1 ) H(y10 − y20 ) − H(y20 − y10 ) δ 0 ((y1 − y2 )2 ),
π

versione relativistica della (12.59). Al membro di destra abbiamo il contributo dei due
termini di Larmor, che rappresentano la radiazione emessa dalle due particelle singolar-
mente. Ma poi compare un ulteriore termine, proporzionale a e1 e2 ed originante quindi
dalle forze di mutua interazione, che è dovuto all’interferenza tra i campi di radiazione
delle due particelle.
Per analizzare la natura delle varie correzioni relativistiche contenute nella (12.66) è più
conveniente tornare alle equazioni di partenza (12.60) e (12.61), ed eseguirne un’espansione
non relativistica. In questo modo saremo anche in grado di confrontarle direttamente con
le (12.56), (12.57).

12.4.1 Espansione non relativistica

Di seguito eseguiremo un’espansione non relativistica in potenze di 1/c, delle equazioni


(12.60) e (12.61). Dalle espansioni del paragrafo 12.2.4 sappiamo che le forze di frenamento
cominciano con termini di ordine 1/c3 , e conosciamo anche la loro forma. Limitandoci
a termini fino all’ordine 1/c3 , le componenti spaziali delle (12.60) e (12.61) si scrivono
allora,

d~p1 e21 d~a1 ~


= + F21 , (12.67)
dt 6πc3 dt

d~p2 e22 d~a2 ~


= + F12 , (12.68)
dt 6πc3 dt

dove abbiamo definito le forze di interazione,


µ ¶ µ ¶
~ ~ ~v1 ~ ~ ~ ~v2 ~
F21 = e1 E2 (y1 ) + × B2 (y1 ) , F12 = e2 E1 (y2 ) + × B1 (y2 ) . (12.69)
c c

368
Per quanto riguarda, invece, le leggi della potenza occorre valutare la componente 0 della
forza di frenamento Γµ , vedi (12.31). In questo caso contribuiscono sia il termine di
Larmor, che quello di Schott,
µ ¶ µ ¶ µ ¶
0 e2 1 dw0 e2 d 1
Γ = 3
q + w2 = (~v · ~a) − |~a|2 +o
6πc 1− v2 dt 6πc3 dt c5
c2
µ ¶
e2 d~a 1
= 3
~v · +o 5 .
6πc dt c
Arrestandoci all’ordine 1/c3 , le componenti µ = 0 delle (12.60), (12.61) si riducono allora
a,
dε1 e21 d~a1 ~ 2 (y1 ),
= 3
~v1 · + e1 ~v1 · E (12.70)
dt 6πc dt

dε2 e22 d~a2 ~ 1 (y2 ).


= ~
v 2 · + e2 ~v2 · E (12.71)
dt 6πc3 dt
Si verifica facilmente che le (12.70), (12.71) sono conseguenze delle (12.67), (12.68), in
quanto dalla relazione algebrica ε2 = c2 p2 + m2 c4 segue che,
dε d~p dε d~p
ε = c2 p~ · ⇒ = ~v · .
dt dt dt dt
Espansione non relativistica di potenziali e campi. Dalle formule scritte si vede che,
per consistenza dell’approssimazione, è necessario espandere il campo elettrico fino ai
termini di ordine 1/c3 , e il campo magnetico fino ai termini di ordine 1/c2 . Dovremmo
quindi sviluppare i campi di Lienard–Wiechert (6.107), (6.108) in serie di potenze di 1/c,
arrestandoci agli ordini richiesti. Dal punto di vista tecnico questa operazione risulta
complicata dal fatto che è necessario sviluppare in serie di potenze di 1/c anche il tem-
po ritardato t0 (t, ~x). Difatti, per eseguire l’espansione non relativistica dei campi è più
conveniente esprimere questi ultimi in termini dei potenziali di Lienard–Wiechert (6.93),
~
E ~ 0 − 1 ∂A ,
~ = −∇A ~ =∇
B ~ × A,
~ (12.72)
c ∂t
e sviluppare dunque i potenziali. Dobbiamo allora espandere A0 fino ai termini di ordine
~ fino ai termini di ordine 1/c2 . Infine, invece di usare per il quadripotenziale la
1/c3 , e A
formula (6.93), è più conveniente ripartire dalla rappresentazione integrale (6.48),
Z µ ¶
µ 1 3 1 µ |~x − ~z|
A = dz j t− , ~z , (12.73)
4πc |~x − ~z| c

369
dove per una singola particella la corrente è data da,

j µ (t, ~x) = e V µ (t) δ 3 (~x − ~y (t)), V µ (t) = (c, ~v (t)) .

Incominciamo espandendo la (12.73) in serie di potenze di 1/c, arrestandoci al terzo


ordine,
Z µ ¶
µ 1 3 j µ (t, ~z) 1 ∂j µ (t, ~z) 1 ∂ 2 j µ (t, ~z) 1 3 µ
2 ∂ j (t, ~
z)
A = dz − + 2 |~x − ~z| 2
− 3
|~
x − ~
z | 3
4πc |~x − ~z| c ∂t 2c ∂t 6c ∂t

Z Z
1 3 j µ (t, ~z) 1 ∂
= dz − d3 z j µ (t, ~z)
4πc |~x − ~z| 4πc2 ∂t

Z Z
1 ∂2 3 µ 1 ∂3
+ d z |~x − ~z| j (t, ~z) − d3 z |~x − ~z|2 j µ (t, ~z)
8πc3 ∂t2 24πc4 ∂t3

µ ¶
e V µ 1 ∂V µ 1 ∂2 µ 1 ∂3 ¡ 2 µ¢
= − + 2 2 (rV ) − 3 3 r V ,
4πc r c ∂t 2c ∂t 6c ∂t

dove abbiamo posto,


~r = ~x − ~y (t), r = |~r|.

I potenziali, fino all’ordine richiesto, sono allora dati da,


µ ¶
0 e 1 1 ∂ 2r 1 ∂ 3 r2
A = + − 3 3 ,
4π r 2c2 ∂t2 6c ∂t

µ ¶
~ = e ~v ~a
A − 2 .
4π cr c

Si noti che in A0 è assente il contributo di ordine 1/c. Ricordiamo che le formule appena
scritte costituiscono le espansioni non relativistiche dei potenziali di Lienard–Wiechert
(6.93). Per determinare il campo elettrico occorre calcolare,
µ ¶
~ 0 e ~r 1 ∂ 2 rb 1 d~a
−∇A = − − 3 , (12.74)
4π r3 2c2 ∂t2 3c dt

~ µ µ ¶ ¶
1 ∂A e 1 ∂ ~v 1 d~a
− = − − 3 , (12.75)
c ∂t 4π c2 ∂t r c dt

dove abbiamo posto,


~r
rb = .
r
370
Usando,
∂b
r (b
r · ~v ) rb − ~v ∂r
= , = −b
r · ~v ,
∂t r ∂t
per valutare le derivate nelle (12.74), (12.75), le (12.72) danno allora,
µ µ ¶ ¶
~ e ~r 1 ∂ ~v + (b r · ~v )b
r 2 d~a
E = − + 3 (12.76)
4π r3 2c2 ∂t r 3c dt

µ µ ¶ ¶
e ~r 1 r · ~v )2 − v 2 ) rb
(3(b 2 d~a
= − ~a + (b
r · ~a) rb + + 3 , (12.77)
4π r3 2c2 r r 3c dt

~ = e ~r
B ~v × 3 . (12.78)
4πc r
~ il termine di ordine 1/c2 è assente, perché ~a è indipendente da ~x.
Si noti che in B
~ si riconosce all’ordine più basso il termine coulombiano, l’ordine 1/c2 compren-
In E
de una correzione relativistica di tipo cinetico al campo coulombiano, mentre il termi-
ne di ordine 1/c3 rappresenta la radiazione, come vedremo tra poco. Insistiamo sul
fatto che le (12.77), (12.78) costituiscono le espansioni non relativistiche dei campi di
Lienard–Wiechert (6.107), (6.108).
Determinazione di ∆pµ . Dati questi campi possiamo ora analizzare il trasferimento
di quadrimomento dalle particelle al campo elettromagnetico durante il processo di dif-
fusione. Consideriamo prima la quantità di moto. Valutando i campi (12.77) e (12.78)
lungo le traiettorie delle due particelle, possiamo determinare la forza d’interazione totale
F~12 + F~21 , usando le (12.69). Il campo coulombiano si cancella, e dopo un semplice conto
si ricava che questa forza si può scrivere come una derivata totale,
µ ¶
~ ~ e1 e2 d 1 2
F12 + F21 = − 2 (~v1 + ~v2 + [m ~ · (~v1 + ~v2 )]m
~ ) + 3 (~a1 + ~a2 ) , (12.79)
4π dt 2c r12 3c
dove abbiamo posto,
~y2 − ~y1
r12 = |~y2 − ~y1 |, m
~ = .
|~y2 − ~y1 |
Sommando le (12.67) e (12.68), e integrando tra t = −∞ e t = +∞ si trova allora,
Z ∞³ ´
∆ (~p1 + p~2 ) = ~ ~
F12 + F21 dt = 0,
−∞

perché per t → ±∞ si ha ~a1,2 → 0, e 1/r12 → 0. Durante il processo di diffusione


la quantità di moto totale delle due particelle dunque non cambia, nonostante si abbia

371
d(~p1 + p~2 )/dt 6= 0. Questo risultato è evidentemente in accordo con il fatto che in ap-
prossimazione non relativistica, ovvero, in approssimazione di dipolo, la radiazione non
trasporta quantità di moto, vedi paragrafo 7.3.2. Con ciò abbiamo in particolare verificato
che il membro di destra della parte spaziale dell’equazione (12.66) è di ordine 1/c4 .
Passiamo ora all’analisi del trasferimento di energia, sommando le (12.70) e (12.71).
Usando la (12.76) si dimostra facilmente che la somma delle “potenze relative” si può
scrivere come,
µ ¶
e1 ~v1 · E ~ 1 (y2 ) = − de
~ 2 (y1 ) + e2 ~v2 · E εp
+
e1 e2
~v1 ·
d~a2
+ ~v2 ·
d~a1
, (12.80)
dt 6πc3 dt dt

dove abbiamo definito l’energia potenziale modificata,


µ ¶
e1 e2 1
εep = 1 + 2 (~v1 · ~v2 + (m
~ · ~v1 )(m
~ · ~v2 )) .
4πr12 2c

Nella (12.80) il termine di ordine zero è il potenziale coulombiano non relativistico, vedi
(12.58), i termini di ordine 1/c2 corrispondono a una correzione cinematica al potenziale
coulombiano, mentre i termini di ordine 1/c3 rappresentano gli effetti dell’interferenza
tra le radiazioni emesse dalle due cariche. Sommando le (12.70), (12.71) si ottiene in
definitiva,
d 1 d
(ε1 + ε2 + εep ) = 3
(e1~v1 + e2~v2 ) · (e1~a1 + e2~a2 ).
dt 6πc dt
Integrando questa relazione tra t = −∞ e t = +∞, e sfruttando il fatto che all’infinito
vale ancora εep → 0, si ottiene per la variazione dell’energia totale delle due particelle,
Z Z
1 d 1
∆(ε1 + ε2 ) = dt (e1~v1 + e2~v2 ) · (e1~a1 + e2~a2 ) = − dt |e1~a1 + e2~a2 |2 .
6πc3 dt 6πc3
(12.81)
Abbiamo eseguito un’integrazione per parti, sfruttando di nuovo il fatto che per t →
±∞, si ha ~a1,2 → 0. Si noti che il risultato (12.81) è in accordo con la formula (7.44),
che dà la potenza emessa da un generico sistema carico sotto forma di radiazione, in
approssimazione di dipolo: in assenza di forze esterne l’energia totale del sistema “cariche
+ campo” si deve, infatti, conservare. Confrontando la (12.81) con la componente 0 della
(12.66) si vede, infine, che i termini di Larmor vengono riprodotti correttamente nel limite
non relativistico, mentre il termine di interferenza – la seconda riga nella (12.66) – è dato

372
da,
Z
e1 e2
− dt (~a1 · ~a2 ),
3πc3
modulo termini di ordine 1/c4 .
Lagrangiana al secondo ordine. Per concludere osserviamo che la dinamica di un si-
stema di due particelle cariche – vedi le equazioni (12.67), (12.68) – tenendo conto delle
correzioni relativistiche fino all’ordine 1/c2 può essere dedotta dalla lagrangiana,
µ ¶
1 2 2 1 2 2 1 v14 1 v24 e1 e2 1
L = m 1 v1 + m 2 v2 + m 1 2 + m 2 2 − 1 − 2 (~v1 · ~v2 + (m
~ · ~v1 )(m
~ · ~v2 )) .
2 2 8 c 8 c 4πr12 2c

La verifica è lasciata per esercizio. Osserviamo, comunque, che i termini di ordine v 4 /c2
R Rp
discendono dallo sviluppo dell’azione libera, −mc ds = −mc2 1 − v 2 /c2 dt, fino al-
l’ordine 1/c2 . I termini del tipo v 2 /c2 r12 riproducono, invece, le correzioni di ordine 1/c2
alle forze (12.69), dove i campi elettrico e magnetico sono dati dalle (12.77), (12.78).
Infine facciamo notare che i termini di ordine 1/c3 nelle equazioni (12.67), (12.68), non
possono essere dedotti da una lagrangiana, il motivo essendo che questi termini sono lineari
nelle derivate terze delle coordinate. Considerando una singola particella l’equazione da
riprodurre sarebbe,
e2 d~a
m~a = + ···
6πc3 dt
Per motivi dimensionali la lagrangiana dovrebbe allora avere la forma,
µ ¶
1 2 e2 d~a
L = mv + 3 k1 ~v · ~a + k2 ~y · + ···,
2 c dt

dove k1 e k2 sono costanti adimensionali. Tuttavia, i termini tra parentesi corrispondono


a una derivata totale,
µ ¶
d~a d k1 − k2 2
k1 ~v · ~a + k2 ~y · = k2 ~y · ~a + v .
dt dt 2

L dà quindi luogo all’equazione del moto della particella libera. Riscontriamo di nuovo il
fatto che l’equazione di Lorentz–Dirac non può essere derivata da un principio variazionale,
vedi paragrafo 12.2.3.

373
12.5 Problemi

12.1 Si dimostri che nel limite non relativistico l’equazione di Lorentz–Dirac (12.23), e
la sua versione integro–differenziale (12.52), si riducono rispettivamente a,

d~a ~
m ~a = m τ + e E,
dt
Z ∞
m ~a(t) = e ~ + τ α) dα,
e−α E(t (12.82)
0

~ è il campo elettrico esterno.


dove E
a) Si dimostri che la seconda è soluzione implicita della prima.
~ sia diverso da zero solo in una regione limitata dello spazio, e che
b) Si supponga che E
sia ivi costante e uniforme. Si determini esplicitamente il membro di destra della (12.82),
e si discuta la violazione della causalità nell’equazione di Newton che ne risulta.

374
13 Un tensore energia–impulso privo di singolarità

Nel capitolo precedente abbiamo visto che il campo creato da una particella diverge nelle
vicinanze della stessa come,

1
F µν ∼ , r = |~x − ~y (t)|,
r2

e di conseguenza il tensore energia–impulso,

µν 1 µν αβ
Tem = F µα Fα ν + η F Fαβ , (13.1)
4

diverge come,
µν 1
Tem ∼ . (13.2)
r4
Nel caso particolare di una particella statica nell’origine, per cui ~y (t) = 0, si ha,

~ = e ~x ,
E ~ = 0,
B (13.3)
4π r3

e, vedi (2.76)–(2.78),

00 1 ³ e ´2 1
Tem = , (13.4)
2 4π r4
0i
Tem = 0, (13.5)
µ ¶
ij 1 ³ e ´2 1 ij xi xj
Tem = δ −2 2 . (13.6)
2 4π r4 r
µν
Due problemi di Tem . L’andamento singolare (13.2) comporta due patologie, legate
tra di loro. La prima, già menzionata nel capitolo 12, consiste nel fatto che gli integrali
µ
R 0µ 3
del quadrimomento totale Pem = Tem d x, sono divergenti. Nel caso particolare della
particella statica si ha,
Z Z Z
00 3 1 ³ e ´2 1 3 i 0i 3
εem = Tem d x= d x = ∞, Pem = Tem d x = 0, (13.7)
2 4π r4

e diverge solo l’energia, ma per una particella in moto arbitrario diverge anche la quantità
di moto. Ovviamente divergono anche gli integrali del quadrimomento su un qualsiasi
volume finito V contenente la particella. Si noti, comunque, che nelle analisi dei bilanci
energetici svolte nei capitoli precedenti, il problema dell’energia infinita non è mai inter-
venuto direttamente. La potenza irradiata coinvolge, infatti, il campo elettromagnetico a

375
grandi distanze dalla particella, dove esso è regolare. D’altra parte la potenza irradiata si
riferisce a differenze di valori di energia, e si può supporre che nelle differenze le divergenze
si cancellino. In effetti, quello che risulta osservabile in natura sono le differenze dei valori
dell’energia di un sistema fisico, e non la sua energia stessa. Tuttavia, se si vuole dare
un significato preciso all’affermazione “il quadrimomento si conserva”, è necessario che il
quadrimomento sia una grandezza finita.
µν
Il secondo problema consiste nel fatto che le componenti del tensore Tem non sono
distribuzioni temperate, ovvero, elementi di S 0 (R4 ): mentre le componenti di F µν sono
distribuzioni, i loro prodotti, che compaiono nella (13.1), non lo sono. Ricordiamo che
in generale prodotti di distribuzioni non definiscono distribuzioni. L’andamento (13.2)
rappresenta, infatti, una singolarità non integrabile in R4 . Non essendo le componenti
µν
di Tem distribuzioni, le loro derivate non sono definite, e la domanda quanto valga la
µν
quadridivergenza ∂µ Tem è quindi priva di senso, e la questione della conservazione del
quadrimomento dunque malposta. Si noti, in proposito, che l’espressione formale derivata
µν
per la quadridivergenza di Tem in (2.72),
X Z
µν
∂µ Tem =− er F νµ (yr )urµ δ 4 (x − yr ) dsr , (13.8)
r

è, in realtà, divergente. Il coefficiente F νµ (yr ) comprende, infatti, l’autocampo di Lienard–


Wiechert della particella r–esima, che sappiamo essere divergente. Vediamo cosı̀ che la
µν
dimostrazione della conservazione del tensore–energia impulso totale Tem +Tpµν , presentata
nel paragrafo 2.4.3, aveva solo validità formale, essendo per di più basata sull’equazione
di Lorentz orginale – che ora sappiamo pure divergere.
Scopo di questo capitolo è la costruzione di un tensore energia–impulso totale T µν , le
cui componenti siano distribuzioni, che sia Lorentz covariante, a divergenza nulla e che
ammetta integrali di quadrimomento finiti. La costruzione di per sè risulterà semplice,
ma la dimostrazione che il tensore cosı̀ costruito abbia le proprietà richieste è un po’
complicata, e verrà riportata solo per il campo generato da una particella in moto rettilineo
uniforme.
Nella prossima sezione presentiamo la strategia che sta alla base della costruzione, e
diamo un argomento euristico per la costruzione esplicita. In sezione 13.2 dimostriamo la

376
validità dell’approccio nel caso di una particella in moto rettilineo uniforme, e in sezione
13.3 presentiamo la sua generalizzazione ad un sistema di N particelle.

13.1 Linee guida della costruzione

Per costruire un tensore energia–impulso con le proprietà desiderate a partire dalla (13.1),
seguiamo una procedura simile a quella del capitolo 12, consistente di una regolarizzazione
seguita da una rinormalizzazione. Consideriamo una particella singola, e mettiamo a zero
µν
il campo esterno Fin , supposto regolare, perché la sua presenza è ininfluente per quanto
riguarda le singolarità del tensore energia–impulso. Il campo elettromagnetico totale è
allora dato dal solo campo di Lienard–Wiechert F µν di (12.13).
Regolarizzazione. Dato che le singolarità di F µν sono localizzate nei punti dove si
trovano le particelle, possiamo adottare ancora la regolarizzazione che abbiamo usato per
dedurre l’equazione di Lorentz–Dirac, che tra l’altro preserva l’invarianza relativistica.
Ripartiamo allora dal campo di Lienard–Wiechert regolarizzato, vedi (12.19),
¯
µν ¯
Fεµν =F ¯ ,
λ→λε (x)

che costituisce, in effetti, una distribuzione regolare. Più precisamente, le componenti


di questo campo sono funzioni di classe C ∞ (R4 ), per ogni ε > 0. Illustriamo questa
proprietà per una particella statica nell’origine. Per il moto rettilineo uniforme il campo
regolarizzato è stato valutato nella (12.20), che per uµ = (1, 0, 0, 0) si riduce a,

~ε = e
E
~x
, ~ ε = 0.
B (13.9)
4π (r + ε2 )3/2
2

Questi campi sono effettivamente di classe C ∞ (R4 ), e come tali sono regolari in tutto lo
spazio, compreso il punto ~x = 0, dove si trova la particella. In particolare, l’energia totale
del campo elettromagnetico regolarizzato è finita. Al posto di (13.7) abbiamo, infatti,
Z Z
1 ~ 2 3 1 ³ e ´2 r2 3
³ e ´2 3π 2
εem,ε = |E ε | d x = d x= . (13.10)
2 2 ε 4π (r2 + 1)3 4π 8ε

Per valutare l’integrale abbiamo eseguito il cambiamento di variabili ~x → ε ~x e usato,


Z
r2 3 3π 2
d x = .
(r2 + 1)3 4

377
Si noti che per ε → 0 l’energia regolarizzata diverge di nuovo, come 1/ε.
Tornando a un moto y µ (s) arbitrario notiamo che, essendo Fεµν una distribuzione
regolare di classe C ∞ , risultano distribuzioni di Classe C ∞ anche i suoi prodotti. Possiamo
allora definire un tensore energia–impulso elettromagnetico regolarizzato, ponendo,

1 µν αβ
Tεµν ≡ Fεµα Fε α ν + η Fε Fε αβ . (13.11)
4

Le componenti di questo tensore appartengono a S 0 per ogni ε > 0. Inoltre, per ogni
xµ 6= y µ (s) esiste il limite puntuale,

lim Tεµν (x) = Tem


µν
(x).
ε→0

Tuttavia, tale limite non esiste se eseguito nella topologia di S 0 , a causa delle singolarità
presenti per xµ = y µ (s), e infatti Tem
µν
/ S 0 ! Queste proprietà sono molto evidenti nel caso

59
statico .
Rinormalizzazione. Prima di poter eseguire il limite per ε → 0 nella topologia di S 0 ,
occorre quindi individuare e sottrarre “la parte divergente” di Tεµν , che indichiamo con
Tbεµν . Questa sottrazione rappresenta la “rinormalizzazione”. Al tensore Tbεµν , che viene
anche chiamato “controtermine”, richiediamo le seguenti proprietà:
1) Deve essere un tensore sotto trasformazioni di Lorentz.
2) Deve essere supportato sulla traiettoria della particella, cioè, Tbεµν (x) = 0, se xµ 6= y µ (s).
3) Deve essere simmetrico e a traccia nulla, come lo è il tensore regolarizzato Tεµν , cioè,
ηµν Tbεµν = 0.
4) Deve essere tale che esista il tensore limite,
³ ´
Θµν ≡ S 0
− lim T µν
− bµν .
T (13.12)
em ε ε
ε→0

Identifichiamo Θµν
em con il tensore energia–impulso elettromagnetico rinormalizzato, che
µν
sostituisce a tutti gli effetti il tensore originale, mal definito, Tem .
59
Nel caso statico si ha,
1 ~ 2 1 ³ e ´2 r2
Tε00 = |Eε | = ,
2 2 4π (r2 + ε2 )3
che per ε → 0 converge, per ogni ~x 6= 0, puntualmente a,

00 1 ³ e ´2 1
Tem = .
2 4π r4
Ma questa espressione non costituisce una distribuzione.

378
5) Tbεµν deve essere tale che il tensore energia–impulso totale del sistema campo + particella
sia conservato,
T µν ≡ Θµν µν
em + Tp , ∂µ T µν = 0,

dove per Tpµν manteniamo la forma standard (2.70).


La richiesta 1) assicura che Θµν
em è un tensore sotto trasformazioni di Lorentz, dato che

anche Tεµν lo è. La richiesta 2) è motivata dai seguenti due fatti. Primo, nel complemento
µν
della traiettoria della particella il tensore energia–impulso totale originale Tem + Tpµν è
µν
regolare e conservato. Secondo, la forma di Tem nel complemento della traiettoria è
ben testata dal punto di vista fenomenologico, come abbiamo visto per esempio dalla
0i
componente Tem ~ × B)
= (E ~ i , che è responsabile dell’irraggiamento. La procedura di
µν
rinormalizzazione non deve, dunque, cambiare il valore di Tem nel complemento della
traiettoria. Questo vuol dire che il supporto del controtermine deve essere la linea di
universo della particella, e Tbεµν deve quindi essere una combinazione lineare della δ di
Dirac e delle sue derivate, supportate sulla traiettoria. La richiesta 3) segue dal fatto
che la parte divergente di un tensore simmetrico a traccia nulla, è ancora un tensore
simmetrico a traccia nulla. Il significato delle richieste 4) e 5) è, invece, evidente. Si
può, infine, vedere che le richieste 1)–5) determinano il tensore Tbεµν univocamente, moduli
termini di ordine o(ε) nella topologia di S 0 . Ciò assicura in particolare l’unicità del tensore
Θµν
em , come definito in (13.12).

Costruzione esplicita: un argomento euristico. Cerchiamo ora di sfruttare queste ri-


chieste per determinare euristicamente la forma di Tbεµν . Per la proprietà 2) questo tensore
deve essere proporzionale a δ 3 (~x − ~y (t)), o meglio, alla grandezza Lorentz–invariante,
Z p
δ 4 (x − y(s)) ds = 1 − v 2 (t) δ 3 (~x − ~y (t)).

Inoltre, dato che Tεµν è proporzionale alla carica al quadrato, tale dovrà essere anche
Tbεµν . Per la richiesta 4) il controtermine deve poi cancellare le parti divergenti di Tεµν ,
e quindi deve divergere per ε → 0. Visto l’esempio (13.10), ci aspettiamo che queste
divergenze compaiano come poli in 1/ε. Includiamo allora in Tbεµν un fattore 1/ε. Queste
considerazioni ci portano quindi a ipotizzare la forma,
Z
bµν 1 ³ e ´2
Tε = H µν δ 4 (x − y(s)) ds,
ε 4π

379
dove H µν è un tensore simmetrico e a traccia nulla. Essendo definito lungo la linea di
universo, questo tensore deve dipendere dalle quantità cinematiche y µ (s), uµ (s), wµ (s)
etc., e può coinvolgere eventualmente le derivate spazio–temporali ∂µ . Inoltre, Tbεµν deve
avere le stesse dimensioni di Tεµν , e dato che ε ha le dimensioni di una lunghezza, H µν deve
essere adimensionale. Siccome uµ è l’unica quantità cinematica adimensionale, H µν deve
allora essere necessariamente della forma a uµ uν + b η µν , con a e b costanti. Ma dovendo
essere anche a traccia nulla, si conclude che,
µ ¶
µν µ ν 1 µν
H =C u u − η ,
4

per qualche costante numerica C. Si noti che contributi ad H µν del tipo y µ wν + y ν wµ −


1 µν ρ
2
η y wρ , oppure y µ ∂ ν + y ν ∂ µ − 12 η µν y ρ ∂ρ , che sarebbero pure adimensionali, simmetrici
e a traccia nulla, sono esclusi perché non invarianti sotto traslazioni, y µ → y µ + aµ .
Le nostre richieste porterebbero allora alla seguente proposta per il tensore energia–
impulso rinormalizzato,
· Z µ ¶ ¸
µν 0 µν C ³ e ´2 µ ν 1 µν 4
Θem = S − lim Tε − u u − η δ (x − y(s)) ds , (13.13)
ε→0 ε 4π 4

dove l’unica quantità indeterminata è la costante C. Questa costante dovrebbe essere


fissata imponendo la richiesta 4), cioè, che Tbεµν cancelli le parti divergenti di Tεµν , e la
richiesta 5), cioè, che il tensore energia–impulso totale risultante sia conservato. In effetti
si può dimostrare il risultato non banale che con la scelta,

π2
C= ,
2

si riescono a soddisfare entrambe queste richieste. Siccome la dimostrazione di questo


60
fatto per una particella in moto arbitrario è abbastanza complicata , ci limitiamo a
svolgerla nel caso di una particella libera.

13.2 Costruzione di Θµν


em per la particella libera

Una particella libera si muove di moto rettilineo uniforme e genera i campi determinati
in sezione 6.3. Data la Lorentz–invarianza della procedura appena congetturata, se essa
60
Si veda, K. Lechner and P.A. Marchetti, Variational principle and energy–momentum tensor for
relativistic Electrodynamics of point charges, Ann. Phys. 322 (2007) 1162-1190, (hep-th/0602224).

380
ha successo in un sistema di riferimento particolare, allora ha automaticamente successo
in qualsiasi sistema di riferimento. È allora sufficiente considerare una particella statica
nell’origine, con ~y (t) = 0.
Conosciamo già i campi regolarizzati di una particella statica, vedi (13.9), e usando
le (2.76)–(2.78) è allora immediato scrivere le componenti del tensore energia–impulso
regolarizzato (13.11),

1 ³ e ´2 r2
Tε00 = , (13.14)
2 4π (r2 + ε2 )3
Tε0i = 0, (13.15)
1 ³ e ´2 δ ij r2 − 2 xi xj
Tεij = . (13.16)
2 4π (r2 + ε2 )3

Si noti che ηµν Tεµν = 0. Anche il controtermine in (13.13) è facile da valutare, perché si
R
ha uµ = (1, 0, 0, 0), e δ 4 (x − y(s)) ds = δ 3 (~x). Inserendo le (13.14)–(13.16) nella (13.13),
dovremmo allora, prima di tutto, stabilire l’esistenza dei limiti,
µ ¶
00 1 ³ e ´2 0 r2 3C 3
Θem = · S − lim − δ (~x) , (13.17)
2 4π ε→0 (r2 + ε2 )3 2ε
Θ0i
em = 0, (13.18)
µ ij 2 ¶
ij 1 ³ e ´2 0 δ r − 2 xi xj C ij 3
Θem = · S − lim − δ δ (~x) , (13.19)
2 4π ε→0 (r2 + ε2 )3 2ε

per un’opportuna costante C.

13.2.1 Esistenza di Θµν


em

Nella valutazione dei limiti che seguono risulterà spesso necessario portare il limite sotto
il segno di integrale, operazione non sempre lecita. A questo proposito è utile il teorema
della convergenza dominata, che enunciamo senza dimostrazione.
Teorema della convergenza dominata. Sia data una successione di funzioni {fn } ∈
L1 ≡ L1 [RD ] tale che, a) esista il limite puntuale (quasi ovunque rispetto alla misura
di Lebesgue in RD ),
lim fn (x) = f (x),
n→∞

e, b) esista una funzione positiva g ∈ L1 , tale che (quasi ovunque rispetto alla misura di
Lebesgue in RD ),
|fn (x)| ≤ g(x), ∀ n.

381
Allora f ∈ L1 , e le fn convergono ad f nella topologia di L1 ,

L1 − lim fn = f.
n→∞

Corollario. Il teorema assicura che la successione {fn } converge nella topologia di L1 .


Ciò è sufficiente per poter portare il limite sotto il segno di integrale. Abbiamo, infatti,
la maggiorazione,
¯Z Z ¯ ¯Z ¯ Z
¯ ¯ ¯ ¯
¯ fn d x − f d x¯ = ¯ (fn − f ) d x¯ ≤ |fn − f | dD x = ||fn − f kL1 .
D D D
¯ ¯ ¯ ¯

Siccome per n → ∞ si ha che fn → f in L1 , l’ultimo membro della maggiorazione converge


a zero, e quindi converge a zero anche il primo. Abbiamo allora,
Z Z Z
D D
lim fn d x = f d x = lim fn dD x,
n→∞ n→∞

dove abbiamo usato la definizione di f . Concludiamo che, se le fn soddisfano le ipotesi


del teorema della convergenza dominata, allora possiamo scambiare i segni di limite e di
integrazione. Nei casi di nostro interesse al posto dell’indice discreto n avremo l’indice
“continuo” ε. Inoltre, siccome il limite puntuale – ipotesi a) – esisterà sempre banalmente,
per assicurare la validità del teorema si tratterà di trovare una maggiorante g “uniforme”,
ovvero, indipendente da ε, come richiesto dall’ipotesi b).
Esistenza di Θ00 µν
em . Cominciamo la dimostrazione dell’esistenza di Θem , dimostrando

l’esistenza del limite che definisce la componente Θ00


em , cioè, la densità di energia. In

particolare vorremo ottenere una definizione operativa per questa distribuzione, ovverosia,
una definizione che ci permetta di determinare esplicitamente l’energia contenuta in un
volume qualsiasi. Secondo la definizione del limite nel senso delle distribuzioni, dobbiamo
dimostrare che per un’opportuna costante C esiste il limite ordinario,
·Z ¸
00 1 ³ e ´2 r2 ϕ(~x) 3 3C
Θem (ϕ) ≡ lim d x− ϕ(0) ,
2 4π ε→0 (r2 + ε2 )3 2ε
per ogni funzione di test ϕ ∈ S(R3 ) 61
. Sottraendo e aggiungendo ϕ(0) nel numeratore
dell’integrando, e notando che si ha l’integrale,
Z
r2 3 3 π2
d x = ,
(r2 + ε2 )3 4ε
61
Lo spazio delle funzioni di test da usare sarebbe S(R4 ), ma nel caso statico la dipendenza dal tempo
è banale e può essere omessa.

382
otteniamo,
·Z µ ¶ ¸
1 ³ e ´2 r2 (ϕ(~x) − ϕ(0)) 3 3 π2
Θ00
em (ϕ) = lim 2 2 3
d x+ − C ϕ(0) . (13.20)
2 4π ε→0 (r + ε ) 2ε 2

Il limite per ε → 0 dell’integrale a secondo membro è ora finito. Per farlo vedere separiamo
nella regione d’integrazione gli r piccoli da quelli grandi,
Z 2 Z Z
r (ϕ(~x) − ϕ(0)) 3 r2 (ϕ(~x) − ϕ(0) − xi ∂i ϕ(0)) 3 r2 (ϕ(~x) − ϕ(0)) 3
d x = d x+ d x.
(r2 + ε2 )3 r<1 (r2 + ε2 )3 r>1 (r2 + ε2 )3
(13.21)
Nel primo integrale abbiamo sottratto un termine che è nullo, in quanto si annulla l’in-
R
tegrale sugli angoli ni dΩ, dove ni = xi /r. Nel primo integrale possiamo ora portare il
limite sotto il segno di integrale, usando il teorema della convergenza dominata. Abbiamo
infatti la maggiorazione uniforme,
¯ 2 ¯
¯ r (ϕ(~x) − ϕ(0) − xi ∂i ϕ(0)) ¯ |ϕ(~x) − ϕ(0) − xi ∂i ϕ(0))|
¯ ¯≤ ≡ g(~x) ∈ L1 (R3 ),
¯ (r2 + ε2 )3 ¯ r4

dove è sottointeso che per r > 1 poniamo g = 0. La maggiorante g sta in L1 (R3 ), perché
il numeratore ϕ(~x) − ϕ(0) − xi ∂i ϕ(0) si annulla come r2 , per r → 0. In questo caso
particolare la maggiorante coincide con il modulo della funzione limite. Per portare il
limite sotto il segno di integrale nel secondo integrale della (13.21), è sufficiente usare la
maggiorazione, ¯ 2 ¯
¯ r (ϕ(~x) − ϕ(0)) ¯ 2 ||ϕ||
¯ ¯ 3
¯ (r2 + ε2 )3 ¯ ≤ r4 ≡ g(~x) ∈ L1 (R ),

dove con ||ϕ|| intendiamo l’estremo superiore del modulo di ϕ in R3 , ed è sottinteso che
g = 0 per r < 1.
Portando nella (13.21) i limiti sotto i segni di integrale, otteniamo allora il limite finito,
Z 2 Z Z
r (ϕ(~x) − ϕ(0)) 3 ϕ(~x) − ϕ(0) − xi ∂i ϕ(0) 3 ϕ(~x) − ϕ(0) 3
lim 2 2 3
d x= 4
d x+ d x.
ε→0 (r + ε ) r<1 r r>1 r4
(13.22)
Concludiamo che per ottenere un limite finito nella (13.20), è necessario e sufficiente
scegliere,
π2
C= .
2
Se nel primo integrale della (13.22) facciamo precedere l’integrazione su r dall’integrazione
sugli angoli, il terzo termine non contribuisce, e la somma dei due integrali si può scrivere

383
di nuovo come un integrale unico su tutto R3 . La densità di energia rinormalizzata si può
allora scrivere semplicemente come,
Z
1 ³ e ´2 ϕ(~x) − ϕ(0) 3
Θ00
em (ϕ) = d x, (13.23)
2 4π r4

dove, per costruzione, l’integrazione sugli angoli deve precedere l’integrazione su r (“con-
vergenza condizionata”).
In modo completamente analogo si dimostra che, per lo stesso valore di C, esiste anche
il limite (13.19), e che risulta,
Z
1 ³ e ´2 ϕ(~x) − ϕ(0) ¡ ij 2 ¢ 3
Θij
em (ϕ) = δ r − 2 x i j
x d x. (13.24)
2 4π r6

Nella dimostrazione conviene fare uso degli integrali invarianti del problema 2.6, scrivendo
xi xj = ni nj r2 . Abbiamo quindi concluso la dimostrazione dell’esistenza del limite (13.13),
secondo la richiesta 4).

13.2.2 Conservazione di Θµν


em

Affrontiamo ora la richiesta 5), cioè, la conservazione del tensore energia–impulso. Per
una particella in moto rettilineo uniforme, il quadrimomento del campo elettromagnetico
si deve conservare separatamente, perché il quadrimomento della particella è costante.
Dobbiamo quindi dimostrare che vale,

∂µ Θµν
em = 0.

La componente ν = 0 di questa equazione è banalmente soddisfatta, perché Θi0


em = 0,

e Θ00
em non dipende dal tempo. Resta quindi da verificare la componente ν = j, che si

riduce a,
∂i Θij
em = 0, (13.25)

equazione non ovvia. Si vede, quindi, che anche per la particella libera la conservazione
del tensore energia–impulso rinormalizzato non è garantita a priori. Per dimostrare che
Θij
em soddisfa la (13.25), invece di usare direttamente la (13.24) è più conveniente usare la

definizione originale (13.19), e sfruttare il fatto che la derivata è un’operazione continua in


S 0 . Ciò ci permette di scambiare i limiti con le derivate. Ponendo C = π 2 /2 e prendendo

384
la divergenza della (13.19), si ottiene allora,
µ µ ij 2 ¶ ¶
ij 1 ³ e ´2 0 δ r − 2 xi xj π2 3
∂i Θem = · S − lim ∂i − ∂j δ (~x) . (13.26)
2 4π ε→0 (r2 + ε2 )3 4ε

Siccome il primo termine è una distribuzione regolare, le sue derivate possono essere
calcolate nel senso delle funzioni,
µ ij 2 ¶ µ ¶
δ r − 2 xi xj xj ε 2 ε2
∂i = −6 2 = ∂j .
(r2 + ε2 )3 (r + ε2 )4 (r2 + ε2 )3

La (13.26) può allora essere riscritta come,


µ · ¸¶
ij 1 ³ e ´2 0 ε2 π2 3
∂i Θem = ∂j S − lim − δ (~x) .
2 4π ε→0 (r 2 + ε2 )3 4ε

Abbiamo di nuovo scambiato le derivate con il limite. Questo passaggio è lecito, purché
il limite della distribuzione tra parentesi quadre esista. In realtà questo limite è zero.
Per dimostrarlo occorre fare vedere che per ogni ϕ ∈ S, è zero il limite per ε → 0 della
quantità,
Z Z Z
2 3 ϕ(~x) π2 ϕ(~x) − ϕ(0) ϕ(ε~x) − ϕ(0)
ε dx 2 − ϕ(0) = ε2 dx3
= d3 x , (13.27)
(r + ε2 )3 4 ε (r2 + ε2 )3 ε (r2 + 1)3

dove abbiamo usato l’integrale,


Z
d3 x π2
= .
(r2 + ε2 )3 4 ε3

Nell’ultimo integrale della (13.27) possiamo ora portare il limite sotto il segno di inte-
grale, sfruttando il teorema della convergenza dominata. In questo caso la successione
integranda,
ϕ(ε~x) − ϕ(0)
fε (~x) ≡ ,
ε (r2 + 1)3
può essere maggiorata usando la stima,
Z 1
ϕ(ε~x) − ϕ(0) = ε~x · ~
∇ϕ(ε~
x α) dα ⇒ |ϕ(ε~x) − ϕ(0)| ≤ 3 εr ||∂ϕ||,
0

dove con ||∂ϕ|| intendiamo l’estremo superiore dei moduli delle derivate parziali di ϕ in
R3 . Abbiamo allora la maggiorazione uniforme, ipotesi b),

3r||∂ϕ||
|fε (~x)| ≤ ≡ g(~x) ∈ L1 [R3 ].
(r2 + 1)3

385
D’altra parte la successione fε ammette il limite puntuale ∀ ~x, ipotesi a),
xi ∂i ϕ(0)
lim fε (~x) = ≡ f (~x).
ε→0 (r2 + 1)3
Portando dunque nella (13.27) il limite sotto il segno di integrale risulta,
µ Z ¶ Z Z
2 3 ϕ(~x) π2 3 ϕ(ε ~x) − ϕ(0) i
3 x ∂i ϕ(0)
lim ε dx 2 − ϕ(0) = d x lim = d x = 0,
ε→0 (r + ε2 )3 4 ε ε→0 ε (r2 + 1)3 (r2 + 1)3
(13.28)
dove la conclusione deriva dal fatto che, scrivendo xi = ni r, l’integrazione sugli angoli dà
R
dΩ ni = 0. Segue la (13.25).
Concludiamo che il tensore energia–impulso definito dalle (13.17)–(13.19) soddisfa,

∂µ Θµν
em = 0. (13.29)

13.2.3 Una definizione operativa dell’energia elettromagnetica

La costruzione del paragrafo 13.2.1 ha fornito in particolare una definizione operativa per
la densità di energia Θ00
em – la (13.23) – che permette di determinare esplicitamente l’ener-

gia contenuta in un arbitrario volume V . Indichando con χV (~x) la funzione caratteristica


del volume V , la (13.23) ci dice, infatti, come calcolare l’energia contenuta in V ,
Z Z
00 3 00 1 ³ e ´2 χV (~x) − χV (0) 3
εem,V = Θem d x = Θem (χV ) = d x.
V 2 4π r4
Da questa formula, ma equivalentemente anche dalla (13.17), vediamo che l’energia cosı̀
definita ha le seguenti proprietà:
1) εV è finita ∀ V , il cui bordo non contenga l’origine, cioè, la particella.
R 00 3 ¡ e ¢2
2) Se V non contiene l’origine, allora εV = V Tem d x, dove Tem 00
= 12 4π 1
r4
.
e 2
3) Se VR è una palla di raggio R centrata nell’origine, allora εem,VR = − 8πR .
4) Se VeR indica il complemento di VR in R3 , allora εem,VeR = e2
8πR
.
5) εem,R3 = 0, cioè, l’energia totale del campo elettromagnetico di una particella statica
è zero, cosı̀ come è zero pure la sua quantità di moto totale, vedi la (13.18). Abbiamo
quindi,
Z
µ
Pem ≡ Θ0µ 3
em d x = 0. (13.30)

6) L’energia cosı̀ definita riproduce, in particolare, la sottrazione che si opera di solito “a


mano” nel caso di un sistema di cariche non relativistiche, vedi problema 2.8.

386
Moto rettilineo uniforme generico. Grazie all’invarianza di Lorentz della nostra proce-
dura, tutti questi risultati si estendono automaticamente a un moto rettilineo uniforme
generico. Possiamo allora riassumere le conclusioni di questo paragrafo come segue.
Per un moto rettilineo uniforme il tensore energia–impulso Θµν
em dato in (13.13), con

C = π 2 /2, definisce una distribuzione Lorentz–covariante, simmetrica, e conservata,

∂µ Θµν
em = 0, Θµν νµ
em = Θem .

Gli integrali a tempo fissato,


Z
µ
Pem,V = Θµ0 3
em d x,
V

esistono finiti per ogni V , e rappresentano il quadrimomento del campo elettromagnetico


contenuto nel volume V . Se in un dato istante la particella non è contenuta in V allora
si ha,
Z
µ µ0 3
Pem,V = Tem d x,
V

coincidente con il quadrimomento fornito dal tensore energia–impulso originale. Il qua-


drimomento totale del campo della particella è zero,
Z
µ
Pem = Θµ0 3
em d x = 0.

13.3 Costruzione generale

In questa sezione presentiamo, senza dimostrazione, la generalizzazione dei risultati delle


sezioni precedenti al caso di un sistema di N particelle in moto arbitrario.
Consideriamo N particelle puntiformi che interagiscono tra di loro, e con un campo
µν
esterno Fin . Ciascuna di queste particelle produce allora un campo di Lienard–Wiechert,
che indichiamo con Frµν , r = 1, · · · , N . Il campo elettromagnetico totale del sistema è
dunque dato da,
µν
X
F µν = Fin + Frµν . (13.31)
r

Ciascuno dei campi di Lienard–Wiechert può essere regolarizzato secondo la (12.19), dan-
do luogo al campo Frµνε . Come campo elettromagnetico totale regolarizzato del sistema

387
definiamo allora,
µν
X
Fεµν = Fin + Frµνε .
r

Definiamo poi il tensore energia–impulso regolarizzato come,

1 µν αβ
Tεµν = Fεµα Fε α ν + η Fε Fε αβ .
4

Il tensore energia–impulso rinormalizzato segue allora dalla ricetta (13.13),


" #
π 2 X³
e ´2 Z µ 1

r
Θµν 0
em = S − lim Tε −
µν
uµr uνr − η µν δ 4 (x − yr ) dsr . (13.32)
ε→0 2 ε r 4π 4

Si noti che il controtermine è dato semplicemente dalla somma dei controtermini delle
singole particelle. Questa scelta discende dal fatto che le mutue interazioni tra le particelle,
corrispondenti ai prodotti dei campi di Lienard–Wiechert di particelle differenti, danno
luogo in Tεµν a singolarità integrabili di tipo 1/r2 , che sono ben definite nel senso delle
distribuzioni. In particolare si dimostrano i seguenti due teoremi, si veda la nota 60.
Teorema A. Il limite distribuzionale in (13.32) esiste, qualsiasi siano le traiettorie delle
particelle. Inoltre, il quadrimomento totale del campo elettromagnetico,
Z
Pem ≡ Θµ0
µ 3
em d x,

è finito, purché l’accelerazione delle particelle svanisca con sufficiente rapidità per t →
−∞.
Teorema B. Per traiettorie arbitrarie delle particelle – non soggette a nessuna equazione
del moto – la divergenza di Θµν
em , come definito in (13.32), è data da,

X Z µ e2 µ dwν ¶ ¶
µν r r
∂µ Θem = − + wr ur + er Fr (yr )urµ δ 4 (x − yr ) dsr ,
2 ν νµ
(13.33)
r
6π ds r

dove abbiamo definito,


µν
X
Frµν = Fin + Fsµν .
s6=r

Questa relazione è la controparte – ben definita – della relazione formale (13.8). Confron-
tando le due relazioni, e tenendo conto della (13.31), si vede che è come se nella (13.8) la
νµ
µ ν er Fr ¶(yr )urµ , fosse stata sostituita con la forza di frena-
forza di frenamento divergente
2
e dwr
mento ben definita r + wr2 uνr . In particolare, per una particella singola in moto
6π dsr
rettilineo uniforme, e quindi in assenza di forze esterne, la (13.33) si riduce alla (13.29).

388
Mantenendo per il tensore energia–impulso delle particelle l’espressione (2.70),
X Z
Tpµν = mr uµr uνr δ 4 (x − yr ) dsr ,
r

si ha ancora, vedi paragrafo 2.4.3,


X Z dpν
r 4
∂µ Tpµν = δ (x − yr ) dsr .
r
ds r

Considerando come tensore energia–impulso totale del sistema la somma,

T µν = Θµν µν
em + Tp ,

si ottiene dunque,
X Z µ dpν µ
e2r dwrν
¶ ¶
µν r
∂µ T = − + wr ur − er Fr (yr )urµ δ 4 (x − yr ) dsr .
2 ν νµ

r
dsr 6π dsr

Se si vuole, infine, che il quadrimomento totale sia conservato localmente, ∂µ T µν = 0,


allora occorre dunque che le cariche soddisfino le equazioni di Lorentz–Dirac (12.24),
µ ¶
dpµr e2r dwrµ
= + wr ur + er Frµν (yr ) urν .
2 µ
dsr 6π dsr

Vediamo che, in ultima analisi, è la richiesta della conservazione del quadrimomento


ad imporre che le particelle soddisfino queste equazioni del moto del terzo ordine. Questa
richiesta va, quindi, considerata come la causa ultima di tutti gli aspetti problematici che
queste equazioni comportano.

389
14 Monopoli magnetici

Nelle equazioni dell’Elettrodinamica i campi elettrico e magnetico giocano sotto certi


aspetti ruoli molto simili, ma sotto altri hanno funzioni completamente diverse. In assenza
di sorgenti le similitudini tra questi campi sono evidenti se si considerano le equazioni di
~ e
Maxwell in notazione tridimensionale (2.28)–(2.31). In questo caso le equazioni per E
~ sono difatti identiche, a parte un segno.
B
D’altra parte nell’equazione di Lorentz,

d~p ³ ´
~ ~
= e E + ~v × B ,
dt

questi campi giocano ruoli molto diversi, in particolare il campo magnetico è soppresso
di un fattore v/c rispetto al campo elettrico. Ma la differenza più significativa emerge in
presenza di sorgenti non nulle: cariche statiche generano infatti solo un campo elettrico,
e nessun campo magnetico. In altre parole essendo,

~ ·E
∇ ~ = j 0, ~ ·B
∇ ~ = 0,

l’Elettrodinamica classica non prevede cariche magnetiche, ma solo cariche elettriche.


In questo capitolo esploreremo la possibilità di introdurre in Elettrodinamica particel-
le dotate di carica magnetica, i cosiddetti monopoli magnetici. A priori questa impresa
sembra avere poche possibilità di successo perché la struttura interna di questa teoria
appare molto rigida, essendo sorretta da vari requisiti che sono in delicato equilibrio tra
di loro, come l’invarianza relativistica e la conservazione della carica elettrica, del quadri-
momento e del momento angolare. Sappiamo poi che queste proprietà sono intimamente
legate tra di loro. Qualsiasi modifica ad hoc delle equazioni di Maxwell e dell’equazione di
Lorentz rischia quindi di compromettere la consistenza interna della teoria. Alla luce di
questo fatto il risultato principale del presente capitolo, cioè, che l’Elettrodinamica clas-
sica resta perfettamente consistente anche in presenza di monopoli magnetici, deve essere
considerato un risultato altamente non banale. L’introduzione di monopoli magnetici in
Elettrodinamica fu in effetti presa in considerazione già all’inizio del secolo scorso 62 , e rie-
62
Vedi per esempio, H. Poincaré, Compt. Rendus 123 (1896) 530, e J.J. Thomson, Electricity and
Matter, Scribners, New York, 1904, p. 26.

390
saminata a livello quantistico pochissimi anni dopo l’avvento della Meccanica Quantistica
da Dirac.
Una volta accertato che i monopoli magnetici sono compatibili con la struttura ge-
nerale dell’Elettrodinamica, l’ipotesi di questo nuovo tipo di particelle assume una certa
rilevanza anche da un punto di vista sperimentale. Il dato sperimentale in questione è la
quantizzazione della carica elettrica, cioè, il fatto che tutte le cariche elettriche presenti
in natura sono multipli interi di una carica fondamentale – fenomeno che tuttora attende
una spiegazione teorica. Ebbene, come dimostrato da P.A.M. Dirac nel 1931, se in natura
esiste anche un solo monopolo magnetico allora la consistenza dell’Elettrodinamica quan-
tistica comporta automaticamente la quantizzazione della carica elettrica. Nella sezione
finale di questo capitolo presenteremo una deduzione semiclassica di questa “condizione
di quantizzazione di Dirac”.

14.1 La dualità elettromagnetica

Riprendiamo le equazioni di Maxwell nel vuoto,


~
∂E
− ~ ×B
+∇ ~ = 0, (14.1)
∂t
~ ·E
∇ ~ = 0, (14.2)
~
∂B ~ ×E
+∇ ~ = 0, (14.3)
∂t
~ ·B
∇ ~ = 0. (14.4)

Come si vede questo insieme di equazioni resta invariato se si eseguono le sostituzioni,

~ → B,
E ~ ~ → −E.
B ~ (14.5)

Queste trasformazioni generano un gruppo discreto di simmetrie che viene chiamato “dua-
lità elettromagnetica”, o semplicemente “dualità”. Si verifica facilmente che il gruppo in
questione è Z4 . Infatti, è sufficiente notare che se si esegue la trasformazione generatrice
(14.5) due volte, si ottiene meno l’identità. In presenza di cariche elettriche questa sim-
metria è evidentemente violata – per via della presenza di sorgenti solo nella prima coppia
di equazioni.

391
Per dare valenza relativistica alla dualità elettromagnetica introduciamo il “tensore
63
elettromagnetico duale”, antisimmetrico anche’esso ,

1
Feµν ≡ εµνρσ Fρσ . (14.6)
2
γ δ
Eseguendo l’operazione di dualità due volte e notando l’identità εαβγδ εαβµν = −4δ[µ δν] si
ottiene,
e µν 1
Fe = εµνρσ Feρσ = −F µν . (14.7)
2
In termini del tensore elettromagnetico duale le trasformazioni di dualità (14.5) corrispon-
dono difatti semplicemente alle sostituzioni,

F µν → Feµν , Feµν → −F µν . (14.8)

Per vederlo è sufficiente determinare i campi elettrico e magnetico “duali”. Usando la


definzione (14.6) si trova infatti,

e i ≡ Fei 0 = 1 εi0jk Fjk = − 1 εijk F jk = B i ,


E (14.9)
2 2
e i ≡ − εijk Fejk = − εijk εjkl0 Fl0 = − 1 εijk εljk E l = −E i ,
B
1 1
(14.10)
2 2 2

in accordo con (14.5).


È anche immediato verificare che le due coppie di equazioni di Maxwell, precedente-
mente chiamate “equazione di Maxwell” e “identità di Bianchi”, si possono scrivere nella
forma equivalente,

∂µ F µν = jeν , (14.11)

∂µ Feµν = 0, (14.12)

dove abbiamo introdotto il pedice “e” per indicare che si tratta della quadricorrente elet-
trica. Risulta allora chiaro che se si vogliono mantenere le equazioni di Maxwell invarianti
63
L’operazione di contrazione di un tensore completamente antisimmetrico di rango n con il tensore
di Levi–Civita si chiama “dualità di Hodge”. Il risultato dell’operazione è un tensore completamente
antisimmetrico di rango D−n, se D è la dimensione
³ ´ dello spazio–tempo. Da un conteggio delle componenti
indipendenti di un tensore antisimmetrico, D n per la precisione, ci si convince facilmente che questa
mappa preserva il numero di componenti. La dualità di Hodge è infatti una biiezione tra lo spazio dei
tensori antisimmetrici di rango n e quello dei tensori antisimmetrici di rango D − n.

392
sotto le trasformazioni di dualità (14.8) in presenza di sorgenti, allora è necessario in-
trodurre anche delle “sorgenti magnetiche” al membro di destra dell’identità di Bianchi
(14.12).
L’introduzione di una quadricorrente magnetica nell’identità di Bianchi comporta a
priori vari aspetti problematici riguardo alla consistenza interna della teoria modificata.
Esponiamo quı̀ di seguito l’aspetto che risulta il più problematico di tutti. Supponiamo
pure di introdurre una quadricorrente magnetica nella (14.12) e di preservare in questo
modo l’invarianza di Poincaré delle equazioni del moto. Sussistendo tale invarianza sap-
piamo che è garantita la conservazione del quadrimomento e del momento angolare totali,
se esiste un’azione invariante per trasformazioni di Poincaré, dalla quale queste equazioni
possono essere dedotte. Ma, come abbiamo visto, per scrivere un’azione è necessario in-
trodurre un potenziale vettore Aµ . In assenza di correnti magnetiche l’identità di Bianchi
stessa è equivalente all’esistenza di un potenziale vettore, ma in presenza di tali correnti
l’identità di Bianchi è violata e non esiste nessun modo naturale per introdurre un po-
tenziale vettore. In effetti si può far vedere che in presenza di correnti magnetiche non
64
esiste nessuna azione canonica . La conservazione del quadrimomento e del momento
angolare non è quindi più garantita a priori.
Nonostante ciò, come faremo vedere nella prossima sezione, esiste un modo consistente
per modificare le equazioni di Maxwell e di Lorentz in presenza di monopoli magnetici,
che preserva l’invarianza di Poincaré e mantiene tutte le leggi di conservazione dell’Elet-
trodinamica con sole cariche – un risultato altamente non banale alla luce del fatto che
non esiste un’azione canonica.

14.2 L’Elettrodinamica classica in presenza di dioni

In questa sezione proponiamo un nuovo insieme di equazioni fondamentali per l’Elettrodi-


namica – in sostituzione delle (2.12)–(2.14) – che descrivono la dinamica di un arbitrario
64
Per scrivere un’azione si deve rinunciare ad almeno una delle proprietà base che si richiedono di
solito a un’azione, per esempio la località, oppure l’invarianza di Lorentz manifesta. Ciononostante le
equazioni del moto che si ottengono da queste azioni sono locali e Lorentz–invarianti. Tuttavia, l’assenza
di un’azione manifestamente Lorentz–invariante crea gravi problemi qualora si cerchi di quantizzare la
teoria. Questa difficoltà ha ritardato di molto la dimostrazione della consistenza quantistica della teoria
dei monopoli magnetici, avvenuta solo nel 1979.

393
sistema di particelle che portano sia carica elettrica che carica magnetica, i cosiddetti
dioni.
Consideriamo dunque un sistema di N particelle puntiformi con masse mr e linee di
universo yrµ (sr ), dotate – oltre che di carica elettrica er – di carica magnetica gr . Se per
una particella si ha er 6= 0, gr 6= 0 essa viene chiamata “dione”, se er 6= 0, gr = 0 la si
chiama carica (elettrica), e se er = 0, gr 6= 0 essa viene chiamata monopolo (magnetico).
A questo sistema di particelle possiamo associare le quadricorrenti elettriche e magne-
tiche,
X Z
jeµ = er uµr δ 4 (x − yr ) dsr ,
r
X Z
µ
jm = gr uµr δ 4 (x − yr ) dsr .
r

Allo stesso modo in cui si è dimostrato che la corrente elettrica è conservata, si dimostra
che è conservata anche quella magnetica. Abbiamo quindi,

∂µ jeµ = 0, µ
∂µ jm = 0, (14.13)

R 0 3
qualsiasi siano le cariche er e gr . In particolare la carica magnetica totale G = jm dx
risulta conservata.
Proponiamo la seguente modifica delle equazioni di Maxwell,

∂µ F µν = jeν , (14.14)

∂µ Feµν = jm
ν
. (14.15)

Intanto vediamo che queste equazioni sono compatibili con le (14.13), in quanto sia F che
Fe sono tensori antisimmetrici. Inoltre ora possiamo ristabilire l’invarianza per dualità se
poniamo le seguenti trasformazioni,

F → Fe, Fe → −F, je → jm , jm → −je , (14.16)

cioè, per quanto riguarda le cariche,

er → gr , gr → −er . (14.17)

394
L’invarianza sotto queste trasformazioni è anche evidente se si scrivono le nuove equazioni
di Maxwell nel formalismo tridimensionale,

~ ·E
∇ ~ = je0 , (14.18)
~
∇ ~ − ∂E
~ ×B = ~je , (14.19)
∂t
~
∇·B~ 0
= jm , (14.20)
~
−∇ ~ − ∂B
~ ×E = ~jm . (14.21)
∂t

Notiamo che, anche in presenza di dioni, l’identità di Bianchi modificata può essere scritta
in tre modi equivalenti,

∂µ Feµν = jm
ν
.
α
∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = −εµνρα jm (14.22)
1 α
∂[µ Fνρ] = − εµνρα jm .
3

Dalle (14.18)–(14.21) si vede che, il campo magnetico è ora generato non solo da
cariche elettriche in moto, ma anche da monopoli magnetici statici, cosı̀ come il campo
elettrico sarà ora generato non solo da cariche elettriche statiche, ma anche da monopoli
magnetici in moto.

14.2.1 Leggi di conservazione

Come test principale della consistenza del nuovo sistema di equazioni (14.14), (14.15),
affrontiamo ora la questione dell’esistenza di un tensore energia–impulso, che soddisfi
l’equazione di continuità ∂µ T µν = 0. Manteniamo la definizione sia del contributo del
65
campo elettromagnetico che di quello delle particelle , T µν = Temµν
+ Tpµν ,
X Z
µν 1 µν αβ
Tem = F µα Fα ν + η F Fαβ , Tpµν = mr uµr uνr δ 4 (x − yr ) dsr , (14.23)
4 r

e valutiamo separatamente la divergenza dell’uno e dell’altro. Cominciamo con il contri-


buto elettromagnetico,

µν 1 αβ ν
∂µ Tem = jeα Fα ν + F µα ∂µ Fα ν + F ∂ Fαβ
2
65
Per semplicità trascuriamo quı̀ il problema delle divergenze dovute all’autointerazione, risolubile con
le stesse tecniche del capitolo precedente.

395
1 ¡ ¢
= −F να jeα + Fαβ ∂ α F βν + ∂ β F να + ∂ ν F αβ
2
1
= −F να jeα − Fαβ εαβνµ jmµ
2
= −F jeα − Feνα jmα
να

XZ ³ ´
= − er F να + gr Feνα urα δ 4 (x − yr ) dsr .
r

Nel primo passaggio al posto di ∂µ F µα abbiamo sostituito jeα , usando (14.14). Il


secondo passaggio contiene rimaneggiamenti elementari degli indici. Nel terzo abbiamo
usato l’identità di Bianchi modificata, nella forma (14.22). Nel quarto abbiamo applicato
la definizione di Fe, e nell’ultimo la definizione delle correnti.
La divergenza del tensore energia–impulso delle particelle è stata calcolata in (2.73),
X Z dpν
r 4
∂µ Tpµν = δ (x − yr ) dsr .
r
ds r

Sommando i due contributi si ottiene allora,


X Z µ dpν ³ ´ ¶
µν
∂µ T = r να e
− er F + gr F να
urα δ 4 (x − yr ) dsr .
r
ds r

Vediamo, quindi, che se vogliamo mantenere il tensore eneriga–impulso totale conservato,


allora dobbiamo modificare anche l’equazione di Lorentz, sostituendola con,

dpνr ³ ´
να e
= er F + gr F να
urα . (14.24)
dsr

Si noti che questa formula è ora invariante per dualità, vedi (14.8) e (14.17). Usando le
(14.9), (14.10) è immediato scriverla in notazione tridimensionale,

dεr ³ ´
~ ~
= ~vr · er E + gr B (14.25)
dt
d~pr ³ ´ ³ ´
~ ~ ~ ~
= er E + ~vr × B + gr B − ~vr × E . (14.26)
dt

Un dione – una particella dotata oltre che di carica elettrica er anche di carica magnetica
~ − ~vr × E).
gr – è quindi soggetta alla forza di Lorentz aggiuntiva gr (B ~

Dalle equazioni (14.18)–(14.21), e (14.26) si vede allora che – grazie alla dualità – la
dinamica di un sistema di soli monopoli, è completamente identica alla dinamica di un
sistema di sole cariche, cioè, all’Elettrodinamica standard.

396
Essendo il tensore energia–impulso totale conservato e simmetrico, sappiamo che si
conserva automaticamente anche la corrente di densità di momento angolare,

M µαβ = xα T µβ − xβ T µα , ∂µ M µαβ = 0. (14.27)

Inoltre, dato che il tensore–energia impulso ha mantenuto la stessa forma, anche l’espres-
R
sione del momento angolare conservato, Lαβ = d3 x M 0αβ , in termini di E ~ eB~ rimane

immutata. Ricordiamo in particolare l’espressione per il momento angolare spaziale totale


Li = 21 εijk Ljk , vedi (2.88),
X Z h i
~ =
L (~yr × p~r ) + 3 ~ ~ ~p + L
d x ~x × (E × B) ≡ L ~ em . (14.28)
r

~ em = 0, in
Si noti che per un sistema statico di sole cariche, o soli monopoli, si ha L
~ mentre nel secondo si annulla E.
quanto nel primo caso si annulla B, ~ Nella prossima

sezione vedremo che per un sistema statico costituito da cariche e monopoli, avremo
~ em 6= 0.
invece L

14.3 La condizione di quantizzazione di Dirac

Abbiamo visto che l’Elettrodinamica classica di un sistema di dioni, basata sulle equazioni
(14.14), (14.15) e (14.24), è perfettamente consistente qualsiasi siano le cariche er e gr delle
particelle. In questa sezione daremo un argumento semiclassico per cui la dinamica quan-
tistica di un tale sistema risulta consistente solo se queste cariche sono opportunamente
vincolate tra di loro – dalla condizione di quantizzazione di Dirac.

14.3.1 Una carica e un monopolo

Dalla trattazione precedente risulta chiaro che aspetti fenomenologici nuovi possono emer-
gere solo se consideriamo un sistema in cui compaiono sia cariche che monopoli. La si-
tuazione non banale più semplice da analizzare è la seguente. Consideriamo un monopolo
magnetico statico (particella 1) con massa M e cariche e1 = 0 e g1 = g, fisso nell’origine.
Possiamo allora studiare la dinamica di una carica elettrica non relativistica (particella
2) con massa m ¿ M e cariche e2 = e e g2 = 0, che si muove nel campo elettromagnetico
creato dal monopolo.

397
Come prima cosa dobbiamo dunque calcolare il campo elettromagnetico generato dal
monopolo. Essendo statico e fisso nell’origine le sue correnti sono,

0
jm = g δ 3 (~x), ~jm = 0, jeµ = 0,

in quanto e1 = 0. Si tratta allora di risolvere il sistema (14.18)–(14.21) in presenza di


queste correnti. Dato che ci troviamo in un regime statico esso si riduce essenzialmente
~ ·B
all’equazione ∇ ~ = g δ 3 (~x). La soluzione, ottenibile per dualità dal caso della particella

carica statica, è,


~ 1 (t, ~x) = 0,
E ~ 1 (t, ~x) = g ~x .
B (14.29)
4π r3
La particella 2 si muove quindi in questo campo elettromagnetico sotto l’azione della forza
di Lorentz data in (14.26).
Nella presente trattazione non relativistica la forza di frenamento agente sulla parti-
cella 2 può essere trascurata, e il campo creato da essa non ha quindi nessuna influenza
sulla sua dinamica. Tuttavia, più avanti avremo bisogno di conoscere il campo elettroma-
gnetico totale del sistema carica + monopolo, e quindi anche il campo creato dalla carica.
Se denotiamo la sua traiettoria con ~y (t), nel limite non relativistico le sue correnti sono,

je0 = e δ 3 (~x − ~y (t)), ~je ≈ 0, µ


jm = 0.

Per queste correnti le (14.18)–(14.21) danno luogo al campo elettromagnetico ben noto,

~ 2 (t, ~x) = e ~x − ~y (t) ,


E ~ 2 (t, ~x) = 0.
B (14.30)
4π |~x − ~y (t)|3

Scriviamo ora l’equazione del moto (14.26) della carica nel limite non relativistico.
~ 1 = 0 si ottiene (~v = d~y /dt, ~a = d~v /dt),
Tenendo conto che g2 = 0 e che E

~ 1 (t, ~y ) = eg ~v × ~y .
m ~a = e ~v × B (14.31)
4π y3

Questa è un’equazione differenziale del secondo ordine che determina la legge oraria ~y (t)
della carica, note le condizioni iniziali ~y0 e ~v0 . Data questa legge oraria vogliamo ora esplo-
rare le leggi di conservazione del sistema carica + monopolo + campo elettromagnetico,
sfruttando il fatto che – come dimostrato nella sezione precedente – energia, quantità di
moto e momento angolare totali si devono conservare.

398
Consideriamo innanzitutto l’energia. Si vede subito che l’energia cinetica della carica
si conserva perché, ¡1 ¢
d 2
mv 2
= m ~a · ~v = 0,
dt
cosı̀ come si conservano seperatamente l’energia del monopolo, che è zero, e quella del
R
~2 + B
campo elettromagnetico. L’energia di quest’ultimo vale 1/2 d3 x(E ~ 2 ), che è infatti
2 1

una “costante” infinita.


La quantità di moto m ~v della carica evidentemente non si conserva, ma non è difficile
66
dimostrare che la quantità di moto del sistema carica + monopolo è conservata . La
quantità di moto del campo elettromagnetico dovrebbe allora essere costante. Usando le
(14.29) e (14.30) si trova infatti che,
Z Z Z
~ 3 ~ ~ 3 ~ ~ eg ~x
Pem = d x E × B = d x E2 × B1 = − 2
~y × d3 x = 0,
(4π) r |~x − ~y |3
3

in quanto l’integrale in d3 x è proporzionale a ~y .

14.3.2 Il momento angolare del sistema

Analizziamo ora in dettaglio la conservazione del momento angolare. Nel limite statico
il monopolo ha momento angolare nullo, perché anche se la sua quantità di moto resta
~ p = ~y × m~v è
diversa da zero, il suo braccio va a zero. Il momento angolare della carica L
invece diverso da zero e, per di più, non si conserva. Usando la (14.31) si trova appunto,
~p µ ¶
dL eg ~v (~v · ~y ) ~y
= ~y × m ~a = − . (14.32)
dt 4π y y3

Di conseguenza anche il momento angolare del campo elettromagnetico deve essere diverso
~ =E
da zero. Lo possiamo valutare usando la sua definizione (14.28), con E ~ 2, e B
~ =B
~ 1,

(~n ≡ ~x/r),
Z
~ em =
L ~ × B)
d3 x ~x × (E ~
Z µ ¶
g 3 ~× ~
x
= d x ~x × E
4π r3
Z µ ¶
g 3 1 ~ ~ ~x
= dx E − (~x · E) 3
4π r r
66
Nel limite statico la velocità del monopolo va a zero, ma la sua quantità di moto resta finita. La
somma delle quantità di moto di carica e monopolo è infatti costante per il principio di azione e reazione
di Newton, valido nel limite non relativistico.

399
Z
g ¡ ¢
= d3 x E i ∂i ~n

Z ³ ¡ ´
g ¢
= ~ · E)
d3 x ∂i ~n E i − ~n (∇ ~

· µZ ¶ Z ¸
g 2 i i 3 3
= lim r n E ~n dΩ − e d x ~n δ (~x − ~y )
4π r→∞
Z
eg eg ~y
= 2
~n dΩ −
(4π) 4π y
eg ~y
= − . (14.33)
4π y
Il momento angolare totale è quindi dato da,

~ =L
L ~ em = ~y × m~v − eg ~y ,
~p + L (14.34)
4π y
~
e usando (14.32) si verifica facilmente che è conservato, dL/dt = 0.
Il fatto che il momento angolare del sistema a due corpi (carica + monopolo) da solo
non si conserva ha due conseguenze importanti. La prima è che il moto non è piano,
come succede invece per due corpi che interagiscono attraverso una forza centrale. La
seconda è che in un esperimento di scattering una carica inizialmente priva di momento
angolare, passando vicino a un monopolo magnetico può acquistare un momento angolare
non nullo, sottraendolo al campo elettromagnetico. La variazione del momento angolare
della carica tra lo stato iniziale e quello finale può infatti essere letta dalla (14.34),
õ ¶ µ ¶!
~ p = −∆L ~ em = eg ~
y ~y
∆L − .
4π y f y i
Supponiamo ora di eseguire un esperimento di scattering in cui la carica passa a
una distanza molto grande dal monopolo, ovverosia con un parametro d’impatto b molto
grande. In questo caso la carica praticamente non viene deflessa perché la forza a cui è
sottoposta si annulla a grandi distanze come 1/y 2 , vedi (14.31). Indicando allora con zb il
versore della velocità a più e meno infinito, che è dunque la stessa, abbiamo,
µ ¶ µ ¶
~y ~y
= −bz, = zb,
y i y f
e quindi,
~p = eg
∆L zb. (14.35)

Calcolo esplicito di ∆Lzp . Per capire meglio il meccanismo che fa emergere per b → ∞
una variazione non nulla del momento angolare, mentre nello stesso limite le velocità

400
iniziale e finale sono uguali, calcoliamo esplicitamente la variazione della velocità durante
l’intero processo di scattering. In questo caso la traiettoria è praticamente rettilinea, e
supponendo che essa giaccia nel piano (x, z) abbiamo ~y (t) = b x
b + vt zb, ~v (t) = v zb. L’unica
67
componente non nulla della forza in (14.31) è allora la componente y ,
· ¸
eg ~y eg vb
Fy = ~v × 3 = .
4π y y 4π (b + v 2 t2 )3/2
2

Di conseguenza l’unica componente della velocità che varia è la componente y,


Z ∞ Z ∞ Z ∞
1 eg vb dt eg
∆vy = ay (t) dt = Fy dt = = .
−∞ m −∞ 4π m −∞ (b2 2 2
+v t )3/2 2π m b

Si vede quindi che la particella acquista una velocità lungo y diversa da zero – che la fa
uscire dal piano iniziale (x, z) – che si annulla nel limite per b → ∞. Al contrario, la
componente z del momento angolare subisce una variazione non nulla anche per b → ∞,

eg
∆Lzp = b (m∆vy ) = ,

in accordo con la (14.35).

14.3.3 Consistenza quantistica e condizione di quantizzazione di Dirac

Cerchiamo ora di interpretare il risultato di questo esperimento nel contesto della Mec-
canica Quantistica. In questo ambito, dato che abbiamo considerato il limite b → ∞, sia
nello stato iniziale che in quello finale la carica può essere considerata come una particella
libera che si muove di moto rettilineo uniforme lungo l’asse z. Inoltre, le componenti z
della velocità e del momento angolare sono variabili compatibili, perchè da,

[Li , pj ] = i~ εijk pk ,

segue,
[Lzp , pz ] = 0.

Possiamo quindi misurare l’osservabile Lzp con precisione sia nello stato iniziale che in
quello finale, senza modificare la velocità lungo z. I valori che otteniamo per Lzp nei
67
Ovviamente la traiettoria della carica giace nel piano (x, z) solo per per t → −∞, perché il moto
non è piano. In realtà quı̀ stiamo eseguendo un calcolo perturbativo attorno alla traiettoria rettilinea
imperturbata, con parametro di espansione 1/b.

401
due stati sono evidentemente due autovalori permessi per una componente del momento
angolare, cioè, n1 ~ e n2 ~, con n1 e n2 interi. Ma allora deve essere quantizzata anche la
differenza,
∆Lzp = n~,

con n intero. Confrontando con la (14.35) si deduce cosı̀ la condizione di quantizzazione


68
di Dirac ,
e g = 2πn~c, (n = 0, ±1, ±2, · · ·). (14.36)

Possiamo concludere che una condizione necessaria per la coesistenza quantistica di


monopoli e cariche è che qualsiasi coppia di cariche e monopoli soddisfi la condizione di
quantizzazione di Dirac, per qualche intero positivo o negativo n. Solo recentemente è
stato dimostrato che la (14.36) è in realtà anche sufficiente per la costruzione di una teoria
69
quantistica relativistica di campo che coinvolge sia cariche che monopoli .
Nonostante questi risultati teorici confortanti la ricerca sperimentale di monopoli ma-
gnetici – tuttora in atto – ha dato finora esiti negativi. Tuttavia, per l’interesse sia teorico
che sperimentale che queste particelle continuano a suscitare, elenchiamo quı̀ di seguito
alcune conseguenze che deriverebbero dall’esistenza di monopoli magnetici in natura.
Quantizzazione della carica elettrica. Supponendo che esista anche un solo monopolo,
di carica g0 , la carica elettrica er di una qualsiasi particella carica a noi nota dovrebbe
soddisfare la relazione er g0 = 2πnr ~, e quindi,

2π~
er = e0 nr , e0 ≡ .
g0

Si risolverebbe cosı̀ il problema della quantizzazione della carica elettrica, perché tutte le
cariche sarebbero necessariamente multiple di una carica fondamentale e0 . Questo fatto è
confermato dagli esperimenti con estrema precisione – per esempio la differenza relativa
tra i moduli della carica dell’elettrone e della carica del protone è minore di 10−20 – ma
a tuttoggi non esiste nessuna spiegazione teorica di questa “coincidenza”.
Dualità di accoppiamento debole/forte. La condizione di Dirac stabilisce una relazione
68
P.A.M. Dirac, Proc. Roy. Soc. (London), A133, 60 (1931).
69
R.A. Brandt et al., Phys. Rev. D19 4 1153 (1979)

402
tra le costanti di struttura fine elettrica e magnetica,

e2 g2
αe ≡ , αm ≡ ,
4π ~c 4π ~c

che in teoria quantistica di campo giocano il ruolo di costanti di accoppiamento. Usando


la (14.36) si ottiene infatti,
n2
αe αm = .
4
Per un dato sistema di cariche abbiamo quindi che se αe è piccola allora αm è grande, e
viceversa. D’altra parte sotto una trasformazione di dualità e e g si scambiano tra di loro
secondo e → g, g → −e, che per le costanti di accoppiamento equivale a,

αe ←→ αm . (14.37)

La dualità elettromagnetica scambia quindi regimi di accoppiamento debole con regimi di


accoppiamento forte. Per questo motivo questa dualità viene anche chiamata “dualità di
accoppiamento debole/forte”. Si può allora facilmente intuire che una relazione di dualità
può essere molto utile per analizzare una teoria a livello non perturbativo, cioè, in un
regime in cui la costante di accoppiamento è grande, per cui non avrebbe senso effettuare
uno sviluppo perturbativo.
I monopoli in Teorie di Grande Unificazione. Lo studio dei monopoli – introdotti da
noi ad hoc nell’ambito dell’Elettrodinamica classica – è motivato anche dal fatto che nelle
Teorie di Grande Unificazione (GUT), come per esempio quella basata sul gruppo di gauge
SU (5), la presenza di monopoli è una previsione inevitabile della teoria stessa. Il fatto che
i monopoli non siano stati ancora osservati evidentemente non contraddice queste teorie,
per il semplice motivo che le masse previste per queste particelle sono troppo elevate da
poterle produrre negli acceleratori oggi in uso.
La condizione di quantizzazione di Schwinger. Concludiamo presentando la generaliz-
zazione della condizione di Dirac al caso di particelle dioniche. L’argomento semiclassico
che abbiamo presentato sopra si estende infatti facilmente al caso in cui abbiamo una
particella con cariche e1 e g1 , statica nell’origine, e una particella con cariche e2 e g2 che
si muove nel campo elettromagnetico creato dalla prima. In questo caso si ottiene la

403
70
condizione ,
e1 g2 − e2 g1 = 2πn ~c, (n = 0, ±1, ±2, · · ·). (14.38)

Il segno relativo tra i due termini in questa relazione è dettato dall’invarianza per dualità,
vedi (14.17).
Sottolineiamo il fatto che le condizioni di quantizzazione (14.36) e (14.38) sono state
ottenute come condizioni necessarie – attraverso un argomento semiclassico nell’ambito
della Meccanica Quantistica non relativistica. Per completezza aggiungiamo che nell’am-
bito delle teorie quantistiche relativistiche di campo si può far vedere che un sistema di
N dioni può interagire consistentemente se vale, in alternativa, l’uno o l’altro dei seguenti
due set di condizioni,

er gs = 2πnrs ~c, ∀ r, s,

er gs − es gr = 4πnrs ~c, ∀ r, s,

dove gli nrs sono interi postivi o negativi. Il fattore 2 aggiuntivo nel secondo set di
condizioni, rispetto a (14.38), è da interpretarsi come un effetto relativistico.

70
J. Schwinger, Phys. Rev. 144 4 (1966) 1087.

404

Potrebbero piacerti anche